欢迎访问宙启技术站
智能推送

利用Python中的glob模块批量读取指定文件夹下的文件

发布时间:2024-01-04 09:26:29

在Python中,可以使用glob模块来批量读取指定文件夹下的文件。glob模块提供了一个函数glob(),它可以根据指定的模式匹配文件并将匹配到的文件路径返回为一个列表。

首先,我们需要导入glob模块:

import glob

接下来,我们可以使用glob()函数来匹配文件。函数的参数是一个匹配模式,可以包含通配符*?,其中*代表零个或多个字符,?代表一个字符。

例如,假设我们有一个文件夹data,其中包含了一些文本文件(.txt文件)。我们可以使用glob()函数来匹配以.txt为扩展名的所有文本文件:

files = glob.glob('data/*.txt')

这会返回一个列表files,列表中包含了匹配到的所有文件的路径。

接下来,我们可以遍历这个文件列表,对每个文件进行操作。例如,假设我们要读取这些文本文件的内容并打印出来:

for file in files:
    with open(file, 'r') as f:
        content = f.read()
        print(content)

上述代码中,我们使用open()函数打开每个文件,并使用read()方法读取文件的内容。然后,我们将内容打印出来。

完整的例子如下所示:

import glob

files = glob.glob('data/*.txt')

for file in files:
    with open(file, 'r') as f:
        content = f.read()
        print(content)

上述代码中,我们假设data文件夹位于当前目录下,并且文件夹中只包含了文本文件。如果文件夹的位置不同或者包含其他类型的文件,可以根据实际情况修改匹配模式。

使用glob模块,可以方便地批量读取指定文件夹下的文件。这在处理大量文件时非常有用,可以减少手动遍历文件的工作量。同时,使用glob模块还可以更加灵活地匹配指定类型的文件。