利用Python的fileinput模块实现文件的逐行读取和处理

发布时间：2023-12-15 20:09:34

Python的fileinput模块可以方便地实现文件的逐行读取和处理。该模块提供了一个input()函数，可以迭代读取一个或多个文件，并且可以对每一行进行处理。

使用fileinput模块首先需要导入该模块：

import fileinput

接下来可以使用以下方法来利用fileinput模块逐行读取和处理文件：

1. 逐行读取文件内容：

for line in fileinput.input('filename.txt'):
    # 处理每一行的逻辑
    print(line)

上述代码会依次迭代读取"filename.txt"文件中的每一行，并将其打印出来。

2. 过滤行：

fileinput模块还提供了对行的过滤功能。可以通过设置fileinput.input()函数的kwargs参数来实现。kwargs参数接受一个字典，可以设置以下过滤器：

- inplace：指示是否对文件进行原地修改（默认为False）

- backup：指示是否在进行原地修改时保留备份文件（默认为False）

- mode：指定原地修改时文件的打开模式（默认为'b'）

- openhook：指定文件的打开钩子函数（默认为None）

- bufsize：指定读写文件的缓冲区大小（默认为-1）

- files：指定需要处理的文件列表（默认为sys.argv[1:]，即命令行参数列表）

以下是一个过滤行的例子：

def filter_line(line):
    # 过滤行的逻辑
    if line.startswith('#'):
        return False
    return True

for line in fileinput.input('filename.txt', inplace=True, backup='.bak', mode='w'):
    if filter_line(line):
        # 处理每一行的逻辑
        print(line, end='')

上述代码会读取"filename.txt"文件中的每一行，通过filter_line()函数过滤掉以'#'开头的行，并将处理后的结果写回原文件中（设置inplace=True）。同时，还会在原文件的同一目录下生成一个备份文件"filename.txt.bak"。

3. 处理多个文件：

fileinput模块还支持同时处理多个文件。只需要将需要处理的文件名作为参数传递给fileinput.input()函数即可：

for line in fileinput.input(['file1.txt', 'file2.txt', 'file3.txt']):
    # 处理每一行的逻辑
    print(line)

上述代码会依次迭代读取"file1.txt"、"file2.txt"和"file3.txt"三个文件中的每一行，并将其打印出来。

综上所述，Python的fileinput模块可以方便地实现文件的逐行读取和处理。通过设置参数，可以实现对行的过滤、原地修改等功能。使用该模块可以简化文件处理的代码，提高程序的可读性和可维护性。