Python中使用Filter函数的几个实用场景

发布时间：2023-05-27 02:31:40

Filter函数是Python中非常实用的一个函数，它能够从一个序列中过滤出符合条件的元素，并返回一个新的序列。下面介绍几个使用Filter函数的实用场景。

1. 过滤不符合条件的元素

Filter函数最常见的用途就是过滤不符合条件的元素。比如，过滤掉一个列表中所有小于10的数字：

nums = [1, 15, 7, 25, 3, 12, 9]
result = filter(lambda x: x >= 10, nums)
print(list(result))  # [15, 25, 12]

上面的代码中，使用lambda表达式定义了过滤条件：只要元素大于等于10就符合条件。使用Filter函数对列表进行过滤后，返回的结果是一个Iterator对象，需要使用list函数将其转换为列表。

2. 过滤掉空值和None值

在实际开发中，经常需要对序列中的空值和None值进行过滤。这时，可以使用bool函数作为过滤条件，将所有空值和None值过滤出来。下面是一个例子：

list1 = ['hello', '', None, 'world', None, 'python', '']
result = filter(bool, list1)
print(list(result))  # ['hello', 'world', 'python']

bool函数会将空字符串、None和False三种情况转换为False，其他情况转换为True。因此，使用bool函数作为过滤条件时，所有空值和None值都会被过滤出来。

3. 过滤掉重复的元素

Python中内置了Set集合类型，它能够快速过滤掉重复的元素。但是，如果需要保留原始顺序，可以使用Filter函数与列表的index方法配合使用。下面是一个例子：

list2 = [1, 2, 3, 2, 4, 5, 4, 6]
result = filter(lambda x: x[1] == x[0], enumerate(list2))
print([i[1] for i in result])  # [2, 4]

上面的代码中，使用enumerate函数将列表转换为由元素索引和值组成的元组。然后，使用Filter函数过滤掉索引和值不相等的元组，最后将过滤后的元素取出组成新的列表。

4. 过滤出满足条件的文件列表

在对文件进行操作时，经常需要筛选出符合条件的文件，比如扩展名为.py的Python源文件。这时，可以使用Filter函数配合os模块中的walk和glob方法，来快速筛选出符合条件的文件。下面是一个例子：

import os
import glob

path = '/Users/username/Documents/Python'
result = filter(lambda x: x.endswith('.py'),
                glob.glob(os.path.join(path, '**', '*'), recursive=True))
print(list(result))

上面的代码中，使用os模块中的join方法拼接目录路径，然后使用glob.glob方法递归查找所有的文件，使用Filter函数过滤掉不符合条件的文件。最后，将过滤后的文件列表取出，组成一个新的列表。这样就可以快速筛选出扩展名为.py的Python源文件。

5. 过滤掉重复的数据记录

在进行数据处理时，经常需要过滤掉重复的数据记录。这时，可以使用Filter函数配合字典的setdefault方法，来快速过滤掉重复的数据记录。下面是一个例子：

data = [
    {'name': 'john', 'age': 27},
    {'name': 'bob', 'age': 27},
    {'name': 'susan', 'age': 25},
    {'name': 'alice', 'age': 25},
    {'name': 'john', 'age': 28},
    {'name': 'bob', 'age': 27}
]

result = filter(lambda x: x['name'] == x.setdefault('name', x),
                data)

print(list(result))
# [{'name': 'john', 'age': 27},
#  {'name': 'bob', 'age': 27},
#  {'name': 'susan', 'age': 25},
#  {'name': 'alice', 'age': 25}]

上面的代码中，使用setdefault方法从字典中获取名字，如果不存在则使用默认值为当前字典本身，然后使用lambda表达式判断字典中的名字与默认值是否相等。如果相等，则说明当前数据记录为重复记录，需要被过滤掉。

6. 过滤出满足条件的对象实例列表

在面向对象编程中，经常需要根据条件筛选出满足条件的对象实例。这时，可以使用Filter函数配合对象的方法或属性，来快速筛选出符合条件的对象实例列表。下面是一个例子：

class Person:
    def __init__(self, name, age, gender):
        self.name = name
        self.age = age
        self.gender = gender

    def __repr__(self):
        return f'Person(name={self.name}, age={self.age}, gender={self.gender})'

    def get_age(self):
        return self.age

    def is_male(self):
        return self.gender == 'male'


persons = [Person('John', 27, 'male'),
           Person('Bob', 27, 'male'),
           Person('Susan', 25, 'female'),
           Person('Alice', 25, 'female'),
           Person('Lucy', 26, 'female'),
           Person('Jack', 28, 'male')]

result = filter(lambda x: x.get_age() >= 27 and x.is_male(),
                persons)

print(list(result))
# [Person(name=John, age=27, gender=male),
#  Person(name=Bob, age=27, gender=male),
#  Person(name=Jack, age=28, gender=male)]

上面的代码中，定义了一个Person类，它有三个属性：姓名、年龄和性别，以及两个方法：get_age和is_male。然后，创建了一个对象实例列表，使用lambda表达式作为过滤条件，将满足条件的对象实例筛选出来。最后，将筛选结果取出，组成新的列表。

总结

Filter函数是Python中非常实用的一个函数，它能够快速过滤掉不符合条件的元素，提高开发效率。上述实用场景仅是Filter函数的冰山一角，还有很多未列举的实用场景，都需要我们在日常开发中不断摸索，掌握Filter函数的使用技巧。