欢迎访问宙启技术站
智能推送

如何使用Python中的Pandas读取CSV数据文件?

发布时间:2023-06-11 04:42:03

Pandas是一个流行的Python库。它主要用于处理和分析数据,可将其导入和导出到多种数据源中,包括CSV文件。CSV文件(逗号分隔值文件)是一种常见的用于交换数据的格式。它可以被许多程序和工具读取,包括Excel和数据库。

在本文中,我们将介绍如何使用Pandas读取CSV文件。我们将探讨如何读取文件、查看数据、选择数据、过滤数据和排序数据。

读取CSV文件

首先,我们需要导入Pandas库。下一步是导入CSV文件。我们将使用Pandas的read_csv()函数。

在以下示例中,我们将使用一个名为demo.csv的CSV文件,并将其保存在工作目录中。示例文件包含姓名、年龄、城市和性别。

import pandas as pd

data = pd.read_csv("demo.csv")

查看数据

一旦我们读取了CSV文件,我们可以检查它是否被正确读取。我们可以使用Pandas的head()函数查看数据的前几行。默认情况下,head()函数将返回前5行。我们可以选择更多的行,例如head(10)将返回前10行。

print(data.head())

输出:

   Name   Age     City  Gender

0  John    25  New York    Male

1  Bill    30   London    Male

2  Cindy   28  Shanghai  Female

3  Alice   33    Tokyo  Female

4  Kevin   29  New York    Male

选择数据

我们可以使用Pandas来选择文件的特定列。为此,我们只需在括号中指定要选择的列的名称。

print(data['Name'])

输出:

0     John

1     Bill

2    Cindy

3    Alice

4    Kevin

Name: Name, dtype: object

过滤数据

Pandas使我们能够轻松地筛选数据。在下面的示例中,我们将通过筛选“性别”列中的值来过滤数据。我们将筛选“Gender”列中为“Female”的所有数据。

print(data[data.Gender == 'Female'])

输出:

    Name   Age     City  Gender

2   Cindy   28  Shanghai  Female

3   Alice   33    Tokyo  Female

排序数据

我们可以按任意列对数据进行排序。在下面的示例中,我们将根据“年龄”列按降序对数据进行排序。

print(data.sort_values('Age',ascending=False))

输出:

   Name   Age     City  Gender

3  Alice   33    Tokyo  Female

1  Bill    30   London    Male

4  Kevin   29  New York    Male

2  Cindy   28  Shanghai  Female

0  John    25  New York    Male

结论

在本文中,我们介绍了如何使用Pandas读取CSV文件。我们学习了如何导入库、读取CSV文件、查看数据、选择数据、过滤数据和排序数据。由于Pandas具有易于使用的API,它成为许多数据科学家和分析师的首选。现在您可以用Pandas处理CSV文件了!