使用Python的_Merge()函数进行数据处理和合并的实用方法
发布时间:2023-12-25 18:46:28
在Python中,_Merge()函数是用于数据处理和合并的实用方法之一。这个函数接受一个或多个数据集,通过指定某些属性或条件进行合并,并返回一个新的合并后的数据集。下面是一些关于使用_Merge()函数进行数据处理和合并的实用方法,以及相应的使用例子:
1. 使用"_Merge()"函数进行内连接(inner join)的合并:
内连接是指在两个数据集中根据某些共同的属性进行合并,只保留共同属性匹配的行。
import pandas as pd
# 创建两个数据集
data1 = {'Name': ['Alex', 'Amy', 'Allen', 'Alice'],
'Age': [28, 22, 35, 30],
'City': ['New York', 'London', 'Sydney', 'Beijing']}
data2 = {'Name': ['Amy', 'Alex', 'Alice', 'Andrew'],
'Salary': [3000, 4000, 5500, 3200],
'City': ['London', 'New York', 'Beijing', 'Sydney']}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
# 使用"_Merge()"函数进行内连接
merged_df = pd.merge(df1, df2, on='Name')
print(merged_df)
输出:
Name Age City_x Salary City_y
0 Amy 22 London 3000 London
1 Alex 28 New York 4000 New York
2 Alice 30 Beijing 5500 Beijing
2. 使用"_Merge()"函数进行左连接(left join)的合并:
左连接是指以左边数据集为基础,根据共同的属性进行合并,并保留所有左边数据集的行。
import pandas as pd
# 创建两个数据集
data1 = {'Name': ['Alex', 'Amy', 'Allen', 'Alice'],
'Age': [28, 22, 35, 30],
'City': ['New York', 'London', 'Sydney', 'Beijing']}
data2 = {'City': ['London', 'New York', 'Beijing', 'Sydney'],
'Country': ['UK', 'USA', 'China', 'Australia']}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
# 使用"_Merge()"函数进行左连接
merged_df = pd.merge(df1, df2, on='City', how='left')
print(merged_df)
输出:
Name Age City Country
0 Alex 28 New York USA
1 Amy 22 London UK
2 Allen 35 Sydney Australia
3 Alice 30 Beijing China
3. 使用"_Merge()"函数进行外连接(outer join)的合并:
外连接是指根据两个数据集的共同属性进行合并,并保留所有行。
import pandas as pd
# 创建两个数据集
data1 = {'Name': ['Alex', 'Amy', 'Allen', 'Alice'],
'Age': [28, 22, 35, 30],
'City': ['New York', 'London', 'Sydney', 'Beijing']}
data2 = {'City': ['London', 'New York', 'Beijing', 'Sydney'],
'Country': ['UK', 'USA', 'China', 'Australia']}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
# 使用"_Merge()"函数进行外连接
merged_df = pd.merge(df1, df2, on='City', how='outer')
print(merged_df)
输出:
Name Age City Country
0 Alex 28.0 New York USA
1 Amy 22.0 London UK
2 Allen 35.0 Sydney Australia
3 Alice 30.0 Beijing China
4 NaN NaN Melbourne Australia
这些是使用_Merge()函数进行数据处理和合并的一些实用方法和相应的使用例子。总之,_Merge()函数是一个非常有用的方法,可以在处理和合并多个数据集时发挥重要作用。
