使用Python编写一个get_dataset()函数来获取数据集
发布时间:2024-01-19 17:31:43
以下是使用Python编写的一个示例get_dataset()函数,用于获取数据集。该函数使用例子为获取鸢尾花数据集(Iris dataset):
from sklearn.datasets import load_iris
def get_dataset():
"""
获取鸢尾花数据集
返回值:
- X: 特征向量矩阵
- y: 目标向量
- target_names: 目标类别
"""
# 使用sklearn库中的load_iris()函数加载鸢尾花数据集
iris = load_iris()
# 特征矩阵
X = iris.data
# 目标向量
y = iris.target
# 目标类别
target_names = iris.target_names
return X, y, target_names
# 调用get_dataset()函数获取鸢尾花数据集
X, y, target_names = get_dataset()
# 打印数据集相关信息
print("特征矩阵:")
print(X[:5]) # 打印前5个样本的特征向量
print("
目标向量:")
print(y[:5]) # 打印前5个样本的目标类别
print("
目标类别:")
print(target_names) # 打印目标类别
运行以上代码,将会输出鸢尾花数据集的特征矩阵、目标向量和目标类别。
该示例函数使用了Python中的sklearn库,通过调用load_iris()函数来获取鸢尾花数据集。函数返回特征矩阵X、目标向量y和目标类别target_names。
特征矩阵X是一个二维数组,每行表示一个样本的特征向量,每列表示一个特征。目标向量y是一个一维数组,其中每个元素表示对应样本的目标类别。目标类别是一个字符串数组,包含了样本的目标类别名称。
除了鸢尾花数据集,sklearn库中还提供了许多其他经典的数据集,你可以根据自己的需求修改代码,获取不同的数据集。
希望以上示例能够帮助您理解如何编写一个获取数据集的函数。
