欢迎访问宙启技术站
智能推送

使用Python编写一个get_dataset()函数来获取数据集

发布时间:2024-01-19 17:31:43

以下是使用Python编写的一个示例get_dataset()函数,用于获取数据集。该函数使用例子为获取鸢尾花数据集(Iris dataset):

from sklearn.datasets import load_iris

def get_dataset():
    """
    获取鸢尾花数据集
    返回值:
    - X: 特征向量矩阵
    - y: 目标向量
    - target_names: 目标类别
    """
    # 使用sklearn库中的load_iris()函数加载鸢尾花数据集
    iris = load_iris()
    
    # 特征矩阵
    X = iris.data
    
    # 目标向量
    y = iris.target
    
    # 目标类别
    target_names = iris.target_names
    
    return X, y, target_names

# 调用get_dataset()函数获取鸢尾花数据集
X, y, target_names = get_dataset()

# 打印数据集相关信息
print("特征矩阵:")
print(X[:5])  # 打印前5个样本的特征向量
print("
目标向量:")
print(y[:5])  # 打印前5个样本的目标类别
print("
目标类别:")
print(target_names)  # 打印目标类别

运行以上代码,将会输出鸢尾花数据集的特征矩阵、目标向量和目标类别。

该示例函数使用了Python中的sklearn库,通过调用load_iris()函数来获取鸢尾花数据集。函数返回特征矩阵X、目标向量y和目标类别target_names。

特征矩阵X是一个二维数组,每行表示一个样本的特征向量,每列表示一个特征。目标向量y是一个一维数组,其中每个元素表示对应样本的目标类别。目标类别是一个字符串数组,包含了样本的目标类别名称。

除了鸢尾花数据集,sklearn库中还提供了许多其他经典的数据集,你可以根据自己的需求修改代码,获取不同的数据集。

希望以上示例能够帮助您理解如何编写一个获取数据集的函数。