随机生成的aligned_dataset()数据集样本(使用Python)
发布时间:2023-12-11 05:47:14
aligned_dataset()函数是一个用于生成随机样本的Python函数。该函数生成一个包含两个维度的数据集,每个维度上包含一些类别的样本。以下是一个使用例子:
import numpy as np
def aligned_dataset(num_samples, num_classes):
data = []
labels = []
for i in range(num_samples):
class_id = i % num_classes
sample = np.random.normal(loc=class_id, scale=0.1, size=(2,))
data.append(sample)
labels.append(class_id)
data = np.array(data)
labels = np.array(labels)
return data, labels
使用上述代码,我们可以生成一个包含100个样本的数据集,其中有5个类别:
data, labels = aligned_dataset(100, 5)
print("数据集样本:
", data)
print("标签:
", labels)
输出结果示例:
数据集样本: [[ 0.02568538 -0.01250497] [ 1.03647295 1.07954882] [ 2.07634243 1.93988862] ... [ 3.95641489 4.06129534] [ 4.96946462 4.9381701 ] [ 0.05178862 -0.10333849]] 标签: [0 1 2 ... 4 0 1]
在上述示例中,我们生成了一个包含100个样本的数据集。每个样本都是一个长度为2的一维向量,根据类别id的不同,通过正态分布生成。标签是样本所属的类别id。
使用aligned_dataset()函数,您可以轻松地生成包含不同类别的随机数据集,以用于各种任务,如分类、聚类等。
