欢迎访问宙启技术站
智能推送

随机生成的aligned_dataset()数据集样本(使用Python)

发布时间:2023-12-11 05:47:14

aligned_dataset()函数是一个用于生成随机样本的Python函数。该函数生成一个包含两个维度的数据集,每个维度上包含一些类别的样本。以下是一个使用例子:

import numpy as np

def aligned_dataset(num_samples, num_classes):
    data = []
    labels = []
    
    for i in range(num_samples):
        class_id = i % num_classes
        sample = np.random.normal(loc=class_id, scale=0.1, size=(2,))
        data.append(sample)
        labels.append(class_id)
    
    data = np.array(data)
    labels = np.array(labels)
    
    return data, labels

使用上述代码,我们可以生成一个包含100个样本的数据集,其中有5个类别:

data, labels = aligned_dataset(100, 5)
print("数据集样本:
", data)
print("标签:
", labels)

输出结果示例:

数据集样本:
 [[ 0.02568538 -0.01250497]
 [ 1.03647295  1.07954882]
 [ 2.07634243  1.93988862]
 ...
 [ 3.95641489  4.06129534]
 [ 4.96946462  4.9381701 ]
 [ 0.05178862 -0.10333849]]

标签:
 [0 1 2 ... 4 0 1]

在上述示例中,我们生成了一个包含100个样本的数据集。每个样本都是一个长度为2的一维向量,根据类别id的不同,通过正态分布生成。标签是样本所属的类别id。

使用aligned_dataset()函数,您可以轻松地生成包含不同类别的随机数据集,以用于各种任务,如分类、聚类等。