欢迎访问宙启技术站
智能推送

使用numpy.random.randn()函数生成多维正态分布的随机数数据集

发布时间:2023-12-24 09:42:51

numpy.random.randn()函数是numpy库中的一个方法,用于生成多维正态分布的随机数数据集。

多维正态分布是指具有多个维度(多个特征)的正态分布,也被称为多元正态分布。它的概率密度函数描述了具有多个特征的随机变量的概率分布。

要使用numpy.random.randn()函数生成多维正态分布的随机数数据集,首先需要使用numpy库导入这个函数。然后可以调用该函数并传入参数来指定生成随机数的维度和数量。

下面是使用numpy.random.randn()函数生成一个二维正态分布的随机数数据集的例子:

import numpy as np

# 生成1000个二维正态分布的随机数数据集
data = np.random.randn(1000, 2)

# 查看数据集的形状
print(data.shape)  # 输出 (1000, 2)

# 查看数据集的前5个数据
print(data[:5])

在上面的例子中,我们调用np.random.randn(1000, 2)生成了一个形状为(1000, 2)的二维数据集。这个数据集有1000行和2列,每一行代表一个样本,两列分别代表两个特征。然后我们通过print(data.shape)验证数据集的形状,输出(1000, 2)。最后通过print(data[:5])查看了数据集的前5个样本。

numpy.random.randn()函数生成的随机数数据集的特点是满足标准正态分布,即均值为0,方差为1。每个维度(特征)上的随机数都是独立且服从标准正态分布的。所以生成的多维正态分布的随机数数据集可以用于模拟实验、构建模型等多种应用场景。

除了指定维度和数量生成多维正态分布的随机数数据集外,numpy.random.randn()函数还可以通过其他参数来控制生成的随机数的均值和方差,从而生成具有不同均值和方差的多维正态分布的随机数数据集。具体的参数设置可以参考numpy官方文档。