torch.nn.init.normal_方法在生成对抗网络中的使用

发布时间：2024-01-21 02:00:26

在生成对抗网络（GAN）中，torch.nn.init.normal_方法可以用来初始化网络模型中的权重。GAN是一种由生成器和判别器组成的模型，其中生成器试图生成逼真的假样本，而判别器则试图将真样本和假样本区分开来。

在生成器部分，我们可以使用torch.nn.init.normal_方法来初始化权重。下面是一个简单的例子：

import torch
import torch.nn as nn
import torch.nn.init as init

class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        
        self.fc = nn.Linear(100, 256)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(256, 784)
        self.sigmoid = nn.Sigmoid()

        # 初始化权重
        init.normal_(self.fc.weight, mean=0, std=0.02)
        init.normal_(self.fc2.weight, mean=0, std=0.02)

    def forward(self, x):
        x = self.fc(x)
        x = self.relu(x)
        x = self.fc2(x)
        x = self.sigmoid(x)
        return x

# 创建生成器实例
generator = Generator()

# 使用生成器生成假样本
noise = torch.randn(10, 100)
fake_samples = generator(noise)

以上代码创建了一个简单的生成器模型，其输入是一个100维的噪声向量，输出是一个784维的假样本。在模型初始化时，使用了torch.nn.init.normal_方法来对模型的fc和fc2层的权重进行正态分布的初始化。具体来说，平均值为0，标准差为0.02。

生成器的forward方法定义了模型的前向传播过程，通过全连接层(fc)，ReLU激活函数(relu)，全连接层(fc2)和Sigmoid激活函数(sigmoid)构成了生成器的结构。最后，generator(noise)利用生成器生成了10个假样本。

在训练生成对抗网络时，需要确保生成器和判别器都进行权重的初始化。与生成器相似，判别器也可以使用torch.nn.init.normal_方法来初始化权重。下面是一个完整的生成对抗网络的训练过程的例子：

import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.init as init

# 定义生成器和判别器
class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        
        self.fc = nn.Linear(100, 256)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(256, 784)
        self.sigmoid = nn.Sigmoid()
        
        # 初始化权重
        init.normal_(self.fc.weight, mean=0, std=0.02)
        init.normal_(self.fc2.weight, mean=0, std=0.02)

    def forward(self, x):
        x = self.fc(x)
        x = self.relu(x)
        x = self.fc2(x)
        x = self.sigmoid(x)
        return x


class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        
        self.fc = nn.Linear(784, 256)
        self.relu = nn.LeakyReLU(0.2)
        self.fc2 = nn.Linear(256, 1)
        self.sigmoid = nn.Sigmoid()
        
        # 初始化权重
        init.normal_(self.fc.weight, mean=0, std=0.02)
        init.normal_(self.fc2.weight, mean=0, std=0.02)
        
    def forward(self, x):
        x = self.fc(x)
        x = self.relu(x)
        x = self.fc2(x)
        x = self.sigmoid(x)
        return x


# 创建生成器和判别器实例
generator = Generator()
discriminator = Discriminator()

# 定义损失函数和优化器
loss_fn = nn.BCELoss()
optimizer_G = optim.Adam(generator.parameters(), lr=0.0002, betas=(0.5, 0.999))
optimizer_D = optim.Adam(discriminator.parameters(), lr=0.0002, betas=(0.5, 0.999))

# 训练生成对抗网络
for epoch in range(num_epochs):
    for i, real_samples in enumerate(data_loader):
        # 训练判别器
        optimizer_D.zero_grad()
        
        # 准备真样本和假样本的标签
        real_labels = torch.ones(batch_size, 1)
        fake_labels = torch.zeros(batch_size, 1)
        
        # 生成假样本
        noise = torch.randn(batch_size, 100)
        fake_samples = generator(noise)
        
        # 判别器对真样本的判别损失
        real_outputs = discriminator(real_samples)
        loss_D_real = loss_fn(real_outputs, real_labels)
        
        # 判别器对假样本的判别损失
        fake_outputs = discriminator(fake_samples.detach())
        loss_D_fake = loss_fn(fake_outputs, fake_labels)
        
        # 计算判别器的总损失
        loss_D = loss_D_real + loss_D_fake
        
        # 更新判别器的权重
        loss_D.backward()
        optimizer_D.step()
        
        # 训练生成器
        optimizer_G.zero_grad()
        
        # 生成假样本
        noise = torch.randn(batch_size, 100)
        fake_samples = generator(noise)
        
        # 判别器对假样本的判别损失，生成器希望判别器判别出假样本为真
        fake_outputs = discriminator(fake_samples)
        loss_G = loss_fn(fake_outputs, real_labels)
        
        # 更新生成器的权重
        loss_G.backward()
        optimizer_G.step()

在训练过程中，我们使用torch.nn.init.normal_方法来初始化生成器和判别器的权重。这里的例子是一个简单的GAN模型，其中生成器和判别器的网络结构也相对简单。在训练过程中，首先训练判别器使其能够区分真样本和假样本，然后再训练生成器使其能够生成更逼真的假样本。通过交替训练生成器和判别器，我们可以不断优化GAN模型，使其生成更逼真的假样本。