深度自动编码器背后的数学原理（如何使用自动编码器生成图像）

小君 2023-07-04 07:28:14 344

深度自动编码器背后的数学原理（如何使用自动编码器生成图像）然而，自动编码器面临与大多数神经网络相同的几个问题。他们往往倾向于过度拟合，还遭受消失的梯度问题。那么有解决方案吗？这里为您推荐一个变分自动编码器。它本质上增加了随机性，但不完全准确。此外，很明显，我们可以应用它们来重现相同但有点不同甚至更好的数据。例子是：为了更好地理解自动编码器，我将提供一些代码和解释。在本文中，我们将使用Pytorch来构建和训练我们的模型。自动编码器是简单的神经网络，它们的输出就是输入，就是这么简单。他们的目标是学习如何重建输入数据。但它有什么用呢？关键是他们的结构。网络的第一部分就是我们所说的编码器，它接收输入并将其编码在较低维度的潜在空间中。第二部分（解码器）采用该向量并对其进行解码以生成原始输入。中间的潜在向量是我们想要的，因为它是输入的压缩表示，应用程序非常丰富，例如：

点击上方关注，All in AI中国

如果我们不需要标记数据来训练我们的模型，那将会是一个很酷的事情。我的意思是标记和分类数据会花费我们很多的时间，然而，事实是大多数从支持向量机到卷积神经网络的现有模型没有它们就无法进行训练。

无监督学习通过自己的无标签数据推断出一个函数。最著名的无监督算法是K-Means，它已被广泛用于将数据聚类成组，而主成成分分析（PCA）是降维的一个重要解决方案。 K-Means和PCA可能是有史以来最好的两种机器学习算法。让他们变得更好的原因是他们的简单性，当你掌握了它们时，你就会感叹：“我为什么不早点想到它？”

接下来我们想到的下一个问题可能是：“是否存在无监督的神经网络？”。

为了更好地理解自动编码器，我将提供一些代码和解释。在本文中，我们将使用Pytorch来构建和训练我们的模型。

深度自动编码器背后的数学原理（如何使用自动编码器生成图像）(1)

自动编码器是简单的神经网络，它们的输出就是输入，就是这么简单。他们的目标是学习如何重建输入数据。但它有什么用呢？关键是他们的结构。网络的第一部分就是我们所说的编码器，它接收输入并将其编码在较低维度的潜在空间中。第二部分（解码器）采用该向量并对其进行解码以生成原始输入。

深度自动编码器背后的数学原理（如何使用自动编码器生成图像）(2)

中间的潜在向量是我们想要的，因为它是输入的压缩表示，应用程序非常丰富，例如：

压缩
降维

此外，很明显，我们可以应用它们来重现相同但有点不同甚至更好的数据。例子是：

数据去噪：给他们输入存在噪声的图像，并训练它们，会输出相同的图像但没有噪声。
训练数据增加
异常检测：在单个类上训练它们，以便每个异常都会产生很大的重构错误。

然而，自动编码器面临与大多数神经网络相同的几个问题。他们往往倾向于过度拟合，还遭受消失的梯度问题。那么有解决方案吗？这里为您推荐一个变分自动编码器。它本质上增加了随机性，但不完全准确。

让我们进一步解释一下，变分自动编码器经过训练，可以学习模拟输入数据的概率分布，而不是映射输入和输出的函数。然后，它从该分布中采样点并将它们馈送到解码器，以生成新的输入数据样本。但是等一下，当我听说概率分布时，只有一件事物浮现在脑海中：贝叶斯。是的，贝叶斯规则再次成为主要原则。顺便说一下，我并不是夸大其词，但贝叶斯公式可能是有史以来最好的方程式。而且我不是在开玩笑，它无处不在。

回到变分自动编码器。我认为以下图片足够使你清楚的了解它：

深度自动编码器背后的数学原理（如何使用自动编码器生成图像）(3)