快捷搜索:  汽车  科技

网络智能总能超乎你的想象:胶囊网络 一种全新的富有吸引力的AI架构

网络智能总能超乎你的想象:胶囊网络 一种全新的富有吸引力的AI架构罂粟花胶囊胶囊网络:一种全新的富有吸引力的AI架构校对 | 酱番梨 整理 | 菠萝妹原文链接:https://heartbeat.fritz.ai/capsule-networks-a-new-and-attractive-ai-architecture-bd1198cc8ad4

本文为 AI 研习社编译的技术博客,原标题 :

Capsule Networks: A new and attractive AI architecture

作者 | Ayyüce Kızrak

翻译 | 安石徒、Disillusion、AdaAlvin、friedhelm739

校对 | 酱番梨 整理 | 菠萝妹

原文链接:

https://heartbeat.fritz.ai/capsule-networks-a-new-and-attractive-ai-architecture-bd1198cc8ad4

胶囊网络:一种全新的富有吸引力的AI架构

网络智能总能超乎你的想象:胶囊网络 一种全新的富有吸引力的AI架构(1)

罂粟花胶囊

本文已被翻译为英文并首次发表在《Deep Learning Turkey》。

卷积神经网络(CNN)因其在目标识别和分类任务中的成功应用而被计算机视觉应用界所青睐。CNN是由堆叠在一起的多个神经元组成的。在神经元之间计算卷积需要大量的计算,因此通常使用池化来减小网络层的大小。卷积方法可以通过简单的计算来学习数据的许多复杂特征。通过对输入进行矩阵乘法和求和,我们可以得出问题的答案。

网络智能总能超乎你的想象:胶囊网络 一种全新的富有吸引力的AI架构(2)

基本的卷积神经网络

我总是听到CNN到底有多优秀。但是他们什么时候会失败呢?

CNN在解决物体识别和分类问题方面确实取得了巨大的成功。然而,它们并不完美。如果输入CNN的对象处于一个CNN不熟悉的方向,或是出现在CNN从未见过的地方,那么它的预测任务很可能失败。

例如,如果你把一张脸颠倒过来,网络将不再能够识别眼睛、鼻子、嘴巴以及它们之间的空间关系。类似地,如果改变面部的特定区域(即切换眼睛和鼻子的位置),网络也可以识别脸部,但是它已经不是真正的脸部了。CNN只学习到了图像中的统计信息,但是他们没有学习基本的思维,即到究竟什么样子才会被称作是脸。

网络智能总能超乎你的想象:胶囊网络 一种全新的富有吸引力的AI架构(3)

Geoffrey Hinton 和 Sara Sabour

关于CNN为何不能学习思维的理论,人工智能之父杰弗里·辛顿(Geoffrey Hinton)针对于用于缩小网络规模和计算需求的池化操作哀叹道:

“在卷积神经网络中使用的池化操作是一个大错误,它工作得如此好就是一个灾难!”

池化层破坏信息,使得网络无法学习更高级的思维。因此,他着手开发一种新的体系结构,这种体系结构并不很依赖于这种池化操作。

由此引出:胶囊网络

什么是胶囊网络?

Hinton 和 Sabour 从神经科学中借用了一些想法,即认为大脑被组织成了叫做胶囊 的模块。这些胶囊特别擅长处理物体的姿态(位置、大小、方向)、变形、速度、反照率、色调、纹理等特征。

他们推测,大脑肯定有一种机制,将低层次的视觉信息传递到它认为能最好的处理这些信息的胶囊。针对卷积神经网络模型性能不足的领域问题,人们提出了胶囊网络和动态路由算法。

网络智能总能超乎你的想象:胶囊网络 一种全新的富有吸引力的AI架构(4)

毕加索和他的女神们

胶囊表示图像中特定实体的各种特征。一种非常特殊的特征是图像中实例化实体的存在。实例化实体是诸如位置、大小、方向、变形、速度、反照率、色调、纹理等参数。表示其存在的一个简单方法是使用单独的逻辑单元,其输出是实体存在的概率[1]。为了得到比CNN更好的结果,我们应该使用一个迭代的协议路由机制。这些特性称为实例化参数。在经典的CNN模型中是没有得到图像中目标的这些属性的。平均/最大池层减少了一组信息的大小,同时减少了其尺寸大小。

图中有些地方有嘴唇、鼻子和眼睛,但是卷积神经网络不知道它们在哪和应该在哪里。对于传统网络,这些错放的特性不会影响到它!

挤压函数

网络智能总能超乎你的想象:胶囊网络 一种全新的富有吸引力的AI架构(5)

猜您喜欢: