视觉智能「产学交融」新十年｜CCF-GAIR 2020

KK免更新

2020-08-11 09:45:06

阅读（6382）

从2012年以来，跟着AlexNet横空出世，深度神经网络在核算机视觉范畴成为干流的办法。2014年，谷歌创造出了GoogleNet，牛津大学创造了VGGNet，2015年微软创造了ResNet，2016年康奈尔大学和清华大学创造了DenseNet，这几个结构都是环绕分类使命而创造的网络结构。

除了分类以外，在核算机视觉里边还有其它的重要使命，比方图画切割、人脸要害点的检测、人体姿势估量、方针检测等等。

下一代的网络结构是什么样的呢？是否适用于更为广泛的视觉辨认问题？

王井东首要介绍了分类网络结构，它是包含一系列减小表征空间巨细的进程，终究得到一个低分辨率的表征，然后进行分类，可是切割等使命需求空间精度高的表征，即高分辨率FBA头程表征。

学习高分辨率表征，有一种叫上采样的通用办法，包含两个过程，榜首个过程是分类的网络架构，表征开端比较大，然后渐渐变小。第二个过程，经过上采样的办法逐渐从低分辨率康复高分辨率。这样的办法获得的特征空间精度较弱。

而王井东团队研制的高分辨率网络架构（HRNet）没有沿袭曾经的分类架构，也不是从低分辨率康复到高分辨率，从头到尾保持高分辨率。

他们让高中低分辨率不停地交互，使得高分辨率能够拿到低分辨率语义性比较强的表征，低分辨率能够拿到高分辨率的空间精度比较强的表征，不停地交融，终究获得更强的高分辨率表征。

在人体姿势、切割、人脸要害点检测、方针检测等使命中，HRNet从参数量、核算量以及终究成果看，高分辨率结构都十分有优势。HRNet在人体姿势估量的使命上，现已成为规范的办法；在切割使命上，因为其更好的功用，也被我们广泛运用。雷锋网雷锋网雷锋网(大众号：雷锋网)

雷锋网原创文章，未经授权制止转载。概况见转载须知。

来源:版权归属原作者,部分文章推送时未能及时与原作者取得联系,若来源标注错误或侵犯到您的权益烦请告知，我们会及时删除。