0733-302187234

从图像识别到物体识别:亚搏网页登陆2021-02-13 16:51

本文摘要:随着增强现实(AR)和自主驾驶时代的到来,3D数据正在迅速爆炸。在不久的将来,处理3D数据的算法将应用于机器人自动导航和基于增强现实的智能用户界面等应用。受此启发,拟阵公司撰写的论文明确提出了FusionNet,用于在一个名为PrincetonModelNet的标准数据集上对3DCAD对象进行分类。融合网络的核心是一种全新的应用于3D对象的三维卷积神经网络。 我们必须从多方面对传统CNN进行调整,使其有效。更准确的说,我们不妨看看用于图像分类的二维CNN。

亚博网页版登录入口

随着增强现实(AR)和自主驾驶时代的到来,3D数据正在迅速爆炸。在不久的将来,处理3D数据的算法将应用于机器人自动导航和基于增强现实的智能用户界面等应用。受此启发,拟阵公司撰写的论文明确提出了FusionNet,用于在一个名为PrincetonModelNet的标准数据集上对3DCAD对象进行分类。融合网络的核心是一种全新的应用于3D对象的三维卷积神经网络。

我们必须从多方面对传统CNN进行调整,使其有效。更准确的说,我们不妨看看用于图像分类的二维CNN。其思想是机器学习研究者不会构建由几个隐藏层组成的模型,每一层都以不同的形式与前一层相连。

在第一层,你不会喜欢在2D图像上滑动窗口区域作为输出。因为这个区域继续执行卷积,所以当窗口滑动时,操作者对其进行交织,所以称为卷积层。之后有几个不同形态的隐藏层,最后一层用来预测潜在输入;每个输入对应于图像标签中的某个分类。

在ModelNet40Challenge数据集里,没有40个分类,所以模型最后一层有40个神经元。第一类可能是猫,第二类可能是车辆,等等。如果第一个神经元在40个中引起的满意度最高,那么输出样本就不会被判断为第一类,猫。整个模型假设输出是图片的形式,也就是二维数据。

怎么扩展到三维?一种可能的方法是通过投影将对象处理成二维图像,就像显示器显示三维对象一样,然后在其上运行标准的二维CNN算法。本质上,在PrincetonModelNetChallenge数据集上提交的拟合算法的思想是将任意三维物体从多个角度扩展到一组2D投影扩展像素,然后将其用于卷积神经网络。

亚博网页版登录

FusionNet显然也是用于基于像素通信的CNN,但关键是它也缩减了一个新的三维CNN。与在2D图像上滑动区域不同,我们可以在物体上滑动3D空间!在这种沟通下,投射的步骤做得并不妥当。这种方法使用体通信来处理对象。

在我们的体像素通信中,3D对象被线性转换成30*30*30体素网格。如果对象的任何部分位于1*1*1体素中,该体素将被赋予值1,否则,将被赋予值0。

与以往的工作不同,我们在自学习物体特征的过程中使用了像素通信和体素通信。这种方法比单独使用其中一个更好地对3DCAD对象进行分类。

一些例子如下:图1。两种交流。左:浴缸、矮凳、卫生间、衣柜的2D投影。

右:体素化后的浴缸、矮凳、马桶、衣柜。感谢RezaZadeh获取图片,我们创建了两个处理体素数据的卷积神经网络(V-CNNI和V-CNNI),以及一个处理像素数据的网络(MV-CNN)。右图展示了这些网络是如何协同工作的,并得到最终的对象分类判别。

CNN处理2D图像的标准是不同的。他们不能从图像中学习一些空间局部特征。


本文关键词:从,图像,识别,到,物体,亚搏,网页,登陆,随着,亚搏网页登陆

本文来源:亚搏网页登陆-www.frenchwpc.com