""

澳门太阳城网站-最新注册

  • objectnet,由MIT和IBM的研究人员,从多角度显示对象,在多个方向,创建照片和针对不同背景来的3D对象更好地表示复杂的数据集。研究人员希望该数据集将引领新的计算机视觉技术来执行在现实生活更好一点。

    objectnet,由MIT和IBM的研究人员,从多角度显示对象,在多个方向,创建照片和针对不同背景来的3D对象更好地表示复杂的数据集。研究人员希望该数据集将引领新的计算机视觉技术来执行在现实生活更好一点。

    研究者的拼贴照片礼貌。

    全屏

这个对象识别数据集难倒了世界上最优秀的计算机视觉模型

objectnet,由MIT和IBM的研究人员,从多角度显示对象,在多个方向,创建照片和针对不同背景来的3D对象更好地表示复杂的数据集。研究人员希望该数据集将引领新的计算机视觉技术来执行在现实生活更好一点。

对象所构成在各种位置和在奇数角度拍摄到刺激新的人工智能技术。


记者联系

金·马蒂诺
电子邮件: kimmarti@mit.edu
电话:617-710-5216
澳门太阳城最新网站追求情报

计算机模型已经学会识别照片的视觉对象,以便准确这一些还可以在某些数据集人类跑赢大盘。当这些相同的对象,但在探测器宽松转向现实世界,他们的性能下降明显,自驾车车等安全关键的机器视觉系统的使用产生可靠性问题。

在努力缩小这种性能差距,一队美国澳门太阳城最新网站和IBM的研究人员着手来创建一个完全不同的对象识别的数据集。这就是所谓的 objectnet, 对IMAGEnet,负责照片人工智能推出许多现代繁荣的众包数据库的发挥。 

不像IMAGEnet,其特点Flickr的和其他社交媒体网站拍摄的照片,objectnet采用了由支付自由职业者拍摄的照片。对象被示放倒在自己的身边,在拍摄多角度,并且在整洁的房间散落显示。当领先的物体检测模型上测试objectnet, 他们的准确率从97%上IMAGEnet一个高位回落只是50-55个百分点。

“我们创造ESTA数据集来告诉人们对象识别的问题仍然是一个困难的问题,”说 鲍里斯·卡茨澳门太阳城最新网站的研究科学家 计算机科学和人工智能实验室 (CSAIL)和 中心的大脑,心灵和机器 (CBMM)。 “我们需要更好,更智能的算法。”卡茨和他的同事们将提出objectnet及其对结果 神经信息处理系统会议(neurips).

深度学习,带动人工智能的最新进展多的技术,人工“神经元”使用图层找到大量的原始数据模式。它学会在几百到几千的例子训练后,挑,说,在照片中的椅子。但即使是数以百万计图像的数据集不能显示在STI和设置的所有可能的定向每个对象,创建问题时,这些模型在现实生活中遇到的对象。

objectnet是另一种方式的重要常规图像数据集的不同:它不包含任何训练图像。大多数数据集分为数据用于训练和测试模型的表现。但训练集份常微妙的相似之处带载测试,实际上赋予车型在测试一睹为快。 

乍一看, imagenet,在第14万张图片,显得巨大。当它的训练集,但被排除在外,这是在大小相当于objectnet,50,000张照片。 

“如果我们想知道的算法将如何在现实世界中进行,我们测试他们是公正的形象是否应和,他们从来没有看到过,”研究的共同作者说 安德烈·巴尔布在CSAIL与CBMM的研究科学家。 

这一个数据集试图捕捉现实世界的复杂对象 -  

很少有人会想到,分享从objectnet的照片与他们的朋友,这是一点。从自由职业者的研究人员雇来亚马逊的Mechanical Turk数以百计的随机带来家用物品的照片。工人收到照片分配的应用程序,以动画的指令,告诉他们如何定位分配对象,什么角度,从拍摄,以及是否会对物体在厨房,卫生间,卧室,还是客厅。 

他们希望消除偏见3共同点:对象显示正面,在标志性的位置,并在高度相关的设置 - 例如,在厨房里堆放板。 

它花了三年时间受孕的数据集,并设计一个应用程序,将标准化的数据收集过程。 “探索如何在这是令人难以置信的棘手的各种偏见的方式控制收集数据,”研究的共同作者说 大卫·梅奥,研究生澳门太阳城最新网站 电气工程和计算机科学系。 “同时,我们不得不进行一些实验,以确保我们的指示明确,被工人们清楚地知道正在问他们的。” 

又一年把它收集的实际数据,并在年底前,所有提交的照片本来自由职业者的一半被丢弃未能满足研究人员的规范。在尝试是有益的,一些工人加标签,他们的对象,上演他们在白色背景,或尝试在他们被分配到拍摄的照片的美感,否则提高。

许多采取了美国以外的照片,因此,有些人可能面生的对象。是绿色的成熟的橘子,香蕉有不同的尺寸,和服装出现在各种形状和纹理。

与.NET对象IMAGEnet:领先的对象识别模型如何比较

研究人员测试了当objectnet国家的最先进的计算机视觉模型,他们发现从IMAGEnet的40-45个百分点的性能下降。结果表明,对象探测器仍然在努力理解三维物体,并且可以旋转并移动到新的环境中,研究人员说。 “这些概念都没有建成现代对象检测器的架构,”研究的共同作者说 他们给加特福伦德在IBM的研究员。

这objectnet是显示正是因为被认为与定位多么困难对象,研究人员让这些模型来对剩余的一半测试之前对objectnet数据的一半训练的。培训和对同一数据集测试通常提高性能,但这里的模型仅略有改善,这表明物体探测器那些尚未充分理解对象在现实世界中是如何存在的。

有视力的计算机模型自2012年起逐步提高,当被称为alexnet的物体检测粉碎在年度IMAGEnet比赛的竞争。已经得到了更大的数据集作为,性能也有所改善。

但设计objectnet的大版本,随着加入的视角和方向,会导致结果不一定好,研究人员发出警告。 objectnet的目标是激励研究人员拿出革命性的技术浪潮下,多为首次推出IMAGEnet挑战一样。

“这些人养活数据探测器庞大的金额,但有收益递减,”卡茨说。 “你不能从每一个角度,每大环境中的对象。这是我们希望新的数据集将产生强大的计算机视觉ESTA没有在现实世界中令人惊讶的失败“。

这项研究的其他作者是朱利安alvero,威廉·罗,王志成,和澳门太阳城最新网站的乔舒亚·特南鲍姆。这项研究是由美国国家科学基金会,澳门太阳城最新网站的中心大脑,心灵和机器资助,澳门太阳城最新网站,IBM沃森人工智能实验室,丰田汽车研究所和systemsthatlearn @ CSAIL举措。


主题: 追求智慧, 中心的大脑思维和机器, 电气工程和计算机科学(EECS), 计算机科学和人工智能实验室(CSAIL), 工程学院, 算法, 人工智能, 计算机科学与技术, 计算机视觉, 数据, 机器学习, 软件

回到顶部