""

澳门太阳城网站-最新注册

  • 图文:克里斯蒂娜达尼洛夫

    全屏
  • 由研究员在MIT和UCLA开发了新的物体识别系统查找由同一对象的多个实例共享基本的视觉特征。然后,它查找的多个实例共享这些特征的组合,以及这些组合的组合,依此类推,直到,它装配了对象,类似于一个画线的模型。

    由研究员在MIT和UCLA开发了新的物体识别系统查找由同一对象的多个实例共享基本的视觉特征。然后,它查找的多个实例共享这些特征的组合,以及这些组合的组合,依此类推,直到,它装配了对象,类似于一个画线的模型。

    图像:长(LEO)朱

    全屏

只见树木不见森林

反对说,打破图像转换成更小的部分应该是更加有效和可对大脑是如何工作揭示识别系统。


目标识别是计算机视觉研究的核心课题之一:毕竟,一台计算机可以看出,是没有多大用处,如果它不知道它在看。澳门太阳城最新网站的研究人员与美国加州大学洛杉矶分校的同事,已经开发出新的技术,应该让物体识别系统来构建,更容易应使他们更有效地使用计算机内存。

传统的物体识别系统,试图辨别数字图像的特定类型的对象时,通常会通过寻找对象的显着特征开始。内置识别人脸的系统,例如,可能会寻找类似的东西眼睛,鼻子和嘴,然后确定他们是否有相互正确的空间关系。这种系统的设计,但是,通常需要人的直觉:一个程序员决定该物体的部件是正确的,以ON键英寸这意味着,对于每个新的对象添加到系统中的曲目,程序员必须从头开始,确定所述对象的部分是最重要的。

此外,它意味着旨在表彰百万个不同类型的对象的系统将无法管理大成了。每个对象有它自己一套独特的三个或四个部分,但部分看起来从不同的角度不同,和编目所有这些观点将采取计算机存储的大量信息。

在一份文件中,他们将出席在电气和电子工程师计算机视觉和六月模式识别,博士后长(LEO)朱教授比尔·弗里曼和安东尼奥·托拉尔瓦,会议研究所所有澳门太阳城最新网站计算机科学和人工智能实验室和元昊陈和加州大学洛杉矶分校的阿兰yuille描述了一次解决这两个问题的方法。最喜欢的对象识别系统,其系统学习通过被“训练”与标记对象的数字图像识别新的对象。但它并不需要事先应该找哪个的对象的特点就知道了。对于每个标记的对象时,它首先确定它可以最小的特征 - 往往只是短线段。然后它会在这些低级别特征彼此连接的情况下,形成略微更复杂的形状。然后它会在这些更复杂的形状彼此连接,等等的情况下,直到它的组装日益复杂的零件,其顶部层是整个对象的模型的分层目录。

规模经济

该系统已安装11 ITS从下往上的目录,它通过它从上而下,风选了所有的冗余。在零件目录中所见轮廓,例如,从顶部开始的第二层可以包括马的后部的两个不同的表示马:一个可包括臀部,一个后腿,腹部的一部分;其他可能包括臀部和后腿两者。它可以转出,但在绝大多数的病例当系统识别这些中的一个“部件”,它以及标识等。所以它只会削减层级的其中之一了。

尽管分级方法增加新的信息层关于数字描绘的对象,它结束了节省内存不同的对象可以共享部分因为。也就是说,在几个不同的层,马和鹿最终可能共同具有形状零件目录;在一定程度上,这也适用于可能马匹和汽车如此。无论形状在两个或更多目录之间共享,该系统需要存储它只有一次。在他们的新论文中,研究人员表示,由于他们添加能够识别更多的对象他们的系统,每个对象部分的平均数量稳步下降。

虽然研究人员的工作承诺,更有效地利用计算机内存和程序员的时间,‘它远远不只是一个更好的方式做目标识别更重要的,说:’泰新利,计算机科学的卡耐基梅隆大学副教授。 “这项工作是非常重要的部分,因为我觉得它说,大脑中的一对夫妇的科学奥秘。”李指出人类是视觉处理似乎五到七个不同的脑区参与,但没有一个是很确定他们做什么。研究人员的新对象识别系统没有指定在每个分层模型的层的数目;该系统简单地组装,因为它需要许多层。 “什么样的让我目瞪口呆的是,[中]系统通常学习五到七个层,”李说。这一点,他说,表明它可能执行相同的可视处理是发生在大脑的。

在他们的论文中,澳门太阳城最新网站和加州大学洛杉矶分校的研究人员报告说,在测试中,他们的系统进行以及现有的目标识别系统。但是这仍远不及人类的大脑。李说,研究人员的系统目前主要集中在检测对象的二维描绘的边缘;接近人脑的性能,它必须包含大量关于表面纹理和三维轮廓的附加信息,如大脑一样。朱补充说,他和他的同事们也追求自己的技术的其他应用程序。例如,他们的分层模型自然地将它们自己不仅自动目标识别 - 确定对象是什么 - 也自动对象分割 - 标记对象的组成部分。


主题: 计算机科学与技术, 计算, 电气工程和电子, 物体识别, 计算机视觉, 对象分割

评论

在2000年这是相当清楚的专家前馈的愿景是一个平行的过程,只需要8-10突触传递选择的响应。

可悲的是很多人进入这个领域的思想观念认为,图灵机wholy这是作为大脑的不足直觉。现在我们已经看到了一些进步到正确的方向。

但是应该科学家难怪他们所用技术授权,可以描述的场景。他们被赋予最终的机器无法抗拒因为人类的诱惑,使用的工具在他们的处置,尤其是当他们的武器。

neurom要么pher,你能解释一下这句话?目前尚不清楚。

“应然难怪科学家她们所用技术授权,可以描述一个场景,都赋予最终的机器无法抗拒因为人类的诱惑,使用的工具在他们的处置,特别是当他们的武器。”

我认为一个词典系统可能是有效的。如果我们采取一系列库存图片或词典,例如,处理阶段一个由近似基本形状,例如圆形,正方形,矩形,计算机近似于看出到第一级的形状的形状,并创建从一个简单的模式复杂的图像。第二阶段,简单的图案是一个目录中的其他基本形状的交叉引用,像书,瓶,板等,然后在第三阶段中,它被精制以更大的一组图像。在三个阶段,我们有,在视觉上,三维立方体,与含有高度轴或行的基本形状,选择一个,然后映射到长度轴线为更复杂的形状,然后对更精细的形状的宽度轴。所以如果看到一棵树的日志例如,不过直观的逻辑或学习计算机是什么使IT人员能够随着时间的推移缩小其定义的计算机可能会说“汽车”。能够重新设定它自己的字典结构是机器的基本知识发展有什么我们可以称之为一个“心”。

回到顶部