""

澳门太阳城网站-最新注册

  • 来自澳门太阳城最新网站和其他地方的研究人员已经开发出一种交互式工具,对于第一次,可以让用户看到并控制日益流行的自动化机器学习(automl)系统工作。

    来自澳门太阳城最新网站和其他地方的研究人员已经开发出一种交互式工具,对于第一次,可以让用户看到并控制日益流行的自动化机器学习(automl)系统工作。

    图片:切尔西车工,澳门太阳城最新网站

    全屏
  • 该工具,atmseer,产生一个友好的用户界面,显示关于所选择的模型的性能,以及算法和参数的选择,可以全部被调整的深度信息。

    该工具,atmseer,产生一个友好的用户界面,显示关于所选择的模型的性能,以及算法和参数的选择,可以全部被调整的深度信息。

    图像:研究人员礼貌

    全屏

破解开自动化机器学习的黑盒子

来自澳门太阳城最新网站和其他地方的研究人员已经开发出一种交互式工具,对于第一次,可以让用户看到并控制日益流行的自动化机器学习(automl)系统工作。

交互式工具,使用户能够查看和控制模型的搜索如何自动工作。 看视频


记者联系

艾比abaz要么ius
电子邮件: abbya@mit.edu
电话:617-253-2709
澳门太阳城最新网站新闻办公室

来自澳门太阳城最新网站和其他地方的研究人员已经开发出一种交互式工具,对于第一次,可以让用户看到并控制机器学习系统是如何工作的自动化。其目的是建立在这些系统的信心,并设法改善他们。

设计用于特定任务的机器学习模型 - 如图像分类,疾病诊断和股市的预测 - 是一项艰巨的,耗时的过程。专家们首先从许多不同的算法来构建模型周围中进行选择。然后,他们手动调整“超参数” - 它决定了模型的整体结构 - 模型开始赛前训练。

最近开发的自动化机器学习(automl)系统反复测试和修改算法,而那些超参数,选择最适合的机型。但作为系统运行的“黑盒子”,这意味着他们的选择技术对用户隐藏。因此,用户可能不信任的结果,可以发现很难在系统定制自己的搜索需求。

在计算系统,由澳门太阳城最新网站的研究人员对人为因素的ACM驰会议提交了一份文件,科技大学(科大),浙江大学,香港大学描述了一个工具,使的automl方法的分析和控制到用户的手中。 atmseer叫,该工具的输入是automl系统,数据集,以及有关用户的任务的一些信息。那么,它在可视化用户界面友好,呈现在模型的性能更深入的信息搜索过程。

“我们让用户挑选,看看automl系统是如何工作的,”合着者格利扬veeramachaneni,在澳门太阳城最新网站的实验室信息和决策系统(盖),谁的数据将导致AI组首席研究员说。 “你可以简单地选择表现最好的模型,也可能有其他方面的考虑,或使用领域的专业知识来引导系统搜索比其他一些模型。”

在学研究生的学生,谁是automl新手案例研究中,研究人员发现,参与者的85%左右谁使用atmseer是由系统选择的车型有信心。几乎所有的参与者使用的工具,使他们足够舒适在将来使用automl系统说。

“我们发现,人们更倾向于使用automl作为开放的是黑盒子,看到和控制系统是如何运作的结果,”弥史密斯,一名研究生在电气工程和计算机科学(EECS)部门,并说一研究员盖。

“数据可视化是对人类和机器之间更好的合作的有效途径。 atmseer体现了这个想法,”香港科技大学的主要作者王干文说。 “atmseer将主要受益机器学习的从业者,无论其网域,[谁]有专家的一定水平。它可以缓解的手动选择的机器学习算法和调整超参数的疼痛“。

在纸张上加入史密斯veeramachaneni,和王分别是:姚明,胡乔木沉,刘冬雨和华民曲,所有科大的;与浙江大学志华斤。

调整模型

在新工具的核心是一个定制automl系统,被称为“自动调整模式”(ATM),由veeramachaneni和其他研究人员在2017年与传统automl系统开发,ATM完全编目所有的搜索结果,因为它试图以适应模型的数据。

ATM作为输入任何数据集和编码的预测的任务。系统随机选择的算法类 - 如神经网络,决策树,随机森林,和逻辑回归 - 和模型的超参数,诸如决策树的大小或神经网络层的数目。

然后,系统运行对数据集模型,反复调谐超参数,并测量性能。它使用所了解到的有关模型的性能来选择另一种模式,等等。在结束时,系统输出几个表现最好的车型为任务。

诀窍是每个模型基本上可以与几个变量一个数据点进行处理:算法,超参数和性能。建立在这项工作中,研究人员设计了标绘在指定的图形和图表中的数据点和变量的系统。从那里,他们开发出一种独立的技术,也让他们重新配置的实时数据。 “的伎俩是,用这些工具,任何你能想象,你也可以修改,”史密斯说。

类似的可视化工具朝着只分析一个特定的机器学习模型量身定制的,并允许搜索空间的有限的定制。 “因此,他们提供的automl过程,其中的许多配置搜索模型需要分析的支持有限,”王说。 “相反,atmseer支持与各种算法生成的机器学习模型的分析”。

用户控制和信心

atmseer的接口由三个部分组成。一个控制面板允许用户上传的数据集和一个automl系统,和开始或暂停搜索过程。下方是示出了基本的统计概要面板 - 如算法和超参数数量搜索 - 和降序顺序执行顶模型“横幅广告”。 “这可能是你最感兴趣的是,如果你不是一个专家在深入细节坚韧的细节,认为” veeramachaneni说。

atmseer包括一个“automl探查,”含约的算法和超参数,这都可以调整深入的信息的面板。一个面板代表所有算法类作为直方图 - 条形图,显示了算法的业绩得分的分配,以0分至10分,这取决于它们的超参数。单独的面板显示散射该可视化的权衡在不同超参数和算法类性能曲线。

与机器学习专家,谁没有automl经验的案例研究,揭示了用户的控制确实有助于提高automl选择的性能和效率。如生物学和金融 - - 13名研究生在不同科学领域的用户研究也揭示。结果表明,三大因素 - 算法搜索数量,系统运行时间,并发现表现最出色的模型 - 确定用户如何定制自己的搜索automl。这些信息可用于系统定制用户,研究人员说。

“我们才刚刚开始看到的不同方式让人们使用这些系统,并进行选择的开始,” veeramachaneni说。 “那是因为现在这些信息都在一个地方,人们可以看到发生了什么事情幕后,必须控制它的力量。”

该项目资助,部分由埃森哲和美国国家科学基金会


主题: 研究, 计算机科学与技术, 算法, 机器学习, 数据, 人工智能, IDSS, 实验室信息和决策系统(盖), 计算机科学和人工智能实验室(CSAIL), Electrical Engineering & Computer Science (eecs), 工程学院

回到顶部