澳门太阳城网站-最新注册

  • paradigm4允许用户将数据从像基因测序,生物测量,环境因素的来源更加整合,并为他们的询问,以使在一系列生命科学领域的新发现。

    paradigm4允许用户将数据从像基因测序,生物测量,环境因素的来源更加整合,并为他们的询问,以使在一系列生命科学领域的新发现。

    全屏

加快数据驱动的发现

paradigm4允许用户将数据从像基因测序,生物测量,环境因素的来源更加整合,并为他们的询问,以使在一系列生命科学领域的新发现。

生命科学公司利用paradigm4独有的数据库管理系统,以发现新的见解人体健康。


记者联系

艾比abaz要么ius
电子邮件: abbya@mit.edu
电话:617-253-2709
澳门太阳城最新网站新闻办公室

像单细胞基因测序,增强生物医学成像和医疗设备激增“物联网”技术,对人类健康的关键发现复杂的生命科学和健康数据的广阔troves内越来越多地发现。

但是从这些数据绘制有意义的结论是,可能涉及拼凑不同的数据类型和响应变化的科学调查操纵大型数据集的一大难题。问题是一样关于计算机科学,因为它是科学的其他领域。这就是paradigm4用武之地。

该公司,由创办玛丽莲·麦茨SM '80和图灵奖得主,澳门太阳城最新网站教授迈克尔·斯通布雷克,帮助制药企业,研究机构和生物技术公司将数据转化为洞察力。

它实现这与同时从地上爬起来建主机多样化,多方面的数据在生命科学研究前沿的计算的数据库管理系统。包括来自如国家生物库,临床试验,对事物的医疗网络,人体细胞地图集,医学影像,环境因素,以及多组学,包括基因组,微生物组,代谢组,以及更多的研究领域的一个来源的数据。

在该系统的独特架构之上,公司还建成了数据准备,元数据管理和分析工具,帮助用户发现的重要模式与关联所有这些数字内潜伏。

在许多情况下,客户都在探索数据集的创始人说是过于庞大和复杂的要由传统的数据库管理系统的有效体现。

“我们热衷于让科学家和数据科学家通过使他们更容易应对大规模计算和机器学习上的各种数据,做的事情他们以前无法完成”马茨说。 “我们正在帮助科学家和生物信息学家与合作,重复性研究提出和回答尖锐的问题更快。”

一个新的范例

斯通布雷克已经有几十年的数据库管理系统领域的先驱。他已经开始九家公司,而他的创新已经为途径现代系统让人们能够组织和访问大型数据集的标准。

多斯通布雷克的职业生涯一直专注于关系型数据库,其数据组织成列和行。但在2000年代中期开始,斯通布雷克意识到,很多正在生成的数据将得到更好的存储不是行或列,但多维数组。

例如,卫星打破了地球表面到大广场,和GPS系统跟踪随着时间的推移,通过这些广场一个人的运动。该操作涉及那些不容易分组或以其他方式操纵在关系数据库系统的分析垂直,水平,和时间测量。

斯通布雷克回忆他的科学同事抱怨说,现有的数据库管理系统太慢与复杂的科学数据集工作,像基因组学,那里的研究人员研究人口规模的多组学数据,表型数据和医疗记录之间的关系领域。

“[关系数据库系统]扫描水平或垂直,而不是两者”斯通布雷克解释。 “所以你需要一个系统可以做到这些,这需要在系统,它能够通过一个非常大的阵列水平和垂直移动的两个底部的存储管理器了。这就是paradigm4呢“。

在2008年,斯通布雷克开始在澳门太阳城最新网站开发的数据库管理系统,多维数组存储数据。他确认所提供的主要效率优势的做法,允许基于线性代数,包括各种形式的机器学习和统计数据处理,被应用到新的方式巨大的数据集的分析工具。

斯通布雷克决定将项目分拆成一家公司在2010年,当他与马茨合作,一个成功的企业家谁共同创办康耐视公司,一个大的工业机器视觉公司,上市于1989年,创始人和他们的团队,包括亚历克斯poliakov BS '07,去工作,建立了该系统的主要功能,包括它的分布式体系结构,允许系统的低成本服务器上运行,而其对用户有用的方式能够自动清洁和整理数据。

创始人描述他们的数据库管理系统,为科学数据的计算引擎,他们已经把它命名为scidb。在scidb的顶部,他们开发了一个分析平台,叫做揭示发现引擎,根据用户日常的研究活动和愿望。

“如果你是一个科学家或数据科学家,范式的揭示和scidb产品照顾所有的数据扯皮和计算‘水管和电线,’所以你不必担心访问数据,移动数据,或设立平行分布式计算,”马茨说。 “你的数据是科学就绪。只问你的科学问题和平台编排所有的数据管理和计算的你“。

scidb被设计成由科学家和开发者使用,因此用户可以通过图形用户接口的系统或通过利用统计和编程像r和蟒语言交互。

“这是非常重要的销售解决方案,而不是搭积木,”马茨说。 “我们在与顶级制药和生物技术公司和研究机构在生命科学成功的很大一部分是把他们我们揭示了一套应用程序特定问题的解决方案。我们不交给他们的分析平台,这是一个集火花的LEGO积木;我们给予该处理,他们处理日常的数据,并使用自己的词汇量,并回答他们希望在工作中的问题解决方案,这些解决方案。”

加快发现

今天paradigm4的客户包括世界上一些最大的制药和生物技术公司,以及在卫生,斯坦福大学,和其他地方的国家机构的研究实验室。

客户可以整合基因组测序数据,生物测量,对环境因素的数据,多进他们的询问,以使在一系列生命科学领域的新发现。

马茨说scidb做1个十亿线性回归,在不到一个小时在最近的基准,它可以很好地扩展,除此之外,这可能加快研究人员谁历来不得不从文件中提取的数据,然后依靠的发现和降低成本通过低效率的云计算为基础的方法来大规模应用的算法。

“如果研究人员能够在运行复杂几分钟分析和过去需要几天,这极大地改变了,你可以问尖锐的问题和答案的数量,”马茨说。 “这是一个力量倍增,每天将改变的研究。”

超越生命科学,paradigm4的系统适用于任何行业的交易有多方面的数据,包括地球科学,其中马茨说,美国宇航局的气候学家已经使用该系统,以及工业IOT,其中数据科学家认为大量不同的数据来了解复杂的制造系统的承诺。马茨说,该公司明年将更多的精力放在那些行业。

在生命科学,然而,创始人相信他们已经有一个革命性的产品,它能够真实发现的一个新的世界。下了线,他们看到scidb,揭示促进国家和全球卫生研究,这将允许医生提供最知情,人性化关怀可想而知。

“每一个医生要运行的查询是,当你进入他或她的办公室,并显示一组症状,医生问:“谁在这个国家数据库具有遗传学看起来像我的,症状看起来像我的,生活方式曝光,看起来像我的吗?并且是什么他们的诊断是什么?什么是他们的治疗方法?什么是他们的发病率?”斯通布雷克说。 “这是你的交叉与其他人做的非常个性化药物相关,我认为这是我们的掌握之中。”


话题: Innovation and Entrepreneurship (I&E), 校友/ AE, 大数据, 机器学习, 数据, 工程学院, Electrical Engineering & Computer Science (eecs), 计算机科学和人工智能实验室(CSAIL), 计算机科学与技术, 学院, 健康, 药物, 初创公司

回到顶端