您的位置:首页 >科技 >

AI独角兽数据机器人收购数据预备老手Paxata

DataRobot是自动化机器学习(ML)和人工智能(AI)领域的领军企业,它收购了Paxata, Paxata是早期的自助数据准备纯粹的游戏供应商之一。DataRobot表示,收购Paxata将有助于“增强其端到端的人工智能能力”;事实上,它在这一主题的新闻稿中也使用了同样的措辞。交易条款没有披露。

Paxata,就其本身而言,可能更关注于直接的描述性分析的数据准备,而不是人工智能。但人工智能平台也需要准备数据,以帮助数据科学家精简和净化他们的数据集。数据准备在所谓的特征工程工作中也非常有用,它的目的是在数据准备工作发生之前,从列数据的特定子集中提取ML模型输入(“特征”)到它们自己的数据列中。

我与菲尔•Gurbacki DataRobot高级产品开发和客户体验,他告诉我每个DataRobot用户需要做数据准备为了成功毫升。这样,Gurbacki表示,尽管独立Paxata产品仍将是可用的,该公司是最热衷于拍摄Paxata数据准备,把每一个DataRobot客户一体化的方式。

Gurbacki还解释说,用于AI和ML的数据准备工作负载与用于BI和分析的不同。首先,人工智能的准备工作通常集中在一组被转换为模型特性的列上。此外,不仅需要准备数据来训练ML模型,还需要准备这些模型在生成预测时得到的数据。数据需要以非常低的延迟发生,并且本质上是一个频繁的生产过程。这与BI数据准备不同,后者在较大的数据卷上针对一组广泛的列执行的频率较低。

尽管工作负载不同,但DataRobot认为Paxata技术已经准备好并能够适应这两种场景。

Paxata于2012年由一个团队创建,其中包括来自企业商业智能(BI)领域的经验丰富的老手。创始人之一,首席产品官Nenshad Bardoliwalla是遗留CRM供应商Siebel的分析团队的校友,以及BI先锋Hyperion和SAP(Siebel和Hyperion都被Oracle收购了)。联合创始人兼首席执行官普拉卡什•南杜里来自Tibco和SAP。

我在纽约的aTDWIchapter会议上遇到了Bardoliwalla,当时Paxata还处于隐身模式。他解释说,他和其他人都坚信,在企业级BI世界中,准备数据太困难,太依赖IT专家。这种情况反过来又剥夺了企业用户以热情和效率追求分析的权利。

如果这是一个标准化测试中的类比问题,我们可能会说[Paxata]:[data prep]和[DataRobot]:[AI和ML]。这两家公司都试图通过提供自助服务平台来实现各自技术领域的民主化,从而增强业务用户的能力,减轻他们对专业人士的依赖。考虑到这一点,这次收购意义重大。Gurbacki告诉我“DataRobot的使命是建立一个企业AI平台,在原始数据和商业价值之间架起一座桥梁。”

另外,通过多样化和现在的整合,作为纯游戏供应商类别的data prep也在减少。Alteryx通过收购Semanta和Yhat,在数据目录和人工智能领域显著拓宽了其平台。Datameer也推出了自己的Neebo数据虚拟化平台。在Trifacta保持独立的同时,该公司高度关注云数据仓库和数据湖场景,谷歌利用了该公司的技术开发其云Dataprep产品。与此同时,微软(Microsoft)、Informatica、Talend和Tableau等公司已将自行开发的自助数据准备系统添加到它们自己的堆栈和核心产品中。

亦读:Alteryx扩展产品集,做数据科学采集

对于特定技术领域的创新(比如为大数据做自助数据准备)来说,这是一个自然的流程,会产生多个纯粹的供应商,他们会将创新产品化。这是一个自然的结果,随着一个创新领域的成熟,它的供应商会被现有的和新领域的参与者收购,比如人工智能。我们已经看到这种情况发生在商业智能上——虽然一个数据点不构成趋势——也许现在我们会在数据准备上看到它。

免责声明:本文由用户上传,如有侵权请联系删除!

最新文章