苹果公司2亿美元购入专门挖暗数据的AI小新时代
苹果公司2亿美元购入专门挖"暗数据"的AI小公司
美国的《福布斯》报道了人工智能初创公司 被苹果收购的消息,苹果随后官方确认了这次收购。此后,又有媒体爆料收购的金额为2亿美元,收购在数周前已经完成,的20名员工加入苹果。
(图片来源:公司主页)
虽然成立时间不长,但是创始人大有来头
。Mike Cafarella是密歇根大学的助理教授,也是著名的数据库系统领域的专家,曾与别人共同设计了
Hadoop 系统。而另一位创始人 Christopher Re
教授来自斯坦福大学,此前曾构建了机器学习系统DeepDive。Lattice公司的成立正是为了实现 DeepDive 系统的商业化。
Lattice 的投资方包括谷歌风险资本(GV)和 Madrona 等机构。
简单地来说,可以从大量从未被仔细研究过的暗数据(dark data)中挖掘出有价值的信息。虽然每天传感器、互联和移动设备等都会产生大量的数据,但是这些数据往往杂乱无章,缺乏结构。
举个例子,全世界的学者都会发表成千上万篇论文,但这些论文中既有统计数据,又有图片数据、引用数据、文本数据等等内容,非常难以实现结构化。
的 D第三名的无动于衷就促使了第二名的更加猖狂eepDive 系统正是可以从这样一些杂乱无章的数据中提取出结构化的信息,储存在结构化的数据库里。
目前,DeepDive
已经在很多领域产生应用,比如对抗人口贩卖活动。根据国际刑警组织的分析,人口贩卖已经成为仅次于毒品和武器走私的全球第三大非法贸易。贩卖的人口主要在工厂中从事强迫性的苦力工作或者被迫成为性工作者,人口贩子可以从相关的流程中获得分成。作为商业流程中不可或缺的一环,贩卖人口的广告也总会在上露出一些痕迹。
于是,Lattice营造浓厚的学习、读书氛围。二是做好计划生育工作。积极配合办事处宣传《独生子女父母光荣证》的换发、办理工作。对符合独生子女的职工认真核对
参与了美国国防部领导的 Memex 项目,负责从页求职广告数据中抽取出与人口贩卖相关的结构化数据。互联上有海量的广告页,可以理解成一个个
HTML 文件,里面既有 HTML 的标签,也有非结构化的文本内容。项目的其他参与者从上找到了3000万条和性服务有关的广告。
虽然不同的广告形式、内容、风格都不相同。不过通过DeepDive系统,可以把这些广告所含的信息整理成表,包括不同的列,比如:广告的链接、广告中联系人的姓名和号码、工作地点,以及工资等。这样,络广告数据就变成了一张可以存储在
SQL 甚至 Excel 中的表格。
图丨DeepDive的人口贩卖跟踪系统(图片来源:DeepDive主页)
在赋予了数据结构后,数据分析师就可以利用这些表格进行有目的的数据分析工作,比如,回答了以下几个问题:如何判断某个工作广告是否面向被贩卖的人口?如何了解人口贩卖组织的内部结构?如何帮助执法者找到危害最大的人口贩卖集团,解救处境最危险的受害者?
因为有了DeepDive,复杂的分析性工作变成了简答的数据库查询任务。
例如,人口贩子经常移动受害者,保持对他们的控制。所以如果求职者经常变换工作地点,说明他们更有可能被人控制。
此外,没有被贩卖的性工作者存在经济上的理性,会提出合理的价格并规避风险加大的行为。如果一个求职个体要求非市场化的价格或提供非正常性的服务,就应该引起执法者的注意。
关于苹果公司的AI布局
苹果公司并没有过多地透露这次收购的具体细节,只是在一则声明中表示:苹果公司会不时收购一些小型技术公司,但我们通常不讨论收购的目的和计划。
是苹果在在过去2年多时间里收购的至少第三家人工智能公司。2015年10月,苹果收购了语音技术公司VocalIQ,此举被认为用于增强语音助手 Siri 和未来的汽车搭载交互系统。2016年8月,苹果又斥资2
亿美元收购西雅图的人工智能初创公司 Turi,并随后成立了机器学习部门。
和其他硅谷的巨头相比,长期以来苹果并不以人工智能著称。Facebook
的人工智能负责人 Yan LeCun
曾经公开表示,苹果并不是人工智能研究圈子中的一员。一方面是因为苹果的公司文化不算开放,也很少发表人工智能相关的学术论文;另一方面则是因为苹果在挖掘用户数据和保护用户隐私的平衡中更偏向后者。
然而,每个季度都能卖出几千万台的苹果公司显然不能忽视用户数据带来的巨大红利。早先收购的人工智能公司往往被认为有非常具体的产品整合目的,尤其是相关的语音分析技术可被用来增强Siri系统。
但对于 Lattice 的这次收购,无疑可能将在更大的尺度上帮助苹果整合并分析收集到的各种数据。
毫无疑问,作为一个多媒体终端,获取的数据会非常杂乱多样,可能包括用户的位置数据、App使用记录、文字、图片、视频等等。如果能从这么多非结构化的信息中抽取出数据整理成表格,有可能将苹果的数据分析水平提升一个层次。
此外,DeepDive在医疗领域也有应用。如果向系统输入大量生物医学领域的论文数据,系统就会自动提取论文中提及的疾并基因、表型形状等关键词,还能从论文中挖掘出药物和身体分子相互作用的关系。考虑到苹果长期以来在医疗领域的布局,DeepDive的这些功能也有可能派上用常
乳腺增生怎么冶疗最好
黄石治疗白斑的医院
呼伦贝尔治疗白癜风医院
婴儿拉肚子是怎么样的
-
格林美:公司不会“过度“做镍,目的是保障天然资源安全
每经记者:安宇飞 每经编辑:陈俊杰 5年末20日,格林美(002340,SZ)召开了...
2023-10-09
-
C罗透露经历丧子之痛,足坛各方送上恳求传递爱与力量
南都资 记者陶新蕾 北京时间4月底19日凌晨,C罗在社群大媒体上公开发表了一...
2023-10-07
-
哪有什么真直男 都是装直男 他发觉你生气了 需要哄 也发觉消息要及时回 也发觉要关心你 给你买喜欢的
哪有什么真直男 都是装直男 他究竟你羞愧了 必须拚命 也究竟消息要及时返...
2023-10-05
-
2022宁夏公务员考试笔试时间确认7月9日至10日
根据局限性霍乱风险评估态势及《银川市2022年入学破例公务人员告示》明确...
2023-10-03
-
【医学小常识】慢阻肺患者睡觉时不成形易腹泻?这三款代茶饮总有一款能帮你!
慢阻呼吸系统水泡不成形易病症?这三款代茶饮总有一款能找来你止燥! 本...
2023-09-27
-
明早,对拉脱维亚“断气”
挪威国和有太阳能供货商加苏姆一些公司20日坚称,俄国和原油工业生产股份...
2023-09-24