2017 年 5 月 14 日,美國的《福布斯》報道了人工智能初創(chuàng)公司 Lattice.io 被蘋果收購的消息,蘋果隨后官方確認了這次收購。此后,又有媒體爆料收購的金額為 2 億美元,收購在數(shù)周前已經完成,Lattice.io的 20 名員工加入蘋果。
Lattice.io 雖然成立時間不長,但是創(chuàng)始人大有來頭。Mike Cafarella是密歇根大學的助理教授,也是 的數(shù)據(jù)庫系統(tǒng)領域的專家,曾與別人共同設計了 Hadoop 系統(tǒng)。而另一位創(chuàng)始人 Christopher Re 教授來自斯坦福大學,此前曾構建了機器學習系統(tǒng)DeepDive。Lattice公司的成立正是為了實現(xiàn) DeepDive 系統(tǒng)的商業(yè)化。
Lattice 的投資方包括谷歌風險資本(GV)和 Madrona 等機構。
簡單地來說,Lattice.io可以從大量從未被仔細研究過的暗數(shù)據(jù)(dark data)中挖掘出有價值的信息。雖然每天傳感器、互聯(lián)網和移動設備等都會產生大量的數(shù)據(jù),但是這些數(shù)據(jù)往往雜亂無章,缺乏結構。
≠個例子,全世界的學者都會發(fā)表成千上萬篇論文,但這些論文中既有統(tǒng)計數(shù)據(jù),又有圖片數(shù)據(jù)、引用數(shù)據(jù)、文本數(shù)據(jù)等等內容,非常難以實現(xiàn)結構化。
Lattice.io 的 DeepDive 系統(tǒng)正是可以從這樣一些雜亂無章的數(shù)據(jù)中提取出結構化的信息,儲存在結構化的數(shù)據(jù)庫里。
目前,DeepDive 已經在很多領域產生應用,比如對抗人口販賣活動。根據(jù)國際刑警組織的分析,人口販賣已經成為僅次于毒品和武器走私的全球第三大非法貿易。販賣的人口主要在工廠中從事強迫性的苦力工作或者被迫成為性工作者,人口販子可以從相關的流程中獲得分成。作為商業(yè)流程中不可或缺的一環(huán),販賣人口的廣告也總會在網上露出一些痕跡。
于是,Lattice 參與了美國國防部領導的 Memex 項目,負責從網頁求職廣告數(shù)據(jù)中抽取出與人口販賣相關的結構化數(shù)據(jù);ヂ(lián)網上有海量的廣告網頁,可以理解成一個個 HTML 文件,里面既有 HTML 的標簽,也有非結構化的文本內容。項目的其他參與者從網上找到了 3000 萬條和性服務有關的廣告。
雖然不同的廣告形式、內容、風格都不相同。不過通過DeepDive系統(tǒng),可以把這些廣告所含的信息整理成表,包括不同的列,比如:廣告的鏈接、廣告中聯(lián)系人的姓名和電話號碼、工作地點,以及工資等。這樣,網絡廣告數(shù)據(jù)就變成了一張可以存儲在 SQL 甚至 Excel 中的表格。
因為有了DeepDive,復雜的分析性工作變成了簡答的數(shù)據(jù)庫查詢任務。
例如,人口販子經常移動受害者,保持對他們的控制。所以如果求職者經常變換工作地點,說明他們更有可能被人控制。
此外,沒有被販賣的性工作者存在經濟上的理性,會提出合理的價格并規(guī)避風險加大的行為。如果一個求職個體要求非市場化的價格或提供非正常性的服務,就應該引起執(zhí)法者的注意。
關于蘋果公司的AI布局
蘋果公司并沒有過多地透露這次收購的具體細節(jié),只是在一則聲明中表示:“蘋果公司會不時收購一些小型技術公司,但我們通常不討論收購的目的和計劃!
Lattice.io 是蘋果在在過去 2 年多時間里收購的至少第三家人工智能公司。2015 年 10 月,蘋果收購了語音技術公司VocalIQ,此舉被認為用于增強語音助手 Siri 和未來的汽車搭載交互系統(tǒng)。2016 年 8 月,蘋果又斥資 2 億美元收購西雅圖的人工智能初創(chuàng)公司 Turi,并隨后成立了機器學習部門。
和其他硅谷的巨頭相比,長期以來蘋果并不以人工智能著稱。Facebook 的人工智能負責人 Yan LeCun 曾經公開表示,蘋果并不是人工智能研究圈子中的一員。一方面是因為蘋果的公司文化不算開放,也很少發(fā)表人工智能相關的學術論文;另一方面則是因為蘋果在挖掘用戶數(shù)據(jù)和保護用戶隱私的平衡中更偏向后者。
然而,每個季度都能賣出幾千萬臺手機的蘋果公司顯然不能忽視用戶數(shù)據(jù)帶來的巨大紅利。早先收購的人工智能公司往往被認為有非常具體的產品整合目的,尤其是相關的語音分析技術可被用來增強Siri系統(tǒng)。
但對于 Lattice 的這次收購,無疑可能將在更大的尺度上幫助蘋果整合并分析收集到的各種數(shù)據(jù)。
毫無疑問,手機作為一個多媒體終端,獲取的數(shù)據(jù)會非常雜亂多樣,可能包括用戶的位置數(shù)據(jù)、App使用記錄、文字、圖片、視頻等等。如果能從這么多非結構化的信息中抽取出數(shù)據(jù)整理成表格,有可能將蘋果的數(shù)據(jù)分析水平提升一個層次。
此外,DeepDive在醫(yī)療領域也有應用。如果向系統(tǒng)輸入大量生物醫(yī)學領域的論文數(shù)據(jù),系統(tǒng)就會自動提取論文中提及的疾病、基因、表型形狀等關鍵詞,還能從論文中挖掘出藥物和身體分子相互作用的關系?紤]到蘋果長期以來在醫(yī)療領域的布局,DeepDive的這些功能也有可能派上用場。
投稿郵箱:chuanbeiol@163.com 詳情請訪問川北在線:http://m.sanmuled.cn/