你好,歡迎來到川北在線
微信
騰訊微博
新浪微博
人工智能仍然只是一個夢:淺談“深度學(xué)習(xí)”目前存在著的若干瓶頸
時間:2017-04-13 11:36   來源:創(chuàng)見   責任編輯:毛青青

  人工智能現(xiàn)在已經(jīng)火的不能再火了。各種新聞機構(gòu)都在不斷地放出猛料,有的說現(xiàn)在 IBM 的 Waston 人工智能已經(jīng)能夠徹底取代勞動者了;還有的說現(xiàn)在的算法在醫(yī)療領(lǐng)域已經(jīng)能夠打敗醫(yī)生了。每一天,都有新的人工智能初創(chuàng)公司出現(xiàn),每一家都聲稱自己在利用機器學(xué)習(xí),徹底顛覆你個人的生活,商業(yè)性質(zhì)的活動。

  還有一些大家平日里司空見慣的產(chǎn)品,比如榨汁機,無線路由器,一夜之間也都換上了全新的廣告語:「我們都是由人工智能技術(shù)所支持的!」智能桌子不僅能知道你平日里工作時所需要的合適高度,甚至還能幫你點午餐!

  但事實是什么呢?那些報道新聞的記者,其實從來沒有親自去介入到一個神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程當中,而新聞源頭的初創(chuàng)公司以及營銷團隊也有自己的盤算:都是想擴大自己的名聲,獲取到資本和人才的關(guān)注,哪怕它們壓根沒有解決一個現(xiàn)實中存在著的問題。

  也正是在這樣的喧囂氣氛中,難怪在人工智能領(lǐng)域會出現(xiàn)那么多一知半解,其實大家都搞不清楚什么是 AI 能做的,什么是 AI 無法辦到的。

  深度學(xué)習(xí)確實是一個讓人心馳神往的技術(shù),這無可辯駁。

  其實,神經(jīng)網(wǎng)絡(luò)這個概念自上個世紀 60 年代就已經(jīng)出現(xiàn)了,只是因為最近在大數(shù)據(jù)、計算機性能上面出現(xiàn)的飛躍,使得它真正變得有用起來,由此也衍生出來一門叫做「深度學(xué)習(xí)」的專業(yè),旨在將復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)應(yīng)用在數(shù)據(jù)建模上,最終帶來前所未有的準確性。

  現(xiàn)在的技術(shù)開發(fā)成果也確實讓人印象深刻。計算機現(xiàn)在可以辨識圖片和視頻里的東西都是什么,可以將語音轉(zhuǎn)化成為文字,其效率已經(jīng)超過了人力范疇。Google 也將 Google Translate 服務(wù)中添加了神經(jīng)網(wǎng)絡(luò),現(xiàn)在的機器學(xué)習(xí)在翻譯水平上已經(jīng)逐步逼近人工翻譯。

  現(xiàn)實中的一些應(yīng)用也讓人大開眼界,就比如說計算機可以預(yù)測農(nóng)田作物產(chǎn)量,其準確性比美國農(nóng)業(yè)部還高;機器還能更加精準的診斷癌癥,其準確度也比從醫(yī)多年的老醫(yī)師還要高。

  DARPA(美國國防部高級研究計劃局)的一名負責人 John Lauchbury 形容如今人工智能領(lǐng)域內(nèi)存在著三股浪潮:

  1. 知識庫,或者是類似于 IBM 所開發(fā)的「深藍」和 Waston 專家系統(tǒng)。

  2. 數(shù)據(jù)學(xué)習(xí),其中包括了機器學(xué)習(xí)和深度學(xué)習(xí)。

  3. 情境適應(yīng),其中涉及通過利用少量數(shù)據(jù),在現(xiàn)實生活中中構(gòu)建出一個可靠的,解釋型的模型,正如人類能完成的程度一樣

 ⊥第二波浪潮而言,目前深度學(xué)習(xí)算法的研究工作進展的不錯,用 Launchbury 的話來說就是因為「流形假設(shè)」的出現(xiàn)。(見下圖) 

  但是深度學(xué)習(xí)也是存在著一些棘手問題的

  在最近在灣區(qū)召開的一次人工智能大會上,Google 的人工智能研究人員 Francois Chollet 強調(diào)了深度學(xué)習(xí)的重要性,它比一般的數(shù)據(jù)統(tǒng)計和機器學(xué)習(xí)方法都要更高級,是一款非常強大的模式辨別工具。但是,不可否認它是存在著嚴重局限性的,至少目前來說是這樣。

  深度學(xué)習(xí)的成果是建立在極其苛刻的前提條件之上

  不管是「監(jiān)督學(xué)習(xí)」(supervised perception),亦或者是「強化學(xué)習(xí)」(reinforcement learning),它們都需要大量的數(shù)據(jù)進行支撐,而且在提前計劃上面表現(xiàn)的非常差,只能做某些最簡單直接的模式辨認工作。

  相比之下,人就能夠從極少數(shù)的例子上學(xué)到有價值的信息,并且善于在時間跨度很長的計劃,在針對某個情境上有能力自己建造一個抽象模型,并利用這樣的模型來做站在 處的歸納總結(jié)。

  事實上,隨便在街邊上走著的一個路人所能做到的最為稀松平常的事,對于深度學(xué)習(xí)算法來說都是難如登天。還是舉個例子好了:現(xiàn)在比如說我們要讓機器來學(xué)會如何在路上走的時候避免被車撞到。

  如果你是采用的「監(jiān)督學(xué)習(xí)路徑」,那么你需要從汽車駕駛的情境中提取海量的數(shù)據(jù),而且還要以明確標示出來的「動作標簽」進行分類挑揀,比如「停止」、「站住」等等。再接下來,你還需要訓(xùn)練一個神經(jīng)網(wǎng)絡(luò),使得它能夠從眼下的情景和所與之相對應(yīng)的行動之間構(gòu)建因果聯(lián)系;

  如果你是采用的「強化學(xué)習(xí)路徑」,那么你應(yīng)該給算法一個目標,讓它能夠獨立地判斷當下最優(yōu)解(也就是最理想的行動)是什么,電腦在不同的情境之下,為了實現(xiàn)避免撞車的這個動作,它估計要宕機上幾千次;

  Choliet 總結(jié)道:「你不可能就以今時今日的技術(shù)研發(fā)成果作為基礎(chǔ),就能實現(xiàn)某種一般意義上的智能!

  而人則不一樣,你需要告訴他一次:你需要躲避車子走。然后我們的大腦就有能力從少數(shù)的例子中提拳驗,有能力在大腦中想象出來被車碾壓后的凄慘嘲(在計算機那里被稱之為「建!),為了避免喪生或者缺胳膊少腿,絕大多數(shù)人都能快速地學(xué)習(xí)到不被車撞到的要領(lǐng)。

  雖然現(xiàn)在已經(jīng)有了比較大的進展,一些神經(jīng)網(wǎng)絡(luò)可以從數(shù)據(jù)層面,在相當大的樣本數(shù)量上給出一個驚人的成果,但是它們?nèi)绻麊为毮贸鲆粋出來,都是不可靠的,所犯的錯誤是人一輩子都不可能犯的,比如說錯把牙刷當作棒球棍。

  數(shù)據(jù)質(zhì)量的不穩(wěn)定性帶來的是:不可靠、不準確,以及不公平。

  而且,你的結(jié)果,還得撒于輸入的數(shù)據(jù)質(zhì)量如何。神經(jīng)網(wǎng)絡(luò)中如果輸入的數(shù)據(jù)是不準確的,不完整的,那么結(jié)果也會錯的離譜,有些時候不僅造成損失,而且還會很尷尬。就比如說 Google 圖片錯把非裔美國人當作了猩猩;而微軟曾經(jīng)試著把一個人工智能放在 Twitter 上進行學(xué)習(xí),幾個小時之后,它就變得充滿惡意,滿口臟話,帶有嚴重種族歧視。

  也許推特上的這個例子有些極端,但不可否認,我們輸入的數(shù)據(jù)本身就存在著某種程度的偏見和歧視,這種帶有主觀性的,潛移默化的觀念或者暗示,有時我們甚至自己都無法察覺。就比如說:word2vec 是 google 推出的做詞嵌入(word embedding)的開源工具,從 Google News 里提取了 300 萬個詞。這組數(shù)據(jù)傳遞出來的信息包括了「爸爸是醫(yī)生,媽媽是護士!惯@明顯就帶有性別上的歧視。

  這種歧視不僅僅是被原封不動地搬運到了數(shù)字世界,而且還會得到放大。如果「醫(yī)生」這個詞更多的指向「男人」而非「女人」,那么算法在面對一份公開的醫(yī)生職位篩選的時候,它會將男性放在女性前面優(yōu)先考慮。

  除了不準確、不公平,還存在著最大的風(fēng)險:不安全。

  「生成對抗式網(wǎng)絡(luò)」(GAN)的發(fā)明人 Ian Goodfellow 提醒我們:現(xiàn)在的神經(jīng)網(wǎng)絡(luò)可以很容易被不軌之徒操縱。他們可以以一種人的肉眼無法識別的方式,篡改圖片,讓機器錯誤地辨識這個圖片。

  左邊的是熊貓(機器的確認度是 57.7%),加上中間的這層圖片之后,機器的確認度上升到了 99.3%,認為圖片上出現(xiàn)的是長臂猿。

  不要寫這樣的風(fēng)險,這種惡意篡改人工智能系統(tǒng)的做法,會帶來極大的危害,尤其是被篡改的圖片和最初的圖片在我們看來完全是一回事。比如說無人自駕駛汽車就會受到威脅。、

  以上就是深度學(xué)習(xí)所存在著的種種瓶頸,目前它要發(fā)揮作用所需要的前置條件太過苛刻,輸入的數(shù)據(jù)對其最終的結(jié)果有著決定性的影響,另外,它存在著很多漏洞,安全性也無法得到保證。如果我們要駛向理想中的人工智能未來,這些瓶頸還有待于人們的進一步的突破與挑戰(zhàn)。

   投稿郵箱:chuanbeiol@163.com   詳情請訪問川北在線:http://m.sanmuled.cn/

川北在線-川北全搜索版權(quán)與免責聲明
①凡注明"來源:XXX(非在線)"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,本網(wǎng)不承擔此類稿件侵權(quán)行為的連帶責任。
②本站所載之信息僅為網(wǎng)民提供參考之用,不構(gòu)成任何投資建議,文章觀點不代表本站立場,其真實性由作者或稿源方負責,本站信息接受廣大網(wǎng)民的監(jiān)督、投訴、批評。
③本站轉(zhuǎn)載純粹出于為網(wǎng)民傳遞更多信息之目的,本站不原創(chuàng)、不存儲視頻,所有視頻均分享自其他視頻分享網(wǎng)站,如涉及到您的版權(quán)問題,請與本網(wǎng)聯(lián)系,我站將及時進行刪除處理。



圖庫
合作媒體
金寵物 綠植迷
法律顧問:ITLAW-莊毅雄律師