你好,歡迎來(lái)到川北在線
微信
騰訊微博
新浪微博
騰訊挖來(lái)微軟語(yǔ)音識(shí)別專家,成立西雅圖 AI 實(shí)驗(yàn)室“搞事情”
時(shí)間:2017-05-03 12:35   來(lái)源:cheekr   責(zé)任編輯:毛青青

  如果你不喜歡收聽微信的語(yǔ)音信息,可能也會(huì)因此試用過微信的語(yǔ)音轉(zhuǎn)文字功能。如果對(duì)方普通話標(biāo)準(zhǔn),識(shí)別出來(lái)的內(nèi)容還算是能夠理解,這還得歸功于騰訊在語(yǔ)音識(shí)別等人工智能(AI)方面的研究。

  如今,為了進(jìn)一步“升級(jí)”技能,騰訊更是從微軟挖來(lái)一位在語(yǔ)音識(shí)別與深度學(xué)習(xí)領(lǐng)域的專家——俞棟。作為騰訊 AI Lab 副主任,俞棟將管理新成立的美國(guó)西雅圖 AI 實(shí)驗(yàn)室,負(fù)責(zé)推動(dòng)騰訊在語(yǔ)音識(shí)別及自然語(yǔ)言理解等 AI 領(lǐng)域的基礎(chǔ)研究。

  加入騰訊前,俞棟擔(dān)任微軟研究院語(yǔ)音和對(duì)話組(Speech and Dialog Group)首席研究員。

  他是 2011 年發(fā)布的論文《Conversational Speech Transcription Using Context-Dependent Deep Neural Networks(使用上下文相關(guān)深層神經(jīng)網(wǎng)絡(luò)進(jìn)行交談?wù)Z音轉(zhuǎn)寫)》的主要研究人員。

  該論文提出了基于人工神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別新方法,實(shí)驗(yàn)結(jié)果證明,這種新方法大幅降低了語(yǔ)音識(shí)別的錯(cuò)誤率,將沉寂多年的人工神經(jīng)網(wǎng)絡(luò)再次引入語(yǔ)音識(shí)別研究領(lǐng)域,開啟了語(yǔ)音識(shí)別的深度學(xué)習(xí)時(shí)代。

  這項(xiàng)工作(將深度學(xué)習(xí)的方法引入語(yǔ)音識(shí)別領(lǐng)域)一開始受到很多懷疑,很多同事或者朋友都經(jīng)歷過 80 年代末 90 年代初,神經(jīng)網(wǎng)絡(luò)從高潮跌落到低潮的過程,所以他們都對(duì)此有一定的懷疑。

  俞棟回顧道,但在兩年后,許多公司卻開始重復(fù)他們的研究工作,并發(fā)現(xiàn)那對(duì)識(shí)別率有很大幫助。隨后,通過深度學(xué)習(xí),微軟團(tuán)隊(duì)在語(yǔ)音識(shí)別上也在不斷突破:

  2016 年 9 月中旬,微軟報(bào)告了在語(yǔ)音識(shí)別方面取得的新里程碑:在 Switchboard 這一電話交談基準(zhǔn)測(cè)試集上新系統(tǒng)的識(shí)別詞錯(cuò)率降至 6.3%;一個(gè)月后,微軟又公布了在這一基準(zhǔn)測(cè)試集上成功實(shí)現(xiàn)了歷史性突破:他們的語(yǔ)音識(shí)別系統(tǒng)詞錯(cuò)率(WER)和專業(yè)轉(zhuǎn)錄員相當(dāng)甚至更低,達(dá)到 5.9%。

  當(dāng)被問及為何會(huì)選擇和騰訊合作,俞棟表示,他認(rèn)為騰訊在研究語(yǔ)音識(shí)別方面有自己的優(yōu)勢(shì):騰訊具有大數(shù)據(jù)來(lái)源,同時(shí)也具備運(yùn)算能力,有出口形成反饋機(jī)制進(jìn)而優(yōu)化產(chǎn)品,有落地的嘲。與之同時(shí),騰訊還能滿足他更偏向研究的喜好。

  更偏研究的西雅圖實(shí)驗(yàn)室

  在 2016 年 4 月,騰訊正式成立 AI Lab,旨在推進(jìn)人工智能技術(shù)研究,且發(fā)展相關(guān)應(yīng)用嘲。

  AI Lab 聚焦四大領(lǐng)域的基礎(chǔ)研究,包括:計(jì)算機(jī)視覺、語(yǔ)音識(shí)別、自然語(yǔ)言處理與機(jī)器學(xué)習(xí)。并將相關(guān)技術(shù)應(yīng)用于具有騰訊特色的四大業(yè)務(wù)嘲中的應(yīng)用能力:內(nèi)容 AI、社交 AI、游戲 AI 和平臺(tái)工具 AI。

  深圳 AI Lab 注重將基礎(chǔ)研究結(jié)果和應(yīng)用嘲快速結(jié)合。相比之下,由俞棟帶領(lǐng)的西雅圖 AI Lab 將承擔(dān)一些語(yǔ)音識(shí)別和 NLP 的基礎(chǔ)和前沿研究工作,并試圖解決這些領(lǐng)域更困難的問題。

  雖然這個(gè)研究方向下,研究結(jié)果和實(shí)際應(yīng)用結(jié)合過程可能會(huì)比較漫長(zhǎng),但語(yǔ)音識(shí)別的基礎(chǔ)性研究與騰訊重社交和交互的業(yè)務(wù)來(lái)說非常重要,無(wú)論是游戲、微信、QQ、物聯(lián)網(wǎng)等,都可用上語(yǔ)音識(shí)別。因此這次布局也是戰(zhàn)略之舉。

  如果要在技術(shù)研究上取得突破,確實(shí)需要有一定耐心,相對(duì)來(lái)說長(zhǎng)期穩(wěn)定的投入,西雅圖這邊基本上秉持這樣的理念。

  我們希望長(zhǎng)遠(yuǎn)來(lái)講,能夠創(chuàng)新性地攻克關(guān)鍵的、主要的技術(shù)難題,在真實(shí)應(yīng)用嘲里有很大的性能提升。但是因?yàn)槲覀儧]有辦法預(yù)測(cè)到底哪天能成功,我們希望在每一個(gè)階段都會(huì)有一些進(jìn)步,這是我們 可以定義的一些進(jìn)步,但是這個(gè)進(jìn)步會(huì)有多大,也是沒有辦法比較明確說出來(lái)的。

  俞棟如此說道。而作為西雅圖實(shí)驗(yàn)室負(fù)責(zé)人的 任務(wù),俞棟目前正在招攬團(tuán)隊(duì)成員中。

   投稿郵箱:chuanbeiol@163.com   詳情請(qǐng)?jiān)L問川北在線:http://m.sanmuled.cn/

川北在線-川北全搜索版權(quán)與免責(zé)聲明
①凡注明"來(lái)源:XXX(非在線)"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。
②本站所載之信息僅為網(wǎng)民提供參考之用,不構(gòu)成任何投資建議,文章觀點(diǎn)不代表本站立場(chǎng),其真實(shí)性由作者或稿源方負(fù)責(zé),本站信息接受廣大網(wǎng)民的監(jiān)督、投訴、批評(píng)。
③本站轉(zhuǎn)載純粹出于為網(wǎng)民傳遞更多信息之目的,本站不原創(chuàng)、不存儲(chǔ)視頻,所有視頻均分享自其他視頻分享網(wǎng)站,如涉及到您的版權(quán)問題,請(qǐng)與本網(wǎng)聯(lián)系,我站將及時(shí)進(jìn)行刪除處理。



圖庫(kù)
合作媒體
IT袋 綠植迷 金寵物 領(lǐng)啦網(wǎng)
法律顧問:ITLAW-莊毅雄律師