你好,歡迎來到川北在線
微信
騰訊微博
新浪微博
百度聯(lián)合發(fā)起中文自然語言處理數據共建計劃「千言」
時間:2020-08-26 10:01   來源:今日頭條   責任編輯:毛青青
  原標題:百度聯(lián)合發(fā)起中文自然語言處理數據共建計劃「千言」
 
  8 月 25 日,在百度大腦語言與知識技術峰會上,百度 CTO 王海峰首次發(fā)布了百度大腦語言與知識產品全景圖;百度還聯(lián)合發(fā)起中文自然語言處理數據共建計劃——「千言」 ... 另外,百度集團副總裁吳甜發(fā)布了語義理解技術與平臺文心、智能文檔分析平臺 TextMind 和 AI 同傳會議解決方案 3 大新產品。


    據介紹,百度推出的語義理解技術與平臺文心,基于深度學習 平臺飛槳打造,依托領先的語義理解核心技術,集成 的預訓練模型、全面的NLP算法集、端到端開發(fā)套件和平臺,提供一站式NLP開發(fā)與服務,讓開發(fā)者更簡單、高效地定制企業(yè)級NLP模型。智能文檔分析平臺TextMind,基于OCR、NLP技術,以文檔解析為核心能力,支持文檔對比與文檔審核,具備“多快好省”的核心優(yōu)勢,促進企業(yè)辦公智能升級。

    其中,全新發(fā)布的AI同傳會議解決方案,覆蓋會議全場景、全流程,旨在打造用戶隨身的“會議同傳專家”。吳甜現場展示了如何只用一臺電腦和一部手機快速搭建一套同傳服務,只需點點鼠標、打幾個字,就能快速獲得專業(yè)的同傳服務。

    值得一提的是,針對數據匱乏、算力不足等語言與知識技術研發(fā)中面臨的瓶頸,會上,百度聯(lián)合中國計算機學會、中國中文信息學會發(fā)起中文自然語言處理數據共建計劃——“千言”,解決數據稀缺問題。

圖:百度集團副總裁 吳甜

  據悉,“千言”一期由來自國內11家高校和企業(yè)的數據資源研發(fā)者共同建設,已涵蓋開放域對話、閱讀理解等7大任務,20余個中文開源數據集。
 
  對此,百度技術委員會主席吳華表示,“未來,我們希望有更多的數據集作者能夠參與共建千言,共同推動中文信息處理技術的進步,建設世界范圍的中文信息處理影響力。我們計劃在未來3年,面向20多個任務,收集和建設不少于100個中文自然語言處理數據集,覆蓋語言與知識技術全部領域。”
 
  現場,吳華還發(fā)布了百度語言與知識技術算力共享計劃,通過百度AI STUDIO平臺提供算力支持。
 

   投稿郵箱:chuanbeiol@163.com   詳情請訪問川北在線:http://m.sanmuled.cn/

川北在線-川北全搜索版權與免責聲明
①凡注明"來源:XXX(非在線)"的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,本網不承擔此類稿件侵權行為的連帶責任。
②本站所載之信息僅為網民提供參考之用,不構成任何投資建議,文章觀點不代表本站立場,其真實性由作者或稿源方負責,本站信息接受廣大網民的監(jiān)督、投訴、批評。
③本站轉載純粹出于為網民傳遞更多信息之目的,本站不原創(chuàng)、不存儲視頻,所有視頻均分享自其他視頻分享網站,如涉及到您的版權問題,請與本網聯(lián)系,我站將及時進行刪除處理。



圖庫
合作媒體
金寵物 綠植迷
法律顧問:ITLAW-莊毅雄律師