在2024世界人工智能大會啟明創(chuàng)投·創(chuàng)業(yè)與投資論壇上,階躍星辰創(chuàng)始人、CEO姜大昕發(fā)表了演講,分享了對于大模型發(fā)展現(xiàn)狀與趨勢的觀察與思考。在演講中,姜大昕重點闡述了一個核心觀點:探索AGI路徑,“Scaling Law”和“多模態(tài)”是相輔相成、缺一不可的兩個方向。兩者齊頭并進,最終到達AGI。
近年來,GPT系列模型的演進,客觀上驗證了Scaling Law的有效性。模型參數(shù)量決定模型能力的上限。從模型效果看,參數(shù)量增大確實帶來了性能上的飛躍。雖然業(yè)內(nèi)圍繞“Scaling Law還能走多遠”尚未形成共識,但階躍星辰認為,參數(shù)量接下來再提高一個數(shù)量級是依然成立的。Scaling Law 目前依然奏效,模型性能仍然在隨著參數(shù)量、數(shù)據(jù)量和計算量的增加呈冪次方增長。在此發(fā)展過程中,萬億參數(shù)量已經(jīng)成為一個基本的入門門檻。
正是基于這樣的認知,階躍星辰很早便啟動了萬億參數(shù)模型的訓(xùn)練。從千億到萬億,模型的參數(shù)規(guī)模提升了一個量級,難度也提升了十倍以上。為此,階躍星辰加大資源投入,尤其在系統(tǒng)和算法上積極探索,最終走通了萬億參數(shù) MoE 大模型訓(xùn)練的道路。在 WAIC 2024 上,階躍星辰發(fā)布了全新的 Step-2 萬億參數(shù)語言大模型正式版。根據(jù)從邏輯推理、世界知識、數(shù)學(xué)和編程等多個維度進行的權(quán)威測試,Step-2 模型能力都已全面接近國際主流模型,在部分測試集甚至實現(xiàn)了超越。
投稿郵箱:chuanbeiol@163.com 詳情請訪問川北在線:http://m.sanmuled.cn/