7月4日,2024世界人工智能大會在上海啟幕,聚焦大模型、算力、機器人、自動駕駛等重點領域,與“人工智能+”相關的創(chuàng)新應用成果和產品備受矚目。
大會上,商湯科技、科大訊飛、星環(huán)科技等企業(yè)帶來的新一代大模型集體亮相;摩爾線程也帶來了其AI旗艦產品夸娥(KUAE)智算集群解決方案的重大升級,旨在打造專為萬億參數(shù)級別的復雜大模型訓練設計的國產通用加速計算平臺;“AI大模型產業(yè)發(fā)展的關鍵要素與創(chuàng)新生態(tài)”閉門研討會舉辦……吸引著全行業(yè)的目光。
近年來,全世界數(shù)十萬億級的數(shù)據(jù)被投入大模型訓練當中,一次次挑戰(zhàn)著開發(fā)者和硬件算力的極限,大國、巨頭加速ALL IN。在這場未來產業(yè)的激烈競爭中,成都已經(jīng)成為其中的有力參與者。
今年,四川省把人工智能作為1號創(chuàng)新工程精準支持。成都也接連出臺了《成都市進一步促進人工智能產業(yè)高質量發(fā)展的若干政策措施》等相關文件。5月,成都市3個人工智能大模型通過國家備案,實現(xiàn)了成都行業(yè)大模型備案的零突破。
大模型發(fā)展面臨哪些挑戰(zhàn)?成都能否從中找到新賽道競爭的破局點?是人工智能產業(yè)當下聚焦的重點。
01“馭風”而行場景孕育大模型落地
目前,大模型技術在國內日趨升溫,許多廠商正在積極推進大模型在垂直領域的應用探索。復旦大學自然語言處理實驗室教授張奇認為,“推理能力”是通用人工智能核心,目前GPT4.0在企業(yè)端直接端到端使用仍有巨大困難,大部分場景下直接使用只能達到20%至85%的準確率,因此需要對AGI的邊界有清晰認知,如何選擇場景,才是大模型技術落地的關鍵。
今年4月北京發(fā)布的《北京市人工智能大模型行業(yè)應用分析報告》中提到,通過舉辦人工智能大模型創(chuàng)新應用大賽的形式助推大模型的技術落地。大賽設置了政務、金融、產業(yè)升級、醫(yī)療、文化教育、智慧城市6個大模型領域熱門賽道,挖掘出了一批典型的行業(yè)應用案例,梳理凝練出了大量核心業(yè)務場景和高質量行業(yè)核心數(shù)據(jù),為大模型后續(xù)發(fā)展進行“預訓練”。
今年7月,在2024世界人工智能大會的浦東新區(qū)人工智能產業(yè)生態(tài)推介會上,上海浦東張江“模力社區(qū)”正式啟用。作為浦東新區(qū)人工智能產業(yè)生態(tài)的重要組成部分,“模力社區(qū)”將為人工智能領域的創(chuàng)新團隊和企業(yè)提供更加便捷的交流合作平臺,推動產學研用深度融合,加速形成大模型創(chuàng)新生態(tài)。
在場景應用方面,成都市深挖AI大模型在生產、生活、城市治理等領域應用實踐并發(fā)布機會清單引導科技研發(fā)。根據(jù)《成都市人工智能產業(yè)高質量發(fā)展三年行動計劃(2024—2026年)》,成都將大力實施場景融合應用培育行動,在2026年打造150個創(chuàng)新應用場景,培育示范應用產品超過500個。
02搶占賽道直面發(fā)展挑戰(zhàn)與機遇
如同形式各樣的城市排名,在火熱的“百模大戰(zhàn)”之下,大模型備案數(shù)量似乎成為人工智能產業(yè)實力的重要指標,各地對大模型的重視程度也不斷提高。成都市場上已經(jīng)誕生了一批具有競爭力的大模型:成都海藝互娛科技有限公司的“海藝繪畫大模型”,聚焦AI繪圖和視頻生成領域,滿足企業(yè)和個人個性化的設計需求;成都曉多科技有限公司的“曉模型XPT”大語言模型已經(jīng)賦能電商、金融等多個行業(yè);成都考拉悠然科技有限公司的多模態(tài)產業(yè)通用大模型已經(jīng)面向半導體、煙草、城市治理等500多個高能項目……
數(shù)據(jù)顯示,國內已經(jīng)推出超300個大模型,截至今年4月已經(jīng)有117個大模型完成了生成式AI備案服務,其中屬地位于北京的有51個、上海24個、廣東19個……百花齊放、百家爭鳴的同時,“百模大戰(zhàn)”也逐漸進入白熱化階段。
目前成都在“百模大戰(zhàn)”中處于什么位置?四川省人工智能研究院副院長、四川省人工智能行業(yè)協(xié)會秘書長陳章表示,根據(jù)他的觀察和推斷,成都已通過備案的大模型數(shù)量大概處于全國第六、七名左右的位置,在他看來,這個排名不算太高,還可以爭取再往前靠。
03強力支撐大模型產業(yè)提速跑
總體來看,加速大模型應用落地依然是圍繞“算力、算法、數(shù)據(jù)”開展工作。成都正利用自身發(fā)展優(yōu)勢,尋找行業(yè)破局點,迎頭趕上。
增強算力基礎設施。正如沒有超高速風洞,造不出頂級的導彈和戰(zhàn)斗機,沒有足夠的算力支撐,大模型訓練也難以邁進。今年的政府工作報告上提到,適度超前建設數(shù)字基礎設施,加快形成全國一體化算力體系,培育算力產業(yè)生態(tài)。要以廣泛深刻的數(shù)字變革,賦能經(jīng)濟發(fā)展、豐富人民生活、提升社會治理現(xiàn)代化水平。
成渝地區(qū)是國家“東數(shù)西算”工程的樞紐節(jié)點之一,成都已經(jīng)形成國家超級計算成都中心、成都智算中心“雙中心”格局。
可喜的是,近年來成都不斷發(fā)布《成都市圍繞超算智算加快算力產業(yè)發(fā)展的政策措施實施細則》等算力發(fā)展相關政策,推進產業(yè)建圈強鏈,構建“超算+智算+通算+邊緣計算”多元異構算力設施,目前智能算力規(guī)模已超過4700 Pflops,并計劃到2026年實現(xiàn)算力規(guī)模2萬PFLOPS,未來成都的獲得算力成本將進一步下降。
穩(wěn)抓高質量行業(yè)數(shù)據(jù)。算力規(guī)模的基礎設施建設是一個漫長的過程,同時還受到摩爾定律、芯片研發(fā)實力、算力成本等多方面因素影響,打下高質量數(shù)據(jù)基礎是成都破局的重要發(fā)力點。
人民網(wǎng)財經(jīng)研究院發(fā)布的《2024年中國AI大模型產業(yè)發(fā)展報告》指出,國內大模型的數(shù)據(jù)缺乏多數(shù)據(jù)源的調用,可供大模型訓練的有效數(shù)據(jù)源呈現(xiàn)碎片化分散狀態(tài),政府部門的權威數(shù)據(jù)、大型企業(yè)掌握的行業(yè)或內部數(shù)據(jù)通常不對外公開,仍需構建高質量的AI大模型訓練數(shù)據(jù)集,擴充數(shù)據(jù)源提高數(shù)據(jù)質量。
四川擁有全部41個工業(yè)門類,成都作為四川省會城市,利用好完整工業(yè)體系中的高質量數(shù)據(jù),使得利用行業(yè)大模型打通“人工智能+”最后一公里成為可能。
今年5月,第七屆數(shù)字中國建設峰會舉辦,成都獲批成為全國首批7個數(shù)據(jù)標注試點基地之一。成都已建成覆蓋全市2140余萬常住人口和390余萬法人等系列基礎數(shù)據(jù)庫,向社會公眾開放數(shù)據(jù)3億條;授權運營公共數(shù)據(jù)575類5.7億條,數(shù)字城市競爭力排名全國第5。
通過數(shù)據(jù)標注,可以將原始數(shù)據(jù)轉化為機器學習算法可理解的形式,是新一代人工智能發(fā)展的關鍵抓手。參考北京人工智能數(shù)據(jù)訓練基地,若能有效組織數(shù)據(jù)供給方、加工服務方、模型訓練方“進場”合作,推動高質量數(shù)據(jù)價值釋放,將對通用模型和行業(yè)垂類模型訓練精調提供極大助力。
相信只要找準突破口,隨著大模型技術奇點的到來以及行業(yè)標準化體系的建設與完善,成都規(guī)劃中的人工智能萬億級市場定能實現(xiàn)。(張夏桐 陳夢雪)