“AI原生”時(shí)代來臨 基礎(chǔ)設(shè)施如何建設(shè)
[ 訓(xùn)練和推理是大模型生命周期中不可或缺的兩個(gè)階段,都需要強(qiáng)大的算力資源來支撐。然而,相比國(guó)際上模型層與芯片層呈現(xiàn)的“雙頭壟斷”格局,中國(guó)的模型層與芯片層表現(xiàn)得“百花齊放”,尤其是在芯片層。 ]
打開水龍頭前,我們不需要知道水是從哪條河里來的。同理,未來我們用各種AI應(yīng)用時(shí),也不會(huì)知道它調(diào)用了哪些基座模型,用到了哪種加速卡的算力。
在業(yè)內(nèi)人士看來,這就是最好的AI Native(AI原生)基礎(chǔ)設(shè)施。
如何高效整合異構(gòu)算力資源
在2024世界人工智能大會(huì)(WAIC)暨人工智能全球治理高級(jí)別會(huì)議上的一場(chǎng)AI基礎(chǔ)設(shè)施論壇上,業(yè)內(nèi)專家熱議這種被稱為AI Native的概念。它是指將人工智能融入到各個(gè)產(chǎn)品、業(yè)務(wù)和服務(wù)中,從而實(shí)現(xiàn)更高效和智能化的運(yùn)作方式。
“AI Native我們也把它叫做AI原生,這就像是互聯(lián)網(wǎng)原生的概念,但不同的是,互聯(lián)網(wǎng)是由流量驅(qū)動(dòng)的,AI是由算力驅(qū)動(dòng)的。”無問芯穹吉印通創(chuàng)始人、清華大學(xué)電子工程系副研究員顏深根表示,“AI時(shí)代要求我們構(gòu)建新的生態(tài),以適應(yīng)算力驅(qū)動(dòng)的需求。”
顏深根表示,AI基礎(chǔ)設(shè)施應(yīng)該“向上對(duì)接應(yīng)用,向下對(duì)接芯片設(shè)計(jì)與制造工藝”,從而讓算力能夠更為充分地發(fā)揮出來,提升算力的使用效率。
針對(duì)如何構(gòu)建適應(yīng)多模型與多芯片格局的AI Native基礎(chǔ)設(shè)施,無問芯穹吉印通創(chuàng)始人兼CEO夏立雪對(duì)第一財(cái)經(jīng)記者表示:“我們需要提供高效整合異構(gòu)算力資源的算力平臺(tái),以及支持軟硬件吉印通優(yōu)化與加速的中間件,讓異構(gòu)芯片真正轉(zhuǎn)化為大算力。”
訓(xùn)練和推理是大模型生命周期中不可或缺的兩個(gè)階段,都需要強(qiáng)大的算力資源來支撐。然而,相比國(guó)際上模型層與芯片層呈現(xiàn)的“雙頭壟斷”格局,中國(guó)的模型層與芯片層表現(xiàn)得“百花齊放”,尤其是在芯片層。
異構(gòu)的芯片之間存在一種“生態(tài)豎井”,即硬件生態(tài)系統(tǒng)封閉且互不兼容。用了A卡的開發(fā)者,無法輕易遷移至B卡上展開工作,也難以同時(shí)使用A卡和B卡完成大模型訓(xùn)練或推理,這導(dǎo)致如果一個(gè)算力集群中存在兩種或以上的芯片,算力使用方會(huì)面臨一系列技術(shù)挑戰(zhàn)。
在今年的WAIC大會(huì)上,無問芯穹發(fā)布了全球首個(gè)可進(jìn)行單任務(wù)千卡規(guī)模異構(gòu)芯片混合訓(xùn)練的平臺(tái),具備萬(wàn)卡擴(kuò)展性,支持包括AMD、華為昇騰、天數(shù)智芯、沐曦、摩爾線程、英偉達(dá)六種異構(gòu)芯片在內(nèi)的大模型混合訓(xùn)練,千卡異構(gòu)混合訓(xùn)練集群算力利用率最高達(dá)到97.6%。
算力分散且利用效率不高是目前制約國(guó)內(nèi)人工智能技術(shù)發(fā)展的一個(gè)瓶頸。中科加禾創(chuàng)始人兼中科院計(jì)算技術(shù)研究所研究員崔慧敏表示:“我們必須承認(rèn),目前在國(guó)內(nèi),中間層的AI基礎(chǔ)設(shè)施仍然落后于上層的應(yīng)用以及下層的芯片。”她也認(rèn)為,算力優(yōu)化非常重要,也就是做到在不降低算法精度的情況下,提升算力的性能。
崔慧敏提出,通過構(gòu)建基礎(chǔ)的軟件平臺(tái)層,就能讓底下的芯片層以及上面的模型層隨意切換。這就像是提供了一個(gè)中間的編譯平臺(tái),讓模型、應(yīng)用可以在不同的硬件平臺(tái)之間自由移植,同時(shí)優(yōu)化性能,從而補(bǔ)齊AI產(chǎn)業(yè)生態(tài)的缺位,降低上層應(yīng)用在國(guó)產(chǎn)芯片平臺(tái)上的落地門檻和成本,提升多種異構(gòu)算力的利用和適配效率。
如何打造自主可控的AI生態(tài)
隨著國(guó)內(nèi)大模型的發(fā)展,構(gòu)建AI產(chǎn)業(yè)生態(tài)成為業(yè)內(nèi)高度關(guān)注的話題。上海算豐信息總經(jīng)理顧萌指出:“在基礎(chǔ)設(shè)施建設(shè)領(lǐng)域,英偉達(dá)生態(tài)不可攻破,存在壓倒性的優(yōu)勢(shì),這對(duì)于我們的AI基礎(chǔ)設(shè)施如何服務(wù)于AI發(fā)展,以及AI發(fā)展如何反哺AI基礎(chǔ)設(shè)施的建設(shè)提出挑戰(zhàn)。”
科大訊飛董事長(zhǎng)劉慶峰在大會(huì)上表示:“國(guó)產(chǎn)大模型的底座能力決定了企業(yè)在這條路上到底能走多遠(yuǎn),我們要以長(zhǎng)期主義來打造中國(guó)真正自主可控的AI產(chǎn)業(yè)生態(tài)。在國(guó)產(chǎn)化的底座下,能為行業(yè)帶來更高的話語(yǔ)權(quán)與安全性。”
在提到AI基礎(chǔ)設(shè)施建設(shè)時(shí),劉慶峰對(duì)第一財(cái)經(jīng)記者表示:“我們希望通過一些技術(shù)的創(chuàng)新方法,來提升算力的使用效率,從而彌補(bǔ)我們?cè)谒懔ι系哪承┎蛔恪?”
長(zhǎng)期以來,云端大模型和基礎(chǔ)設(shè)施一直是AI領(lǐng)域的投資重點(diǎn)。劉慶峰說道:“未來,云、邊、端結(jié)合軟硬一體化一定是大模型發(fā)展的一個(gè)趨勢(shì)。”
顏深根認(rèn)為,在互聯(lián)網(wǎng)時(shí)代,平臺(tái)占據(jù)強(qiáng)勢(shì)地位,比如吉印通、阿里、美團(tuán)這些大平臺(tái)是流量的主要入口,而未來,隨著人工智能的發(fā)展,端側(cè)智能的能力會(huì)迅速增強(qiáng),平臺(tái)的收益將會(huì)向設(shè)備側(cè)轉(zhuǎn)移,這會(huì)給端側(cè)帶來更加豐厚的利潤(rùn)。
“我們也希望在端側(cè)做一些優(yōu)化,比如芯片的IP等,但在技術(shù)上要實(shí)現(xiàn)還面臨一定的挑戰(zhàn),一方面是現(xiàn)在模型本身的規(guī)模還比較大,內(nèi)存方面的問題沒有解決,另一方面是要發(fā)展端側(cè),在芯片層面也還有欠缺,國(guó)內(nèi)對(duì)大模型的支持還沒有理想的解決方案。”顏深根表示。