大模型時代,算力是底座。北京市經(jīng)信局黨組書記、局長姜廣智在日前舉辦的2023全球數(shù)字經(jīng)濟大會人工智能高峰論壇(以下簡稱“人工智能論壇”)上表示,北京正籌劃出臺“算力券”,支持基于大模型落地應(yīng)用場景的中小企業(yè)獲取多元化、低成本的優(yōu)質(zhì)算力。眼下,大模型正推動智能算力需求爆發(fā)式增長。但智能算力很貴,大多數(shù)中小企業(yè)目前還是依賴于購買或租用算力,其成本也并不低。這成為了中小企業(yè)狂奔大模型賽道的痛點和堵點。而北京“算力券”的推出,將有望打通這一堵點,為產(chǎn)業(yè)打開全新的想象空間。
市場價格的5、6折左右
就北京籌劃出臺“算力券”政策,北京市經(jīng)信局相關(guān)負(fù)責(zé)人在接受北京商報記者采訪時介紹,目前“算力券”政策正在研究中,具體細(xì)節(jié)還未敲定。不過,可以明確的是,“算力券”中算力的供應(yīng)方來自北京經(jīng)信局正在征集的“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃”成員。
【資料圖】
北京商報記者在北京市經(jīng)信局官網(wǎng)查詢發(fā)現(xiàn),7月3日,北京市經(jīng)信局已經(jīng)發(fā)布了第二批伙伴名單,63家伙伴企業(yè)中,算力伙伴10家,分別為北京百度網(wǎng)訊科技有限公司、北京世紀(jì)互聯(lián)寬帶數(shù)據(jù)中心有限公司、中國電信股份有限公司北京分公司、中國移動通信集團北京有限公司、北京昇騰創(chuàng)新人工智能科技中心有限公司、京東科技信息技術(shù)有限公司、北京紅山信息科技研究院有限公司、企商在線(北京)數(shù)據(jù)技術(shù)股份有限公司、北京神州數(shù)碼云科信息技術(shù)有限公司、北京金山云網(wǎng)絡(luò)技術(shù)有限公司。
此前發(fā)布的第一批伙伴成員中,共有算力伙伴2家,分別為阿里云計算有限公司和北京超級云計算中心。
關(guān)于算力券的具體價格,前述北京經(jīng)信局相關(guān)負(fù)責(zé)人表示正在研究中。不過,他也指出,目前算力伙伴提供的算力價格尚未公布,但基本已經(jīng)是市場價格的5、6折左右。
算力租賃的市場價格是怎樣的?提供算力服務(wù)的北京昇騰創(chuàng)新人工智能科技中心有限公司CTO楊光告訴北京商報記者,目前市場價格約為15-20元/卡/時,1P大約是3-4張卡。
“‘卡’指單芯片,目前算力價格確實也不是很統(tǒng)一。但這個價格對于中小企業(yè)來說還是比較昂貴的,所以急需有普惠算力支持企業(yè)自身發(fā)展?!睏罟馀e例,一個常規(guī)的AIGC項目租用的算力規(guī)模涉及到的“點”比較多,租用算力的費用并不太容易計算?!暗怯泄_數(shù)據(jù)顯示,訓(xùn)練一個GPT-3需要花費460萬美元”。
北京商報記者經(jīng)查詢了解到,國際算力設(shè)備龍頭企業(yè)英偉達也計劃開放DGX Cloud實例,企業(yè)可以“云租賃”的形式按月租用DGX Cloud集群,價格為每實例3.7萬美元/月起。DGX Cloud能為AI超級計算提供完整的解決方案,借助該集群,企業(yè)用戶可擴展大型多節(jié)點訓(xùn)練工作負(fù)載的開發(fā),無須等待需求量通常很大的加速計算資源。
“出臺‘算力券’政策,主要是為了解決中小大模型企業(yè)算力成本問題,支持基于落地應(yīng)用場景的中小企業(yè)獲取多元化、低成本的優(yōu)質(zhì)算力?!鼻笆霰本┙?jīng)信局相關(guān)負(fù)責(zé)人表示,“如果企業(yè)有需要,我們很愿意提供算力供需對接的平臺。”
需求暴增推高算力價格
本次北京經(jīng)信局籌劃“算力券”的背后,是呈現(xiàn)爆發(fā)式增長的智能算力需求。
隨著ChatGPT在今年的爆火,各大科技企業(yè)都開始逐鹿細(xì)分行業(yè)大模型,包括但不限于交通、醫(yī)療、數(shù)字政務(wù)等細(xì)分領(lǐng)域。根據(jù)北京市經(jīng)信局在人工智能論壇上披露的數(shù)據(jù),我國目前已有80余個大模型公開發(fā)布,其中北京約占一半?!暗舜笮突ヂ?lián)網(wǎng)企業(yè)、AI龍頭企業(yè)具有較多的GPU算力芯片儲備外,中小企業(yè)在發(fā)展AI模型、應(yīng)用過程中,遭遇算力瓶頸?!?/p>
一家科技企業(yè)負(fù)責(zé)人王楠告訴北京商報記者,他們公司主要通過向大廠購買算力來解決算力需求,而ChatGPT在今年突然崛起,許多大廠的GPU算力芯片價格都漲了不少,一段時間里甚至高價也很難買到。
算力價格漲了多少,從英偉達GPU芯片的交付價格即可一窺。以英偉達GPU芯片A100為例,該芯片價格從去年12月開始上漲,截至今年4月上半月,其5個月價格累計漲幅達到37.5%;同期A800價格累計漲幅達20%。同時,英偉達GPU交貨周期也被拉長,之前拿貨周期大約為一個月,現(xiàn)在基本都需要三個月或更長。甚至,部分新訂單“可能要到12月才能交付”。
而算力的需求究竟有多大?資料顯示,OpenAI為了訓(xùn)練ChatGPT,構(gòu)建了由近3萬張英偉達V100顯卡組成的龐大算力集群,GPT-4更是達到了100萬億的參數(shù)規(guī)模,其對應(yīng)的算力需求同比大幅增加。如今國內(nèi)多家企業(yè)宣布投身大模型的公司,如果再疊加計算上圍繞大模型的人工智能生態(tài)和由此產(chǎn)生的用于推理的算力需求,未來的算力缺口將更加驚人。
“總體上看,我國的算力需求從靜態(tài)來說目前‘基本’能夠?qū)崿F(xiàn)算力供需之間的平衡,但是從動態(tài)角度來說,未來越來越多的行業(yè)、企業(yè)要運用大模型、運用人工智能多模態(tài),算力在未來存在非常大的缺口。”北京社科院研究員、中國人民大學(xué)智能社會治理研究中心研究員王鵬在接受北京商報記者采訪時表示。
加大算力供給是根本
龐大的算力需求為AI算力產(chǎn)業(yè)帶來了廣闊的市場空間。來自IDC的數(shù)據(jù)與預(yù)測顯示,2021年中國智能算力規(guī)模達到155.2EFLOPS(每秒一百億億次的浮點運算),并在之后的幾年始終保持穩(wěn)健增長態(tài)勢,預(yù)計到2026年將突破進入每秒十萬億億次浮點計算級別,智能算力實現(xiàn)1271.4EFLOPS的龐大規(guī)模,2021-2026年期間,預(yù)計年復(fù)合增長率達到52.3%。
各科技巨頭在算力上的投入也十分明顯。在百度2023年Q1財報中,其AI的內(nèi)容貫穿始終。騰訊發(fā)布的2023年Q1財報中,在數(shù)實經(jīng)濟、廣告和游戲三大核心業(yè)務(wù)集體發(fā)力下,騰訊重回增長曲線。值得一提的是,關(guān)于算力和人工智能的部分,同樣占據(jù)了財報很大的篇幅。
然而擺在國內(nèi)廠商面前的另一道難題則是,最關(guān)鍵的AI芯片GPU被英偉達壟斷,市場占有率達到90%以上。而一張40G顯存的A100芯片,在京東平臺上所標(biāo)售價就達6.25萬元。因此,A100芯片也一直被廣大科技發(fā)燒友戲稱為“小金磚”。
這也導(dǎo)致了自建智能算力平臺成本極高。今5月,上海張江一家數(shù)據(jù)公司的相關(guān)負(fù)責(zé)人在接受媒體采訪時曾表示,“一臺包含8張A800的DGX超算,現(xiàn)在市面上的價格可能要到230萬元到250萬元之間,價格還在持續(xù)上漲”。
算力成本高,成為了制約中小企業(yè)的一道坎,而算力租賃或許可以成為目前解題的突破口。在楊光看來,采用租賃方式使用算力能夠彈性提供算力,滿足不同模型訓(xùn)練所需要的算力需求。
“由企業(yè)自身建設(shè)、運維算力設(shè)備所需的投入非常高,并不是一般企業(yè)所能承受的??梢詤⒖嫉慕鉀Q辦法,首先是統(tǒng)一建設(shè)集中化的算力中心,統(tǒng)一分配,部分頭部企業(yè)已經(jīng)開始了這方面的布局。其次便是算力租賃,通過政府搭線,給企業(yè)提供優(yōu)質(zhì)的、相對廉價的算力,降低企業(yè)成本?!蓖貔i說道。
天使投資人、資深人工智能專家郭濤從通用算力和智能算力的細(xì)分角度進行了分析,他表示,當(dāng)前部分地區(qū)已出現(xiàn)通用算力過?,F(xiàn)象,算力租賃可以有效解決算力供需對接問題。不過,當(dāng)前大模型建設(shè)更需要的是智能算力,智能算力受到智能計算中心建設(shè)滯后和高端芯片難以獲取等方面影響,市場供給不足,對人工智能相關(guān)產(chǎn)業(yè)的規(guī)?;?、普惠化落地產(chǎn)生負(fù)面影響。
“算力租賃雖然可以在一定程度上平衡算力需求,但并不能從根本上解決算力稀缺問題。未來,隨著大批智能計算中心項目建設(shè)運營,有望從根本上解決智能算力瓶頸問題?!惫鶟f。
“過去幾年以通用算力為主,智能時代尤其ChatGPT時代則以智能算力為主?!睏罟庵赋?,解決大模型企業(yè)的成本還是要加大智能算力基礎(chǔ)設(shè)施建設(shè),“北京也正在先行先試建設(shè)多個公共智算平臺,除了我們位于門頭溝的北京昇騰人工智能計算中心外,海淀正在規(guī)劃北京人工智能公共算力平臺,朝陽也在規(guī)劃北京經(jīng)濟算力中心等。”
關(guān)鍵詞:
責(zé)任編輯:Rex_05