隨著生成式AI和大型語言模型的不斷發(fā)展和遍及到每個(gè)人的生活和工作之中,如何滿足AI應(yīng)用所創(chuàng)造出的運(yùn)算與儲(chǔ)存需求已經(jīng)成為人們關(guān)注的焦點(diǎn)。群聯(lián)電子作為全球儲(chǔ)存技術(shù)的領(lǐng)導(dǎo)廠商,展望此趨勢所帶來的商業(yè)、市場與技術(shù)發(fā)展,重新定義了一個(gè)全新的概念– Home computing。Home Computing的概念涵蓋了未來世界中,在企業(yè)以及個(gè)人環(huán)境中所需要的本地端(Local)的AI運(yùn)算與儲(chǔ)存系統(tǒng)。而本文最后,群聯(lián)電子將分享aiDAPTIV+是如何透過技術(shù)創(chuàng)新落實(shí)此理想。
Home Computing,本地端應(yīng)用帶來眾多好處
簡單來說,現(xiàn)代商業(yè)環(huán)境中的on-premise server 與個(gè)人環(huán)境所使用的AI PC即是Home computing所涵蓋的使用情景。全球AI技術(shù)發(fā)展的趨勢,不意外地從云端環(huán)境中落地發(fā)展,接下來,企業(yè)與個(gè)人對(duì)于AI的需求也快速興起,隨之而來的是更多的隱私、安全性、個(gè)人化,與成本優(yōu)化的問題,Home computing泛指能夠克服上述所有問題的本地端AI解決方案,這不單是一個(gè)容易記住的名詞,其概念凸顯出個(gè)人和商業(yè)環(huán)境中使用私有、本地運(yùn)算及儲(chǔ)存與云端所帶來的不同。相較于將數(shù)據(jù)上傳至云端進(jìn)行運(yùn)算和儲(chǔ)存,Home computing具有許多明顯的好處:
提高數(shù)據(jù)的安全性和隱私性:使用本地服務(wù)器進(jìn)行運(yùn)算和儲(chǔ)存能夠提供更高程度的控制和保護(hù)個(gè)人或企業(yè)的敏感數(shù)據(jù),避免遭受外部入侵和資料外泄的風(fēng)險(xiǎn)。
較快速和穩(wěn)定的指令周期:本地運(yùn)算可以加快指令周期,提高效率,特別是在需要處理大量數(shù)據(jù)或復(fù)雜運(yùn)算的情況下,明顯優(yōu)于上傳至云端運(yùn)算。
更靈活的運(yùn)算體驗(yàn):利用本地服務(wù)器進(jìn)行運(yùn)算,用戶可以享受更個(gè)性化、定制化的運(yùn)算體驗(yàn),可以根據(jù)自身需求進(jìn)行設(shè)置和調(diào)整。
成本效益:使用本地服務(wù)器進(jìn)行運(yùn)算和儲(chǔ)存可能會(huì)降低整體成本,因?yàn)椴恍枰獮橥獠吭贫朔?wù)的運(yùn)算與傳輸支付月費(fèi),因此可以更加有效地控制硬設(shè)備和軟件的成本,符合個(gè)人或企業(yè)的預(yù)算需求。
網(wǎng)絡(luò)穩(wěn)定性:使用本地服務(wù)器進(jìn)行運(yùn)算可以避免依賴于網(wǎng)絡(luò)連接,可以提供更穩(wěn)定的運(yùn)算環(huán)境。當(dāng)網(wǎng)絡(luò)連接出現(xiàn)問題時(shí),本地服務(wù)器仍可以繼續(xù)運(yùn)作,不受網(wǎng)絡(luò)狀況變化的影響,確保持續(xù)的運(yùn)算穩(wěn)定性和效率。
普及化”聯(lián)合學(xué)習(xí)”的訓(xùn)練模式:聯(lián)合學(xué)習(xí)的優(yōu)勢在于參與者只需要共享AI模型,不需要分享具機(jī)密性的數(shù)據(jù)、數(shù)據(jù),即可找出優(yōu)化的人工智能應(yīng)用。不僅可解決數(shù)據(jù)治理及個(gè)人隱私保護(hù)問題,并可同時(shí)達(dá)到精進(jìn)AI模型之目的。
AI模型訓(xùn)練民主化:核心概念在于使用AI 的層面,已經(jīng)不僅是「AI如何提供服務(wù)的自由」,而延伸到「所有使用者都能夠擁有符合個(gè)人需求AI 的自由」。實(shí)現(xiàn)藉由簡單的訓(xùn)練,讓更多人能夠真正在工作、生活中受益于AI的愿景。
然而,要落實(shí)Home Computing,使其普及,讓這世代的AI更加速的發(fā)展,仍須克服硬體擴(kuò)充時(shí)所造成的高昂代價(jià)。我們都知道AI運(yùn)算,很貴。
AI運(yùn)算需要大量參數(shù)與數(shù)據(jù),儲(chǔ)存技術(shù)最重要的時(shí)刻到來
隨著生成式AI和大型語言模型的能力不斷提升,所需的模型大小及參數(shù)數(shù)量也爆炸性成長,導(dǎo)致模型訓(xùn)練過程中,需要大量的內(nèi)存空間和運(yùn)算能力來處理海量的計(jì)算數(shù)據(jù)。
以目前最為知名的GPT-3模型為例,其參數(shù)數(shù)量已經(jīng)來到1750億個(gè)之多,若是要執(zhí)行單次的模型訓(xùn)練就需要建置多組配備有高階顯示適配器及高速內(nèi)存的服務(wù)器來進(jìn)行運(yùn)算,然而所需的資本投入和設(shè)備花費(fèi)更是動(dòng)輒超過千萬臺(tái)幣,并不是一般小型企業(yè)和家庭用戶能夠負(fù)擔(dān)的金額,這也大幅提高了生成式AI模型落地訓(xùn)練的進(jìn)入門坎,并成為Home computing全面發(fā)展的最大阻礙。
目前顯示適配器配備的內(nèi)存容量并不足以支持參數(shù)數(shù)量達(dá)到一定規(guī)模以上的大型語言模型進(jìn)行模型訓(xùn)練,已經(jīng)成為各大科技巨頭不得不正視的問題,像蘋果公司在近期發(fā)表的一篇論文中就有提及,由于大型語言模型需要人工智能加速器和高DRAM 儲(chǔ)存容量,該公司的研究人員正在開發(fā)一種使用閃存芯片來儲(chǔ)存AI 模型數(shù)據(jù)的技術(shù),旨在將大型語言模型引入內(nèi)存容量有限的裝置,像是iPhone和Mac系列等產(chǎn)品。
然而,作為領(lǐng)先的儲(chǔ)存解決方案供貨商和技術(shù)先驅(qū),群聯(lián)電子發(fā)展的更早,2023年中,便已經(jīng)推出了自主研發(fā)的aiDAPTIV+技術(shù),透過整合SSD的AI運(yùn)算架構(gòu),將大型AI模型做結(jié)構(gòu)性拆分,有效的降低AI服務(wù)所需投入的硬件擴(kuò)建成本。其核心概念即是利用成本效益高、大容量和可擴(kuò)展性的固態(tài)硬盤來參與訓(xùn)練生成式AI和大型語言模型,分擔(dān)顯示適配器內(nèi)存需暫存訓(xùn)練數(shù)據(jù)和模型計(jì)算過程中產(chǎn)生的數(shù)據(jù)等負(fù)擔(dān),藉此克服本地端因顯示適配器內(nèi)存容量有限而無法使用更大參數(shù)量的模型來進(jìn)行模型訓(xùn)練的困境。
aiDAPTIV+ , 突破性的解決方案
aiDAPTIV+技術(shù)將固態(tài)硬盤整合到AI模型訓(xùn)練框架內(nèi),在訓(xùn)練的過程中,訓(xùn)練模型和計(jì)算過程中產(chǎn)生的數(shù)據(jù)都儲(chǔ)存在固態(tài)硬盤內(nèi),每次只將需要處理的部分模型暫時(shí)放入顯示適配器內(nèi)存進(jìn)行計(jì)算,待計(jì)算結(jié)束后再將結(jié)果存回固態(tài)硬盤中。這種方式有效地減少了對(duì)顯示適配器內(nèi)存的依賴,避免了模型和數(shù)據(jù)“塞滿”內(nèi)存的情況發(fā)生。
根據(jù)群聯(lián)電子實(shí)際測試的結(jié)果顯示,在顯示適配器內(nèi)存能夠被釋放之后,將能夠處理比原先更多批次的待訓(xùn)練數(shù)據(jù),進(jìn)而使落地訓(xùn)練的整體效率能夠大幅提升。
一旦采用了aiDAPTIV+的解決方案,顯示適配器及其高速內(nèi)存的容量需求將不再是模型訓(xùn)練發(fā)展的瓶頸,也將能夠化解建置大量服務(wù)器的必要性和其所帶來的高額成本,將原本需要超過千萬的硬件擴(kuò)充成本,降低為數(shù)萬元的水平,近似于一般用戶對(duì)于個(gè)人計(jì)算機(jī)或3C產(chǎn)品的花費(fèi)水平,這將使得每個(gè)商業(yè)用戶或家庭用戶都可以使用有限的資源來進(jìn)行更大型并有效率的模型訓(xùn)練。
Home computing,一個(gè)具有前景和發(fā)展?jié)摿Φ倪\(yùn)算概念,隨著aiDAPTIV+打破Home computing發(fā)展的枷鎖與束縛— 高昂的硬設(shè)備成本,過去因經(jīng)費(fèi)有限的商業(yè)用戶和家庭用戶將能夠享有本地AI運(yùn)算所帶來高安全性和隱私保護(hù),甚至是高度客制化的使用體驗(yàn)。群聯(lián)電子的aiDAPTIV+目前已經(jīng)與全球多家合作伙伴攜手,目標(biāo)共同推進(jìn)AI發(fā)展的下個(gè)新世代– 掀起Home Computing的浪潮!