近日,聯(lián)想百應(yīng)智能體正式宣布引入國產(chǎn)AI大模型DeepSeek 。DeepSeek憑借技術(shù)上的高度創(chuàng)新備受關(guān)注,相比ChatGPT等模型,DeepSeek采用混合專家模型,可將任務(wù)拆分給多個(gè)專用子模塊處理,資源利用率更高,大幅降低了大模型訓(xùn)練所需的算力要求。作為國內(nèi)首個(gè)面向中小企業(yè)的IT服務(wù)智能體,聯(lián)想百應(yīng)智能體與DeepSeek實(shí)現(xiàn)深度融合,能為萬千企業(yè)的智能化轉(zhuǎn)型和發(fā)展提供助力。

聯(lián)想百應(yīng)智能體是基于智能IT引擎“擎天3.0”所打造的一站式服務(wù)平臺。這次與DeepSeek在技術(shù)上實(shí)現(xiàn)深度融合,將有效幫助聯(lián)想百應(yīng)智能體豐富技術(shù)“武器庫”,多模態(tài)交互、可視化思維鏈、多方案博弈、多智能體協(xié)作、全鏈路安全五大技術(shù)能力都將得到進(jìn)一步增強(qiáng)。
在算力調(diào)度方面,DeepSeek 的漸進(jìn)式分層知識蒸餾技術(shù)獨(dú)具優(yōu)勢,它能夠把大型模型蘊(yùn)含的知識,精準(zhǔn)遷移到更為輕量化的模型之中。這樣一來,在保證模型性能不受影響的前提下,還能顯著降低對計(jì)算資源的消耗。當(dāng)這項(xiàng)技術(shù)與擎天 3.0 的混合架構(gòu)調(diào)度能力相結(jié)合,就能最終實(shí)現(xiàn) “端 - 邊 - 云 - 網(wǎng) - 智” 的高效協(xié)同運(yùn)作。這對于企業(yè)而言意義重大,企業(yè)可以在邊緣設(shè)備上輕松部署輕量化模型,減少對云端算力的依賴,從而進(jìn)一步降低運(yùn)維成本。
在模型架構(gòu)層面,百應(yīng)服務(wù)大模型的 MoE 架構(gòu)由多個(gè)專門的 “專家模型” 構(gòu)成。這些專家模型各自針對特定任務(wù)進(jìn)行了優(yōu)化,比如 IT 問題診斷、AI 辦公等場景,這種設(shè)計(jì)能有效減輕計(jì)算負(fù)載。而 DeepSeek 同樣具備全球領(lǐng)先的模型架構(gòu),其 DeepSeek R1 模型就采用了 MoE(稀疏混合專家模型)架構(gòu)。引入 DeepSeek 后,能為百應(yīng)服務(wù)大模型 MoE 的動(dòng)態(tài)調(diào)度提供更有力的支持。具體來說,它可以依據(jù)輸入特征,智能選擇最為匹配的專家模型,進(jìn)而提升處理效率與輸出質(zhì)量,充分滿足企業(yè)級場景對于資源高利用率的嚴(yán)格要求。

和封閉源代碼的國際大模型不同,DeepSeek R1 有著開源、性能卓越、成本低廉這三大突出長處。DeepSeek 依據(jù) MIT 許可協(xié)議,毫無保留地開放其多模態(tài)、多規(guī)格的模型,這種開源舉措極大地推動(dòng)了相關(guān)技術(shù)在各個(gè)領(lǐng)域的擴(kuò)散。在這樣的技術(shù)生態(tài)環(huán)境里,企業(yè)可以按照自身的實(shí)際需求,從眾多選項(xiàng)中挑選出適配的模型與智能體。不僅如此,企業(yè)還能夠依托自身業(yè)務(wù)所積累的數(shù)據(jù),進(jìn)行定制化的模型訓(xùn)練與推理操作,塑造出更符合自身業(yè)務(wù)特性的專屬崗位智能體。
DeepSeek只是新一輪大模型熱潮的起點(diǎn),相信聯(lián)想百應(yīng)智能體將持續(xù)深化探索強(qiáng)化學(xué)習(xí)、多模態(tài)融合等前沿技術(shù),進(jìn)一步提升模型定制化能力。