訂閱
糾錯(cuò)
加入自媒體

接入DeepSeek,百度掀起AI大模型低價(jià)風(fēng)暴

2025-02-19 15:44
源Sight
關(guān)注

文源 | 源Sight

作者 | 王言

整整一個(gè)春節(jié)過后,DeepSeek的熱度依然居高不下。為了加速行業(yè)大模型的落地,DeepSeek系列模型已在國內(nèi)外多家主流云平臺(tái)完成上架部署。

與此同時(shí),DeepSeek也打破了大模型賽道參與者一直以來所堅(jiān)守的信仰,一場以“低成本、高效率”為核心的AI普惠革命,拉開帷幕。

一個(gè)最直觀的例子是,相比傳統(tǒng)AI訓(xùn)練模式,DeepSeek能在相同任務(wù)下,大幅降低對計(jì)算資源的需求,從而降低硬件投入成本。這也是DeepSeek在能夠提供媲美ChatGPT-o1服務(wù)的同時(shí),但又無需用戶付費(fèi)的底氣所在。

也是因此,2025年也成為AI大模型不斷降本增效的一年。在DeepSeek的刺激下,不少國內(nèi)外廠商宣布上線DeepSeek大模型,并開始拿出真金白銀,以高性價(jià)比服務(wù)吸引更多用戶。

作為國內(nèi)AI先行者,百度無疑是最為特別的一個(gè)。

01

摩爾定律在大模型的效力

如果要在國內(nèi)找到一家深度參與大模型商業(yè)化的平臺(tái),百度一定位列其中。

2月3日,百度智能云宣布,其千帆平臺(tái)正式上架DeepSeek-R1和DeepSeek-V3模型,并推出了超低價(jià)格方案——價(jià)格僅為DeepSeek-V3官方刊例價(jià)的三折,DeepSeek-R1官方刊例價(jià)的五折。此外,用戶還可以享受限時(shí)免費(fèi)服務(wù)。

百度智能云稱,此次接入的模型已全面融合千帆推理鏈路,集成百度獨(dú)家內(nèi)容安全算子,實(shí)現(xiàn)模型安全增強(qiáng)與企業(yè)級高可用保障,同時(shí)支持完善的BLS日志分析和BCM告警,助力用戶安全、穩(wěn)定地構(gòu)建智能應(yīng)用。

圖片

據(jù)公開數(shù)據(jù),DeepSeek-R1的整體成本約為OpenAI o1模型的1/30。這一數(shù)據(jù)如同地震一般,顛覆了全球相關(guān)從業(yè)者的信仰。

被稱為“日本AI研究第一人”的東京大學(xué)教授松尾豐,就在近日表示,DeepSeek技術(shù)很出色,性能與運(yùn)營“ChatGPT”的美國OpenAI接近,每次發(fā)布新的AI模型,都會(huì)發(fā)表論文,詳細(xì)說明模型采用了什么樣的技術(shù),以及花費(fèi)心思實(shí)施的改進(jìn)之處。

松尾豐還稱贊了DeepSeek以開源方式進(jìn)行公開的做法。其1月發(fā)布的最新模型“R1”,進(jìn)行了提升推理能力的強(qiáng)化學(xué)習(xí),最終展現(xiàn)出了與OpenAI的o1同等的推理性能。

同時(shí),如何提供更加便捷、高效、經(jīng)濟(jì)的產(chǎn)品體驗(yàn),成為AI大模型相關(guān)企業(yè)在競爭中拔得頭籌的關(guān)鍵。

此次百度智能云千帆平臺(tái)推出超低價(jià)格方案的背后,是其嘗試降低用戶AI模型試錯(cuò)成本的嘗試,也符合當(dāng)前AI技術(shù)普惠化的趨勢。

根據(jù)市場調(diào)研和咨詢公司Gartner發(fā)布的數(shù)據(jù),到2027年,企業(yè)使用的AI模型中,將有一半以上具有特定行業(yè)或業(yè)務(wù)功能,而在2023年這一比例僅為不到1%。

不過,從模型訓(xùn)練到應(yīng)用開發(fā)的過程中,耗費(fèi)大量資金、堆砌算力所造成的投入成本高、短期收益不明顯等問題,是企業(yè)實(shí)現(xiàn)將大模型進(jìn)行業(yè)務(wù)場景化落地的主要挑戰(zhàn)。降低技術(shù)成本,才是推動(dòng)創(chuàng)新實(shí)現(xiàn)落地的主要?jiǎng)恿Α?/p>

2月11日,“世界政府峰會(huì)”在阿聯(lián)酋迪拜開幕。百度創(chuàng)始人李彥宏在會(huì)上表示,在AI領(lǐng)域或IT行業(yè),大多數(shù)創(chuàng)新都與降低成本有關(guān)。如果成本降低一定比例,生產(chǎn)力也隨之提高同樣比例。

“在今天,創(chuàng)新速度比以往都快得多。根據(jù)摩爾定律,每18個(gè)月,性能就會(huì)翻倍而價(jià)格減半。如今,大模型推理成本每年降低90%以上!崩顝┖暾f。

02

已經(jīng)有人掀起低價(jià)風(fēng)暴

對比目前已經(jīng)宣布上架DeepSeek的云廠商以及官方刊例調(diào)用價(jià)格,百度智能云服務(wù)的價(jià)格具有較大優(yōu)勢。同時(shí),百度智能云也在進(jìn)一步豐富平臺(tái)AI模型生態(tài),為用戶提供更多元和強(qiáng)大的模型選擇。

總體來看,相比其他廠商,百度針對當(dāng)前的市場需求提出了極具“效價(jià)比”的方案,幫助用戶在產(chǎn)品效果、性能以及成本之間實(shí)現(xiàn)平衡。

據(jù)了解,百度智能云千帆ModelBuilder,是百度智能云推出的與大模型相關(guān)的平臺(tái),為用戶提供模型調(diào)用、模型效果調(diào)優(yōu)等服務(wù)。百度智能云千帆ModelBuilder提供高效價(jià)比的文心模型及開源模型服務(wù),以及模型效果調(diào)優(yōu)的一站式工具鏈,包含數(shù)據(jù)加工、模型精調(diào)、模型評估、模型量化。

在DeepSeek以中國式效率打破全球AI大模型以資本和算力主導(dǎo)的高成本壁壘后,行業(yè)的整體生態(tài)發(fā)生了顯著的變化。

對比目前已經(jīng)宣布上架DeepSeek的廠商,以及直接通過官方進(jìn)行調(diào)用的價(jià)格,百度智能云調(diào)用R1對比官方刊例價(jià)為五折,調(diào)用V3對比官方刊例價(jià)為三折,全網(wǎng)最低。

可以說,在DeepSeek催化下,相比盲目地“燒錢”和堆積算力,以合理成本獲得可靠的產(chǎn)品體驗(yàn)更為重要。

圖片

而在當(dāng)前的路線下,百度智能云的產(chǎn)品和服務(wù),已經(jīng)在市場上取得了顯著的效果。

根據(jù)官方數(shù)據(jù),目前百度智能云千帆大模型平臺(tái),已幫助客戶精調(diào)了3.3萬個(gè)模型、開發(fā)了77萬個(gè)企業(yè)應(yīng)用。這些應(yīng)用,涵蓋了金融、政務(wù)、汽車、互聯(lián)網(wǎng)泛科技等多個(gè)領(lǐng)域,為企業(yè)客戶提供了便捷、高效、經(jīng)濟(jì)的大模型使用和開發(fā)體驗(yàn)。

而從行業(yè)角度來看,百度的高效價(jià)比方案,不僅平衡了自身投入成本,也為整個(gè)行業(yè)提供了新的思路和方向。

03

AI大模型的技術(shù)“拉力賽”

縱觀全球AI競爭,除了保持更低成本的算力之外,擁有更高性能,也是相關(guān)企業(yè)保證自身領(lǐng)先地位的重要手段。

有效降低模型調(diào)用價(jià)格,提供更具效價(jià)比的方案,離不開百度智能云強(qiáng)大且高效的算力支持,以及在推理引擎性能優(yōu)化技術(shù)、推理服務(wù)工程架構(gòu)創(chuàng)新和推理服務(wù)全鏈路安全保障上的深度融合。

這其中,百度的自研萬卡集群,是其實(shí)現(xiàn)算力降本的關(guān)鍵。

如果將目光拉至全球大模型的競爭全景下,可以看到,單集群萬卡已成為相關(guān)企業(yè)必不可少的配置。

畢竟,萬卡集群可持續(xù)降低千億參數(shù)模型的訓(xùn)練周期,實(shí)現(xiàn)AI原生應(yīng)用的快速迭代。同時(shí),萬卡集群也支持多任務(wù)并發(fā)能力,通過動(dòng)態(tài)資源切分,單集群可同時(shí)訓(xùn)練多個(gè)輕量化模型,通過通信優(yōu)化與容錯(cuò)機(jī)制,提升集群綜合利用率,實(shí)現(xiàn)訓(xùn)練成本指數(shù)級下降。

2月初,百度智能云宣布點(diǎn)亮昆侖芯三代萬卡集群,這也是國內(nèi)首個(gè)正式點(diǎn)亮的自研萬卡集群。昆侖芯三代萬卡集群,不僅為百度帶來堅(jiān)實(shí)的算力支持,也有望推動(dòng)模型的降本趨勢。

在推理引擎性能方面,基于自身在大模型推理性能優(yōu)化方向的技術(shù)積累,百度智能云針對DeepSeek模型MLA結(jié)構(gòu)的計(jì)算,進(jìn)行了極致的性能優(yōu)化。并通過計(jì)算、通信、內(nèi)存不同資源類型算子的有效重疊,以及高效的Prefill/Decode分離式推理架構(gòu),在核心延遲指標(biāo)TTFT/TPOT滿足SLA的條件下,實(shí)現(xiàn)模型吞吐的大幅度提升,顯著降低模型推理成本。

在推理服務(wù)層面,百度智能云也進(jìn)行了深入的優(yōu)化與創(chuàng)新,針對推理架構(gòu)做了嚴(yán)格的推/拉模式的性能對比。同時(shí),百度智能云經(jīng)驗(yàn)證拉模式在請求處理的成功率、響應(yīng)延時(shí)以及吞吐量等關(guān)鍵指標(biāo)上,均展現(xiàn)出更為卓越的性能。

為了進(jìn)一步提升系統(tǒng)的穩(wěn)定性和用戶體驗(yàn),百度智能云巧妙地設(shè)計(jì)了一種請求失敗的續(xù)推機(jī)制,這顯著增強(qiáng)了系統(tǒng)的容錯(cuò)能力和服務(wù)SLA達(dá)標(biāo)率。

同時(shí),針對多輪對話和system設(shè)定等場景中存在重復(fù)Prompt前綴的情況,百度智能云實(shí)現(xiàn)了主流的KV-Cache復(fù)用技術(shù),并輔以全局Cache感知的流量調(diào)度策略。這一舉措,有效避免了Token KV的重復(fù)計(jì)算,從而大幅降低推理延遲,提高了推理吞吐。

此外,針對用戶所關(guān)注的安全保障方面,平臺(tái)基于百度自身長期的大模型安全技術(shù)積累,集成獨(dú)家內(nèi)容安全算子,實(shí)現(xiàn)模型安全增強(qiáng)與企業(yè)級高可用保障。

同時(shí),在大模型全生命周期數(shù)據(jù)安全與模型保護(hù)機(jī)制的基礎(chǔ)下,千帆平臺(tái)上的模型均擁有使用安全的安全保障;基于在安全方面的專項(xiàng)優(yōu)化,確保DeepSeek-R1&DeepSeek-V3模型的企業(yè)用戶在使用過程也具有更高的安全性。

在如今的大模型競爭態(tài)勢下,AI大模型的技術(shù)“拉力賽”愈演愈烈,擁有高性能且更低成本的算力,始終是企業(yè)實(shí)現(xiàn)產(chǎn)品普及,保證領(lǐng)先地位的重要手段。

在致力于提供效價(jià)比服務(wù)的策略下,百度智能云的商業(yè)化落地正在不斷加速,百度大模型的商業(yè)模式也有望進(jìn)一步完善。

部分圖片來源于網(wǎng)絡(luò),如有侵權(quán)請告知?jiǎng)h除

       原文標(biāo)題 : 接入DeepSeek,百度掀起AI大模型低價(jià)風(fēng)暴

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)