大模型新皇Claude 3即將入駐Amazon Bedrock,公有云成AI創(chuàng)新加速器
作者|小葳
出品|智能進(jìn)化論 公眾號(hào):AImatters
2024年3月4日,Anthropic發(fā)布旗下最新一代大模型Claude 3系列,引發(fā)行業(yè)熱議。
在推理、數(shù)學(xué)、編碼、多語(yǔ)言理解和視覺(jué)方面,Claude 3在多個(gè)基準(zhǔn)測(cè)試上樹(shù)立了新的標(biāo)準(zhǔn),性能超越了包括GPT4在內(nèi)的其他模型,被認(rèn)為是通用大模型新皇。
與此同時(shí),亞馬遜云科技宣布,Claude 3系列將入駐其生成式AI托管服務(wù)Amazon Bedrock。亞馬遜云科技的客戶將可以通過(guò)Amazon Bedrock訪問(wèn)Claude 3系列的三個(gè)模型——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。
Claude 3對(duì)于通用大模型發(fā)展帶來(lái)哪些改變?對(duì)于更多想要用好大模型的企業(yè),什么是更好的使用通用大模型的方式?以下是筆者的一些觀察。
圖片來(lái)自AI生成
1 沖破一家獨(dú)大,Claude3成通用大模型新“卷王”
此次推出的Claude3共有三個(gè)模型,性能和價(jià)格由低到高為:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,也被形象概括為中杯、大杯、超大杯。
其中,Claude 3 Haiku 主打快速緊湊,即時(shí)的響應(yīng)能力。Claude 3 Sonnet 在智能和速度之間取得了理想的平衡,特別適合企業(yè)用例。Claude 3 Opus具有深度推理、高級(jí)數(shù)學(xué)和編碼能力,在高度復(fù)雜的任務(wù)上具有領(lǐng)先性能。
Claude 3的領(lǐng)先之處體現(xiàn)在基準(zhǔn)性能、視覺(jué)能力、復(fù)雜開(kāi)放性問(wèn)題處理能力等。
基準(zhǔn)性能方面,Claude 3在多項(xiàng)AI系統(tǒng)常用評(píng)估標(biāo)準(zhǔn),包括本科級(jí)別專業(yè)知識(shí)(MMLU)、研究生級(jí)別專家推理(GPQA)、基礎(chǔ)數(shù)學(xué)(GSM8K),均取得領(lǐng)先業(yè)界LLM的性能。
Claude 3的三個(gè)模型均具備視覺(jué)功能,可以理解不同格式的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),包括圖像、圖表、圖表等。比如,官方演示視頻中,Claude 3 Opus可以在幾分鐘內(nèi)分析全球經(jīng)濟(jì)、未來(lái)美國(guó)GDP走勢(shì)等。
對(duì)于下圖這樣的復(fù)雜開(kāi)放式問(wèn)題, Claude3能夠理解物體的外觀及其與數(shù)學(xué)等概念的聯(lián)系。
此外,Claude3的三個(gè)模型都將至少支持200K token的上下文窗口。在200K token的「大海撈針」(NIAH)測(cè)試中,Claude 3 Opus準(zhǔn)確率超過(guò)99%。Claude 3 Haiku 能夠3秒讀完10k token論文。
筆者認(rèn)為,目前大模型發(fā)展呈現(xiàn)兩條不同的路徑:
一條路徑,圍繞如何練好大模型。像OpenAI、Anthropic、Google這樣的科技巨頭,有能力和資源在通用基礎(chǔ)大模型賽道競(jìng)爭(zhēng)。通用基礎(chǔ)大模型的賽道相對(duì)同質(zhì)化,各家都在追求更高更快更強(qiáng),即更強(qiáng)大更全面的性能。
而且通用大模型的競(jìng)爭(zhēng)態(tài)勢(shì)一直是動(dòng)態(tài)變化的,任何一家的領(lǐng)先都是暫時(shí)的,榜單隨時(shí)可能被刷新和超越。在這種態(tài)勢(shì)下,任何一家獨(dú)大,強(qiáng)者恒強(qiáng)未必對(duì)行業(yè)、對(duì)生態(tài)更好。
從這個(gè)意義上,Claude3能夠打破OpenAI長(zhǎng)期領(lǐng)先的優(yōu)勢(shì),加速通用大模型卷出更高的智能水平。
另一條路徑,圍繞如何用好大模型。如何用大模型的能力解決不同行業(yè)不同場(chǎng)景下的專業(yè)問(wèn)題,才是絕大多數(shù)企業(yè)最關(guān)注的。在這條路徑上,云計(jì)算正發(fā)揮著舉足輕重的價(jià)值。
2 云計(jì)算,使用基礎(chǔ)大模型的必經(jīng)之路
目前,AI大模型已經(jīng)成為云計(jì)算廠商的第二增長(zhǎng)曲線,全球頭部云計(jì)算廠商都將AI大模型作為下一個(gè)十年發(fā)展的必爭(zhēng)之地。
如果我們回到企業(yè)需求的視角,企業(yè)使用基礎(chǔ)大模型至少有以下幾個(gè)核心訴求:
首先,數(shù)據(jù)安全與合規(guī)
數(shù)據(jù)安全合規(guī)是企業(yè)使用大模型的首要考量,包括數(shù)據(jù)泄露風(fēng)險(xiǎn)、數(shù)據(jù)濫用風(fēng)險(xiǎn)、模型安全漏洞等等。比如,很多企業(yè)擔(dān)心客戶信息、商業(yè)秘密和個(gè)人身份信息等敏感數(shù)據(jù)泄露。這些都對(duì)提供大模型能力的公有云廠商提出了更高的要求。
在如何保障大模型安全使用方面,亞馬遜云科技率先做出了很多探索。比如,Amazon Bedrock 處理的任何客戶內(nèi)容都會(huì)被加密,并靜態(tài)存儲(chǔ)在客戶使用的亞馬遜云科技區(qū)域中?蛻艨梢允褂肁mazon PrivateLink建立從Amazon Virtual Private Cloud(VPC)到Amazon Bedrock的私有連接,而無(wú)需將VPC暴露給互聯(lián)網(wǎng)流量。用戶輸入和模型輸出不會(huì)與任何模型提供商共享。Amazon Bedrock還提供全面的監(jiān)控和日志記錄功能。
圖片來(lái)自攝圖網(wǎng)
其次,豐富的基礎(chǔ)模型選擇
沒(méi)有任何一款大模型可以滿足所有需求。
企業(yè)在使用大模型時(shí),一定是博采眾長(zhǎng),多款并用的。筆者觀察到,很多企業(yè)在開(kāi)發(fā)垂直領(lǐng)域的企業(yè)服務(wù)大模型時(shí),底層都接入了不止一個(gè)頭部大模型。
在頭部云廠商中,以亞馬遜云科技為例,豐富的基礎(chǔ)模型選擇也是其在大模型賽道的差異化優(yōu)勢(shì)。目前,Amazon Bedrock平臺(tái)的大模型提供商擴(kuò)充至7家,包括AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon和Mistral AI。
“回顧2021年,當(dāng) Anthropic第一次開(kāi)始在亞馬遜云科技上構(gòu)建時(shí),沒(méi)有人能想到Claude系列模型會(huì)帶來(lái)多大的變革。自Amazon Bedrock于 2023年9月28日全面上線以來(lái)的短短幾個(gè)月內(nèi),已有超過(guò)10,000名客戶使用它,其中許多客戶正在使用Claude。”亞馬遜云科技數(shù)據(jù)和AI副總裁Swami Sivasubramanian博士表示。
目前,已經(jīng)有不少頭部企業(yè)在云上使用Claude創(chuàng)建生成式AI應(yīng)用。比如,全球領(lǐng)先的生物制藥公司輝瑞正通過(guò)Amazon Bedrock使用Claude模型,加速創(chuàng)新癌癥治療方案的研發(fā)。通過(guò)運(yùn)用生成式AI技術(shù),輝瑞能夠大幅縮短收集相關(guān)數(shù)據(jù)和科學(xué)內(nèi)容所需的時(shí)間,進(jìn)而利用這些內(nèi)容分析趨勢(shì)、制定腫瘤學(xué)目標(biāo)并進(jìn)行驗(yàn)證,從而提高成功概率。
第三,易用的AI平臺(tái)和工具集
云計(jì)算廠商并非僅僅提供AI大模型的底層基礎(chǔ)設(shè)施和基礎(chǔ)模型接口,更關(guān)鍵是提供系統(tǒng)化的AI平臺(tái)和工具集,幫助企業(yè)更好使用大模型進(jìn)行創(chuàng)新。
比如,Amazon Bedrock推出了豐富的AI功能,包括幫助客戶識(shí)別、比較模型的模型評(píng)估功能、簡(jiǎn)化生成式AI應(yīng)用構(gòu)建并利用專有數(shù)據(jù)提供定制化響應(yīng)的知識(shí)庫(kù)功能、模型調(diào)優(yōu)功能、能執(zhí)行多步驟業(yè)務(wù)指令的代理功能、實(shí)現(xiàn)負(fù)責(zé)任AI的Guardrails安全功能等。
Claude3的出現(xiàn),讓生成式AI領(lǐng)域再度風(fēng)起云涌。Claude3不僅刷新了基礎(chǔ)大模型的性能,也打破了長(zhǎng)期以來(lái)通用大模型領(lǐng)域一家獨(dú)大的市場(chǎng)格局。
同時(shí),亞馬遜云科技與Anthropic的強(qiáng)強(qiáng)聯(lián)合,不僅能讓更多企業(yè)在云上便捷使用更新更強(qiáng)大的通用大模型,也代表了企業(yè)首選在公有云上使用大模型能力和生成式AI的發(fā)展趨勢(shì)。
參考資料:
The Claude 3 Model Family: Opus, Sonnet, Haiku
https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf
原文標(biāo)題 : 大模型新皇Claude 3即將入駐Amazon Bedrock,公有云成AI創(chuàng)新加速器

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?