訂閱
糾錯
加入自媒體

OpenAI發(fā)布最強AI模型!

沒等來GPT-5,卻等來了OpenAI悄悄發(fā)布的「o3-pro」。

我們一起看看這個聲稱 “最強AI模型” 的o3-pro,有哪些亮點?適合哪些人使用?

1 什么是o3-pro?

簡單來說,o3-pro是o3推理模型的加強版。官方介紹它是目前推理能力最強的一代。

具體來說,o3-pro是專門為復雜問題設計的:它不追求快,而是強調“想得清楚”。像數(shù)學、科學、編程、寫作、教育類任務,它處理得更有條理,輸出內(nèi)容更準確、結構更清晰。 

2 性能表現(xiàn)亮眼

先來上成績單。

在專家評估中,o3-pro比o3得到了更多認可。

在OpenAI內(nèi)部的測試數(shù)據(jù)中,o3-pro表現(xiàn)相當亮眼:

在數(shù)學測試AIME 2024中,超過了谷歌的 Gemini 2.5 Pro。

在GPQA Diamond(博士級科學知識評測)中,勝過了Anthropic家的 Claude 4 Opus。

在編程測試Codeforces中,也比前代模型有了不小的提升。

這些測試都是針對邏輯嚴謹性和知識深度的高難度評估。能在這里脫穎而出,確實說明了OpenAI在思考推理能力上的進步。 

此外,OpenAI還用 “4/4可靠性評估” 來證明了o3-pro的可靠性(4次回答全部正確才被視為成功)。

3 價格如何?

來看下API調用的價格:

輸入:$20/百萬token

輸出:$80/百萬token

相較于普通o3,價格貴了10倍......

4 最強也有局限性

再強的模型,也不是十全十美。

OpenAI列出了目前o3-pro存在的一些局限:

速度比前代慢,輸出時間更長;

暫不支持圖像生成;

暫時不兼容Canvas功能;

ChatGPT中無法使用“臨時對話”功能。

不過這些問題對大多數(shù)文字為主的使用場景來說,影響不大。但如果你要的是深度和準確性,那就得接受慢工出細活兒。

目前,o3-pro已經(jīng)面向ChatGPT Pro和Team用戶開放,企業(yè)和教育用戶下周可用。

如果你日常對AI回答的質量、準確率有較高要求,不妨試試看。

       原文標題 : OpenAI發(fā)布最強AI模型!

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號