通義千問(wèn)與文心一言對(duì)比評(píng)測(cè):誰(shuí)才是蘋(píng)果AI的“黃金搭檔”?
4499元起,iPhone 16e來(lái)了,該不該買卻要慎重考慮。
僅看硬件配置,同價(jià)位的安卓手機(jī)應(yīng)該沒(méi)有比它更差的,但對(duì)于蘋(píng)果用戶而言,iPhone 16e是價(jià)格最低的AI iPhone,是預(yù)算有限又想體驗(yàn)蘋(píng)果AI功能的消費(fèi)者的最佳之選。
去年10月蘋(píng)果就表示,Apple Intelligence將于2025年4月初推出簡(jiǎn)體中文版,F(xiàn)在iPhone 16e商品頁(yè)面又顯示Apple Intelligence推出時(shí)間將依監(jiān)管部門審批情況而定,表明該功能已完成開(kāi)發(fā)并送審,大概率可以如此前的宣傳一般,在4月初與iOS 18.4一同上線。
(圖源:蘋(píng)果)
為確保Apple Intelligence符合國(guó)內(nèi)相關(guān)要求,蘋(píng)果需要在中國(guó)尋找AI企業(yè)作為合作伙伴,方能為中國(guó)用戶提供AI功能。最初豆包、百度等AI公司傳出過(guò)與蘋(píng)果合作的消息,經(jīng)過(guò)一番篩選后,蘋(píng)果被曝選擇了阿里巴巴作為合作伙伴,放棄了百度。2月13日,阿里巴巴聯(lián)合創(chuàng)始人蔡崇信在阿聯(lián)酋迪拜舉辦的World Governments Summit 2025峰會(huì)上,確認(rèn)了與蘋(píng)果合作的消息。
然而據(jù)科技媒體The Information報(bào)道,蘋(píng)果并未放棄百度,同時(shí)與阿里巴巴和百度兩家企業(yè)合作,百度也會(huì)參與部分AI套件的研發(fā)工作,包括中文版Siri語(yǔ)音助手升級(jí)、圖片和文本智能搜索等。
百度、阿里巴巴、騰訊三家企業(yè)曾并列中國(guó)互聯(lián)網(wǎng)三巨頭,合稱“BAT”,進(jìn)入AI時(shí)代后分別開(kāi)發(fā)出了文心一言、通義千問(wèn)、騰訊混元三大AI大模型。蘋(píng)果同時(shí)與百度和阿里巴巴合作,令小雷想到了當(dāng)初蘋(píng)果讓供應(yīng)商內(nèi)卷的畫(huà)面,唯有實(shí)力強(qiáng)勁的供應(yīng)商才能加入果鏈。那么問(wèn)題來(lái)了,百度和阿里哪個(gè)才是蘋(píng)果AI領(lǐng)域的“黃金搭檔”?
阿里VS百度,誰(shuí)才是蘋(píng)果AI的黃金搭檔?
在之前關(guān)于AI大模型的測(cè)試中,小雷曾多次對(duì)比過(guò)通義千問(wèn)、文心一言、豆包、Kimi、DeepSeek等國(guó)產(chǎn)AI大模型,但當(dāng)時(shí)文心4.0及更強(qiáng)的大模型收費(fèi)服務(wù),為公平起見(jiàn),小雷選擇了免費(fèi)的文心3.5大模型。
現(xiàn)在,百度已宣布文心一言將于4月1日起免費(fèi)服務(wù),6月30日起開(kāi)源模型。在免費(fèi)服務(wù)之前,每天還會(huì)發(fā)放VIP體驗(yàn)券,幾乎等同于已經(jīng)免費(fèi)服務(wù)。因此,小雷決定用文心一言最強(qiáng)的文心4.0 Turbo對(duì)比通義千問(wèn)屢獲殊榮的Qwen 2.5模型。
考慮到阿里巴巴、百度與蘋(píng)果合作是為了向iPhone用戶提供AI服務(wù),小雷將此測(cè)試項(xiàng)目問(wèn)題全部設(shè)為我們?nèi)粘J褂檬謾C(jī)時(shí),可能會(huì)遇到的問(wèn)題或需要處理的事項(xiàng)。
常識(shí)問(wèn)答:PC端通義千問(wèn)才是完全體?
在針對(duì)AI的測(cè)試項(xiàng)目中,常識(shí)問(wèn)答一般最為簡(jiǎn)單,小雷本以為這場(chǎng)測(cè)試難以體現(xiàn)出AI大模型的差距,結(jié)果卻令小雷有點(diǎn)驚訝。
早有假期旅游計(jì)劃的小雷,向AI提出的第一道問(wèn)題為“今年高速哪些時(shí)間免費(fèi)”。通義千問(wèn)并未將今年高速所有免費(fèi)時(shí)間段全部告知小雷,僅給出了春節(jié)期間高速免費(fèi)開(kāi)始和結(jié)束時(shí)間。不死心的小雷問(wèn)了兩次,得到的回答完全相同。文心一言則將春節(jié)、清明、勞動(dòng)節(jié)、國(guó)慶節(jié)四個(gè)時(shí)間段,高速免費(fèi)開(kāi)始和結(jié)束時(shí)間全部統(tǒng)計(jì)出來(lái),并備注了免費(fèi)通用型車輛的標(biāo)準(zhǔn)。
(左:通義;右:文小言;圖源:App截圖)
需要注意的是,當(dāng)小雷切換至PC端,再向通義千問(wèn)詢問(wèn)該問(wèn)題,居然得到了正確答案?尚±椎谌问褂檬謾C(jī)端通義App詢問(wèn)該問(wèn)題,通義千問(wèn)依然給出了與前兩次相同的錯(cuò)誤答案。
(圖源:通義千問(wèn)截圖)
從結(jié)果來(lái)看,通義千問(wèn)在常識(shí)解答方面的能力不輸文心一言,只是自身網(wǎng)頁(yè)版和手機(jī)App似乎存在差距,手機(jī)端三次回答全部錯(cuò)誤,PC端一次就回答正確。考慮到這層因素,接下來(lái)的幾輪測(cè)試,全部改用網(wǎng)頁(yè)版通義千問(wèn)和文心一言。
工作提效:文心、通義各有所長(zhǎng)
許多較長(zhǎng)的論文、文檔小雷總是沒(méi)有時(shí)間從頭看到尾,好在AI大模型基本加入了內(nèi)容總結(jié)功能。本輪測(cè)試小雷便選擇了此前清華大學(xué)新聞與傳播學(xué)院、新媒體研究中心、元宇宙文化實(shí)驗(yàn)室聯(lián)合推出的《DeepSeek:從入門到精通》文件,讓通義千問(wèn)和百度為我們分析、總結(jié)DeepSeek的使用技巧。
通義千問(wèn)總結(jié)的內(nèi)容分為六大板塊,前四個(gè)板塊均為分析DeepSeek的領(lǐng)先性和應(yīng)用場(chǎng)景,第五板塊為清華大學(xué)的貢獻(xiàn),最后一個(gè)板塊為未來(lái)展望,每一個(gè)板塊的內(nèi)容都極為簡(jiǎn)略,倒是可以作為DeepSeek入門前了解基礎(chǔ)知識(shí)的閱讀材料,跟“精通”二字完全無(wú)關(guān)。
(圖源:通義千問(wèn)截圖)
文心一言總結(jié)出的內(nèi)容分為12個(gè)小板塊,每個(gè)板塊同樣簡(jiǎn)略,但并未忽視提示語(yǔ)的重要性和使用技巧板塊,忽略了對(duì)于用戶沒(méi)有意義的清華大學(xué)貢獻(xiàn)一欄。當(dāng)然,文心一言總結(jié)的內(nèi)容僅僅是略勝一籌,如果說(shuō)通義千問(wèn)總結(jié)的內(nèi)容像大標(biāo)題及簡(jiǎn)單介紹,文心一言總結(jié)的內(nèi)容則是小標(biāo)題加內(nèi)容梗概,實(shí)質(zhì)性內(nèi)容依然稀少。
(圖源:文心一言截圖)
車轱轆話亂轉(zhuǎn),重點(diǎn)內(nèi)容過(guò)于簡(jiǎn)略,罕有實(shí)用性的內(nèi)容,是當(dāng)前AI大模型總結(jié)內(nèi)容時(shí)普遍存在的問(wèn)題。數(shù)萬(wàn)字的文件,濃縮成數(shù)百字,難免需要舍棄大量?jī)?nèi)容,在使用AI總結(jié)篇幅較長(zhǎng)的文檔時(shí),最好還是自己按照生成的內(nèi)容,再大致看一下原文檔。
為進(jìn)一步測(cè)試兩款A(yù)I大模型的能力,小雷決定縮小范圍,讓大模型根據(jù)文件中提示語(yǔ)鏈相關(guān)的內(nèi)容,撰寫(xiě)一篇提示語(yǔ)鏈作用與設(shè)計(jì)原則的文章。
這輪測(cè)試中,通義千問(wèn)一改之前簡(jiǎn)略的風(fēng)格,提示語(yǔ)鏈的作用、設(shè)計(jì)原則、設(shè)計(jì)模型三大板塊均面面俱到,教導(dǎo)用戶該如何設(shè)計(jì)和使用提示語(yǔ)鏈。
(圖源:通義千問(wèn)截圖)
文心一言則延續(xù)了簡(jiǎn)約的風(fēng)格,作用機(jī)制的分析和設(shè)計(jì)原則的解讀給人一種未能準(zhǔn)確理解文件的感覺(jué)。
(圖源:文心一言截圖)
本輪測(cè)試中,PDF全文解讀方面,文心一言表現(xiàn)稍好,提示語(yǔ)鏈專項(xiàng)內(nèi)容生成方面,則是通義千問(wèn)領(lǐng)先,二者互有優(yōu)勢(shì)。蘋(píng)果同時(shí)與阿里巴巴、百度合作,或許可以綜合二者的特點(diǎn),為用戶提供更完善的AI體驗(yàn)。
360開(kāi)發(fā)的納米AI搜索App,便提供混合模型方案,聯(lián)合15家大模型廠商打造AI助手,能夠自動(dòng)調(diào)整大模型回答問(wèn)題。未來(lái)或許其他企業(yè)也會(huì)采取此類方案,通過(guò)混合模型解決單一模型不擅長(zhǎng)部分領(lǐng)域的問(wèn)題。
圖片修改:文心再勝一場(chǎng)
AI攝影、AI修圖在今天已是極為常見(jiàn)的功能,許多手機(jī)廠商還會(huì)在新機(jī)發(fā)布時(shí)宣傳AI修圖功能。小雷也對(duì)通義千問(wèn)和文心一言的圖片修改功能進(jìn)行了測(cè)試,但本輪測(cè)試出現(xiàn)了一點(diǎn)意外。
通義千問(wèn)本身不支持以文字指令修改圖片,雖提供諸多可修改圖片的智能體,但這些智能體卻均不支持上傳圖片,無(wú)法正常使用,唯一可上傳圖片的修圖智能體是AI擴(kuò)圖,又僅是等比例縮小或放大圖片,并非根據(jù)畫(huà)面已有內(nèi)容,額外繪制不存在的內(nèi)容。
(圖源:通義千問(wèn)截圖)
文心一言倒是根據(jù)小雷的要求,成功將圖片的背景從灰蒙蒙的天空替換成藍(lán)天白云?蔁羲黧w卻重繪,不再是原來(lái)的燈塔,根據(jù)拍攝照片和要求重新繪制了一張圖,僅保留了主體的特征。
(圖源:文心一言截圖)
為進(jìn)一步測(cè)試兩款A(yù)I大模型的制圖能力,小雷以“海邊矗立著一座孤獨(dú)的燈塔,唯有藍(lán)天白云和海鳥(niǎo)與其相伴”為描述語(yǔ),要求通義千問(wèn)和文心一言各生成一張圖。從圖片質(zhì)量來(lái)看,文心一言生成的圖片意境、清晰度、美感等方面均更勝一籌,而且文心一言會(huì)一次生成四張圖片供用戶選擇。
(圖源:通義千問(wèn)生成)
(圖源:文心一言生成)
本輪測(cè)試文心一言再次獲勝,既可以根據(jù)原圖重新繪制圖片,也能根據(jù)用戶的描述生成圖片,而且生成的圖片質(zhì)量更高,原圖大小為1.48MB,通義千問(wèn)生成的圖片原圖大小則僅為73.2KB(注明:兩張圖片原圖分辨率均為1024×1024)。
通義千問(wèn)Qwen 2.5作為一款開(kāi)源模型,追求的是便于用戶部署、使用、修改,更注重B端場(chǎng)景,對(duì)于C端用戶的需求似乎沒(méi)有那么上心。文心4.0 Turbo曾是閉源模型,面向C端用戶收費(fèi),因而需要豐富手機(jī)App和PC端的功能。本輪測(cè)試的落后,并不等同于通義千問(wèn)Qwen 2.5落后文心4.0 Turbo。
左擁阿里右抱百度,蘋(píng)果智能上雙保險(xiǎn)?
以上幾輪測(cè)試中,通義千問(wèn)和文心一言均有自己的優(yōu)勢(shì)項(xiàng)目:百度在圖片生成和文檔總結(jié)方面表現(xiàn)較好,通義千問(wèn)則在提取重點(diǎn)內(nèi)容并撰寫(xiě)文章方面更加出色。
因模型架構(gòu)、訓(xùn)練所用的數(shù)據(jù)存在差異,AI大模型之間自然也會(huì)出現(xiàn)優(yōu)勢(shì)領(lǐng)域不同的情況。蘋(píng)果同時(shí)與阿里巴巴、百度合作,可能有充分利用兩家企業(yè)的優(yōu)勢(shì),實(shí)現(xiàn)揚(yáng)長(zhǎng)避短,在各種場(chǎng)景下均能為用戶提供行業(yè)第一梯隊(duì)的體驗(yàn)的考慮。
(圖源:蘋(píng)果)
中文版Apple Intelligence與英文版在體驗(yàn)方面很可能會(huì)存在較大差距,哪一個(gè)更領(lǐng)先還不好說(shuō),阿里巴巴加上百度的AI實(shí)力加持的Apple Intelligence,值得期待。
4499元起的iPhone 16e略貴,好在128GB/256GB版本定價(jià)低于6000元,可享受政府補(bǔ)貼,3999元/4999元即可入手,各大電商平臺(tái)大概率也會(huì)推出一定的優(yōu)惠方案。相較iPhone 16系列其他機(jī)型,擁有價(jià)格優(yōu)勢(shì)且支持Apple Intelligence,能否推動(dòng)蘋(píng)果銷量翻盤?關(guān)鍵還要看蘋(píng)果在中國(guó)市場(chǎng)端出來(lái)的“AI大餐”的體驗(yàn)。
手機(jī)AI進(jìn)化一日千里,留給蘋(píng)果的時(shí)間不多了
在蘋(píng)果AI亦步亦趨時(shí),安卓/鴻蒙陣營(yíng)的手機(jī)品牌在AI上進(jìn)展神速。
在海外市場(chǎng),聯(lián)想(Moto)和三星靠著Google Gemini和運(yùn)營(yíng)商支持正“大殺四方”;在國(guó)內(nèi)市場(chǎng),小米、華為、OPPO、vivo、榮耀等品牌已完成各自AI化進(jìn)程,AI功能可圈可點(diǎn)甚至讓人眼花繚亂,甚至成了手機(jī)廠商“卷”的新焦點(diǎn)。
25年春節(jié)后DeepSeek爆火,國(guó)產(chǎn)手機(jī)廠商(除了小米)大都第一時(shí)間接入了DeepSeek,這其實(shí)證明了安卓手機(jī)開(kāi)放性的優(yōu)勢(shì):以后DeepSeek新模型,或者比DeepSeek更強(qiáng)的AI模型出現(xiàn),安卓手機(jī)都可在第一時(shí)間接入,絕不掉隊(duì)。
然而iPhone就只能讓用戶等,因?yàn)樘O(píng)果封閉模式必須點(diǎn)對(duì)點(diǎn)合作,這會(huì)讓iPhone用戶的智能體驗(yàn)有代差。其實(shí)在中國(guó)用戶等待蘋(píng)果智能這半年時(shí),DeepSeek R1/V3,xAI Grok 3以及百度文心4.5(即將發(fā)布,開(kāi)源且免費(fèi))就已紛紛發(fā)布,AI技術(shù)進(jìn)步可謂是一日千里。姍姍來(lái)遲的蘋(píng)果智能真能打嗎?小雷很悲觀。
對(duì)中國(guó)用戶來(lái)說(shuō),“蘋(píng)果智能”依然是懸而未決的“餅”。從春節(jié)到現(xiàn)在,中國(guó)用戶正在習(xí)慣使用強(qiáng)大的DeepSeek以及接入DeepSeek的微信、百度以及國(guó)產(chǎn)安卓手機(jī)等產(chǎn)品的AI服務(wù),對(duì)AI的期待正在變得越來(lái)越高。蘋(píng)果與阿里或者百度合作落地的“蘋(píng)果智能”能否滿足中國(guó)用戶預(yù)期,依然有待觀察。
來(lái)源:雷科技
原文標(biāo)題 : 通義千問(wèn)與文心一言對(duì)比評(píng)測(cè):誰(shuí)才是蘋(píng)果AI的“黃金搭檔”?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?