亞馬遜:要用機(jī)器人消滅“條形碼”!
今日消息,電商巨頭亞馬遜準(zhǔn)備消滅“條形碼”。
機(jī)器人也許是未來,但機(jī)械臂顯然不擅長使用一種古老而又穩(wěn)定的技術(shù)形式:條形碼。電商巨頭亞馬遜本周五表示,條形碼很難找到,而且可能會(huì)被貼在奇形怪狀的產(chǎn)品上,這是機(jī)器人無法很好地解決的問題。于是,亞馬遜準(zhǔn)備消滅掉這項(xiàng)技術(shù)。
用“圖片訓(xùn)練計(jì)算機(jī)模型”解決
對于亞馬遜即將舍棄“條形碼”后給出的解決方案是:利用亞馬遜倉庫里物品的圖片訓(xùn)練計(jì)算機(jī)模型。
據(jù)悉,該公司開發(fā)了一種攝像頭系統(tǒng),可以逐個(gè)監(jiān)控從傳送帶上經(jīng)過的物品,以確保它們與圖片相符。最終,亞馬遜的人工智能專家和機(jī)器人專家希望將這項(xiàng)技術(shù)與機(jī)器人結(jié)合起來,讓機(jī)器人在拾取和翻轉(zhuǎn)物品的同時(shí)識別物品。
亞馬遜的人工智能專家必須首先建立一個(gè)產(chǎn)品圖像庫,在這個(gè)項(xiàng)目之前,該公司沒有理由這樣做。圖像本身以及有關(guān)產(chǎn)品尺寸的數(shù)據(jù)為早期版本的計(jì)算機(jī)視覺算法提供了素材,攝像機(jī)不斷捕捉產(chǎn)品的新圖像來訓(xùn)練模型。
“解決這個(gè)問題,讓機(jī)器人可以在不需要查找和掃描條形碼的情況下拾取物品并進(jìn)行處理,這是最根本的,”亞馬遜柏林計(jì)算機(jī)視覺部門的應(yīng)用科學(xué)經(jīng)理諾塔斯·安東納克斯(Nontas Antonakos)表示,“這將幫助我們更快、更準(zhǔn)確地將包裹送到客戶手中。”
這個(gè)被稱為多模式識別的系統(tǒng)不會(huì)很快完全取代條形碼。亞馬遜表示,目前,該系統(tǒng)已在西班牙巴塞羅那和德國漢堡的倉庫中投入使用,已經(jīng)加快了那里處理包裹的時(shí)間。這項(xiàng)技術(shù)將在亞馬旗下各個(gè)業(yè)務(wù)部門共享,所以它未來可能會(huì)被用于全食超市或其他亞馬遜實(shí)體連鎖店。
亞馬遜表示,該系統(tǒng)的錯(cuò)誤率不高,把不正確的商品發(fā)送給客戶的問題不經(jīng)常出現(xiàn)。但是考慮到一個(gè)倉庫一天要處理許多物品,即使是不常見的錯(cuò)誤疊加起來也會(huì)導(dǎo)致嚴(yán)重誤工。
亞馬遜算法第一次使用時(shí)的準(zhǔn)確率在75%到80%之間,這被亞馬遜視為一個(gè)不錯(cuò)的開始。亞馬遜表示,目前的準(zhǔn)確率已達(dá)到99%。不過該系統(tǒng)在最初使用時(shí)遇到了故障,無法捕捉顏色差異。在Prime Day促銷期間,這個(gè)系統(tǒng)無法區(qū)分兩種不同顏色的Echo Dots智能音箱。
亞馬遜人工智能團(tuán)隊(duì)表示,微調(diào)多模式識別系統(tǒng)來評估由人處理的產(chǎn)品將是一個(gè)挑戰(zhàn),這就是為什么其最終目標(biāo)是讓機(jī)器人來處理這些產(chǎn)品的原因。
那么,人類的視覺系統(tǒng)可以復(fù)制嗎?
答案是肯定的。
復(fù)制“人類的視覺系統(tǒng)”
計(jì)算機(jī)視覺技術(shù)的不斷普及,讓機(jī)器識別和處理圖像就像人的大腦一樣,且速度更快、更準(zhǔn)確。機(jī)器·像人類一樣去“思考”。
計(jì)算機(jī)視覺是近年來人工智能增長最快的領(lǐng)域之一。計(jì)算機(jī)視覺技術(shù)集數(shù)字圖像處理、數(shù)字信號處理、光學(xué)、物理學(xué)、幾何學(xué)、應(yīng)用數(shù)學(xué)、模式識別及人工智能等知識于一體,其應(yīng)用已經(jīng)涉及到計(jì)算機(jī)和、計(jì)算機(jī)圖形學(xué)、圖像處理、機(jī)器人學(xué)等領(lǐng)域。
許多計(jì)算機(jī)視覺應(yīng)用已經(jīng)投入使用,且正在以更快的速度、更大的規(guī)模去嘗試模仿人類觀察和理解周圍世界的能力。
在自動(dòng)駕駛領(lǐng)域,計(jì)算機(jī)視覺的圖像識別功能使汽車能夠識別行人、道路標(biāo)志及行進(jìn)路線中的其他重要特征;在醫(yī)療領(lǐng)域,醫(yī)生利用計(jì)算機(jī)視覺技術(shù)支持來自CT、放射線圖像和其他成像工具的診斷;在電子商務(wù)領(lǐng)域,企業(yè)依靠計(jì)算機(jī)視覺推動(dòng)廣告投放和識別不安全的品牌內(nèi)容等等。
不可否認(rèn)的是,各行各業(yè)的企業(yè)都將受益于計(jì)算機(jī)視覺解決方案,助力其準(zhǔn)確高效地實(shí)現(xiàn)業(yè)務(wù)流程自動(dòng)化。而用于計(jì)算機(jī)視覺的深度學(xué)習(xí)基于神經(jīng)網(wǎng)絡(luò),它需要大量的高質(zhì)量訓(xùn)練數(shù)據(jù)并適當(dāng)調(diào)整變量,以達(dá)到讓機(jī)器學(xué)會(huì)識別目標(biāo)對象、而無需其他指導(dǎo)的目的。
圖像的識別功能
圖像的識別過程實(shí)際上可以看作是一個(gè)標(biāo)記過程,即利用識別算法來辨別景物中已分割好的各個(gè)物體,給這些物體賦予特定的標(biāo)記,它是計(jì)算機(jī)視覺系統(tǒng)必須完成的一個(gè)任務(wù)。
按照圖像識別從易到難,可分為三類問題。第一類識別問題中,圖像中的像素表達(dá)了某一物體的某種特定信息。
第二類問題中,待識別物是有形的整體,二維圖像信息已經(jīng)足夠識別該物體,如文字識別、某些具有穩(wěn)定可視表面的三維體識別等。
第三類問題是由輸入的二維圖、要素圖、2×5 維圖等,得出被測物體的三維表示。這里存著如何將隱含的三維信息提取出來的問題,是當(dāng)今研究的熱點(diǎn)。
目前用于圖像識別的方法主要分為決策理論和結(jié)構(gòu)方法。決策理論方法的基礎(chǔ)是決策函數(shù),利用它對模式向量進(jìn)行分類識別,是以定時(shí)描述(如統(tǒng)計(jì)紋理)為基礎(chǔ)的;結(jié)構(gòu)方法的核心是將物體分解成了模式或模式基元,而不同的物體結(jié)構(gòu)有不同的基元串(或稱字符串),通過對未知物體利用給定的模式基元求出編碼邊界,得到字符串,再根據(jù)字符串判斷它的屬類。這是一種依賴于符號描述被測物體之間關(guān)系的方法。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評 >> 【評選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?