一文了解計算機視覺未來的走向
前言:
目前,計算機視覺面臨幾大問題:
1.需要大算力,需要大數據用于訓練,因此導致成本太高。
2.應用場景單一,目前僅用于無人駕駛,安防監(jiān)控等少數領域。
3.對CV人來說,內卷嚴重,市場接近飽和。
在知乎上,很多大牛從技術的角度上談了關于計算機視覺未來的走向,受益匪淺。結合前幾日看到的另一個問題,為什么很多人現在不看好商湯科技,在這里,我想從一個社會的角度來談一談我對計算機視覺未來走向的看法。
日新月異,用它來形容現在社會的變化真是再恰當不過,而推動這個變化的是科技的高速發(fā)展。
我對技術的看法是,技術必須服務于人,必須對社會有益,推動社會進步,而負責實現這件事的正是企業(yè),企業(yè)必須將技術落地應用,變成產品,為人類服務,為社會服務。
因此,說起我為什么不看好商湯科技,是因為我覺得它沒有完成這件事。
作為一個技術人員,我平?吹臇|西算是比較多,不僅是技術方面,產品方面也比較關注。經?吹缴虦珪缡烙职l(fā)了什么論文,卻幾乎沒見過它們研發(fā)出了什么新產品。在我的印象里,它們就像是一個研究所的存在。
然而,世界上已經有了這么多高校實驗室研究所在搞學術研究,還差一個商湯曠世嗎?
在我看來,這與格力聲稱要做格力手機如出一轍。市面上已經有了蘋果,小米,華為,OV等這么多做的很好的手機,還差一個格力手機嗎?
所以董明珠如果要做手機,最合適的就是自己做操作系統(tǒng),或者自己搞芯片,做點對社會對市場有益的事情。但格力明顯沒有這個打算,我對它當初說要做手機就一直是冷眼相看。四五年過去了,就目前來看,還真沒看錯它。
企業(yè)還是應該做企業(yè)該做的事情,那就是將學術研究落地應用,變成產品。
在《下一個倒下的會不會是華為》中有這樣一段話:
“我們一定要做商人?茖W家可以什么都不管,一輩子只研究蜘蛛腿的一根毛。對科學家來說,這是可以的。但是對我們呢?我們只研究蜘蛛腿,誰給我們飯吃?因此,不能光研究蜘蛛腿,要研究客戶需求……”
這番話講于2002年,其時,“獅子”朗訊科技快要倒下了,“巨獅”摩托羅拉也病懨懨的……
朗訊科技最核心的資源——貝爾實驗室,正是以研究“蜘蛛腿”“蝴蝶翅膀”“馬尾巴的功能”等這些基礎課題見長的,它既是朗訊科技的成長助推器,也是朗訊科技的包袱;摩托羅拉以巨資投入銥星系統(tǒng)研發(fā),結果尖端技術成為它走向衰敗的滑鐵盧……這兩家公司以及眾多的“巨獅”都患上了資本和技術的“富營養(yǎng)病”,所以到頭來都被優(yōu)勢資源所拖累、所詛咒。
商湯曠世在這一點上像極了朗訊和摩托羅拉,忽視了技術的最終目的是服務于人,服務于社會。
談及我對計算機視覺的看法,技術和產品的關系就像是硬件與軟件的關系。當硬件發(fā)展到一定水平時,如果軟件的發(fā)展速度跟不上,那么硬件就毫無作用。當軟件發(fā)展起來后,又受到硬件水平的限制,軟件要進一步提高,需要提升硬件水平。
從目前的環(huán)境來看,學術研究已經達到了一定的程度,而落地應用的領域或者說產品很少,因此導致了計算機視覺的飽和。、
當應用的領域被逐漸開發(fā),產品逐漸增多,現在的飽和就變成了暫時性的飽和。從產品,市場的層面上也會進一步推動學術研究的發(fā)展。
那有待開發(fā)的領域和產品有哪些呢?
借用何同學的思考方式,我們對計算機視覺的應用還只局限于當下,我們正因為它目前需要龐大的數據集訓練,昂貴的算力,才限制了我們對它的應用場景和產品的想象。
當日后算力成本降低,數據不足的問題得到緩解,我們會發(fā)現,其實計算機視覺可應用的場景非常多。
從我的角度來看,它在未來一定能與機器人結合,我指的機器人并不只是人形機器人,主要是各種智能化設備,如場景監(jiān)控,服務機器人,無人駕駛,醫(yī)療設備,嵌入式設備等。
想想很多科幻電影,機器人可以對一個環(huán)境進行各種分析,然后做出相應行為。當然,這對人類來說,賦予機器人電影中的這些能力是一件很可怕的事情,就目前來說,也不現實。
不過,一些小范圍的能力我們是可以給的。
目前已經有的一些應用是對監(jiān)控進行分析,檢測到如車禍,火災,槍擊案,養(yǎng)老院的老人摔倒等異常事件后自動報警。無人駕駛上的視覺。
京東啟動一個對豬臉識別的項目,對豬的健康狀況進行檢測,斯坦福對人的糞便識別檢測,從而判斷人的健康狀況。
以后可以有以下應用:
對二手車進行全面掃描,識別型號,給出新舊程度分析,從而給出相應報價。
對臉部掃描,分析臉部皮膚情況,給出適合其皮膚的護理方案。對頭發(fā)掃描,推薦相應的護發(fā)產品與護發(fā)方案。
對農田進行實時監(jiān)控,提醒農場主目前農田的情況,如蟲子,作物生長狀況,分析該地區(qū)往年氣候,給出對該地區(qū)農田的最優(yōu)打理方案。
家庭服務機器人,掃描茶幾沙發(fā),自動清理并將物品放到本該在的位置。
學跳舞,將老師的跳舞輸入作為模板,對學生學舞視頻進行分析,給出跳的不對的地方。
…… ……
還可以有很多很多的應用,我給的都是些很細很具體的想法。
我個人經歷有限,設想也不夠全面,但我相信社會上還存在很多可以用視覺來解決的事情。
這些事情都需要有一個共同的基礎,就是可以將視覺用于移動端設備,嵌入式設備。
從我的理解來看,日后硬件水平會有較大發(fā)展,用于深度學習的專用處理器會有較好的性能。因此,計算機視覺未來的應用場景很廣泛,我們需要對每一個具體的應用場景設計一個很小的,專一的,可以用于嵌入式設備的模型。模型小型化,輕量化,檢測實時化。
商湯和曠世,作為AI四小龍的一份子,作為一個企業(yè),將技術落地應用是它們的責任,不管是從規(guī)模上,人才供給上,資金上,它們也完全有能力去將計算機視覺與機器人,移動端,嵌入式設備端結合開發(fā)新領域,研發(fā)新產品。
就目前互聯網企業(yè)來說,AI四小龍也是最適合做這件事的。
歡迎關注公眾號CV技術指南。專注于計算機視覺的技術總結,最新技術跟蹤。

最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?