視覺大模型落地應用,?低暟l(fā)布系列大模型攝像機
進入2025年,依托?涤^瀾大模型技術體系,海康威視將大模型能力直接部署至端側,推出一系列視覺大模型攝像機。視覺大模型攝像機不僅成像畫質更優(yōu),更重要的是突破了場景普適性弱、復雜目標識別難等瓶頸,進一步提升目標檢出率,大幅降低誤報,在零樣本的情況下也能進行識別,檢測目標種類更豐富。
大幅降低誤報檢出率、檢準率雙提升
智能攝像機在實際應用中,不同場景、不同光照條件、不同天氣等均會帶來大量誤報警告,造成運維成本增加,用戶體驗不佳,降低事件響應的信任度。
20余年來,海康威視深耕視頻領域業(yè)務,結合各類場景的豐富行業(yè)知識,構建了預訓練大模型,在預訓練階段中增加了各類真實動態(tài)場景干擾數(shù)據(jù),如雨雪霧天氣、強光閃爍、動物移動、振動抖動等,針對不同條件下進行數(shù)據(jù)增強,大幅提升智能識別的檢出與檢準率。
同時,?低晿嫿送晟频拇竽P筒渴鸺夹g體系,從模型輕量化、計算效率提升、計算資源節(jié)省等方面研究模型結構設計和量化技術,創(chuàng)新研發(fā)出更加適配場景的視覺大模型攝像機。
如在周界應用中,?低曇研纬汕驒C、IPC、多攝等大模型警戒系列攝像機。相比傳統(tǒng)視頻周界產(chǎn)品,大模型警戒系列攝像機進一步提升識別距離,誤報率下降90%以上。(根據(jù)項目實測數(shù)據(jù))。例如,同一測試場景下,采用4mm鏡頭測試,視覺大模型相機在70米可檢出人員入侵,以往深度學習算法40米可檢出,傳統(tǒng)smart算法在20米才能檢出。同樣檢測條件下,過濾小鳥誤報時,傳統(tǒng)smart算法檢出人員入侵的同時持續(xù)檢出小鳥入侵,視覺大模型相機可精準過濾小鳥誤報,僅檢出人員入侵。
在交通事件檢測中,?低曂瞥隼滓曇惑w機、事件檢測攝像機、FOD雷視檢測一體機等視覺大模型攝像機。在高速公路交通事件檢測領域,有效解決復雜場景下拋灑物、停車、行人等事件的誤報、漏報難題。
在交通卡口應用中,推出卡口抓拍單元、非機動車抓拍單元、雷云船舶卡口一體機等視覺大模型攝像機產(chǎn)品。如在駕駛室特征識別應用中,識別安全帶時,有效過濾低對比度、遮擋、復雜姿態(tài)等產(chǎn)生的誤報;識別打電話時,有效過濾對抬手、握物等產(chǎn)生的誤報。
支持零樣本開放識別,目標識別種類更豐富
傳統(tǒng)智能應用的落地,千行百業(yè)智能需求各不相同,針對不同目標需訓練特定的識別算法,存在樣本采集成本高、類別拓展難、訓練周期較長等問題。
通過在攝像機部署開放式目標檢測大模型,采用自研的統(tǒng)一模態(tài)學習方案,將視覺識別的圖像特征對齊語義特征,實現(xiàn)目標的精準檢出與定位,海康威視推出”描述即識別”的智能攝像機應用模式,即輸入一個詞、一句話可按需快速靈活生成模型,無需樣本訓練即可識別目標。
場景定義畫質,精準自適應調優(yōu)
視覺大模型攝像機以“硬件+算法”深度融合,打造全場景畫質提升。以專業(yè)的大光圈鏡頭,高感光傳感器設計能力,結合豐富低照度場景經(jīng)驗,構建端到端的智能大模型算法,有效區(qū)分圖像中信號和噪聲,精準去噪,提升夜視監(jiān)控畫面信噪比,針對暴雨、霧霾、過曝、偏色等場景,可實現(xiàn)場景定義畫質,讓圖像細節(jié)更豐富,色彩更真實,為智能應用提供更優(yōu)的視頻圖像支撐。
從看得見,看得清,到看得懂,大模型的到來,進一步提升?低暤募夹g和產(chǎn)品創(chuàng)新能力。目前?低曇淹瞥鼍湎盗小⒔煌ㄊ录䴔z測系列、卡口抓拍系列、機械臂防碰撞系列、抗振防抖系列、巡檢系列等視覺大模型攝像機。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?