天網恢恢,疏而不漏。不法分子的“易容術”、3D面具、圍巾帽子加口罩等偽裝,均逃不過人工智能監控的“透視眼”……
方象知產研究院梳理了“視覺”安防領域傳統巨頭和創新企業的發展情況和特點;本期文章將繼續篩選和解析這些企業在“計算機視覺+安防”領域的高價值核心技術,一窺“大佬”和“萌新”們的獨門秘笈及發展方向,以期為相關企業和投資機構未來布局、決策提供參考。

傳統安防巨頭 不止于“看得清”
在技術迅速發展和迭代的今天,傳統安防巨頭既不忘初心,又與時俱進,在不斷提升原有監控前端產品性能指標的同時,積極運用人工智能技術革新產品序列,確保在穩守“根據地”的基礎上,繼續開疆拓土。
?低—監控攝像機能自動聚焦
作為傳統安防三巨頭,?低、大華科技和宇視科技早已克服了模擬監控、數字監控等畫面不清晰、不易存儲讀取等問題,并手握相關核心技術。
監控攝像機拍攝圖像時,如果不經常調節鏡頭,無法快速、準確、平穩自動對焦。
針對這一問題,?低曆邪l了具有“自適應聚焦技術” 的攝像裝置,攝像機針對同一場景,可以自動選擇合適的聚焦模式,從而構建了清晰度評價準則。
這種自適應聚焦方法(見圖 1),針對不同模糊程度的圖像及聚焦參考值,設計了相應的“自適應步長策略”,能夠更快速、準確驅動步進電機對焦、減少震蕩。該項技術能讓視覺前端產品“看得更清”,因此在?诞a品序列中被廣泛引用。
方象知產研究院分析發現,?低曔@項技術的發明專利,被引用高達30多次,引用者不乏其競爭對手宇視科技、大華科技、華為等,足見該項技術的重要性。
除了?低,浙江大學、宇視科技等對該技術都有深入研究。

圖 1:攝像裝置自適應聚焦技術原理
來源:方象知產研究院
大華科技—卷積神經網絡 提高圖像識別率
在計算機視覺發展火熱的今天,安防巨頭并沒有躺在有傳統優勢的硬件產品上“吃老本”,而是早早布局智能安防領域,以期在“看得清”的基礎上,讓視覺監控智能化。而這些新技術,也成為安防巨頭能為客戶提供整體安全解決方案的重要基礎。
2018年12月11日,大華科技公開的一篇專利顯示,該公司針對在海量視頻圖像中,如何判斷優選圖像,布局了核心技術。該技術運用預先訓練好的卷積神經網絡評價模型,對圖像進行包括殘缺度、目標物體與所在圖像的垂線角度、目標占圖像面積比、圖像清晰度、圖像亮暗度等參數進行評價,最終選出滿足預設條件的優選圖像。比如在交管應用方面,這一技術能提高低質量車輛圖像的識別,提高圖像數據利用率。
宇視科技—智能回放 能自動挑選動態視頻分析
又如宇視科技,在視頻存儲與播放領域布局了一系列技術,專利被引用數量超過20次。其中的視頻智能回放方法,可以將視頻錄像劃分為多個視頻片段,通過篩選出具有運動目標的視頻段回放,以便更準確、快速對錄像進行分析。這項技術,解決了后端分析浪費智能服務器、智能網絡硬盤錄像機(NVR)、處理結果時間長的痛點。
傳統安防巨頭布局智能監控,在重要技術熱點上,不同公司通過不同方法解決問題。結合深度學習算法,智能視頻技術使攝像機不單純具有“眼睛”的功能,更具有“大腦”的特點。以此為支撐的計算機視覺安防系統解決方案,可廣泛用于安防布控、罪犯抓捕及大型活動安保等領域。
新興創企 特定角度切入研發“看穿你”
作為后起之秀,眾多創企率先將計算機視覺技術落地到安防領域。在傳統硬件設備和市場渠道等方面,創業公司無法與傳統安防巨頭匹敵,因此,它們大多瞄準了智能安防這一創新技術領域。而人臉識別,不約而同成為多家創業公司“夢開始的地方”。
人臉識別技術發展的過程中,諸多痛點問題顯現:比如對于通過化妝、“易容”等偽造生物特征的目標,不能完全識別;比如在大規模人員移動、人流量密集等情況,因監控圖片質量下降造成識別困難;還有對目標人群識別的視頻切割處理不靈活,導致完整行為信息缺乏等。
針對這些痛點問題,創新公司依托強大的研發能力,接連攻克核心技術,通過技術優勢,不僅在安防市場中搶得一席之地,業務范圍還拓展到金融、智慧城市等其他領域。
深醒科技—雙路神經網絡 能識別“易容術”
在人臉識別中,可能有不法分子通過用照片、3D人臉面具偽造生物特征避免被查。針對這類問題,深醒科技提出利用兩個卷積神經網絡進行人臉驗證:其中一個神經網絡提取臉部多個子區域的局部特征(如眼部子區域,鼻部子區域等);另一個神經網絡提取深度特征,通過深度圖譜驗證輸入圖像是否為實體,是否匹配一致。
雙路神經網絡,分別識別局部特征和整體深度特征,對局部特征和深度特征比較判別,實現真人面部識別,同時能夠有效識別照片、視頻、3D面具等反偵察欺騙手段。在圖像采集方面,紅外攝像頭和可見光攝像頭同時采集圖像,為進一步識別判定提供基礎。
商湯科技—智能監控“透視眼” 能“看穿”戴口罩的臉
在火車站、商圈等人流密集場所,人員流動性較強、情況復雜,給追查犯罪分子、重點人員布控造成困難。專注于機器視覺的商湯科技,針對上述問題研發了基于深度學習和大規模集群的智能人臉追逃系統(見圖 2)。
該系統利用百萬級的數據集對神經網絡進行訓練,大大提高誤報警率與漏檢率,能夠有效克服面部受遮擋、陽光等強光源照射等外界因素對圖片采集的影響。同時,該技術支持多機多路和一機多路處理數據。如果人臉數據庫較小,可將人臉識別服務器部署在同一個物理服務器上,從而實現一機多路。如果人臉數據庫較大,為了提高處理效率,可將人臉識別服務器部署在不同的物理服務器上,從而實現多機多路。

圖 2:智能人臉追逃系統技術原理
來源:方象知產研究院
窺一斑見全豹。各創業公司在安防落地場景中,通常針對不同的細分應用領域深耕,以解決傳統方法無法克服的問題為切入點,以數據集大、計算速度快、非線性適應性強等優勢,為計算機視覺打造一顆“智能大腦”,利用學習的方式,“教會”前后端設備“認得清”、“看得懂”。
其實在計算機視覺領域,除了人臉識別以外,行為識別也是廣為應用的技術之一。眾多科技公司在該技術分支上紛紛布局,方象知產研究院以后會就此單獨進行分析。
“巨頭”“萌新” 均重視布局存儲技術
大數據是人工智能的基礎。在數據就是黃金的今天,隨著監控網點急速擴展,視頻和卡口產生海量數據。如何安全存儲、高效查找,成為“視覺”安防未來發展不可或缺的支柱性技術之一。“大佬”和“萌新”們也都意識到這個問題,針對視頻存儲、編碼解碼進行了大量的研究工作(見表1)。
方象知產研究院列出了部分公司較為重要或具有代表性的專利。受篇幅所限,本文不做過多解讀。

表1:各公司與計算機視覺相關存儲技術專利
來源:方象知產研究院
上述存儲技術,主要針對大數據的存儲安全、升級安全、丟失恢復、容錯能力及讀取能力,結合分布式存儲、云平臺等方法,將各類信息分門別類存儲。不同公司雖然有不同的算法,但殊途同歸,都要解決數字存儲中高效與安全的問題。
方象技術觀察
布局特定場景及行為識別 搶占技術前沿
中國電子學會的公開數據顯示, 2017 年,中國人工智能核心產業規模已達到 56 億美元左右,預計 2020年將超過 220 億美元。在人工智能中,機器視覺占比最高,達到 37%。而在機器視覺市場中,安防行業占據七成份額。
目前,隨著安防建設升級,安防系統正從傳統的被動防御體系升級成為主動判斷和預警的智能防御。這種安防建設的升級,對智能安防也提出了更高要求。那么,從被動追逃到主動預警再到多場景應用,視覺安防技術會如何發展呢?
視覺安防離不開卷積神經網絡算法
在“計算機視覺+安防”領域,無論是智能視頻監控,還是人臉識別或行為識別,歸根結底,本質上都是對圖像進行處理。自2012年以來,在圖像處理問題上,卷積神經網絡因其在學習過程中無需手工選取特征,只需進行大量圖像數據訓練即可,在圖像分割、圖像檢測等方面取得巨大成果。目前,卷積神經網絡已經成為圖像識別領域的核心算法之一。
根據人類視覺系統[1]對信息分級處理的方式,人工構建的深度卷積神經網絡模型,可以仿照人類大腦,由低層到高層逐層迭代、抽象處理視覺信息。卷積網絡每層代表可視皮層的區域,每層上的節點代表可視皮層區域上的神經元,信息由左向右,逐層迭代傳播。通過對歷史數據逐步進行學習,將歷史數據的經驗存儲在網絡中,且伴隨著學習次數及經驗不斷提高,可指數型跨越式地提升計算機對圖像和視頻的認知能力。
。1]1981年諾貝爾醫學獎獲獎者David Hubel、Torsten Wiesel發現
特定場景和行為識別是重要技術靶點
深度依托于圖像處理的“安防”,最先得到了技術發展的紅利,傳統安防巨頭和創企紛紛致力于打造具有“智能大腦”的算法、設備和系統。
雖然深度卷積網絡的多重非線性使其具有很大的可塑性,但想要將這把利器恰到好處地用到安防場景,還需更多研究和實踐。
在深度網絡框架下,如何選擇內部結構,引入多少節點,選取哪些區域進行池化,往往需要大量經驗,還要反復進行調整。深度網絡“學習”的過程中,特寫場景中的目標特征識別尤為重要。這需要對系統有針對性地喂以訓練數據,比如遮擋人臉、行為識別中各種組合姿態等,通過深度學習,讓其能針對特寫場景中的目標進行識別。
方象知產研究院認為,在視覺安防領域,以卷積神經網絡突破細分場景應用,仍然是未來的發展方向:一方面能讓這種“類視覺人工智能系統”針對特定場景的目標進行識別,不僅知道什么時候“該看”,還要能“看得清”、“看得透”、“看得懂”,在安防領域發揮作用;另一方面,還要完善深度網絡的學習能力,突破算法局限,能針對不同特點的數據庫及需求,建立對應的識別能力,建立系統性的整體設計方案,以最低成本拓展應用場景。