#本文僅代表作者觀點,不代表IPRdaily立場#
原標題:美軍AI黑科技:黑暗中也能準確識別人臉,誰該為此感到緊張?
今天我們要聊的,是一件讓人第一反應很驚訝,“竟然還有這種操作?”但細細想來,又極為驚恐的事情。
這件事,就是美國軍方最近搞出來的一個大新聞。據(jù)《The Register》專欄記者凱蒂安娜·庫奇 4 月 17 日的一篇文章,美國陸軍研究實驗室正在研究一項技術,通過 AI 的深度學習技術加持,可以實現(xiàn)在黑暗中準確識別人臉。
想在夜里獲得視野并不是什么難事,如今 紅外技術的發(fā)展已經(jīng)非常成熟。拍攝野生動物、24 小時監(jiān)控等等都會用到這類技術。再加上熱成像,在夜里能夠判斷前面站著的是個人而不是一塊石頭,已經(jīng)不是什么問題。
但要在沒有打光的情況下實現(xiàn)人臉識別的精度,這確實有點驚為天人。那么,美國軍方究竟是準備怎么做的?
AI+ 熱成像:不僅看到你,還能看清你
首先我們需要知道的是,熱成像是通過非接觸探測紅外能量,將其轉(zhuǎn)換為電信號,進而在顯示器上生成圖像和溫度值的一種技術。熱成像裝置在軍事用途中非常常見。比如 Apache 直升機等飛機和裝甲運兵車等地面交通工具,都是配備了熱成像相機。這能夠保證其在低能見度的情況下也能探測到人員,比如大霧、夜晚。
這里存在著一個問題,熱成像裝置雖然相當于給在夜里活動的士兵們裝了一雙眼睛,但這雙眼睛其實是雙“近視眼”。它能夠顯現(xiàn)出對面出現(xiàn)的障礙物的基本輪廓,讓士兵們能夠判斷眼前是人還是石頭。但是,也就僅限于此。眼前的人是敵還是友,目前還是沒轍。
基于此,美國陸軍研究實驗室開發(fā)出了一套基于深度學習的 AI 識別系統(tǒng)。通過卷積神經(jīng)網(wǎng)絡的處理,熱圖像中人的眼睛、鼻子、嘴唇等的邊界被標記出來,從而可以確定出人臉的整體形狀。接下來,非線性回歸模型將這些特征映射到相應的面孔樣貌中。這種被稱為“多區(qū)域合成”的系統(tǒng)通過損失函數(shù)進行訓練,熱圖像和可見圖像之間的誤差會被最小化,從而可以構(gòu)建出一個相對準確的人臉圖像。
技術深入解讀
陸軍研究實驗室(Army Research Laboratory,ARL)的科學家 Benjamin S. Riggan,Nathaniel J. Short 和 Shuowen Hu 在最近發(fā)表的論文《Thermal to Visible Synthesis of Face Images using Multiple Regions》中詳細地介紹了軍方是如何開發(fā)在熱成像圖像中應用人臉識別技術的方法。
技術解讀部分由 AI 前線基于論文原文進行編譯。
從熱圖像中合成可見光圖像是異質(zhì)人臉識別中十分有前景的一項方法,可以利用已有的在可見光人臉數(shù)據(jù)庫上訓練的面部識別軟件,并且更有效地進行跨光譜匹配。論文提出了一個利用全局(面部整體)和局部區(qū)域(五官)來增強判別性的可見光人臉圖像合成方法。
??圖 1(a)熱紅外圖像與可見光圖像的跨模態(tài)匹配任務一直是異質(zhì)人臉識別的一項重要挑戰(zhàn)。而(b)(從熱紅外圖像中)合成的可見光圖像與可見光圖像則可能夠進行更有效的跨光譜匹配和判斷。
跨光譜識別主要有兩類方法:(1)直接跨光譜識別,(2)跨光譜合成識別。在這篇論文中,作者提出了一個跨光譜合成方法,增強了面部細節(jié),通過聯(lián)合優(yōu)化不同面部區(qū)域的目標函數(shù),使不同區(qū)域間的表示可以互補。這一多區(qū)域目標函數(shù)利用了全局和局部信息來合成能夠保持整體面部結(jié)構(gòu)和局部人臉細節(jié)的可見光圖像,從而提高跨光譜識別率。
使用多區(qū)域進行跨光譜識別
圖 2 算法框架圖
對于給定熱圖像,首先使用全卷積神經(jīng)網(wǎng)絡 g(x) 在全局區(qū)域(紅色)和局部基準區(qū)域(藍色,黃色和綠色)提取特征。然后使用特定區(qū)域的跨光譜映射從提取的熱圖像特征中估測對應的可見光圖像表示。最后,通過反向傳播每個區(qū)域提取特征和估測特征之間的誤差,對全局和局部區(qū)域進行梯度更新,然后合成可見光圖像。
論文主要考慮的是由于預訓練的興趣區(qū)域(ROI)導致的多重損失和正則化函數(shù)的影響。盡管 ROI 是任意的,論文考慮了對應局部判別特征(眼睛、鼻子和嘴巴)以及一個整體的區(qū)域的特征。
對于每個興趣區(qū)域,我們最小化以下目標函數(shù):
其中
L 代表損失函數(shù),R 是 alpha 范數(shù)和整體的變量懲罰項,g 代表了從輸入圖像到表示特征的映射,hi 代表對應區(qū)域 i 的跨光譜映射函數(shù)。在實現(xiàn)中,g 為全卷積神經(jīng)網(wǎng)絡,所以輸入圖像的尺寸不需要定義,hi 由 1x1 的卷積層組成。
合成的圖像通過求解如下優(yōu)化問題得到:
其中:
權(quán)重 w 平衡了全局結(jié)構(gòu)和局部細節(jié),wi 對應第 i 個區(qū)域。
實驗結(jié)果
?合成方法對比
?合成圖像與真實圖像(頂部)的對比:熱圖像 - 可見光合成效果(中間),極化圖像 - 可見光合成效果(底部)。
關鍵點檢測對比:真實圖像(頂部),熱圖像 - 可見光合成效果(中間),極化圖像 - 可見光合成效果(底部)。?
識別效果對比如下表:
可以看到,目前基于熱成像技術多區(qū)域合成的模型精度和常規(guī)成像精度都超過了 80%。
想要深入了解相關技術細節(jié),可查看論文原文:
https://arxiv.org/pdf/1803.07599.pdf
人臉識別數(shù)據(jù)庫才是關鍵!
但如何認識這張臉?畢竟僅僅得出一個人臉的圖像是沒有多大用處的,這項技術的最主要目的是判斷對面的人是誰。這就需要有一個數(shù)據(jù)庫用來對即時生成的人臉進行比對。
論文作者 Riggan 也強調(diào)說:
當使用熱成像照相機拍攝面部圖像時,主要的挑戰(zhàn)在于捕獲的熱圖像必須與目標人物的常規(guī)可見圖像的監(jiān)視圖像庫相匹配。
為了有效,需要將構(gòu)建出來的圖像與數(shù)據(jù)庫中的已知面部進行匹配,如監(jiān)獄罪犯、恐怖分子等,才能識別出目標。也就是說,使用這套系統(tǒng)拍攝出的面部圖像,必須要與數(shù)據(jù)庫中的圖像進行匹配。如果能早點應用,類似波士頓恐襲事件中對犯罪分子的抓捕,也許就不會那么大費周折。這樣說來,目前來說這套系統(tǒng)的最大優(yōu)勢可以是抓在逃犯。
聽起來這項技術的可應用前景還是很廣闊的。但還沒等美國軍方高興起來,有人就過來潑冷水了。
三月份在內(nèi)華達州舉行的 IEE 動機計算機視覺應用會議上,有研究者就認為,雖然熱成像技術多區(qū)域合成模型精度和常規(guī)成像精度都超過了 80%,看起來結(jié)果有一定的希望,但是由于熱成像精度的變化,該技術的人臉合成精度也會發(fā)生變化。因此,將這些算法和當前的熱成像技術的完美結(jié)合仍然是有不同程度的困難。
有意思的是,國內(nèi)的一些媒體在進行相關報道的時候,夸大其詞地轉(zhuǎn)譯了其具有“穿墻透視”的功能。我們需要知道的是,目前熱成像儀還無法突破墻體去探測人體發(fā)出的輻射,因此“穿墻”一說,噱頭的成分更大一點。
對于剛剛?cè)〉贸醪竭M展的這項技術而言,這樣的批評之言應該算是一種鞭策或者方向。但是現(xiàn)在問題又出來了。即便這項技術成熟了,但是數(shù)據(jù)庫里沒有那么多人臉來匹配,一切不都白瞎了?
目前來看,該算法在于現(xiàn)有數(shù)據(jù)庫進行結(jié)合的情況下,可以暫時解決一部分的問題。但是如果想要實現(xiàn)更精準而廣泛的應用,仍然有賴于人臉識別數(shù)據(jù)庫的擴建。比如一個名為 Terrogence 的商業(yè)機構(gòu)就聲稱自己擁有一個包含數(shù)以千計的恐怖分子面孔數(shù)據(jù)庫。而這個數(shù)據(jù)庫的客戶,就包括國安局、美國海軍情報機構(gòu)和政府機構(gòu)。
可以想見,未來這項技術在追捕在逃犯、打擊恐怖分子、夜間作戰(zhàn)方面還是有很大的用武之地的。
No entry:停在邊界線上
上面我們說到了驚訝,接下來,我們就要說驚恐了。
核武器的最大作用在于震懾,但當其巨大的摧毀力被用來殺人的時候,愛因斯坦都為此而感到后悔。這也就說明,任何一項技術,包括我們今天所介紹的 AI+ 熱成像極大的降低了人臉識別的適用門檻,無論其初衷如何,如果會存在對公眾產(chǎn)生傷害的可能(尤其當這項技術被軍方掌握時),那就必須要有人來監(jiān)管。
試想一下,你和朋友在夜里漫步街頭,享受著一天的疲倦之后的片刻輕松,而路口的紅外攝像頭則正在默不作聲地將你們兩個的頭像進行掃描分析,同時比對著不知何時被搜集的數(shù)據(jù)庫中的你的頭像,然后作出判斷:安全人員。
雖然它不會影響你的正常的生活,但會給人一種深深的擔憂:我們的生活時時刻刻處在無數(shù)雙眼睛的監(jiān)控之下。也許我們并未感受到受到了某種傷害。但是這很可能意味著在這個城市里,我們已經(jīng)失去了未被授權(quán)的隱私。在這個個人隱私可以作為商品交換巨額利潤的時代,每個人都并不希望自己渾然不覺地成為商品。也正是因為如此,對 Facebook 泄露用戶的數(shù)據(jù),人們才會感到如此的憤怒。
所以,不管美國軍方的這項技術的初衷如何,我們都希望其目的只是用來對付社會的陰暗分子,民眾也必然希望對這項技術有嚴格的監(jiān)管。同時,對政府和軍方的使用要進行限制,并確保技術不會外流,以免被別有用心的人利用。畢竟,每個人都應對自己的隱私享有自主的權(quán)力,而不能成為暴露在鏡頭下的楚門。
來源:新科技前沿
編輯:IPRdaily趙珍 校對:IPRdaily縱橫君
推薦閱讀
2018中國·海淀高價值專利培育大賽正式開啟?。▓竺斍椋?/span>
“投稿”請投郵箱“iprdaily@163.com”
「關于IPRdaily」
IPRdaily成立于2014年,是全球影響力的知識產(chǎn)權(quán)媒體+產(chǎn)業(yè)服務平臺,致力于連接全球知識產(chǎn)權(quán)人,用戶匯聚了中國、美國、德國、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司、成長型科技企業(yè)IP高管、研發(fā)人員、法務、政府機構(gòu)、律所、事務所、科研院校等全球近50多萬產(chǎn)業(yè)用戶(國內(nèi)25萬+海外30萬);同時擁有近百萬條高質(zhì)量的技術資源+專利資源,通過媒體構(gòu)建全球知識產(chǎn)權(quán)資產(chǎn)信息第一入口。2016年獲啟賦資本領投和天使匯跟投的Pre-A輪融資。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自新科技前沿并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉(zhuǎn)載,請注明出處:“http://globalwellnesspartner.com/”
文章不錯,犒勞下辛苦的作者吧