返回
頂部
我們已發(fā)送驗(yàn)證鏈接到您的郵箱,請(qǐng)查收并驗(yàn)證
沒(méi)收到驗(yàn)證郵件?請(qǐng)確認(rèn)郵箱是否正確或 重新發(fā)送郵件
確定
產(chǎn)業(yè)行業(yè)法院投稿訴訟招聘TOP100政策國(guó)際視野人物許可交易深度專題活動(dòng)灣區(qū)IP動(dòng)態(tài)職場(chǎng)商標(biāo)Oversea晨報(bào)董圖公司審查員說(shuō)法官說(shuō)首席知識(shí)產(chǎn)權(quán)官G40領(lǐng)袖機(jī)構(gòu)企業(yè)專利律所

是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

深度
灣區(qū)知識(shí)產(chǎn)權(quán)4年前
是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

#本文僅代表作者觀點(diǎn),不代表IPRdaily立場(chǎng),未經(jīng)作者許可,禁止轉(zhuǎn)載#


來(lái)源:IPRdaily中文網(wǎng)(iprdaily.cn)

作者:北京專獵前沿技術(shù)有限公司

原標(biāo)題:是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述


從上世紀(jì)60年代算起,計(jì)算機(jī)視覺(jué)的歷史也不過(guò)半個(gè)多世紀(jì),跟整個(gè)人類歷史相比,眨眼之瞬而已。然而,即使在這半個(gè)多世紀(jì)的時(shí)間里,計(jì)算機(jī)視覺(jué)已經(jīng)從最開始簡(jiǎn)單地處理數(shù)字圖像發(fā)展到現(xiàn)在可以在多種情景下準(zhǔn)確地進(jìn)行人臉識(shí)別,目標(biāo)跟蹤等。隨著算法的更迭、算力的提升、數(shù)據(jù)的爆發(fā)以及未來(lái)5G帶來(lái)的高速網(wǎng)絡(luò),計(jì)算機(jī)視覺(jué)的發(fā)展和應(yīng)用更有著充滿想象的巨大空間。


何為計(jì)算機(jī)視覺(jué)


從2016年AlphaGo以4:1戰(zhàn)勝世界圍棋冠軍李世石到2017年人工智能被正式寫入國(guó)家“十三五”規(guī)劃綱要,再到2021年“十四五”規(guī)劃將人工智能列為前沿科技領(lǐng)域的“最高優(yōu)先級(jí)”,人工智能已在風(fēng)口迎風(fēng)飛翔多年,成為當(dāng)下最熱門的科學(xué)技術(shù)。作為人工智能的三大核心技術(shù)之一(另外兩項(xiàng)為自然語(yǔ)言處理和語(yǔ)音識(shí)別),計(jì)算機(jī)視覺(jué)更是迎來(lái)了蓬勃發(fā)展。


日常生活中,我們經(jīng)常使用的人臉解鎖、刷臉支付、人臉身份驗(yàn)證、智能美顏、拍攝背景虛化等,其背后都是計(jì)算機(jī)視覺(jué)技術(shù)在支撐。除此之外,公共安防、無(wú)人駕駛、醫(yī)療診斷、文化旅行、教育、農(nóng)業(yè)等領(lǐng)域,都有計(jì)算機(jī)視覺(jué)的身影,可以說(shuō)計(jì)算機(jī)視覺(jué)在商業(yè)化應(yīng)用上已百花齊放,滲透到生活的方方面面。根據(jù)Tractica預(yù)測(cè),到2025年,全球計(jì)算機(jī)視覺(jué)市場(chǎng)規(guī)模(包括軟件、硬件和服務(wù)收入)將從2016年的11億美元增長(zhǎng)到262億美元。


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 1 2016-2025年計(jì)算機(jī)視覺(jué)市場(chǎng)規(guī)模_Tractica預(yù)測(cè)數(shù)據(jù)

數(shù)據(jù)來(lái)源:Tractica


何為計(jì)算機(jī)視覺(jué)?計(jì)算機(jī)視覺(jué)是以圖像(視頻)為輸入,以對(duì)環(huán)境的表達(dá)(representation)和理解為目標(biāo),研究圖像信息組織、物體和場(chǎng)景識(shí)別、進(jìn)而對(duì)事件給予解釋的學(xué)科。計(jì)算機(jī)視覺(jué)的研究?jī)?nèi)容,大體可以分為物體視覺(jué)(object vision)和空間視覺(jué)(spatial vision)兩大部分。物體視覺(jué)在于對(duì)物體進(jìn)行精細(xì)分類和鑒別,而空間視覺(jué)在于確定物體的位置和形狀,為“動(dòng)作(action)”服務(wù)。從本質(zhì)上講,計(jì)算機(jī)視覺(jué)就是研究視覺(jué)感知問(wèn)題,“賦予機(jī)器自然視覺(jué)能力”。


透過(guò)專利看計(jì)算機(jī)視覺(jué)的發(fā)展史


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 2 全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)趨勢(shì)


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 3 全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)主要受理局分布


注:由于發(fā)明專利申請(qǐng)的公開相對(duì)于申請(qǐng)日而言有滯后期,一般為18個(gè)月,因而2019、2020年的專利申請(qǐng)尚有部分未公開,與實(shí)際情況相比,其數(shù)據(jù)有一定程度的偏低。


同其他科學(xué)技術(shù)一樣,計(jì)算機(jī)視覺(jué)的發(fā)展也是由最初的萌芽期一路走到了如今的井噴發(fā)展期(圖2)。


技術(shù)萌芽期


20世紀(jì)60年代,尤其是1965年以后,是計(jì)算機(jī)視覺(jué)的技術(shù)萌芽期。1966年,人工智能學(xué)家Minsky在給學(xué)生布置的作業(yè)中,要求學(xué)生通過(guò)編寫一個(gè)程序讓計(jì)算機(jī)告訴我們它通過(guò)攝像頭看到了什么,這被認(rèn)為是計(jì)算機(jī)視覺(jué)最早的任務(wù)描述[1]。從此,計(jì)算機(jī)視覺(jué)的研究序幕拉開,并將迎來(lái)屬于它自己的跌宕起伏波瀾壯闊的歷史篇章。


1965年-1968年,全球計(jì)算機(jī)視覺(jué)相關(guān)專利申請(qǐng)總數(shù)在2000篇以下,并以每年百篇左右的數(shù)量遞增著。這一時(shí)期的研究集中在美歐兩地(圖3),美國(guó)的IBM一枝獨(dú)秀,是最主要的研究企業(yè);其次為德國(guó)的西門子(圖4)。


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 4 1965-1968年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)Top15


慢速增長(zhǎng)期


20世紀(jì)60年代末至90年代,隨著現(xiàn)代電子計(jì)算機(jī)的出現(xiàn)以及對(duì)計(jì)算機(jī)視覺(jué)研究的深入,人們開始嘗試不同的算法。計(jì)算機(jī)視覺(jué)研究進(jìn)入了相對(duì)慢速但“百家爭(zhēng)鳴”般的增長(zhǎng)期,全球?qū)@暾?qǐng)數(shù)量以年均10%左右的速度增長(zhǎng)。


雖然在七十年代中期美國(guó)的MIT人工智能實(shí)驗(yàn)室正式開設(shè)計(jì)算機(jī)視覺(jué)課程,在1982年英國(guó)的David Marr發(fā)表了《視覺(jué)》一書,標(biāo)志著計(jì)算機(jī)視覺(jué)成為一門獨(dú)立學(xué)科,但是計(jì)算機(jī)視覺(jué)的研究已經(jīng)西風(fēng)東漸,日本成為全球最主要、最大的研究地。從1970到1990年左右,全球50%以上的專利申請(qǐng)都出自日本,而同時(shí)期美國(guó)的專利申請(qǐng)數(shù)量占全球?qū)@暾?qǐng)總數(shù)的10%不到,而且無(wú)論是專利申請(qǐng)數(shù)量還是專利申請(qǐng)?jiān)鲩L(zhǎng)速度,日本都遠(yuǎn)超歐美(圖3)。即使1990年以后,美國(guó)的研究開始發(fā)力,歷年專利申請(qǐng)數(shù)量呈線性增加,歐洲和韓國(guó)地區(qū)的專利申請(qǐng)數(shù)量也在逐年遞增,但是日本的專利申請(qǐng)數(shù)量依然占有絕對(duì)優(yōu)勢(shì)。這一時(shí)期,在全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)排名前15的企業(yè)中,除美國(guó)的IBM(第7)和荷蘭的皇家飛利浦(第14)外,其余全是日本企業(yè)(圖5),佳能、東芝、日立、富士通、日本電氣等響當(dāng)當(dāng)?shù)钠髽I(yè)高居榜單前5。


另外,現(xiàn)代CNN網(wǎng)絡(luò)中卷積層+池化層的最初范例及靈驗(yàn)來(lái)源,世界上第一個(gè)神經(jīng)網(wǎng)絡(luò)——Neocognitron[2],也是由日本計(jì)算科學(xué)家Kunihiko Fukushima在1980年提出的??梢哉f(shuō),這是屬于日本的高光時(shí)刻。


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 5 1969-1999全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)top15


平穩(wěn)過(guò)渡期


21世紀(jì)前10年,得益于計(jì)算機(jī)算力的飛躍式提升,以及互聯(lián)網(wǎng)和社交媒體的發(fā)展,全球數(shù)據(jù)達(dá)到ZB級(jí)別,計(jì)算機(jī)視覺(jué)的算法研究從“百家爭(zhēng)鳴”逐漸聚焦到機(jī)器學(xué)習(xí)。計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)經(jīng)過(guò)世紀(jì)初的猛增后,進(jìn)入一個(gè)平穩(wěn)過(guò)渡期,歷年的專利申請(qǐng)數(shù)量基本沒(méi)有增加,徘徊在35000件左右。雖然這一時(shí)期全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)排名前15中,日本企業(yè)依然占有11席(圖6),但日本專利申請(qǐng)的歷年數(shù)量呈下降趨勢(shì),計(jì)算機(jī)視覺(jué)的研發(fā)由集中在日本漸漸地轉(zhuǎn)向以美歐日韓為主的多地發(fā)展(圖3)。荷蘭的皇家飛利浦在醫(yī)療健康領(lǐng)域的重點(diǎn)突破,美國(guó)的微軟在中國(guó)設(shè)立微軟亞洲研究院專門研究計(jì)算機(jī)視覺(jué),以及韓國(guó)的三星經(jīng)過(guò)20世紀(jì)90年代的研究積累,使得他們躋身進(jìn)2000-2009年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)排名前10(圖6)。


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 6 2000-2009年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)Top15


同一時(shí)期,大洋彼岸的中國(guó),雖然專利申請(qǐng)數(shù)量在逐年增加,但其專利申請(qǐng)基本來(lái)自諸如索尼、皇家飛利浦、三星、微軟等海外巨頭在中國(guó)的布局,中國(guó)計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)前15中,還沒(méi)有中國(guó)企業(yè)的名字(圖7)。中國(guó)企業(yè)的計(jì)算機(jī)視覺(jué)研究還處于萌芽狀態(tài)。


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 7 2000-2009年中國(guó)計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)top15


這段時(shí)間,具有標(biāo)志性的事件為:


2006年,Geoffrey Hinton教授提出了深度學(xué)習(xí)的概念,并通過(guò)逐層訓(xùn)練的方法解決了深度神經(jīng)網(wǎng)絡(luò)難以訓(xùn)練的問(wèn)題[2]。


2009年,李飛飛教授等在CVPR2009上發(fā)表了一篇名為《ImageNet: A Large-Scale Hierarchical Image Database》的論文,發(fā)布了ImageNet數(shù)據(jù)集,這是為了檢測(cè)計(jì)算機(jī)視覺(jué)能否識(shí)別自然萬(wàn)物,回歸機(jī)器學(xué)習(xí),克服過(guò)擬合問(wèn)題,經(jīng)過(guò)三年多籌劃組建完成的一個(gè)大的數(shù)據(jù)集。ImageNet是計(jì)算機(jī)視覺(jué)發(fā)展的重要推動(dòng)者,和深度學(xué)習(xí)熱潮的關(guān)鍵推動(dòng)者,將目標(biāo)檢測(cè)算法推向了新的高度[3]。


快速增長(zhǎng)期


2010-2015年,計(jì)算機(jī)的算力遵循著“摩爾定律”穩(wěn)步提升,互聯(lián)網(wǎng)及社交媒體的進(jìn)一步普及帶來(lái)爆發(fā)式增長(zhǎng)的大數(shù)據(jù),深度學(xué)習(xí)算法開始流行,成為計(jì)算機(jī)視覺(jué)領(lǐng)域最主要的算法。計(jì)算機(jī)視覺(jué)也進(jìn)入了一個(gè)快速發(fā)展期,全球?qū)@暾?qǐng)數(shù)量以年均17%左右的速度增長(zhǎng)。其中,美國(guó)專利申請(qǐng)數(shù)量的年均增長(zhǎng)率約為23%,美國(guó)正式取代日本,成為計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)量最大的國(guó)家。在2010-2015年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)前10名中,美國(guó)企業(yè)占5席,分別為微軟(第2),谷歌(第5),高通(第6),IBM(第7)和Intel(第9)。中國(guó)專利申請(qǐng)數(shù)量更是以年均33%左右的速度增長(zhǎng),中國(guó)企業(yè)的計(jì)算機(jī)視覺(jué)研究也從小芽長(zhǎng)成了一棵小苗。2010-2015年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)前15名榜單中,也首次出現(xiàn)了中國(guó)企業(yè)的身影:聯(lián)想,第15(圖8)。此外,韓國(guó)的三星依靠其龐大的家電和手機(jī)產(chǎn)品整合計(jì)算機(jī)視覺(jué)技術(shù),高居榜首位置;日本的索尼、佳能、富士通、日本電氣、理光等5家企業(yè)也榜上有名。


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 8 2010-2015年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)Top15


這一時(shí)期,具有里程碑式的標(biāo)志事件為[3]:


2012年,Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 創(chuàng)造了一個(gè)“大型的深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)”,也即現(xiàn)在眾所周知的AlexNet,將圖像識(shí)別錯(cuò)誤率降低了10%,贏得了當(dāng)年的 ILSVRC競(jìng)賽(是機(jī)器視覺(jué)領(lǐng)域最受追捧也是最具權(quán)威的學(xué)術(shù)競(jìng)賽之一,代表了圖像領(lǐng)域的最高水平)這是史上第一次有模型在 ImageNet 數(shù)據(jù)集表現(xiàn)如此出色。自那時(shí)起,CNN成了家喻戶曉的名字。


2014年,蒙特利爾大學(xué)提出生成對(duì)抗網(wǎng)絡(luò)(GAN):擁有兩個(gè)相互競(jìng)爭(zhēng)的神經(jīng)網(wǎng)絡(luò)可以使機(jī)器學(xué)習(xí)得更快。一個(gè)網(wǎng)絡(luò)嘗試模仿真實(shí)數(shù)據(jù)生成假的數(shù)據(jù),而另一個(gè)網(wǎng)絡(luò)則試圖將假數(shù)據(jù)區(qū)分出來(lái)。


井噴發(fā)展期


2016年及以后,計(jì)算機(jī)視覺(jué)技術(shù)逐漸賦能各行業(yè),應(yīng)用場(chǎng)景紛紛落地。廣闊的商業(yè)化應(yīng)用為計(jì)算機(jī)視覺(jué)的發(fā)展注入強(qiáng)勁動(dòng)力,至此,計(jì)算機(jī)視覺(jué)領(lǐng)域的研究進(jìn)入井噴狀態(tài),如春風(fēng)拂地萬(wàn)物在不經(jīng)意間復(fù)蘇一般,全球的研發(fā)格局也在悄然地發(fā)生變化。


2016-2018年間,全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)年均增長(zhǎng)率超過(guò)20%(2019及2020年的因?qū)@暾?qǐng)到公開的時(shí)間遲滯原因,在此未統(tǒng)計(jì)),中美日韓歐成為主要的研發(fā)陣地。其中,中國(guó)專利申請(qǐng)的年均增長(zhǎng)率超過(guò)40%,貢獻(xiàn)了全球最主要的專利申請(qǐng)?jiān)鲩L(zhǎng),同時(shí),中國(guó)也超越美國(guó),成為新一屆的專利申請(qǐng)最大的國(guó)家。2016-2020年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)前15名中,美國(guó)企業(yè)5家、日本企業(yè)3家、韓國(guó)企業(yè)1家,而中國(guó)企業(yè)有6家,開始占據(jù)明顯地位。這6家中國(guó)企業(yè)分別是騰訊(第2),OPPO(第5),平安科技(第11),華為(第12),阿里巴巴(第14)和商湯科技(第15)。騰訊和OPPO更是超過(guò)微軟、佳能、索尼等老牌企業(yè),躋身進(jìn)前5(圖9)。


作為國(guó)內(nèi)的傳統(tǒng)互聯(lián)網(wǎng)巨頭,一直以推動(dòng)科技創(chuàng)新為愿景的騰訊充分集成利用自身的數(shù)據(jù)資源、人才資源和軟硬件技術(shù)基礎(chǔ),打造出風(fēng)靡全國(guó)的人工智能系統(tǒng)和平臺(tái)。旗下的騰訊優(yōu)圖實(shí)驗(yàn)室從2012年開始專注計(jì)算機(jī)視覺(jué)技術(shù)研發(fā),其在2017年研發(fā)出的“優(yōu)圖祖母模型”以及“目標(biāo)關(guān)聯(lián)算法”在多個(gè)比賽中排名第一甚至刷新世界紀(jì)錄;在2020年輸出超過(guò)50篇優(yōu)秀論文,入選多個(gè)行業(yè)頂級(jí)學(xué)術(shù)會(huì)議,內(nèi)容涵蓋目標(biāo)跟蹤、行人重識(shí)別、視頻識(shí)別等多個(gè)熱門及前沿領(lǐng)域。


以拍照手機(jī)出名的OPPO已在圖像處理上深耕多年,2012年OPPO首次在手機(jī)自拍上實(shí)現(xiàn)了美顏拍攝功能,開創(chuàng)了“手機(jī)自拍美顏”時(shí)代;2018年,OPPO研究院在深圳成立,計(jì)算機(jī)視覺(jué)是其重要的研究方向之一;2020年的全球計(jì)算機(jī)視覺(jué)頂級(jí)會(huì)議CVPR (Conference on Computer Vision and Pattern Recognition) 上,OPPO共獲兩項(xiàng)第一,兩項(xiàng)第三。


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 9 2016-2020年全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)Top15


總體來(lái)說(shuō),這一時(shí)期的美國(guó)引領(lǐng)著主流技術(shù)發(fā)展方向;日本的高光時(shí)刻已經(jīng)一去不復(fù)返,韓國(guó)靠著三星撐起半邊天,而中國(guó)的計(jì)算機(jī)視覺(jué)研究從小苗開始生長(zhǎng)出更多的枝丫。


最新的計(jì)算機(jī)視覺(jué)研發(fā)格局


分析2020年公開的計(jì)算機(jī)視覺(jué)領(lǐng)域的專利申請(qǐng)情況,得以管中窺豹,了解最新的計(jì)算機(jī)視覺(jué)研發(fā)格局。


國(guó)際格局


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 10 2020年公開的全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)Top15


2020年公開的全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)中,中美日韓的企業(yè)占據(jù)著專利申請(qǐng)數(shù)量的前15(圖10),其中美國(guó)企業(yè)5家,日本企業(yè)2家,韓國(guó)企業(yè)2家,中國(guó)企業(yè)6家。得益于國(guó)內(nèi)新基建的建設(shè)以及豐富的計(jì)算機(jī)視覺(jué)應(yīng)用場(chǎng)景,中國(guó)在企業(yè)數(shù)量和專利申請(qǐng)數(shù)量上大有后來(lái)追上之勢(shì)。


前10名的申請(qǐng)人中:


韓國(guó)的三星因其廣泛的產(chǎn)品線使得計(jì)算機(jī)視覺(jué)擁有廣闊的落地場(chǎng)景,其專利申請(qǐng)數(shù)量穩(wěn)列第一位。美國(guó)的IBM、微軟、谷歌、蘋果分別位于第3、4、5和第9位。IBM一直注重人工智能方面的基礎(chǔ)性研究,從20世紀(jì)60年代開始就已經(jīng)是計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)前15榜單中的常客;微軟和谷歌是目前人工智能技術(shù)的領(lǐng)軍企業(yè),他們掌握和引領(lǐng)著主流技術(shù)方向,目前全球的人工智能開發(fā)方案中有相當(dāng)大的比例是基于微軟、谷歌等發(fā)布的基礎(chǔ)框架型構(gòu)架而進(jìn)行的;蘋果在2010年以后收購(gòu)了十幾家人工智能公司,將人工智能服務(wù)于自身的系列產(chǎn)品,提高現(xiàn)有產(chǎn)品體驗(yàn)。日本的索尼與佳能分別位于第6和第7位。他們是傳統(tǒng)的光學(xué)產(chǎn)品大廠,計(jì)算機(jī)圖像處理方面有深厚的研發(fā)底蘊(yùn),其研發(fā)實(shí)力在上世紀(jì)七八十年代已經(jīng)顯現(xiàn)。


中國(guó)的企業(yè)除前面提到的騰訊、OPPO分別位列第2和第8外,成立于2014年的商湯科技以迅雷之勢(shì)超過(guò)美國(guó)的Intel、日本的富士通和國(guó)內(nèi)的華為、平安科技,進(jìn)入前10名,在一眾國(guó)內(nèi)外聲名顯赫的科技巨頭企業(yè)中格外顯眼。而商湯科技的成績(jī)不止于此:2018年,商湯科技被中國(guó)科技部指定為首個(gè)“智能視覺(jué)”國(guó)家新一代人工智能開放創(chuàng)新平臺(tái);2019年的ICCV (the International Conference on Computer Vision) 上,商湯科技及其聯(lián)合實(shí)驗(yàn)室以入選57篇論文的成績(jī)備受矚目;2020年的CVPR上,商湯科技的入選論文數(shù)超過(guò)微軟、Facebook等科技巨頭,并拿下了CVPR2020 ActivityNet 時(shí)空動(dòng)作定位賽道、動(dòng)作分類賽道,以及 CVPR 2020 NTIRE 競(jìng)賽等3項(xiàng)世界冠軍。自成立以來(lái),商湯科技已在各種重要賽事中,斬獲了60多個(gè)世界第一。


國(guó)內(nèi)格局


圖10中上榜的6家中國(guó)企業(yè),在一定程度上體現(xiàn)出了我國(guó)計(jì)算機(jī)視覺(jué)的研究格局:這6家企業(yè)中,有擁有數(shù)據(jù)資源、人才資源和軟硬件技術(shù)基礎(chǔ)優(yōu)勢(shì)的互聯(lián)網(wǎng)巨頭BAT(百度,阿里巴巴,騰訊),有擁有龐大智能應(yīng)用終端承載計(jì)算機(jī)視覺(jué)技術(shù)的OPPO、華為(根據(jù)國(guó)際知名市場(chǎng)分析機(jī)構(gòu)Counterpoint的數(shù)據(jù)顯示:2021年1月OPPO、華為為國(guó)內(nèi)前二智能手機(jī)品牌,分別占據(jù)國(guó)內(nèi)智能手機(jī)份額的21%和20%),以及有專注于計(jì)算機(jī)視覺(jué)基礎(chǔ)研究與應(yīng)用的商湯科技。這些企業(yè),代表了國(guó)內(nèi)計(jì)算機(jī)視覺(jué)的最新、最強(qiáng)的研究實(shí)力。


另一方面,企業(yè)的海外專利申請(qǐng)是為其業(yè)務(wù)拓展保駕護(hù)航,海外布局策略和其業(yè)務(wù)拓展策略是一致的。2020年公開的專利申請(qǐng)中,中國(guó)企業(yè)在中國(guó)大陸之外的專利申請(qǐng)量排名前5名分別為騰訊、華為、阿里巴巴、OPPO、商湯科技(圖11)。騰訊和阿里巴巴在中國(guó)大陸之外的布局策略比較一致,中國(guó)香港為其主要布局地,其次為專利五局中的美日韓歐。華為在中國(guó)大陸之外布局策略主要在專利五局中的美日韓歐,美歐為主場(chǎng)。OPPO與商湯科技在中國(guó)大陸之外布局策略類似,除了美日韓歐外,在中國(guó)香港、中國(guó)臺(tái)灣等地也有較多的布局,但相較起來(lái),商湯科技在中國(guó)大陸之外布局更加均衡,在一些未來(lái)新興市場(chǎng),比如新加坡、印度,商湯科技也提前進(jìn)行了布局,擁有較多的專利申請(qǐng)。


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 11 2020年公開的中國(guó)企業(yè)在中國(guó)大陸之外計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)排名Top10


基礎(chǔ)算法研究格局


計(jì)算機(jī)視覺(jué)的發(fā)展有四大要素:算法、算力、數(shù)據(jù)和場(chǎng)景。萬(wàn)丈高樓平地起,地基是基礎(chǔ)。而基礎(chǔ)算法就是計(jì)算機(jī)視覺(jué)這座高樓的地基。IPC分類號(hào)中,G06N對(duì)應(yīng)的分類號(hào)包括了目前主流的計(jì)算機(jī)視覺(jué)算法——深度學(xué)習(xí)所涉及的主要技術(shù),即:G06N3/02(采用神經(jīng)網(wǎng)絡(luò)模型),G06N3/04(體系結(jié)構(gòu),例如,互連拓?fù)洌珿06N3/08(學(xué)習(xí)方法),G06N20/00(機(jī)器學(xué)習(xí))。2020年公開的全球計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@暾?qǐng)中,篩選出G06N下的專利申請(qǐng),得到全球?qū)@暾?qǐng)數(shù)量排名前10的企業(yè)(圖12):除IBM、三星、谷歌、微軟、Intel5家老牌企業(yè)外,其余5家均為中國(guó)企業(yè),騰訊(第2)、百度網(wǎng)訊(第5)、平安科技(第7)、商湯科技(第8)、支付寶(第9)赫然在列,彰顯了中國(guó)計(jì)算機(jī)視覺(jué)算法研究的實(shí)力。與其他業(yè)務(wù)方向廣泛的企業(yè)不同,成立只有6年歷史的商湯科技專注于計(jì)算機(jī)視覺(jué)領(lǐng)域的基礎(chǔ)研究和市場(chǎng)應(yīng)用,在計(jì)算機(jī)視覺(jué)算法研究方面持續(xù)取得不菲成績(jī),其于2014年發(fā)表的DeepID系列人臉識(shí)別算法,在誕生之初就超過(guò)了Facebook同期發(fā)表的Deepface算法, 將人臉識(shí)別準(zhǔn)確度提高到98.52%,在全球首次超過(guò)人眼識(shí)別率,突破工業(yè)化應(yīng)用的紅線。其最新的DeepID-3算法已達(dá)到了99.53%的人臉識(shí)別準(zhǔn)確率。在國(guó)際計(jì)算機(jī)視覺(jué)領(lǐng)域研究的激烈競(jìng)爭(zhēng)中,商湯科技可以與谷歌、微軟等國(guó)際大企業(yè)比肩,為中國(guó)企業(yè)豎起一面旗幟。


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 12 2020年公開的全球深度學(xué)習(xí)算法專利申請(qǐng)排名Top10


總結(jié)


從上世紀(jì)60年代算起,計(jì)算機(jī)視覺(jué)的歷史也不過(guò)半個(gè)多世紀(jì),跟整個(gè)人類歷史相比,眨眼之瞬而已。然而,即使在這半個(gè)多世紀(jì)的時(shí)間里,計(jì)算機(jī)視覺(jué)已經(jīng)從最開始簡(jiǎn)單地處理數(shù)字圖像發(fā)展到現(xiàn)在可以在多種情景下準(zhǔn)確地進(jìn)行人臉識(shí)別,目標(biāo)跟蹤等。


這個(gè)過(guò)程中,隨著時(shí)間的推移,IBM,西門子,東芝,索尼,佳能,微軟,谷歌,騰訊,OPPO, 商湯科技等企業(yè)的身影依次出現(xiàn)在我們眼前,是他們讓機(jī)器“睜開眼睛看見(jiàn)世界”,逐漸地賦予機(jī)器自然視覺(jué)的能力。


2017年,國(guó)務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》中明確指出新一代人工智能發(fā)展分三步走的戰(zhàn)略目標(biāo),到2030年使中國(guó)人工智能理論、技術(shù)與應(yīng)用總體達(dá)到世界領(lǐng)先水平,成為世界主要人工智能創(chuàng)新中心。隨著算法的更迭、算力的提升、數(shù)據(jù)的爆發(fā)以及未來(lái)5G帶來(lái)的高速網(wǎng)絡(luò),計(jì)算機(jī)視覺(jué)的發(fā)展和應(yīng)用更是有充滿想象的巨大空間。我們期待在賦予機(jī)器自然視覺(jué)能力的這條路上有更多中國(guó)企業(yè)的身影。


注1:除圖1外,以上各圖的數(shù)據(jù)均來(lái)自智慧芽。

注2:本文關(guān)注的是計(jì)算機(jī)視覺(jué)領(lǐng)域企業(yè)的研究情況,各圖的排名中未考慮高校。


參考資料
[1] 十分鐘讀完人工智能的三生三世

https://baijiahao.baidu.com/s?id=1601076075337670392&wfr=spider&for=pc 

[2] 計(jì)算機(jī)視覺(jué)發(fā)展史 https://zhuanlan.zhihu.com/p/142927311

[3] 計(jì)算機(jī)視覺(jué)簡(jiǎn)述

https://blog.csdn.net/lanmengyiyu/article/details/109648345


來(lái)源:IPRdaily中文網(wǎng)(iprdaily.cn)

作者:北京專獵前沿技術(shù)有限公司

編輯:IPRdaily王穎          校對(duì):IPRdaily縱橫君



注:原文鏈接:是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述(點(diǎn)擊標(biāo)題查看原文)


如有想看文章主題內(nèi)容,歡迎留言評(píng)論~


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述


是誰(shuí)在賦予機(jī)器自然視覺(jué)的能力?——計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

「關(guān)于IPRdaily」


IPRdaily是具有全球影響力的知識(shí)產(chǎn)權(quán)媒體,致力于連接全球知識(shí)產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來(lái)自于中國(guó)、美國(guó)、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國(guó)等15個(gè)國(guó)家和地區(qū)的高科技公司及成長(zhǎng)型科技企業(yè)的管理者及科技研發(fā)或知識(shí)產(chǎn)權(quán)負(fù)責(zé)人,還有來(lái)自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬(wàn)用戶(國(guó)內(nèi)70余萬(wàn)+海外近30萬(wàn)),2019年全年全網(wǎng)頁(yè)面瀏覽量已經(jīng)突破過(guò)億次傳播。


(英文官網(wǎng):iprdaily.com  中文官網(wǎng):iprdaily.cn) 


本文來(lái)IPRdaily中文網(wǎng)(iprdaily.cn)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://globalwellnesspartner.com/

灣區(qū)知識(shí)產(chǎn)權(quán)投稿作者
共發(fā)表文章4354
最近文章
關(guān)鍵詞
首席知識(shí)產(chǎn)權(quán)官 世界知識(shí)產(chǎn)權(quán)日 美國(guó)專利訴訟管理策略 大數(shù)據(jù) 軟件著作權(quán)登記 專利商標(biāo) 商標(biāo)注冊(cè)人 人工智能 版權(quán)登記代理 如何快速獲得美國(guó)專利授權(quán)? 材料科學(xué) 申請(qǐng)注冊(cè)商標(biāo) 軟件著作權(quán) 虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí) 專利侵權(quán)糾紛行政處理 專利預(yù)警 知識(shí)產(chǎn)權(quán) 全球視野 中國(guó)商標(biāo) 版權(quán)保護(hù)中心 智能硬件 新材料 新一代信息技術(shù)產(chǎn)業(yè) 躲過(guò)商標(biāo)轉(zhuǎn)讓的陷阱 航空航天裝備 樂(lè)天 產(chǎn)業(yè) 海洋工程裝備及高技術(shù)船舶 著作權(quán) 電子版權(quán) 醫(yī)藥及高性能醫(yī)療器械 中國(guó)專利年報(bào) 游戲動(dòng)漫 條例 國(guó)際專利 商標(biāo) 實(shí)用新型專利 專利費(fèi)用 專利管理 出版管理?xiàng)l例 版權(quán)商標(biāo) 知識(shí)產(chǎn)權(quán)侵權(quán) 商標(biāo)審查協(xié)作中心 法律和政策 企業(yè)商標(biāo)布局 新商標(biāo)審查「不規(guī)范漢字」審理標(biāo)準(zhǔn) 專利機(jī)構(gòu)排名 商標(biāo)分類 專利檢索 申請(qǐng)商標(biāo)注冊(cè) 法規(guī) 行業(yè) 法律常識(shí) 設(shè)計(jì)專利 2016知識(shí)產(chǎn)權(quán)行業(yè)分析 發(fā)明專利申請(qǐng) 國(guó)家商標(biāo)總局 電影版權(quán) 專利申請(qǐng) 香港知識(shí)產(chǎn)權(quán) 國(guó)防知識(shí)產(chǎn)權(quán) 國(guó)際版權(quán)交易 十件 版權(quán) 顧問(wèn) 版權(quán)登記 發(fā)明專利 亞洲知識(shí)產(chǎn)權(quán) 版權(quán)歸屬 商標(biāo)辦理 商標(biāo)申請(qǐng) 美國(guó)專利局 ip 共享單車 一帶一路商標(biāo) 融資 馳名商標(biāo)保護(hù) 知識(shí)產(chǎn)權(quán)工程師 授權(quán) 音樂(lè)的版權(quán) 專利 商標(biāo)數(shù)據(jù) 知識(shí)產(chǎn)權(quán)局 知識(shí)產(chǎn)權(quán)法 專利小白 商標(biāo)是什么 商標(biāo)注冊(cè) 知識(shí)產(chǎn)權(quán)網(wǎng) 中超 商標(biāo)審查 維權(quán) 律所 專利代理人 知識(shí)產(chǎn)權(quán)案例 專利運(yùn)營(yíng) 現(xiàn)代產(chǎn)業(yè)
本文來(lái)自于iprdaily,永久保存地址為http://globalwellnesspartner.com/article_27344.html,發(fā)布時(shí)間為2021-03-22 10:06:06。

文章不錯(cuò),犒勞下辛苦的作者吧

    我也說(shuō)兩句
    還可以輸入140個(gè)字
    我要評(píng)論
    回復(fù)
    還可以輸入 70 個(gè)字
    請(qǐng)選擇打賞金額