返回
頂部
我們已發(fā)送驗(yàn)證鏈接到您的郵箱,請(qǐng)查收并驗(yàn)證
沒收到驗(yàn)證郵件?請(qǐng)確認(rèn)郵箱是否正確或 重新發(fā)送郵件
確定
產(chǎn)業(yè)行業(yè)法院投稿訴訟招聘TOP100政策國(guó)際視野人物許可交易深度專題活動(dòng)灣區(qū)IP動(dòng)態(tài)職場(chǎng)商標(biāo)Oversea晨報(bào)董圖公司審查員說(shuō)法官說(shuō)首席知識(shí)產(chǎn)權(quán)官G40領(lǐng)袖機(jī)構(gòu)企業(yè)專利律所

智能語(yǔ)義技術(shù)在專利檢索中的應(yīng)用

機(jī)構(gòu)
知識(shí)產(chǎn)權(quán)界6年前
智能語(yǔ)義技術(shù)在專利檢索中的應(yīng)用

智能語(yǔ)義技術(shù)在專利檢索中的應(yīng)用

#本文僅代表作者觀點(diǎn),未經(jīng)作者許可,禁止轉(zhuǎn)載,不代表IPRdaily立場(chǎng)#


來(lái)源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:隆天集團(tuán)中專隆天知識(shí)產(chǎn)權(quán)運(yùn)營(yíng)(深圳)股份有限公司  周俊 高級(jí)項(xiàng)目經(jīng)理、專利分析師
原標(biāo)題:智能語(yǔ)義技術(shù)在專利檢索中的應(yīng)用


摘要


人工智能浪潮下,很多工作將會(huì)被替代。智能語(yǔ)義技術(shù)已經(jīng)在專利檢索中大規(guī)模應(yīng)用,未來(lái)將成為檢索專家的得力助手還是終結(jié)者?筆者基于其曾在專利審查工作中使用智能語(yǔ)義開展檢索的豐富經(jīng)驗(yàn),通過(guò)梳理智能語(yǔ)義技術(shù)產(chǎn)生的原因、基本原理及其在專利檢索中的應(yīng)用方式,給出了一個(gè)答案。


專利檢索經(jīng)歷了百余年的發(fā)展歷史,早在19世紀(jì)末美國(guó)政府就在咨詢工作中應(yīng)用專利檢索技術(shù),當(dāng)時(shí)是針對(duì)紙質(zhì)專利文獻(xiàn)的手工檢索。從20世紀(jì)70年代起,基于計(jì)算機(jī)的專利檢索逐步普及,專利檢索的效率也因此大幅提升,但對(duì)于當(dāng)時(shí)的公眾而言,獲取專利信息仍然是十分困難的事情。直到1997年IBM開始在互聯(lián)網(wǎng)上提供專利信息服務(wù),公眾獲取專利信息才變得相對(duì)容易[1] ??v觀專利檢索的發(fā)展歷史,伴隨著信息技術(shù)的變革,專利信息獲取和利用的方式也在不斷發(fā)生變化。


進(jìn)入21世紀(jì)以來(lái),信息技術(shù)創(chuàng)新日益加快,人工智能技術(shù)的發(fā)展尤為迅速,網(wǎng)絡(luò)購(gòu)物時(shí)的推薦算法、掃臉支付、語(yǔ)音助理等新技術(shù)已經(jīng)不知不覺融入到我們的日常生活中。在專利檢索分析領(lǐng)域,被稱作智能語(yǔ)義的新技術(shù)也進(jìn)入到了重要的發(fā)展時(shí)期。2018年5月,世界知識(shí)產(chǎn)權(quán)組織召開“知識(shí)產(chǎn)權(quán)局關(guān)于ICT戰(zhàn)略和人工智能”會(huì)議,會(huì)議資料顯示,多個(gè)國(guó)家和地區(qū)的知識(shí)產(chǎn)權(quán)局已經(jīng)開始嘗試在專利審查的檢索環(huán)節(jié)應(yīng)用智能語(yǔ)義技術(shù) [2]。在商用專利數(shù)據(jù)庫(kù)領(lǐng)域,多款工具已經(jīng)具備了智能語(yǔ)義檢索功能。新技術(shù)的出現(xiàn)為專利檢索工作帶來(lái)了什么樣的變化?作者基于其曾在專利審查工作中使用智能語(yǔ)義開展檢索的豐富經(jīng)驗(yàn),簡(jiǎn)要介紹智能語(yǔ)義技術(shù)產(chǎn)生的原因、基本原理及其在專利檢索中的應(yīng)用方式。


傳統(tǒng)檢索面臨的困境


困境,不僅存在于專利檢索中,而是在于所有的傳統(tǒng)搜索領(lǐng)域。信息爆炸是困境的主要來(lái)源,隨著人類知識(shí)以幾何級(jí)數(shù)量增長(zhǎng),想要快速準(zhǔn)確的搜索到所需信息并不是一件容易的事情。專利行業(yè)同樣面臨數(shù)據(jù)增長(zhǎng)的問(wèn)題,僅中國(guó)大陸公開的專利文獻(xiàn)數(shù)量,發(fā)明和實(shí)用新型專利文獻(xiàn)總量從2008年底只有不到250萬(wàn)件,已經(jīng)躍升到2018年底的1700萬(wàn)余件,10年的時(shí)間增長(zhǎng)了7倍,這為開展專利檢索工作帶來(lái)巨大的挑戰(zhàn)。


基于傳統(tǒng)的布爾檢索方式,檢索專家們致力于在檢索全面性和檢索效率之間尋找平衡:任何一個(gè)技術(shù)概念都有諸多的表述方式,檢索時(shí)只有盡可能全面的列舉這些表述方式,才能保證不漏掉重要文獻(xiàn);但每一種表述方式又會(huì)有多重含義,全面的表述將引入大量不準(zhǔn)確的噪聲文件,這些噪聲文件浪費(fèi)了檢索人員的瀏覽時(shí)間。如今,檢索專家們面對(duì)著增長(zhǎng)了數(shù)十倍的專利文獻(xiàn),感到越來(lái)越難在檢索的全面性與檢索效率之間找到平衡。


智能語(yǔ)義檢索的興起


為了解決傳統(tǒng)檢索面臨的困境,出現(xiàn)了一種自動(dòng)擴(kuò)展檢索內(nèi)容的語(yǔ)義技術(shù),具體來(lái)說(shuō)是構(gòu)建一個(gè)大型的同義詞庫(kù),將用戶輸入的內(nèi)容在同義詞庫(kù)中搜索,擴(kuò)展相關(guān)關(guān)鍵詞來(lái)提高檢索的命中率。但是,這種語(yǔ)義技術(shù)雖然提高了檢索的全面性,但應(yīng)用該算法會(huì)在每次檢索中命中更多的專利,同樣引入了噪聲文件,增加了檢索人員瀏覽和篩選文獻(xiàn)的工作量。


另一種智能語(yǔ)義技術(shù)是基于語(yǔ)義相關(guān)性的排序。這種技術(shù)基于專利文本數(shù)據(jù)開展機(jī)器學(xué)習(xí),自動(dòng)運(yùn)算詞語(yǔ)之間和文檔之間的相關(guān)性,基于相關(guān)性對(duì)文獻(xiàn)進(jìn)行排序。這種方法的目標(biāo)是將最相關(guān)技術(shù)排在最前,直接提升檢索人員瀏覽文獻(xiàn)的效率。應(yīng)用該技術(shù)的專利檢索工具,可以允許用戶輸入任意長(zhǎng)度的一段文本或是直接輸入一個(gè)專利公開號(hào),系統(tǒng)將自動(dòng)推薦最相關(guān)的文獻(xiàn)。


智能語(yǔ)義技術(shù)在專利檢索中的應(yīng)用


對(duì)于基于同義詞庫(kù)的語(yǔ)義搜索技術(shù),由于計(jì)算機(jī)僅僅是對(duì)用戶輸入的內(nèi)容進(jìn)行了擴(kuò)展,在具體檢索時(shí)仍然執(zhí)行了布爾檢索,因此這種語(yǔ)義檢索工具和傳統(tǒng)布爾檢索工具的差別不大,在理解和使用上沒有太大的困難。


而基于潛在語(yǔ)義索引的搜索技術(shù),則完全脫離了傳統(tǒng)布爾檢索的范疇,與我們長(zhǎng)期對(duì)檢索的理解大不相同。這種搜索技術(shù)完全拋棄了從一個(gè)文獻(xiàn)集中限定出子集的過(guò)程,而是按照用戶所輸入文本內(nèi)容的相關(guān)性,直接對(duì)一個(gè)文獻(xiàn)集進(jìn)行排序。下面簡(jiǎn)要介紹應(yīng)用這種技術(shù)開展專利檢索的兩種方法。


第一種方法是完全獨(dú)立使用智能語(yǔ)義檢索。此時(shí)檢索人員只需將想要檢索的一段文本輸入語(yǔ)義檢索系統(tǒng),計(jì)算機(jī)就能根據(jù)用戶輸入的文本,對(duì)數(shù)據(jù)庫(kù)中存儲(chǔ)的千萬(wàn)乃至上億條專利做排序,檢索人員依次瀏覽就可能獲得所需的專利。由于這種檢索方式不需要任何的檢索策略,完全沒有檢索經(jīng)驗(yàn)的人也能很快上手。對(duì)于檢索經(jīng)驗(yàn)豐富的人,在檢索初期也可以優(yōu)先使用這種方法進(jìn)行試探性檢索,有一定的幾率可以很快獲得滿意的結(jié)果,并且可以通過(guò)統(tǒng)計(jì)分析排序靠前的專利,發(fā)現(xiàn)更多的關(guān)鍵詞表述方式或相關(guān)的專利分類號(hào)。


完全獨(dú)立使用智能語(yǔ)義檢索,雖然可以提升檢索的效率,但仍然不能替代檢索專家和布爾檢索。其中一個(gè)主要原因是:智能語(yǔ)義技術(shù)無(wú)法進(jìn)行技術(shù)方案層面的理解,換句話說(shuō),智能語(yǔ)義技術(shù)還不能像檢索專家一樣,提煉出技術(shù)方案的核心技術(shù)特征開展精準(zhǔn)檢索。例如針對(duì)下面的一段文本,檢索專家基于其中描述的技術(shù)方案和對(duì)現(xiàn)有技術(shù)的理解,會(huì)將“缺口”和“折彎部”這兩個(gè)特征作為核心特征來(lái)檢索,而目前的智能語(yǔ)義算法還無(wú)法模擬檢索專家從文本到技術(shù)方案這一抽象的思維過(guò)程。


一種一體式自拍裝置,包括伸縮桿及用于夾持拍攝設(shè)備的夾持裝置,所述夾持裝置包括載物臺(tái)及設(shè)于載物臺(tái)上方的可拉伸夾緊機(jī)構(gòu),其特征在于:所述夾持裝置一體式轉(zhuǎn)動(dòng)連接于所述伸縮桿的頂端,所述載物臺(tái)上設(shè)有一缺口,所述夾緊機(jī)構(gòu)設(shè)有一與所述缺口位置相對(duì)應(yīng)的折彎部,所述伸縮桿折疊后可容置于所述缺口及折彎部。


使用智能語(yǔ)義最佳的方式是與專家布爾檢索結(jié)合使用。具體來(lái)說(shuō)是利用布爾檢索式獲得檢索結(jié)果后,再利用一個(gè)與布爾檢索式無(wú)關(guān)的排序因子對(duì)上述檢索結(jié)果進(jìn)行排序。布爾檢索式用于精準(zhǔn)的表達(dá)技術(shù)方案的核心特征,智能語(yǔ)義將其他非核心特征用相關(guān)性來(lái)表述,用排序的方法展示給檢索專家。這樣檢索的好處是,一方面可以充分發(fā)揮檢索專家定義核心特征的作用,保證了檢索的精準(zhǔn)度,同時(shí)發(fā)揮智能語(yǔ)義算法搜索的全面性,避免了因?yàn)閷?duì)非核心技術(shù)特征的表述不夠全面而導(dǎo)致的漏檢。


針對(duì)上面的例子,如果獨(dú)立使用布爾檢索,則至少要在檢索時(shí)限定出自拍裝置、夾持裝置、缺口、彎折部等特征,但將語(yǔ)義與布爾檢索結(jié)合時(shí),可以僅用布爾檢索搜索缺口、彎折部等核心特征,再將該全部文本作為排序因子對(duì)檢索結(jié)果排序,就能將與自拍裝置、夾持高度相關(guān)的專利排序到最前。這種檢索方式既提高了檢索的準(zhǔn)確性,又避免了漏掉重要專利,檢索的效率也能大幅提升。


每當(dāng)聽到人工智能將會(huì)取代某些工作時(shí),相信不少人會(huì)有一絲擔(dān)憂。但筆者認(rèn)為,專利檢索本身是一種目標(biāo)高度不確定、需要大量主觀思考判斷和綜合分析的工作,檢索專家們完全不必把智能語(yǔ)義看作是競(jìng)爭(zhēng)對(duì)手,而是當(dāng)成今后工作中的重要工具為自己賦能。相信語(yǔ)義技術(shù)與專家布爾檢索的結(jié)合會(huì)是未來(lái)檢索的主流,基于海量數(shù)據(jù)模型的語(yǔ)義排序與基于布爾的精確命中,將會(huì)合奏出人與人工智能融合的完美樂章。



注釋:

[1]陳燕, 黃迎燕, 方建國(guó). 專利信息采集與分析[M]. 清華大學(xué)出版社, 2006:104-106.
[2]WIPO/IP/ITAI/GE/18,May 23 to May 25, 2018 (Geneva, Switzerland),https://www.wipo.int/meetings/en/details.jsp?meeting_id=46586.



來(lái)源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:隆天集團(tuán)中專隆天知識(shí)產(chǎn)權(quán)運(yùn)營(yíng)(深圳)股份有限公司  周俊 高級(jí)項(xiàng)目經(jīng)理、專利分析師
編輯:IPRdaily趙珍          校對(duì):IPRdaily縱橫君


推薦閱讀(點(diǎn)擊圖文,閱讀全文)


智能語(yǔ)義技術(shù)在專利檢索中的應(yīng)用

開年重磅!尋找40位40歲以下企業(yè)知識(shí)產(chǎn)權(quán)精英(40 Under 40)


“投稿”請(qǐng)投郵箱“iprdaily@163.com”


智能語(yǔ)義技術(shù)在專利檢索中的應(yīng)用

「關(guān)于IPRdaily」


IPRdaily成立于2014年,是全球影響力的知識(shí)產(chǎn)權(quán)媒體+產(chǎn)業(yè)服務(wù)平臺(tái),致力于連接全球知識(shí)產(chǎn)權(quán)人,用戶匯聚了中國(guó)、美國(guó)、德國(guó)、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國(guó)等15個(gè)國(guó)家和地區(qū)的高科技公司、成長(zhǎng)型科技企業(yè)IP高管、研發(fā)人員、法務(wù)、政府機(jī)構(gòu)、律所、事務(wù)所、科研院校等全球近50多萬(wàn)產(chǎn)業(yè)用戶(國(guó)內(nèi)25萬(wàn)+海外30萬(wàn));同時(shí)擁有近百萬(wàn)條高質(zhì)量的技術(shù)資源+專利資源,通過(guò)媒體構(gòu)建全球知識(shí)產(chǎn)權(quán)資產(chǎn)信息第一入口。2016年獲啟賦資本領(lǐng)投和天使匯跟投的Pre-A輪融資。

(英文官網(wǎng):iprdaily.com  中文官網(wǎng):iprdaily.cn) 

 

本文來(lái)自IPRdaily.cn 中文網(wǎng)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://globalwellnesspartner.com/”

知識(shí)產(chǎn)權(quán)界投稿作者
共發(fā)表文章716
最近文章
關(guān)鍵詞
首席知識(shí)產(chǎn)權(quán)官 世界知識(shí)產(chǎn)權(quán)日 美國(guó)專利訴訟管理策略 大數(shù)據(jù) 軟件著作權(quán)登記 專利商標(biāo) 商標(biāo)注冊(cè)人 人工智能 版權(quán)登記代理 如何快速獲得美國(guó)專利授權(quán)? 材料科學(xué) 申請(qǐng)注冊(cè)商標(biāo) 軟件著作權(quán) 虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí) 專利侵權(quán)糾紛行政處理 專利預(yù)警 知識(shí)產(chǎn)權(quán) 全球視野 中國(guó)商標(biāo) 版權(quán)保護(hù)中心 智能硬件 新材料 新一代信息技術(shù)產(chǎn)業(yè) 躲過(guò)商標(biāo)轉(zhuǎn)讓的陷阱 航空航天裝備 樂天 產(chǎn)業(yè) 海洋工程裝備及高技術(shù)船舶 著作權(quán) 電子版權(quán) 醫(yī)藥及高性能醫(yī)療器械 中國(guó)專利年報(bào) 游戲動(dòng)漫 條例 國(guó)際專利 商標(biāo) 實(shí)用新型專利 專利費(fèi)用 專利管理 出版管理?xiàng)l例 版權(quán)商標(biāo) 知識(shí)產(chǎn)權(quán)侵權(quán) 商標(biāo)審查協(xié)作中心 法律和政策 企業(yè)商標(biāo)布局 新商標(biāo)審查「不規(guī)范漢字」審理標(biāo)準(zhǔn) 專利機(jī)構(gòu)排名 商標(biāo)分類 專利檢索 申請(qǐng)商標(biāo)注冊(cè) 法規(guī) 行業(yè) 法律常識(shí) 設(shè)計(jì)專利 2016知識(shí)產(chǎn)權(quán)行業(yè)分析 發(fā)明專利申請(qǐng) 國(guó)家商標(biāo)總局 電影版權(quán) 專利申請(qǐng) 香港知識(shí)產(chǎn)權(quán) 國(guó)防知識(shí)產(chǎn)權(quán) 國(guó)際版權(quán)交易 十件 版權(quán) 顧問(wèn) 版權(quán)登記 發(fā)明專利 亞洲知識(shí)產(chǎn)權(quán) 版權(quán)歸屬 商標(biāo)辦理 商標(biāo)申請(qǐng) 美國(guó)專利局 ip 共享單車 一帶一路商標(biāo) 融資 馳名商標(biāo)保護(hù) 知識(shí)產(chǎn)權(quán)工程師 授權(quán) 音樂的版權(quán) 專利 商標(biāo)數(shù)據(jù) 知識(shí)產(chǎn)權(quán)局 知識(shí)產(chǎn)權(quán)法 專利小白 商標(biāo)是什么 商標(biāo)注冊(cè) 知識(shí)產(chǎn)權(quán)網(wǎng) 中超 商標(biāo)審查 維權(quán) 律所 專利代理人 知識(shí)產(chǎn)權(quán)案例 專利運(yùn)營(yíng) 現(xiàn)代產(chǎn)業(yè)
本文來(lái)自于iprdaily,永久保存地址為http://globalwellnesspartner.com/article_21073.html,發(fā)布時(shí)間為2019-02-28 08:37:17。

文章不錯(cuò),犒勞下辛苦的作者吧

    我也說(shuō)兩句
    還可以輸入140個(gè)字
    我要評(píng)論
    回復(fù)
    還可以輸入 70 個(gè)字
    請(qǐng)選擇打賞金額