專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利專(zhuān)利分類(lèi)分類(lèi)分類(lèi)分類(lèi)分類(lèi)分類(lèi)中國(guó)專(zhuān)利申請(qǐng)
#本文僅代表作者觀點(diǎn),不代表IPRdaily立場(chǎng),未經(jīng)作者許可,禁止轉(zhuǎn)載#
來(lái)源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:吳正明 常州市權(quán)航專(zhuān)利代理有限公司
原標(biāo)題:先布爾再語(yǔ)義還是先語(yǔ)義后布爾,這是一個(gè)問(wèn)題
隨著專(zhuān)利數(shù)據(jù)庫(kù)的發(fā)展,數(shù)據(jù)量全已經(jīng)是一個(gè)最基本的評(píng)判指標(biāo)了,智能化的傻瓜型檢索方式能夠幫助企業(yè)非專(zhuān)業(yè)的IPR經(jīng)過(guò)短期培訓(xùn)也能夠勝任普通的檢索要求;因此,為了使專(zhuān)利數(shù)據(jù)庫(kù)的使用更加人性化,語(yǔ)義檢索也成為各大專(zhuān)利數(shù)據(jù)庫(kù)宣傳的重點(diǎn)。本文對(duì)一件“基石”專(zhuān)利價(jià)值評(píng)估值38萬(wàn)美金的專(zhuān)利進(jìn)行檢索分析。
前段時(shí)間有分析師分析了國(guó)內(nèi)數(shù)據(jù)庫(kù)的專(zhuān)利申請(qǐng)情況,同時(shí)根據(jù)專(zhuān)利被引用次數(shù),找出了一家數(shù)據(jù)庫(kù)被19次引用的專(zhuān)利,這件專(zhuān)利被認(rèn)為是該數(shù)據(jù)庫(kù)的“基石”專(zhuān)利,引用這件美國(guó)專(zhuān)利申請(qǐng)的企業(yè)都是微軟、阿里巴巴、百度、LEXIS NEXIS等國(guó)內(nèi)外互聯(lián)網(wǎng)巨頭,體現(xiàn)了這件專(zhuān)利在相關(guān)技術(shù)上的先進(jìn)性。分析師指出,這件名為“Method and System for Re-ranking Search Results”的專(zhuān)利,背后是基于自然語(yǔ)義分析的新一代智能搜索技術(shù),通過(guò)超大規(guī)模計(jì)算智能,能自動(dòng)理解不同專(zhuān)利文獻(xiàn)中蘊(yùn)含的各種主題。
帶著強(qiáng)烈的好奇心,筆者找出了這件專(zhuān)利,進(jìn)行了分析。這件“基石”專(zhuān)利價(jià)值評(píng)估值38萬(wàn)美金。
專(zhuān)利的優(yōu)先權(quán)是中國(guó)專(zhuān)利CN200810105725.1(對(duì)搜索結(jié)果重新排序的方法和系統(tǒng)),這件中國(guó)專(zhuān)利申請(qǐng)在授權(quán)時(shí)遇到一些波折,經(jīng)歷了一次復(fù)審,也就是說(shuō)審查員曾經(jīng)做出過(guò)駁回決定。以下是最終授權(quán)版本的權(quán)利要求1。
權(quán)利要求1很簡(jiǎn)單,也說(shuō)明了保護(hù)范圍較大,創(chuàng)新比較原始,從保護(hù)內(nèi)容來(lái)看,實(shí)質(zhì)上是布爾檢索和語(yǔ)義檢索聯(lián)合使用時(shí)的一種應(yīng)用場(chǎng)景。翻譯過(guò)來(lái)大概是:
1、計(jì)算機(jī)搜索用戶(hù)輸入的關(guān)鍵詞等布爾檢索式,獲得檢索結(jié)果;
2、計(jì)算機(jī)根據(jù)用戶(hù)輸入的語(yǔ)義檢索式(重排序表達(dá)式),對(duì)第一步的結(jié)果進(jìn)行重新排序;
3、顯示排序后的所有檢索結(jié)果。
看來(lái)這件專(zhuān)利應(yīng)該屬于自然語(yǔ)義分析的新一代智能搜索技術(shù)的應(yīng)用專(zhuān)利,而與自然語(yǔ)義分析本身沒(méi)太大的關(guān)系,在說(shuō)明書(shū)中也是引用了一些文獻(xiàn),并且核心算法并未在說(shuō)明書(shū)中直接公開(kāi),僅公開(kāi)了一些顯性操作過(guò)程和執(zhí)行過(guò)程。
這件中國(guó)專(zhuān)利在授權(quán)的權(quán)利要求1中主要改變了兩個(gè)特征,一是增加了“其中重排序表達(dá)式與搜索表達(dá)式同時(shí)輸入”,二是刪除了對(duì)部分文檔進(jìn)行排序和顯示部分文檔的技術(shù)方案(根據(jù)重排序表達(dá)式,對(duì)部分文檔進(jìn)行重排序,以所述排序來(lái)顯示所述搜索結(jié)果中的部分文檔),只保留了對(duì)所有文檔進(jìn)行排序并顯示所有文檔的技術(shù)方案。
同族的美國(guó)授權(quán)專(zhuān)利中也增加了“重排序表達(dá)式為搜索查詢(xún)附帶的文本字符串,在從數(shù)據(jù)源生成搜索結(jié)果時(shí)不進(jìn)行任何操作”的限定。也就是說(shuō),語(yǔ)義排序?qū)Σ紶査阉鹘Y(jié)果只作排序,不進(jìn)行再次限定等會(huì)影響布爾檢索式搜索結(jié)果的操作。
這件專(zhuān)利保護(hù)的實(shí)際是先布爾限定后語(yǔ)義排序的檢索方式,這種技術(shù)可以“使得搜索結(jié)果不減少的情況下,與用戶(hù)的關(guān)注點(diǎn)相關(guān)的結(jié)果會(huì)顯示在結(jié)果的最前面。使得用戶(hù)能夠首先關(guān)注他特別最期望看到的結(jié)果,同時(shí)又可以完整地看到其它結(jié)果。而且,用戶(hù)可以對(duì)同一個(gè)搜索結(jié)果根據(jù)需要進(jìn)行多個(gè)不同的排序,只要修改排序表達(dá)式即可。使用用戶(hù)個(gè)性化定制的重排序表達(dá)式可以很好的滿(mǎn)足用戶(hù)個(gè)性化的需求,提高了對(duì)搜索結(jié)果的瀏覽效率,能夠更快更準(zhǔn)確地獲得需要的結(jié)果?!?/p>
這件專(zhuān)利申請(qǐng)日是2008年,當(dāng)時(shí)國(guó)內(nèi)數(shù)據(jù)庫(kù)方面還停留在關(guān)鍵字檢索方式上,基本未涉及語(yǔ)義檢索,所以該數(shù)據(jù)庫(kù)能提出這樣的檢索模式和檢索思路,同時(shí)被如此多的巨頭引用,也說(shuō)明了這件專(zhuān)利在專(zhuān)利數(shù)據(jù)庫(kù)檢索上的技術(shù)貢獻(xiàn)和應(yīng)用前景是比較可觀的,帶領(lǐng)了國(guó)內(nèi)數(shù)據(jù)庫(kù)從布爾檢索轉(zhuǎn)向智能化檢索具有里程碑的意義。
隨著專(zhuān)利數(shù)據(jù)庫(kù)的發(fā)展,數(shù)據(jù)量全已經(jīng)是一個(gè)最基本的評(píng)判指標(biāo)了,智能化的傻瓜型檢索方式能夠幫助企業(yè)非專(zhuān)業(yè)的IPR經(jīng)過(guò)短期培訓(xùn)也能夠勝任普通的檢索要求;因此,為了使專(zhuān)利數(shù)據(jù)庫(kù)的使用更加人性化,語(yǔ)義檢索也成為各大專(zhuān)利數(shù)據(jù)庫(kù)宣傳的重點(diǎn)。經(jīng)研究過(guò)后,筆者發(fā)現(xiàn)當(dāng)前布爾與語(yǔ)義的配合存在兩種方式,一種是先布爾限定后語(yǔ)義排序的方式;第二種是先語(yǔ)義檢索出固定量的專(zhuān)利(例如2000條),再用布爾限定在其中繼續(xù)篩選,也就是先語(yǔ)義后布爾的方式。
以下是筆者基于國(guó)內(nèi)兩大數(shù)據(jù)庫(kù)演示三種檢索模式。
一、先布爾后語(yǔ)義
1.數(shù)據(jù)庫(kù)1
先用布爾檢索,在全文中搜索具有“多旋翼 or 四軸 or 多軸”關(guān)鍵詞的專(zhuān)利,一共111335件。
添加語(yǔ)義排序條件“CN106494640B”對(duì)結(jié)果進(jìn)行排序。
最終的表達(dá)式為R:(“CN106494640B”) AND (TACD_ALL:(多旋翼 or 四軸 or 多軸)),其中R:(“CN106494640B”)部分為語(yǔ)義排序表達(dá)式,(TACD_ALL:(多旋翼 or 四軸 or 多軸))部分為布爾限定表達(dá)式,結(jié)果仍是111335件專(zhuān)利,只不過(guò)排序方式發(fā)生了變化,專(zhuān)利CN106494640B的公開(kāi)版本CN106494640A排在了第一個(gè)。與該數(shù)據(jù)庫(kù)在幫助中心的介紹相同。
在頂部輸入框可直接輸入語(yǔ)義排序表達(dá)式和布爾限定表達(dá)式,R:(“CN110641729A”) AND (TACD_ALL:(無(wú)人機(jī))),檢索結(jié)果數(shù)量變成了123382件專(zhuān)利,專(zhuān)利CN110641729A自身排在了檢索結(jié)果第一個(gè)。
單獨(dú)使用布爾檢索式(TACD_ALL:(無(wú)人機(jī)))檢索,與布爾+語(yǔ)義的檢索結(jié)果相同,也是123382件專(zhuān)利,但檢索結(jié)果排序發(fā)生了變化。
2.數(shù)據(jù)庫(kù)2
數(shù)據(jù)庫(kù)2中可直接同時(shí)輸入布爾檢索和語(yǔ)義排序(超級(jí)排序)的內(nèi)容進(jìn)行檢索,在“標(biāo)題、摘要、權(quán)利要求”中搜索具有“多旋翼 or 四軸 or 多軸”關(guān)鍵詞的專(zhuān)利,同時(shí)根據(jù)“CN106494640B”進(jìn)行排序。
最終的表達(dá)式為R=(CN106494640B) AND (TIABC=(多旋翼 OR 四軸 OR 多軸)),其中R=(CN106494640B)部分為語(yǔ)義排序表達(dá)式,(TIABC=(多旋翼 OR 四軸 OR 多軸))部分為布爾限定表達(dá)式。檢索結(jié)果一共52999件,其中每件專(zhuān)利都標(biāo)記了相關(guān)度百分比,專(zhuān)利CN106494640B的公開(kāi)版本CN106494640A排在了第二個(gè),相關(guān)度是63.27%。
刪除語(yǔ)義表達(dá)式,單獨(dú)使用布爾檢索式(TIABC=(多旋翼 OR 四軸 OR 多軸))檢索,與布爾+語(yǔ)義的檢索結(jié)果相同,也是52999件專(zhuān)利,但檢索結(jié)果排序發(fā)生了變化。
我們也嘗試了在頂部輸入框直接輸入語(yǔ)義排序表達(dá)式和布爾限定表達(dá)式,R=(CN106124517A) AND (TIABC=(無(wú)人機(jī))),檢索結(jié)果發(fā)生了變化,檢索結(jié)果數(shù)量變成了75229件專(zhuān)利。
單獨(dú)使用布爾檢索式(TIABC=(無(wú)人機(jī)))檢索,與布爾+語(yǔ)義的檢索結(jié)果相同,也是75229件專(zhuān)利,但檢索結(jié)果中無(wú)相關(guān)度百分比,排序發(fā)生了變化。
二、先語(yǔ)義后布爾
在各數(shù)據(jù)庫(kù)獨(dú)立的語(yǔ)義檢索模塊中操作時(shí),檢索模式并非先布爾后語(yǔ)義的模式,而是采用了相反的先語(yǔ)義后布爾的模式,具體來(lái)說(shuō),是先通過(guò)語(yǔ)義檢索先找出固定數(shù)量的相關(guān)專(zhuān)利(例如2000條),再使用布爾限定在已找出來(lái)的固定數(shù)量的專(zhuān)利中繼續(xù)篩選符合布爾檢索條件的專(zhuān)利,因此這種模式下,最終的檢索數(shù)量一定小于等于通過(guò)語(yǔ)義檢索篩選出的專(zhuān)利數(shù)量,同時(shí)也一定小于等于僅布爾檢索條件的檢索結(jié)果數(shù)量。
1.數(shù)據(jù)庫(kù)1
先在語(yǔ)義搜索中輸入語(yǔ)義搜索條件CN106494640B。
檢索結(jié)果中可得到1000條檢索結(jié)果,每個(gè)結(jié)果都有相關(guān)度百分比,并且是逐漸降低的,也就是說(shuō)系統(tǒng)截取了最相關(guān)的1000個(gè)檢索結(jié)果,語(yǔ)義檢索表達(dá)式是一串加密的代碼。
在語(yǔ)義檢索基礎(chǔ)上,使用布爾檢索條件限定IPC分類(lèi)號(hào)為B64F5/60,進(jìn)行二次過(guò)濾。
過(guò)濾后檢索結(jié)果為75條,也就是原1000條相關(guān)專(zhuān)利中,有75件專(zhuān)利的IPC分類(lèi)號(hào)為B64F5/60。
而單獨(dú)檢索IPC分類(lèi)號(hào)為B64F5/60的專(zhuān)利為3588條,也就是說(shuō)此種方式并不是先布爾限定后語(yǔ)義排序,而是先語(yǔ)義檢索出1000條專(zhuān)利,在1000條結(jié)果中,再限定IPC分類(lèi)號(hào)為B64F5/60的專(zhuān)利,共75條。
2.數(shù)據(jù)庫(kù)2
先在語(yǔ)義搜索中輸入語(yǔ)義搜索條件CN106494640B。
檢索結(jié)果中可得到2000條檢索結(jié)果,每個(gè)結(jié)果都有相關(guān)度百分比,并且是逐漸降低的,也就是說(shuō)系統(tǒng)截取了最相關(guān)的2000個(gè)檢索結(jié)果。
在語(yǔ)義檢索基礎(chǔ)上,使用布爾檢索條件限定IPC分類(lèi)號(hào)為B64F5/60,進(jìn)行二次過(guò)濾。
過(guò)濾后檢索結(jié)果為45條,也就是原2000條相關(guān)專(zhuān)利中,有45件專(zhuān)利的IPC分類(lèi)號(hào)為B64F5/60。
而單獨(dú)檢索IPC分類(lèi)號(hào)為B64F5/60的專(zhuān)利與數(shù)據(jù)庫(kù)1相同,也是3559條,也就是說(shuō)此種方式并不是先布爾限定后語(yǔ)義排序,而是先語(yǔ)義檢索出2000條專(zhuān)利,在2000條結(jié)果中,再限定IPC分類(lèi)號(hào)為B64F5/60的專(zhuān)利,共45條。
三、先布爾后語(yǔ)義+截?cái)?/strong>
1.數(shù)據(jù)庫(kù)1
在數(shù)據(jù)庫(kù)1獨(dú)立的語(yǔ)義檢索模塊中操作時(shí),界面下方還可以同時(shí)輸入一些布爾限定條件,看起來(lái)類(lèi)似先布爾后語(yǔ)義的模式,但從檢索結(jié)果看,仍是1000條結(jié)果。
使用IPC分類(lèi)號(hào)B64F5/60對(duì)結(jié)果進(jìn)行二次限定,檢索結(jié)果仍是1000條,并且檢索結(jié)果排序未發(fā)生變化。也就是說(shuō)原檢索結(jié)果中所有的專(zhuān)利都具有IPC分類(lèi)號(hào)B64F5/60,這種模式應(yīng)該是先布爾后語(yǔ)義,同時(shí)做了相應(yīng)的截?cái)嗵幚恚达@示完整所有的布爾檢索結(jié)果。
2.數(shù)據(jù)庫(kù)2
在數(shù)據(jù)庫(kù)2獨(dú)立的語(yǔ)義檢索模塊中同時(shí)輸入布爾限定條件,檢索結(jié)果也仍是2000條結(jié)果。
使用IPC分類(lèi)號(hào)B64F5/60對(duì)結(jié)果進(jìn)行二次限定,檢索結(jié)果仍是2000條,并且檢索結(jié)果排序未發(fā)生變化。也就是說(shuō)與數(shù)據(jù)庫(kù)1一樣,原檢索結(jié)果中所有的專(zhuān)利都具有IPC分類(lèi)號(hào)B64F5/60,這種模式應(yīng)該也是先布爾后語(yǔ)義,同時(shí)做了相應(yīng)的截?cái)嗵幚?,未顯示完整所有的布爾檢索結(jié)果。
四、小結(jié)
由此以上分析,當(dāng)前語(yǔ)義+布爾的檢索模式一共三種,并且各主要數(shù)據(jù)庫(kù)都支持這三種模式。先布爾后語(yǔ)義的模式是先使用關(guān)鍵詞檢索等布爾條件檢索出一個(gè)專(zhuān)利集合,再使用語(yǔ)義排序?qū)@個(gè)集合進(jìn)行相關(guān)度排序,并且顯示專(zhuān)利集合中所有的專(zhuān)利;因此,檢索結(jié)果仍然是布爾檢索的結(jié)果,只是排序發(fā)生了改變;先語(yǔ)義后布爾的模式是先使用語(yǔ)義檢索以檢索出固定數(shù)量(一般為1000或2000)的專(zhuān)利,在這個(gè)范圍內(nèi),再使用布爾檢索條件進(jìn)一步限定,檢索結(jié)果是兩者的交集,專(zhuān)利數(shù)量小于等于語(yǔ)義檢索條件以及布爾檢索條件;最后一種先布爾后語(yǔ)義+截?cái)嗟哪J剑瑒t是在先布爾后語(yǔ)義的模式下,不顯示所有檢索結(jié)果,而是截?cái)嘀燎?000個(gè)或2000個(gè)。
綜上,從上述檢索結(jié)果可以看出,目前國(guó)內(nèi)數(shù)據(jù)庫(kù)巨頭基于上述三種方式檢索反饋的結(jié)果數(shù)據(jù)量是不相伯仲的,那有沒(méi)有相應(yīng)公司能夠開(kāi)發(fā)一套具有全新檢索方式和檢索思路的專(zhuān)利數(shù)據(jù)庫(kù),咱們拭目以待。
來(lái)源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:吳正明 常州市權(quán)航專(zhuān)利代理有限公司
編輯:IPRdaily王穎 校對(duì):IPRdaily縱橫君
注:原文鏈接:專(zhuān)利檢索中先布爾再語(yǔ)義還是先語(yǔ)義后布爾,這是一個(gè)問(wèn)題(點(diǎn)擊標(biāo)題查看原文)
青年有為!尋找2021年“40位40歲以下企業(yè)知識(shí)產(chǎn)權(quán)精英”活動(dòng)正式啟動(dòng)
報(bào)名!2021年「涉外專(zhuān)利代理高級(jí)研修班【上海站】」來(lái)啦!
報(bào)名!8天過(guò)實(shí)務(wù)-專(zhuān)代實(shí)務(wù)考試面授集訓(xùn)營(yíng)【華南站】正式招生
「關(guān)于IPRdaily」
IPRdaily是具有全球影響力的知識(shí)產(chǎn)權(quán)媒體,致力于連接全球知識(shí)產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來(lái)自于中國(guó)、美國(guó)、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國(guó)等15個(gè)國(guó)家和地區(qū)的高科技公司及成長(zhǎng)型科技企業(yè)的管理者及科技研發(fā)或知識(shí)產(chǎn)權(quán)負(fù)責(zé)人,還有來(lái)自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬(wàn)用戶(hù)(國(guó)內(nèi)70余萬(wàn)+海外近30萬(wàn)),2019年全年全網(wǎng)頁(yè)面瀏覽量已經(jīng)突破過(guò)億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來(lái)自IPRdaily中文網(wǎng)(iprdaily.cn)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://globalwellnesspartner.com/
今天上午10:00直播!一帶一路知識(shí)產(chǎn)權(quán)交流合作研討會(huì)
報(bào)名!跨國(guó)平行訴訟視角下標(biāo)準(zhǔn)必要專(zhuān)利訴訟熱點(diǎn)與應(yīng)對(duì)策略
文章不錯(cuò),犒勞下辛苦的作者吧