#本文由作者授權(quán)發(fā)布,不代表IPRdaily立場(chǎng),未經(jīng)作者許可,禁止轉(zhuǎn)載#
“一起來(lái)看看這條‘開(kāi)源 + 專(zhuān)利’雙軌并行的道路究竟有何價(jià)值?!?br/>
來(lái)源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:佑斌
近來(lái),AI圈正被一場(chǎng)“低成本+高性能”的技術(shù)風(fēng)暴席卷,由中國(guó)企業(yè) DeepSeek 打造的大語(yǔ)言模型,在多個(gè)國(guó)際基準(zhǔn)測(cè)試中以超強(qiáng)表現(xiàn)刷新外界認(rèn)知,且其訓(xùn)練成本竟然比市面主流方案低了一個(gè)數(shù)量級(jí)。這讓一度被認(rèn)為只有“海量GPU”才能跑出頂尖AI性能的傳統(tǒng)思維,面臨前所未有的挑戰(zhàn)。
更具話(huà)題性的是,DeepSeek一方面全面開(kāi)源大模型的代碼與訓(xùn)練文檔;另一方面卻申請(qǐng)了多項(xiàng)專(zhuān)利,涵蓋數(shù)據(jù)處理、分布式訓(xùn)練、網(wǎng)絡(luò)通信等關(guān)鍵領(lǐng)域。很多人不免困惑:為什么要把成果免費(fèi)放出來(lái),又要用專(zhuān)利進(jìn)行保護(hù)?“開(kāi)源”和“專(zhuān)利”不是矛盾的嗎?
其實(shí),越來(lái)越多的AI企業(yè)(如Meta、Mistral、EleutherAI等)都在開(kāi)源與專(zhuān)利保護(hù)之間尋找平衡。以及開(kāi)源軟件在AI領(lǐng)域的種種優(yōu)勢(shì),一起來(lái)看看這條“開(kāi)源+專(zhuān)利”雙軌并行的道路究竟有何價(jià)值。
一、“開(kāi)源”究竟有什么好處?
提到“開(kāi)源”,很多人往往只想到“源代碼可見(jiàn)、免費(fèi)使用”,但在AI大模型領(lǐng)域,開(kāi)源還帶來(lái)多重紅利:
1.構(gòu)建全球化開(kāi)發(fā)者生態(tài),助力市場(chǎng)拓展
社區(qū)驅(qū)動(dòng)的創(chuàng)新:一旦模型、代碼、文檔公開(kāi),世界各地的研究者、程序員都會(huì)加入“眾包”式的改進(jìn)與測(cè)試。
Meta開(kāi)源的Llama模型,不到數(shù)月就被社區(qū)打磨出無(wú)數(shù)增強(qiáng)版(Vicuna、Alpaca等),大幅提升模型在對(duì)話(huà)、多語(yǔ)言等方面的性能;Mistral AI開(kāi)源了高效小參數(shù)模型后,吸引了眾多開(kāi)發(fā)者競(jìng)相嘗試,快速形成一股“用戶(hù)自帶研發(fā)”浪潮。
快速搶占市場(chǎng)與用戶(hù)心智:開(kāi)源可以“零門(mén)檻”地讓企業(yè)、個(gè)人、高校研究者下載使用,從而大面積占領(lǐng)市場(chǎng)。一旦在開(kāi)發(fā)者群體中取得先發(fā)地位,就為后續(xù)付費(fèi)增值或生態(tài)合作打下基礎(chǔ)。
商業(yè)邏輯:盡管最初看似“免費(fèi)”,但隨著社區(qū)認(rèn)可度升高,一旦形成標(biāo)準(zhǔn)或廣泛采用,就會(huì)有更多商業(yè)客戶(hù)尋求官方技術(shù)支持、定制化服務(wù)、企業(yè)級(jí)部署方案等。對(duì)開(kāi)源企業(yè)而言,這往往反而能帶來(lái)更可觀的營(yíng)收。
品牌與公關(guān)效應(yīng):在“開(kāi)源 = 透明與信任”的時(shí)代,越多的開(kāi)發(fā)者和媒體會(huì)將“開(kāi)源大模型”的企業(yè)視為“站在技術(shù)前沿、敢于分享、利他共贏”的典范,這種“信譽(yù)加成”對(duì)市場(chǎng)拓展非常有幫助。
2. 加速技術(shù)迭代與降低研發(fā)成本
開(kāi)源社區(qū)的“協(xié)同研發(fā):許多公司在開(kāi)源后,能收到來(lái)自外部的優(yōu)化工具、插件以及新功能貢獻(xiàn)。這相當(dāng)于把一部分研發(fā)工作“眾包”給了全球?qū)I(yè)人士,為企業(yè)節(jié)省了不小的人力與時(shí)間成本。
EleutherAI的GPT-Neo、GPT-J等開(kāi)源模型,借助社區(qū)力量完成了從訓(xùn)練到評(píng)測(cè)的一系列繁瑣細(xì)節(jié),有效降低組織內(nèi)部的資源開(kāi)銷(xiāo)。
生態(tài)完善,工具互通:大模型常常與各種開(kāi)源庫(kù)和硬件適配深度綁定,如分布式訓(xùn)練框架、性能調(diào)優(yōu)工具、推理引擎等。企業(yè)若封閉單干,需自己摸索一整套解決方案。而選擇開(kāi)源,就能順利對(duì)接已有的豐富社區(qū)成果,節(jié)省大量重復(fù)投入。
廣泛應(yīng)用場(chǎng)景反饋:開(kāi)源讓不同領(lǐng)域、不同業(yè)務(wù)的使用者在第一時(shí)間把需求和bug反饋給開(kāi)發(fā)團(tuán)隊(duì),幫助模型持續(xù)進(jìn)化。對(duì)比封閉式開(kāi)發(fā),迭代速度常??鞌?shù)倍,也是為何Meta的Llama衍生版本層出不窮。
3. 與資本和商業(yè)化不沖突,甚至能增加盈利機(jī)會(huì)
雙重策略:社區(qū)版與企業(yè)版:很多開(kāi)源項(xiàng)目使用的都是“寬松許可證”(如Apache 2.0),同時(shí)企業(yè)會(huì)保留一些定制化、高端功能,只對(duì)企業(yè)客戶(hù)提供付費(fèi)授權(quán)。這樣既能凝聚社區(qū)人氣,又能在高階商用市場(chǎng)賺取利潤(rùn)。
如Databricks對(duì)Spark的開(kāi)源與商用支持,Docker對(duì)社區(qū)版和企業(yè)版的劃分,都在證明“開(kāi)源”和“盈利”可以雙贏。
衍生服務(wù)與云合作:開(kāi)源大模型通常需要穩(wěn)定的云部署、長(zhǎng)期維護(hù)和安全管理,許多企業(yè)客戶(hù)樂(lè)于付費(fèi)給原廠商獲取專(zhuān)業(yè)支持服務(wù)。企業(yè)也可與云平臺(tái)(如阿里云、騰訊云、AWS、Azure等)合作,共同推出“托管版”大模型,產(chǎn)生盈利分成。
增強(qiáng)投資者信心:從資本市場(chǎng)角度看,開(kāi)源 = 快速做大規(guī)模與影響力,有助于拉高公司估值。許多投資機(jī)構(gòu)更青睞能迅速形成社區(qū)影響、構(gòu)建行業(yè)標(biāo)準(zhǔn)的AI公司,理由在于:一旦拿下開(kāi)發(fā)者生態(tài),就等于站上了“未來(lái)的流量入口”。
二、DeepSeek為什么還要申請(qǐng)專(zhuān)利?
既然開(kāi)源優(yōu)勢(shì)這么多,DeepSeek為何要對(duì)核心技術(shù)進(jìn)行專(zhuān)利布局?其實(shí),開(kāi)源與專(zhuān)利保護(hù)在法律和商業(yè)層面并不對(duì)立,它們解決的是不同問(wèn)題:
開(kāi)源主要處理“著作權(quán)”:讓他人可以合法地復(fù)制、修改、分發(fā)代碼或模型。專(zhuān)利主要保護(hù)“發(fā)明與技術(shù)方案”:防止他人在未授權(quán)的情況下,將同一創(chuàng)新技術(shù)用于商業(yè)牟利。對(duì)大模型企業(yè)而言,“開(kāi)源 + 專(zhuān)利”雙軌并行大多出于以下考量:
1. 防御侵權(quán)與惡意訴訟
防被對(duì)手或“專(zhuān)利流氓”搶注:AI技術(shù)迭代極快,如果DeepSeek不及時(shí)申請(qǐng)專(zhuān)利,可能會(huì)被他人搶先注冊(cè)相似技術(shù),然后再反向告DeepSeek“侵權(quán)”。通過(guò)專(zhuān)利確權(quán),可有效減少日后糾紛。
形成法律護(hù)盾:當(dāng)企業(yè)擁有足夠的專(zhuān)利儲(chǔ)備,就能在面對(duì)外部專(zhuān)利攻擊時(shí),用自身專(zhuān)利進(jìn)行“交叉授權(quán)”或“反訴”,從而守護(hù)開(kāi)源項(xiàng)目的安全。
2. 保護(hù)核心競(jìng)爭(zhēng)力與商業(yè)收益
小核心、大協(xié)同:企業(yè)可以將大模型整體架構(gòu)、訓(xùn)練流程開(kāi)源,讓更多人受益;但在某些關(guān)鍵算法或系統(tǒng)優(yōu)化上,通過(guò)專(zhuān)利來(lái)維護(hù)“獨(dú)家知識(shí)”。這樣既可獲取社區(qū)的廣泛支持,又能保留自己無(wú)法輕易被復(fù)制的“王牌”。
專(zhuān)利提升公司估值:對(duì)商業(yè)公司而言,專(zhuān)利是重要的無(wú)形資產(chǎn),可以在投融資、并購(gòu)或談判中提高企業(yè)估值與議價(jià)能力,從而支持后續(xù)研發(fā)投入。
3. 與開(kāi)源社區(qū)的關(guān)系:授權(quán)而非壟斷
許多開(kāi)源許可證帶有“專(zhuān)利授權(quán)”條款(如Apache 2.0、GPLv3等),如果DeepSeek將模型以這類(lèi)許可證開(kāi)放,就會(huì)默認(rèn)授予用戶(hù)必要的專(zhuān)利使用許可,只要用戶(hù)遵守協(xié)議即可合法使用關(guān)鍵技術(shù)。
企業(yè)仍能保留更多商業(yè)授權(quán)模式:當(dāng)下游客戶(hù)規(guī)模、用途超越一定范圍,或者需要深度定制,DeepSeek可通過(guò)額外專(zhuān)利授權(quán)來(lái)收取合理費(fèi)用,平衡研發(fā)成本。
三、DeepSeek專(zhuān)利布局:如何實(shí)現(xiàn)“低成本 + 高性能”?
根據(jù)Maxipat的專(zhuān)利分析,DeepSeek在北京、杭州、寧波等關(guān)聯(lián)企業(yè)名下,圍繞大模型訓(xùn)練優(yōu)化、網(wǎng)絡(luò)通信、數(shù)據(jù)管理等領(lǐng)域申請(qǐng)了 17項(xiàng)核心專(zhuān)利。其中最令人矚目的是:
1.數(shù)據(jù)序列索引技術(shù)(CN118246542A)
將訓(xùn)練數(shù)據(jù)集拆分成固定大小的數(shù)據(jù)序列,統(tǒng)一以“索引”方式混合、打亂、切分,而非物理復(fù)制或重組數(shù)據(jù)。這樣做可極大節(jié)省存儲(chǔ)空間、減少數(shù)據(jù)重復(fù)和網(wǎng)絡(luò)通信負(fù)擔(dān),并讓GPU始終“吃得飽”,提升訓(xùn)練效率。
2. 多平面RDMA并行數(shù)據(jù)傳輸(CN118503194A)
跨節(jié)點(diǎn)GPU之間通過(guò)RDMA(遠(yuǎn)程直接內(nèi)存訪問(wèn)),繞過(guò)CPU瓶頸,減少延遲和數(shù)據(jù)傳輸中的來(lái)回拷貝。在大規(guī)模分布式訓(xùn)練時(shí),通信是最大瓶頸之一;該技術(shù)能大幅提升網(wǎng)絡(luò)吞吐,減少GPU空閑時(shí)間。
3. 無(wú)損壓縮與分布式異步I/O(CN117707416A)
動(dòng)態(tài)選擇數(shù)據(jù)壓縮策略,結(jié)合并行讀取,將PB級(jí)數(shù)據(jù)的I/O壓力大幅分?jǐn)?。減少對(duì)高端存儲(chǔ)硬件的依賴(lài),讓訓(xùn)練能在相對(duì)普通的硬件環(huán)境中高效運(yùn)行,進(jìn)一步降低成本。
4. 異構(gòu)斷點(diǎn)續(xù)訓(xùn)(CN117669701A)
允許在不同并行策略或集群拓?fù)淝袚Q時(shí),快速恢復(fù)訓(xùn)練進(jìn)度,減少重復(fù)。
這些底層專(zhuān)利相輔相成,共同構(gòu)筑了DeepSeek的大模型訓(xùn)練優(yōu)化體系。這正是DeepSeek能在不靠“天價(jià)GPU堆砌”的情況下,跑出媲美或超越歐美先進(jìn)大模型的關(guān)鍵原因。
四、開(kāi)源與專(zhuān)利并舉:DeepSeek的多重收益
快速做大影響力:通過(guò)開(kāi)源,DeepSeek的模型可快速被更多開(kāi)發(fā)者、企業(yè)采納,形成用戶(hù)與社區(qū)規(guī)模效應(yīng)。從而帶動(dòng)后續(xù)培訓(xùn)服務(wù)、付費(fèi)支持、云托管等增值服務(wù)的市場(chǎng)空間。
穩(wěn)固技術(shù)壁壘與估值:專(zhuān)利不僅能阻擋對(duì)手的“抄襲”,還能在投融資和產(chǎn)業(yè)合作中當(dāng)“硬通貨”。一旦有企業(yè)想要深度集成DeepSeek的核心技術(shù),就有明確的專(zhuān)利授權(quán)機(jī)制可以產(chǎn)生收益。
提升品牌認(rèn)知與人才吸引力:以開(kāi)源姿態(tài)示人,讓DeepSeek在AI界獲得“透明可信、技術(shù)底氣足”的形象;而對(duì)核心專(zhuān)利的掌控又能吸引想做深層研究的高級(jí)工程師、科研人員加入,共同突破技術(shù)極限。
減少外部專(zhuān)利風(fēng)險(xiǎn),確保開(kāi)源生態(tài)健康發(fā)展:擁有充足專(zhuān)利儲(chǔ)備的企業(yè),才有底氣說(shuō)“我們的開(kāi)源項(xiàng)目不怕惡意訴訟”。社區(qū)開(kāi)發(fā)者也能更加安心地基于DeepSeek的成果進(jìn)行二次創(chuàng)新,形成良性循環(huán)。
五、對(duì)中國(guó)AI產(chǎn)業(yè)的啟示
DeepSeek的成功給中國(guó)AI乃至全球AI行業(yè)帶來(lái)一些重要啟示:
1.“高性能”不一定非要靠“大算力燒錢(qián)”
合理的網(wǎng)絡(luò)優(yōu)化、數(shù)據(jù)管理、分布式訓(xùn)練算法等“軟實(shí)力”同樣能帶來(lái)性能飛躍;技術(shù)積累與系統(tǒng)性創(chuàng)新,是彎道超車(chē)、降本增效的。
2. 開(kāi)源與專(zhuān)利可以共存,形成“雙贏模式”
開(kāi)源不是“白白送人”,也不是與商業(yè)化對(duì)立;專(zhuān)利也不是“封閉壟斷”,關(guān)鍵看企業(yè)如何設(shè)計(jì)授權(quán)條款,讓更多人受益的同時(shí),保證自身投資回報(bào)。
3. 中小企業(yè)也能在大模型賽道突出重圍
DeepSeek并非“超級(jí)大廠”,打破行業(yè)對(duì)大模型的一些傳統(tǒng)認(rèn)知;只要足夠聚焦、創(chuàng)新點(diǎn)過(guò)硬,小公司同樣能在AI浪潮中嶄露頭。
4. 建立健康的AI開(kāi)源生態(tài),離不開(kāi)行業(yè)的共同努力
大廠的開(kāi)放策略、民間社區(qū)的積極貢獻(xiàn)、專(zhuān)利保護(hù)與共享機(jī)制,這些都需要更多機(jī)構(gòu)和人才參與。隨著更多像DeepSeek這樣兼具技術(shù)實(shí)力與開(kāi)源精神的企業(yè)涌現(xiàn),中國(guó)在大模型領(lǐng)域有望形成更具活力、更具競(jìng)爭(zhēng)力的生態(tài)。
在這樣一條道路上,DeepSeek不僅收獲了社區(qū)人氣與國(guó)際聲譽(yù),也為自身后續(xù)擴(kuò)張打下堅(jiān)實(shí)基礎(chǔ)。更重要的是,它為國(guó)內(nèi)外AI行業(yè)提供了一個(gè)值得借鑒的范本:在快速迭代、高度競(jìng)爭(zhēng)的AI時(shí)代,“技術(shù)護(hù)城河 + 社區(qū)共創(chuàng)”才是持續(xù)發(fā)展之道。
未來(lái),隨著DeepSeek不斷完善其大模型生態(tài)并推出更多創(chuàng)新應(yīng)用,或許會(huì)有更多企業(yè)被激勵(lì)跟進(jìn),形成“高效率、低門(mén)檻”的大模型新范式。讓我們拭目以待。
(原標(biāo)題:DeepSeek為何一邊“開(kāi)源大模型”,一邊“申請(qǐng)專(zhuān)利”?)
來(lái)源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:佑斌
編輯:IPRdaily辛夷 校對(duì):IPRdaily縱橫君
注:原文鏈接:DeepSeek為何一邊“開(kāi)源大模型”,一邊“申請(qǐng)專(zhuān)利”?(點(diǎn)擊標(biāo)題查看原文)
「關(guān)于IPRdaily」
IPRdaily是全球領(lǐng)先的知識(shí)產(chǎn)權(quán)綜合信息服務(wù)提供商,致力于連接全球知識(shí)產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來(lái)自于中國(guó)、美國(guó)、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國(guó)等15個(gè)國(guó)家和地區(qū)的高科技公司及成長(zhǎng)型科技企業(yè)的管理者及科技研發(fā)或知識(shí)產(chǎn)權(quán)負(fù)責(zé)人,還有來(lái)自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬(wàn)用戶(hù)(國(guó)內(nèi)70余萬(wàn)+海外近30萬(wàn)),2019年全年全網(wǎng)頁(yè)面瀏覽量已經(jīng)突破過(guò)億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來(lái)自IPRdaily中文網(wǎng)(iprdaily.cn)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://globalwellnesspartner.com
文章不錯(cuò),犒勞下辛苦的作者吧