原標題:塵封的專利"寶藏"該如何挖掘?
專利數(shù)據(jù)作為大數(shù)據(jù)的一種,具有與新技術(shù)聯(lián)系緊密、產(chǎn)業(yè)領(lǐng)域覆蓋范圍廣、內(nèi)容信息豐富、數(shù)據(jù)詳實準確、數(shù)據(jù)獲取方便等優(yōu)勢,是技術(shù)創(chuàng)新的基礎(chǔ)性、戰(zhàn)略性信息資源。在大數(shù)據(jù)時代,以新的視角和新的手段審視并充分利用專利數(shù)據(jù),將專利信息分析與產(chǎn)業(yè)運行決策深度融合,將有利于市場有效配置技術(shù)創(chuàng)新要素,有利于技術(shù)創(chuàng)新成果直通實體經(jīng)濟,驅(qū)動新常態(tài)下的國家經(jīng)濟轉(zhuǎn)型升級。
在筆者看來,大數(shù)據(jù)時代專利信息利用,存在數(shù)據(jù)鴻溝和認知差異兩大矛盾。大數(shù)據(jù)的核心意義不在于數(shù)據(jù)的“大”,而在于“據(jù)”,價值重點在于通過數(shù)據(jù)挖掘分析來支撐科學(xué)決策。在大數(shù)據(jù)時代,擁有專利數(shù)據(jù)并不等于擁有了應(yīng)用、處理專利數(shù)據(jù)的能力。一方面,專利數(shù)據(jù)量快速增長與有價信息快速檢索之間存在矛盾,數(shù)據(jù)洪流帶來的信息超載問題不但沒有得到有效解決,而且表現(xiàn)出數(shù)據(jù)鴻溝日益加深的趨勢,現(xiàn)有基于原始專利文獻所提供的數(shù)據(jù)入口難以滿足用戶關(guān)于更全、更準、更便捷獲取信息的需求;另一方面,專利檢索分析的專業(yè)性強與知識產(chǎn)權(quán)行業(yè)外的普通用戶的數(shù)據(jù)檢索分析能力間存在矛盾,普通用戶難以掌握專利文獻專業(yè)高效的檢索工具,這加大了專利信息普及應(yīng)用的難度。在這一背景下,如何方便、快捷、全面、高效地利用專利數(shù)據(jù)獲取所需信息仍然是用戶痛點,如何從本質(zhì)上提升專利信息平臺的智能化水平仍然是專利信息服務(wù)商亟需解決的首要問題。
面向數(shù)據(jù)精細化和融合化的專利數(shù)據(jù)深加工,是大數(shù)據(jù)時代解決專利數(shù)據(jù)可及性的根本措施。近年來,自然語言處理、人工智能、機器學(xué)習(xí)等技術(shù)發(fā)展有力地推動了專利數(shù)據(jù)的挖掘利用,但在化解專利數(shù)據(jù)可及性障礙方面并未取得質(zhì)的飛躍。一個專利信息平臺通常涉及數(shù)據(jù)資源、軟件功能及其支撐硬件3個要素,當從軟件技術(shù)角度解決信息平臺智能化問題陷入瓶頸時,人們重新把注意力集中到數(shù)據(jù)層面,試圖通過加工實現(xiàn)數(shù)據(jù)“增值”,解決專利數(shù)據(jù)可及性問題。
一方面,人們通過數(shù)據(jù)深加工探尋進入專利數(shù)據(jù)寶庫的途徑,將隱藏在原始專利文獻中的高價值信息顯性化,通過結(jié)構(gòu)化標引增加更為細致、更多維度的信息獲取入口,分流引導(dǎo)數(shù)據(jù)洪流;另一方面,通過數(shù)據(jù)深加工,打通專利數(shù)據(jù)寶庫及其相關(guān)數(shù)據(jù)資源的橋梁,將不規(guī)范數(shù)據(jù)予以規(guī)范化,將不同的檢索語言進行映射關(guān)聯(lián),將專利與產(chǎn)業(yè)、產(chǎn)品、技術(shù)進行映射關(guān)聯(lián),提供鏈接數(shù)據(jù)孤島的接口和切入點,促進數(shù)據(jù)孤島的互聯(lián)互通。因此,大數(shù)據(jù)時代下的專利數(shù)據(jù)深加工,對于解決用戶使用專利數(shù)據(jù)的“痛點”和“癢點”具有重要意義。
專利數(shù)據(jù)承載著時間、空間、主體(申請人或發(fā)明人等)、客體(技術(shù)主題或技術(shù)領(lǐng)域等)4個維度的信息,其中,專利權(quán)的主體和客體是數(shù)據(jù)深加工的重點對象,數(shù)據(jù)精細化、融合化是大數(shù)據(jù)時代的數(shù)據(jù)深加工方向,數(shù)據(jù)越加工越有價值,數(shù)據(jù)越關(guān)聯(lián)越有價值。
當前,通過面向精細化和融合化的數(shù)據(jù)深加工,數(shù)據(jù)鴻溝正在變淺,認知差異正在化解。在筆者看來,隨著專利數(shù)據(jù)深加工工作的不斷深入,“讓人們用便捷的方法獲取信息、找到所求”的夢想將照進現(xiàn)實,專利數(shù)據(jù)將不再是塵封的“寶藏”,專利信息將為用戶創(chuàng)造更多的價值。
【關(guān)閉】