TWI255409B - Method for transforming grammar to search patent information - Google Patents

Method for transforming grammar to search patent information Download PDF

Info

Publication number
TWI255409B
TWI255409B TW094101774A TW94101774A TWI255409B TW I255409 B TWI255409 B TW I255409B TW 094101774 A TW094101774 A TW 094101774A TW 94101774 A TW94101774 A TW 94101774A TW I255409 B TWI255409 B TW I255409B
Authority
TW
Taiwan
Prior art keywords
grammar
search
conversion method
string
database
Prior art date
Application number
TW094101774A
Other languages
English (en)
Other versions
TW200627188A (en
Inventor
Chung-I Lee
Chien-Fa Yeh
Xiao-Di Fan
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Priority to TW094101774A priority Critical patent/TWI255409B/zh
Priority to US11/306,921 priority patent/US20060200452A1/en
Application granted granted Critical
Publication of TWI255409B publication Critical patent/TWI255409B/zh
Publication of TW200627188A publication Critical patent/TW200627188A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

1255409 九、發明說明: 【發明所屬之技術領域】 本發明涉及-健訊檢索綠,尤其涉及/種專锻訊檢索之語法轉換方 法。 、 【先前技#
專利資訊,是指包括專利申請、授權、專利法律狀態、專利技術内容等資訊 ,集合’,集了大量的技術資訊、經濟資訊和法律資訊,是—個反映科技發展 最迅速^全面、最系統的知識庫。翻f訊對於技術進步和科研^發具冑“ 重要的意義。所以,如縛鱗狀,纖紗已知彼,瞭^握技術的 發展歷程;如.较絲,醜雛概爭對補新產品以及辭對手所取得 的專利二如果從事應用研究,則必須不時注意相關領域中的新專利和送審中的專 利’以幕握關鍵技術之發展動向。而專利檢索可以幫助研發人員和企業,追縱技 術發展動向,掌握研發方向和研擬市場競爭策略,避免重復研究所造成的人力、 物力、時間等資源的浪費,並及時把握競爭對手的發展動向。 查詢專利在過去是-項既費時又費事的工作,首先 吕j更…、法建立專門圖書館。其次專利既是技術文件又是法律文件,其專利 特殊的檢索系統和檢索策略,不是研究人員所熟悉,所以多半是委由專 機翻專利檢綱代為檢索。由於翻檢索細不普及和檢 產力文到相當程度的影響。 mi ^後’隨著網際網路的發展,為專利資赌索開拓了新的局面。雜研究人 善介面’連線檢索各國的專利資訊。然而,這些網站所支 ====度的差別’使用戶在不同國家的專利資訊網站進纖 =3獻力概了蜂__式設計,沒 中:手工辟厂二…析帽檢鲜串逐字眺,其語法綱後入代碼 中,手工、扁寫Java代碼;且語法維護困難,邏術复雜。
換為各咖賴站上細嫩法,_戶準顧臟細專利J 6 1255409 Λ ’其=J^aCC設計檢索程式,語法描述採用腳範式(Backus Naur F〇™,巴 ^諾_办提供銳分析;自_生―代碼;且語法轉料,語法簡 【發明内容】 &本發明之主要目的在於提供專利資訊檢索之語法轉換方法,其可藉由對專利 貪訊,檢索語法進行自動轉換,實現對不同國家的專利資姻站進行檢索。 上舄達成上述之目的,本發日月提供一種專利#訊檢索之語法轉換方法, 資料庫之語法參考文件,該方法包括以下步驟··輸入檢 二字串’對輸入字串的語法定義採用BNF範式(BackusNaurFbmi,巴科斯_諾^ =式),對輸入的檢索字串進行語法分析,即將檢索字串自動切分成個體進行 二、和刀析刀析過私中利用的工具是JavaCC(Java c〇m碑c⑽咖純^ =分析式);對檢索料_粉後,生成語法樹;触成的語法樹進 =化’如^行條件合併;對優化後的個體進行語意分析,識別個體在資料庫 所表示的語意,並執行類型檢查;經過各類分析後,進行語法轉換,藉由載入 =同^ Schema語言,將上述分析後的語法轉譯成不同的檢索語句,·藉由語法轉 半、,可以,SQI伽CtUred〇UeryLailgUage,結構化查詢語言)檢索語句,在資 2庫中= 了檢索;若需要檢索鱗赚資辦巾無法檢索到,或者資料庫所 ^的資K不夠王面’貝I丨可藉由语法轉換自動生成適合各國專利局網上資料庫檢 、一法^目關檢索語句’直接至各國專利局網上資料庫進行檢索,·此外,藉由語 =專換1可生成XML^e^e Markup ,可擴展標記語言)語句等其他 。式的k索口口句。其中’藉由語法轉換而生成的各類檢索語句,其生 第一種是將Java代碼礙入到JavaCC腳本;第二種是利用珊 疋一個JavaCC _件,通過縦擴充JavaCC生成的解析器)產生動態樹結構。 利用本舍明,可提供通用的專利語法,並實職檢索語法自動轉換為各 :貧_站上的不同檢索語法,方便用戶準確快捷聽索相關專利資气。 【實施方式】 、 參閱第-圖所示,係實施本發明專利資訊檢纟之語法轉換 圖’,複數_端電腦丄、至少一伺膨、至少—資料庫3及== 連起來的網路4。用戶藉由使用者端福1輸人-檢索字串並發送至舰器2, 1255409 伺服杰2對该檢索字串進行語法分析,從資料庫3中快速搜索相關專利資訊,並 將搜索結果進行處理後傳送至使用者端電腦工;若資料庫3中沒有相關專利資 吼’伺服器2可自動將輸入的檢索字串進行語法轉換,即將語法轉譯為相應國家 專利網站的齡絲,並触麟4幼細家的糊晴進行獻及獲取搜索 結果。 網路4可以是一企業内部網㈤恤过),也可以是網際網路(恤誠)或豆 他類型通訊網路。使用者端電腦!提供—互動胡戶介面,以便於用戶_亍專利 資訊檢索及查看相關結果。 貪料庫3中存儲有伺服器2藉由網際網路下載之各國專利資訊,並且存儲一 • 語法參考文件,其列出定義的各類語法及對應的内容描述等資訊,如專利名稱 (?*__)在檢索時可用瓜表示,專利權人(越辦心講)用—表示,專 利摘要(Abstract)用ABST表示,專利描述(Specfficati〇n)用SPEC表示,專利範圍 (Claim)用 ACLM 表示,專利號(patent Numbe_ PN 表示,申請號(Applicati〇n Number)用APN表示,專利公告曰期(IssueDate)用ISD表示等等。 參閱第二圖所示,係本發明專利資訊檢索之語法轉換方法之流程圖。首先, 輸入檢索字串,對輸入字串的語法定義採用BNF範式(Backus Naur Form,巴科 斯-諾爾範式),例如檢索在2004年專利權人(AN)是B公司或者C公司,且專利 範圍(ACLM)包含連接器(Connector)的所有專利,其檢索字串為AN/(B or C) and ACLM/ConnectorAND ISD/[2004.1.1-2004.12.31],其中 AN、ACLM 及 ISD 為自 籲 定義語法(步驟si)。對輸入的檢索字串進行語法分析,即參照資料庫3中的語法 參考文件’將檢索字串自動切分成個體進行辨識和分析,分析過程中利用的工具 是JavaCC(Java Compiler Compiler,純Java的詞法分析建構程式),如對上述查詢 的分析,其JavaCC片段如下所示: 〈LPAREN: “(",> 〈LPAREN: ‘7,> <STRING: ([ΠΑ”-ΠΖΠ,’ΌΠ-”9Π])+ > 〈QUOTED—STRING: ‘‘\\丨’,,(〜[π\\ππ])+ ”\\,,,’ > <AND: (“AND” I “&&,,)> <OR:(“OR,,|“||,,)> 8 1255409 〈TERM: [“AN”,,,ACLM”,,,ISD”,,,ABSr,]> 舰/(B or C) — ACLM/Connector AND ISD/[2004.1.1-2004.12.31](步驟 S2)。 對檢索字串自動切分後,生成如第三圖所示的語法樹(步驟S3)。對生成的語 法樹進行優化,例如進行條件合併,如上述檢索專利權人(綱是B公司或者c 公司所帽的糊,若其輸人的檢索料為州細^舰^),則可優化為姻你 or C)(步驟S4)。對優化後的個體進行語意分析,如識別個體“顺,,在資料庫中所 表不的語意應為專利權人,且執行類型檢查,AN應為字元類型,而代表公告曰 的ISD應為日期類型(步驟S习。經過各類分析後,進行語法轉換,通過载入不同 的Schema語言,將上述分析後的語法轉譯成不同的檢索語句(步驟神。藉由語 法轉換’可以生成SQL(Structured Query Language,結構化查詢語言)檢索語句, 在貧料庫3中進行檢索,例如上述檢索專利權人是B公司或者^公司所申請的 連接器專利藉由語法轉換後生成如下所示SqL語句(片段): (CONTAINS(PAIENTJNF〇.TX$ASN NAME, ^BorC^andCONTAINSCPAreNT^^ ^Connector >〇 )
AndDECISION_DAmTO^DAm(20(M.^ . fyyyy.mm.dd)AND TO一DATE(’2004.12.31丨,丨yyyy.mm.dd)(步驟 S7) 〇 若需要檢索的專利資訊在資料庫3中並不存在,或者:#料庫3所射堵的資訊 不夠全面,則可藉由語法轉換自動生成適合各國專利局網上資料庫檢索語法的相 關檢索語句’直接至各國專利局網上資料庫進行搜索(步驟S8)。此外,藉由語法 轉換射生成XMLCExtensible Markup㈣嗯,可擴展標記語言)語“其:格 式的檢索語句,以適應不同類型語法的要求(步驟S9)。 在上述檢索語法之雛方法流程中,檢索字串可藉由語法雛而自動生成不 ^格式的代碼,其生成方式有兩種類型,第一種是將Java代碼嵌入到加紅腳 本’第二種是利用版egjlYee是-個JavaCC的插件,通過縱擴充加從 生成的解析器)產生動態樹結構。 ㈣Γί三圖所示,係本發明專利資爾之語法_去之語法麵。語法 树係對檢索語法進行語法分析後所生成。上述實施方式中舉例:檢索麵 ^人是Β公贼者C公司,蝴_包含連接雜特翻,额幸字串 為姻/(BorQandAO娜Connector娜筒[胤i 12帆12叫觸檢索字 Ϊ255409 串進行語法分析後,則生成如本圖所示的語法樹。 本發明雖以較佳實施例揭露如上,然其並非用以限定本發明。任何熟悉此項 技藝者’在不脫離本發明之精神和範圍内,當可做更動與潤飾,因此本發明之保 護範圍當視後附之申請專利範圍所界定者為準。 【圖式簡單說明】 第一圖係本發明專利資訊檢索之語法轉換方法之系統架構圖。 第一圖係本發明專利資訊檢索之語法轉換方法之流程圖。 第二圖係本發明專利資訊檢索之語法轉換方法之語法樹圖。 【主要元件符號說明】 > 使用者端電腦 丨 應用伺服器 2 資料庫 3 網路 10

Claims (1)

1255409 十、申請專利範圍: L 訊檢索之語法轉換方法,其法轉換時參照—存儲於資料庫 法苓考文件,其改良在於,該方法包括如下步驟: 藉由使用者端電腦輸入檢索字串; 错由所述使用者端電腦相連之伺服器,對輸入的檢索字串進行語法分析, (Γ貝料庫中;^的語法茶考文件,將檢索字串自動切分成個體進行辨識 對檢索字串自動切分後,生成語法樹; 對生成的語法樹進行優化;
對優化後的個體進行語意分析,識別個體在資料庫中所表示的語竟 型檢查; ,並執行類 進行法轉換’藉由載入不同的Schema 同的檢索語句;及 吕吾言’將上述分析後的語法轉譯成不 稭由語法無’自触錢合各畴觸社:麟庫檢索語法的細檢索語 句’直接至各國專利局網上資料庫進行搜索。 一° 2.如申請專利範圍第1項所述之專利資織索之語法轉換方法,其中,所 入檢索字串之語法定義採用BNF範式。 則
3·如申凊專纖圍第工項所述之專利資謝衾索之語法轉換方法,其巾,所 輸入的k索子串進行語法分析係採用javacc語言來實現。 4·如申請專利範圍第i項所述之專利資謝衾索之語法轉換方法,其巾,所述夢 由語法轉換而生成的檢索語句可為生成SQL檢索語句,該SQL檢索語1 業内存儲專利資訊的資料庫進行檢索。 止 5·如申請專利範圍第χ項所述之專利資嫌索之語法轉換方法,其中,所 由語法轉換而生成的檢索語句可為生成XML語言格式的檢索語$。 9 6·如申請專概圍第i項所述之專利資謝叙索之語法轉換方法,其巾,所 由語法轉換而生成檢索語句,其生成方式有如下兩種類型: ,、 將Java代碼嵌入到javacc腳本;及 利用JJTree產生動態樹結構。 11
TW094101774A 2005-01-21 2005-01-21 Method for transforming grammar to search patent information TWI255409B (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW094101774A TWI255409B (en) 2005-01-21 2005-01-21 Method for transforming grammar to search patent information
US11/306,921 US20060200452A1 (en) 2005-01-21 2006-01-17 Method for translating syntax of patent information search

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW094101774A TWI255409B (en) 2005-01-21 2005-01-21 Method for transforming grammar to search patent information

Publications (2)

Publication Number Publication Date
TWI255409B true TWI255409B (en) 2006-05-21
TW200627188A TW200627188A (en) 2006-08-01

Family

ID=36945260

Family Applications (1)

Application Number Title Priority Date Filing Date
TW094101774A TWI255409B (en) 2005-01-21 2005-01-21 Method for transforming grammar to search patent information

Country Status (2)

Country Link
US (1) US20060200452A1 (zh)
TW (1) TWI255409B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021848B (zh) * 2006-02-15 2010-08-25 鸿富锦精密工业(深圳)有限公司 资讯搜索系统及方法
US9146985B2 (en) * 2008-01-07 2015-09-29 Novell, Inc. Techniques for evaluating patent impacts
US20100057733A1 (en) * 2008-09-02 2010-03-04 Suresh Ravinarayanan Purisai Method, computer program product, and apparatus for enabling access to enterprise information
US20130091266A1 (en) 2011-10-05 2013-04-11 Ajit Bhave System for organizing and fast searching of massive amounts of data
US9081834B2 (en) 2011-10-05 2015-07-14 Cumulus Systems Incorporated Process for gathering and special data structure for storing performance metric data
US9081829B2 (en) 2011-10-05 2015-07-14 Cumulus Systems Incorporated System for organizing and fast searching of massive amounts of data
SG11201508013YA (en) * 2013-03-29 2015-10-29 Cumulus Systems Inc Organizing and fast searching of data
CN106484686A (zh) * 2016-10-21 2017-03-08 长沙市麓智信息科技有限公司 专利智能翻译系统及其翻译方法
CN106484685A (zh) * 2016-10-21 2017-03-08 长沙市麓智信息科技有限公司 专利实时学习系统及其学习方法
CN107292167B (zh) * 2017-06-27 2020-03-10 北京计算机技术及应用研究所 基于精简语法树的sql语句安全检测方法
CN110020006B (zh) * 2017-07-27 2021-04-27 北京国双科技有限公司 查询语句的生成方法及相关设备
US11030261B1 (en) * 2020-08-06 2021-06-08 Coupang Corp. Computerized systems and methods for managing and monitoring services and modules on an online platform

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6963920B1 (en) * 1993-11-19 2005-11-08 Rose Blush Software Llc Intellectual asset protocol for defining data exchange rules and formats for universal intellectual asset documents, and systems, methods, and computer program products related to same
US6286138B1 (en) * 1998-12-31 2001-09-04 International Business Machines Corporation Technique for creating remotely updatable programs for use in a client/server environment
US6662178B2 (en) * 2001-03-21 2003-12-09 Knowledge Management Objects, Llc Apparatus for and method of searching and organizing intellectual property information utilizing an IP thesaurus
US6925457B2 (en) * 2001-07-27 2005-08-02 Metatomix, Inc. Methods and apparatus for querying a relational data store using schema-less queries
US7293024B2 (en) * 2002-11-14 2007-11-06 Seisint, Inc. Method for sorting and distributing data among a plurality of nodes
US7386541B2 (en) * 2004-03-18 2008-06-10 Microsoft Corporation System and method for compiling an extensible markup language based query

Also Published As

Publication number Publication date
TW200627188A (en) 2006-08-01
US20060200452A1 (en) 2006-09-07

Similar Documents

Publication Publication Date Title
TWI255409B (en) Method for transforming grammar to search patent information
JP4654776B2 (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
CN101290624B (zh) 一种新闻网页元数据自动抽取方法
Hoehndorf et al. The flora phenotype ontology (FLOPO): tool for integrating morphological traits and phenotypes of vascular plants
CN1906609A (zh) 在数据中心中使用的用于进行数据格式转换的系统
Bird et al. Extending Dublin Core metadata to support the description and discovery of language resources
Krek et al. European lexicographic infrastructure (elexis)
Alonso et al. Expertise identification and visualization from CVS
Prudhomme et al. Automatic Integration of Spatial Data into the Semantic Web.
Çöltekin et al. Resources for Turkish natural language processing: A critical survey
Xu et al. Chinese emotion lexicon developing via multi-lingual lexical resources integration
Blätte et al. How germaparl evolves: Improving data quality by reproducible corpus preparation and user involvement
Du et al. Understanding progress in software citation: a study of software citation in the CORD-19 corpus
CN1808427A (zh) 专利信息检索的语法转换方法
Das et al. Developing bengali wordnet affect for analyzing emotion
Baisa et al. Software and Data for Corpus Pattern Analysis.
Westphal et al. Countering language attrition with PanLex and the Web of Data
CN116913548A (zh) 不良反应数据分析方法、装置、电子设备和存储介质
Zhang et al. Architecture Decisions in AI-based Systems Development: An Empirical Study
Srivastava et al. How to configure statistical machine translation with linked open data resources
Subercaze Chaudron: extending DBpedia with measurement
Tianwen et al. Evaluate the chinese version of machine translation based on perplexity analysis
Wang et al. The syntax and semantics of verbs of searching
Fan Effectiveness model of automatic machine translation of publicity texts based on deep learning
Piros New automatic interpreter for complex UDC numbers

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees