TW201828104A - 申請專利範圍之解析紀錄方法 - Google Patents

申請專利範圍之解析紀錄方法 Download PDF

Info

Publication number
TW201828104A
TW201828104A TW106103109A TW106103109A TW201828104A TW 201828104 A TW201828104 A TW 201828104A TW 106103109 A TW106103109 A TW 106103109A TW 106103109 A TW106103109 A TW 106103109A TW 201828104 A TW201828104 A TW 201828104A
Authority
TW
Taiwan
Prior art keywords
definition
component
scope
text
component definition
Prior art date
Application number
TW106103109A
Other languages
English (en)
Inventor
蔡宏興
Original Assignee
雲拓科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 雲拓科技有限公司 filed Critical 雲拓科技有限公司
Priority to TW106103109A priority Critical patent/TW201828104A/zh
Priority to US15/652,202 priority patent/US20180210873A1/en
Priority to EP17208691.0A priority patent/EP3355202A1/en
Priority to CN201810022758.3A priority patent/CN108446259A/zh
Priority to JP2018006724A priority patent/JP2018120590A/ja
Publication of TW201828104A publication Critical patent/TW201828104A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Technology Law (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Library & Information Science (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一種申請專利範圍之解析紀錄方法,係讀取一申請專利範圍之文字定義以得出一元件定義並予以紀錄,包含一元件定義得出步驟,根據一詞性資料庫及一詞性斷句規則,自申請專利範圍之文字定義中讀取出一名詞詞首文字,接著在名詞詞首文字之後讀取出對應於名詞詞首文字的一中間判斷文字且/或對應於名詞詞首文字的一斷句文字,藉此而得出一元件定義;一元件定義紀錄步驟,將元件定義得出步驟所得出的元件定義予以結合於一元件定義屬性標籤而紀錄於一序列文字檔案;以及一序列文字檔案儲存步驟,係將序列文字檔案予以紀錄於一非關連式資料庫。

Description

申請專利範圍之解析紀錄方法
本發明相關於一種申請專利範圍的解析紀錄方法,係讀取一申請專利範圍之文字定義以得出一元件定義並予以紀錄於一序列文字檔案。
申請專利範圍為專利說明書的核心,包含有元件定義(包含:標的、主要元件、次要元件等)及敘述定義(即,連接關係敘述、補述等)等細部結構。然而,各個元件定義之間以及元件定義與敘述定義之間關係複雜,造成閱讀不易而不易瞭解,即使經初步瞭解其關係之後,但在進行分析時由於申請專利範圍未經整理也會有不易整理出分析報告的問題。此外,如可整理出元件定義,則在專利檢索及專利分析上,皆會有極大的幫助。因此,如何整理出元件定義及敘述定義係為一課題。
習知並無以詞性關係而得出申請專利範圍的元件定義(包含:標的、主要元件、次要元件等)及敘述定義(即,連接關係敘述、補述等)的技術。習知有關申請專利範圍之拆解處理係有將申請專利範圍予以分解為獨立項與附屬項。此外,習知技術(例如,台灣專利號I347561以及I400621)中申請專利範圍的元件定義之辨識係以將申請專利範圍的個別文字予以比對一文字資料庫中文字之方式而逐字比對,但是這樣的方式有以下缺點:(1)必須建立龐大的文字資料庫;(2)對於元件定義以及敘述定義必須個別建立元件定義文字資料庫以及敘述定義文字資料庫;(3)即使經過辛苦建立了該些文字資料庫之後,在當申請專利範圍的文字定義或敘述定義不屬於該些文字資料庫中之文字時,需再重新加入新的元件定義及敘述定義至該些文字資料庫中而相當麻煩;(4)在將單個文字定義予以與具有龐大內容的文字資料庫相互比對的過程將需花費非常龐大的時間,更何況專利資料庫中的申請專利範圍項目的文字係以數十億至數百億計算,所需辨識出的元件定義以及敘述定義更為以億計,因此要將該數億個文字定義予以逐一比對於文字資料庫並不可行。由此可知,習知技術的該方法並不科學而並不可行。因此,面對數量龐大且規則不一的申請專利範圍元件定義及敘述定義的辨識,需要一有效而可行的解析方法乃成為一個課題。
對此,本發明之申請人發現藉由英文詞性的關係,利用詞性分類上為數量有限的「關係代名詞」、「介系詞」、「分詞之結尾符號」等詞性辨識而快速地辨識出詞性,並藉由以詞性所建立的一詞性資料庫及根據該詞性資料庫所建立的一詞性斷句規則而執行申請專利範圍之解析以得出一元件定義,並接續得出敘述定義,藉此而可快速有效的得出該元件定義及該敘述定義。
此外,由於面對所要存取的係為數量龐大的申請專利範圍以及數量更為龐大的元件定義及敘述定義,因此資料存取速度是必須要解決的問題。在一般的資料儲存技術中,係將經邏輯處理後所得出的資料予以儲存於一經正規化處理後的一關連式資料庫之資料表中,以在需使存取該資料時藉由存取該資料表而使用該資料。然而,以關連式資料庫儲存具有元件定義及敘述定義的申請專利範圍資料有以下缺點:(1)將攫取出的大量元件定義及敘述定義依序儲存至該關連式資料庫將耗費大量時間;(2)元件定義與敘述定義之間的關連性不容易於關連式資料庫中設定建立,需要複雜的資料連接設定;(3)元件定義、敘述定義、案名、說明書、書目資料等之間的關連性不容易於關連式資料庫中建立,需要複雜的資料連接設定;(4)關連式資料庫需要以資料表的聯集或交集進行運算,存取時將耗費大量時間;(5)關連式資料庫本身的存取速度較慢。然而,專利的申請專利範圍係為一非結構化資料,且所得出的元件定義與敘述定義又需有多重的應用(例如,檢索、關連於說明書以及分析),且數量極為龐大,因此在攫取出申請專利範圍的元件定義及敘述定義後,需使用儲存容易、存取速度快、應用性高的非關連式資料庫進行資料的儲存。
因此,本發明的目的即在提供一種申請專利範圍之解析紀錄方法,藉由英文詞性的關係,利用詞性分類上為數量有限的「關係代名詞」、「介系詞」、「分詞之結尾符號」等詞性辨識而快速地辨識出詞性,並藉由以詞性所建立的一詞性資料庫及根據該詞性資料庫所建立的一詞性斷句規則而執行申請專利範圍之解析以得出一元件定義,並接續得出敘述定義,藉此而可快速有效的得出該元件定義及該敘述定義。且將所得出的該元件定義予以結合於一元件定義屬性標籤而紀錄於一序列文字檔案,並將該序列文字檔案予以紀錄於一非關連式資料庫。藉此以簡化元件定義/敘述定義之儲存、加速儲存與存取之速度及簡化元件定義/敘述定義的應用複雜度。
本發明為解決習知技術之問題所採用之技術手段係提供一種申請專利範圍之解析紀錄方法,係讀取一申請專利範圍之文字定義以得出一元件定義並予以紀錄,包含:一元件定義得出步驟,根據一詞性資料庫及一詞性斷句規則,自該申請專利範圍之文字定義中讀取出一名詞詞首文字,接著在該名詞詞首文字之後讀取出對應於該名詞詞首文字的一中間判斷文字且/或對應於該名詞詞首文字的一斷句文字,藉此而得出一元件定義;一元件定義紀錄步驟,將該元件定義得出步驟所得出的該元件定義予以結合於一元件定義屬性標籤而紀錄於一序列文字檔案;以及一序列文字檔案儲存步驟,係將該序列文字檔案予以紀錄於一非關連式資料庫。
在本發明的一實施例中係提供一種申請專利範圍之解析紀錄方法,該元件定義得出步驟進一步包含一元件定義結合步驟,係將一元件定義及該元件定義後之接續元件定義予以根據一結合文字資料庫而結合該元件定義及該元件定義後之接續元件定義而形成一結合後的元件定義。
在本發明的一實施例中係提供一種申請專利範圍之解析紀錄方法,進一步包含一連接關係敘述得出步驟,係根據該元件定義得出步驟所得出的該元件定義而將該元件定義之後的文字定義予以作為一連接關係敘述而得出該連接關係敘述。
在本發明的一實施例中係提供一種申請專利範圍之解析紀錄方法,係將該連接關係敘述得出步驟所得出的該連接關係敘述予以結合於一連接關係敘述屬性標籤而紀錄於該序列文字檔案,並將該序列文字檔案予以紀錄於一非關連式資料庫。
在本發明的一實施例中係提供一種申請專利範圍之解析紀錄方法,該元件定義、結合於該元件定義的該元件定義屬性標籤、該連接關係敘述、及結合於該連接關係敘述的該連接關係敘述屬性標籤係以該元件定義及該連接關係敘述於該申請專利範圍之文字定義中的順序而紀錄於該序列文字檔案。
在本發明的一實施例中係提供一種申請專利範圍之解析紀錄方法,該非關連式資料庫並紀錄該元件定義之間的對應關係且/或紀錄該元件定義與該連接關係敘述之間的對應關係。
在本發明的一實施例中係提供一種申請專利範圍之解析紀錄方法,該元件定義紀錄步驟係以該文字定義被讀取的順序而將該元件定義紀錄至該序列文字檔案。
在本發明的一實施例中係提供一種申請專利範圍之解析紀錄方法,該元件定義紀錄步驟係以該文字定義被讀取的順序而將該元件定義及該連接關係敘述紀錄至該序列文字檔案。
本發明的申請專利範圍之解析紀錄方法具有以下之功效。藉由英文詞性的關係,利用詞性分類上為數量有限的「關係代名詞」、「介系詞」、「分詞之結尾符號」等詞性辨識而快速地辨識出詞性,並藉由以詞性所建立的一詞性資料庫及根據該詞性資料庫所建立的一詞性斷句規則而執行申請專利範圍之解析以得出一元件定義,並接續得出敘述定義,藉此而可快速有效的得出該元件定義及該敘述定義。且將所得出的該元件定義予以結合於一元件定義屬性標籤而紀錄於一序列文字檔案,並將該序列文字檔案予以紀錄於一非關連式資料庫。藉此以簡化元件定義/敘述定義之儲存、加速儲存與存取之速度及簡化元件定義/敘述定義的應用複雜度。
以下根據第1、2圖,而說明本發明的實施方式。該說明並非為限制本發明的實施方式,而為本發明之多個實施例中的一種。
如第1圖所示,本發明的一實施例的一種申請專利範圍之解析紀錄方法係讀取一申請專利範圍之文字定義以得出一元件定義並予以紀錄,包含:一元件定義得出步驟S1,根據一詞性資料庫及一詞性斷句規則,自該申請專利範圍之文字定義中讀取出一名詞詞首文字,接著在該名詞詞首文字之後讀取出對應於該名詞詞首文字的一中間判斷文字且/或對應於該名詞詞首文字的一斷句文字,藉此而得出一元件定義。
在本發明中,係藉由一詞性資料庫及一詞性斷句規則而進行元件定義之得出。以下首先介紹本發明的申請專利範圍之解析紀錄方法中的「元件定義得出步驟S1」的一實施例。在下文中,所有步驟係可由載入有本發明的申請專利範圍之解析紀錄方法的程式產品的一電腦系統而執行。
如第2圖所示,本發明中所使用的該詞性資料庫包含多數個詞性資料表,包括:名詞詞首資料表、關係代名詞資料表、從屬動詞資料表、第一分詞(Ved)資料表、第二分詞(Ving)資料表、介系詞資料表、斷句符號資料表。該名詞詞首資料表包含:「A, a, An, an, The, the, Said, said, at least+數字...」之名詞詞首文字,該關係代名詞資料表包含:「which, whose, where, wherein, where...」之關係代名詞文字,該從屬動詞資料表包含:「is, are, was, were...」之從屬動詞文字,該第一分詞(Ved)資料表包含:「provided以及以ed或是en為句尾之字...」之第一分詞文字,該第二分詞(Ving)資料表包含:「providing以及以ing為句尾之字...」之第二分詞文字,該介系詞資料表包含「with, to, in, on, at, over, above, below, along, through, via, within, onto...」之介系詞文字,該斷句符號表包含各個標點符號。請注意,由於詞性的判斷容易許多,介系詞、關係代名詞、從屬動詞等的數量皆非常有限,而分詞可藉由字尾的形式予以判斷,如此可大為簡化用為判斷之詞庫的大小。
在第2圖中,係逐字讀取申請專利範圍之文字定義以進行解析,當讀取到名詞詞首資料表中的字「A, a, The, the, Said, said, at least+數字...」,則在該字的位置處註記,作為所要得出的元件定義的開頭,於該第1圖中係以「○」記號作為表示,並繼續逐字讀取。在有了一元件定義的開頭之後,則藉由以詞性往下尋找該元件定義的之可能結尾,並在該「可能結尾處」做標記,如第三圖中「●」所示即為「可能之結尾處」。如前述,當遇到可能之結尾處,則需要繼續往後閱讀。當繼續往後閱讀,讀到第2圖所示「○」所屬資料表時,表示該可能結尾處被確定為結尾(即,判斷條件「成立」),則以前述「●」所標記位置作為斷句位置,而將自「○」至「●」的文字予以作為所攫取出的名詞。
以下依序說明第2圖的各列號之意義。
第1列至第3列,在攫取到「名詞詞首」之後,當攫取到「關係代名詞資料表」、「從屬動詞資料表」或「介系詞資料表」時,則以該「關係代名詞資料表」、「從屬動詞資料表」或「介系詞資料表」作為斷句位置(即,以「●」表示)。
第4列至第9列,在攫取到「名詞詞首」之後,當攫取到「第一分詞資料表」時,則繼續讀取。當繼續攫取到「第二分詞資料表」、「介系詞資料表」、「名詞詞首資料表」、「關係代名詞資料表」或「分詞資料表(包含第一分詞以及第二分詞)」,則該斷句判斷條件成立(即,以「○」表示),並以該「第一分詞資料表」的位置作為斷句位置(即,以「●」表示)。
第10列至第12列,在攫取到「名詞詞首」之後,當攫取到「介系詞資料表」時,則繼續讀取。當繼續攫取到「名詞詞首資料表」、「關係代名詞資料表」或「分詞資料表(包含第一分詞以及第二分詞)」,則該斷句判斷條件成立(即,以「○」表示),並以該「介系詞資料表」的位置作為斷句位置(即,以「●」表示)。
第13列,在攫取到「名詞詞首」之後,當攫取到「斷句資料表」時,則以該「斷句資料表」作為斷句位置(即,以「●」表示)。
以下,根據該詞性資料表的該斷句邏輯表格,如第1圖所示,並以文字:“a circuit board provided with an edge extending in a longitudinal direction of said circuit board;”為所要解構分析的文句作為實例,而說明如下。 (1) 當讀到“「a」circuit board provided with an edge extending in a longitudinal direction of said circuit board;”,其中「」中的文字為讀到的文字,因為「a」這個名詞屬於「名詞詞首資料表」,如第三列中列首標示有「1」的該列所示,繼續進行讀取(即,1+的動作); (2) 接著讀到“a 「circuit」 board provided with an edge extending in a longitudinal direction of said circuit board;”,此「circuit」並不屬於任何資料表,因此繼續讀取; (3) 接著讀到“a circuit 「board」 provided with an edge extending in a longitudinal direction of said circuit board;”,此「board」並不屬於任何資料表,因此繼續讀取; (4) 接著讀到“a circuit board 「provided」 with an edge extending in a longitudinal direction of said circuit board;”,此「provided」屬於第一分詞(Ved)資料表,即,其為動詞後接ed的第一分詞,因此根據該斷句邏輯表格,應進行項次標號為「5」至「10」的列的處理,該6種列的處理有一共通之處,即為將該第一分詞作為斷句處,並繼續向下讀取,以決定要選用哪一個列的處理; (5) 接著讀到“a circuit board provided 「with」 an edge extending in a longitudinal direction of said circuit board;”,此「with」屬於介系詞資料表,因此根據該斷句邏輯表格,應選取項次標號為「6」的該列的處理,該列的處理係為將表示決定出之前的第一分詞斷句處為「成立」,應以該第一分詞為斷句,將該斷句之前的部分,即,「circuit board」當作一所要得出的名詞,並繼續向下讀取; (6) 接著讀到“a circuit board provided with 「an」 edge extending in a longitudinal direction of said circuit board;”,此「an」這個名詞屬於「名詞詞首資料表」,並繼續進行讀取(即,1+的動作); (7) 接著讀到“a circuit board provided with an 「edge」 extending in a longitudinal direction of said circuit board;”,此「edge」並不屬於任何資料表,因此繼續讀取; (8) 接著讀到“a circuit board provided with an edge 「extending」 in a longitudinal direction of said circuit board;”,此「extending」為屬於第二分詞(Ving)資料表,此時需要之後所接的讀取字作為判斷; (9) 接著讀到“a circuit board provided with an edge extending 「in」 a longitudinal direction of said circuit board;”,此「in」為介系詞資料表,因此將之前為屬於第二分詞(Ving)資料表的extending排除於所要得出之名詞,而只取出「名詞詞首資料表」之「a」至斷句位置「extending」之中的字詞,作為所要得出之名詞,因此所得出為「edge」作為所要得出之名詞,並繼續讀取; (10) 接著讀到“a circuit board provided with an edge extending in 「a」 longitudinal direction of said circuit board;”,該「a」為屬於「名詞詞首資料表」,並繼續進行讀取(即,1+的動作); (11) 接著讀到“a circuit board provided with an edge extending in a 「longitudinal」 direction of said circuit board;”,該「longitudinal」並不屬於任何資料表,因此繼續讀取; (12) 接著讀到“a circuit board provided with an edge extending in a longitudinal 「direction」 of said circuit board;”,該「direction」並不屬於任何資料表,因此繼續讀取; (13) 接著讀到“a circuit board provided with an edge extending in a longitudinal direction 「of」 said circuit board;”,該「of」屬於介系詞資料表,因此根據該斷句邏輯表格,應進行項次標號為「11」至「13」的列的處理,該3列的處理係將決定以該介系詞作為斷句處,並繼續向下讀取,以決定要選用哪一個列的處理; (14) 接著讀到“a circuit board provided with an edge extending in a longitudinal direction of 「said」 circuit board;”,該「said」屬於「名詞詞首資料表」,因此選擇標號為「11」的該列,即,將該介系詞「of」為斷句予以成立,而取出自該名詞詞首「a」至該介系詞「of」之前的字詞,即,「longitudinal direction」作為所得出的名詞,並繼續讀取,並紀錄此時所得到的是一詞首名詞; (15) 接著讀到“a circuit board provided with an edge extending in a longitudinal direction of said 「circuit」 board;”,該「circuit」並不屬於任何資料表,因此繼續讀取; (16) 接著讀到“a circuit board provided with an edge extending in a longitudinal direction of said circuit 「board」;”,該「board」並不屬於任何資料表,因此繼續讀取; (17) 接著讀到“a circuit board provided with an edge extending in a longitudinal direction of said circuit board「;」”,該「;」為標點符號,屬於該斷句符號資料表,因此表示可進行斷句,而得出「said circuit board」作為所要得出之元件敘述。
此時,所得出的元件定義係如下「」中所示者: “ 「a circuit board」 provided with 「an edge extending」 in 「a longitudinal direction」 of 「said circuit board」;”。 請注意,為使元件敘述更為準確,如第1圖所示,本發明的申請專利範圍之解析記錄方法中該元件定義得出步驟S1進一步包含一元件定義結合步驟S11,係將一元件定義及該元件定義後之接續元件定義予以根據一結合文字資料庫中的文字,例如,“of”,而結合該元件定義「a longitudinal direction」及該元件定義後之接續元件定義「said circuit board」而形成一結合後的元件定義「a longitudinal direction of said circuit board」。如此,該所得出的元件定義係如下「」中所示者, “「a circuit board」 provided with 「an edge extending」 in 「a longitudinal direction of said circuit board」”。
如第1圖所示,本發明的該申請專利範圍之解析紀錄方法進一步包含一連接關係敘述得出步驟S22,係根據該元件定義得出步驟S1所得出的該元件定義而將該元件定義之後的文字定義予以作為一連接關係敘述而得出該連接關係敘述。亦即,將上述所得的元件定義「a circuit board」之後所接的「provided with」作為一連接關係敘述。
習知檢索資料庫係將將經邏輯處理後所得出的元件定義或敘述定義予以儲存於一關連式資料庫中的資料表,以在需使用該元件定義或敘述定義時藉由存取該資料表而使用該元件定義或敘述定義。本發明的該申請專利範圍之解析記錄方法,係將該元件定義得出步驟S1所得出的該元件定義予以結合於一元件定義屬性標籤而紀錄於一序列文字檔案,此處該元件定義屬性標籤係為該元件定義在申請專利範圍中所具有的結構屬性之標籤。例如,元件敘述係具有“&元件敘述標籤”、連接關係敘述係具有“&連接關係敘述標籤”。本發明的該申請專利範圍之解析記錄方法並包含一元件定義紀錄步驟S21,係將該元件定義得出步驟S1所得出的該元件定義予以結合於一元件定義屬性標籤而紀錄於一序列文字檔案。此外,如第1圖所示,本發明的該申請專利範圍之解析記錄方法並另包含將該連接關係敘述得出步驟S22所得出的該連接關係敘述予以結合於一連接關係敘述屬性標籤而紀錄於該序列文字檔案。
例如,以“a circuit board provided with an edge extending in a longitudinal direction of said circuit board;” 作為例子,則變為” {a circuit board &元件敘述標籤} {provided with &連接關係敘述標籤} {an edge &元件敘述標籤} {extending in &連接關係敘述標籤} {a longitudinal direction of said circuit board; &元件敘述標籤}”
請注意,在上述例子中可發現:該元件定義、結合於該元件定義的該元件定義屬性標籤、該連接關係敘述、及結合於該連接關係敘述的該連接關係敘述屬性標籤係以該元件定義及該連接關係敘述於該申請專利範圍之文字定義中的順序而紀錄於該序列文字檔案。
如第1圖所示,本發明的該申請專利範圍之解析紀錄方法係包含一序列文字檔案儲存步驟S3,而將上述之該序列文字檔案予以紀錄於一非關連式資料庫。
接下來,針對一申請專利範圍而提供本發明之申請專利範圍之解析紀錄方法的一實施例。
申請專利範圍:An apparatus of controlling a robot, the apparatus comprising: an image obtaining unit configured to obtain a three-dimensional image of a user; a driving unit configured to drive an arm of the robot that is composed of a plurality of segments; and a control unit configured to generate a user model that corresponds to a motion of the joint of the user based on the three-dimensional image, to generate a target model having the plurality of segments of which the length varies based on the user model, and to allow the arm of the robot to be driven based on the target model.
經由前述的元件定義得出步驟S1以及名詞合併步驟S23,可得到以下結果,其中所得出的元件敘述係以「」予以表示。
「An apparatus of controlling a robot」, 「the apparatus」 comprising: 「an image obtaining unit」 configured to obtain 「a three-dimensional image of a user」; 「a driving unit」 configured to drive 「an arm of the robot」 that is composed of 「a plurality of segments」; and 「a control unit」 configured to generate 「a user model」 that corresponds to 「a motion of the joint of the user」 based on 「the three-dimensional image」, to generate 「a target model」 having 「the plurality of segments」 of which 「the length」 varies based on 「the user model」, and to allow 「the arm of the robot」 to be driven based on 「the target model」。其餘未以「」所標示者,係為連接關係敘述。而所得出的該序列文字檔案將為: {An apparatus of controlling a robot, &元件敘述標籤} {the apparatus &元件敘述標籤} {comprising: &連接關係敘述標籤} {an image obtaining unit &元件敘述標籤} {configured to obtain &連接關係敘述標籤} {a three-dimensional image of a user; &元件敘述標籤} {a driving unit &元件敘述標籤} {configured to drive &連接關係敘述標籤} {an arm of the robot &元件敘述標籤} {that is composed of &連接關係敘述標籤} {a plurality of segments; &元件敘述標籤} {and &連接關係敘述標籤} {a control unit &元件敘述標籤} {configured to generate &連接關係敘述標籤} {a user model &元件敘述標籤} {that corresponds to &連接關係敘述標籤} {a motion of the joint of the user &元件敘述標籤} {based on &連接關係敘述標籤} {the three-dimensional image, &元件敘述標籤} {to generate &連接關係敘述標籤} {a target model &元件敘述標籤} {having &連接關係敘述標籤} {the plurality of segments &元件敘述標籤} {of which &連接關係敘述標籤} {the length &元件敘述標籤} {varies based on &連接關係敘述標籤} {the user model, &元件敘述標籤} {and to allow &連接關係敘述標籤} {the arm of the robot &元件敘述標籤} {to be driven based on &連接關係敘述標籤} {the target model. &元件敘述標籤}
以上之敘述以及說明僅為本發明之較佳實施例之說明,對於此項技術具有通常知識者當可依據以下所界定申請專利範圍以及上述之說明而作其他之修改,惟此些修改仍應是為本發明之發明精神而在本發明之權利範圍中。
S1、S11、S21、S22、S23、S3‧‧‧步驟
第1圖為顯示根據本發明的一實施例的一申請專利範圍之解析紀錄方法之一流程圖。 第2圖為顯示根據本發明的實施例的申請專利範圍之解析紀錄方法之一邏輯表。

Claims (8)

  1. 一種申請專利範圍之解析紀錄方法,係讀取一申請專利範圍之文字定義以得出一元件定義並予以紀錄,包含: 一元件定義得出步驟,根據一詞性資料庫及一詞性斷句規則,自該申請專利範圍之文字定義中讀取出一名詞詞首文字,接著在該名詞詞首文字之後讀取出對應於該名詞詞首文字的一中間判斷文字且/或對應於該名詞詞首文字的一斷句文字,藉此而得出一元件定義; 一元件定義紀錄步驟,將該元件定義得出步驟所得出的該元件定義予以結合於一元件定義屬性標籤而紀錄於一序列文字檔案;以及 一序列文字檔案儲存步驟,係將該序列文字檔案予以紀錄於一非關連式資料庫。
  2. 如申請專利範圍第1項之申請專利範圍之解析紀錄方法,其中該元件定義得出步驟進一步包含一元件定義結合步驟,係將一元件定義及該元件定義後之接續元件定義予以根據一結合文字資料庫而結合該元件定義及該元件定義後之接續元件定義而形成一結合後的元件定義。
  3. 如申請專利範圍第1項之申請專利範圍之解析紀錄方法,進一步包含一連接關係敘述得出步驟,係根據該元件定義得出步驟所得出的該元件定義而將該元件定義之後的文字定義予以作為一連接關係敘述而得出該連接關係敘述。
  4. 如申請專利範圍第3項之申請專利範圍之解析紀錄方法,其中係將該連接關係敘述得出步驟所得出的該連接關係敘述予以結合於一連接關係敘述屬性標籤而紀錄於該序列文字檔案,並將該序列文字檔案予以紀錄於一非關連式資料庫。
  5. 如申請專利範圍第4項之申請專利範圍之解析紀錄方法,其中該元件定義、結合於該元件定義的該元件定義屬性標籤、該連接關係敘述、及結合於該連接關係敘述的該連接關係敘述屬性標籤係以該元件定義及該連接關係敘述於該申請專利範圍之文字定義中的順序而紀錄於該序列文字檔案。
  6. 如申請專利範圍第1項之申請專利範圍之解析紀錄方法,其中該非關連式資料庫並紀錄該元件定義之間的對應關係且/或紀錄該元件定義與該連接關係敘述之間的對應關係。
  7. 如申請專利範圍第1項之申請專利範圍之解析紀錄方法,其中該元件定義紀錄步驟係以該文字定義被讀取的順序而將該元件定義紀錄至該序列文字檔案。
  8. 如申請專利範圍第3項之申請專利範圍之解析紀錄方法,其中該元件定義紀錄步驟係以該文字定義被讀取的順序而將該元件定義及該連接關係敘述紀錄至該序列文字檔案。
TW106103109A 2017-01-26 2017-01-26 申請專利範圍之解析紀錄方法 TW201828104A (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
TW106103109A TW201828104A (zh) 2017-01-26 2017-01-26 申請專利範圍之解析紀錄方法
US15/652,202 US20180210873A1 (en) 2017-01-26 2017-07-17 Claim disassembling and recording method
EP17208691.0A EP3355202A1 (en) 2017-01-26 2017-12-19 Claim disassembling and recording device
CN201810022758.3A CN108446259A (zh) 2017-01-26 2018-01-10 权利要求书的解构处理方法
JP2018006724A JP2018120590A (ja) 2017-01-26 2018-01-18 請求の範囲の解析記録装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW106103109A TW201828104A (zh) 2017-01-26 2017-01-26 申請專利範圍之解析紀錄方法

Publications (1)

Publication Number Publication Date
TW201828104A true TW201828104A (zh) 2018-08-01

Family

ID=60781762

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106103109A TW201828104A (zh) 2017-01-26 2017-01-26 申請專利範圍之解析紀錄方法

Country Status (5)

Country Link
US (1) US20180210873A1 (zh)
EP (1) EP3355202A1 (zh)
JP (1) JP2018120590A (zh)
CN (1) CN108446259A (zh)
TW (1) TW201828104A (zh)

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3314392B2 (ja) * 1991-08-26 2002-08-12 松下電器産業株式会社 対話型英日機械翻訳装置
US5694559A (en) * 1995-03-07 1997-12-02 Microsoft Corporation On-line help method and system utilizing free text query
JP3437710B2 (ja) * 1996-04-22 2003-08-18 エイディシーテクノロジー株式会社 機械翻訳装置
US20010049707A1 (en) * 2000-02-29 2001-12-06 Tran Bao Q. Systems and methods for generating intellectual property
CN1519752A (zh) * 2003-01-20 2004-08-11 黄致辉 一种自然语言语法分析器及其方法
JP4242701B2 (ja) * 2003-05-23 2009-03-25 日本電信電話株式会社 格納検索装置、格納検索プログラム、および格納検索プログラム記録媒体
US7823061B2 (en) * 2004-05-20 2010-10-26 Wizpatent Pte Ltd System and method for text segmentation and display
TW200602906A (en) 2004-07-15 2006-01-16 Sheng-Fu Lin Automatic analysis method of patent claim
US8099430B2 (en) * 2008-12-18 2012-01-17 International Business Machines Corporation Computer method and apparatus of information management and navigation
TWI400621B (zh) 2008-12-09 2013-07-01 Application of patent scope automatic analysis method
US8447789B2 (en) * 2009-09-15 2013-05-21 Ilya Geller Systems and methods for creating structured data
JP5536518B2 (ja) * 2009-04-23 2014-07-02 インターナショナル・ビジネス・マシーンズ・コーポレーション システムの自然言語仕様から当該システム用のシステム・モデル化メタモデル言語モデルを自動的に抽出するための方法、装置及びコンピュータ・
US10013505B1 (en) * 2010-01-13 2018-07-03 The Boeing Company Method, apparatus and computer program product for identifying a target part name within a data record
US9760634B1 (en) * 2010-03-23 2017-09-12 Firstrain, Inc. Models for classifying documents
JP2011257817A (ja) * 2010-06-04 2011-12-22 Kenichiro Ayaki 特許明細書分析装置、及び文章分析装置。
US20120246609A1 (en) * 2011-03-24 2012-09-27 International Business Machines Corporation Automatic generation of user stories for software products via a product content space
US8747115B2 (en) * 2012-03-28 2014-06-10 International Business Machines Corporation Building an ontology by transforming complex triples
US8838607B2 (en) * 2012-10-17 2014-09-16 International Business Machines Corporation Software system test case creation
CN103077164B (zh) * 2012-12-27 2016-05-11 新浪网技术(中国)有限公司 文本分析方法及文本分析器
US20140324808A1 (en) * 2013-03-15 2014-10-30 Sumeet Sandhu Semantic Segmentation and Tagging and Advanced User Interface to Improve Patent Search and Analysis
JP6366902B2 (ja) * 2013-05-13 2018-08-01 技術経営ソリューション株式会社 英文の特許明細書からの格成分抽出プログラム
CA2881938A1 (en) * 2014-02-12 2015-08-12 Robert A. Nissen Patent search and display methods and systems
US20150234805A1 (en) * 2014-02-18 2015-08-20 David Allan Caswell System and Method for Interacting with Event and Narrative Information As Structured Data
US20170075877A1 (en) * 2015-09-16 2017-03-16 Marie-Therese LEPELTIER Methods and systems of handling patent claims
US10878190B2 (en) * 2016-04-26 2020-12-29 International Business Machines Corporation Structured dictionary population utilizing text analytics of unstructured language dictionary text
TWI639927B (zh) * 2016-05-27 2018-11-01 雲拓科技有限公司 將一申請專利範圍中的申請專利範圍元件名詞所屬元件名詞對應標號予以對應之對應方法

Also Published As

Publication number Publication date
EP3355202A1 (en) 2018-08-01
US20180210873A1 (en) 2018-07-26
CN108446259A (zh) 2018-08-24
JP2018120590A (ja) 2018-08-02

Similar Documents

Publication Publication Date Title
CA2777520C (en) System and method for phrase identification
Ciravegna et al. Learning to harvest information for the semantic web
JP2009104630A (ja) 大規模な電子的なドキュメントのコレクション(集まり)を探索するためのドキュメント関連性の決定に対する機械学習アプローチ
US20050108630A1 (en) Extraction of facts from text
US8583415B2 (en) Phonetic search using normalized string
Zheng et al. Dynamic knowledge-base alignment for coreference resolution
TWI550422B (zh) 申請專利範圍之文字歸位方法
WO2019200699A1 (zh) 政务系统发文方法、装置、计算机设备及存储介质
JP5737079B2 (ja) テキスト検索装置、テキスト検索プログラム、及びテキスト検索方法
Büchler et al. Increasing recall for text re-use in historical documents to support research in the humanities
Pudota et al. A new domain independent keyphrase extraction system
JP4640593B2 (ja) 多言語文書検索装置および多言語文書検索方法、並びに、多言語文書を検索するプログラム
JP5447368B2 (ja) 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム
Ehsan et al. A Pairwise Document Analysis Approach for Monolingual Plagiarism Detection.
JP2009086903A (ja) 検索サービス装置
Harrag et al. Comparative study of topic segmentation Algorithms based on lexical cohesion: Experimental results on Arabic language
Saeed et al. An abstractive summarization technique with variable length keywords as per document diversity
TW201828104A (zh) 申請專利範圍之解析紀錄方法
Pokorny Automatic subject indexing and classification using text recognition and computer-based analysis of tables of contents
Ali et al. A novel framework for plagiarism detection: A case study for urdu language
JP2007172179A (ja) 意見抽出装置、意見抽出方法、および意見抽出プログラム
Chaimongkol et al. Utilizing LDA clustering for technical term extraction
US20220245326A1 (en) Semantically driven document structure recognition
JP2006172489A (ja) 文書の参照理由を用いて情報検索を行なう装置
JP2008293070A (ja) 文書解析システム、および文書解析方法、並びにコンピュータ・プログラム