TWI550422B - 申請專利範圍之文字歸位方法 - Google Patents

申請專利範圍之文字歸位方法 Download PDF

Info

Publication number
TWI550422B
TWI550422B TW104111343A TW104111343A TWI550422B TW I550422 B TWI550422 B TW I550422B TW 104111343 A TW104111343 A TW 104111343A TW 104111343 A TW104111343 A TW 104111343A TW I550422 B TWI550422 B TW I550422B
Authority
TW
Taiwan
Prior art keywords
noun
homing
patent application
component
scope
Prior art date
Application number
TW104111343A
Other languages
English (en)
Other versions
TW201636875A (zh
Inventor
蔡宏興
Original Assignee
雲拓科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 雲拓科技有限公司 filed Critical 雲拓科技有限公司
Priority to TW104111343A priority Critical patent/TWI550422B/zh
Application granted granted Critical
Publication of TWI550422B publication Critical patent/TWI550422B/zh
Publication of TW201636875A publication Critical patent/TW201636875A/zh

Links

Landscapes

  • Machine Translation (AREA)

Description

申請專利範圍之文字歸位方法
本發明相關於一種文字歸位方法,特別是相關於一種申請專利範圍之文字歸位方法。
近年來,申請專利範圍的構文解析越來越受到重視。經構文解析後之申請專利範圍不但可方便申請專利範圍之閱讀,更可根據該經解析後之申請專利範圍而應用於專利申請、專利審查、專利侵權以及專利檢索等專利實務處理。
但專利資料庫中的專利申請案量乃非常龐大,以美國USPTO專利資料庫的核准專利案數,即高達510萬,以每個專利案保守有10個申請專利範圍而論,就有5100萬筆申請專利範圍。此外,每個申請人所使用的撰寫方式並不盡相同,如果以「關鍵名詞比對」的方式進行,效能不佳。在「關鍵名詞比對」的方式中(例如,台灣專利號I347561以及I400621),需要將操作者所知的關鍵名詞予以整理至一資料庫,再將申請專利範圍中的所有字詞依照順序予以一一比對於該資料庫的所有資料。這樣的方式,其邏輯性低、速度緩慢、並會有諸多遺漏,當有遺漏時需要經由不斷的重新瀏覽新的申請專利範圍以加入新的關鍵名詞。不僅於此,在申請專利範圍的解析中,關鍵名詞之間的連接關係(或稱對應關係)亦需要予以構文解析,其複雜度更高,其原因在於連接關係以及對應關係中所使用的字詞其變化性更大,如果以「關鍵字比對」方式進行, 其資料庫需要更大、比對更多、規則更多,其效能之低下可以想像。因此,面對案量龐大且規則不一的構文解析標的,如何有一有效而可行的構文解析方法乃成為一個課題。
鑒於以上所提之習知技術,本發明的發明人認為,根據「文法詞性」進行構文解析是一個比較可行的方式。藉由「文法詞性」進行「名詞之攫取」,係藉由斷句的方式而直接找出申請專利範圍中的所有名詞,並根據所有名詞的名詞位置、以及各個名詞位置之間的位置關係而找出一元件對應關係敘述。此簡化資料庫的大小,所產生的結果之正確性高且速度快,提供對於龐大構文解析標的之一個可行的方法。
因此,本發明的目的即在提供一種申請專利範圍之文字歸位方法,可簡化資料庫的大小,所產生的結果之正確性高且速度快。
本發明為解決習知技術之問題所採用之技術手段係提供一種申請專利範圍之文字歸位方法,係對於一申請專利範圍中之文字予以結構化歸位,該申請專利範圍的文字歸位方法包含:一名詞攫取步驟,藉由文字中的一名詞詞首及由文法詞性關係所識別出的斷句文字而執行一名詞斷句,而攫取出該申請專利範圍中之名詞,並記錄所攫取出之名詞所在之名詞位置;一位置判斷步驟,根據該名詞攫取步驟所紀錄之名詞位置,而判斷出各個名詞位置之間的位置關係;一標的名詞決定步驟,根據第一次出現之名詞、該第一次出現之名詞後之接續名詞以及該第一次出現之名詞與該第一次出現之名詞後之接續名詞之間的文法詞性關係,而將第一次出現之名詞整理而決定出一標的名詞;一元件名詞決定步驟,根據所攫取出之名詞所在之名詞位置之間的位置關係且/或標點符號而決定出一元件名詞;以及一元件對應關係敘述決定步驟,根據該元 件名詞決定步驟所決定出之各個元件名詞而決定出在該所決定出的元件名詞之間的定義為一元件對應關係敘述。
在本發明的一實施例中係提供一種申請專利範圍之文字歸位方法,該名詞攫取步驟進一步包含一名詞結合步驟,係將一名詞、該名詞後之接續名詞予以根據該名詞與該名詞後之接續名詞之間的文法詞性關係,而結合該名詞與該名詞後之接續名詞。。
在本發明的一實施例中係提供一種申請專利範圍之文字歸位方法,該名詞攫取步驟,係攫取出該申請專利範圍中所有之名詞。
在本發明的一實施例中係提供一種申請專利範圍之文字歸位方法,進一步包含一歸位放置顯示步驟,係將該標的名詞、該元件名詞以及該元件對應關係敘述予以歸位放置至一申請專利範圍歸位圖表,該申請專利範圍歸位圖表係為階層式歸位圖表,為將該標的名詞、該元件名詞以及該元件對應關係敘述以階層式圖表而顯示。
在本發明的一實施例中係提供一種申請專利範圍之文字歸位方法,該文法詞性關係為申請專利範圍中前後文字之間的文法對應規則,該前後文字為相鄰的前後文字或是相隔的前後文字。
在本發明的一實施例中係提供一種申請專利範圍之文字歸位方法,該申請專利範圍歸位圖表之階層式關係為該元件名詞之間以及該元件名詞與該元件對應關係敘述之間的階層式關係。
在本發明的一實施例中係提供一種申請專利範圍之文字歸位方法,該歸位放置顯示步驟進一步具有一歸位修正顯示步驟,係提供該歸位放置顯示步驟的一修正輸出輸入介面,以修正該申請專利範圍歸位圖表。
在本發明的一實施例中係提供一種申請專利範圍之文字歸位方法,該歸位修正顯示步驟具有一位置搬移機構,提供一位置搬移介面,以搬動該申請專利範圍歸位圖表中之元件名詞以及該元件對應關係敘述的歸位位置。
在本發明的一實施例中係提供一種申請專利範圍之文字歸位方法,該位置搬移機構具有一位置互換介面,以將該申請專利範圍歸位圖表中之元件名詞予以互換。
在本發明的一實施例中係提供一種申請專利範圍之文字歸位方法,該歸位修正顯示步驟具有一規則提出機構,提供一規則提出介面,以輸入一新的文字歸位規則。
本發明的申請專利範圍之文字歸位方法具有以下之功效。藉由「文法詞性」進行「名詞之攫取」,係藉由斷句的方式而直接找出申請專利範圍中的所有名詞,並根據所有名詞的名詞位置、以及各個名詞位置之間的位置關係而找出一元件對應關係敘述。此簡化資料庫的大小,所產生的結果之正確性高且速度快,提供對於龐大構文解析標的之一個可行的方法。
501‧‧‧修正方塊
502‧‧‧緩衝方塊
503‧‧‧文字歸位規則
第1圖為顯示本發明的一實施例的一申請專利範圍之文字歸位方法的流程圖。
第2圖為顯示本發明的一實施例的申請專利範圍之文字歸位方法的流程圖。
第3圖為顯示本發明的實施例的申請專利範圍之文字歸位方法中根據詞性資料表而建立的一斷句邏輯表格的示意圖。
第4圖為顯示根據本發明的實施例的申請專利範圍之文字歸位方法中以階層化所呈現出的申請專利範圍歸位圖表的示意圖。
第5圖為依據本發明的實施例的申請專利範圍之文字歸位方法中的一歸位修正顯示畫面的示意圖。
以下根據第1圖至第5圖,而說明本發明的實施方式。該說明並非為限制本發明的實施方式,而為本發明之多個實施例中的一種。
在本發明中,係藉由「文法詞性」進行「名詞之攫取」。以下首先介紹本發明的申請專利範圍之文字歸位方法中的「名詞攫取步驟」的一實施例。在下文中,所有步驟係可由載入有本發明的申請專利範圍之文字歸位方法的程式產品的一電腦系統而執行。
如第3圖所示,本發明中所使用的資料庫包含多數個詞性資料表,包括:名詞詞首資料表、關係代名詞資料表、從屬動詞資料表、第一分詞(Ved)資料表、第二分詞(Ving)資料表、介系詞資料表、斷句符號資料表。該名詞詞首資料表包含:「A,a,An,an,The,the,Said,said,at least+數字...」,該關係代名詞資料表包含:「which,whose,where,wherein,where...」,該從屬動詞資料表包含:「is,are,was,were...」,該第一分詞(Ved)資料表包含:「provided以及以ed或是en為句尾之字...」(該所屬集合為可調整),該第二分詞(Ving)資料表包含:「providing以及以ing為句尾之字...」(該所屬集合為可調整),該介系詞資料表包含「with,to,in,on,at,over,above,below,along,through,via,within,onto...」,該斷句符號表包含各個標點符號。
在第3圖中,係以逐字進行解析,當讀到名詞詞首資料表中的字「A,a,The,the,Said,said,at least+數字...」,則在該字的位置處註記,作為所要攫取的開頭,於該第3圖中係以「○」記號作為表示,並繼續逐字閱讀。在有了攫取的開頭之後,則應尋找所有攫取之結尾。但要判斷是否屬於所要攫取之結尾,則需要在該「可能之結尾處」做標記,如第三圖中「●」所示即為「可能之結尾處」。如前述,當遇到可能之結尾處,則需要繼續往後閱讀。當繼續往後閱讀,讀到第3圖所示「○」所屬資料表時,表示該判斷條件「成立」,則以 「●」所標記位置作為斷句位置,而將自「○」至「●」的文字予以作為所攫取出的名詞。
以下依序說明第3圖的各列號之意義。
第1列至第3列,在攫取到「名詞詞首」之後,當攫取到「關係代名詞資料表」、「從屬動詞資料表」或「介系詞資料表」時,則以該「關係代名詞資料表」、「從屬動詞資料表」或「介系詞資料表」作為斷句位置(即,以「●」表示)。
第4列至第9列,在攫取到「名詞詞首」之後,當攫取到「第一分詞資料表」時,則繼續讀取。當繼續攫取到「第二分詞資料表」、「介系詞資料表」、「名詞詞首資料表」、「關係代名詞資料表」或「分詞資料表(包含第一分詞以及第二分詞)」,則該斷句判斷條件成立(即,以「○」表示),並以該「第一分詞資料表」的位置作為斷句位置(即,以「●」表示)。
第10列至第12列,在攫取到「名詞詞首」之後,當攫取到「介系詞資料表」時,則繼續讀取。當繼續攫取到「名詞詞首資料表」、「關係代名詞資料表」或「分詞資料表(包含第一分詞以及第二分詞)」,則該斷句判斷條件成立(即,以「○」表示),並以該「介系詞資料表」的位置作為斷句位置(即,以「●」表示)。
第13列,在攫取到「名詞詞首」之後,當攫取到「斷句資料表」時,則以該「斷句資料表」作為斷句位置(即,以「●」表示)。
以下,根據該詞性資料表的該斷句邏輯表格,如第3圖所示,並以文字:“a circuit board provided with an edge extending in a longitudinal direction of said circuit board;”為所要解構分析的文句作為實例,而說明如下。
(1)當讀到“「a」circuit board provided with an edge extending in a longitudinal direction of said circuitboard;”,其中「」中的文字為讀到的文字,因 為「a」這個名詞屬於「名詞詞首資料表」,如第三列中列首標示有「1」的該列所示,繼續進行讀取(即,1+的動作);(2)接著讀到“a「circuit」board provided with an edge extending in a longitudinal direction of said circuit board;”,此「circuit」並不屬於任何資料表,因此繼續讀取;(3)接著讀到“a circuit「board」provided with an edge extending in a longitudinal direction of said circuit board;”,此「board」並不屬於任何資料表,因此繼續讀取;(4)接著讀到“a circuit board「provided」with an edge extending in a longitudinal direction of said circuit board;”,此「provided」屬於第一分詞(Ved)資料表,即,其為動詞後接ed的第一分詞,因此根據該斷句邏輯表格,應進行項次標號為「5」至「10」的列的處理,該6種列的處理有一共通之處,即為將該第一分詞作為斷句處,並繼續向下讀取,以決定要選用哪一個列的處理;(5)接著讀到“a circuit board provided「with」an edge extending in a longitudinal direction of said circuit board;”,此「with」屬於介系詞資料表,因此根據該斷句邏輯表格,應選取項次標號為「6」的該列的處理,該列的處理係為將表示決定出之前的第一分詞斷句處為「成立」,應以該第一分詞為斷句,將該斷句之前的部分,即,「circuit board」當作一所要攫取出的名詞,並繼續向下讀取;(6)接著讀到“a circuit board provided with「an」edge extending in a longitudinal direction of said circuit board;”,此「an」這個名詞屬於「名詞詞首資料表」,並繼續進行讀取(即,1+的動作); (7)接著讀到“a circuit board provided with an「edge」extending in a longitudinal direction of said circuit board;”,此「edge」並不屬於任何資料表,因此繼續讀取;(8)接著讀到“a circuit board provided with an edge「extending」in a longitudinal direction of said circuit board;”,此「extending」為屬於第二分詞(Ving)資料表,此時需要之後所接的讀取字作為判斷;(9)接著讀到“a circuit board provided with an edge extending「in」a longitudinal direction of said circuit board;”,此「in」為介系詞資料表,因此將之前為屬於第二分詞(Ving)資料表的extending排除於所要攫取之名詞,而只取出「名詞詞首資料表」之「a」至斷句位置「extending」之中的字詞,作為所要攫取之名詞,因此所得出為「edge」作為所要攫取之名詞,並繼續讀取;(10)接著讀到“a circuit board provided with an edge extending in「a」longitudinal direction of said circuit board;”,該「a」為屬於「名詞詞首資料表」,並繼續進行讀取(即,1+的動作);(11)接著讀到“a circuit board provided with an edge extending in a 「longitudinal」direction of said circuit board;”,該「longitudinal」並不屬於任何資料表,因此繼續讀取;(12)接著讀到“a circuit board provided with an edge extending in a longitudinal「direction」of said circuit board;”,該「direction」並不屬於任何資料表,因此繼續讀取;(13)接著讀到“a circuit board provided with an edge extending in a longitudinal direction「of」said circuit board;”,該「of」屬於介系詞資料表,因此根據該斷句邏輯表格,應進行項次標號為「11」至「13」的列的處理,該3列 的處理係將決定以該介系詞作為斷句處,並繼續向下讀取,以決定要選用哪一個列的處理;(14)接著讀到“a circuit board provided with an edge extending in a longitudinal direction of「said」circuit board;”,該「said」屬於「名詞詞首資料表」,因此選擇標號為「11」的該列,即,將該介系詞「of」為斷句予以成立,而取出自該名詞詞首「a」至該介系詞「of」之前的字詞,即,「longitudinal direction」作為所攫取出的名詞,並繼續讀取,並紀錄此時所得到的是一詞首名詞;(15)接著讀到“a circuit board provided with an edge extending in a longitudinal direction of said「circuit」board;”,該「circuit」並不屬於任何資料表,因此繼續讀取;(16)接著讀到“a circuit board provided with an edge extending in a longitudinal direction of said circuit「board」;”,該「board」並不屬於任何資料表,因此繼續讀取;(17)接著讀到“a circuit board provided with an edge extending in a longitudinal direction of said circuit board「;」”,該「;」為標點符號,屬於該斷句符號資料表,因此表示可進行斷句,而攫取出「said circuit board」作為所要攫取之名詞。
此時,所攫取到的名詞係如下「」中所示者:“「a circuit board」provided with「an edge extending」in「a longitudinal direction」of「said circuit board」;”本發明中,在攫取出名詞的同時,並紀錄該所攫取出名詞之位置。並以該句之標點符號「;」做為邊界,而定義出一目標區塊,以瞭解該些名詞之間的位置關係。
如第1圖所示,係為依據本發明的一實施例的一申請專利範圍之文字歸位方法。其係對於一申請專利範圍中之文字予以結構化歸位,該申請專 利範圍的文字歸位方法包含:一名詞攫取步驟,藉由文字中的一名詞詞首及由文法詞性關係所識別出的斷句文字而執行一名詞斷句,而攫取出該申請專利範圍中之名詞,並記錄所攫取出之名詞所在之名詞位置;一位置判斷步驟,根據該名詞攫取步驟所紀錄之名詞位置,而判斷出各個名詞位置之間的位置關係;一標的名詞決定步驟,根據第一次出現之名詞、該第一次出現之名詞後之接續名詞以及該第一次出現之名詞與該第一次出現之名詞後之接續名詞之間的文法詞性關係,而將第一次出現之名詞整理而決定出一標的名詞;一元件名詞決定步驟,根據所攫取出之名詞所在之名詞位置之間的位置關係且/或標點符號而決定出一元件名詞;以及一元件對應關係敘述決定步驟,根據該元件名詞決定步驟所決定出之各個元件名詞而決定出在該所決定出的元件名詞之間的定義為一元件對應關係敘述。
在第3圖中的斷句邏輯表中,可加入一從屬動詞資料表、該從屬動詞資料表包含:「having,is,are,was,were...」,並以找到該從屬動詞,將該從屬動詞的前一個字作為斷句位置。
本發明的該申請專利範圍之文字歸位方法,雖係以前述順序而描述,但其並非定義其順序,其順序係可更替或是結合。例如,該名詞攫取步驟以及該位置判斷步驟可以經交替結合執行,而在每個名詞被判斷出,即得到該名詞之位置資料,根據該位置資料而判斷該名詞係為一標的名詞或是一元件名詞。
申請專利範圍之標的名詞(subject matter)需要被決定出。因此本發明具有一標的名詞決定步驟,其係根據第一次出現之名詞、該第一次出現之名詞後之接續名詞以及該第一次出現之名詞與該第一次出現之名詞後之接續名詞之間的文法詞性關係,而將第一次出現之名詞整理而決定出一標的名詞。
在本發明中,對於元件名詞的名詞攫取之標準可以為不同於標的名詞的名詞攫取標準。例如,以「an apparatus of controlling a robot」為例子,如果該名詞係作為元件名詞,可以使「an apparatus」以及「a robot」互相分開,但是如果該名詞是作為標的名詞,則不可分開,需要以「An apparatus of controlling a robot」而表示,因此,本發明提供一標的名詞決定步驟。該標的名詞決定步驟係根據第一次出現之名詞、該第一次出現之名詞後之接續名詞以及該第一次出現之名詞與該第一次出現之名詞後之接續名詞之間的文法詞性關係,而將第一次出現之名詞整理而決定出一標的名詞。
該第一次出現之名詞與該第一次出現之名詞後之接續名詞之間的文法詞性關係尤其相關於「of」,因此在本發明的一實施例中,係以「of」作為標的解析資料表的元件,當該第一次出現之名詞與該第一次出現之名詞後之接續名詞之間存在有「of」之字詞時,則進行標的名詞決定步驟。在一實施例中,其邏輯係為:當該第一次出現之名詞與該第一次出現之名詞後之接續名詞之間存在有「of」之字詞時,將該當該第一次出現之名詞為始而至該第一次出現之名詞後之接續名詞為止予以攫取,而作為一標的名詞。亦即,將該第一次出現名詞「an apparatus」至該第二次出現名詞「arobot」為止予以攫取而得到「an apparatus of controlling a robot」而作為標的名詞。
該標的解析資料表的元件,除了「of」之外,另可包含:「for」、「with」、「having」等。
對於元件名詞,同樣也有需要進行合併的可能性。對於某些使用者而言,將元件合併可簡化整個輸出畫面。因此在一實施例中,由於介系詞「of」會是屬於同一所要攫取之名詞的兩個名詞之連接字,因此需要一名詞結合步驟,以將連接於「of」兩端的所攫取出名詞予以合併。
亦即,如第2圖所示,依據本發明的一實施例的一申請專利範圍之文字歸位方法,該名詞攫取步驟進一步包含一名詞結合步驟,係將一名詞、該名詞後之接續名詞予以根據該名詞與該名詞後之接續名詞之間的文法詞性關係,而結合該名詞與該名詞後之接續名詞。
其規則為判斷出:如果兩個所攫取出名詞之間若且為若存在有單一個「of」,則將兩個所攫取出名詞予以合併。
相較於習知以名詞比對的方式,這樣的作法簡單容易許多。
又例如另一申請專利範圍:An obstacle detecting apparatus comprising: a distance image obtaining section having a distance sensor...
本發明將第一次出現之名詞(An obstacle detecting apparatus)、該第一次出現之名詞後之接續名詞(a distance image obtaining section)以及該第一次出現之名詞(An obstacle detecting apparatus)與該第一次出現之名詞後之接續名詞(a distance image obtaining section)之間的文法詞性關係,亦即出現「:」,則判斷在該「:」之前的名詞為標的名詞,而決定出一標的名詞(An obstacle detecting apparatus)。
接下來,針對一申請專利範圍而提供本發明之申請專利範圍之文字歸位方法的一實施例。
申請專利範圍:An apparatus of controlling a robot, the apparatus comprising: an image obtaining unit configured to obtain a three-dimensional image of a user; a driving unit configured to drive an arm of the robot that is composed of a plurality of segments; and a control unit configured to generate a user model that corresponds to a motion of the joint of the user based on the three-dimensional image, to generate a target model having the plurality of segments of which the length varies based on the user model, and to allow the arm of the robot to be driven based on the target model.
經由前述的名詞攫取步驟以及名詞合併步驟,可得到以下結果,其中所攫取出的名詞係以「」予以表示。
「An apparatus of controlling a robot」,「the apparatus」comprising: 「an image obtaining unit」configured to obtain「a three-dimensional image of a user」;「a driving unit」configured to drive「an arm of the robot」that is composed of「a plurality of segments」;and「a control unit」configured to generate「a user model」that corresponds to「a motion of the joint of the user」based on「the three-dimensional image」,to generate「a target model」having「the plurality of segments」of which「the length」varies based on「the user model」,and to allow「the arm of the robot」to be driven based on「the target model」.
亦即,在本發明中該元件名詞決定步驟,係根據所攫取出之名詞所在之名詞位置之間的位置關係且/或標點符號而決定出一元件名詞。
本發明之該元件對應關係敘述決定步驟,係根據該元件名詞決定步驟所決定出之各個元件名詞而決定出在該所決定出的元件名詞之間的定義為一元件對應關係敘述。以該申請專利範圍...「an image obtaining unit」configured to obtain「a three-dimensional image of a user」;...,係以「;」作為區塊標記,並根據區塊中各個元件名詞(「an image obtaining unit」以及「a three-dimensional image of a user」)之間的位置關係(「an image obtaining unit」在前,而「a three-dimensional image of a user」在後)而攫取出在該「an image obtaining unit」以及「a three-dimensional image of a user」之間的所有字詞(configured to obtain),而予以決定為一元件對應關係敘述。
又例如,...「a driving unit」configured to drive「an arm of the robot」that is composed of「a plurality of segments」;...,係以「;」作為區塊標記,並根據區塊中各個元件名詞(「a driving unit」、「an arm of the robot」)之間的位置關係(「an driving unit」在前,而「an arm of the robot」在後)而攫取出在該「an driving unit」以及「an arm of the robot」之間的所有字詞(configured to drive),而予以決定為一元件對應關係敘述。接續並將「an arm of the robot」以及「a plurality of segments」予以同樣的方式處理,而攫取出在該「an arm of the robot」以及「a plurality of segments」之間的所有字詞(that is composed of),而予以決定為該「an arm of the robot」以及「a plurality of segments」之間的一元件對應關係敘述。
依據本發明的一實施例的一申請專利範圍之文字歸位方法,該名詞攫取步驟,係攫取出該申請專利範圍中所有之名詞。經由將該該申請專利範圍中所有之名詞予以全部攫取出以便於後續之歸位處理。
本發明的一實施例的該申請專利範圍之文字歸位方法係為提供使用者瀏覽一申請專利範圍歸位圖表,如第4圖所示,該申請專利範圍歸位圖表係以階層化之方式而呈現出:標的、元件名詞、以及元件名詞與元件名詞之間的元件對應關係敘述。
依據本發明的一實施例的一申請專利範圍之文字歸位方法,進一步包含一歸位放置顯示步驟,係將該標的名詞、該元件名詞以及該元件對應關係敘述予以歸位放置至一申請專利範圍歸位圖表,該申請專利範圍歸位圖表係為階層式歸位圖表,為將該標的名詞、該元件名詞以及該元件對應關係敘述以階層式圖表而顯示。
本發明以「詞性關係」進行構文解析,簡化了整個構文解析方法。亦即,依據本發明的一實施例的一申請專利範圍之文字歸位方法,該文法詞性 關係為申請專利範圍中前後文字之間的文法對應規則,該前後文字為相鄰的前後文字或是相隔的前後文字。本發明之該詞性關係的構文解析方法係以名詞詞首資料表、關係代名詞資料表、從屬動詞資料表、第一分詞(Ved)資料表、第二分詞(Ving)資料表、介系詞資料表、斷句符號資料表而實施。
亦即,依據本發明的一實施例的一申請專利範圍之文字歸位方法,該申請專利範圍歸位圖表之階層式關係為該元件名詞之間以及該元件名詞與該元件對應關係敘述之間的階層式關係。
依據本發明的一實施例的一申請專利範圍之文字歸位方法,該歸位放置顯示步驟進一步具有一歸位修正顯示步驟,係提供該歸位放置顯示步驟的一修正輸出輸入介面,以修正該申請專利範圍歸位圖表。該修正輸出輸入介面,如第5圖所示,可輸入一新的元件攫取規則,經由輸入至該修正輸出輸入介面而輸入至該資料庫,而由開發者所接收,而使開發者根據該規則而產生新的元件攫取規則或是對應關係描述攫取之規則,以不斷修正該些規則以產生最正確的結果。
該歸位修正顯示步驟為個別在該標的名詞、該元件名詞以及該元件對應關係敘述之顯示方塊,另個別設置該標的名詞、該元件名詞以及該元件對應關係敘述的修正方塊501,以個別修正該標的名詞、該元件名詞以及該元件對應關係敘述。
為了方便該標的名詞、該元件名詞以及該元件對應關係敘述之顯示方塊的對調,可另設置一緩衝方塊502,以方便暫時存放將為搬動的方塊。例如,要將方塊A與方塊B對調,可先將方塊A搬動至該緩衝方塊502,再將方塊B搬動到原方塊A之位置,再將位於該緩衝方塊502中的原方塊A內容搬動至方塊B之位置。
亦即,如第5圖所示,依據本發明的一實施例的一申請專利範圍之文字歸位方法,該歸位修正顯示步驟中,電腦系統具有一位置搬移機構,提供一位置搬移介面,以搬動該申請專利範圍歸位圖表中之元件名詞以及該元件對應關係敘述的歸位位置。
如第5圖所示,依據本發明的一實施例的一申請專利範圍之文字歸位方法,該位置搬移機構具有一位置互換介面(亦即,該緩衝方塊),以將該申請專利範圍歸位圖表中之元件名詞予以互換。
亦即,依據本發明的一實施例的一申請專利範圍之文字歸位方法,該歸位修正顯示步驟中,電腦系統具有一規則提出機構,提供一規則提出介面,以輸入一新的文字歸位規則503。
以上之敘述以及說明僅為本發明之較佳實施例之說明,對於此項技術具有通常知識者當可依據以下所界定申請專利範圍以及上述之說明而作其他之修改,惟此些修改仍應是為本發明之發明精神而在本發明之權利範圍中。

Claims (10)

  1. 一種申請專利範圍之文字歸位方法,係對於一申請專利範圍中之文字予以結構化歸位,該申請專利範圍的文字歸位方法包含:一名詞攫取步驟,藉由該申請專利範圍中之文字中的一名詞詞首及由文法詞性關係所識別出的斷句文字而執行一名詞斷句,而攫取出該申請專利範圍中之名詞,並記錄該所攫取出之名詞所在之名詞位置;一位置判斷步驟,根據該名詞攫取步驟所紀錄之名詞位置,而判斷出各個該名詞位置之間的位置關係;一標的名詞決定步驟,根據該申請專利範圍中之第一次出現之名詞、該第一次出現之名詞後之接續名詞以及該第一次出現之名詞與該第一次出現之名詞後之接續名詞之間的文法詞性關係,而將第一次出現之名詞整理而決定出一標的名詞;一元件名詞決定步驟,根據該所攫取出之名詞所在之名詞位置之間的位置關係且/或標點符號而決定出一元件名詞;以及一元件對應關係敘述決定步驟,根據該元件名詞決定步驟所決定出之各個元件名詞而決定出在該所決定出的元件名詞之間的定義為一元件對應關係敘述。
  2. 如申請專利範圍第1項之申請專利範圍之文字歸位方法,其中該名詞攫取步驟進一步包含一名詞結合步驟,係將該申請專利範圍中之一名詞及該名詞後之接續名詞予以根據該名詞與該名詞後之接續名詞之間的文法詞性關係,而結合該名詞與該名詞後之接續名詞。
  3. 如申請專利範圍第1項之申請專利範圍之文字歸位方法,其中該名詞攫取步驟,係攫取出該申請專利範圍中所有之名詞。
  4. 如申請專利範圍第1項之申請專利範圍之文字歸位方法,更包含一歸位放置顯示步驟,係將該標的名詞、該元件名詞以及該元件對應關係敘述 予以歸位放置至一申請專利範圍歸位圖表,該申請專利範圍歸位圖表係為階層式歸位圖表,為將該標的名詞、該元件名詞以及該元件對應關係敘述以階層式圖表而顯示。
  5. 如申請專利範圍第1項之申請專利範圍之文字歸位方法,其中該文法詞性關係為該申請專利範圍中之前後文字之間的文法對應規則,該前後文字為相鄰的前後文字或是相隔的前後文字。
  6. 如申請專利範圍第4項之申請專利範圍之文字歸位方法,其中該申請專利範圍歸位圖表之階層式關係為該元件名詞之間以及該元件名詞與該元件對應關係敘述之間的階層式關係。
  7. 如申請專利範圍第4項之申請專利範圍之文字歸位方法,其中該歸位放置顯示步驟進一步具有一歸位修正顯示步驟,係提供該歸位放置顯示步驟的一修正輸出輸入介面,以修正該申請專利範圍歸位圖表。
  8. 如申請專利範圍第7項之申請專利範圍之文字歸位方法,其中該歸位修正顯示步驟,係包括由一位置搬移機構提供一位置搬移介面,以搬動該申請專利範圍歸位圖表中之元件名詞以及該元件對應關係敘述的歸位位置。
  9. 如申請專利範圍第8項之申請專利範圍之文字歸位方法,其中該位置搬移機構具有一位置互換介面,以將該申請專利範圍歸位圖表中之元件名詞予以互換。
  10. 如申請專利範圍第7項之申請專利範圍之文字歸位方法,其中該歸位修正顯示步驟,係包括由一規則提出機構提供一規則提出介面,以輸入一新的文字歸位規則。
TW104111343A 2015-04-08 2015-04-08 申請專利範圍之文字歸位方法 TWI550422B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW104111343A TWI550422B (zh) 2015-04-08 2015-04-08 申請專利範圍之文字歸位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW104111343A TWI550422B (zh) 2015-04-08 2015-04-08 申請專利範圍之文字歸位方法

Publications (2)

Publication Number Publication Date
TWI550422B true TWI550422B (zh) 2016-09-21
TW201636875A TW201636875A (zh) 2016-10-16

Family

ID=57445142

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104111343A TWI550422B (zh) 2015-04-08 2015-04-08 申請專利範圍之文字歸位方法

Country Status (1)

Country Link
TW (1) TWI550422B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255103A (zh) * 2017-07-13 2019-01-22 云拓科技有限公司 撰写权利要求书的自动装置
CN110245344A (zh) * 2018-03-08 2019-09-17 云拓科技有限公司 权利要求书的自动解构处理装置
US10535110B2 (en) 2016-12-05 2020-01-14 Integral Search Technology Ltd. Method and device for automatic computer translation of patent claims
CN112800760A (zh) * 2019-11-14 2021-05-14 云拓科技有限公司 权利要求书的元件名词及元件名词所属位置自动得出设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI639927B (zh) 2016-05-27 2018-11-01 雲拓科技有限公司 將一申請專利範圍中的申請專利範圍元件名詞所屬元件名詞對應標號予以對應之對應方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200506655A (en) * 2003-08-12 2005-02-16 Inst Information Industry Chinese ontology auto-establishment system and method, and storage media
TW200630827A (en) * 2005-02-23 2006-09-01 Hsin-Hsi Chen Chinese opinion retrieval and extraction systems
US20100145940A1 (en) * 2008-12-09 2010-06-10 International Business Machines Corporation Systems and methods for analyzing electronic text
TW201500939A (zh) * 2013-06-21 2015-01-01 Ubic Inc 數位資訊分析系統、數位資訊分析方法、及數位資訊分析程式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200506655A (en) * 2003-08-12 2005-02-16 Inst Information Industry Chinese ontology auto-establishment system and method, and storage media
TW200630827A (en) * 2005-02-23 2006-09-01 Hsin-Hsi Chen Chinese opinion retrieval and extraction systems
US20100145940A1 (en) * 2008-12-09 2010-06-10 International Business Machines Corporation Systems and methods for analyzing electronic text
TW201500939A (zh) * 2013-06-21 2015-01-01 Ubic Inc 數位資訊分析系統、數位資訊分析方法、及數位資訊分析程式

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10535110B2 (en) 2016-12-05 2020-01-14 Integral Search Technology Ltd. Method and device for automatic computer translation of patent claims
CN109255103A (zh) * 2017-07-13 2019-01-22 云拓科技有限公司 撰写权利要求书的自动装置
CN110245344A (zh) * 2018-03-08 2019-09-17 云拓科技有限公司 权利要求书的自动解构处理装置
CN112800760A (zh) * 2019-11-14 2021-05-14 云拓科技有限公司 权利要求书的元件名词及元件名词所属位置自动得出设备

Also Published As

Publication number Publication date
TW201636875A (zh) 2016-10-16

Similar Documents

Publication Publication Date Title
TWI550422B (zh) 申請專利範圍之文字歸位方法
Drobac et al. Optical character recognition with neural networks and post-correction with finite state methods
US6978275B2 (en) Method and system for mining a document containing dirty text
JP4218758B2 (ja) 字幕生成装置、字幕生成方法、及びプログラム
Karimi et al. Machine transliteration survey
Gupta et al. Mining Hindi-English Transliteration Pairs from Online Hindi Lyrics.
JP2007004633A (ja) 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置
US11031003B2 (en) Dynamic extraction of contextually-coherent text blocks
JP5646792B2 (ja) 単語分割装置、単語分割方法、及び単語分割プログラム
US8208726B2 (en) Method and system for optical character recognition using image clustering
JP5900367B2 (ja) 検索装置、検索方法及びプログラム
Cao et al. Machine learning based detection of clickbait posts in social media
Takamura et al. Analyzing semantic change in Japanese loanwords
KR20180105546A (ko) 클레임 요소 명사의 요소 명사 참조 번호를 획득하기 위한 요소 명사 참조 번호 획득방법
Kestemont et al. Intrinsic plagiarism detection using character trigram distance scores
Naoum et al. Article segmentation in digitised newspapers with a 2d markov model
Rexha et al. Towards a More Fine Grained Analysis of Scientific Authorship: Predicting the Number of Authors Using Stylometric Features.
JP6736224B2 (ja) 文章解析装置及び文章解析プログラム
Kilgarriff et al. Longest–commonest Match
Nouvel et al. Coupling knowledge-based and data-driven systems for named entity recognition
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
Rexha et al. Towards Authorship Attribution for Bibliometrics using Stylometric Features.
Khan et al. Challenges in developing a rule based urdu stemmer
Yue et al. Blind recognition of text input on mobile devices via natural language processing
Moritz et al. Ambiguity in Semantically Related Word Substitutions: an investigation in historical Bible translations

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees