TWI772709B - 對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備 - Google Patents

對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備 Download PDF

Info

Publication number
TWI772709B
TWI772709B TW108141435A TW108141435A TWI772709B TW I772709 B TWI772709 B TW I772709B TW 108141435 A TW108141435 A TW 108141435A TW 108141435 A TW108141435 A TW 108141435A TW I772709 B TWI772709 B TW I772709B
Authority
TW
Taiwan
Prior art keywords
text
character
excluded
characters
word
Prior art date
Application number
TW108141435A
Other languages
English (en)
Other versions
TW202119258A (zh
Inventor
林志青
Original Assignee
雲拓科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 雲拓科技有限公司 filed Critical 雲拓科技有限公司
Priority to TW108141435A priority Critical patent/TWI772709B/zh
Priority to CN202010207905.1A priority patent/CN112800760A/zh
Priority to JP2020148638A priority patent/JP7105500B2/ja
Publication of TW202119258A publication Critical patent/TW202119258A/zh
Application granted granted Critical
Publication of TWI772709B publication Critical patent/TWI772709B/zh

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一種對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備,包含:基本排除文字紀錄排除裝置、可刪文字紀錄排除裝置、單個文字紀錄排除裝置,以及進階排除文字紀錄排除裝置。無字間空格語言文字申請專利範圍文字C-Text中經排除基本排除文字後的連續文字作為一基本排除文字連續文字。該基本排除文字排除連續文字中經排除可刪文字後的連續文字作為一可刪文字刪去連續文字。經排除單個文字後的可刪文字刪去連續文字作為一初步元件名詞。該初步元件名詞中經排除進階排除文字後的連續文字作為該所得出元件名詞。

Description

對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備
本發明相關於一種元件名詞及元件名詞所屬位置自動得出設備,特別是相關於一種對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備。
專利說明書有其複雜性而並不容易閱讀。藉由以人工智慧辨識出專利請求項中的元件名詞為人工智慧專利助讀系統的基礎。所謂元件名詞,係指專利請求項中構成元件的定義字,該元件名詞並不只是名詞,而是以名詞字為最終字,而由包含形容詞、動詞、副詞或名詞所構成的定義字,例如,「接收天線」、「信號發送機構」等。藉由得出專利請求項的元件名詞,而可得出該元件名詞之所屬位置,因此而可更明確得出對應於該元件名詞的動作特徵、連接關係或位置關係的對應位置,以明確協助專利閱讀者更瞭解該專利請求項的技術特徵。
然而,對於無字間空格語言文字,例如亞洲語言,包含中文、日文或韓文,由於字與字之間並無空格,因此相較於英文,該無字間空格語言文字較難辨識出字與字之間的組合,因此較難得出各種組合後之字詞。在此困難下,難以實現自然語言的詞性分析。雖然有人提出建立元件名詞詞庫的設備而以詞性進行元件名詞的辨識,但是專利請求項的元件名詞有各種可能的變化,無法建立如此龐大數量的元件名詞資料庫,而常常有動詞、名詞、形容詞、副詞等之誤判。再者,即使可建立出此龐大數量的元件名詞詞庫,進行如此巨大資料庫的資料比對裝置將非常費時,因此難以實施。
因此,關於如何以高效率而正確地自動得出申請專利範圍之元件名詞。亦即,如何以不需建立元件名詞資料庫的方式且不以詞性進行元件名詞之判斷,而係根據專利請求項的撰寫格式以及特性,在不需花費龐大系統計算及儲存資源的情況下,有效率的得出數量最多、準確度最高、得出速度最快的設備,成為一個課題。
因此,本發明的目的即在提供一種對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備,不需建立元件名詞資料庫的方式且不以詞性進行元件名詞之判斷,而以不可能為元件名詞的文字位置逐步排除的方式而最終得出元件名詞,如此可有效率的得出數量最多、準確度最高、得出速度最快的申請專利範圍之元件名詞及元件名詞所屬位置。
本發明為解決習知技術之問題所採用之技術手段係提供一種對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備,係對於以一無字間空格語言文字所構成的一無字間空格語言文字申請專利範圍予以自動得出申請專利範圍的各個所得出元件名詞及所得出元件名詞所屬位置,該元件名詞及元件名詞所屬位置自動得出設備包含:基本排除文字紀錄排除裝置,係自動讀取該無字間空格語言文字申請專利範圍文字C-Text,並根據一基本排除文字庫中的複數個基本排除文字而自該無字間空格語言文字申請專利範圍文字C-Text中將該基本排除文字予以記錄為排除,而使該無字間空格語言文字申請專利範圍文字C-Text中經排除該基本排除文字後的連續文字作為一基本排除文字連續文字;可刪文字紀錄排除裝置,係自動讀取多數個該基本排除文字連續文字,並根據一可刪文字刪去規則而自各個該基本排除文字連續文字中將一可刪文字予以記錄為排除,該可刪文字刪去規則係自基本排除文字連續文字中將該可刪文字刪去規則所定義的一特定排除文字予以作為該可刪文字而予以記錄為排除且/或將該特定排除文字的相鄰文字或相鄰連續文字予以作為該可刪文字而予以記錄為排除,而使該基本排除文字排除連續文字中經排除該可刪文字後的連續文字作為一可刪文字刪去連續文字;單個文字紀錄排除裝置,係自動讀取多數個該可刪文字刪去連續文字,並將僅具有單個文字的可刪文字刪去連續文字予以記錄為排除,而使經排除該單個文字後的可刪文字刪去連續文字作為一初步元件名詞;以及進階排除文字紀錄排除裝置,係自動讀取多數個該初步元件名詞,並根據一進階排除文字庫中的複數個進階排除文字而自各個該初步元件名詞中將該進階排除文字予以記錄為排除,而使該初步元件名詞中經排除該進階排除文字後的連續文字作為該所得出元件名詞。
在本發明的一實施例中係提供一種所述的元件名詞及元件名詞所屬位置自動得出設備,其中在該可刪文字紀錄排除裝置進一步具有一首部文字記錄排除裝置,該首部文字記錄排除裝置係自動讀取多數個該基本排除文字連續文字,並根據一首部刪去規則所定義之一可刪識別文字而:判斷各個該基本排除文字連續文字的起始文字或起始連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該對應可刪識別文字且/或該對應可刪識別文字之後的指定字數文字予以作為一首部刪去文字而記錄為排除、或判斷各個該基本排除文字連續文字的起始文字的相鄰前文字或相鄰前連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該起始文字之後的指定字數文字予以作為一首部刪去文字而記錄為排除,藉此而使該基本排除文字排除連續文字中經排除該首部刪去文字後的連續文字作為該可刪文字刪去連續文字。
在本發明的一實施例中係提供一種所述的元件名詞及元件名詞所屬位置自動得出設備,其中在該可刪文字紀錄排除裝置進一步具有一尾部文字記錄排除裝置,該尾部文字記錄排除裝置係自動讀取多數個該基本排除文字連續文字,並根據一尾部刪去規則所定義之一可刪識別文字而:判斷各個該基本排除文字連續文字的最終文字或最終連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該對應可刪識別文字且/或該對應可刪識別文字之前的指定字數文字予以作為一尾部刪去文字而記錄為排除、或判斷各個該基本排除文字連續文字的最終文字的相鄰後文字或相鄰後連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該最終文字之前的指定字數文字予以作為一尾部刪去文字而記錄為排除,藉此而使該基本排除文字排除連續文字中經排除該首部刪去文字後的連續文字作為該可刪文字刪去連續文字。
在本發明的一實施例中係提供一種所述的元件名詞及元件名詞所屬位置自動得出設備,其中在該進階排除文字紀錄排除裝置進一步包含一細部元件名詞得出裝置,該細部元件名詞得出裝置將為與「一」後相鄰的該所得元件名詞予以比對於為與「該」後相鄰的該所得元件名詞,當比對吻合時,則確定與「該」後相鄰的該所得元件名詞為一細部元件名詞而作為該所得元件名詞。
在本發明的一實施例中係提供一種所述的元件名詞及元件名詞所屬位置自動得出設備,係根據各個所得出元件名詞、各個所得出元件名詞之所得出元件名詞所屬位置、標點符號及換行符號而得出該無字間空格語言文字申請專利範圍的架構。
本發明為解決習知技術之問題所採用之另一技術手段係提供一種對於無字間空格語言文字申請專利範圍文字C-Text之元件名詞及元件名詞所屬位置自動得出設備,係對於以一無字間空格語言文字所構成的一無字間空格語言文字申請專利範圍文字C-Text予以自動得出一所得出元件名詞及所得出元件名詞所屬位置,該元件名詞及元件名詞所屬位置自動得出設備包含:元件對照表元件名詞記錄排除裝置,該元件對照表元件名詞記錄排除裝置係自動讀取該無字間空格語言文字申請專利範圍文字C-Text,並根據一元件名詞對照表中的一元件對照表元件名詞而自該無字間空格語言文字申請專利範圍文字C-Text中將該元件對照表元件名詞予以記錄為排除,而使該無字間空格語言文字申請專利範圍文字C-Text中經排除該元件對照表元件名詞後的連續文字作為一元件對照表元件名詞排除連續文字;基本排除文字記錄排除裝置,係自動讀取該元件對照表元件名詞排除連續文字,並根據一基本排除文字庫中的複數個基本排除文字而自該元件對照表元件名詞排除連續文字中將該基本排除文字予以記錄為排除,而使該元件對照表元件名詞排除連續文字中經排除該基本排除文字後的連續文字作為一基本排除文字連續文字;可刪文字記錄排除裝置,係自動讀取多數個該基本排除文字連續文字,並根據一可刪文字刪去規則而自各個該基本排除文字連續文字中將一可刪文字予以記錄為排除,該可刪文字刪去規則係自基本排除文字連續文字中將該可刪文字刪去規則所定義的一特定排除文字予以作為該可刪文字而予以記錄為排除且/或將該特定排除文字的相鄰文字或相鄰連續文字予以作為該可刪文字而予以記錄為排除,而使該基本排除文字排除連續文字中經排除該可刪文字後的連續文字作為一可刪文字刪去連續文字;單個文字記錄排除裝置,係自動讀取多數個該可刪文字刪去連續文字,並將僅具有單個文字的可刪文字刪去連續文字予以記錄為排除,而使經排除該單個文字後的可刪文字刪去連續文字作為一初步元件名詞;以及進階排除文字記錄排除裝置,係自動讀取多數個該初步元件名詞,並根據一進階排除文字庫中的複數個進階排除文字而自各個該初步元件名詞中將該進階排除文字予以記錄為排除,而使該初步元件名詞中經排除該進階排除文字後的連續文字作為該所得出元件名詞。
在本發明的另一實施例中係提供另一種所述的元件名詞及元件名詞所屬位置自動得出設備,其中在該可刪文字紀錄排除裝置進一步具有一首部文字記錄排除裝置,該首部文字記錄排除裝置係自動讀取多數個該基本排除文字連續文字,並根據一首部刪去規則所定義之一可刪識別文字而:判斷各個該基本排除文字連續文字的起始文字或起始連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該對應可刪識別文字且/或該對應可刪識別文字之後的指定字數文字予以作為一首部刪去文字而記錄為排除、或判斷各個該基本排除文字連續文字的起始文字的相鄰前文字或相鄰前連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該起始文字之後的指定字數文字予以作為一首部刪去文字而記錄為排除,藉此而使該基本排除文字排除連續文字中經排除該首部刪去文字後的連續文字作為該可刪文字刪去連續文字。
在本發明的另一實施例中係提供另一種所述的元件名詞及元件名詞所屬位置自動得出設備,其中在該可刪文字紀錄排除裝置進一步具有一尾部文字記錄排除裝置,該尾部文字記錄排除裝置係自動讀取多數個該基本排除文字連續文字,並根據一尾部刪去規則所定義之一可刪識別文字而:判斷各個該基本排除文字連續文字的最終文字或最終連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該對應可刪識別文字且/或該對應可刪識別文字之前的指定字數文字予以作為一尾部刪去文字而記錄為排除、或判斷各個該基本排除文字連續文字的最終文字的相鄰後文字或相鄰後連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該最終文字之前的指定字數文字予以作為一尾部刪去文字而記錄為排除,藉此而使該基本排除文字排除連續文字中經排除該尾部刪去文字後的連續文字作為該可刪文字刪去連續文字。
在本發明的另一實施例中係提供另一種所述的元件名詞及元件名詞所屬位置自動得出設備,其中在該進階排除文字紀錄排除裝置進一步包含一細部元件名詞得出裝置,該細部元件名詞得出裝置將為與「一」後相鄰的該所得元件名詞予以比對於為與「該」後相鄰的該所得元件名詞,當比對吻合時,則確定與「該」後相鄰的該所得元件名詞為一細部元件名詞而作為該所得元件名詞。
在本發明的另一實施例中係提供另一種所述的元件名詞及元件名詞所屬位置自動得出設備,係根據各個所得出元件名詞、各個所得出元件名詞之所得出元件名詞所屬位置、標點符號及換行符號而得出該無字間空格語言文字申請專利範圍的架構。
根據本發明的實施方式,本發明可對於申請專利範圍之元件名詞及元件名詞所屬位置之自動得出,在不需建立元件名詞資料庫的方式且不以詞性進行元件名詞之判斷,而係根據專利請求項的撰寫格式以及特性而以不可能為元件名詞的文字位置逐步排除的方式而最終得出元件名詞,如此以不需花費龐大系統計算及儲存資源的情況,而提供有效率的得出數量最多、準確度最高、提供速度最快的申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備。
以下根據第1圖至第4圖,而說明本發明的實施方式。該說明並非為限制本發明的實施方式,而為本發明之實施例的一種。
如第1圖至第3(c)圖所示,該元件名詞及元件名詞所屬位置自動得出設備P係對於以一無字間空格語言文字所構成的一無字間空格語言文字申請專利範圍C-Text予以自動得出其所具有的所得出元件名詞EM及所得出元件名詞所屬位置EP,該元件名詞及元件名詞所屬位置自動得出設備P包含:基本排除文字紀錄排除裝置1,係自動讀取該無字間空格語言文字申請專利範圍文字C-Text,並根據一基本排除文字庫11中的複數個基本排除文字B而自該無字間空格語言文字申請專利範圍文字C-Text中將該基本排除文字B予以記錄為排除,而使該無字間空格語言文字申請專利範圍文字C-Text中經排除該基本排除文字B後的連續文字作為一基本排除文字連續文字B-Text。
此處的無字間空格語言文字包含:中文、日文或韓文。但本發明並不限於此。
詳細而言,在該基本排除文字紀錄排除裝置1中,該基本排除文字庫11的基本排除文字B,包含:「,」;「;」;「:」;「。」;「一」;「該」;「與」;「及」;「且」;「於」;「並」;「至」;「而」;「在」;「中」;「其」;「係」;「之」;「的」;「個」;「從」;「也」;「只」;「和」;「則」;「內,」;「中,」;「下,」;「處,」;「內;」;「中;」;「下;」;「處;」;「內。」;「中。」;「下。」;「處。」;「中之」;「下之」;「內之」;「處之」;「之間」;「時,」;「藉由」;「藉以」;「用以」;「用來」;「作為」;「涉及」;「根據」;「依據」;「包含」;「包括」;「其中」;「來自」;「用於」;「沿著」;「至少」;「具有」;「提供」;「以及」;「至少」;「一種」;「一個」;「複數」;「多個」;「每個」;「下述」;「大於」;「小於」;「等於」;「所述」;「特徵」;「上述」;「進行」;「較大」;「較小」;「相同」;「之間,」;「不大於」;「不小於」;「不等於」;「且/或」;「及/或」;「一位於」;「相關的」;「相關之」;「之間的」;「之間之」;「形成在」;「接收到」;「經配置」;「用於提供」;「相關聯的」;「特徵在於」;「其特徵在於」……等文字。且該排除方式為:先排除字數較多的基本排除文字,再排除字數較少的基本排除文字。例如,先執行五個字的「其特徵在於」基本排除文字,再依序四個字的「用於提供」、「相關聯的」、「特徵在於」,再執行三個字的「之間,」、「不大於」、「不小於」、「不等於」、「且/或」、「及/或」、「一位於」、「相關的」、「相關之」、「之間的」、「之間之」、「形成在」、「直接將」、「不需要」、「接收到」、「經配置」,之後再依序執行二個字,最後再執行一個字的基本排除文字。舉例而言,一無字間空格語言文字申請專利範圍C-Text如下: 一種緩衝元件,包含:一多層材料,包含一隔離層、一被設置成與該隔離層鄰接的聚合材料層,及一被設置成與該隔離層鄰接且與其對立的穩定層;多個柱狀物,其被設置於該多層材料內,每個該多個柱狀物包含一厚度,一上表面及一側壁,該側壁係從該上表面並底切該上表面以形成一位於該上表面和該側壁之間之半徑化的上緣;多個間隔物區域,其被設置於該多個柱狀物之間,每個該多個間隔物區域包含一間隔物區域厚度;其中該柱狀物厚度大於該間隔物區域厚度。 經該基本排除文字紀錄排除裝置1執行後而為如下(底線為該基本排除文字B):一種 緩衝元件 包含 多層材料 包含 隔離層 被設置成 隔離層鄰接 聚合材料層 被設置成 隔離層鄰接 對立 穩定層 多個 柱狀物, 被設置 多層材料 每個 多個 柱狀物包含 厚度 上表面 側壁 側壁 上表面 底切 上表面 形成 位於 上表面 側壁之間 半徑化 上緣 多個 間隔物區域 被設置 多個 柱狀物之間每個 多個 間隔物區域包含 間隔物區域厚度 其中 柱狀物厚度大於 間隔物區域厚度。
本發明為藉由將不可能為元件名詞的字詞予以排除,而逐步得出可能的元件名詞,上述將該基本排除文字B予以排除即為將不可能為元件名詞的字詞予以排除的第一步,在本發明的其他裝置中為繼續對於不可能為元件名詞的字詞予以記錄記錄為排除。經由該基本排除文字紀錄排除裝置1對於該無字間空格語言文字申請專利範圍文字C-Text予以排除複數個該基本排除文字B之後所得的結果為多數個基本排除文字連續文字B-Text,也就是說經由複數個該基本排除文字B之分隔而得出未被分隔的連續文字,而每組連續文字係稱為一組基本排除文字連續文字B-Text,因此而得出多組基本排除文字連續文字B-Text。以上述例子為例,而得出如下之多數個基本排除文字連續文字B-Text(亦即,不具有底線的各別連續文字):「緩衝元件」、「多層材料」、「隔離層」、「被設置成」、「隔離層鄰接」、「聚合材料層」、「被設置成」、「隔離層鄰接」、「對立」、「穩定層」、「柱狀物」、「被設置 」、「 該多層材料」、「柱狀物」、「厚度」、「 上表面」、「側壁」、「側壁」、「上表面」、「底切」、「上表面」、「形成」、「上表面」、「側壁」、「半徑化」、「上緣」、「間隔物區域」、「被設置」、「柱狀物」、「間隔物區域」、「間隔物區域厚度」、「柱狀物厚度」、「間隔物區域厚度」。
在本發明的一實施例中,係將該基本排除文字B給定一特定標示元(例如,BD(Basic deleting words))作為該基本排除文字的識別。例如,當該基本排除文字B的該特定標示元為BW,則將被識別出的該基本排除文字予以記錄為具有“BW”的特定標示元。此外,並可標記該特定標示字在該無字間空格語言文字申請專利範圍的起始位置及結束位置,例如,“一種”這個基本排除文字的起始位置為0,結束位置為1。並將該特定標示元、該基本排除文字的內容、該特定標示字的起始位置及結束位置予以記錄於一記憶體中,例如記錄為(BW,“一種”0,1)。但本發明並不限於上述方式,只要可明確標示該無字間空格語言文字申請專利範圍中的該基本排除文字及該基本排除文字連續文字的相互之間的位置關係、以及該基本排除文字及該基本排除文字連續文字的內容即可。
接著,說明連接於該基本排除文字紀錄排除裝置1的一可刪文字紀錄排除裝置2。該可刪文字紀錄排除裝置2係自動讀取多數個該基本排除文字連續文字B-Text,並根據一可刪文字刪去規則DR(Deletion Rule)而自各個該基本排除文字連續文字B-Text中將一可刪文字D予以記錄為排除,該可刪文字刪去規則DR係自基本排除文字連續文字B-Text中將該可刪文字刪去規則DR所定義的一特定排除文字SD予以作為該可刪文字D而予以記錄為排除且/或將該特定排除文字SD的相鄰文字或相鄰連續文字予以作為該可刪文字D而予以記錄為排除,而使該基本排除文字排除連續文字B-Text中經排除該可刪文字D後的連續文字作為一可刪文字刪去連續文字D-Text。
亦即,如第2(a)圖、第2(b)圖、第2(c)圖、第3(a)圖、第3(b)圖及第3(c)圖所示(所記錄為排除之文字係以“XX”表示,經找到的該特定排除文字SD係以圓圈表示),該可刪文字刪去規則DR係尋找該基本排除文字連續文字B-Text中是否具有該特定排除文字SD(如第2(a)圖、第2(b)圖、第3(a)圖及第3(b)圖所示)、或是在相鄰於該基本排除文字連續文字B-Text的該基本排除文字B中是否具有該特定排除文字SD(如第2(c)圖及第3(c)圖所示),如果在該基本排除文字連續文字B-Text中具有該特定排除文字SD的話(如第2(a)圖、第2(b)圖、第3(a)圖及第3(b)圖所示),則將該基本排除文字連續文字B-Text中的該特定排除文字SD予以記錄為排除(如第2(a)圖及第3(a)圖所示),或是將該特定排除文字SD連同該特定排除文字SD的相鄰文字或相鄰連續文字予以作為該可刪文字D予以記錄為排除(如第2(b)圖及第3(b)圖所示)。此外,如果在該基本排除文字B中具有該特定排除文字SD(如第2(c)圖及第3(c)圖所示),則將該基本排除文字連續文字B-Text的首部或尾部的特定字數的文字或連續文字予以作為該可刪文字D,而予以記錄為排除。詳細而言,該特定排除文字SD係存在於該基本排除文字連續文字B-Text之中,或是存在於該基本排除文字連續文字B-Text之相鄰之外。所謂「存在於該基本排除文字連續文字B-Text之相鄰之外的特定排除文字SD」係指:該特定排除文字SD並不存在於該基本排除文字連續文字B-Text之中,而是存在於該基本排除文字連續文字B-Text的前相鄰基本排除文字B之尾部或後相鄰基本排除文字B的首部中。進一步而言,本發明的該可刪文字紀錄排除裝置2除了對於該基本排除文字連續文字B-Text找出該特定排除文字SD之外,並可找出該基本排除文字連續文字B-Text的前相鄰基本排除文字B之尾部文字、後相鄰基本排除文字B之尾部文字、前相鄰基本排除文字B之尾部連續文字、或後相鄰基本排除文字B之尾部連續文字是否為該特定排除文字SD,如果是的話,則將該基本排除文字連續文字B-Text的首部文字、尾部文字、首部連續文字、或尾部連續文字予以取出作為該可刪文字D,而予以記錄排除。
以「 被設置成 隔離層鄰接 聚合材料層」中的「 被設置成 」片段為例,其中「一」及「與」為該基本排除文字B,而「被設置成」為該基本排除文字連續文字B-Text。當該可刪文字刪去規則DR中「被設置」被指定為該特定排除文字SD,亦即,該特定排除文字SD係存在於該基本排除文字連續文字B-Text之中,因此,將該特定排除文字SD「被設置」予以作為該可刪文字,而將該可刪文「被設置」予以自該基本排除文字連續文字「被設置成」中予以記錄排除,而形成經排除「被設置」的可刪文字刪去連續文字「成」。此即為第2(a)圖的例子。
以「 天線耦接 隔離層 信號發送器」中的「 天線耦接 」片段為例,其中「將」及「於」為該基本排除文字B,而「天線耦接」為該基本排除文字連續文字B-Text。當該可刪文字刪去規則DR中「於」被指定為該特定排除文字SD,亦即,該特定排除文字SD為存在於該基本排除文字連續文字B-Text「天線耦接」的外部(尾部)相鄰基本排除文字B處(此處,「於」已經於該基本排除文字紀錄排除裝置1中被記錄排除而作為該基本排除文字B),且由該可刪文字刪去規則DR規定為「將在該基本排除文字連續文字之尾部鄰接字“於”之前二字予以記錄排除」之規則,因此將「於」之前的位在該該基本排除文字連續文字B-Text的尾部二字「耦接」予以自該基本排除文字連續文字B-Text中予以記錄排除,而得出「 天線(耦接) 」,其中刮號中為該可刪文字紀錄排除裝置2所記錄排除部分(亦即,為該可刪文字D),因此,而得出該可刪文字刪去連續文字D-Text「天線」。此為第3(c)圖的例子。
具體而言,本發明的該可刪文字紀錄排除裝置2進一步具有一首部文字記錄排除裝置21(亦即,如第2(a)圖、第2(b)圖及第2(c)圖所示),該首部文字記錄排除裝置21係自動讀取多數個該基本排除文字連續文字B-Text,並根據一首部刪去規則HR所定義之一可刪識別文字IW(Identifying word) 而:判斷各個該基本排除文字連續文字B-Text的起始文字或起始連續文字是否具有該可刪識別文字IW並予以作為一對應可刪識別文字Found-IW以將該對應可刪識別文字Found-IW且/或該對應可刪識別文字Found-IW之後的指定字數文字予以作為一首部刪去文字HD而記錄為排除、或判斷各個該基本排除文字連續文字B-Text的起始文字的相鄰前文字或相鄰前連續文字是否具有該可刪識別文字IW並予以作為一對應可刪識別文字Found-IW以將該起始文字之後的指定字數文字予以作為一首部刪去文字HD而記錄為排除,藉此而使該基本排除文字排除連續文字B-Text中經排除該首部刪去文字HD後的連續文字作為該可刪文字刪去連續文字D-Text。
該可刪文字紀錄排除裝置2進一步具有一尾部文字記錄排除裝置22如第3(a)圖、第3(b)圖、第3(c)圖,該尾部文字記錄排除裝置22係自動讀取多數個該基本排除文字連續文字B-Text,並根據一尾部刪去規則TR所定義之一可刪識別文字IW而:判斷各個該基本排除文字連續文字B-Text的最終文字或最終連續文字是否具有該可刪識別文字IW並予以作為一對應可刪識別文字Found-IW以將該對應可刪識別文字Found-IW且/或該對應可刪識別文字Found-IW之前的指定字數文字予以作為一尾部刪去文字TD而記錄為排除、或判斷各個該基本排除文字連續文字B-Text的最終文字的相鄰後文字或相鄰後連續文字是否具有該可刪識別文字IW並予以作為一對應可刪識別文字Found-IW以將該最終文字之前的指定字數文字予以作為一尾部刪去文字TD而記錄為排除,藉此而使該基本排除文字排除連續文字B-Text中經排除該尾部刪去文字TD後的連續文字作為該可刪文字刪去連續文字D-Text。
以下說明該首部文字記錄排除裝置21的一實施例。該首部刪去規則HR,係如第2(a)圖、第2(b)圖及第2(c)圖所示。
在第2(a)圖,係指當該基本排除文字連續文字B-Text的起始文字或起始連續文字具有該可刪識別文字IW,則將可刪識別文字IW予以作為該對應可刪識別文字Found-IW,以將該對應可刪識別文字Found-IW予以作為一首部刪去文字HD而記錄為排除。例如,當該首部文字記錄排除裝置21之該首部刪去規則HR所定義之一可刪識別文字IW(Identifying word)為:「被設置」、「或」;「被」;「隨」;「為」;「將」;「給」(以字數多先執行),則將該些可刪識別文字IW自該基本排除文字連續文字B-Text的起始處予以記錄為排除。
在第2(b)圖,係指當該基本排除文字連續文字B-Text的起始文字或起始連續文字具有該可刪識別文字IW,則將可刪識別文字IW予以作為該對應可刪識別文字Found-IW,以將該對應可刪識別文字Found-IW以及該對應可刪識別文字Found-IW之後的指定字數文字予以作為一首部刪去文字HD而記錄為排除。例如,當該可刪識別文字IW為:「分別」;「當前」;「將經」;「使經」;「該經」;「且經」;「用以」;「用來」;「用於」;「得到」;「設置」;「配置」;「以上」;「以內」;「利用」;「處於」;「~在」;「~地~」;「未被~」;「可~」(以字數多先執行),則將該些文字暨該些文字之後兩個文字予以記錄為排除。
在第2(c)圖中,係判斷各個該基本排除文字連續文字B-Text的起始文字的相鄰前文字或相鄰前連續文字(存在於相鄰前基本排除文字B中)是否具有該可刪識別文字IW並予以作為一對應可刪識別文字Found-IW以將該起始文字之後的指定字數文字予以作為一首部刪去文字HD而記錄為排除,藉此而使該基本排除文字排除連續文字B-Text中經排除該首部刪去文字HD後的連續文字作為該可刪文字刪去連續文字D-Text。例如,當該基本排除文字連續文字B-Text的相鄰的前一個文字或相鄰前連續文字(此些文字及連續文字已經被紀錄為排除)為:藉以、用以、用來、用於、彼此等可刪識別文字IW,則將該基本排除文字連續文字B-Text的起始處後兩個文字予以記錄為排除。
以下說明該尾部文字記錄排除裝置22的一實施例。該尾部刪去規則TR,係如第3(a)圖、第3(b)圖及第3(c)圖所示。
在第3(a)圖,係指當該基本排除文字連續文字B-Text的尾部文字或尾部連續文字具有該可刪識別文字IW,則將可刪識別文字IW予以作為該對應可刪識別文字Found-IW,以將該對應可刪識別文字Found-IW予以作為一尾部刪去文字TD而記錄為排除。例如,當該尾部文字記錄排除裝置21之該尾部刪去規則TR所定義之一可刪識別文字IW(Identifying word)為:或、成、於、時、來、有、者、對應、相關、連同、之間、鄰接、“元件名詞+兩個字”(以字數多先執行),則將該些可刪識別文字IW自該基本排除文字連續文字B-Text的尾部處予以記錄為排除。
在第3(b)圖,係指當該基本排除文字連續文字B-Text的最終文字或最終連續文字具有該可刪識別文字IW,則將可刪識別文字IW予以作為該對應可刪識別文字Found-IW,以將該對應可刪識別文字Found-IW以及該對應可刪識別文字Found-IW之前的指定字數文字予以作為一尾部刪去文字TD而記錄為排除。例如,當該可刪識別文字IW為:給、到(以字數多先執行)、為,則將該些文字暨該些文字之前兩個文字予以記錄為排除。
在第3(c)圖中,係判斷各個該基本排除文字連續文字B-Text的最終文字的相鄰後文字或相鄰後連續文字(存在於相鄰後基本排除文字B中)是否具有該可刪識別文字IW並予以作為一對應可刪識別文字Found-IW以將該最終文字之前的指定字數文字予以作為一尾部刪去文字TD而記錄為排除,藉此而使該基本排除文字排除連續文字B-Text中經排除該尾部刪去文字TD後的連續文字作為該可刪文字刪去連續文字D-Text。例如,當該基本排除文字連續文字B-Text的相鄰的後一個文字或相鄰後連續文字(此些文字及連續文字已經被紀錄為排除)為:該、一、於、在,則將該基本排除文字連續文字B-Text的最終處前兩個文字予以記錄為排除。
因此前述例子成為以下,其中由該可刪文字紀錄排除裝置2所記錄為排除者為以黑底字表示。 「一種 緩衝元件 包含 多層材料 包含 隔離層 被設置成 隔離層鄰接 聚合材料層 被設置成 隔離層鄰接 對立 穩定層 多個 柱狀物, 被設置 多層材料 每個 多個 柱狀物包含 厚度 上表面 側壁 側壁 上表面 底切 上表面 形成 位於 上表面 側壁之間 半徑化 上緣 多個 間隔物區域 被設置 多個 柱狀物之間每個 多個 間隔物區域包含 間隔物區域厚度 其中 柱狀物厚度大於 間隔物區域厚度。」。
本發明的該元件名詞及元件名詞所屬位置自動得出設備P進一步包含一單個文字紀錄排除裝置3,該單個文字紀錄排除裝置3係連接於該可刪文字紀錄排除裝置2,以自動讀取多數個該可刪文字刪去連續文字D-Text,並將僅具有單個文字SW的可刪文字刪去連續文字D-Text予以記錄為排除,而使經排除該單個文字SW後的可刪文字刪去連續文字D-Text作為一初步元件名詞P-EN。
因此前述例子成為以下,其中由該單個文字紀錄排除裝置3所記錄為排除者為以字框表示。「一種 緩衝元件 包含 多層材料 包含 隔離層 被設置成 隔離層鄰接 聚合材料層 被設置成 隔離層鄰接 對立 穩定層 多個 柱狀物, 被設置 多層材料 每個 多個 柱狀物包含 厚度 上表面 側壁 側壁 上表面 底切 上表面 形成 位於 上表面 側壁之間 半徑化 上緣 多個 間隔物區域 被設置 多個 柱狀物之間每個 多個 間隔物區域包含 間隔物區域厚度 其中 柱狀物厚度大於 間隔物區域厚度。」。
本發明的該元件名詞及元件名詞所屬位置自動得出設備P進一步包含一進階排除文字紀錄排除裝置4,該進階排除文字紀錄排除裝置4連接於該單個文字紀錄排除裝置3以自動讀取多數個該初步元件名詞P-EN,並根據一進階排除文字庫AL中的複數個進階排除文字ED而自各個該初步元件名詞P-EN中將該進階排除文字ED予以記錄為排除,而使該初步元件名詞中P-EN經排除該進階排除文字ED後的連續文字作為該所得出元件名詞R-EN。
詳細而言,該進階排除文字庫AL中的複數個進階排除文字ED包含:初步元件名詞為二個文字且該初步元件名詞之前、之後為「於」、「成」、「至」、「在」、「用於」……等,則將該初步元件名詞予以刪除;以及「經XX」(XX代表二個文字)、「為XX」(XX代表二個文字)、「待XX」(XX代表二個文字)、「之間」、「同時」、「實時」、「以上」、「被XX的」(XX代表二個文字)、「XX化」……等文字,則將該初步元件名詞予以刪除。
因此前述例子成為以下,其中由該進階排除文字紀錄排除裝置4所記錄為排除者為以刪除線表示。「一種 緩衝元件 包含 多層材料 包含 隔離層 被設置成 隔離層鄰接 聚合材料層 被設置成 隔離層鄰接 對立 穩定層 多個 柱狀物, 被設置 多層材料 每個 多個 柱狀物包含 厚度 上表面 側壁 側壁 上表面 底切 上表面 形成 位於 上表面 側壁之間 半徑化 上緣 多個 間隔物區域 被設置 多個 柱狀物之間每個 多個 間隔物區域包含 間隔物區域厚度 其中 柱狀物厚度大於 間隔物區域厚度。」。
以上未具有任何標號者為所得元件名詞(即,本發明所要得出的元件名詞),依序包含:緩衝元件 多層材料 隔離層、隔離層、聚合材料層 隔離層、穩定層、柱狀物、多層材料、柱狀物、厚度、上表面、側壁、側壁、上表面、上表面、上表面、側壁 上緣、間隔物區域、柱狀物、間隔物區域、間隔物區域厚度、柱狀物厚度 間隔物區域厚度。
如第1圖所示,進一步而言,依據本發明的一實施例的對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備P,其中在該進階排除文字紀錄排除裝置4進一步包含一細部元件名詞得出裝置42,該細部元件名詞得出裝置42將為與「一」後相鄰的該所得元件名詞予以比對於為與「該」後相鄰的該所得元件名詞,當比對吻合時,則確定與「該」後相鄰的該所得元件名詞為一細部元件名詞而作為該所得元件名詞。藉由此方式,而確定該所得元件名詞,因此而可再次執行該首部刪去規則HR中的“元件名詞+兩個字”之記錄為排除,而增加元件名詞之得出正確度。
如第1圖所示,依據本發明的一實施例的對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備P,係根據各個所得出元件名詞、各個所得出元件名詞之所得出元件名詞所屬位置、標點符號及換行符號而得出該無字間空格語言文字申請專利範圍的架構。例如,可藉由標點符號而對於無字間空格語言文字申請專利範圍進行換行,且將所得出的該所得元件名詞予以標示為可點選,以在點選後可跳至該所得元件名詞位於說明書的位置,藉此而可更加瞭解該所得元件名詞的意義。
因此前述例子成為以下,其中並進一步將“;”所屬區段予以對仗顯示,所得元件名詞為以底線表示。一種緩衝元件 , 包含 : 多層材料 包含 一隔離層 一被設置成與 該隔離層 鄰接的聚合材料層 及 一 被設置成與 該隔離層 鄰接 且 與 其 對立的穩定層 多個 狀物 其 被設置 於 該多層材料 內 , 每個 該 多個 狀物 包含 一厚度 上表面 及 一側壁 側壁 係 從 該上表面 並底切該上表面 以形成 一 位於 該上表面 和 該側壁 之間 之半徑化 的上緣 多個間隔物區域 其 被設置 於 該 多個 狀物 之間, 每個 該 多個間隔物區域 包含 一間隔物區域厚度 其中 該柱狀 物厚度 大於 該間隔物區域厚度
本發明除了上述實施例之外,可藉由先將元件對照表中所列出的元件名詞予以先行於該對於無字間空格語言文字申請專利範圍文字C-Text中找出,再進行該基本排除文字紀錄排除裝置1中的該基本排除文字連續文字B-Text的得出,以增加整體運算速度以及正確性。如第4圖所示,在本發明的另一實施例,該對於無字間空格語言文字申請專利範圍文字C-Text之元件名詞及元件名詞所屬位置自動得出設備P可另設置一元件對照表元件名詞記錄排除裝置1A,該元件對照表元件名詞記錄排除裝置1A連接於該基本排除文字紀錄排除裝置1該元件對照表元件名詞記錄排除裝置1A係自動讀取該無字間空格語言文字申請專利範圍文字C-Text,並根據一元件名詞對照表EN-List中的一元件對照表元件名詞List-EN而自該無字間空格語言文字申請專利範圍文字C-Text中將該元件對照表元件名詞List-EN予以記錄為排除,而使該無字間空格語言文字申請專利範圍文字C-Text中經排除該元件對照表元件名詞List-EN後的連續文字作為一元件對照表元件名詞排除連續文字D-EN。所得出的該元件對照表元件名詞排除連續文字D-EN予以傳送至該基本排除文字記錄排除裝置1,而由該基本排除文字記錄排除裝置1為同樣執行上述操作,以自該元件對照表元件名詞排除連續文字D-EN中將該基本排除文字B予以記錄為排除,而使該元件對照表元件名詞排除連續文字D-EN中經排除該基本排除文字B後的連續文字作為一基本排除文字連續文字B-Text。
進一步而言,在先行得出該元件對照表元件名詞List-EN之後,可在後續的可刪文字紀錄排除裝置2(包含有該首部文字記錄排除裝置21及該首部文字記錄排除裝置22)之該可刪文字刪去規則DR中訂定出關於該元件對照表元件名詞List-EN的規則運算,而可增加整體運算速度以及正確性。亦即,該可刪文字紀錄排除裝置2中的該可刪文字刪去規則DR將該元件對照表元件名詞List-EN予以納入為該特定排除文字SD,以自基本排除文字連續文字B-Text中將該特定排除文字SD予以作為該可刪文字D而予以記錄為排除且/或將該特定排除文字SD的相鄰文字或相鄰連續文字予以作為該可刪文字D而予以記錄為排除,而使該基本排除文字排除連續文字B-Text中經排除該可刪文字D後的連續文字作為一可刪文字刪去連續文字D-Text。
具體而言,該可刪文字紀錄排除裝置2的首部文字記錄排除裝置21係自動讀取多數個該基本排除文字連續文字B-Text,並將該元件對照表元件名詞List-EN予以納入為該首部刪去規則所定義的一可刪識別文字IW,以除了第一實施例的判斷之外,再根據該元件對照表元件名詞List-EN而:判斷各個該基本排除文字連續文字B-Text的起始文字的相鄰前文字或相鄰前連續文字是否具有該元件對照表元件名詞List-EN並予以作為一對應可刪識別文字Found-IW以將該起始文字之後的指定字數文字予以作為一首部刪去文字而記錄為排除(亦即,在將該元件對照表元件名詞List-EN予以納入為該首部刪去規則HR所定義的一可刪識別文字IW時,係為第2(c)圖以及第3(c)圖的例子,其中該可刪識別文字IW為在該基本排除文字連續文字B-Text的起始文字之外的相鄰前文字或相鄰前連續文字)。此時,該首部文字記錄排除裝置21為與第一實施例相同,對於其他非該元件對照表元件名詞List-EN的可刪識別文字IW仍為:判斷各個該基本排除文字連續文字B-Text的起始文字或起始連續文字是否具有該可刪識別文字IW並予以作為一對應可刪識別文字Found-IW以將該對應可刪識別文字Found-IW且/或該對應可刪識別文字Found-IW之後的指定字數文字予以作為一首部刪去文字而記錄為排除、或判斷各個該基本排除文字連續文字的起始文字的相鄰前文字或相鄰前連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該起始文字之後的指定字數文字予以作為一首部刪去文字而記錄為排除,藉此而使該基本排除文字排除連續文字中B-Text經排除該首部刪去文字後的連續文字作為該可刪文字刪去連續文字D-Text。
詳細而言,該首部文字記錄排除裝置21除了執行與第一實施例相同的對於該可刪識別文字IW的判斷之外,並會依據所得知之該元件對照表元件名詞List-EN而對該基本排除文字排除連續文字B-Text進行以下之文字記錄排除,以得到該可刪文字刪去連續文字D-Text。例如,該可刪文字刪去規則DR訂定出:「將」+「List-EN 」+「……至」(亦即,「將」以及「List-EN 」為位在該基本排除文字排除連續文字B-Text「……至」之外且為前相鄰,且「至」為在該基本排除文字排除連續文字B-Text之尾部)之情形,則將「至」及「至」之前的兩個字予以記錄為排除。又例如,該可刪文字刪去規則DR訂定出:「把」+「List-EN 」+「……至」(亦即,「把」以及「List-EN 」為位在該基本排除文字排除連續文字B-Text「……至」之外且為前相鄰,且「至」為在該基本排除文字排除連續文字B-Text之尾部)之情形,則將「至」及「至」之前的兩個字予以記錄為排除。又例如,該可刪文字刪去規則DR訂定出:「把」+「List-EN 」+「……以」(亦即,「把」以及「List-EN 」為位在該基本排除文字排除連續文字B-Text「……以」之外且為前相鄰,且「以」為在該基本排除文字排除連續文字B-Text之尾部)之情形,則將「以」及「以」之前的兩個字予以記錄為排除。
在具有先行得出該元件對照表元件名詞List-EN的該元件對照表元件名詞記錄排除裝置1A之無字間空格語言文字申請專利範圍文字C-Text之元件名詞及元件名詞所屬位置自動得出設備P,該可刪文字紀錄排除裝置2的該尾部文字記錄排除裝置22係自動讀取多數個該基本排除文字連續文字B-Text,並將該元件對照表元件名詞List-EN予以納入為該尾部刪去規則TR所定義的一可刪識別文字IW,以除了第一實施例的判斷之外,再根據該元件對照表元件名詞List-EN而:判斷各個該基本排除文字連續文字B-Text的最終文字的相鄰後文字或相鄰後連續文字是否具有該元件對照表元件名詞List-EN並予以作為一對應可刪識別文字Found-IW以將該最終文字之後的指定字數文字予以作為一尾部刪去文字而記錄為排除(亦即,在將該元件對照表元件名詞List-EN予以納入為該尾部刪去規則TR所定義的一可刪識別文字IW時,係為第2(c)圖以及第3(c)圖的例子,其中該可刪識別文字IW為在該基本排除文字連續文字B-Text的最終文字之外的相鄰後文字或相鄰後連續文字)。此時,該尾部文字記錄排除裝置22為與第一實施例相同,對於其他非該元件對照表元件名詞List-EN的可刪識別文字IW仍為:判斷各個該基本排除文字連續文字B-Text的最終文字或最終連續文字是否具有該可刪識別文字IW並予以作為一對應可刪識別文字Found-IW以將該對應可刪識別文字Found-IW且/或該對應可刪識別文字Found-IW之前的指定字數文字予以作為一尾部刪去文字TD而記錄為排除、或判斷各個該基本排除文字連續文字B-Text的最終文字的相鄰後文字或相鄰後連續文字是否具有該可刪識別文字IW並予以作為一對應可刪識別文字Found-IW以將該最終文字之前的指定字數文字予以作為一尾部刪去文字TD而記錄為排除,藉此而使該基本排除文字排除連續文字B-Text中經排除該尾部刪去文字TD後的連續文字作為該可刪文字刪去連續文字D-Text。
舉例而言,該尾部文字記錄排除裝置22除了執行與第一實施例相同的對於該可刪識別文字IW的判斷之外,並會依據所得知之該元件對照表元件名詞List-EN而對該基本排除文字排除連續文字B-Text進行以下之文字記錄排除,以得到該可刪文字刪去連續文字D-Text。例如,該可刪文字刪去規則DR訂定出:「至」+「List-EN ,」(亦即,「List-EN ,」為位在該基本排除文字B-Text「……至」之外且為後相鄰,且「至」為在該基本排除文字排除連續文字B-Text之尾部)之情形,則將「至」及「至」之前的兩個字予以記錄為排除(直到標點符號,如「;」、「,」)。又例如,該可刪文字刪去規則DR訂定出:「給」+「List-EN ,」(亦即,「List-EN ,」為位在該基本排除文字B-Text「……給」之外且為後相鄰,且「給」為在該基本排除文字排除連續文字B-Text之尾部)之情形,則將「給」及「給」之前的兩個字予以記錄為排除(至標點符號,如「;」、「,」)。又例如,該可刪文字刪去規則DR訂定出:「到」+「List-EN ,」(亦即,「List-EN ,」為位在該基本排除文字B-Text「……到」之外且為後相鄰,且「到」為在該基本排除文字排除連續文字B-Text之尾部)之情形,則將「到」及「到」之前的兩個字予以記錄為排除(至標點符號,如「;」、「,」)。又例如,該可刪文字刪去規則DR訂定出:「至」+「List-EN 上,」(亦即,「List-EN 上,」為位在該基本排除文字B-Text「……至」之外且為後相鄰,且「至」為在該基本排除文字排除連續文字B-Text之尾部)之情形,則將「至」及「至」之前的兩個字予以記錄為排除。
根據本發明的實施方式,本發明可對於申請專利範圍之元件名詞及元件名詞所屬位置之自動得出,在不需建立元件名詞資料庫的方式且不以詞性進行元件名詞之判斷,而係根據專利請求項的撰寫格式以及特性而以不可能為元件名詞的文字位置逐步排除的方式而最終得出元件名詞,如此以不需花費龐大系統計算及儲存資源的情況,而提供有效率的得出數量最多、準確度最高、提供速度最快的申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備。
以上之敘述以及說明僅為本發明之較佳實施例之說明,對於此項技術具有通常知識者當可依據以下所界定申請專利範圍以及上述之說明而作其他之修改,惟此些修改仍應是為本發明之發明精神而在本發明之權利範圍中。
P:元件名詞及元件名詞所屬位置自動得出設備 1A:元件對照表元件名詞記錄排除裝置 1:基本排除文字記錄排除裝置 11:基本排除文字庫 2:可刪文字紀錄排除裝置 21:首部文字刪去裝置 22:對應前相鄰字判斷裝置 3:單個文字紀錄排除裝置 4:進階排除文字紀錄排除裝置 42:第二細部元件名詞得出裝置 B:基本排除文字 B-Text:基本排除文字連續文字 SD:特定排除文字
[第1圖]為顯示根據本發明之對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備的一實施例的架構方塊示意圖; [第2(a)圖]為顯示當基本排除文字連續文字的起始文字或起始連續文字具有該可刪識別文字則將可刪識別文字予以作為該對應可刪識別文字的示意圖; [第2(b)圖]為顯示當基本排除文字連續文字的起始文字或起始連續文字具有可刪識別文字則將可刪識別文字予以作為該對應可刪識別文字的另一示意圖; [第2(c)圖]為顯示判斷各個基本排除文字連續文字的起始文字的相鄰前文字或相鄰前連續文字是否具有可刪識別文字並予以作為一對應可刪識別文字的示意圖; [第3(a)圖]為顯示當基本排除文字連續文字的尾部文字或尾部連續文字具有可刪識別文字則將可刪識別文字予以作為對應可刪識別文字的示意圖; [第3(b)圖]為顯示當基本排除文字連續文字的最終文字或最終連續文字具有可刪識別文字則將可刪識別文字予以作為對應可刪識別文字的示意圖; [第3(c)圖]為顯示判斷各個基本排除文字連續文字的最終文字的相鄰前文字或相鄰前連續文字是否具有可刪識別文字並予以作為一對應可刪識別文字的示意圖;以及 [第4圖]為顯示根據本發明之對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備的另一實施例的架構方塊示意圖。
無。
P:元件名詞及元件名詞所屬位置自動得出設備
1:基本排除文字所屬位置得出裝置
11:基本排除文字庫
2:可刪文字紀錄排除裝置
21:首部文字記錄排除裝置
22:尾部文字記錄排除裝置
3:單個文字紀錄排除裝置
4:進階排除文字紀錄排除裝置
42:細部元件名詞得出裝置

Claims (10)

  1. 一種對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備,係對於以一無字間空格語言文字所構成的一無字間空格語言文字申請專利範圍予以自動得出申請專利範圍的各個所得出元件名詞及所得出元件名詞所屬位置,該元件名詞及元件名詞所屬位置自動得出設備包含:基本排除文字紀錄排除裝置,係自動讀取該無字間空格語言文字申請專利範圍文字C-Text,並根據一基本排除文字庫中的複數個基本排除文字而自該無字間空格語言文字申請專利範圍文字C-Text中將該基本排除文字予以記錄為排除,而使該無字間空格語言文字申請專利範圍文字C-Text中經排除該基本排除文字後的連續文字作為一基本排除文字連續文字;可刪文字紀錄排除裝置,係自動讀取多數個該基本排除文字連續文字,並根據一可刪文字刪去規則而自各個該基本排除文字連續文字中將一可刪文字予以記錄為排除,該可刪文字刪去規則係自基本排除文字連續文字中將該可刪文字刪去規則所定義的一特定排除文字予以作為該可刪文字而予以記錄為排除且/或將該特定排除文字的相鄰文字或相鄰連續文字予以作為該可刪文字而予以記錄為排除,而使該基本排除文字排除連續文字中經排除該可刪文字後的連續文字作為一可刪文字刪去連續文字;單個文字紀錄排除裝置,係自動讀取多數個該可刪文字刪去連續文字,並將僅具有單個文字的可刪文字刪去連續文字予以記錄為排除,而使經排除該單個文字後的可刪文字刪去連續文字作為一初步元件名詞;以及 進階排除文字紀錄排除裝置,係自動讀取多數個該初步元件名詞,並根據一進階排除文字庫中的複數個進階排除文字而自各個該初步元件名詞中將該進階排除文字予以記錄為排除,而使該初步元件名詞中經排除該進階排除文字後的連續文字作為該所得出元件名詞。
  2. 如請求項1所述的元件名詞及元件名詞所屬位置自動得出設備,其中在該可刪文字紀錄排除裝置進一步具有一首部文字記錄排除裝置,該首部文字記錄排除裝置係自動讀取多數個該基本排除文字連續文字,並根據一首部刪去規則所定義之一可刪識別文字而:判斷各個該基本排除文字連續文字的起始文字或起始連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該對應可刪識別文字且/或該對應可刪識別文字之後的指定字數文字予以作為一首部刪去文字而記錄為排除、或判斷各個該基本排除文字連續文字的起始文字的相鄰前文字或相鄰前連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該起始文字之後的指定字數文字予以作為一首部刪去文字而記錄為排除,藉此而使該基本排除文字排除連續文字中經排除該首部刪去文字後的連續文字作為該可刪文字刪去連續文字。
  3. 如請求項1所述的元件名詞及元件名詞所屬位置自動得出設備,其中在該可刪文字紀錄排除裝置進一步具有一尾部文字記錄排除裝置,該尾部文字記錄排除裝置係自動讀取多數個該基本排除文字連續文字,並根據一尾部刪去規則所定義之一可刪識別文字而:判斷各個該基本排除文字連續文字的最終文字或最終連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該對應可刪識別文字且/或該對應可刪識別文字之前的指定字數文字予以作為一尾部刪去文字而記錄為排除、或判斷各個該基本排除文字連續文 字的最終文字的相鄰後文字或相鄰後連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該最終文字之前的指定字數文字予以作為一尾部刪去文字而記錄為排除,藉此而使該基本排除文字排除連續文字中經排除該首部刪去文字後的連續文字作為該可刪文字刪去連續文字。
  4. 如請求項1所述的元件名詞及元件名詞所屬位置自動得出設備,其中在該進階排除文字紀錄排除裝置進一步包含一細部元件名詞得出裝置,該細部元件名詞得出裝置將為與「一」後相鄰的該所得元件名詞予以比對於為與「該」後相鄰的該所得元件名詞,當比對吻合時,則確定與「該」後相鄰的該所得元件名詞為一細部元件名詞而作為該所得元件名詞。
  5. 如請求項1所述的元件名詞及元件名詞所屬位置自動得出設備,係根據各個所得出元件名詞、各個所得出元件名詞之所得出元件名詞所屬位置、標點符號及換行符號而得出該無字間空格語言文字申請專利範圍的架構。
  6. 一種對於無字間空格語言文字申請專利範圍文字C-Text之元件名詞及元件名詞所屬位置自動得出設備,係對於以一無字間空格語言文字所構成的一無字間空格語言文字申請專利範圍文字C-Text予以自動得出一所得出元件名詞及所得出元件名詞所屬位置,該元件名詞及元件名詞所屬位置自動得出設備包含:元件對照表元件名詞記錄排除裝置,該元件對照表元件名詞記錄排除裝置係自動讀取該無字間空格語言文字申請專利範圍文字C-Text,並根據一元件名詞對照表中的一元件對照表元件名詞而自該無字間空格語言文字申請專利範圍文字C-Text中將該元件對照表元件名詞予以記錄為排除,而使該無字間空格語言文字 申請專利範圍文字C-Text中經排除該元件對照表元件名詞後的連續文字作為一元件對照表元件名詞排除連續文字;基本排除文字記錄排除裝置,係自動讀取該元件對照表元件名詞排除連續文字,並根據一基本排除文字庫中的複數個基本排除文字而自該元件對照表元件名詞排除連續文字中將該基本排除文字予以記錄為排除,而使該元件對照表元件名詞排除連續文字中經排除該基本排除文字後的連續文字作為一基本排除文字連續文字;可刪文字記錄排除裝置,係自動讀取多數個該基本排除文字連續文字,並根據一可刪文字刪去規則而自各個該基本排除文字連續文字中將一可刪文字予以記錄為排除,該可刪文字刪去規則係自基本排除文字連續文字中將該可刪文字刪去規則所定義的一特定排除文字予以作為該可刪文字而予以記錄為排除且/或將該特定排除文字的相鄰文字或相鄰連續文字予以作為該可刪文字而予以記錄為排除,而使該基本排除文字排除連續文字中經排除該可刪文字後的連續文字作為一可刪文字刪去連續文字;單個文字記錄排除裝置,係自動讀取多數個該可刪文字刪去連續文字,並將僅具有單個文字的可刪文字刪去連續文字予以記錄為排除,而使經排除該單個文字後的可刪文字刪去連續文字作為一初步元件名詞;以及進階排除文字記錄排除裝置,係自動讀取多數個該初步元件名詞,並根據一進階排除文字庫中的複數個進階排除文字而自各個該初步元件名詞中將該進階排除文字予以記錄為排除,而使該初步元件名詞中經排除該進階排除文字後的連續文字作為該所得出元件名詞。
  7. 如請求項6所述的元件名詞及元件名詞所屬位置自動得出設備,其中在該可刪文字紀錄排除裝置進一步具有一首部文字記錄排除裝置,該首部文字記錄排除裝置係自動讀取多數個該基本排除文字連續文字,並根據一首部刪去規則所定義之一可刪識別文字而:判斷各個該基本排除文字連續文字的起始文字或起始連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該對應可刪識別文字且/或該對應可刪識別文字之後的指定字數文字予以作為一首部刪去文字而記錄為排除、或判斷各個該基本排除文字連續文字的起始文字的相鄰前文字或相鄰前連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該起始文字之後的指定字數文字予以作為一首部刪去文字而記錄為排除,藉此而使該基本排除文字排除連續文字中經排除該首部刪去文字後的連續文字作為該可刪文字刪去連續文字。
  8. 如請求項6所述的元件名詞及所屬元件名詞所屬位置自動得出設備,其中在該可刪文字紀錄排除裝置進一步具有一尾部文字記錄排除裝置,該尾部文字記錄排除裝置係自動讀取多數個該基本排除文字連續文字,並根據一尾部刪去規則所定義之一可刪識別文字而:判斷各個該基本排除文字連續文字的最終文字或最終連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該對應可刪識別文字且/或該對應可刪識別文字之前的指定字數文字予以作為一尾部刪去文字而記錄為排除、或判斷各個該基本排除文字連續文字的最終文字的相鄰後文字或相鄰後連續文字是否具有該可刪識別文字並予以作為一對應可刪識別文字以將該最終文字之前的指定字數文字予以作為一尾部刪去文字而記錄為排除,藉此而使該基本排除文字排除連續文字中經排除該尾部刪去文字後的連續文字作為該可刪文字刪去連續文字。
  9. 如請求項6所述的元件名詞及元件名詞所屬位置自動得出設備,其中在該進階排除文字紀錄排除裝置進一步包含一細部元件名詞得出裝置,該細部元件名詞得出裝置將為與「一」後相鄰的該所得元件名詞予以比對於為與「該」後相鄰的該所得元件名詞,當比對吻合時,則確定與「該」後相鄰的該所得元件名詞為一細部元件名詞而作為該所得元件名詞。
  10. 如請求項6所述的元件名詞及元件名詞所屬位置自動得出設備,係根據各個所得出元件名詞、各個所得出元件名詞之所得出元件名詞所屬位置、標點符號及換行符號而得出該無字間空格語言文字申請專利範圍的架構。
TW108141435A 2019-11-14 2019-11-14 對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備 TWI772709B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW108141435A TWI772709B (zh) 2019-11-14 2019-11-14 對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備
CN202010207905.1A CN112800760A (zh) 2019-11-14 2020-03-23 权利要求书的元件名词及元件名词所属位置自动得出设备
JP2020148638A JP7105500B2 (ja) 2019-11-14 2020-09-04 コンピュータによって実行される文字間スペースなし特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW108141435A TWI772709B (zh) 2019-11-14 2019-11-14 對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備

Publications (2)

Publication Number Publication Date
TW202119258A TW202119258A (zh) 2021-05-16
TWI772709B true TWI772709B (zh) 2022-08-01

Family

ID=75806081

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108141435A TWI772709B (zh) 2019-11-14 2019-11-14 對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備

Country Status (3)

Country Link
JP (1) JP7105500B2 (zh)
CN (1) CN112800760A (zh)
TW (1) TWI772709B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667194A (zh) * 2009-09-29 2010-03-10 北京大学 基于用户评论文本特征的自动摘要方法及其自动摘要系统
CN102945228A (zh) * 2012-10-29 2013-02-27 广西工学院 一种基于文本分割技术的多文档文摘方法
CN103390004A (zh) * 2012-05-11 2013-11-13 北京百度网讯科技有限公司 一种语义冗余的确定方法和装置、对应的搜索方法和装置
CN103559310A (zh) * 2013-11-18 2014-02-05 广东利为网络科技有限公司 一种从文章中提取关键词的方法
CN104915443A (zh) * 2015-06-29 2015-09-16 北京信息科技大学 一种中文微博评价对象的抽取方法
TW201804341A (zh) * 2016-07-13 2018-02-01 阿里巴巴集團服務有限公司 字串的分詞方法、裝置及設備

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001318792A (ja) * 2000-05-10 2001-11-16 Nippon Telegr & Teleph Corp <Ntt> 固有表現抽出規則生成システムと方法およびその処理プログラムを記録した記録媒体ならびに固有表現抽出装置
CN1253814C (zh) * 2000-08-04 2006-04-26 拓墣科技股份有限公司 数字文件关键特征的自动撷取方法
CN103235774B (zh) * 2013-04-27 2016-04-06 杭州电子科技大学 一种科技项目申请书特征词提取方法
TWI550422B (zh) * 2015-04-08 2016-09-21 雲拓科技有限公司 申請專利範圍之文字歸位方法
TWI639927B (zh) * 2016-05-27 2018-11-01 雲拓科技有限公司 將一申請專利範圍中的申請專利範圍元件名詞所屬元件名詞對應標號予以對應之對應方法
CN108268440A (zh) * 2017-01-04 2018-07-10 普天信息技术有限公司 一种未登录词识别方法
TW201828103A (zh) * 2017-01-24 2018-08-01 雲拓科技有限公司 申請專利範圍之解構處理方法
CN109829159B (zh) * 2019-01-29 2020-02-18 南京师范大学 一种古汉语文本的一体化自动词法分析方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667194A (zh) * 2009-09-29 2010-03-10 北京大学 基于用户评论文本特征的自动摘要方法及其自动摘要系统
CN103390004A (zh) * 2012-05-11 2013-11-13 北京百度网讯科技有限公司 一种语义冗余的确定方法和装置、对应的搜索方法和装置
CN102945228A (zh) * 2012-10-29 2013-02-27 广西工学院 一种基于文本分割技术的多文档文摘方法
CN103559310A (zh) * 2013-11-18 2014-02-05 广东利为网络科技有限公司 一种从文章中提取关键词的方法
CN104915443A (zh) * 2015-06-29 2015-09-16 北京信息科技大学 一种中文微博评价对象的抽取方法
TW201804341A (zh) * 2016-07-13 2018-02-01 阿里巴巴集團服務有限公司 字串的分詞方法、裝置及設備

Also Published As

Publication number Publication date
JP7105500B2 (ja) 2022-07-25
TW202119258A (zh) 2021-05-16
CN112800760A (zh) 2021-05-14
JP2021082252A (ja) 2021-05-27

Similar Documents

Publication Publication Date Title
CN107357778B (zh) 一种变形词的识别验证方法及系统
CN103646018B (zh) 一种基于hash散列表词典结构的中文分词方法
US6169999B1 (en) Dictionary and index creating system and document retrieval system
KR20190094078A (ko) 모호한 엔티티 단어에 기반한 텍스트 처리 방법과 장치
US20230035947A1 (en) Voice recognition method and related product
CN112541095B (zh) 视频标题生成方法、装置、电子设备及存储介质
CN105260396A (zh) 字词检索方法和装置
TWI772709B (zh) 對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備
WO2024051196A1 (zh) 恶意代码检测方法、装置、电子设备及存储介质
CN105512335B (zh) 一种摘要搜索方法和装置
CN111291535A (zh) 剧本处理方法、装置、电子设备及计算机可读存储介质
JP3444831B2 (ja) 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
CN104731766A (zh) 拼音文字词库构建方法和装置及输入方法和系统
CN116542246A (zh) 基于关键词质检文本的方法、装置和电子设备
KR100910275B1 (ko) 이중언어 문서에서의 음차표기 대역쌍 자동 추출 방법 및장치
KR101452638B1 (ko) 유사 문자열 검색 방법 및 장치
CN114222193B (zh) 一种视频字幕时间对齐模型训练方法及系统
JPH11203305A (ja) 文書画像処理方法および記録媒体
KR100278310B1 (ko) 확률의존문법을 후향언어모델로 사용하는 연속음성 인식시스템및 그 방법
CN112861534B (zh) 一种对象名称识别方法及装置
KR20090042201A (ko) 이중언어 문서에서의 음차표기 대역쌍 자동 추출 방법 및 장치
CN112001168B (zh) 词语纠错方法、装置、电子设备及存储介质
JP3333952B2 (ja) 話題構造認識方法及び装置
JP2006139659A (ja) 単語認識装置、単語認識方法、単語認識プログラム
KR20050041160A (ko) 멀티미디어 콘텐츠 관리 시스템 및 그 방법