JP7105500B2

JP7105500B2 - コンピュータによって実行される文字間スペースなし特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法

Info

Publication number: JP7105500B2
Application number: JP2020148638A
Authority: JP
Inventors: 林志青
Original assignee: Integral Search International Ltd
Current assignee: Integral Search International Ltd
Priority date: 2019-11-14
Filing date: 2020-09-04
Publication date: 2022-07-25
Anticipated expiration: 2040-09-04
Also published as: TWI772709B; TW202119258A; CN112800760A; CN112800760B; JP2021082252A

Description

本発明は、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法に関するものであって、特に、文字間スペースなし特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法に関する。

特許の明細書というのは、複雑で読みにくいものである。人工知能によって特許請求項における要素名詞を識別するのは、人工知能特許閲読補助システムの礎である。要素名詞とは、特許請求項において要素を構成する定義文字であり、その要素名詞が名詞だけではなく、名詞文字が最終文字として、形容詞、動詞、副詞や名詞を含んで構成する定義文字であり、例えば、「受信アンテナ」、「信号発送手段」などがある。特許請求項の要素名詞を獲得することでその要素名詞の所属位置を獲得できるので、その要素名詞に対応する動作特徴、接続関係や位置関係の対応位置をより明確に獲得でき、特許の閲読者へ明確に補助して、その特許請求項の技術特徴をより明白に理解させることができる。

しかしながら、例えば、中国語、日本語、韓国語などのアジア言語である文字間スペースなし言語文字について、文字と文字の間にはスペースが存在しないので、英語に比べて、前記文字間スペースなし言語文字の文字と文字の間の組合せを識別することが難しくて、各種の組合った言葉を認識するのが難しいこともある。この場合では、自然言語の品詞の解析を実現するのは困難なことである。要素名詞データベースの方法を確立して品詞によって要素名詞の識別を行う方法が提案されるが、特許請求項の要素名詞は色んな変化があるので、膨大な要素名詞データベースの立ち上げが不可能であり、動詞、名詞、形容詞、副詞などの誤判がよくある。また、膨大な要素名詞データベースを立ち上げることが可能であっても、そのような膨大なデータベースの資料比較工程を行うことは、膨大な時間をかかるので、実施するのが難しくなる。

このため、請求の範囲の要素名詞を、如何に高効率で正確に自動的に獲得する方法、即ち、要素名詞データベースの方法に頼らず、且つ、品詞で要素名詞の判断を行わずに、特許請求項のフォーマットおよび特性により、膨大なシステム計算およびストレージをかけずに、効率な最高獲得数、最高正確度、最速獲得速度の方法が求められている。

このため、本発明は上記の課題に鑑みてなされたもので、要素名詞データベースの立ち上げ、且つ、品詞での要素名詞の判断の代わりに、要素名詞の存在不可能の文字位置を順を追って排除することで要素名詞を獲得し、数が多く、成功確率が高く、且つ最速の獲得速度で特許請求の範囲の要素名詞及び要素名詞所属位置を効率的に獲得できる文字間スペースなし特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供することを目的とする。

本発明が従来の技術問題を解決するために用いる技術手段は、コンピュータを用いて中国語文字からなる中国語文字の特許請求の範囲の文字に対して前記中国語文字の特許請求の範囲に所属する各要素名詞文字コードを自動的に獲得して自動獲得要素名詞とし、コンピュータによって実行される、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法であって、コンピュータによって、中国語文字の特許請求の範囲の文字コードを自動的に読み取って前記中国語文字の特許請求の範囲の文字とし、基本排除文字データベースにおいて冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む複数の基本排除文字コードを複数の基本排除文字とすることに基いて、前記中国語文字の特許請求の範囲の文字コードから、複数の前記基本排除文字コードを排除するように記録して、前記中国語文字の特許請求の範囲の文字コードにおける前記基本排除文字コードが排除された連続文字コードを基本排除文字連続文字コードとする、基本排除文字記録排除工程と、コンピュータによって、複数の基本排除文字連続文字コードを自動的に読取って基本排除文字連続文字とし、前記基本排除文字連続文字コードと前記基本排除文字連続文字の前の排除と記録された前記基本排除文字コードの間の文字コード相隣文字関係に基き、前記基本排除文字連続文字コードと前記基本排除文字連続文字の後の排除と記録された前記基本排除文字コードの間の慣用字文字コード、動詞文字コード、副詞文字コード、設置詞文字コードを含む文字コード相隣文字関係に基いて、前記基本排除文字連続文字コードから、削除可能文字コードを削除可能文字として排除するように記録し、前記基本排除文字連続文字コードから、前記削除可能文字コートが排除されて削除可能文字削除連続文字コードを獲得して削除可能文字削除連続文字とする、削除可能文字記録排除工程と、コンピュータによって、複数の前記削除可能文字削除連続文字コードを自動的に読取って複数の前記削除可能文字削除連続文字とし、単一文字排除文字コードを前記削除可能文字削除連続文字コードから排除するように記録して、前記削除可能文字削除連続文字コードから、前記単一文字排除文字コードが排除されて初歩要素名詞文字コードを獲得して初歩要素名詞とする、単一文字記録排除工程と、コンピュータによって、複数の前記初歩要素名詞文字コードを自動的に読取って複数の初歩要素名詞文字とし、前記初歩要素名詞文字コードの前一つ文字が不定冠詞文字コードである前記初歩要素名詞文字コードを前字不定冠詞初歩要素名詞文字コードとし、かつ前記初歩要素名詞文字コードの前一つ文字が定冠詞であるもう一つの初歩要素名詞文字コードを前字定冠詞初歩要素名詞文字コードとし、前記前字不定冠詞初歩要素名詞文字コードを前から後への順序で前記前字定冠詞初歩要素名詞文字コードと比較し、前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞コードを獲得し、且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とする、高度排除文字記録排除工程と、を含むことを特徴とするコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。

本発明の１つの実施例では、前記削除可能文字記録排除工程が首部文字記録排除工程を有し、前記首部文字記録排除工程がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字文字コードである削除可能識別文字コードに基づいて：各前記基本排除文字連続文字コードの起始文字コードや起始連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ／或は前記対応削除可能識別文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字として排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする上述のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。

本発明の１つの実施例では、前記削除可能文字記録排除工程が尾部文字記録排除工程を更に有し、前記尾部文字記録排除装置がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字コードである削除可能識別文字コードに基づいて：各前記基本排除文字連続文字コードの末文字や末連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ／或は前記対応削除可能識別文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの末文字コードの相隣後文字コードや相隣後連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記末文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記尾部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする上述のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。

本発明の１つの実施例では、前記高度排除文字記録排除工程が更に高度排除慣用字コードによって各前記初歩要素名詞コードから前記高度排除慣用字コードを排除するように記録し、前記初歩要素名詞文字コードにおける前記高度排除文字コードが排除された連続文字コードを前記獲得要素名詞文字コードとすることを特徴とする上述のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。

本発明の１つの実施例では、各獲得要素名詞文字コード、各獲得要素名詞文字コードの獲得要素名詞所属位置コード、句読点文字コードおよび改行符号文字コードに基いて、前記中国語文字の特許請求の範囲の構造を得ることを特徴とする上述のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。

本発明が従来の技術問題を解決するために用いるもう一つの技術手段は、コンピュータを用いて中国語文字からなる中国語文字の特許請求の範囲の文字に対して前記中国語文字の特許請求の範囲に所属する各要素名詞文字コードを自動的に獲得して自動獲得要素名詞とし、コンピュータによって実行される、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法であって、コンピュータによって、中国語文字の特許請求の範囲の文字コードを自動的に読み取って前記中国語文字の特許請求の範囲の文字とし、要素名詞対照表における要素対照表要素名詞文字コードに基いて、前記中国語文字の特許請求の範囲の文字コードから、前記要素対照表要素名詞文字コードを排除するように記録し、前記中国語文字の特許請求の範囲の文字コードにおける前記要素対照表要素名詞文字コードが排除された連続文字コードを要素対照表要素名詞排除連続文字コードとする、要素対照表要素名詞記録排除工程と、コンピュータによって、前記要素対照表要素名詞排除連続文字コードを自動的に読み取り、基本排除文字データベースにおいて冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む複数の基本排除文字コードを複数の基本排除文字とすることに基いて、前記要素対照表要素名詞排除連続文字コードから、前記基本排除文字コードを排除するように記録し、前記要素対照表要素名詞排除連続文字コードにおける前記基本排除文字コードが排除された連続文字コードを基本排除文字連続文字コードとする、基本排除文字記録排除工程と、コンピュータによって、複数の前記基本排除文字連続文字コードを自動的に読取って基本排除文字連続文字とし、前記基本排除文字連続文字コードと前記基本排除文字連続文字コードの前の排除と記録された前記基本排除文字コードの間の文字連続関係に基き、及び、前記基本排除文字連続文字コードと前記基本排除文字連続文字コードの後の排除と記録された前記基本排除文字コードの間の慣用字文字コード、動詞文字コード、副詞文字コード及び設置詞文字コードの間の文字コード相隣文字関係である文字コード相隣文字関係に基いて、前記基本排除文字連続文字コードから、削除可能文字コードを削除可能文字として排除するように記録し、前記基本排除文字連続文字コードから、前記削除可能文字コードが排除されて削除可能文字削除連続文字コードを獲得して削除可能文字削除連続文字とする、削除可能文字記録排除工程と、コンピュータによって、複数の前記削除可能文字削除連続文字コードを自動的に読取って複数の前記削除可能文字削除連続文字とし、単一文字排除文字コードを前記削除可能文字削除連続文字コードから排除するように記録して、前記削除可能文字削除連続文字コードから、単一文字排除文字コードが排除されて初歩要素名詞文字コードを獲得して初歩要素名詞とする、単一文字記録排除工程と、コンピュータによって、複数の前記最初要素名詞文字コードを自動的に読取って複数の最初要素名詞とし、前一つ文字が不定冠詞である前記初歩要素名詞文字コードを前字不定冠詞初歩要素名詞文字コードとし、前一つ文字が定冠詞であるもう一つの前記初歩要素名詞文字コードを前字定冠詞初歩要素名詞文字コードとし、前記前字不定冠詞初歩要素名詞文字コードを前から後への順序で前記前字定冠詞初歩要素名詞文字コードと比較し、前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とし、且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞とする、高度排除文字記録排除工程と、を含むことを特徴とするコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。

本発明のもう１つの実施例では、前記削除可能文字記録排除工程が首部文字記録排除工程を有し、前記首部文字記録排除工程がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字文字コードである削除可能識別文字コードにより：各前記基本排除文字連続文字コードの起始文字コードや起始連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ／或は前記対応削除可能識別文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字として排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とするもう一つのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。

本発明のもう１つの実施例では、前記削除可能文字記録排除工程が尾部文字記録排除工程を更に有し、前記尾部文字記録排除装置がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字コードである削除可能識別文字コードにより：各前記基本排除文字連続文字コードの末文字や末連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ／或は前記対応削除可能識別文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの末文字コードの相隣後文字コードや相隣跡後連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記末文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記尾部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とするもう一つのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。

本発明のもう１つの実施例では、前記高度排除文字記録排除工程が更に高度排除慣用字コードによって各前記初歩要素名詞コードから前記高度排除慣用字コードを排除するように記録し、前記初歩要素名詞文字コードにおける前記高度排除文字コードが排除された連続文字コードを前記獲得要素名詞文字コードとすることを特徴とするもう一つのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。

本発明のもう１つの実施例では、各獲得要素名詞文字コード、各獲得要素名詞文字コードの獲得要素名詞所属位置コード、句読点文字コードおよび改行符号文字コードに基いて、前記中国語文字の特許請求の範囲の構造を得ることを特徴とするもう一つのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。

本発明によれば、要素名詞データベースの立ち上げ、且つ、品詞での要素名詞の判断の代わりに、特許請求項の書き方と特性に基いて要素名詞の存在不可能の文字位置で順位に排除することで要素名詞を獲得することで、膨大なシステム計算およびストレージをかからずに、効率な最高獲得数、最高正確度、最速獲得速度で、特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。

本発明によるコンピュータによって実行されるコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法の１つの実施例のブロック図である。基本排除文字連続文字コードの起始文字コードや起始連続文字コードに削除可能識別文字コードが含まれると削除可能識別文字コードを対応削除可能識別文字とすることを示す図である。基本排除文字連続文字コードの起始文字コードや起始連続文字コードに削除可能識別文字コードが含まれると削除可能識別文字コードを対応削除可能識別文字とすることを示すもう１つの図である。各基本排除文字連続文字コードの起始文字コードの相隣前文字コードや相隣前連続文字コードに削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにすることを示す図である。基本排除文字連続文字コードの尾部文字コードや尾部連続文字コードに削除可能識別文字コードが含まれると削除可能識別文字コードを対応削除可能識別文字とすることを示す図である。基本排除文字連続文字コードの最後文字コードや最後連続文字コードに削除可能識別文字コードが含まれると削除可能識別文字コードを対応削除可能識別文字とすることを示す図である。各基本排除文字連続文字コードの最後文字コードの相隣前文字コードや相隣前連続文字コードに削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにすることを示す図である。本発明によるコンピュータによって実行されるコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法のもう１つの実施例のブロック図である。

以下、図１～図４を用いて本発明の実施形態を説明する。本発明はこれらの説明に限定されるものでおらず、本発明の一つの実施例である。

図１～図３（ｃ）に示すように、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Ｐは、コンピュータを用いて中国語文字からなる中国語文字の特許請求の範囲の文字に対して所有する要素名詞文字コード（ＥＭ）及び要素名詞所属位置コード（ＥＰ）を自動的に獲得して自動獲得要素名詞及び自動獲得要素名詞所属位置とする。コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Ｐは、基本排除文字記録排除工程１を有し、コンピュータによって、中国語文字の特許請求の範囲の文字コード（Ｃ－ｔｅｘｔ）を自動的に読み取って前記中国語文字の特許請求の範囲の文字とし、基本排除文字データベース１１において複数の基本排除文字コードＢを複数の基本排除文字とすることに基いて、前記中国語文字の特許請求の範囲の文字コード（Ｃ－ｔｅｘｔ）から、複数の前記基本排除文字コードＢを排除するように記録して、前記中国語文字の特許請求の範囲の文字コード（Ｃ－ｔｅｘｔ）における前記基本排除文字コードＢが排除された連続文字コードを基本排除文字連続文字コードＢ－ｔｅｘｔとする。
基本排除文字データベースにおいて複数の基本排除文字コードが、冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む。

本発明の１つの実施例では、基本排除文字コードＢに特定標示元（例えば、ＢＤ（Ｂａｓｉｃｄｅｌｅｔｉｎｇｗｏｒｄｓ））を与えて前記基本排除文字コードの識別とする。
基本排除文字コードＢの特定標示元がＢＷであると、識別された基本排除文字コードを“ＢＷ”を有する特定標示元にするように記録する。
また、前記特定標示文字の中国語文字の特許請求の範囲の文字の最初位置と終了位置を標示でき、例えば、“一種”の基本排除文字の最初位置が０であり、終了位置が１である。
そして、前記特定標示元、前記基本排除文字の内容、前記特定標示文字の最初位置と終了位置をメモリに記憶し、例えば、（BW，“一種”0，1）に記憶する。
もちろん、本発明は上述の様態に限定されず、中国語文字の特許請求の範囲の文字において、基本排除文字コードＢと基本排除文字連続文字コードＢ－Ｔｅｘｔの相互の位置関係、及び基本排除文字コードＢと基本排除文字連続文字コードＢ－Ｔｅｘｔの内容を、明確に標示できればいい。

即ち、図２（ａ）、図２（ｂ）、図２（ｃ）、図３（ａ）、図３（ｂ）、図３（ｃ）に示す（排除するように記録された文字コードが“ＸＸ”で標示され、検出された削除可能文字コートＳＤが○で標示される）ように、削除可能文字記録排除工程２は、基本排除文字連続文字コードＢ－Ｔｅｘｔにおいて削除可能文字コートＳＤがあるかどうかを探し（図２（ａ）、図２（ｂ）、図３（ａ）、図３（ｂ）のように）、或は、基本排除文字連続文字コードＢ－Ｔｅｘｔに相隣する基本排除文字コードＢにおいて削除可能文字コートＳＤがあるかどうかを探し（図２（ｃ）、図３（ｃ）のように）、基本排除文字連続文字コードＢ－Ｔｅｘｔにおいて削除可能文字コートＳＤがあれば（図２（ａ）、図２（ｂ）、図３（ａ）、図３（ｂ）のように）、基本排除文字連続文字コードＢ－Ｔｅｘｔにおいて削除可能文字コートＳＤを削除するように記録し（図２（ａ）、図３（ａ）のように）、或は、削除可能文字コートＳＤと共に削除可能文字コートＳＤの相隣文字や相隣連続文字を削除可能文字として排除するように記録する（図２（ｂ）、図３（ｂ）のように）。
また、基本排除文字コードＢにおいて削除可能文字コートＳＤがあれば（図２（ｃ）、図３（ｃ）のように）、基本排除文字連続文字コードＢ－Ｔｅｘｔの首部や尾部の特定文字数の文字コードや連続文字コードを削除可能文字コートＳＤとして排除するように記録する。
詳細には、削除可能文字コートＳＤが基本排除文字連続文字コードＢ－Ｔｅｘｔに存在し、或は、基本排除文字連続文字コードＢ－Ｔｅｘｔの相隣の外に存在する。
「基本排除文字連続文字コードＢ－Ｔｅｘｔの相隣の外の削除可能文字コートＳＤ」というのは、削除可能文字コートＳＤが基本排除文字連続文字コードＢ－Ｔｅｘｔに存在されず、基本排除文字連続文字コードＢ－Ｔｅｘｔの前相隣基本排除文字コードＢの尾部や後相隣基本排除文字コードＢの首部に存在する。
更に、本発明の削除可能文字記録排除工程２は、基本排除文字連続文字コードＢ－Ｔｅｘｔに対して削除可能文字コートＳＤを探すこと以外、基本排除文字連続文字コードＢ－Ｔｅｘｔの前相隣基本排除文字コードＢの尾部文字、後相隣基本排除文字コードＢの尾部文字、前相隣基本排除文字コードＢの尾部連続文字、或は後相隣基本排除文字コードＢの尾部連続文字が削除可能文字コートＳＤであるかどうかを探し、そうであれば、基本排除文字連続文字コードＢ－Ｔｅｘｔの首部文字、尾部文字や尾部連続文字を取り出して削除可能文字として削除するように記録する。

「一被設置成與該隔離層鄰接的聚合材料層」における「一被設置成與」の部分を例として、その「一」と「與」が基本排除文字コードＢであり、「被設置成」が基本排除文字連続文字コードＢ－Ｔｅｘｔである。
「被設置」が削除可能文字コートＳＤに指定されると、即ち、削除可能文字コートＳＤが基本排除文字連続文字コードＢ－Ｔｅｘｔに存在するので、削除可能文字コートＳＤである「被設置」を削除可能文字とし、削除可能文字コートＳＤである「被設置」を、基本排除文字連続文字コードある「被設置成」から排除するように記録し、「被設置」が排除された削除可能文字削除連続文字コート「成」になる。
これは、図２（ａ）の例である。

具体的には、図２（ａ）、図２（ｂ）及び図２（ｃ）に示すように、本発明の削除可能文字記録排除工程２は首部文字記録排除工程２１を有する。首部文字記録排除工程２１が、がコンピュータを用いて複数の前記基本排除文字連続文字コードＢ－Ｔｅｘｔを自動的に読取り、慣用字文字コードである削除可能識別文字（ＩＷ、Ｉｄｅｎｔｉｆｙｉｎｇｗｏｒｄ）コードにより：各前記基本排除文字連続文字コードＢ－Ｔｅｘｔの起始文字コードや起始連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして前記対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）且つ／或は前記対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）後の指定文字数の文字コードを首部削除文字コード（ＨＤ）として排除するように記録し、或は、各前記基本排除文字連続文字コードＢ－Ｔｅｘｔの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コード（ＩＷ）が含まれるかどうかを判断し対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして前記起始文字コード後の指定文字数の文字コードを首部削除文字コード（ＨＤ）として排除するように記録することで、前記基本排除文字排除連続文字コードＢ－Ｔｅｘｔにおける前記首部削除文字コード（ＨＤ）が排除された連続文字コードを前記削除可能文字削除連続文字コード（Ｄ－Ｔｅｘｔ）とする。

図３（ａ）、図３（ｂ）及び図３（ｃ）に示すように、前記削除可能文字記録排除工程２が尾部文字記録排除工程２２を更に有する。前記尾部文字記録排除装置２２が、コンピュータを用いて複数の前記基本排除文字連続文字コードＢ－Ｔｅｘｔを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字コードである削除可能識別文字コード（ＩＷ）により：各前記基本排除文字連続文字コードＢ－Ｔｅｘｔの末文字コードや末連続文字コードに前記削除可能識別文字コード（ＩＷ）が含まれるかどうかを判断し対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして前記対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）且つ／或は前記対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）前の指定文字数の文字コードを尾部削除文字コード（ＴＤ）として排除するように記録し、或は、各前記基本排除文字連続文字コードＢ－Ｔｅｘｔの末文字コードの相隣後文字コードや相隣後連続文字コードに前記削除可能識別文字コード（ＩＷ）が含まれるかどうかを判断し対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして前記末文字コード前の指定文字数の文字コードを尾部削除文字コード（ＴＤ）として排除するように記録することで、前記基本排除文字排除連続文字コードＢ－Ｔｅｘｔにおける前記尾部削除文字コード（ＴＤ）が排除された連続文字コードを前記削除可能文字削除連続文字コード（Ｄ－Ｔｅｘｔ）とする。

以下、図２（ａ）、図２（ｂ）及び図２（ｃ）により、首部文字記録排除工程２１の一つの実施例を説明する。

図２（ａ）において、基本排除文字連続文字コードＢ－Ｔｅｘｔの起始文字コードや起始連続文字コードに削除可能識別文字コード（ＩＷ）が含まれると、削除可能識別文字コード（ＩＷ）を対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして、対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）を首部削除文字コード（ＨＤ）として排除するように記録する。
例えば、削除可能識別文字コード（ＩＷ、Ｉｄｅｎｔｉｆｙｉｎｇｗｏｒｄ）が「被設置」、「或」；「被」；「隨」；「為」；「將」；「給」（字数が多いものが先に執行する）であると、これらの削除可能識別文字コード（ＩＷ）を、基本排除文字連続文字コードＢ－Ｔｅｘｔの起始の所から排除するように記録する。

図２（ｃ）において、基本排除文字連続文字コードＢ－Ｔｅｘｔの起始文字コードの相隣前文字コードや相隣前連続文字コード（相隣前基本排除文字コードＢに存在する）に前記削除可能識別文字コード（ＩＷ）が含まれるかどうかを判断し対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして前記起始文字コード後の指定文字数の文字コードを首部削除文字コード（ＨＤ）として排除するように記録することで、前記基本排除文字排除連続文字コードＢ－Ｔｅｘｔにおける前記首部削除文字コード（ＨＤ）が排除された連続文字コードを前記削除可能文字削除連続文字コード（Ｄ－Ｔｅｘｔ）とする
例えば、基本排除文字連続文字コードＢ－Ｔｅｘｔの相隣前１字コードや相隣前連続文字コード（これらの文字コード及び連続文字コードが排除するように記録された）が、藉以、用以、用來、用於、彼此などの削除可能識別文字コード（ＩＷ）であると、基本排除文字連続文字コードＢ－Ｔｅｘｔの起始のところの後の２字コードを排除するように記録する。

以下、図３（ａ）、図３（ｂ）及び図３（ｃ）により、尾部文字記録排除工程２２の一つの実施例を説明する。

図３（ａ）において、基本排除文字連続文字コードＢ－Ｔｅｘｔの末文字コードや末連続文字コードに削除可能識別文字コード（ＩＷ）が含まれると、削除可能識別文字コード（ＩＷ）を対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして、対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）を尾部削除文字コード（ＴＤ）として排除するように記録する。
例えば、削除可能識別文字コード（ＩＷ、Ｉｄｅｎｔｉｆｙｉｎｇｗｏｒｄ）が、或、成、於、時、來、有、者、對應、相關、連同、之間、鄰接、“要素名詞＋２字”（字数が多いものが先に執行する）であると、これらの削除可能識別文字コード（ＩＷ）を、基本排除文字連続文字コードＢ－Ｔｅｘｔの尾部の所から排除するように記録する。

図３（ｂ）において、基本排除文字連続文字コードＢ－Ｔｅｘｔの末文字コードや末連続文字コードに削除可能識別文字コード（ＩＷ）が含まれると、削除可能識別文字コード（ＩＷ）を対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして、対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）及び対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）前の指定文字数の文字コードを尾部削除文字コード（ＴＤ）として排除するように記録する。
例えば、削除可能識別文字コード（ＩＷ）が、給、到（字数が多いものが先に執行する）、為であると、それらの文字コード及びそれらの文字コードの前２字コードを排除するように記録する。

図３（ｃ）において、各前記基本排除文字連続文字コードＢ－Ｔｅｘｔの末文字コードの相隣後文字コードや相隣後連続文字コード（相隣後基本排除文字連続文字コードＢに存在する）に前記削除可能識別文字コード（ＩＷ）が含まれるかどうかを判断し対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして前記末文字コード前の指定文字数の文字コードを尾部削除文字コード（ＴＤ）として排除するように記録することで、前記基本排除文字排除連続文字コードＢ－Ｔｅｘｔにおける前記尾部削除文字コード（ＴＤ）が排除された連続文字コードを前記削除可能文字削除連続文字コード（Ｄ－Ｔｅｘｔ）とする。
例えば、基本排除文字連続文字コードＢ－Ｔｅｘｔの相隣後１字文字コードや相隣後連続文字コード（これらの文字コード及び連続文字コードが排除するように記録された）が、該、一、於、在であると、基本排除文字連続文字コードＢ－Ｔｅｘｔの最終のところの前２字文字コードを排除するように記録する。

本発明のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Ｐは、更に、単一文字記録排除工程３を有し、単一文字記録排除工程３が、コンピュータによって、複数の前記削除可能文字削除連続文字コード（Ｄ-ｔｅｘｔ）を自動的に読取って複数の複数の前記削除可能文字削除連続文字とし、単一文字排除文字コード（ＳＷ）を複数の前記削除可能文字削除連続文字コード（Ｄ-ｔｅｘｔ）から排除するように記録して、前記削除可能文字削除連続文字コードが、前記単一文字排除文字コード（ＳＷ）が排除されて初歩要素名詞文字コード（Ｐ－ＥＮ）を獲得して初歩要素名詞とする、

本発明のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Ｐは、更に、高度排除文字記録排除工程４を有し、高度排除文字記録排除工程４が、コンピュータによって、複数の前記初歩要素名詞文字コード（Ｐ－ＥＮ）を自動的に読取って複数の前記初歩要素名詞とし、前記初歩要素名詞文字コードの前一つ文字が不定冠詞文字コードである前記初歩要素名詞文字コードを前字不定冠詞初歩要素名詞文字コードとし、前記初歩要素名詞文字コードの前一つ文字が定冠詞であるもう一つの初歩要素名詞文字コードを前字定冠詞初歩要素名詞文字コードとし、前記前字不定冠詞初歩要素名詞文字コードを前から後への順序で前記前字定冠詞初歩要素名詞文字コードと比較する。
前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞コードを獲得する。
且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とする。

詳細には、初歩要素名詞が２字文字コードであり、且つ、その初歩要素名詞の前／後が、「於」、「成」、「至」、「在」、「用於」……などであると、初歩要素名詞文字コードを削除し、及び、「經ＸＸ」（ＸＸが２字文字コードを表する）、「為ＸＸ」（ＸＸが２字文字コードを表する）、「待ＸＸ」（ＸＸが２字文字コードを表する）、「之間」、「同時」、「實時」、「以上」、「被ＸＸ的」（ＸＸが２字文字コードを表する）、「ＸＸ化」……などの文字コードであると、初歩要素名詞文字コードを削除する。

図１に示すように、更に、本発明の一つの実施例のコンピュータによって実行される、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Ｐによると、高度排除文字記録排除工程４が、更に高度排除慣用字コードによって各前記初歩要素名詞コードから前記高度排除慣用字コードを排除するように記録し、前記初歩要素名詞文字コードにおける前記高度排除文字コードが排除された連続文字コードを前記獲得要素名詞文字コードとする。
この方法によって、獲得要素名詞を確定するので、首部文字記録排除工程２１の“要素名詞＋２字”の排除するように記録することを再執行でき、要素名詞の獲得正確度を向上できる。

図１に示すように、更に、本発明の一つの実施例のコンピュータによって実行される、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Ｐによると、各獲得要素名詞文字コード、各獲得要素名詞文字コードの獲得要素名詞所属位置コード、句読点文字コードおよび改行符号文字コードに基いて、前記中国語文字の特許請求の範囲の構造を得る。
例えば、句読点文字コードによって、中国語文字の特許請求の範囲に対して、改行を行うことができ、且つ、獲得された獲得要素名詞文字コードを、クリックして獲得要素名詞の明細書の位置に移動するようにクリックできると標示することで、獲得要素名詞の意義を更に分かることができる。

本発明において、上述の実施例以外、要素対照表にリストされる要素名詞を、中国語文字の特許請求の範囲の文字コード（Ｃ－ｔｅｘｔ）から見出すことを先に行い、基本排除文字記録排除工程１の基本排除文字連続文字Ｂ－ｔｅｘｔの獲得を行うことができる。
図４に示すように、本発明のもう一つの実施例において、コンピュータによって実行される、文字間スペースなし言語特許書類文字コードのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Ｐには、要素対照表要素名詞記録排除工程１Ａが設置されることができ、
要素対照表要素名詞記録排除工程１Ａが、コンピュータによって、中国語文字の特許請求の範囲の文字コード（Ｃ－ｔｅｘｔ）を自動的に読み取り、要素名詞対照表（ＥＮ－Ｌｉｓｔ）における要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）に基いて、前記中国語文字の特許請求の範囲の文字コード（Ｃ－ｔｅｘｔ）から、前記要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）を排除するように記録し、前記中国語文字の特許請求の範囲の文字コード（Ｃ－ｔｅｘｔ）における前記要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）が排除された連続文字コードを要素対照表要素名詞排除連続文字コード（Ｄ-ＥＮ）とする。
獲得する要素対照表要素名詞排除連続文字コード（Ｄ-ＥＮ）が基本排除文字記録排除工程１に伝送し、基本排除文字記録排除工程１によって上述と同様な操作を行い、前記要素対照表要素名詞排除連続文字コード（Ｄ-ＥＮ）から、前記基本排除文字コードＢを排除するように記録し、前記要素対照表要素名詞排除連続文字コード（Ｄ-ＥＮ）における前記基本排除文字コードＢが排除された連続文字コードを基本排除文字連続文字コードＢ－ｔｅｘｔとする。

更に、先に、要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）を獲得した後、次の削除可能文字記録排除工程２（首部文字記録排除工程２１と首部文字記録排除工程２２を有する）で要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）に関する規則運算を制定することで、全体の運算速度及び正確性を向上できる。
即ち、削除可能文字記録排除工程２が要素対照表要素名詞文字コードを削除可能文字コードＳＤに取り込み、基本排除文字連続文字コードＢ－ｔｅｘｔから削除可能文字コードＳＤを削除可能文字として排除するように記録し、且つ／或は、削除可能文字コードＳＤの相隣文字コードや相隣連続文字コードを削除可能文字として排除するように記録することで、基本排除文字連続文字コードＢ－ｔｅｘｔで削除可能文字が排除された連続文字コードを削除可能文字削除連続文字とする。

具体的に、削除可能文字記録排除工程２の首部文字記録排除工程２１が、複数の前記基本排除文字連続文字コードＢ－ｔｅｘｔを自動的に読取り、要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）を削除可能識別文字コード（ＩＷ）に取り込み、第１の実施例の判断以外、更に、要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）に基いて：各前記基本排除文字連続文字コードＢ－ｔｅｘｔの起始文字コードの相隣前文字コードや相隣前連続文字コードに要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）が含まれるかどうかを判断し対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして前記起始文字コード後の指定文字数の文字コードを首部削除文字として排除するように記録する（即ち、要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）を削除可能識別文字コード（ＩＷ）に取り込む際に、図２（ｃ）と図３（ｃ）に示す例のように、削除可能識別文字コード（ＩＷ）が基本排除文字連続文字コードＢ－ｔｅｘｔの起始文字コード以外の相隣前文字コードや相隣前連続文字コードである）。
このとき、首部文字記録排除工程２１が第１実施例と同様に、他の要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）ではない削除可能識別文字コード（ＩＷ）に対して：各前記基本排除文字連続文字コードＢ－Ｔｅｘｔの起始文字コードや起始連続文字コードに前記削除可能識別文字コード（ＩＷ）が含まれるかどうかを判断し対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして前記対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）且つ／或は前記対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードＢ－Ｔｅｘｔの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードＢ－Ｔｅｘｔにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コード（Ｄ－Ｔｅｘｔ）とする。

詳細には、首部文字記録排除工程２１が、第１実施例と同様に削除可能識別文字コード（ＩＷ）に対する判断を執行すること以外、知られた要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）に基いて、基本排除文字排除連続文字コードＢ－Ｔｅｘｔに対して以下の文字コードの記録排除を行って、削除可能文字削除連続文字コード（Ｄ－Ｔｅｘｔ）を獲得する。
例えば、「將」＋「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」＋「……至」（即ち、「將」と「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔである「……至」の外に前に相隣し、且つ、「至」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔの尾部にいる）である場合、「至」と「至」の前２字を排除するように記録する。
また、例えば、「把」＋「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」＋「……至」（即ち、「把」と「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔである「……至」の外に前に相隣し、且つ、「至」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔの尾部にいる）である場合、「至」と「至」の前２字を排除するように記録する。
また、例えば、「把」＋「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」＋「……以」（即ち、「把」と「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔである「……以」の外に前に相隣し、且つ、「以」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔの尾部にいる）である場合、「以」と「以」の前２字を排除するように記録する。

要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）を先に獲得する要素対照表要素名詞記録排除工程１Ａを有する文字間スペースなし言語特許書類文字コードのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Ｐにおいて、削除可能文字記録排除工程２の尾部文字記録排除工程２２が、複数の前記基本排除文字連続文字コードＢ－ｔｅｘｔを自動的に読取り、要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）を削除可能識別文字コード（ＩＷ）に取り込み、第１の実施例の判断以外、更に、要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）に基いて：各前記基本排除文字連続文字コードＢ－ｔｅｘｔの起始文字コードの相隣後文字コードや相隣後連続文字コードに要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）が含まれるかどうかを判断し対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして前記最終文字コード後の指定文字数の文字コードを尾部削除文字として排除するように記録する（即ち、要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）を削除可能識別文字コード（ＩＷ）に取り込む際に、図２（ｃ）と図３（ｃ）に示す例のように、削除可能識別文字コード（ＩＷ）が基本排除文字連続文字コードＢ－ｔｅｘｔの最終文字コード以外の相隣後文字コードや相隣後連続文字コードである）。
このとき、尾部文字記録排除工程２２が第１実施例と同様に、他の要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）ではない削除可能識別文字コード（ＩＷ）に対して：各前記基本排除文字連続文字コードＢ－Ｔｅｘｔの最終文字コードや最終連続文字コードに前記削除可能識別文字コード（ＩＷ）が含まれるかどうかを判断し対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして前記対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）且つ／或は前記対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）前の指定文字数の文字コードを尾部削除文字コード（ＴＤ）として排除するように記録し、或は、各前記基本排除文字連続文字コードＢ－Ｔｅｘｔの最終文字コードの相隣後文字コードや相隣後連続文字コードに前記削除可能識別文字コード（ＩＷ）が含まれるかどうかを判断し対応削除可能識別文字コード（Ｆｏｕｎｄ－ＩＷ）にして前記最終文字コード前の指定文字数の文字コードを尾部削除文字コード（ＴＤ）として排除するように記録することで、前記基本排除文字排除連続文字コードＢ－Ｔｅｘｔにおける前記尾部削除文字コード（ＴＤ）が排除された連続文字コードを前記削除可能文字削除連続文字コードとする。

例えば、尾部文字記録排除工程２２が、第１実施例と同様に削除可能識別文字コード（ＩＷ）に対する判断を執行すること以外、知られた要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）に基いて、基本排除文字排除連続文字コードＢ－Ｔｅｘｔに対して以下の文字コードの記録排除を行って、削除可能文字削除連続文字コードを獲得する。
例えば、「至」＋「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」（即ち、「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔである「……至」の外に後に相隣し、且つ、「至」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔの尾部にいる）である場合、「至」と「至」の前２字を排除するように記録する（「；」、「，」などの句読点まで）。
また、例えば、「給」＋「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」（即ち、「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔである「……給」の外に後に相隣し、且つ、「給」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔの尾部にいる）である場合、「給」と「給」の前２字を排除するように記録する（「；」、「，」などの句読点まで）。
また、例えば、「到」＋「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」（即ち、「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔである「……到」の外に後に相隣し、且つ、「到」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔの尾部にいる）である場合、「到」と「到」の前２字を排除するように記録する（「；」、「，」などの句読点まで）。
また、例えば、「至」＋「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」（即ち、「要素対照表要素名詞文字コード（Ｌｉｓｔ－ＥＮ）」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔである「……至」の外に後に相隣し、且つ、「至」が基本排除文字排除連続文字コードＢ－Ｔｅｘｔの尾部にいる）である場合、「至」と「至」の前２字を排除するように記録する（「；」、「，」などの句読点まで）。

本発明の実施形態によると、本発明は、特許書類の要素名詞及び要素名詞所属位置の自動獲得に対して、要素名詞データベースの立ち上げ、且つ、品詞での要素名詞の判断の代わりに、特許請求項の書き方と特性に基いて要素名詞の存在不可能の文字位置で順位に排除することで要素名詞を獲得することで、膨大なシステム計算およびストレージをかからずに、効率な最高獲得数、最高正確度、最速獲得速度で、特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。

なお、本発明は、上記実施形態に限定されるものではない。上記実施形態は、例示であり、本発明の特許請求の範囲に記載された技術的思想と実質的に同一な構成を有し、同様な作用効果を奏するものは、いかなるものであっても本発明の技術的範囲に包含される。

Ｐコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法
１Ａ要素対照表要素名詞記録排除工程
１基本排除文字記録排除工程
１１基本排除文字データベース
２削除可能文字記録排除工程
２１首部文字記録排除工程
２２尾部文字記録排除工程
３単一文字記録排除工程
４高度排除文字記録排除工程
４２第二細部要素名詞獲得工程
Ｂ基本排除文字コード
Ｂ－Ｔｅｘｔ基本排除文字連続文字コード
ＳＤ削除可能文字コード

Claims

コンピュータを用いて中国語文字からなる中国語文字の特許請求の範囲の文字に対して前記中国語文字の特許請求の範囲に所属する各要素名詞文字コードを自動的に獲得して自動獲得要素名詞とし、コンピュータによって実行される、中国語特許書類の要素名詞自動獲得方法であって、
コンピュータによって、中国語文字の特許請求の範囲の文字コードを自動的に読み取って前記中国語文字の特許請求の範囲の文字とし、基本排除文字データベースにおいて冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む複数の基本排除文字コードを複数の基本排除文字とすることに基いて、前記中国語文字の特許請求の範囲の文字コードから、複数の前記基本排除文字コードを排除するように記録して、前記中国語文字の特許請求の範囲の文字コードにおける前記基本排除文字コードが排除された連続文字コードを基本排除文字連続文字コードとする、基本排除文字記録排除工程と、
コンピュータによって、複数の基本排除文字連続文字コードを自動的に読取って基本排除文字連続文字とし、前記基本排除文字連続文字コードと前記基本排除文字連続文字の前の排除と記録された前記基本排除文字コードの間の文字コード相隣文字関係に基き、前記基本排除文字連続文字コードと前記基本排除文字連続文字の後の排除と記録された前記基本排除文字コードの間の慣用字文字コード、動詞文字コード、副詞文字コード、設置詞文字コードを含む文字コード相隣文字関係に基いて、前記基本排除文字連続文字コードから、削除可能文字コードを削除可能文字として排除するように記録し、前記基本排除文字連続文字コードから、前記削除可能文字コートが排除されて削除可能文字削除連続文字コードを獲得して削除可能文字削除連続文字とする、削除可能文字記録排除工程と、
コンピュータによって、複数の前記削除可能文字削除連続文字コードを自動的に読取って複数の前記削除可能文字削除連続文字とし、単一文字排除文字コードを前記削除可能文字削除連続文字コードから排除するように記録して、前記削除可能文字削除連続文字コードから、前記単一文字排除文字コードが排除されて初歩要素名詞文字コードを獲得して初歩要素名詞とする、単一文字記録排除工程と、
コンピュータによって、複数の前記初歩要素名詞文字コードを自動的に読取って複数の初歩要素名詞文字とし、前記初歩要素名詞文字コードの前一つ文字が不定冠詞文字コードである前記初歩要素名詞文字コードを前字不定冠詞初歩要素名詞文字コードとし、かつ前記初歩要素名詞文字コードの前一つ文字が定冠詞であるもう一つの初歩要素名詞文字コードを前字定冠詞初歩要素名詞文字コードとし、前記前字不定冠詞初歩要素名詞文字コードを前から後への順序で前記前字定冠詞初歩要素名詞文字コードと比較し、前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞コードを獲得し、且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とする、高度排除文字記録排除工程と、を含むことを特徴とするコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
前記削除可能文字記録排除工程が首部文字記録排除工程を有し、前記首部文字記録排除工程がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字文字コードである削除可能識別文字コードに基づいて：各前記基本排除文字連続文字コードの起始文字コードや起始連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ／或は前記対応削除可能識別文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする請求項１のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
前記削除可能文字記録排除工程が尾部文字記録排除工程を更に有し、前記尾部文字記録排除装置がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字コードである削除可能識別文字コードに基づいて：各前記基本排除文字連続文字コードの末文字コードや末連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ／或は前記対応削除可能識別文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの末文字コードの相隣後文字コードや相隣後連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記末文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記尾部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする請求項１のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
各獲得要素名詞文字コード、句読点文字コードおよび改行符号文字コードに基いて、前記中国語文字の特許請求の範囲の構造を得ることを特徴とする請求項１のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
コンピュータを用いて中国語文字からなる中国語文字の特許請求の範囲の文字に対して前記中国語文字の特許請求の範囲に所属する各要素名詞文字コードを自動的に獲得して自動獲得要素名詞とし、コンピュータによって実行される、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法であって、
コンピュータによって、中国語文字の特許請求の範囲の文字コードを自動的に読み取って前記中国語文字の特許請求の範囲の文字とし、要素名詞対照表における要素対照表要素名詞文字コードに基いて、前記中国語文字の特許請求の範囲の文字コードから、前記要素対照表要素名詞文字コードを排除するように記録し、前記中国語文字の特許請求の範囲の文字コードにおける前記要素対照表要素名詞文字コードが排除された連続文字コードを要素対照表要素名詞排除連続文字コードとする、要素対照表要素名詞記録排除工程と、
コンピュータによって、前記要素対照表要素名詞排除連続文字コードを自動的に読み取り、基本排除文字データベースにおいて冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む複数の基本排除文字コードを複数の基本排除文字とすることに基いて、前記要素対照表要素名詞排除連続文字コードから、前記基本排除文字コードを排除するように記録し、前記要素対照表要素名詞排除連続文字コードにおける前記基本排除文字コードが排除された連続文字コードを基本排除文字連続文字コードとする、基本排除文字記録排除工程と、
コンピュータによって、複数の前記基本排除文字連続文字コードを自動的に読取って基本排除文字連続文字とし、前記基本排除文字連続文字コードと前記基本排除文字連続文字コードの前の排除と記録された前記基本排除文字コードの間の文字連続関係に基き、及び、前記基本排除文字連続文字コードと前記基本排除文字連続文字コードの後の排除と記録された前記基本排除文字コードの間の慣用字文字コード、動詞文字コード、副詞文字コード及び設置詞文字コードの間の文字コード相隣文字関係である文字コード相隣文字関係に基いて、前記基本排除文字連続文字コードから、削除可能文字コードを削除可能文字として排除するように記録し、前記基本排除文字連続文字コードから、前記削除可能文字コードが排除されて削除可能文字削除連続文字コードを獲得して削除可能文字削除連続文字とする、削除可能文字記録排除工程と、
コンピュータによって、複数の前記削除可能文字削除連続文字コードを自動的に読取って複数の前記削除可能文字削除連続文字とし、単一文字排除文字コードを前記削除可能文字削除連続文字コードから排除するように記録して、前記削除可能文字削除連続文字コードから、単一文字排除文字コードが排除されて初歩要素名詞文字コードを獲得して初歩要素名詞とする、単一文字記録排除工程と、
コンピュータによって、複数の前記最初要素名詞文字コードを自動的に読取って複数の最初要素名詞とし、前一つ文字が不定冠詞である前記初歩要素名詞文字コードを前字不定冠詞初歩要素名詞文字コードとし、前一つ文字が定冠詞であるもう一つの前記初歩要素名詞文字コードを前字定冠詞初歩要素名詞文字コードとし、前記前字不定冠詞初歩要素名詞文字コードを前から後への順序で前記前字定冠詞初歩要素名詞文字コードと比較し、前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とし、且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞とする、高度排除文字記録排除工程と、を含むことを特徴とするコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
前記削除可能文字記録排除工程が首部文字記録排除工程を有し、前記首部文字記録排除工程がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字文字コードである削除可能識別文字コードにより：各前記基本排除文字連続文字コードの起始文字コードや起始連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ／或は前記対応削除可能識別文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字として排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする請求項５のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
前記削除可能文字記録排除工程が尾部文字記録排除工程を更に有し、前記尾部文字記録排除装置がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字コードである削除可能識別文字コードにより：各前記基本排除文字連続文字コードの末文字や末連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ／或は前記対応削除可能識別文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの末文字コードの相隣後文字コードや相隣跡後連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記末文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記尾部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする請求項５のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
各獲得要素名詞文字コード、句読点文字コードおよび改行符号文字コードに基いて、前記中国語文字の特許請求の範囲の構造を得ることを特徴とする請求項５のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。