JP7105500B2 - コンピュータによって実行される文字間スペースなし特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法 - Google Patents
コンピュータによって実行される文字間スペースなし特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法 Download PDFInfo
- Publication number
- JP7105500B2 JP7105500B2 JP2020148638A JP2020148638A JP7105500B2 JP 7105500 B2 JP7105500 B2 JP 7105500B2 JP 2020148638 A JP2020148638 A JP 2020148638A JP 2020148638 A JP2020148638 A JP 2020148638A JP 7105500 B2 JP7105500 B2 JP 7105500B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character code
- code
- deletable
- exclusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 49
- 230000007717 exclusion Effects 0.000 claims description 282
- 238000012217 deletion Methods 0.000 claims description 72
- 230000037430 deletion Effects 0.000 claims description 72
- 230000008030 elimination Effects 0.000 claims description 42
- 238000003379 elimination reaction Methods 0.000 claims description 42
- 238000010586 diagram Methods 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
基本排除文字データベースにおいて複数の基本排除文字コードが、冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む。
基本排除文字コードBの特定標示元がBWであると、識別された基本排除文字コードを“BW”を有する特定標示元にするように記録する。
また、前記特定標示文字の中国語文字の特許請求の範囲の文字の最初位置と終了位置を標示でき、例えば、“一種”の基本排除文字の最初位置が0であり、終了位置が1である。
そして、前記特定標示元、前記基本排除文字の内容、前記特定標示文字の最初位置と終了位置をメモリに記憶し、例えば、(BW,“一種”0,1)に記憶する。
もちろん、本発明は上述の様態に限定されず、中国語文字の特許請求の範囲の文字において、基本排除文字コードBと基本排除文字連続文字コードB-Textの相互の位置関係、及び基本排除文字コードBと基本排除文字連続文字コードB-Textの内容を、明確に標示できればいい。
また、基本排除文字コードBにおいて削除可能文字コートSDがあれば(図2(c)、図3(c)のように)、基本排除文字連続文字コードB-Textの首部や尾部の特定文字数の文字コードや連続文字コードを削除可能文字コートSDとして排除するように記録する。
詳細には、削除可能文字コートSDが基本排除文字連続文字コードB-Textに存在し、或は、基本排除文字連続文字コードB-Textの相隣の外に存在する。
「基本排除文字連続文字コードB-Textの相隣の外の削除可能文字コートSD」というのは、削除可能文字コートSDが基本排除文字連続文字コードB-Textに存在されず、基本排除文字連続文字コードB-Textの前相隣基本排除文字コードBの尾部や後相隣基本排除文字コードBの首部に存在する。
更に、本発明の削除可能文字記録排除工程2は、基本排除文字連続文字コードB-Textに対して削除可能文字コートSDを探すこと以外、基本排除文字連続文字コードB-Textの前相隣基本排除文字コードBの尾部文字、後相隣基本排除文字コードBの尾部文字、前相隣基本排除文字コードBの尾部連続文字、或は後相隣基本排除文字コードBの尾部連続文字が削除可能文字コートSDであるかどうかを探し、そうであれば、基本排除文字連続文字コードB-Textの首部文字、尾部文字や尾部連続文字を取り出して削除可能文字として削除するように記録する。
「被設置」が削除可能文字コートSDに指定されると、即ち、削除可能文字コートSDが基本排除文字連続文字コードB-Textに存在するので、削除可能文字コートSDである「被設置」を削除可能文字とし、削除可能文字コートSDである「被設置」を、基本排除文字連続文字コードある「被設置成」から排除するように記録し、「被設置」が排除された削除可能文字削除連続文字コート「成」になる。
これは、図2(a)の例である。
例えば、削除可能識別文字コード(IW、Identifying word)が「被設置」、「或」;「被」;「隨」;「為」;「將」;「給」(字数が多いものが先に執行する)であると、これらの削除可能識別文字コード(IW)を、基本排除文字連続文字コードB-Textの起始の所から排除するように記録する。
例えば、基本排除文字連続文字コードB-Textの相隣前1字コードや相隣前連続文字コード(これらの文字コード及び連続文字コードが排除するように記録された)が、藉以、用以、用來、用於、彼此などの削除可能識別文字コード(IW)であると、基本排除文字連続文字コードB-Textの起始のところの後の2字コードを排除するように記録する。
例えば、削除可能識別文字コード(IW、Identifying word)が、或、成、於、時、來、有、者、對應、相關、連同、之間、鄰接、“要素名詞+2字”(字数が多いものが先に執行する)であると、これらの削除可能識別文字コード(IW)を、基本排除文字連続文字コードB-Textの尾部の所から排除するように記録する。
例えば、削除可能識別文字コード(IW)が、給、到(字数が多いものが先に執行する)、為であると、それらの文字コード及びそれらの文字コードの前2字コードを排除するように記録する。
例えば、基本排除文字連続文字コードB-Textの相隣後1字文字コードや相隣後連続文字コード(これらの文字コード及び連続文字コードが排除するように記録された)が、該、一、於、在であると、基本排除文字連続文字コードB-Textの最終のところの前2字文字コードを排除するように記録する。
前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞コードを獲得する。
且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とする。
この方法によって、獲得要素名詞を確定するので、首部文字記録排除工程21の“要素名詞+2字”の排除するように記録することを再執行でき、要素名詞の獲得正確度を向上できる。
例えば、句読点文字コードによって、中国語文字の特許請求の範囲に対して、改行を行うことができ、且つ、獲得された獲得要素名詞文字コードを、クリックして獲得要素名詞の明細書の位置に移動するようにクリックできると標示することで、獲得要素名詞の意義を更に分かることができる。
図4に示すように、本発明のもう一つの実施例において、コンピュータによって実行される、文字間スペースなし言語特許書類文字コードのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Pには、要素対照表要素名詞記録排除工程1Aが設置されることができ、
要素対照表要素名詞記録排除工程1Aが、コンピュータによって、中国語文字の特許請求の範囲の文字コード(C-text)を自動的に読み取り、要素名詞対照表(EN-List)における要素対照表要素名詞文字コード(List-EN)に基いて、前記中国語文字の特許請求の範囲の文字コード(C-text)から、前記要素対照表要素名詞文字コード(List-EN)を排除するように記録し、前記中国語文字の特許請求の範囲の文字コード(C-text)における前記要素対照表要素名詞文字コード(List-EN)が排除された連続文字コードを要素対照表要素名詞排除連続文字コード(D-EN)とする。
獲得する要素対照表要素名詞排除連続文字コード(D-EN)が基本排除文字記録排除工程1に伝送し、基本排除文字記録排除工程1によって上述と同様な操作を行い、前記要素対照表要素名詞排除連続文字コード(D-EN)から、前記基本排除文字コードBを排除するように記録し、前記要素対照表要素名詞排除連続文字コード(D-EN)における前記基本排除文字コードBが排除された連続文字コードを基本排除文字連続文字コードB-textとする。
即ち、削除可能文字記録排除工程2が要素対照表要素名詞文字コードを削除可能文字コードSDに取り込み、基本排除文字連続文字コードB-textから削除可能文字コードSDを削除可能文字として排除するように記録し、且つ/或は、削除可能文字コードSDの相隣文字コードや相隣連続文字コードを削除可能文字として排除するように記録することで、基本排除文字連続文字コードB-textで削除可能文字が排除された連続文字コードを削除可能文字削除連続文字とする。
このとき、首部文字記録排除工程21が第1実施例と同様に、他の要素対照表要素名詞文字コード(List-EN)ではない削除可能識別文字コード(IW)に対して:各前記基本排除文字連続文字コードB-Textの起始文字コードや起始連続文字コードに前記削除可能識別文字コード(IW)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記対応削除可能識別文字コード(Found-IW)且つ/或は前記対応削除可能識別文字コード(Found-IW)後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードB-Textの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードB-Textにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コード(D-Text)とする。
例えば、「將」+「要素対照表要素名詞文字コード(List-EN)」+「……至」(即ち、「將」と「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……至」の外に前に相隣し、且つ、「至」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「至」と「至」の前2字を排除するように記録する。
また、例えば、「把」+「要素対照表要素名詞文字コード(List-EN)」+「……至」(即ち、「把」と「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……至」の外に前に相隣し、且つ、「至」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「至」と「至」の前2字を排除するように記録する。
また、例えば、「把」+「要素対照表要素名詞文字コード(List-EN)」+「……以」(即ち、「把」と「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……以」の外に前に相隣し、且つ、「以」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「以」と「以」の前2字を排除するように記録する。
このとき、尾部文字記録排除工程22が第1実施例と同様に、他の要素対照表要素名詞文字コード(List-EN)ではない削除可能識別文字コード(IW)に対して:各前記基本排除文字連続文字コードB-Textの最終文字コードや最終連続文字コードに前記削除可能識別文字コード(IW)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記対応削除可能識別文字コード(Found-IW)且つ/或は前記対応削除可能識別文字コード(Found-IW)前の指定文字数の文字コードを尾部削除文字コード(TD)として排除するように記録し、或は、各前記基本排除文字連続文字コードB-Textの最終文字コードの相隣後文字コードや相隣後連続文字コードに前記削除可能識別文字コード(IW)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記最終文字コード前の指定文字数の文字コードを尾部削除文字コード(TD)として排除するように記録することで、前記基本排除文字排除連続文字コードB-Textにおける前記尾部削除文字コード(TD)が排除された連続文字コードを前記削除可能文字削除連続文字コードとする。
例えば、「至」+「要素対照表要素名詞文字コード(List-EN)」(即ち、「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……至」の外に後に相隣し、且つ、「至」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「至」と「至」の前2字を排除するように記録する(「;」、「,」などの句読点まで)。
また、例えば、「給」+「要素対照表要素名詞文字コード(List-EN)」(即ち、「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……給」の外に後に相隣し、且つ、「給」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「給」と「給」の前2字を排除するように記録する(「;」、「,」などの句読点まで)。
また、例えば、「到」+「要素対照表要素名詞文字コード(List-EN)」(即ち、「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……到」の外に後に相隣し、且つ、「到」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「到」と「到」の前2字を排除するように記録する(「;」、「,」などの句読点まで)。
また、例えば、「至」+「要素対照表要素名詞文字コード(List-EN)」(即ち、「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……至」の外に後に相隣し、且つ、「至」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「至」と「至」の前2字を排除するように記録する(「;」、「,」などの句読点まで)。
1A 要素対照表要素名詞記録排除工程
1 基本排除文字記録排除工程
11 基本排除文字データベース
2 削除可能文字記録排除工程
21 首部文字記録排除工程
22 尾部文字記録排除工程
3 単一文字記録排除工程
4 高度排除文字記録排除工程
42 第二細部要素名詞獲得工程
B 基本排除文字コード
B-Text 基本排除文字連続文字コード
SD 削除可能文字コード
Claims (8)
- コンピュータを用いて中国語文字からなる中国語文字の特許請求の範囲の文字に対して前記中国語文字の特許請求の範囲に所属する各要素名詞文字コードを自動的に獲得して自動獲得要素名詞とし、コンピュータによって実行される、中国語特許書類の要素名詞自動獲得方法であって、
コンピュータによって、中国語文字の特許請求の範囲の文字コードを自動的に読み取って前記中国語文字の特許請求の範囲の文字とし、基本排除文字データベースにおいて冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む複数の基本排除文字コードを複数の基本排除文字とすることに基いて、前記中国語文字の特許請求の範囲の文字コードから、複数の前記基本排除文字コードを排除するように記録して、前記中国語文字の特許請求の範囲の文字コードにおける前記基本排除文字コードが排除された連続文字コードを基本排除文字連続文字コードとする、基本排除文字記録排除工程と、
コンピュータによって、複数の基本排除文字連続文字コードを自動的に読取って基本排除文字連続文字とし、前記基本排除文字連続文字コードと前記基本排除文字連続文字の前の排除と記録された前記基本排除文字コードの間の文字コード相隣文字関係に基き、前記基本排除文字連続文字コードと前記基本排除文字連続文字の後の排除と記録された前記基本排除文字コードの間の慣用字文字コード、動詞文字コード、副詞文字コード、設置詞文字コードを含む文字コード相隣文字関係に基いて、前記基本排除文字連続文字コードから、削除可能文字コードを削除可能文字として排除するように記録し、前記基本排除文字連続文字コードから、前記削除可能文字コートが排除されて削除可能文字削除連続文字コードを獲得して削除可能文字削除連続文字とする、削除可能文字記録排除工程と、
コンピュータによって、複数の前記削除可能文字削除連続文字コードを自動的に読取って複数の前記削除可能文字削除連続文字とし、単一文字排除文字コードを前記削除可能文字削除連続文字コードから排除するように記録して、前記削除可能文字削除連続文字コードから、前記単一文字排除文字コードが排除されて初歩要素名詞文字コードを獲得して初歩要素名詞とする、単一文字記録排除工程と、
コンピュータによって、複数の前記初歩要素名詞文字コードを自動的に読取って複数の初歩要素名詞文字とし、前記初歩要素名詞文字コードの前一つ文字が不定冠詞文字コードである前記初歩要素名詞文字コードを前字不定冠詞初歩要素名詞文字コードとし、かつ前記初歩要素名詞文字コードの前一つ文字が定冠詞であるもう一つの初歩要素名詞文字コードを前字定冠詞初歩要素名詞文字コードとし、前記前字不定冠詞初歩要素名詞文字コードを前から後への順序で前記前字定冠詞初歩要素名詞文字コードと比較し、前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞コードを獲得し、且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とする、高度排除文字記録排除工程と、を含むことを特徴とするコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。 - 前記削除可能文字記録排除工程が首部文字記録排除工程を有し、前記首部文字記録排除工程がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字文字コードである削除可能識別文字コードに基づいて:各前記基本排除文字連続文字コードの起始文字コードや起始連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ/或は前記対応削除可能識別文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする請求項1のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
- 前記削除可能文字記録排除工程が尾部文字記録排除工程を更に有し、前記尾部文字記録排除装置がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字コードである削除可能識別文字コードに基づいて:各前記基本排除文字連続文字コードの末文字コードや末連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ/或は前記対応削除可能識別文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの末文字コードの相隣後文字コードや相隣後連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記末文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記尾部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする請求項1のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
- 各獲得要素名詞文字コード、句読点文字コードおよび改行符号文字コードに基いて、前記中国語文字の特許請求の範囲の構造を得ることを特徴とする請求項1のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
- コンピュータを用いて中国語文字からなる中国語文字の特許請求の範囲の文字に対して前記中国語文字の特許請求の範囲に所属する各要素名詞文字コードを自動的に獲得して自動獲得要素名詞とし、コンピュータによって実行される、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法であって、
コンピュータによって、中国語文字の特許請求の範囲の文字コードを自動的に読み取って前記中国語文字の特許請求の範囲の文字とし、要素名詞対照表における要素対照表要素名詞文字コードに基いて、前記中国語文字の特許請求の範囲の文字コードから、前記要素対照表要素名詞文字コードを排除するように記録し、前記中国語文字の特許請求の範囲の文字コードにおける前記要素対照表要素名詞文字コードが排除された連続文字コードを要素対照表要素名詞排除連続文字コードとする、要素対照表要素名詞記録排除工程と、
コンピュータによって、前記要素対照表要素名詞排除連続文字コードを自動的に読み取り、基本排除文字データベースにおいて冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む複数の基本排除文字コードを複数の基本排除文字とすることに基いて、前記要素対照表要素名詞排除連続文字コードから、前記基本排除文字コードを排除するように記録し、前記要素対照表要素名詞排除連続文字コードにおける前記基本排除文字コードが排除された連続文字コードを基本排除文字連続文字コードとする、基本排除文字記録排除工程と、
コンピュータによって、複数の前記基本排除文字連続文字コードを自動的に読取って基本排除文字連続文字とし、前記基本排除文字連続文字コードと前記基本排除文字連続文字コードの前の排除と記録された前記基本排除文字コードの間の文字連続関係に基き、及び、前記基本排除文字連続文字コードと前記基本排除文字連続文字コードの後の排除と記録された前記基本排除文字コードの間の慣用字文字コード、動詞文字コード、副詞文字コード及び設置詞文字コードの間の文字コード相隣文字関係である文字コード相隣文字関係に基いて、前記基本排除文字連続文字コードから、削除可能文字コードを削除可能文字として排除するように記録し、前記基本排除文字連続文字コードから、前記削除可能文字コードが排除されて削除可能文字削除連続文字コードを獲得して削除可能文字削除連続文字とする、削除可能文字記録排除工程と、
コンピュータによって、複数の前記削除可能文字削除連続文字コードを自動的に読取って複数の前記削除可能文字削除連続文字とし、単一文字排除文字コードを前記削除可能文字削除連続文字コードから排除するように記録して、前記削除可能文字削除連続文字コードから、単一文字排除文字コードが排除されて初歩要素名詞文字コードを獲得して初歩要素名詞とする、単一文字記録排除工程と、
コンピュータによって、複数の前記最初要素名詞文字コードを自動的に読取って複数の最初要素名詞とし、前一つ文字が不定冠詞である前記初歩要素名詞文字コードを前字不定冠詞初歩要素名詞文字コードとし、前一つ文字が定冠詞であるもう一つの前記初歩要素名詞文字コードを前字定冠詞初歩要素名詞文字コードとし、前記前字不定冠詞初歩要素名詞文字コードを前から後への順序で前記前字定冠詞初歩要素名詞文字コードと比較し、前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とし、且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞とする、高度排除文字記録排除工程と、を含むことを特徴とするコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。 - 前記削除可能文字記録排除工程が首部文字記録排除工程を有し、前記首部文字記録排除工程がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字文字コードである削除可能識別文字コードにより:各前記基本排除文字連続文字コードの起始文字コードや起始連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ/或は前記対応削除可能識別文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字として排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする請求項5のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
- 前記削除可能文字記録排除工程が尾部文字記録排除工程を更に有し、前記尾部文字記録排除装置がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字コードである削除可能識別文字コードにより:各前記基本排除文字連続文字コードの末文字や末連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ/或は前記対応削除可能識別文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの末文字コードの相隣後文字コードや相隣跡後連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記末文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記尾部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする請求項5のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
- 各獲得要素名詞文字コード、句読点文字コードおよび改行符号文字コードに基いて、前記中国語文字の特許請求の範囲の構造を得ることを特徴とする請求項5のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108141435 | 2019-11-14 | ||
TW108141435A TWI772709B (zh) | 2019-11-14 | 2019-11-14 | 對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021082252A JP2021082252A (ja) | 2021-05-27 |
JP7105500B2 true JP7105500B2 (ja) | 2022-07-25 |
Family
ID=75806081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020148638A Active JP7105500B2 (ja) | 2019-11-14 | 2020-09-04 | コンピュータによって実行される文字間スペースなし特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7105500B2 (ja) |
CN (1) | CN112800760B (ja) |
TW (1) | TWI772709B (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017211993A (ja) | 2016-05-27 | 2017-11-30 | 雲拓科技有限公司 | 請求の範囲の中の請求の範囲構成要素名詞所属構成要素対応符号を対応検出する方法 |
JP2018120586A (ja) | 2017-01-24 | 2018-08-02 | 雲拓科技有限公司 | 請求の範囲の構造解析の処理装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001318792A (ja) * | 2000-05-10 | 2001-11-16 | Nippon Telegr & Teleph Corp <Ntt> | 固有表現抽出規則生成システムと方法およびその処理プログラムを記録した記録媒体ならびに固有表現抽出装置 |
CN1253814C (zh) * | 2000-08-04 | 2006-04-26 | 拓墣科技股份有限公司 | 数字文件关键特征的自动撷取方法 |
CN101667194A (zh) * | 2009-09-29 | 2010-03-10 | 北京大学 | 基于用户评论文本特征的自动摘要方法及其自动摘要系统 |
CN103390004B (zh) * | 2012-05-11 | 2018-03-02 | 北京百度网讯科技有限公司 | 一种语义冗余的确定方法和装置、对应的搜索方法和装置 |
CN102945228B (zh) * | 2012-10-29 | 2016-07-06 | 广西科技大学 | 一种基于文本分割技术的多文档文摘方法 |
CN103235774B (zh) * | 2013-04-27 | 2016-04-06 | 杭州电子科技大学 | 一种科技项目申请书特征词提取方法 |
CN103559310A (zh) * | 2013-11-18 | 2014-02-05 | 广东利为网络科技有限公司 | 一种从文章中提取关键词的方法 |
TWI550422B (zh) * | 2015-04-08 | 2016-09-21 | 雲拓科技有限公司 | 申請專利範圍之文字歸位方法 |
CN104915443B (zh) * | 2015-06-29 | 2018-11-23 | 北京信息科技大学 | 一种中文微博评价对象的抽取方法 |
CN107622044A (zh) * | 2016-07-13 | 2018-01-23 | 阿里巴巴集团控股有限公司 | 字符串的分词方法、装置及设备 |
CN108268440A (zh) * | 2017-01-04 | 2018-07-10 | 普天信息技术有限公司 | 一种未登录词识别方法 |
CN109829159B (zh) * | 2019-01-29 | 2020-02-18 | 南京师范大学 | 一种古汉语文本的一体化自动词法分析方法及系统 |
-
2019
- 2019-11-14 TW TW108141435A patent/TWI772709B/zh active
-
2020
- 2020-03-23 CN CN202010207905.1A patent/CN112800760B/zh active Active
- 2020-09-04 JP JP2020148638A patent/JP7105500B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017211993A (ja) | 2016-05-27 | 2017-11-30 | 雲拓科技有限公司 | 請求の範囲の中の請求の範囲構成要素名詞所属構成要素対応符号を対応検出する方法 |
JP2018120586A (ja) | 2017-01-24 | 2018-08-02 | 雲拓科技有限公司 | 請求の範囲の構造解析の処理装置 |
Non-Patent Citations (2)
Title |
---|
原 正巳 外2名,テキストのフォーマットと単語の範囲内重要度を利用したキーワード抽出,情報処理学会論文誌,日本,社団法人情報処理学会,1997年02月15日,第38巻 第2号,pp.299-309 |
柚木山 駿 外3名,特許関連業務支援のための技術用語自動抽出の試み,言語処理学会第22回年次大会 発表論文集 [online],日本,言語処理学会,2016年02月29日,pp.326-329,http://www.anlp.jp/proceedings/annual_meeting/2016/pdf_dir/C1-3.pdf |
Also Published As
Publication number | Publication date |
---|---|
TWI772709B (zh) | 2022-08-01 |
TW202119258A (zh) | 2021-05-16 |
CN112800760A (zh) | 2021-05-14 |
CN112800760B (zh) | 2024-08-02 |
JP2021082252A (ja) | 2021-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6671684B1 (en) | Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document | |
KR101435265B1 (ko) | 언어 변환에 있어서 다중 리딩 모호성 해결을 위한 방법 | |
JP3919617B2 (ja) | 文字認識装置および文字認識方法、プログラムおよび記憶媒体 | |
CN112257613B (zh) | 体检报告信息结构化提取方法、装置及计算机设备 | |
JP5508359B2 (ja) | 文字認識装置、文字認識方法及びプログラム | |
JP2007122403A (ja) | 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム | |
JP2013069015A (ja) | 情報処理装置及び情報処理プログラム | |
JP2008022159A (ja) | 文書処理装置及び文書処理方法 | |
Berg-Kirkpatrick et al. | Improved typesetting models for historical OCR | |
CN112541095A (zh) | 视频标题生成方法、装置、电子设备及存储介质 | |
JP2008077454A (ja) | タイトル抽出装置、画像読取装置、タイトル抽出方法、及びタイトル抽出プログラム | |
CN103559512B (zh) | 一种文字识别输出方法及系统 | |
CN102103612A (zh) | 一种信息提取方法及装置 | |
US8170289B1 (en) | Hierarchical alignment of character sequences representing text of same source | |
CN110825874A (zh) | 一种中文文本分类方法和装置及计算机可读存储介质 | |
JP7105500B2 (ja) | コンピュータによって実行される文字間スペースなし特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法 | |
CN113495874A (zh) | 信息处理装置和计算机可读取介质 | |
CN111291535A (zh) | 剧本处理方法、装置、电子设备及计算机可读存储介质 | |
CN113723082B (zh) | 从文本中检测中文拼音的方法和装置 | |
US20160283446A1 (en) | Input assistance device, input assistance method and storage medium | |
US11582435B2 (en) | Image processing apparatus, image processing method and medium | |
KR101790544B1 (ko) | 정보 처리 장치, 정보 처리 방법, 및 기억 매체 | |
JP6640618B2 (ja) | 言語処理装置、方法、およびプログラム | |
US20190318190A1 (en) | Information processing apparatus, and non-transitory computer readable medium | |
CN114222193B (zh) | 一种视频字幕时间对齐模型训练方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200904 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210917 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211230 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220705 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7105500 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |