JP6206874B2 - Case component extraction program - Google Patents

Case component extraction program Download PDF

Info

Publication number
JP6206874B2
JP6206874B2 JP2013207546A JP2013207546A JP6206874B2 JP 6206874 B2 JP6206874 B2 JP 6206874B2 JP 2013207546 A JP2013207546 A JP 2013207546A JP 2013207546 A JP2013207546 A JP 2013207546A JP 6206874 B2 JP6206874 B2 JP 6206874B2
Authority
JP
Japan
Prior art keywords
noun
word
case component
extracted
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013207546A
Other languages
Japanese (ja)
Other versions
JP2015072573A (en
Inventor
史朗 安高
史朗 安高
績央 渡邊
績央 渡邊
元 安彦
元 安彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Management of Technology Solution Cooperation
Original Assignee
Nomura Research Institute Ltd
Management of Technology Solution Cooperation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd, Management of Technology Solution Cooperation filed Critical Nomura Research Institute Ltd
Priority to JP2013207546A priority Critical patent/JP6206874B2/en
Publication of JP2015072573A publication Critical patent/JP2015072573A/en
Application granted granted Critical
Publication of JP6206874B2 publication Critical patent/JP6206874B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、特許明細書等を始めとした電子データ化された文書に記載された文字列から格成分を抽出する格成分抽出プログラムに関する。   The present invention relates to a case component extraction program for extracting a case component from a character string described in an electronic data document such as a patent specification.

従来、短時間で特許明細書のチェックを行うことを目的とするものであって、特に、クレーム数を極力小さく抑える場合においても、かかる中間概念の記載を含めてより簡単に、かつ権利範囲や特許率をも考慮してチェックすることができる特許明細書分析表示装置が提案されている(例えば、特許文献1参照。)。この特許明細書分析表示装置では、明細書の記載の方向性そのものを中間概念をも含めて容易にチェックすることができる利点がある。   Conventionally, the purpose is to check a patent specification in a short time.Especially, even when the number of claims is kept as small as possible, including the description of the intermediate concept, the scope of rights, Patent specification analysis display devices that can be checked in consideration of the patent rate have been proposed (see, for example, Patent Document 1). This patent specification analysis display device has an advantage that the directionality described in the specification itself can be easily checked including intermediate concepts.

しかしながら、この特許文献1の開示技術では、特許請求の範囲において定義された発明概念の広さ、換言すれば技術的範囲の広さに着目した分析を行うことができないという問題点があった。   However, the disclosed technique of Patent Document 1 has a problem in that it is not possible to perform an analysis focusing on the breadth of the inventive concept defined in the claims, in other words, the breadth of the technical scope.

このため、特許明細書における特許請求の範囲に定義された発明の限定度合をカウントして表示することが可能な特許明細書分析表示装置が特許文献2に開示されている。この特許文献2の開示技術によれば、特許発明の技術的範囲の広さを定量化、数値化するための数値化方法における最小抽出単位として、新たに格成分という概念を採用している。この格成分の数(格成分数)とは、特許発明の技術的範囲の広さと最も相関性が最も高いとされる定量的指標である。格成分数は、特許請求の範囲の記載において各構成要素につきどれだけ限定がかけられているかを数値化したものである。格成分数は、特許請求の範囲に定義されている動詞に係り受けする名詞(名詞句を含む)のうち、動詞による命題を実現するために必要な要素のみをカウントして数値化するものである。   For this reason, Patent Document 2 discloses a patent specification analysis display device capable of counting and displaying the degree of limitation of the invention defined in the claims of the patent specification. According to the technology disclosed in Patent Document 2, the concept of a case component is newly adopted as a minimum extraction unit in a numerical method for quantifying and quantifying the breadth of the technical scope of the patented invention. The number of case components (number of case components) is a quantitative index that has the highest correlation with the breadth of the technical scope of the patented invention. The number of case components is obtained by quantifying how much the constituent elements are limited in the description of the claims. The number of case components counts and counts only the elements necessary to realize the verb proposition among the nouns (including noun phrases) that depend on the verb defined in the claims. is there.

特開2006−155151号公報JP 2006-155151 A 特開2009−259154号公報JP 2009-259154 A

しかしながら、この特許文献2の開示技術では、実際に特許請求の範囲から格成分数を抽出する上で実用化に適したアルゴリズムとされていないため、格成分抽出のフローが非常に複雑化し、抽出効率が悪化してしまうという問題点があった。   However, since the disclosed technique of Patent Document 2 is not an algorithm suitable for practical use in actually extracting the number of case components from the claims, the case component extraction flow becomes very complicated, There was a problem that efficiency would deteriorate.

これに加えて格成分数による特許の広さを数値化・定量化について限界があるとすれば、名詞の概念階層(上位概念か下位概念か)についてパラメータに反映されていないところである。例えば、通信装置と携帯電話は、互いに上位概念と下位概念の関係にあり、通信装置と定義した方が、携帯電話と定義するよりも概念的には広く権利範囲をカバーできる。携帯電話と定義した場合には、その権利範囲が携帯電話のみしかカバーできず、タブレット型端末を通信装置として利用した場合にまで権利範囲に含めることができない可能性があるが、通信装置と定義しておくことにより、これらを全て権利範囲に含められる可能性が高くなる。つまり、特許発明の技術的範囲の広さは、文法上の構造単位の大小関係と、それぞれの持つ名詞の概念階層(上位概念か下位概念か)の2つに基づいて決定される。前者は格成分数を指標として用いることで高精度に検出することができるが、後者である名詞の概念階層は格成分数により検出することができない。   In addition to this, if there is a limit to the quantification and quantification of the patent breadth based on the number of case components, the noun concept hierarchy (higher concept or lower concept) is not reflected in the parameters. For example, a communication device and a mobile phone are in a relationship of a higher concept and a lower concept, and the definition of a communication device can cover the scope of rights more conceptually than the definition of a mobile phone. When defined as a mobile phone, the scope of rights can only cover mobile phones and may not be included in the scope of rights until a tablet terminal is used as a communications device. By doing so, there is a high possibility that they can all be included in the scope of rights. In other words, the breadth of the technical scope of the patented invention is determined based on two levels: a grammatical structural unit size relationship and a noun concept hierarchy (superordinate concept or subordinate concept). The former can be detected with high accuracy by using the number of case components as an index, but the concept hierarchy of the latter noun cannot be detected by the number of case components.

このため、格成分数に加えて、このような名詞の概念階層も考慮に入れた、特許の広さの評価指標を提案する必要性があるが、特許文献2の開示技術では、あくまで文法的な文節構造のみに依拠した格成分数に基づいて権利の広さを測るものであり、上述したニーズには応えることができないという問題点があった。   For this reason, it is necessary to propose an evaluation index for the breadth of a patent that takes into account the concept hierarchy of such nouns in addition to the number of case components. In other words, the breadth of rights is measured based on the number of case components that depend only on a simple phrase structure, and there is a problem that the above-mentioned needs cannot be met.

そこで、本発明は、上述した問題点に鑑みて案出されたものであり、その目的とするところは、実際に特許請求の範囲から文法上の構造単位の大小関係と、それぞれの持つ名詞の概念階層の双方を考慮に入れ、特許の広さを評価することが可能な格成分抽出プログラム、並びに格成分数を高精度に抽出することができる格成分抽出プログラムを提供することにある。   Therefore, the present invention has been devised in view of the above-described problems, and the object of the present invention is to actually determine the grammatical structural unit size relationship and the nouns of each from the claims. It is an object of the present invention to provide a case component extraction program capable of evaluating the breadth of a patent and a case component extraction program capable of extracting the number of case components with high accuracy in consideration of both concept hierarchies.

請求項1記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて、上記抽出した名詞句から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する格成分抽出ステップと、名詞の概念が上位概念から下位概念まで階層化されて記憶されている概念辞書を参照して、上記格成分抽出ステップにおいて抽出された各格成分に含まれる名詞の概念階層をそれぞれ特定する概念階層特定ステップとをコンピュータに実行させることを特徴とする。 A case component extraction program according to claim 1 is a preprocessing step for extracting a character string from the description of a claim in an electronic data patent specification, and a morphological analysis for the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of A word comprehension step that summarizes as one word or “abbreviated”, “slightly”, or “sequential” + a noun as one word, and a noun phrase from the character string that includes the word that has undergone the word inclusion step Noun phrase extraction step to extract, and in the noun phrase extraction step, the case component as a noun phrase required to realize the action of the verb related to each component constituting the scope of claims from the extracted noun phrase And a noun included in each case component extracted in the case component extraction step with reference to a concept dictionary in which the concept of the noun is stored in a hierarchy from the upper concept to the lower concept The computer is caused to execute a concept hierarchy specifying step for specifying each concept hierarchy.

請求項2記載の格成分抽出プログラムは、請求項1記載の発明において、上記格成分抽出ステップにより抽出された格成分の数と、上記概念階層特定ステップにより特定された各格成分における名詞の概念階層とをそれぞれ出力又は記憶し、又は上記抽出された格成分の数と各格成分における名詞の概念階層とに基づいて算出した評価値を出力又は記憶する後処理ステップを更に有することを特徴とする。   The case component extraction program according to claim 2 is the invention according to claim 1, wherein the number of case components extracted in the case component extraction step and the noun concept in each case component specified in the concept hierarchy specifying step And a post-processing step for outputting or storing an evaluation value calculated based on the number of extracted case components and a noun conceptual hierarchy in each case component. To do.

請求項3記載の格成分抽出プログラムは、請求項2記載の発明において、上記後処理ステップでは、上記概念階層がより上位になるにつれて、より特許の広さが広くなるような評価値とし、上記概念階層がより下位になるにつれて、より特許の広さが狭くなるような評価値となるように算出することを特徴とする。   According to a third aspect of the present invention, in the second aspect of the invention, in the post-processing step, the post-processing step sets an evaluation value such that the broader the patent is, the higher the concept hierarchy is. As the concept hierarchy becomes lower, the evaluation value is calculated so that the breadth of the patent becomes narrower.

請求項4記載の格成分抽出プログラムは、請求項1〜3のうち何れか1項記載の発明において、上記概念階層特定ステップでは、上記概念辞書が技術分野毎に名詞の概念が階層化されて記憶され、抽出対象の特許明細書の技術分野に対応した概念辞書を参照することを特徴とする。   The case component extraction program according to claim 4 is the invention according to any one of claims 1 to 3, wherein, in the concept hierarchy specifying step, the concept dictionary includes noun concepts hierarchized for each technical field. Reference is made to a concept dictionary that is stored and corresponds to the technical field of the patent specification to be extracted.

請求項5記載の格成分抽出プログラムは、請求項4項記載の発明において、上記概念階層特定ステップでは、上記概念階層が技術分野毎に正規化された概念辞書を使用することを特徴とする。   The case component extraction program according to claim 5 is the invention according to claim 4, wherein the concept hierarchy specifying step uses a concept dictionary in which the concept hierarchy is normalized for each technical field.

請求項6記載の格成分抽出プログラムは、請求項2又は3記載の発明において、上記後処理ステップでは、上記各格成分をこれに含まれる名詞句毎に特定した概念階層に応じて重み付けし、その重み付けがなされた上記各格成分の総和に基づいて上記評価値を算出することを特徴とする。   The case component extraction program according to claim 6 is the invention according to claim 2 or 3, wherein, in the post-processing step, each case component is weighted according to a concept hierarchy specified for each noun phrase included therein, The evaluation value is calculated based on the sum of the weighted case components.

請求項7記載の格成分抽出プログラムは、請求項1〜6のうち何れか1項記載の発明において、概念階層特定ステップでは、ネットワークを介して新たに受信した上記概念辞書、又は他のソフトウェア或いは他のデータベースから新たに取得した概念辞書を使用することを特徴とする。   The case component extraction program according to claim 7 is the invention according to any one of claims 1 to 6, wherein in the concept hierarchy specifying step, the concept dictionary newly received via the network, or other software or A concept dictionary newly acquired from another database is used.

請求項8記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて、上記抽出した名詞句から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する格成分抽出ステップと、従来の特許を母集団として予めその特許明細書の記載を分析することによる名詞の出現頻度に関する情報を参照して、上記格成分抽出ステップにおいて抽出された各格成分に含まれる名詞の出頻度のランクをそれぞれ特定する頻度ランク特定ステップとをコンピュータに実行させることを特徴とする。 The case component extraction program according to claim 8 includes a preprocessing step of extracting a character string from the description of the scope of claims in the patent specification converted into electronic data, and a morphological analysis of the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of A word comprehension step that summarizes as one word or “abbreviated”, “slightly”, or “sequential” + a noun as one word, and a noun phrase from the character string that includes the word that has undergone the word inclusion step Noun phrase extraction step to extract, and in the noun phrase extraction step, the case component as a noun phrase required to realize the action of the verb related to each component constituting the scope of claims from the extracted noun phrase Each case extracted in the case component extraction step with reference to information on the appearance frequency of nouns by analyzing the description of the patent specification in advance with a conventional patent as a population. characterized in that to execute a frequency rank specifying step of specifying the rank of the current frequency output of nouns included in component respectively to the computer.

請求項9記載の格成分抽出プログラムは、請求項8記載の発明において、上記格成分抽出ステップにより抽出された格成分の数と、上記頻度ランク特定ステップにより特定された各格成分における名詞の頻度ランクとをそれぞれ出力又は記憶し、又は上記抽出された格成分の数と各格成分における名詞の頻度ランクとに基づいて算出した評価値を出力又は記憶する後処理ステップを更に有することを特徴とする。   The case component extraction program according to claim 9 is the invention according to claim 8, wherein the number of case components extracted in the case component extraction step and the frequency of nouns in each case component specified in the frequency rank specification step. A post-processing step that outputs or stores ranks, or outputs or stores evaluation values calculated based on the number of extracted case components and the frequency rank of nouns in each case component, To do.

請求項10記載の格成分抽出プログラムは、請求項9記載の発明において、上記後処理ステップでは、頻度ランクがより高頻度になるにつれてより特許の広さが広くなるような評価値とし、上記頻度ランクがより低頻度になるにつれてより特許の広さが狭くなるような評価値となるように算出することを特徴とする。   The case component extraction program according to claim 10 is the evaluation value according to claim 9, wherein in the post-processing step, the evaluation value is such that the breadth of the patent becomes wider as the frequency rank becomes higher. It is characterized in that the evaluation value is calculated such that the width of the patent becomes narrower as the rank becomes lower in frequency.

請求項11記載の格成分抽出プログラムは、請求項8〜10のうち何れか1項記載の発明において、上記頻度ランク特定ステップでは、上記頻度ランクが技術分野毎に記憶され、抽出対象の特許明細書の技術分野に対応した上記頻度ランクを参照することを特徴とする。   The case component extraction program according to claim 11 is the invention according to any one of claims 8 to 10, wherein in the frequency rank specifying step, the frequency rank is stored for each technical field, and the patent specification to be extracted The frequency rank corresponding to the technical field of the book is referred to.

請求項12記載の格成分抽出プログラムは、請求項8〜11のうち何れか1項記載の発明において、上記頻度ランク特定ステップでは、上記頻度ランクが技術分野毎に正規化され、又は分析対象の特許の出願年に応じて正規化されたものを使用することを特徴とする。   The case component extraction program according to claim 12 is the invention according to any one of claims 8 to 11, wherein, in the frequency rank specifying step, the frequency rank is normalized for each technical field, or is analyzed. It is characterized by using one normalized according to the patent application year.

請求項13記載の格成分抽出プログラムは、請求項9又は10項記載の発明において、上記後処理ステップでは、上記各格成分をこれに含まれる名詞句毎に特定した頻度ランクに応じて重み付けし、その重み付けがなされた上記各格成分の総和に基づいて上記評価値を算出することを特徴とする。   The case component extraction program according to claim 13 is weighted according to the frequency rank specified for each noun phrase included in each case component in the post-processing step in the invention according to claim 9 or 10. The evaluation value is calculated based on the sum of the weighted case components.

請求項14記載の格成分抽出プログラムは、請求項8〜13のうち何れか1項記載の発明において、頻度ランク特定ステップでは、ネットワークを介して新たに受信した上記頻度ランク情報、又は他のソフトウェア或いは他のデータベースから新たに取得した頻度ランク情報を使用することを特徴とする。   The case component extraction program according to claim 14 is the invention according to any one of claims 8 to 13, wherein in the frequency rank specifying step, the frequency rank information newly received via the network or other software Alternatively, frequency rank information newly acquired from another database is used.

請求項15記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて、上記抽出した名詞句から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する格成分抽出ステップと、分析対象の特許明細書の記載を分析することによる名詞の出現頻度に関する情報を参照して、上記格成分抽出ステップにおいて抽出された各格成分に含まれる名詞の出頻度のランクをそれぞれ特定する頻度ランク特定ステップとをコンピュータに実行させることを特徴とする。 The case component extraction program according to claim 15 includes a preprocessing step of extracting a character string from the description of the scope of claims in the patent specification converted into electronic data, and a morphological analysis of the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of A word comprehension step of summarizing words as one word, or summing any one of "abbreviation", "slightly", and "sequential" + nouns, and a noun phrase from the character string including the word that has undergone the word inclusion step A noun phrase extraction step for extracting a noun phrase, and in the noun phrase extraction step described above , a case as a noun phrase required for realizing the action of a verb related to each component constituting the scope of claims from the extracted noun phrase . A noun included in each case component extracted in the case component extraction step with reference to information regarding the appearance frequency of nouns by analyzing the description of the patent specification to be analyzed, and a case component extraction step for extracting components and wherein the output be executed and a frequency rank specifying step of specifying each rank of the current frequency to the computer.

請求項16記載の格成分抽出プログラムは、請求項15記載の発明において、上記格成分抽出ステップにより抽出された格成分の数と、上記頻度ランク特定ステップにより特定された各格成分における名詞の頻度ランクとをそれぞれ出力又は記憶し、又は上記抽出された格成分の数と各格成分における名詞の頻度ランクとに基づいて算出した評価値を出力又は記憶する後処理ステップを更に有することを特徴とする。   The case component extraction program according to claim 16 is the invention according to claim 15, wherein the number of case components extracted in the case component extraction step and the frequency of nouns in each case component specified in the frequency rank specification step. A post-processing step that outputs or stores ranks, or outputs or stores evaluation values calculated based on the number of extracted case components and the frequency rank of nouns in each case component, To do.

請求項17記載の格成分抽出プログラムは、請求項1〜16のうち何れか1項記載の発明において、上記格成分抽出ステップでは、上記文字列中の「〜を特徴とする」における「特徴」を上記文字列から除く名詞句を少なくとも格成分として抽出することをコンピュータに実行させることを特徴とする。 The case component extraction program according to claim 17 is the "characteristic" in "characterizing" in the character string in the case component extraction step in the invention according to any one of claims 1 to 16. the characterized in that to execute a computer to extract a noun phrase, excluding from the string as "at least rated component.

請求項18記載の情報送信システムは、請求項2〜7、9〜17のうち何れか1項記載の格成分抽出プログラムによって上記評価値を算出する評価値算出手段と、上記評価値算出手段によって得られた評価値、及びこれに基づく図やデータの何れか1以上を記憶するサーバーと、クライアント側から要求された上記評価値、及びこれに基づく図やデータを上記サーバーから読み出し、これをネットワークを介してクライアント側に送信する送信手段とを備えることを特徴とする。   An information transmission system according to claim 18 includes an evaluation value calculation means for calculating the evaluation value by the case component extraction program according to any one of claims 2 to 7 and 9 to 17, and an evaluation value calculation means. A server that stores at least one of the obtained evaluation value and a figure or data based on the evaluation value, and the evaluation value requested from the client side and a figure or data based on the server are read out from the server And transmitting means for transmitting to the client side via the network.

請求項19記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、 上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて、上記抽出した名詞句のうち、A、Bをそれぞれ名詞句としたときに、AとBが択一的に定義されていた場合には、A、Bの何れか一方を抽出すべき格成分から除外し、残りの名詞句を少なくとも格成分として抽出する格成分抽出ステップとをコンピュータに実行させることを特徴とする。 A case component extraction program according to claim 19 includes a preprocessing step of extracting a character string from the description of the scope of claims in a patent specification converted into electronic data, and a morphological analysis of the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of A word comprehension step of summarizing words as one word, or summing any one of "abbreviation", "slightly", and "sequential" + a noun, and a noun phrase from the character string including the word that has undergone the word inclusion step In the noun phrase extracting step and the noun phrase extracting step, when A and B are defined as noun phrases in the extracted noun phrases, A and B are alternatively defined Is characterized by excluding one of A and B from the case components to be extracted and causing the computer to execute a case component extraction step of extracting the remaining noun phrases as at least the case components.

請求項20記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて抽出された名詞句から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する上で、名詞+並列助詞としての「か」又は「や」の何れかからなる文言を、抽出すべき格成分から除外することをコンピュータに実行させることを特徴とする。 The case component extraction program according to claim 20 includes a preprocessing step of extracting a character string from the description of the scope of claims in the patent specification converted into electronic data, and a morphological analysis of the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, “at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of A word comprehension step of summarizing words as one word, or summing any one of "abbreviation", "slightly", and "sequential" + nouns, and a noun phrase from the character string including the word that has undergone the word inclusion step A noun phrase extraction step for extracting a noun phrase and a case component as a noun phrase required to realize the action of a verb related to each component constituting the scope of claims from the noun phrase extracted in the noun phrase extraction step Is extracted from the case component to be extracted, the computer is executed to exclude a word composed of either “ka” or “ ya as a noun + parallel particle.

請求項21記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて抽出された名詞句から格成分を抽出する上で、抽出した文字列中に「〜が」、「〜は」、「〜には」、「〜も」の何れかで定義される主語と、これに係り受けする動詞の関係が含まれていた場合であって、その主語に相当する文言が、その上段で既に記載されている場合には、当該主語に相当する文言を抽出すべき格成分から除外し、その主語に相当する文言が、その上段で未だ記載されていない場合には、当該主語に相当する文言を抽出すべき格成分に含めるように処理する格成分抽出ステップとをコンピュータに実行させることを特徴とする。 A case component extraction program according to claim 21 includes a preprocessing step of extracting a character string from the description of the scope of claims in a patent specification converted into electronic data, and a morphological analysis of the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of A word comprehension step of summarizing words as one word, or summing any one of "abbreviation", "slightly", and "sequential" + nouns, and a noun phrase from the character string including the word that has undergone the word inclusion step In extracting the noun phrase from the noun phrase extracted step and the noun phrase extracted in the noun phrase extracting step, "~", "~", and "to" are included in the extracted character string. , If the relationship between the subject defined in any of “to” and the verb that depends on the subject is included, and the wording corresponding to the subject has already been described above Excludes the word corresponding to the subject from the case component to be extracted, and if the word corresponding to the subject is not yet described in the upper row, the word corresponding to the subject is to be extracted. Case ingredients to be processed for inclusion in ingredients Characterized in that to execute the steps in computer output.

請求項22記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて抽出された名詞句から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する上で、動詞を順次抽出し、抽出した動詞が、その上段に記載されているか識別を行う識別工程と、上記識別工程における識別の結果、当該抽出した動詞が、その上段で既に記載されていた旨を識別した場合には、当該識別した動詞に係り受けする名詞句、並びにその上段で既に記載されている動詞が係り受けする主体を示す名詞句を特定する特定工程と、上記特定工程において特定した名詞句と、当該抽出した動詞に係り受けする名詞句との間で同一性を判定する同一性判定工程と、当該抽出した動詞に係り受けする名詞句のうち、上記同一性判定工程において同一と判定されたものについては、これを抽出すべき格成分から除外する除外工程とを有する格成分抽出ステップとをコンピュータに実行させることを特徴とする。 A case component extraction program according to claim 22 includes a preprocessing step of extracting a character string from the description of a claim in an electronic data patent specification, and a morphological analysis of the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of A word comprehension step of summarizing words as one word, or summing any one of "abbreviation", "slightly", and "sequential" + nouns, and a noun phrase from the character string including the word that has undergone the word inclusion step A noun phrase extraction step for extracting a noun phrase and a case component as a noun phrase required to realize the action of a verb related to each component constituting the scope of claims from the noun phrase extracted in the noun phrase extraction step In order to extract the verbs, the verbs are sequentially extracted, the identification step for identifying whether the extracted verbs are listed in the upper stage, and as a result of the identification in the identification step, the extracted verbs are already described in the upper stage If it has been identified, the noun phrase that depends on the identified verb, and the noun phrase that indicates the subject on which the verb already described above depends An identity determination step for determining identity between a noun phrase identified in the identifying step and the noun phrase identified in the identifying step and a noun phrase that depends on the extracted verb, and a noun phrase that depends on the extracted verb Among them, a case component determined to be the same in the identity determination step is caused to cause a computer to execute a case component extraction step having an exclusion step of excluding it from case components to be extracted.

請求項23記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、上記単語包括化ステップを経た単語を含む上記文字列から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて抽出された名詞句から格成分を抽出する上で、名詞として抽出される「いずれか」又は「何れか」を抽出すべき格成分から除外するとともに、当該「いずれか」又は「何れか」に直接係り受けする文言が複数存在する場合には、そのうち先行する名詞句について抽出すべき格成分から除外する格成分抽出ステップとをコンピュータに実行させることを特徴とする。 The case component extraction program according to claim 23 includes a preprocessing step for extracting a character string from the description of the scope of claims in the patent specification converted into electronic data, and a morphological analysis for the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of Conclusion As one word, or "substantially", "somewhat", and the word entrapping step to combine either + noun "sequential" One word claims from the string containing the word through the word entrapping step A noun phrase extracting step for extracting a noun phrase as a noun phrase required to realize the action of a verb related to each component constituting the range of the noun phrase, and a case component from the noun phrase extracted in the noun phrase extracting step When extracting any of the words, either “any” or “any” extracted as a noun is excluded from the case components to be extracted, and there are multiple words that are directly related to “any” or “any” In this case, the computer is caused to execute a case component extraction step of excluding the case component to be extracted from the preceding noun phrase.

請求項24記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、 上記単語包括化ステップを経た単語を含む上記文字列から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて抽出された名詞句から格成分を抽出する上で、上記抽出した名詞句のうち、名詞+「的・自在・可能・不能・不可・よう」+(「な」・「に」・「の」・「と」)を含む名詞句、又はこれらの名詞句に平仮名が追加された文言を抽出すべき格成分から除外する格成分抽出ステップとをコンピュータに実行させることを特徴とする。 The case component extraction program according to claim 24 includes a preprocessing step of extracting a character string from the description of the scope of claims in a patent specification converted into electronic data, and a morphological analysis of the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of Conclusion As one word, or "substantially", "somewhat", and the word entrapping step to combine either + noun "sequential" One word claims from the string containing the word through the word entrapping step A noun phrase extracting step for extracting a noun phrase as a noun phrase required to realize the action of a verb related to each component constituting the range of the noun phrase, and a case component from the noun phrase extracted in the noun phrase extracting step In extracting the noun phrases, the nouns including the nouns + “target / free / possible / impossible / impossible / you” + (“na”, “ni”, “no”, “to”) A case component is extracted from a case component to be extracted from a phrase or a phrase in which a hiragana is added to these noun phrases.

請求項25記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて抽出された名詞句から格成分を抽出する上で、「名詞又は名詞句」+「A」+「名詞又は名詞句」からなる文言を抽出した場合において、A=「までの」、「への」、「との」、「にて」、「や」の何れかの場合には、この「A」によって隔てられる個々の「名詞又は名詞句」を別々に格成分として抽出する格成分抽出ステップとをコンピュータに実行させることを特徴とする。 A case component extraction program according to claim 25 includes a preprocessing step of extracting a character string from the description of the scope of claims in a patent specification converted into electronic data, and a morphological analysis of the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of A word comprehension step of summarizing words as one word, or summing any one of "abbreviation", "slightly", and "sequential" + nouns, and a noun phrase from the character string including the word that has undergone the word inclusion step A noun phrase extraction step for extracting a noun phrase and a noun phrase extracted from the noun phrase extracted in the noun phrase extraction step, a word composed of “noun or noun phrase” + “A” + “noun or noun phrase” In the case where A = “up to”, “to”, “to”, “in”, “ya”, or “no”, the individual “nouns” separated by “A” are extracted. A case component extraction step of separately extracting “noun phrases” as case components is executed by a computer.

請求項26記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて、上記名詞句抽出ステップにおいて抽出された名詞句から格成分を抽出する上で、更に上記抽出した文字列のうち、「これ」、「それ」、「あれ」、「どれ」、「ここ」、「そこ」、「あそこ」、「どこ」の何れかからなる代名詞を抽出すべき格成分に含めることをコンピュータに実行させることを特徴とする。 A case component extraction program according to claim 26 includes a preprocessing step for extracting a character string from the description of the scope of claims in the patent specification converted into electronic data, and a morphological analysis on the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of A word comprehension step of summarizing words as one word, or summing any one of "abbreviation", "slightly", and "sequential" + nouns, and a noun phrase from the character string including the word that has undergone the word inclusion step In extracting the noun phrase from the noun phrase extracted in the noun phrase extraction step in the noun phrase extraction step and the noun phrase extraction step, the “no”, “ It is characterized in that the computer is caused to include a pronoun consisting of any of “it”, “that”, “which”, “here”, “there”, “that”, “where” in the case component to be extracted. To do.

請求項27記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて、上記名詞句抽出ステップにおいて抽出された名詞句から格成分を抽出する上で、動詞を「こと」につなげた、動詞の名詞形を格成分として抽出する格成分抽出ステップとをコンピュータに実行させることを特徴とする。 The case component extraction program according to claim 27 includes a preprocessing step of extracting a character string from the description of the scope of claims in the patent specification converted into electronic data, and a morphological analysis of the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of A word comprehension step of summarizing words as one word, or summing any one of "abbreviation", "slightly", and "sequential" + nouns, and a noun phrase from the character string including the word that has undergone the word inclusion step In the noun phrase extraction step for extracting the noun phrase, and in the noun phrase extraction step, the noun form of the verb, in which the verb is connected to “ko”, is extracted from the noun phrase extracted in the noun phrase extraction step. A case component extraction step of extracting as a case component is executed by a computer.

請求項28記載の格成分抽出プログラムは、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、上記名詞句抽出ステップにおいて、上記名詞句抽出ステップにおいて抽出された名詞句から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する格成分抽出ステップとを有し、上記単語包括化ステップでは、「略」・「若干」・「順次」+名詞を一単語とすることをコンピュータに実行させることを特徴とする。 The case component extraction program according to claim 28 includes a preprocessing step for extracting a character string from the description of the scope of claims in the patent specification converted into electronic data, and a morphological analysis on the character string processed in the preprocessing step. And after analyzing these into words by parsing, the noun + noun / noun + “no” + noun / noun + “no” + noun / noun + “target / free / possible” / noun + “To”, noun + “by”, at least” + quantity expression, noun + “do, can, let, be done” as one word, or “above”, “above”, Either “the”, “the”, or the conjunction is combined with the following word as one word, or the noun + “no” + “adjective” + noun / noun + “to be related to Any of A word comprehension step of summarizing words as one word, or summing any one of "abbreviation", "slightly", and "sequential" + nouns, and a noun phrase from the character string including the word that has undergone the word inclusion step In the noun phrase extraction step and the noun phrase extraction step, which are required to realize the action of the verb related to each component constituting the scope of claims from the noun phrase extracted in the noun phrase extraction step. A case component extraction step for extracting case components as a noun phrase, and in the word inclusion step, causes the computer to execute “abbreviation”, “slightly”, “sequential” + noun as one word It is characterized by that.

請求項29記載の格成分抽出プログラムは、請求項19〜28のうち何れか1項記載の発明において、上記格成分抽出ステップでは、上記文字列中の「〜を特徴とする」における「特徴」を上記文字列から除く名詞句を少なくとも格成分として抽出することをコンピュータに実行させることを特徴とする。   A case component extraction program according to a twenty-ninth aspect of the present invention is the invention according to any one of the nineteenth to twenty-eighth aspects, wherein in the case component extraction step, the “characteristic” in “characteristic of” is included in the character string. The computer is caused to extract at least a noun phrase that is removed from the character string as a case component.

請求項30記載の格成分抽出プログラムは、請求項19〜29のうち何れか1項記載の発明において、上記格成分抽出ステップでは、抽出した格成分の数をカウントしてこれを出力又は記憶し、当該格成分の数に基づく評価値、又は特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分の数(以下、CNという。)を下記計算式に基づく評価値として出力又は記憶することをコンピュータに実行させることを特徴とする。
評価値={α−log(CN+β)}×γ
ここでα=3〜8
β=15〜25
γ=15〜40
The case component extraction program according to claim 30 is the invention according to any one of claims 19 to 29, wherein in the case component extraction step, the number of extracted case components is counted and output or stored. , An evaluation value based on the number of case components, or the number of case components (hereinafter referred to as CN) as noun phrases required to realize the action of a verb related to each component constituting the claims . Is output or stored as an evaluation value based on the following calculation formula.
Evaluation value = {α-log (CN + β)} × γ
Where α = 3-8
β = 15-25
γ = 15-40

請求項31記載の情報送信システムは、請求項19〜29のうち何れか1項記載の格成分抽出プログラムによって特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する格成分抽出手段と、
格成分抽出手段によって得られた格成分数又は当該格成分数に基づく評価値の何れか1以上を記憶するサーバーと、
クライアント側から要求された特許の格成分数、又は評価値を上記サーバーから読み出し、これをネットワークを介してクライアント側に送信する送信手段とを備えること
を特徴とする情報送信システム。
An information transmission system according to a thirty-first aspect is required to realize the action of a verb related to each component constituting the scope of the claims by the case component extraction program according to any one of the nineteenth to twenty-ninth aspects. Case component extraction means for extracting case components as noun phrases ;
A server that stores at least one of the number of case components obtained by the case component extraction means or an evaluation value based on the number of case components;
An information transmission system comprising: a transmission unit that reads out the number of case components or an evaluation value of a patent requested from the client side from the server and transmits it to the client side via a network.

上述した構成からなる本発明では、特許明細書における特許請求の範囲に定義された発明の限定度合としての格成分を高精度に抽出することが可能となる。また、文法上の構造単位の大小関係と、それぞれの持つ名詞の概念階層の双方を考慮に入れ、特許の広さを評価することが可能となる。   In the present invention having the above-described configuration, it is possible to extract the case component as the degree of limitation of the invention defined in the claims of the patent specification with high accuracy. In addition, it is possible to evaluate the breadth of patents by taking into account both the size relationship of structural units in the grammar and the concept hierarchy of each noun.

格成分について説明するための図である。It is a figure for demonstrating a case component. 格成分について説明するための他の図である。It is another figure for demonstrating a case component. 本発明を適用した格成分抽出プログラムを実行するためのフローチャートである。It is a flowchart for performing the case component extraction program to which this invention is applied. 概念階層について説明するための図である。It is a figure for demonstrating a concept hierarchy. 概念階層について数値を割り当てる例を示す図である。It is a figure which shows the example which allocates a numerical value about a concept hierarchy. 本発明を適用した格成分抽出プログラムを実行するための他のフローチャートである。It is another flowchart for performing the case component extraction program to which this invention is applied.

以下、本発明を実施するための形態として、特許明細書等を始めとした電子データ化された文書に記載された文字列から格成分を抽出する格成分抽出プログラムについて、図面を参照しながら詳細に説明する。   Hereinafter, as a form for carrying out the present invention, a case component extraction program for extracting a case component from a character string described in an electronic data document including a patent specification and the like will be described in detail with reference to the drawings. Explained.

以下の例では、文書として特許明細書における特許請求の範囲の記載から格成分を抽出する場合について説明をするが、これに限定されるものではなく、他のいかなる文書に対して本発明を適用してもよいことは勿論である。   In the following example, a case where a case component is extracted from the description of the claims in the patent specification will be described as a document. However, the present invention is not limited to this, and the present invention is applied to any other document. Of course, you may do.

格成分のコンセプトCase ingredient concept

特許発明の技術的範囲の広さを定量化、数値化するための数値化方法における最小抽出単位として、格成分が提案されている。   Case components have been proposed as a minimum extraction unit in a quantification method for quantifying and quantifying the breadth of the technical scope of the patented invention.

特許請求の範囲が、各構成要素A、B、Cを「〜Aと、〜Bと、Cとを備える○○装置(方法)」と列挙することにより定義する、いわゆる要件列挙方式で記載されていることを前提としたとき、各構成要素A、B、Cには、動詞句が係り受けする。即ち、各構成要素A、B、Cを主語としたとき、これらにはそれぞれ動詞句が係り受けし、主語と述語とからなる文を成立させることができる。これら動詞句における動詞は、述語として文を形成するにあたり、自らの表す動き、状態、関係を実現させるために、どのような名詞句の組み合わせを取るかが基本的に決まっている。動詞が自らの帯びている語彙的意味の類的なあり方に応じて、文の形成に必要な名詞句の組み合わせを選択的に要求する働きを、動詞の格支配と仮称するならば、動詞により文の成分として要求された名詞句は、動詞を補足する上での格成分ということができる。   The claims are described in a so-called requirement enumeration system, in which each component A, B, and C is defined by enumerating as "XX apparatus (method) including ~ A, ~ B, and C" " As a premise, each component A, B, and C depends on a verb phrase. That is, when each of the constituent elements A, B, and C is a subject, a verb phrase depends on each of them, and a sentence composed of the subject and a predicate can be established. When the verbs in these verb phrases form a sentence as a predicate, the combination of noun phrases is basically determined in order to realize the movement, state, and relationship expressed by the verb. If a verb is tentatively called the case rule of a verb, the verb requires a combination of noun phrases required to form a sentence according to the lexical meaning of the verb. Noun phrases required as sentence components can be called case components in supplementing verbs.

例を挙げて説明するならば、構成要素“信号生成手段”が下記のB−1)により定義されているものとする。   For example, it is assumed that the component “signal generating means” is defined by the following B-1).

B−1)「ユーザの要求に応じて駆動信号を生成する信号生成手段と、〜」   B-1) “Signal generation means for generating a drive signal in response to a user request, and so on”

このとき、「ユーザの要求に応じて駆動信号を生成する」という動詞句が信号生成手段に係り受けする。この動詞句において「生成する」という動詞の動作を実現・完成させるために、「ユーザの要求(に応じて)」、「駆動信号(を)」という名詞句を要求する働きが格支配であり、これら名詞句が格成分である。そして、「ユーザの要求(に応じて)」、「駆動信号(を)」といった名詞句が、それぞれ「生成する」という動詞に対して「動作開始条件」「対象」といった類的な関係的意味が格である。この格成分を実現している名詞句の担っている語彙的意味、またそれらの名詞句が帯びている関係的意味としての格によって形成されるものが、この動詞「生成する」により実現すべき命題の中核部分となる。上記例で言うならば “生成する”という動詞による命題を実現するための動作開始条件として、“ユーザの要求に応じて”いなければならず、さらにその対象として“駆動信号”を生成しなければならないため、これら2つが動詞による命題実現のため条件数となっている。   At this time, a verb phrase “generates a drive signal in response to a user request” depends on the signal generation means. In order to realize and complete the action of the verb “Generate” in this verb phrase, the role of requesting the noun phrases “user request (according to)” and “driving signal ()” is dominant. These noun phrases are case components. And the noun phrases such as “user's request (according to)” and “drive signal ()” have similar relational meanings such as “operation start condition” and “target” for the verb “generate” respectively. Is the case. This verb “generate” should be realized by the lexical meaning of the noun phrases that realize this case component, and the case formed as the relative meaning of those noun phrases. It becomes the core part of the proposition. In the above example, the operation start condition for realizing the proposition by the verb “generate” must be “in response to the user's request”, and “drive signal” must be generated as the target. Therefore, these two are conditional numbers for the realization of the verb proposition.

図1に示すように、このような動詞による命題実現のためにクリアしなければならない条件数が少ない場合を模式的に表したものである。動詞による動作開始のための条件の数が少なくなるため、命題を実現できる可能性が向上する。これに対して、図2は、動詞による命題実現のためにクリアしなければならない条件数が増加した場合を模式的に表したものであり、かかる場合には命題を実現できる可能性が低下する。   As shown in FIG. 1, the case where the number of conditions that must be cleared in order to realize a proposition using such a verb is schematically shown. Since the number of conditions for starting the action by the verb is reduced, the possibility that the proposition can be realized is improved. On the other hand, FIG. 2 schematically shows a case where the number of conditions that must be cleared for the realization of a proposition by a verb is increased. In such a case, the possibility that the proposition can be realized decreases. .

条件数が増加するほど、実際に動作が開始されるまでに条件を満たすか否かの判断のステップ数が増加することになる。各条件を満たす確率に多少の差異があることを考慮しても、この条件の判断ステップ数が増加するに従い、換言すれば条件を規定する格成分が増加するに従い、その動詞句が係り受けする構成要素Aに該当する可能性が低くなることを意味しており、その可能性の低下した分、技術的範囲が狭まることを示している。逆に、格成分数が少ない場合には、その動詞句が係り受けする構成要素Aに該当する可能性が高くなることを意味しており、その分において技術的範囲が広がることを示している。   As the condition number increases, the number of steps for determining whether or not the condition is satisfied before the operation is actually started increases. Even considering that there is a slight difference in the probability of satisfying each condition, the verb phrase depends on as the number of judgment steps for this condition increases, in other words, as the case component that defines the condition increases. This means that the possibility of falling under component A is reduced, and the technical scope is narrowed by the reduced possibility. Conversely, if the number of case components is small, this means that the verb phrase is likely to fall under the component A that it depends on, indicating that the technical scope will expand accordingly. .

このように格成分数(条件数)が、動詞による動作開始可能性、ひいては命題実現の可能性を支配し、これが技術的範囲の広狭に影響を及ぼすものであるから、特許請求の範囲の数値化方法の最小抽出単位を格成分として、この動詞句に含められている格成分数をカウントすることにより、技術的範囲の広さに応じた数値化を実現することができるものと考えられる。   In this way, the number of case components (condition number) governs the possibility of action start by a verb, and thus the possibility of realizing a proposition, and this affects the breadth of the technical scope. By counting the number of case components included in this verb phrase with the minimum extraction unit of the conversion method as the case component, it is considered that numericalization according to the width of the technical range can be realized.

上述したB−1)の例では、構成要素「信号生成手段」の命題を実現するための動詞「生成する」に係り受けする2つの格成分「ユーザの要求に応じて」「駆動信号を」が存在するため、格成分数が2となる。このとき、動詞「生成する」の動作開始条件を規定する「ユーザの要求に応じて」という格成分が存在しない場合には、格成分数が1となり、ユーザの要求の有無に関係なく、いつでも「駆動信号」を「生成する」ことができることになり、「信号生成手段」の命題を実現できる可能性が高くなる。これは構成要素「信号生成手段」により、侵害被疑製品の技術的要素の同一性を立証できる可能性を向上させることができることを示唆しており、かかる可能性の向上させた分が、侵害被疑製品に対する特許発明の捕捉容易性、ひいては特許発明の技術的範囲の広さに相当するものと考えられる。このため、構成要素の命題実現可能性を格成分数を介して表現することにより、技術的範囲の広さに応じた、より最適な数値化、定量化を図ることができるものと考えられる。   In the example of B-1) described above, the two case components “depending on the user's request” and “drive signal” that depend on the verb “generate” to realize the proposition of the component “signal generation means” Therefore, the number of case components is 2. At this time, if there is no case component “in response to the user's request” that defines the operation start condition of the verb “generate”, the number of case components is 1, regardless of whether or not the user has requested. The “drive signal” can be “generated”, and the possibility of realizing the proposition of “signal generation means” is increased. This suggests that the component “signal generation means” can improve the possibility of verifying the identity of the technical elements of the suspected infringing product. This is considered to correspond to the ease of capturing the patented invention with respect to the product, and thus the technical scope of the patented invention. For this reason, it is considered that by expressing the proposition feasibility of the constituent element through the number of case components, it is possible to achieve more optimal quantification and quantification according to the width of the technical range.

特許請求の範囲が、各構成要素A、B、Cを「〜Aと、〜Bと、Cとを備える○○装置(方法)」と列挙することにより定義する、いわゆる要件列挙方式で記載されていることを前提としたとき、各構成要素A、B、Cについてそれぞれ格成分数を求め、その総和を特許発明としての○○装置の格成分数とする。仮に、構成要素Aの格成分数が1、構成要素Bの格成分数が3、構成要素Cの格成分数が2とした場合に、これらにより構成される特許発明としての○○装置の格成分数は、その総和である6となる。   The claims are described in a so-called requirement enumeration system, in which each component A, B, and C is defined by enumerating as "XX apparatus (method) including ~ A, ~ B, and C" " The number of case components is determined for each of the components A, B, and C, and the sum is defined as the number of case components of the OO device as the patented invention. If the number of case components of component A is 1, the number of case components of component B is 3, and the number of case components of component C is 2, the case of the XX device as a patented invention constituted by these components is assumed. The number of components is 6, which is the sum of the components.

実際に各構成要素の格成分数を求める際に、上述したB−1)の例では、「生成する」という動詞に係り受けする格成分「ユーザの要求に応じて」「駆動信号を」を抽出することになるが、この格成分の実際の抽出作業は、「応じて」「を」等、形態素を目印にして行っていくことになる。   When actually determining the number of case components of each component, in the above-mentioned example of B-1), the case components “according to the user's request” and “drive signal” that depend on the verb “generate” are set. Although the case component is extracted, the actual extraction operation of the case component is performed by using morphemes as marks such as “accordingly” and “to”.

表1に格成分を抽出する際に、目印として参照する形態素の例を示す。   Table 1 shows examples of morphemes that are referred to as landmarks when extracting case components.

Figure 0006206874
Figure 0006206874

特許請求の範囲は、B−1)のようなオーソドックスな形で定義されている場合のみならず、例えばC−1)に示すように定義される場合もある。   The claims may be defined not only in the orthodox form as in B-1) but also as shown in C-1), for example.

C−1)「第1のレンズによりスポット径を制御された光束を反射板により全反射する反射手段と、〜」   C-1) "Reflecting means for totally reflecting the light beam, the spot diameter of which is controlled by the first lens, by the reflecting plate,"

例えば、特許請求の範囲を構成する構成要素「反射手段」には、「全反射する」という動詞が係り受けする。この「全反射する」という動詞の動作開始条件を規定する格成として、「光束(を)」と、「反射板(により)」が存在することになり、先ず格成分数2をカウントすることができる。しかし、このうち一の格成分「光束」に着目した場合に、「第1のレンズによりスポット径を制御された」という動詞句がさらに係り受けしているのが分かる。あらゆる光束を「全反射する」対象として定義するよりも、むしろ条件が付加された光束を「全反射する」対象として定義した方が、技術的に限定が付加され、構成要素「反射手段」の命題実現可能性が低下する。このため、この命題実現可能性の低下分を格成分数として補正する必要が出てくる。   For example, the component “reflecting means” constituting the scope of the claims depends on the verb “total reflection”. As a stipulation that defines the action start condition of the verb “totally reflect”, “light flux ()” and “reflector (by)” exist, and first count the number of case components 2. Can do. However, when focusing on one of the case components “light flux”, it can be seen that the verb phrase “the spot diameter is controlled by the first lens” is further dependent. Rather than defining all luminous fluxes as “totally reflecting” objects, it is technically more restrictive to define conditional luminous fluxes as “totally reflecting” objects. Feasibility of proposition decreases. For this reason, it is necessary to correct this decrease in proposition feasibility as the number of case components.

かかる場合には、「光束」に係り受けする動詞句「第1のレンズによりスポット径を制御される」において、「制御する」という動詞により格支配される2つの格成分「第1のレンズ(により)」、「スポット径(を)」が存在しているため、さらに格成分数2を加算する。その結果、C−1)は合計の格成分数は4となる。   In such a case, in the verb phrase “spot diameter is controlled by the first lens” that depends on “light flux”, the two case components “first lens ( )) And “spot diameter ()” are present, so add 2 case components. As a result, the total number of case components for C-1) is 4.

なお、この特許請求の範囲の記載C−1)は、明細書作成者によっては下記のC−2)のように定義される場合もある。   In addition, description C-1) of this claim may be defined as C-2) below depending on the creator of the specification.

C−2)「第1のレンズにより光束のスポット径を制御する光束制御手段と、かかる光束を反射板により全反射する反射手段と、〜」   C-2) “Flux control means for controlling the spot diameter of the light flux by the first lens, and reflection means for totally reflecting the light flux by the reflecting plate, and so on”.

このC−2)における「光束制御手段」並びに「反射手段」により形成される技術的範囲は、C−1)と実質的に同一である。C−2)では、C−1)において「光束」に係り受けする動詞句の内容を、「光束制御手段」により実現すべき命題と位置づけて定義し直している。実際にC−1)においても、定義されている「光束」を作り出すためには、何らかの手段や部材を利用することになるが、あえて「光束制御手段」を挙げて定義していないに過ぎない。このC−2)についても同様に格成分数をカウントすると、光束制御手段で格成分数2、反射手段で格成分数2で合計で格成分数4となり、C−1)と同様の結果となる。   The technical range formed by the “light flux controlling means” and the “reflecting means” in C-2) is substantially the same as C-1). In C-2), the content of the verb phrase that depends on the “light flux” in C-1) is redefined as a proposition to be realized by the “light flux control means”. In fact, even in C-1), in order to produce the defined "light flux", some means or member will be used, but it is only deliberately defined as "light flux control means". . Similarly, when the number of case components is counted for C-2), the number of case components is 2 for the light flux control means and the number of case components is 2 for the reflection means. The result is the same as for C-1). Become.

上述のように、構成要素の命題を実現するために要求される格成分の数を介して技術的範囲の広さをカウントするものであるため、互いに記載方法や単語数が異なるものの実質的に同一の技術的範囲からなるC−1)、C−2)を同等の格成分数で表現することができる。仮に最小抽出単位を構成要素とした場合にC−1)は1、C−2)は2となり、最小抽出単位を単語とした場合にC−1)は7、C−2)は、9となることを鑑みても、この格成分数は、より好適な数値化方法の最小抽出単位になり得るものと考えられる。   As described above, since the scope of the technical range is counted through the number of case components required to realize the proposition of the constituent element, the description method and the number of words differ from each other substantially. C-1) and C-2) consisting of the same technical scope can be expressed with the same number of case components. If the minimum extraction unit is a component, C-1) is 1 and C-2) is 2. If the minimum extraction unit is a word, C-1) is 7, and C-2) is 9. In view of this, it is considered that the number of case components can be a minimum extraction unit of a more suitable numerical method.

なお、C−1)、C−2)の構成は、以下のC−3)により定義される場合もあり得る。   The configurations of C-1) and C-2) may be defined by the following C-3).

C−3)「第1のレンズにより光束のスポット径を制御する光束制御手段と、上記光束制御手段によりスポット径が制御された光束を反射板により全反射する反射手段と、〜」 C-3) “Flux control means for controlling the spot diameter of the light flux by the first lens, and reflection means for totally reflecting the light flux whose spot diameter is controlled by the light flux control means by the reflector, and so on”

このC−3)の波線部は、C−2)における「かかる光束」の部分に相当する。しかし、この波線部に記載されている動詞句の内容は、「光束制御手段」に係り受けする直線部により既に実現されてしまった命題であり、波線部の記載をあえて入れたのは「反射手段」が全反射する対象としての「光束」について解釈上の疑義が生じないようにするための確認的なものに過ぎない。このため、格成分数を計算する際に、この波線部の記載をも同様にカウントすることになれば、下線部の内容を二重カウントすることになり測定精度の悪化を招く結果となる。   The wavy line portion of C-3) corresponds to the portion of “the luminous flux” in C-2). However, the content of the verb phrase described in this wavy line is a proposition that has already been realized by the straight line part that depends on the "light flux control means". This is merely a confirmation to prevent doubt about interpretation of the “light beam” as the object that the “means” totally reflects. For this reason, when the number of case components is calculated, if the description of the wavy line portion is also counted in the same manner, the content of the underlined portion is double counted, resulting in a deterioration in measurement accuracy.

このため、既に命題として実行済みの波線部の記載は、改めてカウントしないように留意することにより、クレームの記載順序や記載方法による格差に伴う格成分数のずれを解消することが可能となる。実際には、この直線部の記載と、波線部の記載とにより実現される命題が同一か否かを判断する必要がある。   For this reason, it is possible to eliminate the shift in the number of case components due to the difference in the description order and description method of the claims by taking care not to count the description of the wavy line already executed as a proposition. Actually, it is necessary to determine whether or not the proposition realized by the description of the straight line portion and the description of the wavy line portion is the same.

最小抽出単位を格成分とした数値化方法では、特に命題の同一性を判断する際において有用なものとなる。格成分は単語と異なり、動詞により支配される性質を持つため、格成分が同一であるということは、格成分の内容に加えてこれを支配する動詞も同一でなければならないことを意味している。格成分と、これを支配する動詞の双方が同一であれば、これにより実現される命題も同一となる。このため、格成分の同一性の判断を介して、命題が同一か否かを識別することが可能となり、ひいては二重カウントか否かを容易に識別することが可能となる。また、明細書作成者間の記載方法の相違により、得られる数値に影響が及ぶこともなくなる。   The numerical method using the minimum extraction unit as a case component is particularly useful when determining the identity of propositions. Case components, unlike words, have the property of being governed by verbs, so that the case components are the same means that in addition to the content of the case component, the verb that governs it must also be the same. Yes. If the case component and the verb that governs it are the same, then the proposition realized by this is the same. For this reason, it is possible to identify whether or not the propositions are the same through the determination of the identity of the case components, and thus it is possible to easily identify whether or not the proposition is a double count. Moreover, the difference in the description method between the specification creators does not affect the obtained numerical value.

なお、上述した例では、特許請求の範囲の記載が構成要件列挙型で記載されている場合を例にとり説明をしたが、他の形式で記載されていても同様にカウントすることができる。例えば、ジェプソン型で記載されていた場合には、公知部分とされる「おいて書き」の記載についても同様の方法によりカウントする。このとき、「おいて書き」の記載のカウント方法が分からない場合には、ジェプソン型から構成要件列挙型に書き換えた上でカウントするようにしてもよい。ちなみに、このジェプソン型から構成要件列挙型への書き換え方法は、従来から周知である。   In the above-described example, the case where the description of the claims is described in the component requirement enumeration type is described as an example. However, even if it is described in another format, it can be counted in the same manner. For example, in the case of being described in the Jepson type, the description of “writing”, which is a known part, is also counted by the same method. At this time, in the case where the counting method described in “note writing” is not known, counting may be performed after rewriting from the Jepson type to the component requirement enumeration type. Incidentally, the rewriting method from the Jepson type to the component requirement enumeration type is conventionally known.

また、特許請求の範囲が書き流し型で記載されていた場合も同様の手法によりカウントすることができる。例えば、C−2)が書き流し型で記載されていた場合には、以下のC−4)のようになる。   Further, even when the scope of claims is described in a flow-through type, it can be counted by the same method. For example, if C-2) is written in a flow-through style, it will be as shown in C-4) below.

C−4)「第1のレンズにより光束のスポット径を制御し、かかる光束を反射板により全反射し、〜」   C-4) "The spot diameter of the light beam is controlled by the first lens, and this light beam is totally reflected by the reflector.

この書き流し型で記載されたC−4)は、C−2)と比較して、「光束制御手段」並びに「反射手段」の文言が抜けている点が相違するが、それ以外は同一である。「光束制御手段」並びに「反射手段」は、主語であってこれをカウントの対象とせず、あくまでこの主語に係り受けする名詞句をカウントするため、書き流し型と構成要件列挙型との間で格成分数が異なることはない。   Compared to C-2), C-4) described in this flow-through type is different in that the words “light flux controlling means” and “reflecting means” are omitted, but the rest is the same. . “Flux control means” and “reflecting means” are subject words and are not counted, but only count noun phrases that depend on this subject. There is no difference in the number of components.

格成分の抽出プロセスCase component extraction process

格成分を抽出する際には、下記のプロセスに基づくものである。以下「カウント」と称しているものは、何れも格成分として抽出するという意味である。   The case component is extracted based on the following process. What is hereinafter referred to as “count” means that all are extracted as case components.

図3は、本発明を適用した格成分抽出プログラムのフローチャートを示している。このフローチャートでは、先ず前処理ステップS11において、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する。そして、この抽出した文字列に対して所定の前処理を実行する。   FIG. 3 shows a flowchart of a case component extraction program to which the present invention is applied. In this flowchart, first, in pre-processing step S11, a character string is extracted from the description of the claims in the patent specification converted into electronic data. Then, predetermined preprocessing is performed on the extracted character string.

この前処理では、先ず文字列中の括弧に括られた部分が存在する場合にはこれを削除する。つまり、文字列中において「第1のレンズにより光束のスポット径(φ)を制御する光束制御手段と、」との記載があった場合には、その後の格成分抽出の便宜の観点から、この括弧で括られた「(φ)」を削除する。ちなみに、文字列中において括弧で括られた部分が存在しない場合には、当該プロセスを省略する。   In this preprocessing, first, if there is a part enclosed in parentheses in the character string, it is deleted. In other words, if there is a description in the character string “with the light beam control means for controlling the spot diameter (φ) of the light beam by the first lens”, for the convenience of subsequent case component extraction, Delete “(φ)” in parentheses. Incidentally, when there is no part enclosed in parentheses in the character string, the process is omitted.

次に、発明の名称に相当する文言の抽出を行う。このプロセスでは、文字列中の「〜を特徴とする」に続く文言を発明の名称とみなすようにする。例えば、文字列の語尾が「〜を特徴とする情報フィルタリング装置」で終わっていた場合には、その「〜を特徴とする」に続く「情報フィルタリング装置」を発明の名称とみなす処理を行う。   Next, the wording corresponding to the name of the invention is extracted. In this process, the word following “characterized by” in the character string is regarded as the name of the invention. For example, when the ending of the character string ends with “information filtering device characterized by”, a process is performed in which “information filtering device” following “characterized by” is regarded as the name of the invention.

それ以外の場合には、文字列の文末から逆向きに一単語ずつ確認して句読点或いは名詞以外の単語が出現するまでの部分を発明の名称とみなす処理を行う。例えば、語尾が「〜を備える車両」で終わっている場合には、その文字列の文末から一単語ずつ確認した場合に、「備える」という名詞以外の単語が出現する。この名詞以外の単語が出現する部分(車両)を発明の名称とみなす処理を行う。また、「〜が記録されている媒体」の場合には、その文字列の文末から一単語ずつ確認した場合に、「記録されている」という名詞以外の単語が出現する。この名詞以外の単語が出現する部分(媒体)を発明の名称とみなす処理を行う。   In other cases, a process is performed in which each word from the end of the character string is confirmed in the reverse direction until a word other than a punctuation mark or noun appears as the name of the invention. For example, in the case where the ending ends with “vehicle having“ ˜ ”, words other than the noun“ having ”appear when words are confirmed one by one from the end of the character string. A process (vehicle) in which a word other than the noun appears is regarded as the name of the invention. In addition, in the case of “medium on which is recorded”, words other than the noun “recorded” appear when words are confirmed one by one from the end of the character string. A portion (medium) where a word other than the noun appears is regarded as the name of the invention.

このとき、この前処理ステップS11では、認定した発明の名称と同一の文言を文字列中からサーチし、これを所定の文言(例えば「発明」等)に置き換えるようにしてもよい。これにより、発明の名称がある程度の文字数がある場合において、構文解析を行う上で確実に1つの名詞として判断されるように処理することが可能となる。なお、本発明では、電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出し、上記文字列中から少なくとも発明の名称を抽出するものであれば上述した方法に限定されるものではなく、他のいかなる方法に基づいて実行するようにしてもよい。なお、この前処理ステップS11は必須の工程ではなく、省略してもよい。   At this time, in this pre-processing step S11, it is possible to search the character string for the same word as the recognized invention name and replace it with a predetermined word (for example, “invention”). As a result, when the name of the invention has a certain number of characters, it is possible to process so as to be surely determined as one noun in the syntax analysis. Note that the present invention is limited to the above-described method as long as a character string is extracted from the description of the claims in the patent specification converted into electronic data, and at least the name of the invention is extracted from the character string. However, the present invention may be executed based on any other method. Note that this preprocessing step S11 is not an essential step and may be omitted.

前処理ステップS11を終了した後、単語包括化ステップS12へと移行する。この単語包括化ステップS12では、前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、単語に分解した上で、所定の文字列を一単語とする処理を行う。即ち、この単語包括化ステップS12では、後段における抽出処理を容易に行うことができるように、単語をまとめる処理を行う。   After preprocessing step S11 is completed, the process proceeds to word inclusion step S12. In this word inclusion step S12, the character string processed in the preprocessing step is subjected to morphological analysis and syntax analysis to be decomposed into words, and then processing is performed with a predetermined character string as one word. That is, in this word inclusion step S12, a process of grouping words is performed so that the extraction process in the subsequent stage can be easily performed.

この単語包括化ステップS12では、前処理ステップS11において処理された文字列を単語に分解した上で、名詞+名詞、名詞+「の」+名詞、名詞+「のうち」+名詞、名詞+「的・自在・可能」、名詞+「とする」、名詞+「により・によって」、「少なくとも」+数量表現、名詞+「する・できる・させる・される」等、格成分の抽出のために一単語とすべき単語(包括化単語)を一単語としてまとめる。また「前記」、「上記」、「該」、「当該」、連体詞(「この」、「その」、「あの」、「どの」の何れか)を後続の単語と一単語(包括化単語)としてまとめる処理を行う。また名詞+「の」+「形容詞」+名詞、名詞+「とする・に係る・に関する・における・となる・である」を一単語(包括化単語)としてまとめる処理を行う。更にこの単語包括化ステップS12では、「略」・「若干」・「順次」+名詞を一単語(包括化単語)にまとめる処理を行うようにしてもよい。
一般に自然言語処理により形態素解析を行った場合、単語は最小限の単位にまで分解される。しかし格成分の抽出においては、名詞+名詞等の包括化単語は一単語としてカウントすべきである。そこで、前述のような所定のルールに基づき、形態素解析により分解された最小単位の単語のうち、包括化単語を一単語としてまとめる処理が必要となる。この単語包括化ステップにより、形態素解析による単語の自動的な分解結果を用いても、格成分を高精度に抽出することが可能となる。
In this word inclusion step S12, the character string processed in the preprocessing step S11 is decomposed into words, and then noun + noun, noun + “no” + noun, noun + “no” + noun, noun + “ For extraction of case components such as "manual / free / possible", noun + "to", noun + "by", "at least" + quantity expression, noun + "to / can / do" Words that should be one word (inclusive word) are grouped as one word. In addition, “the above”, “above”, “the”, “the”, a conjunction (“this”, “that”, “that”, “which”) and the following word and one word (inclusive word) As a summary. In addition, a process of collecting nouns + “no” + “adjectives” + nouns and “nouns +“ becomes related to, related to, and related to ”as one word (inclusive word) is performed. Further, in this word inclusion step S12, a process of combining “abbreviated”, “slightly”, “sequential” + nouns into one word (inclusive word) may be performed.
In general, when morphological analysis is performed by natural language processing, words are decomposed into a minimum unit. However, in case component extraction, inclusive words such as nouns + nouns should be counted as one word. Therefore, based on the predetermined rule as described above, it is necessary to perform a process for collecting the comprehensive words as one word among the minimum unit words decomposed by the morphological analysis. With this word inclusion step, it is possible to extract the case components with high accuracy even using the automatic decomposition result of the words by morphological analysis.

上述した処理を行う上で、この単語包括化ステップS12では、いわゆる形態素解析の技術や構文解析の技術を適宜利用して行う。形態素とは、「自然言語において意味を持つ最小の単位」である。形態素解析とは、文を形態素の単位にまで分解することである。例えば、「太郎は昼ごはんを食べました」は以下の表2のような形態素に分解できる。   In performing the above-described processing, in the word inclusion step S12, so-called morpheme analysis technology and syntax analysis technology are appropriately used. A morpheme is “the smallest unit that has meaning in natural language”. Morphological analysis is the decomposition of sentences into morpheme units. For example, “Taro ate lunch” can be broken down into the morphemes shown in Table 2 below.

Figure 0006206874
Figure 0006206874

実用上の形態素解析の実態としては、自然言語処理においては本来の意味での「形態素」の単位まで分解すると、分析上有用な粒度より細かくなってしまう。このため、「粗い」単位の分解にとどめることが多い。例えば、上記の例では8の品詞に分解しているが、実際の解析では以下の表3のように3つの単位に分解するようにしてもよい。   As for the actual state of morphological analysis in practical use, in natural language processing, if the unit of “morpheme” in its original meaning is decomposed, the granularity becomes finer than that useful for analysis. For this reason, the resolution is often limited to “coarse” units. For example, although it is decomposed into 8 parts of speech in the above example, in actual analysis, it may be decomposed into 3 units as shown in Table 3 below.

Figure 0006206874
Figure 0006206874

一般的な形態素解析・構文解析のアウトプットは、こうした「文節」単位の粒度の情報と、各「文節」単位のブロックの中の細かい構造(たとえば「太郎(名詞) - は(係助詞)」)の2階層になっている(もしくは、そのように後から構成できる)ことが多い。   The output of general morpheme analysis / syntax analysis is the granularity information of each “clause” unit and the detailed structure in the block of each “clause” unit (for example, “Taro (noun)-is a (particle)”. ) In two layers (or can be configured later).

ちなみに、この「昼ごはん」は、少なくとも「昼」「ごはん」の二つの形態素、立場によっては「昼」「ご」「はん」の三つの形態素に分解できると考えうるが、実用上は「昼ごはん」以上に分解しない方が、抽出を行う上では好適である。   By the way, this "lunch rice" can be considered to be decomposed into at least two morphemes of "daytime" and "rice". In order to perform the extraction, it is preferable not to decompose more than “lunch”.

これらの形態素をどこまでまとめるかは、形態素解析技術を用いて自在に調整を行うことができるが、本発明では、これら形態素を、上述のように「太郎は」、「昼ごはんを」のように、名詞又は名詞句を単位としてまとめるように処理を行う。   The extent to which these morphemes are put together can be freely adjusted using morphological analysis technology. However, in the present invention, these morphemes are expressed as “Taro is” or “Lunch” as described above. , Process so that nouns or noun phrases are grouped as a unit.

また、この単語包括化ステップS12では、更に構文解析を行うようにしてもよい。上述した形態素解析の結果は、前後関係のみを持つ一次元的な単語の列である。この単語列を二次元的な「構文木」に組み立てるのが、構文解析である。   In this word inclusion step S12, further syntax analysis may be performed. The result of the morphological analysis described above is a one-dimensional word string having only context. Parsing this word string into a two-dimensional “syntax tree” is syntactic analysis.

構文木において、各単語は最大1つの「親」と0個以上の「子」を持つのが一般的である。ある単語の「親」とは、その単語が「係る」先である。「子」とは、その単語に係る単語のことである。例えば、「花子は赤い鞄を買った」の「鞄を」は「赤い」を子として持ち、「買った」を親として持つ。つまり「鞄を」に係るのが「赤い」であるから、「鞄を」にとって「赤い」は子である。また「鞄を」が係るのが「買った」であるから、「鞄を」にとって「買った」は親である。また、「買った」は、「鞄を」と「花子は」を子として持つ。結果として、この構文木は表4のように示すことが可能となる。   In a syntax tree, each word typically has at most one “parent” and zero or more “children”. The “parent” of a word is the destination of the word “related”. A “child” is a word related to the word. For example, “Hanako bought a red bag” has “Red” as a child and “Bought” as a parent. In other words, “red” is related to “鞄”, so “red” is a child for “鞄”. In addition, “buy” is related to “buy”, so “buy” is “parent” for “mochi”. In addition, “Bought” has “Maki” and “Hanako” as children. As a result, this syntax tree can be expressed as shown in Table 4.

Figure 0006206874
Figure 0006206874

上述した単語包括化ステップS12を終了させた後、名詞句抽出ステップS13へと移行する。この名詞句抽出ステップS13では、上述のごとき形態素解析、構文解析も必要に応じて利用するようにしてもよく、文字列中から名詞句を抽出していく。ちなみに、この名詞句は、名詞のみの場合も含む概念とする。文字列中から全ての名詞又は名詞句の抽出を完了した後、格成分抽出ステップS14へ移行する。   After finishing the word inclusion step S12 described above, the process proceeds to a noun phrase extraction step S13. In this noun phrase extraction step S13, morphological analysis and syntax analysis as described above may be used as necessary, and noun phrases are extracted from the character string. By the way, this noun phrase has a concept including only a noun. After completing the extraction of all nouns or noun phrases from the character string, the process proceeds to case component extraction step S14.

この格成分抽出ステップS14では、名詞句抽出ステップS13において抽出した名詞又は名詞句のうち、格成分に含まれないものにフラグを立てる。そして、フラグが立てられた名詞又は名詞句を除く名詞又は名詞句を上記格成分として抽出する。最後に、この抽出した格成分の合計をカウントし、これを格成分数として表示し、或いはこれを記憶する。
ちなみに本発明は、フラグを立てる代わりに、抽出すべき格成分から除外するための処理を行うものであればいかなる方法を用いてもよい。即ち、フラグを用いることは必須ではなく、抽出すべき格成分に含めるものと、除外するものを選別可能であればいかなる方法を用いてもよい。
In this case component extraction step S14, a flag is set for the noun or noun phrase extracted in the noun phrase extraction step S13, which is not included in the case component. And the noun or noun phrase except the noun or noun phrase for which the flag is set is extracted as the case component. Finally, the total of the extracted case components is counted and displayed as the number of case components or stored.
Incidentally, in the present invention, any method may be used as long as a process for excluding the case component to be extracted is performed instead of setting a flag. That is, it is not essential to use a flag, and any method may be used as long as it can be selected from what is included in the case component to be extracted and what is excluded.

以下、この格成分抽出ステップS14においてフラグを立てる対象について説明をする。   Hereinafter, the target for which the flag is set in the case component extraction step S14 will be described.

先ず、前処理ステップS11において抽出した発明の名称と同一の文言全てにフラグを立てる。これにより、この格成分抽出ステップS14では、発明の名称に相当する文言を、抽出すべき格成分から除外することが可能となる。なお、この発明の名称と同一の文言全てにフラグを立てることは必須ではなく、これにフラグを立てないルールとしてもよい。   First, flags are set for all of the same words as the name of the invention extracted in the preprocessing step S11. Thereby, in this case component extraction step S14, the wording corresponding to the name of the invention can be excluded from the case components to be extracted. It should be noted that it is not essential to flag all of the same words as the name of the present invention, and a rule that does not set a flag may be used.

格成分抽出ステップS14では、発明の名称と同一の文言が所定の文言に置き換えられている場合において、その置き換えた所定の文言に対してフラグを立てることとなる。   In the case component extraction step S14, when a wording identical to the name of the invention is replaced with a predetermined wording, a flag is set for the replaced predetermined wording.

また、格成分抽出ステップS14では、A、Bをそれぞれ名詞又は名詞句としたときに、AとBが択一的に定義されていた場合には、何れか一方のA、Bに対してフラグを立てるようにしてもよい。ここでAとBが択一的に定義されている場合とは、例えば、「AまたはB」「AもしくはB」等のように記載されている場合である。かかる場合にはAが名詞ならば、Aにフラグを立てる。また、Aが名詞でない場合であって、Bが名詞であればBにフラグを立てる。これにより、この格成分抽出ステップS14では、択一的記載となっている何れか一方の名詞又は名詞句を抽出すべき格成分から除外することが可能となる。   In case component extraction step S14, when A and B are nouns or noun phrases, respectively, if A and B are alternatively defined, a flag is set for one of A and B. You may make it stand. Here, the case where A and B are alternatively defined is a case where “A or B”, “A or B”, or the like is described, for example. In such a case, if A is a noun, flag A. If A is not a noun and B is a noun, a flag is set for B. Thereby, in this case component extraction step S14, any one of the nouns or noun phrases that are alternatively described can be excluded from the case components to be extracted.

また、格成分抽出ステップS14では、名詞+並列助詞(「か」、「や」の何れか)からなる文言に対してフラグを立てるようにしてもよい。例えば、「ロープや針金により」と記載されていた場合には、この名詞+並列助詞の組み合わせは、「ロープや」になる。これに対してフラグを立てる。このような「ロープや針金により」の記載からは、ロープとか針金のような、連結に必要な用具を例示列挙しているに過ぎないため、何れか一方の名詞又は名詞句を抽出すべき格成分から除外することとしている。   Further, in the case component extraction step S14, a flag may be set for a word composed of a noun and a parallel particle (either “ka” or “ya”). For example, in the case where “by rope or wire” is described, the combination of the noun and the parallel particle becomes “rope”. Flag this. Since the description of “by rope or wire” merely lists examples of tools necessary for connection, such as ropes and wires, one of the nouns or noun phrases should be extracted. It is supposed to be excluded from the ingredients.

発明の名称と同一の名詞句を除く名詞句のうち、このフラグを立てることにより、抽出すべき格成分から除外する処理動作は、以下の(1)〜(4)の「格成分数抽出基本ルール」に基づくものであってもよい。   Among the noun phrases excluding the same noun phrase as the name of the invention, by setting this flag, the processing operation to be excluded from the case components to be extracted is the “case component number extraction basic” of the following (1) to (4). It may be based on a “rule”.

(1)主語のルール
また格成分抽出ステップでは、構文解析の結果、抽出した文字列中に主語と動詞の関係が含まれていた場合であって、その主語に相当する文言が、その上段で既に記載されている場合には、当該主語に相当する文言に対してフラグを立てる。そして、その主語に相当する文言が、その上段で未だ記載されていない場合には、当該主語に相当する文言にフラグを立てないように処理する。以下の1)〜3)がその具体的な処理フローである。
(1) Subject rule In the case component extraction step, if the extracted character string contains a relationship between the subject and the verb as a result of syntactic analysis, the sentence corresponding to the subject is If already described, a flag is set for the word corresponding to the subject. If the word corresponding to the subject has not yet been described in the upper stage, processing is performed so as not to flag the word corresponding to the subject. The following 1) to 3) are specific processing flows.

1)構文解析を通じて先ず主語を先ず抽出する。「●●●が、」、「●●●は、」「●●●には、」「●●●も、」等となっているものを、主語とみなして全て抽出する。(このとき、●●●について「前記」「当該」「上記」等が付いていても付いていなくても一切関係なし)   1) First, the subject is first extracted through syntax analysis. "●●● is", "●●● is", "●●● is", "●●● is also", etc. are all regarded as the subject and extracted. (At this time, there is no relation to ●●● whether or not “previous”, “related” or “above” is attached)

2) 抽出した主語(●●●)が、それより以前に記載されているかをソートして確認する。その結果、抽出した主語(●●●)と100%一致するもの、或いはそれを一部含むものがあった場合、3)へ移行する。それ以外は、抽出した主語(●●●)が初めて登場したものであるから、その抽出した主語(●●●)を格成分として特定する。   2) Sort and confirm whether the extracted subject (●●●) is listed before that. As a result, if there is an object that matches 100% with the extracted subject (●●●) or includes a part thereof, the process proceeds to 3). Other than that, since the extracted subject (●●●) has appeared for the first time, the extracted subject (●●●) is specified as a case component.

3) 上記2)において3)に移行する場合に、その抽出した主語(●●●)にフラグを立てることにより、格成分としてカウントしない。   3) When shifting to 3) in 2) above, the extracted subject (●●●) is flagged so that it is not counted as a case component.

即ち、抽出した文字列中に「〜が」、「〜は」、「〜には」、「〜も」の何れかで定義される主語と、これに係り受けする動詞の関係が含まれているか否かをまず判断する。その結果、抽出した文字列中に主語と動詞の関係が含まれている場合には、その主語に相当する文言が、その上段で既に記載されているか否かを確認する。そしてその主語に相当する文言が、その上段で既に記載されている場合には、当該主語に相当する文言を抽出すべき格成分から除外し、その主語に相当する文言が、その上段で未だ記載されていない場合には、新たに登場したものであるから、当該主語に相当する文言を抽出すべき格成分に含める。   In other words, the extracted character string includes the relationship between the subject defined by any one of “to-ga”, “to-ha”, “to-to”, and “to-mo” and the verb depending on this subject. First, it is determined whether or not there is. As a result, when the extracted character string includes a relationship between the subject and the verb, it is confirmed whether or not the wording corresponding to the subject has already been described in the upper stage. If the word corresponding to the subject has already been described in the upper row, the word corresponding to the subject is excluded from the case components to be extracted, and the word corresponding to the subject is still written in the upper row. If not, since it has newly appeared, the word corresponding to the subject is included in the case component to be extracted.

これにより主語が多い特許請求の範囲の記載において、主語の数が多いほど格成分が多くなるという不合理を解消することが可能となる。   As a result, in the description of the claims having many subjects, it is possible to eliminate the unreasonable fact that the case components increase as the number of subjects increases.

(2)二重定義のルール
既に前段で定義された発明特定事項や、前段で定義されている処理動作について、後段で再度カウントすると二重カウントとなってしまう。このため後段ではカウントしないようにする。
(2) Double-defined rule If the invention-specific matters already defined in the previous stage or the processing operations defined in the previous stage are counted again in the subsequent stage, double counting will occur. For this reason, it is not counted in the subsequent stage.

(2−1) 「前記登録手段による登録」→前記登録手段は既に登録を行うというアクションが前段で終わっている場合、前記登録手段による登録とせずに、前記登録手段による登録とする。 (2-1) “Registration by the registration unit” → If the registration unit has already completed the action of performing registration , the registration unit does not register but the registration unit registers .

他の例)1回目で「そのキーを含むインデクスエントリ」が登場してきた→含む、が動詞であり、それぞれ分けて格成分をカウント。次に2回目で「そのキーを含むインデクスエントリ」が登場してきた→前回出てきたものを受けているため、分けてカウントせず、まとめて1格成分。 Another example) “ Index entry that includes the key ” appears at the first time. → Include is a verb, and each case component is counted separately. Next, “ index entry including the key ” has appeared for the second time → Since it received the previous one, it is not counted separately, but it is a single component.

(2−2) 「を作成するイメージ化手段と、前記イメージ化手段により作成されたAを〜」 (2-2) “Imaging means for creating A and A created by the imaging means

前記イメージ化手段により作成されたAを」については、純粋に格成分数をカウントしようとした場合に、「前記イメージ化手段により」の部分は、形態素「により」が存在するため、「前記イメージ化手段」は独立してカウントできる格成分数といえる。しかしながら、イメージ化手段によりAを作成するという命題は既に前段で実現されてしまっている。このため、「前記イメージ化手段」をもう一度ここでカウントしてしまうこととなれば、それはAを作成するという命題が再度実現されてしまうため、二重に命題を実現してしまうこととなる。命題の実現性に応じたパラメータとしての格成分数の趣旨から外れてしまうため、ここでは、「前記イメージ化手段により作成された」という文言を「Aを」に合体させて1格成分数とする。 As for “ A created by the imaging means” , when the number of case components is to be counted purely, the part “by the imaging means” has a morpheme “by”, The “imaging means” can be said to be the number of case components that can be counted independently. However, the proposition of creating A by the imaging means has already been realized in the previous stage. For this reason, if the “imaging means” is counted again here, the proposition of creating A is realized again, so that the proposition is realized twice. Since it deviates from the purpose of the number of case components as a parameter in accordance with the feasibility of the proposition, here, the word “created by the imaging means ” is combined with “A” to obtain the number of case components To do.

(2−3) 「印刷物の印刷枚数を算出する印刷枚数算出手段と、上記印刷枚数算出手段により算出された印刷枚数を〜」 (2-3) “ Number of printed sheets calculating means for calculating the number of printed sheets and the number of printed sheets calculated by the number of printed sheets calculating means”

上記印刷枚数算出手段により算出された印刷枚数を〜」については、純粋に格成分数をカウントしようとした場合に、「上記印刷枚数算出手段により」の部分は、形態素「により」が存在するため、「上記印刷枚数算出手段」は独立してカウントできる格成分数といえる。しかしながら、上記印刷枚数算出手段により印刷枚数を算出するという命題は既に前段で実現されてしまっている。このため、「上記印刷枚数算出手段」をもう一度ここでカウントしてしまうこととなれば、それは印刷枚数を算出するという命題が再度実現されてしまうため、二重に命題を実現してしまうこととなる。命題の実現性に応じたパラメータとしての格成分数の趣旨から外れてしまうため、ここでは、「上記印刷枚数算出手段により算出された」という文言を「印刷枚数を」に合体させて1格成分数とする。 As for “the number of printed sheets calculated by the above-mentioned number of printed sheets calculating means” , when the number of case components is to be counted purely, the part “by the number of printed sheet calculating means” has a morpheme “by”. Therefore, it can be said that “the number of printed sheets calculation means” is the number of case components that can be counted independently. However, the proposition of calculating the number of printed sheets by the printed number calculating means has already been realized in the previous stage. For this reason, if “the number of printed sheets calculation means” is counted again here, the proposition of calculating the number of printed sheets is realized again, so that the proposition is realized twice. Become. Since it deviates from the purpose of the number of case components as a parameter according to the feasibility of the proposition, here, the term “calculated by the above-mentioned number-of-print-number calculating means” is combined with “number of printed sheets” to obtain one case component It is a number.

(2−1)〜(2−3)において格成分としてカウントしないものについては、フラグを立てる処理を行うこととなる。   For those not counted as case components in (2-1) to (2-3), a process of setting a flag is performed.

また、この二重定義のルールは以下の処理動作に基づくものであってもよい。動詞が係り受ける主体を先ず特定し、次にその動詞の動作条件を満足する格成分を抽出する。   Further, this double definition rule may be based on the following processing operation. First, the subject on which the verb is involved is identified, and then the case component that satisfies the operation condition of the verb is extracted.

例えば、下記の文章の場合、以下のように、“動詞が係り受けする主体”、“動詞”、“格成分”が特定される。
「内燃機関の出力軸により出力される回転角度信号を検出する回転角度信号検出手段と」
For example, in the case of the following sentence, “subject to which the verb depends”, “verb”, and “case component” are specified as follows.
“Rotation angle signal detecting means for detecting a rotation angle signal output from the output shaft of the internal combustion engine”

Figure 0006206874
Figure 0006206874

このようなリストを順次作っておく。リストは作ることは必須ではなく、“動詞が係り受けする主体”、“動詞”、“格成分”のペアを記憶させるようにしてもよい。   Make a list like this one by one. It is not essential to create a list, and a pair of “subject subject to verb”, “verb”, and “case component” may be stored.

その後段で例えば、「前記回転角度信号検出手段により検出される回転角度信号に基づいて〜」、という文言が定義されていたものとする。   It is assumed that, for example, the phrase “based on the rotation angle signal detected by the rotation angle signal detection means” is defined in the subsequent stage.

“検出される”という動詞に係り受けする「前記回転角度信号検出手段」を格成分としてカウントするか否かの判断を以下のロジックで行う。   The following logic is used to determine whether or not the “rotation angle signal detecting means” that depends on the verb “detected” is counted as a case component.

「前記回転角度信号検出手段」、「検出する(される)」というペアは、以前記憶させておいたところと一致する。このため、これは既に実行されている命題であることからカウントしない。   The pair of “the rotation angle signal detecting means” and “detected (performed)” coincides with the previously stored pair. For this reason, this is not counted because it is a proposition already executed.

「〜検出される回転角度信号」は、「検出される」という動詞に係り受けしていない(逆に動詞によって修飾されている)ため、そもそも「検出される」という動詞との関係で格成分か否かの判定は行うまでもなく、素直に格成分としてカウントする。 Since “~ rotation angle signal to be detected” does not depend on the verb “detected” (reversely modified by the verb), the case component is related to the verb “detected” in the first place. It is not necessary to determine whether or not, and it is counted as a case component.

このように、“動詞が係り受けする主体”、“動詞”、“格成分”のペアを記憶しておき、“動詞”に対して、これらの、“動詞が係り受けする主体”、“格成分”が係り受けするものが後段で出てきた場合には、二重定義としてカウントしないようにする。   In this way, a pair of “subject to which the verb is dependent”, “verb”, and “case component” are stored, and for the “verb”, these “subject to which the verb is dependent”, “case” If a component that depends on the component comes out later, it is not counted as a double definition.

例1 p2000-196550の請求項1
「駆動源として内燃機関を搭載した車両において、車両の車速を検出する車速検出手段と、運転者により操作される車両の制動装置に対する操作入力の状態を検出する制動操作検出手段と、内燃機関の排気経路から排ガスの一部を吸気管内に還流させる排ガス還流手段と、前記車速検出手段により検出された車速に基づいて車両が停止状態にあると認められたとき、前記排ガス還流手段により吸気管内に排ガスを還流させるとともに、この停止状態において前記制動操作検出手段により前記操作入力の解除が検出されたとき、前記排ガス還流手段による排ガスの還流量を低減させる制御手段とを具備したことを特徴とする車両用内燃機関の制御装置。」
この場合、下記のリストができる。
Example 1 Claim 1 of p2000-196550
“In a vehicle equipped with an internal combustion engine as a drive source, vehicle speed detection means for detecting the vehicle speed of the vehicle, braking operation detection means for detecting the state of an operation input to the braking device of the vehicle operated by the driver, Exhaust gas recirculation means for recirculating part of the exhaust gas from the exhaust path into the intake pipe, and when the vehicle is found to be stopped based on the vehicle speed detected by the vehicle speed detection means, And a control means for reducing the amount of exhaust gas recirculated by the exhaust gas recirculation means when the braking operation detection means detects the release of the operation input in the stopped state. Control device for internal combustion engine for vehicle. "
In this case, the following list can be created.

Figure 0006206874
Figure 0006206874

例えば、6の「前記車速検出手段により検出された車速に基づいて」は、“前記車速検出手段により”は、“検出された”という動詞との関係で、すでに既に2で実行されているため、格成分としてはカウントしない。   For example, “based on the vehicle speed detected by the vehicle speed detecting means” of 6 is already executed in 2 because “by the vehicle speed detecting means” is related to the verb “detected”. It is not counted as a case component.

8の「前記排ガス還流手段により吸気管内に排ガスを還流させる」は、“前記排ガス還流手段により”、“吸気管内に”は“還流させる”という動詞の関係で、既に5で実現されているためカウントしない、“排ガス”は、“還流させる”という動詞の関係で、初めて出てきたため1格成分としてカウントする。   No. 8 “recirculate exhaust gas into the intake pipe by the exhaust gas recirculation means” has already been realized in 5 because of the verb relationship “by the exhaust gas recirculation means” and “in the intake pipe” “recirculate”. The “exhaust gas” that is not counted is counted as a first-order component because it has come out for the first time because of the verb “recirculate”.

このように、既に実行されたか否かのチェックは、“動詞”と“動詞が係り受けする主体”のペアのみに着目すればよいというわけではなく、“動詞”と“格成分”のペアについても着目する。   Thus, checking whether or not it has already been executed is not limited to focusing only on the “verb” and “subject subject”, but on the “verb” and “case component” pair. Also pay attention.

9「前記制動操作検出手段により前記操作入力の解除が検出された」については、“制動操作検出手段により”、“検出された”は、4の条件を満たすためカウントしない。操作入力の解除は初めて出てくる。(前記操作入力の解除が)を格成分としてカウントする。   9 “Release of the operation input is detected by the braking operation detection means”, “by the braking operation detection means” and “detected” satisfy the condition of 4 and are not counted. Canceling operation input appears for the first time. (The release of the operation input) is counted as a case component.

ポイントは、この抽出の過程でリストを参照する際に、リストに記述されている動詞について能動態と受動態の変更がありえることは考慮に入れなければならない。   The point is that when referencing the list during this extraction process, it should be taken into account that active and passive changes can be made to the verbs described in the list.

例2 P2000-258811の請求項1
「それぞれが異なる解像度を有する複数種類のプリンタを制御するプリンタ制御装置において,複数の画像の中からプリントすべき画像を選択する画像選択手段,上記画像選択手段によって選択された画像の画素数と上記解像度とにもとづいて,上記複数種類のプリンタの中から使用すべきプリンタを決定するプリンタ決定手段,および上記プリンタ決定手段によって決定されたプリンタに,上記画像選択手段によって選択された画像を表す画像データを送信する送信手段,を備えたプリンタ制御装置。」
Example 2 Claim 1 of P2000-258811
“In a printer control apparatus for controlling a plurality of types of printers each having a different resolution, an image selection means for selecting an image to be printed from a plurality of images, the number of pixels of the image selected by the image selection means, and the above Based on the resolution, printer determination means for determining a printer to be used from among the plurality of types of printers, and image data representing the image selected by the image selection means to the printer determined by the printer determination means A printer control device having transmission means for transmitting the

この場合、下記のリストができる。   In this case, the following list can be created.

Figure 0006206874
Figure 0006206874

4の「上記画像選択手段によって選択された画像の画素数」は、「選択する」という動詞に対する「上記画像選択手段」というペアが3にあるため、既に実行されている。   The “number of pixels of the image selected by the image selection means” of 4 is already executed because there is a pair of “the image selection means” for the verb “select”.

同様に6の「上記プリンタ決定手段によって決定されたプリンタに」は、「決定する」という動詞に対して「記プリンタ決定手段によって」というペアが5にあるため、既に実行されている。   Similarly, “to the printer determined by the printer determination unit” of 6 is already executed because there is a pair “by the printer determination unit” for the verb “determined”.

また7の「上記画像選択手段によって選択された画像」は、「選択する」という動詞に対する「上記画像選択手段」というペアが3にあるため、既に実行されている。   In addition, “the image selected by the image selection unit” of 7 is already executed because there is a pair “image selection unit” for the verb “select”.

既に実行されているものは格成分としてカウントしないようにする。   What has already been executed is not counted as a case component.

つまり、この二重定義のルールでは、結局のところ以下のアルゴリズムに基づき、抽出すべき格成分に含めるか、除外するかの判断を行っている。   That is, in this double definition rule, after all, based on the following algorithm, it is determined whether to include or exclude from case components to be extracted.

(2−4)工程1

Figure 0006206874
動詞をベースにして、これに係り受けする格成分と、その動詞が係り受けする主体を特定する。次に、上段に同一の動詞(能動態と受動態の違いはあるにしても)があるか否かをチェックする。その結果、上段に同一の動詞が無い場合は、特に二重定義のチェックは行わない。これに対して、上段に同一の動詞がある場合には、以下の工程2へと移行する。 (2-4) Step 1
Figure 0006206874
Based on the verb, the case component that depends on this and the subject that the verb depends on are specified. Next, it is checked whether or not there is the same verb (even if there is a difference between active and passive) in the upper row. As a result, if there is no identical verb in the upper row, no double definition check is performed. On the other hand, when there is the same verb in the upper stage, the process proceeds to the following step 2.

(2−5)工程2   (2-5) Step 2

Figure 0006206874
Figure 0006206874

個々の動詞について、動詞が係り受けする主体、格成分との間での同一性の判定を行う。上記は、最初に出てきた同一の動詞(5番)に関する“動詞が係り受けする主体”及び“格成分”と、後から出てきた同一の動詞(8番)に関する格成分との間で同一性を判定する例である。   For each verb, the identity of the subject and case component to which the verb depends is determined. The above is between the “subject to which the verb depends” and “case component” related to the same verb (number 5) that appears first, and the case component related to the same verb (number 8) that appears later. It is an example which determines identity.

(2−6)工程3   (2-6) Step 3

最初に出てきた同一の動詞に関する“動詞が係り受けする主体”及び“格成分”と、後から出てきた同一の動詞に関する格成分との間で同一のものがあった場合には、後から出てきた同一の動詞の格成分を、格成分とみなさない(既に上段で命題が実行されてしまっているため)。実際に格成分とみなさないものについてはフラグを立てることにより、これを特定する。   If there is the same thing between the “subject subject to the verb” and the “case component” for the same verb that appears first, and the case component for the same verb that appears later, The case component of the same verb that comes from is not considered a case component (because the proposition has already been executed in the upper row). Those that are not actually regarded as case components are identified by setting a flag.

Figure 0006206874
Figure 0006206874

以上の処理動作を、他の全ての動詞についても同様に行っていく。   The above processing operation is similarly performed for all other verbs.

つまり、アルゴリズムとしては、順次動詞を拾っていく。拾った動詞が、既に以前に登場しているかチェックする。登場していたら、最初に出てきた同一の動詞に関する“動詞が係り受けする主体”及び“格成分”と、後から出てきた同一の動詞に関する格成分との間で同一性を判定する。判定した結果、同一のものが出てきたら、後から出てきた同一の動詞の格成分を、格成分とみなさない。   In other words, the algorithm picks up verbs sequentially. Check if the picked-up verb has already appeared before. If it appears, the identity is determined between the “subject subject to the verb” and the “case component” relating to the same verb appearing first and the case component relating to the same verb appearing later. As a result of the determination, if the same thing appears, the case component of the same verb that comes out later is not regarded as the case component.

このとき、以下の工程を通じて実現するようにしてもよい。   At this time, it may be realized through the following steps.

動詞を順次抽出し、抽出した動詞が、その上段で既に定義されているか識別を行う識別工程。識別工程における識別の結果、当該抽出した動詞が、その上段で既に定義されていた旨を識別した場合には、その上段で既に定義されている動詞に係り受けする名詞又は名詞句、並びにその上段で既に定義されている動詞が係り受けする主体を示す名詞又は名詞句を特定する特定工程。特定工程において特定した名詞又は名詞句と、当該抽出した動詞に係り受けする名詞又は名詞句との間で同一性を判定する同一性判定工程。当該抽出した動詞に係り受けする名詞又は名詞句のうち、上記同一性判定工程において同一と判定されたものについては、フラグを立てることにより抽出すべき格成分から除外する除外処理工程。   An identification step of sequentially extracting verbs and identifying whether the extracted verbs are already defined in the upper stage. As a result of identification in the identification process, when it is identified that the extracted verb has already been defined in the upper stage, the noun or noun phrase that depends on the verb already defined in the upper stage, and the upper stage A specifying step of specifying a noun or a noun phrase indicating a subject on which a verb already defined in (2) depends. An identity determination step of determining identity between the noun or noun phrase specified in the specifying step and the noun or noun phrase that depends on the extracted verb. Of the nouns or noun phrases that depend on the extracted verb, those that are determined to be the same in the identity determination step are excluded from the case components to be extracted by setting a flag.

また、識別工程では、形態素で結ばれた複数の名詞又は名詞句からなる文言を順次抽出し、上記抽出した文言がその上段で既に定義されているか識別を行うようにしてもよい。そして、除外処理工程では、識別工程における識別の結果、当該抽出した文言が、その上段で既に定義されていた旨を識別した場合には、当該抽出した文言を抽出すべき格成分から除外するようにするためにフラグを立てるようにしてもよい。   In the identification step, words composed of a plurality of nouns or noun phrases connected by morphemes may be sequentially extracted to identify whether the extracted words are already defined in the upper stage. Then, in the exclusion processing step, when the extracted wording is identified as a result of the identification in the identification step, the extracted wording is excluded from the case components to be extracted. A flag may be set to

例えば、「マルチコントロールユニットとの接続時に・・・・・・」とあった場合には、初回は、下線部を格成分として抽出する。また、同じ請求項において、「上記マルチコントロールユニットとの接続時に・・・」と2回目以降で同一の文言が現れた場合、2回目以降は、二重カウントを避けるためにこれらをまとめて1格成分とするか、或いは、これらを格成分として抽出しないように処理動作を行う。 For example, when “ when connected to the multi-control unit ...” Is displayed, the underlined portion is extracted as a case component for the first time. Further, in the same claim, if the same wording appears after the second time, " When connected to the multi-control unit ...", after the second time, these are collectively 1 to avoid double counting. The processing operation is performed so as not to extract the case components as case components.

即ち、「名詞又は名詞句」+「形態素」+「名詞又は名詞句」についても同様に、二重定義となっていないかチェックを行う。   That is, “noun or noun phrase” + “morpheme” + “noun or noun phrase” is also checked for double definition.

(3)方法の発明の格成分除外
(3-1) 物の発明のパターン
全く同一の発明を書き流し方式と、要件列挙方式とで定義すると下記になる。
・書き流し方式
〜A〜Bが配設され、
このBからなるが接続され、
上記が取り付けられてなること
を特徴とする装置」
=7格成分数

・要件列挙方式
「〜Aと、
上記Aに配設された〜Bと、
上記Bに接続された、からなるCと、
上記Cに取り付けられたDとを備えること
を特徴とする装置」
4格成分数 (構成要素を入れると8格成分数)
(3) Case component exclusion of method invention (3-1) Product invention pattern Exactly the same invention is defined by a writing method and a requirement enumeration method as follows.
・ Writing method " ~ B is arranged in ~ A ,
C consisting of this B are connected,
Device characterized in that D is attached to C above "
= 7 case components

・ Requirement enumeration method
~ B arranged in A above ;
Connected to said B, a C consisting of,
A device characterized by comprising D attached to C above "
Number of 4th grade components (8th grade components with components)

要件列挙方式のように、構成要素をカウントしない場合、下線の格成分数は、それぞれの構成要素が実現しようとする命題実現に必要な条件数になる。書き流し方式では、下線の格成分数は、発明の名称(装置)で実現しようとする命題に必要な条件数となる。   When the constituent elements are not counted as in the requirement enumeration method, the number of underlined case components is the number of conditions necessary for realizing the proposition to be realized by each constituent element. In the writing system, the number of case components underlined is the number of conditions necessary for the proposition to be realized with the title (device) of the invention.

要件列挙方式においても、求めようとする格成分数の命題実現対象は、構成要素ではなく、究極的にはやはり装置になる。つまり、要件列挙方式において、装置は、A、B、C,Dを備える。そして、各A、B、C、Dがそれぞれの命題を実現する、と考えればよい。「装置は、A、B、C,Dを備える。」と定義したときに、ちょうどA、B、C,Dが「装置」という主語が「備える」という命題を実現する上で必要な条件となるため、格成分となる。   Even in the requirement enumeration method, the proposition realization target of the number of case components to be obtained is not a component but ultimately a device. That is, in the requirement enumeration method, the device includes A, B, C, and D. Then, it can be considered that each of A, B, C, and D realizes each proposition. When it is defined that “a device includes A, B, C, and D”, the conditions necessary for realizing the proposition that A, B, C, and D are “provided” by the subject “device” are as follows. Therefore, it becomes a case component.

このため、要件列挙方式でもそれぞれ構成要素を格成分としてカウントするとしても、論理的なつじつまは合う。また要件列挙方式と、書き流し方式の方式上の差異による格差も解消できる。   For this reason, even if it is a requirement enumeration method and each component is counted as a case component, it is logically consistent. In addition, the disparity due to the difference between the requirement enumeration method and the writing method can be eliminated.

(3-2) 方法の発明のパターン
・要件列挙方式
「〜A工程と、
上記A工程により製造されたを添加するB工程と、
上記B工程において得られたで加熱するC工程と、
上記C工程において加熱されたを抽出するD工程とを有すること
を特徴とする方法」
下線部:8 工程数:4 合計12
・書き流し方式
A工程により製造されたを添加し、
上記B工程において得られたで加熱し、
上記C工程において加熱されたを抽出すること
を特徴とする方法」
下線部:8 工程数:0 合計8
(3-2) Pattern / requirement enumeration system of method invention
B step of adding P to O produced by the above A step ;
C process of heating Q obtained in the B process with R ;
And a D step of extracting heated S in the C step.
Underlined part: 8 Number of steps: 4 Total 12
・ Writing system “ P is added to O manufactured by the A process ,
Q obtained in the above step B is heated with R ,
A method characterized by extracting S heated in the above-mentioned step C "
Underlined part: 8 Number of steps: 0 Total 8

構成要素(A〜D工程)は、単なる名前だけであり、特に発明特定事項の限定にはなっていない。構成要素を格成分に入れてしまうと帰って方式間の格差が目立ってしまう。   The constituent elements (steps A to D) are merely names, and are not particularly limited to the matters specifying the invention. If the component is put into the case component, the difference between the methods will be conspicuous.

上述した検討から、方法の発明において出てくる構成要素(工程やステップ)は格成分に含めないものとしてもよい。また、物の発明において出てくる構成要素を格成分に含めてカウントするようにしてもよい。   From the above-described examination, components (processes or steps) appearing in the method invention may not be included in the case components. Moreover, you may make it count by including the component which comes out in the invention of a thing in a case component.

ここで、方法の発明において出てくる構成要素(工程やステップ)は格成分から除外するための具体的なプロセスとしては、前処理ステップS11において発明の名称とみなした文言が「方法」を含むものである場合に、「〜ステップと(を)」、「〜段階と(を)」、「〜工程と(を)」、「機能と(を)」、「〜過程と(を)」、「〜処理と(を)」を抽出してこれらにフラグを立てる。これにより、方法の発明においては、これら工程等を格成分に含めないように処理することが可能となる。或いは、上記「と(を)」の代替として、「、」が打たれていた場合には、これにフラグを立てるようにしてもよい。或いは、「、」+「ステップ・段階・工程・機能・過程・処理」+「として」を抽出してこれにフラグを立てるようにしてもよい。   Here, as a specific process for excluding components (processes and steps) appearing in the invention of the method from the case components, the wording considered as the name of the invention in the preprocessing step S11 includes “method”. "~ Step and (O)", "~ Step and (O)", "~ Process and (O)", "Function and (O)", "~ Process and (O)", "~ Extract processing and ()) and flag them. Thereby, in the invention of the method, it is possible to perform processing so that these steps and the like are not included in the case components. Alternatively, as an alternative to the above “and ()”, if “,” is hit, a flag may be set. Alternatively, “,” + “step / stage / process / function / process / process” + “as” may be extracted and flagged.

(4)その他の格成分抽出ルール また、この格成分抽出ステップS14においては、名詞として抽出される「いずれか」又は「何れか」にフラグを立てるようにしてもよい。次に、当該「いずれか」又は「何れか」に直接係り受けする文言が複数存在する場合には、そのうち先行する名詞句について抽出すべき格成分から除外する。つまり、「A部材、B部材の何れかであること」と記載されていた場合には、その何れかに係り受けする名詞句が「A部材、B部材」であり、そのうち先行するA部材を抽出すべき格成分から除外するようにフラグを立てる。「いずれか」又は「何れか」にもフラグが立てられていることから、この例において格成分として抽出されるのは「B部材」のみとなる。しかし、トータルの格成分数は1となり、正確な書く成分抽出が実現されてくることとなる。
また、これ以後も、「いずれか」又は「何れか」に直接係り受けして、かつ先行する文言が名詞又は名詞句である毎にフラグを立てる処理を行っていく。
(4) Other Case Component Extraction Rules In this case component extraction step S14, a flag may be set for “any” or “any” extracted as a noun. Next, when there are a plurality of words that are directly related to “any” or “any”, the preceding noun phrase is excluded from the case components to be extracted. That is, when it is described as “A member or B member”, the noun phrase depending on any of them is “A member, B member”, of which the preceding A member is Flag to exclude from case components to be extracted. Since “any” or “any” is flagged, only “B member” is extracted as the case component in this example. However, the total number of case components is 1, and accurate writing component extraction is realized.
In addition, the process of setting a flag every time the preceding word is a noun or a noun phrase is directly performed on “any” or “any” and thereafter.

また、この格成分抽出ステップS14では、名詞+「的・自在・可能・不能・不可・よう」+(「な」・「に」・「の」・「と」)を含む名詞句、又はこれらの名詞句に平仮名が追加された文言にフラグを立てるようにしてもよい。   Further, in this case component extraction step S14, a noun phrase including a noun + “target / free / possible / impossible / impossible / you” + (“na”, “ni”, “no”, “to”), or these A flag may be set for a sentence in which hiragana is added to the noun phrase.

例えば、「収納自在に」、「嵌合可能な」、「摺動不能の」等の名詞句、文言に対してフラグを立てることにより、これらを格成分として抽出しないように処理することができる。   For example, by setting a flag for a noun phrase or wording such as “retractable”, “fitable”, “non-slidable”, etc., it can be processed so that these are not extracted as case components. .

格成分抽出ステップS14では、「名詞又は名詞句」+「A」+「名詞又は名詞句」からなる文言を抽出した場合において、A=「までの」、「への」、「との」、「にて」、「や」の何れかの場合には、この「A」によって隔てられる個々の「名詞又は名詞句」を別々に格成分として抽出する。また、A=「のうち」の場合には、この「A」によって隔てられる個々の「名詞又は名詞句」を1つの格成分として抽出する。フラグを立てて処理を行う場合には、Aの前後に位置する名詞又は名詞句にフラグを立てるようにしてもよい。これにより、例えば「認証カードとの整合性」や、「ユーザインターフェースまでの距離」等の文言があった場合には、これらを実質的に1つの格成分として抽出することが可能となる。   In the case component extraction step S14, when a word composed of “noun or noun phrase” + “A” + “noun or noun phrase” is extracted, A = “up to”, “to”, “to”, In either case of “de” or “ya”, individual “nouns or noun phrases” separated by “A” are extracted separately as case components. Further, when A = “out”, each “noun or noun phrase” separated by “A” is extracted as one case component. When processing is performed with a flag set, a flag may be set for nouns or noun phrases positioned before and after A. As a result, for example, when there are words such as “consistency with the authentication card” and “distance to the user interface”, these can be extracted substantially as one case component.

格成分抽出ステップS14では、「これ」、「それ」、「あれ」、「どれ」、「ここ」、「そこ」、「あそこ」、「どこ」の何れかからなる代名詞については、抽出すべき格成分に含めるようにしてもよい。つまり、これらの代名詞については、フラグを立てないように処理をするようにしてもよい。これらは、代名詞であっても、役割としては上述した格成分としての働きをするものであり、本来格成分に含めるべきものであるからである。これにより高精度な格成分抽出が可能となる。   In the case component extraction step S14, a pronoun consisting of any one of “this”, “it”, “that”, “which”, “here”, “there”, “that”, “where” should be extracted. It may be included in the case component. That is, these pronouns may be processed so as not to set a flag. This is because even if they are pronouns, they function as case components as described above, and should be included in case components. Thereby, case component extraction with high accuracy is possible.

これに対して、副詞(「こう」、「そう」、「ああ」、「どう」の何れか)、連体詞(「この」、「その」、「あの」、「どの」の何れか)を抽出すべき格成分から除外するようにしてもよい。   On the other hand, adverbs (“Kou”, “So”, “Oh”, “How”) and conjunctions (“Kon”, “That”, “That”, “Which”) are extracted. You may make it exclude from the case component which should be.

格成分抽出ステップS14では、動詞を「こと」につなげた、動詞の名詞形を格成分として抽出するようにしてもよい。つまり「動詞」+「こと」で表示される文言は、これのみで1格成分として抽出する。例えば、「操作されることに」→「操作される」は動詞だが、「こと」で一つの名詞句を構成する。名詞句は格成分になる。「経過したこと」は、名詞形であるため、カウントする。つまり、動詞を「こと」につなげた、動詞の名詞形を格成分として抽出する。   In the case component extraction step S14, the noun form of the verb in which the verb is connected to “koto” may be extracted as the case component. That is, the words displayed as “verb” + “that” are extracted as one case component only by this. For example, “to be operated” → “operated” is a verb, but “that” constitutes a noun phrase. Noun phrases become case components. “Elapsed” is a noun form and is counted. In other words, the noun form of the verb that connects the verb to “Koto” is extracted as a case component.

このようにして、抽出すべき格成分に含めるか否かを上述した所定のルールに適合するか否かで判断を行い、所定のルールに適合するものを格成分として抽出する処理を行っていく。   In this way, it is determined whether or not the case component to be extracted is included in the above-described predetermined rule, and processing for extracting a component that conforms to the predetermined rule as the case component is performed. .

また上述した格成分抽出ステップS14では、全てのルールを実行する場合に限定されるものではなく、任意の1つのルールを実行するものであってもよい。   Moreover, in case component extraction step S14 mentioned above, it is not limited to the case where all the rules are performed, Arbitrary one rule may be performed.

なお、格成分抽出ステップS14では、上記文字列中の「〜を特徴とする」における「特徴」を上記文字列から除いた名詞句から格成分抽出するようにしてもよい。換言すれば、「〜を特徴とする」における「特徴」は名詞ではあるが格成分として抽出しない。一方、必要に応じて、この「〜を特徴とする」における「特徴」を格成分として抽出するようにしてもよい。何れの抽出方針とすべきかはユーザ側において自由に設定することができることは勿論である。   In the case component extraction step S14, case components may be extracted from noun phrases obtained by removing “features” in “characteristic of” from the character string. In other words, the “feature” in “characterized by” is a noun but is not extracted as a case component. On the other hand, if necessary, the “feature” in “feature with” may be extracted as a case component. It goes without saying that which extraction policy should be set can be freely set on the user side.

概念階層特定のプロセス
本発明を適用した格成分抽出プログラムでは、更にステップS15において概念階層特定ステップを設けるようにしてもよい。この概念階層特定ステップにおける詳細なプロセスを以下説明する。
Concept hierarchy identification process In the case component extraction program to which the present invention is applied, a concept hierarchy identification step may be further provided in step S15. A detailed process in this concept hierarchy specifying step will be described below.

概念階層特定ステップS15では、名詞の概念が上位概念から下位概念まで階層化されて記憶されている概念辞書を参照する。   In the concept hierarchy specifying step S15, a concept dictionary in which noun concepts are stored in a hierarchy from a higher concept to a lower concept is referred to.

ここでいう上位概念とは、文言Aが、文言Bを含む、より一般的、より総称的、より抽象的なものを指すときをいう。下位概念とは、文言Bが、言葉Aの指すもののうち、より特定の、より個別の、より具体的な一部のものを指す。例えば図4(a)に示す弾性体の例でいえば、弾性体(文言A)は、バネ又はゴム(文言B)を含む、より一般的、より総称的、より抽象的なものを指しているため、弾性体は、バネ又はゴムに対する上位概念である。これに対して、バネ又はゴム(文言B)は、弾性体(文言A)の指すもののうちより特定の、より個別の、より具体的な一部のものを指している。このため、バネ又はゴムは、弾性体に対する上位概念であるといえる。   The superordinate concept here refers to the case where the word A indicates a more general, more generic, and more abstract thing including the word B. The subordinate concept refers to a part that is more specific, more individual, and more specific among those indicated by the word B. For example, in the example of the elastic body shown in FIG. 4A, the elastic body (word A) refers to a more general, more generic, more abstract material including a spring or rubber (word B). Therefore, an elastic body is a superordinate concept to a spring or rubber. On the other hand, the spring or rubber (word B) refers to a more specific, more specific, more specific part of the elastic body (word A). For this reason, it can be said that a spring or rubber is a superordinate concept to an elastic body.

同様に図4(b)に示すように通信装置は、携帯端末や固定電話の上位概念であるのに対して、携帯端末や固定電話は、通信装置の下位概念であるといえる。また、携帯端末は、スマートフォン、携帯電話、タブレット型端末に対する上位概念であるのに対して、スマートフォン、携帯電話、タブレット型端末は、携帯端末に対する下位概念である。   Similarly, as shown in FIG. 4B, a communication device is a superordinate concept of a mobile terminal or a fixed phone, whereas a mobile terminal or a fixed phone is a subordinate concept of a communication device. A mobile terminal is a superordinate concept for smartphones, mobile phones, and tablet terminals, while a smartphone, a mobile phone, and tablet terminals are subordinate concepts for mobile terminals.

このように概念辞書には、様々な文言が上位概念から下位概念に亘り整理されて記憶されている。このような概念辞書において、以下において上位概念から下位概念まで階層化されたものを概念階層という。   As described above, various words are arranged and stored in the concept dictionary from the upper concept to the lower concept. In such a concept dictionary, what is hierarchized from a superordinate concept to a subordinate concept is hereinafter referred to as a concept hierarchy.

図4(a)では、弾性体は、ゴムやバネよりも上位階層にあり、ゴムやバネや弾性体よりも下位階層となっている。図4(b)では、通信装置は、携帯端末や固定電話よりも上位階層にあり、携帯端末や固定電話は、通信装置よりも下位階層にある。また携帯端末は、スマートフォン、携帯電話、タブレット型端末よりも上位階層にあり、スマートフォン、携帯電話、タブレット型端末は、携帯端末よりも下位階層にある。   In FIG. 4A, the elastic body is in a higher hierarchy than the rubber or spring, and is in a lower hierarchy than the rubber, spring, or elastic body. In FIG. 4B, the communication device is in a higher hierarchy than the mobile terminal and the fixed phone, and the mobile terminal and fixed phone are in the lower hierarchy than the communication device. The mobile terminal is in a higher hierarchy than the smartphone, the mobile phone, and the tablet terminal, and the smartphone, the mobile phone, and the tablet terminal are in a lower hierarchy than the mobile terminal.

概念階層特定ステップS15では、格成分抽出ステップS14において抽出された各格成分に含まれる名詞の概念階層をそれぞれ特定する。例えば、「携帯端末から送信され」という文言を抽出した場合に、名詞句としての「携帯端末から」に含まれる名詞「携帯端末」がいかなる概念階層にあるかを上述した概念辞書を参照して識別する。仮に、「タブレット型端末から送信され」という文言が記載されていた場合には、名詞「タブレット型端末」の概念階層が概念辞書を参照して識別されるが、上述した「携帯端末」よりも下位階層であることが識別される。   In the concept hierarchy specifying step S15, the noun concept hierarchy included in each case component extracted in the case component extracting step S14 is specified. For example, when the phrase “sent from a mobile terminal” is extracted, refer to the conceptual dictionary described above for the conceptual hierarchy of the noun “mobile terminal” included in “from mobile terminal” as a noun phrase. Identify. If the phrase “sent from a tablet-type terminal” is described, the conceptual hierarchy of the noun “tablet-type terminal” is identified with reference to the concept dictionary. A lower hierarchy is identified.

なお、抽出した文言に含まれる全ての格成分の名詞の概念階層を特定する場合に限定されるものではなく、一部の格成分の名詞の概念階層を特定するものであってもよい。また、格成分の名詞が概念辞書に含まれていないものであれば、概念階層を特定しなくてもよいし、適当な概念階層を割り当てるようにしてもよい。   Note that the present invention is not limited to the case where the noun concept hierarchy of all case components included in the extracted wording is specified, and the noun concept hierarchy of some case components may be specified. Further, if the case component noun is not included in the concept dictionary, the concept hierarchy need not be specified, or an appropriate concept hierarchy may be assigned.

また、概念階層が定義された概念辞書は、公知のいかなるものを用いてもよい。   Any known dictionary in which the concept hierarchy is defined may be used.

概念階層特定ステップS15において、各格成分に含まれる名詞の概念階層をそれぞれ特定した後、後処理ステップS16へ移行する。   In the concept hierarchy specifying step S15, after specifying the concept hierarchy of the nouns included in each case component, the process proceeds to the post-processing step S16.

後処理ステップS16では、格成分抽出ステップS14により抽出された格成分の数と、概念階層特定ステップS15により特定された各格成分における名詞の概念階層とをそれぞれ出力又は記憶する。また、後処理ステップS16において、抽出された格成分の数と各格成分における名詞の概念階層とに基づいて評価値を算出するようにしてもよい。   In post-processing step S16, the number of case components extracted in case component extraction step S14 and the noun concept hierarchy of each case component specified in concept hierarchy specifying step S15 are output or stored. In post-processing step S16, the evaluation value may be calculated based on the number of extracted case components and the noun conceptual hierarchy in each case component.

評価値の算出は、説明変数として抽出された格成分の数と、各格成分における名詞の概念階層を利用するものであればいかなる方法に基づいて算出するようにしてもよい。また抽出した文言に含まれる全ての格成分の名詞の概念階層を説明変数に用いる場合に限定されるものではなく、一部の格成分の名詞の概念階層を説明変数に用いるものであってもよい。   The evaluation value may be calculated based on any method that uses the number of case components extracted as explanatory variables and the noun concept hierarchy of each case component. Also, it is not limited to using the concept hierarchy of all case component nouns included in the extracted wording as explanatory variables, but may use the concept hierarchy of some case component nouns as explanatory variables. Good.

評価値の算出時には、概念階層を数値化してこれを演算式に含めるようにしてもよい。例えば図5(a)では食物について、図5(b)では文具について、それぞれ上位概念から下位概念まで1〜3階層まで概念階層を記載した一例である。図5(a)に示すように、上位概念である1階層から下位概念である3階層まで、1階層が最も値が大きく、3階層が最も値が小さくなるように設定するようにしてもよいし、図5(b)に示すように1階層が最も値が小さく、3階層が最も値が大きくなるように設定するようにしてもよい。また実際に割り当てる値も上位階層から下位階層までの変化の割合はいかなるものであってもよい。   When calculating the evaluation value, the concept hierarchy may be digitized and included in the arithmetic expression. For example, FIG. 5 (a) is an example in which concept hierarchies are described from 1 to 3 from the upper concept to the lower concept for food and in FIG. As shown in FIG. 5 (a), it may be set such that the first hierarchy has the largest value and the third hierarchy has the smallest value from the first hierarchy that is the higher concept to the third hierarchy that is the lower concept. However, as shown in FIG. 5B, the value may be set so that the value is the smallest in the first layer and the value is largest in the third layer. Also, the actual allocation value may be any change rate from the upper layer to the lower layer.

このように抽出した文言に含まれる格成分の名詞の概念階層を数値化し、これに基づいて評価値を算出する。この評価値の算出時には、例えば、1つの請求項について、格成分数が24、抽出した文言に含まれる各格成分の名詞の概念階層平均が、2.1であればそれをそのまま出力して評価値として出力してもよい。また格成分数と各格成分の名詞の概念階層平均とをいかなる演算式に基づいて演算してそれを評価値として出力するようにしてもよい。   The concept hierarchy of nouns of case components included in the wording extracted in this way is digitized, and an evaluation value is calculated based on this. When calculating the evaluation value, for example, for one claim, if the number of case components is 24 and the conceptual hierarchy average of nouns of each case component included in the extracted wording is 2.1, output it as it is. You may output as an evaluation value. Further, the number of case components and the concept hierarchy average of nouns of each case component may be calculated based on any calculation formula and output as an evaluation value.

一般に上位概念になるほど特許の広さは広くなり、下位概念になるほど特許の広さは狭くなる。このため、概念階層がより上位になるにつれて評価値が高くなり、概念階層がより下位になるにつれて評価値が低くなるように算出するようにしてもよい。即ち、概念階層がより上位になるにつれて、より特許の広さが広くなるような評価値とし、概念階層がより下位になるにつれて、より特許の広さが狭くなるような評価値となるように算出する。   In general, the broader the concept, the wider the patent, and the lower the concept, the narrower the patent. For this reason, the evaluation value may be increased as the conceptual hierarchy becomes higher and the evaluation value may be reduced as the conceptual hierarchy becomes lower. That is, an evaluation value that broadens the patent as the concept hierarchy becomes higher, and an evaluation value that becomes narrower as the concept hierarchy becomes lower. calculate.

例えば、格成分数は、小さいほど権利が広くなり、大きいほど権利が狭くなる。このため、図5(b)に示すように上位概念ほど値を小さくなるようにし、下位概念ほど値を大きくなるようにする。そして格成分数と概念階層に割り振られた数値を例えば乗算することにより、その文法上の構造単位の大小関係と、それぞれの持つ名詞の概念階層の双方を考慮に入れ、特許の広さを評価することが可能となる。   For example, the smaller the number of case components, the wider the right, and the larger the number, the narrower the right. For this reason, as shown in FIG. 5B, the value is made smaller for the higher concept and the value is made larger by the lower concept. Then, by multiplying the number of case components and the numerical value assigned to the concept hierarchy, for example, the size of the grammatical structural units and the concept hierarchy of each noun are taken into account and the breadth of the patent is evaluated. It becomes possible to do.

表5の例に示すような文章「内燃機関の出力軸により出力される回転角度信号を検出する回転角度信号検出手段と」の場合、格成分中には、内燃機関、出力軸、回転角度信号といった名詞が含まれている。それぞれ内燃機関がいかなる概念階層に属するか、出力軸がいかなる概念階層に属するか等を特定していく。その結果、上位概念ほど点数が低くなるように割り当てるものとした場合、「内燃機関」は2点、「出力軸」は3点、「回転角度信号」は概念辞書に無いため、概念辞書の全階層の平均2.2点を割り当てることとする。   In the case of the sentence “with the rotation angle signal detecting means for detecting the rotation angle signal output from the output shaft of the internal combustion engine” as shown in the example of Table 5, the internal components, the output shaft, the rotation angle signal are included in the case components. The noun is included. It is specified what concept hierarchy the internal combustion engine belongs to, and what concept hierarchy the output shaft belongs to. As a result, when the higher concept is assigned so that the score is lower, the “internal combustion engine” has 2 points, the “output shaft” has 3 points, and the “rotation angle signal” does not exist in the concept dictionary. An average of 2.2 points in the hierarchy will be assigned.

「内燃機関の出力軸」は1格成分だが、内燃機関の2点と出力軸の3点の平均である2.5点を割り当て、「回転角度信号」には2.2点が割り当てる。このようにして各格成分をこれに含まれる名詞句毎に特定した概念階層に応じて重み付けをする。そして、その重み付けがなされた各格成分の総和に基づいて評価値を算出するようにしてもよい。上述の例では、合計点(4.7点)を評価値とすることができる。   The “output shaft of the internal combustion engine” is one component, but 2.5 points, which is the average of the two points of the internal combustion engine and the three points of the output shaft, is assigned, and 2.2 points are assigned to the “rotation angle signal”. In this way, each case component is weighted according to the concept hierarchy specified for each noun phrase contained therein. Then, the evaluation value may be calculated based on the sum of the weighted case components. In the above example, the total score (4.7 points) can be used as the evaluation value.

これを1請求項分について行うことで、1請求項全ての限定要素を文法上の構造単位の大小関係と、それぞれの持つ名詞の概念階層の双方を考慮に入れた特許の広さを求めることが可能となる。   By doing this for one claim, find the breadth of the patent taking into account both the grammatical structural unit size and the noun conceptual hierarchy of all the limiting elements in one claim. Is possible.

なお、重み付けの方法や、重み付けの度合、さらには重み付けした各格成分からどのようにして評価値を算出するかは、既存の統計分析技術も利用し、いかなるものとしてもよい。   Note that the weighting method, the degree of weighting, and how the evaluation value is calculated from each weighted case component may be any value using existing statistical analysis techniques.

なお、使用する概念辞書は、技術分野毎に名詞の概念が階層化されて記憶されたものを使用するようにしてもよい。特許明細書の記載は、技術分野毎にテクニカルタームが用いられる場合も多々あるため、技術分野毎に概念階層を予め整理して階層化されたものを用いる。そして抽出対象の特許明細書の技術分野に対応した概念辞書を参照する。このとき、特許明細書中の特許請求の範囲の欄に絞って予め整理してもよいし、実施の形態も含めた全文を対象に分析して整理してもよい。   Note that the concept dictionary to be used may be one in which noun concepts are stored in a hierarchy for each technical field. In the description of the patent specification, there are many cases where technical terms are used for each technical field, and therefore, a concept hierarchy is arranged in advance for each technical field. Then, a concept dictionary corresponding to the technical field of the patent specification to be extracted is referred to. At this time, it may be arranged in advance in the scope of the claims in the patent specification, or may be analyzed and arranged for the whole sentence including the embodiment.

例えば、格成分の抽出対象の特許が通信機器関連技術である場合には、当該技術分野についてそれぞれ概念階層化された概念辞書を参照する。当該概念辞書には、通信機器に応じた例えば図4(b)に示すような文言が階層化されている。これを利用することで、より精度の高い階層化を実現することができる。特に特許明細書は技術分野が少しでも異なればその明細書に使用される文言は全く異なる場合があるため、抽出対象の特許に見合った技術分野毎に整理された概念辞書を用いることが望ましい。   For example, when the patent from which the case component is to be extracted is a communication equipment related technology, the concept dictionary in which the technical field is hierarchized is referred to. In the concept dictionary, words as shown in FIG. 4B, for example, corresponding to communication devices are hierarchized. By using this, more accurate hierarchization can be realized. In particular, a patent specification may have a completely different terminology if the technical field is slightly different, so it is desirable to use a concept dictionary arranged for each technical field corresponding to the patent to be extracted.

また、各技術分野についてそれぞれ概念階層化された概念辞書は、当該技術分野毎にそれぞれ正規化されていてもよい。例えば、その技術分野を母集団とする過去の特許明細書の記載をテキストマイニング技術を利用して分析した場合、上位概念から下位概念に至るまで使用されている文言の統計的分布を求めることもできる。その分布に基づいて上位概念から下位概念に至るまで何らかの正規化処理を施し、これを評価値に反映させるようにしてもよい。正規化処理については、各技術分野の過去の母集団に基づくテキストマイニング分析を用いることで得られた分布に対して行うものであれば、いかなる公知の手法を用いるようにしてもよい。   Further, the concept dictionaries that are conceptually hierarchized for each technical field may be normalized for each technical field. For example, when the description of past patent specifications with the technical field as the population is analyzed using text mining technology, the statistical distribution of the words used from the superordinate concept to the subordinate concept may be obtained. it can. Based on the distribution, some normalization processing may be performed from the superordinate concept to the subordinate concept, and this may be reflected in the evaluation value. As for the normalization processing, any known method may be used as long as it is performed on the distribution obtained by using the text mining analysis based on the past population of each technical field.

また概念辞書は、本発明に係るプログラムに実装されている場合のみならず、ネットワークを介して新たに受信した概念辞書、又は他のソフトウェア或いは他のデータベースから新たに取得した概念辞書を使用するようにしてもよいことは勿論である。   The concept dictionary is not only implemented in the program according to the present invention, but also uses a concept dictionary newly received via a network, or a concept dictionary newly acquired from other software or another database. Of course, it may be.

上述したプロセスを通じて、文法上の構造単位の大小関係と、それぞれの持つ名詞の概念階層の双方を考慮に入れ、特許の広さを評価することが可能となる。   Through the process described above, it is possible to evaluate the breadth of patents by taking into account both the size relationship of structural units in the grammar and the concept hierarchy of each noun.

頻度ランク特定のプロセス
なお、本発明は、上述した実施の形態に限定されるものではない。上述した実施の形態においては、概念階層特定ステップS15の代替として、図6に示すように頻度ランク特定ステップS17を設けるようにしてもよい。
Frequency rank identification process The present invention is not limited to the above-described embodiment. In the above-described embodiment, as an alternative to the conceptual hierarchy specifying step S15, a frequency rank specifying step S17 may be provided as shown in FIG.

この頻度ランク特定ステップは、各格成分に含まれる名詞の頻度ランクをそれぞれ特定するものである。頻度ランクは、従来の特許群を母集団として予めその特許明細書の記載を分析することによる名詞の出現頻度に関する情報を得る。そして、その名詞の出現頻度に関する情報を参照して、格成分抽出ステップS14において抽出された各格成分に含まれる名詞の出願頻度のランクをそれぞれ特定する。   This frequency rank specifying step specifies the frequency ranks of nouns included in each case component. The frequency rank obtains information on the appearance frequency of nouns by analyzing the description of the patent specification in advance with a conventional patent group as a population. And the rank of the application frequency of the noun contained in each case component extracted in case component extraction step S14 is specified with reference to the information regarding the appearance frequency of the noun.

出現頻度のランクとは、ある期間において出願された特許群の各明細書中の文言(特許請求の範囲、明細書全文等、いかなる欄を対象に分析してもよい。)がどの程度の頻度で出現されているかを示すランクである。例えば、通信技術分野の特許を対象にした場合、個々の文言の「通信装置」は10万件、「携帯端末」は6万件、「タブレット型端末」は3万件出現していた場合、「通信装置」は最も出現頻度のランクが高く、その次に出現頻度のランクが高いのが「携帯端末」であり、最も出現頻度のランクが低いのは「タブレット型端末」となる。即ち、この出現頻度のランクとは出現頻度が多いほど高くなるものである。このような出現頻度を予め分析しておき、それぞれ出現頻度の高いものから低いものまでランク付けをしておく。このランク付けの階層数やランク付けのルールは、出現頻度に応じて階層化されることを前提として、いかなるルールに基づいて行うようにしてもよい。出現頻度の情報やそのランクは予めデータベース化され、プログラムにも附属させるようにしてもよい。   The rank of appearance frequency is the frequency of the wording in each specification of a patent group filed in a certain period (which may be analyzed for any column such as claims and full description). It is the rank which shows whether it has appeared in. For example, in the case of patents in the communication technology field, if there are 100,000 "communication devices", 60,000 "mobile terminals", and 30,000 "tablet terminals" in individual terms, The “communication device” has the highest appearance frequency rank, the next highest appearance frequency rank is the “mobile terminal”, and the lowest appearance frequency rank is the “tablet terminal”. That is, the rank of the appearance frequency is higher as the appearance frequency is higher. Such appearance frequencies are analyzed in advance, and the ranks are ranked from high to low. The number of ranks for ranking and the rules for ranking may be determined based on any rule on the assumption that the ranks are hierarchized according to the appearance frequency. Information on the appearance frequency and its rank may be stored in a database in advance and attached to the program.

即ち、この出現頻度ランクとしては、母集団中の多くの特許に出てくる文言は、母集団のなかで特徴的ではないと考えられる、document-frequencyの考え方に基づいて行う。つまり出現頻度(ランク)の高いものは、普段よく使用される文言であることからあまり特徴的でない一般用語を意味している。これに対して、出現頻度(ランク)の低いものは、明細書に使用される文言としては稀であり、その文言に限定するだけで特徴が出てくるものをいう。   In other words, the appearance frequency rank is based on the concept of document-frequency, which is considered to be uncharacteristic in the population, in terms of many patents in the population. In other words, a high appearance frequency (rank) means a general term that is not so characteristic because it is a commonly used word. On the other hand, those having a low appearance frequency (rank) are rare as words used in the specification, and are characterized only by being limited to the words.

即ち、document-frequencyの考え方に基づき、複数の特許の母集団中において出現頻度(ランク)の低い文言は、より限定された狭い概念になり、逆に出現頻度(ランク)の高い文言は、汎用化された用語でより広い概念となるものと考える。 頻度ランク特定ステップS17では、格成分抽出ステップS14において抽出された各格成分に含まれる名詞の出現頻度のランクをそれぞれ特定する。例えば、「携帯端末から送信され」という文言を抽出した場合に、名詞句としての「携帯端末から」に含まれる名詞「携帯端末」がいかなる出現頻度のランクにあるかを上述した名詞の出現頻度に関する情報を参照して識別する。仮に、「タブレット型端末から送信され」という文言が記載されていた場合には、名詞「タブレット型端末」の出現頻度のランクが出現頻度に関する情報を参照して識別されるが、上述した「携帯端末」よりも下位階層であることが識別される。換言すればタブレット型端末は、通信装置や携帯端末よりも特徴的であるため、その分において限定がかけられており、下位階層に位置する。   In other words, based on the concept of document-frequency, words with a low appearance frequency (rank) in a population of multiple patents become narrower and narrower concepts. Conversely, words with a high appearance frequency (rank) I think that it will be a broader concept in generalized terms. In the frequency rank specifying step S17, the rank of the appearance frequency of nouns included in each case component extracted in the case component extracting step S14 is specified. For example, when the phrase “sent from a mobile terminal” is extracted, the appearance frequency of the above-mentioned noun is the frequency of appearance of the noun “mobile terminal” included in “from the mobile terminal” as the noun phrase. Identify and refer to information about. If the phrase “sent from a tablet-type terminal” is described, the rank of the appearance frequency of the noun “tablet-type terminal” is identified with reference to the information on the appearance frequency. It is identified that it is lower than the “terminal”. In other words, since the tablet type terminal is more characteristic than the communication device and the portable terminal, it is limited in that amount and is located in the lower hierarchy.

なお、抽出した文言に含まれる全ての格成分の名詞の出現頻度のランクを特定する場合に限定されるものではなく、一部の格成分の名詞の出現頻度のランクを特定するものであってもよい。また、格成分の名詞が出現頻度の階層に含まれていないものであれば、出現頻度のランクを特定しなくてもよいし、適当な出現頻度のランクを割り当てるようにしてもよい。   In addition, it is not limited to specifying the ranks of appearance frequency of nouns of all case components included in the extracted wording, and is to specify the ranks of appearance frequency of nouns of some case components. Also good. Further, if the case component noun is not included in the appearance frequency hierarchy, the appearance frequency rank need not be specified, or a suitable appearance frequency rank may be assigned.

頻度ランク特定ステップS15において、各格成分に含まれる名詞の出現頻度のランクをそれぞれ特定した後、後処理ステップS16へ移行する。   In the frequency rank specifying step S15, the rank of the appearance frequency of nouns included in each case component is specified, and then the process proceeds to the post-processing step S16.

後処理ステップS16では、格成分抽出ステップS14により抽出された格成分の数と、頻度ランク特定ステップS15により特定された各格成分における名詞の出現頻度のランクとをそれぞれ出力又は記憶する。また、後処理ステップS16において、抽出された格成分の数と各格成分における名詞の出現頻度のランクとに基づいて評価値を算出するようにしてもよい。   In post-processing step S16, the number of case components extracted in case component extraction step S14 and the rank of appearance frequency of nouns in each case component specified in frequency rank specifying step S15 are output or stored. In post-processing step S16, the evaluation value may be calculated based on the number of extracted case components and the rank of the appearance frequency of nouns in each case component.

評価値の算出は、説明変数として抽出された格成分の数と、各格成分における名詞の出現頻度のランクを利用するものであればいかなる方法に基づいて算出するようにしてもよい。また抽出した文言に含まれる全ての格成分の名詞の出現頻度のランクを説明変数に用いる場合に限定されるものではなく、一部の格成分の名詞の出現頻度のランクを説明変数に用いるものであってもよい。   The evaluation value may be calculated based on any method that uses the number of case components extracted as explanatory variables and the rank of the appearance frequency of nouns in each case component. In addition, it is not limited to the case where the ranks of the appearance frequencies of all case components included in the extracted wording are used as explanatory variables, but the ranks of the appearance frequencies of some case components are used as explanatory variables. It may be.

評価値の算出時には、出現頻度のランクを数値化してこれを演算式に含めるようにしてもよい。出現頻度のランクは、高いほうから数値を高くしてもよいし、高いほうから数値を低く設定してもよい。また出現頻度のランクについて、実際に割り当てる値も上位階層から下位階層までの変化の割合はいかなるものであってもよい。   When calculating the evaluation value, the rank of the appearance frequency may be digitized and included in the arithmetic expression. As for the rank of appearance frequency, the numerical value may be set higher from the higher level, or the numerical value may be set lower from the higher level. Further, regarding the rank of appearance frequency, the actual allocation value may be any change rate from the upper layer to the lower layer.

このように抽出した文言に含まれる格成分の名詞の出現頻度のランクを数値化し、これに基づいて評価値を算出する。この評価値の算出時には、例えば、1つの請求項について、格成分数が24、抽出した文言に含まれる各格成分の名詞の出現頻度のランク平均が、2.1であればそれをそのまま出力して評価値として出力してもよい。また格成分数と各格成分の名詞の出現頻度のランク平均とをいかなる演算式に基づいて演算してそれを評価値として出力するようにしてもよい。   The rank of the appearance frequency of nouns of case components included in the wording extracted in this way is digitized, and the evaluation value is calculated based on this. When calculating the evaluation value, for example, for one claim, if the number of case components is 24 and the rank average of the appearance frequency of each case component included in the extracted wording is 2.1, it is output as it is. And may be output as an evaluation value. Further, the number of case components and the rank average of the appearance frequency of nouns of each case component may be calculated based on any calculation formula and output as an evaluation value.

この出現頻度が高いほど一般用語で限定度合いが低く、上位概念の用語に近くなるため特許の広さは広くなり、出現頻度が低いほど、より限定された特殊用語で限定度合いが高くなり、下位概念の用語に近くなり特許の広さは狭くなるものと仮定する。このため出現頻度のランクが高くなるにつれて特許の広さが広くなるように評価値を算出し、出現頻度のランクがより下位になるにつれて特許の広さが狭くなるように評価値を算出するようにしてもよい。   The higher the frequency of appearance, the lower the degree of limitation in general terms, and the closer the term of the higher concept, the broader the patent. The lower the frequency of appearance, the higher the degree of limitation with more limited special terms and the lower level. Suppose that it is close to the terminology of the concept and the breadth of the patent is narrowed. Therefore, the evaluation value is calculated so that the width of the patent becomes wider as the appearance frequency rank increases, and the evaluation value is calculated so that the width of the patent becomes narrower as the appearance frequency rank becomes lower. It may be.

またケースバイケースで、出現頻度のランクが高くなるにつれて特許の広さが狭くなるように評価値を算出し、出現頻度のランクがより下位になるにつれて特許の広さが広くなるように評価値を算出するようにしてもよい。   Also, on a case-by-case basis, the evaluation value is calculated so that the patent width becomes narrower as the appearance frequency rank becomes higher, and the patent value becomes wider as the appearance frequency rank becomes lower. May be calculated.

例えば、格成分数は、小さいほど権利が広くなり、大きいほど権利が狭くなる。このため、図5(b)に示すように出現頻度のランクが高いほど値を小さくなるようにし、出現頻度のランクが低いほど値を大きくなるようにする。そして格成分数と出現頻度のランクに割り振られた数値を例えば乗算することにより、その文法上の構造単位の大小関係と、それぞれの持つ名詞の概念の双方を考慮に入れ、特許の広さを評価することが可能となる。   For example, the smaller the number of case components, the wider the right, and the larger the number, the narrower the right. Therefore, as shown in FIG. 5B, the higher the appearance frequency rank, the smaller the value, and the lower the appearance frequency rank, the larger the value. And by multiplying the number of case components and the frequency assigned to the rank of appearance frequency, for example, taking into account both the size relationship of the structural units in the grammar and the concept of each noun, the breadth of the patent It becomes possible to evaluate.

表5の例に示すような文章「内燃機関の出力軸により出力される回転角度信号を検出する回転角度信号検出手段と」の場合、格成分中には、内燃機関、出力軸、回転角度信号といった名詞が含まれている。それぞれ内燃機関や出力軸等がいかなる出現頻度のランクの階層に属するかを特定していく。その結果、出現頻度のランクが高いほど点数が低くなるように割り当てるものとした場合、「内燃機関」は2点、「出力軸」は3点、「回転角度信号」は1.2点を割り当てることとする。   In the case of the sentence “with the rotation angle signal detecting means for detecting the rotation angle signal output from the output shaft of the internal combustion engine” as shown in the example of Table 5, the internal components, the output shaft, the rotation angle signal are included in the case components. The noun is included. It is specified which rank of appearance rank each internal combustion engine and output shaft belong to. As a result, if the higher the appearance frequency rank, the lower the score, the “internal combustion engine” is assigned 2 points, the “output shaft” is 3 points, and the “rotation angle signal” is 1.2 points. I will do it.

「内燃機関の出力軸」は1格成分だが、内燃機関の2点と出力軸の3点の平均である2.5点を割り当て、「回転角度信号」には1.2点が割り当てる。このようにして各格成分をこれに含まれる名詞句毎に特定した出現頻度のランクに応じて重み付けをする。そして、その重み付けがなされた各格成分の総和に基づいて評価値を算出するようにしてもよい。上述の例では、合計点(3.7点)を評価値とすることができる。   The “output shaft of the internal combustion engine” is one component, but 2.5 points, which is the average of the two points of the internal combustion engine and the three points of the output shaft, is assigned, and 1.2 points are assigned to the “rotation angle signal”. In this way, each case component is weighted according to the rank of appearance frequency specified for each noun phrase included therein. Then, the evaluation value may be calculated based on the sum of the weighted case components. In the above-described example, the total score (3.7 points) can be used as the evaluation value.

これを1請求項分について行うことで、1請求項全ての限定要素を文法上の構造単位の大小関係と、それぞれの持つ名詞の概念階層の双方を考慮に入れた特許の広さを求めることが可能となる。   By doing this for one claim, find the breadth of the patent taking into account both the grammatical structural unit size and the noun conceptual hierarchy of all the limiting elements in one claim. Is possible.

なお、重み付けの方法や、重み付けの度合、さらには重み付けした各格成分からどのようにして評価値を算出するかは、既存の統計分析技術も利用し、いかなるものとしてもよい。   Note that the weighting method, the degree of weighting, and how the evaluation value is calculated from each weighted case component may be any value using existing statistical analysis techniques.

なお、使用する出現頻度情報は、技術分野毎に名詞の出現頻度のランクが階層化されて記憶されたものを使用するようにしてもよい。特許明細書の記載は、技術分野毎にテクニカルタームが用いられる場合も多々あるため、技術分野毎に出現頻度のランクを予め統計処理も含めて整理して階層化されたものを用いる。そして抽出対象の特許明細書の技術分野に対応した出現頻度のランク情報を参照する。このとき、特許明細書中の特許請求の範囲の欄に絞って予め整理してもよいし、実施の形態も含めた全文を対象に分析して整理してもよい。   Note that the appearance frequency information to be used may be information in which ranks of appearance frequencies of nouns are stored in a hierarchical manner for each technical field. Since the technical specifications are often used for each technical field in the description of the patent specification, the ranks of appearance frequencies for each technical field are arranged in advance, including statistical processing, and hierarchized. Then, the rank information of the appearance frequency corresponding to the technical field of the patent specification to be extracted is referred to. At this time, it may be arranged in advance in the scope of the claims in the patent specification, or may be analyzed and arranged for the whole sentence including the embodiment.

例えば、格成分の抽出対象の特許が通信機器関連技術である場合には、当該技術分野についてそれぞれ出現頻度のランクが階層化された情報を参照する。当該出現頻度のランクに関する情報には、通信機器に応じた例えば図4(b)に示すような文言の出現頻度のランクが階層化されている。これを利用することで、より精度の高い階層化を実現することができる。特に特許明細書は技術分野が少しでも異なればその明細書に使用される文言は全く異なる場合があるため、抽出対象の特許に見合った技術分野毎に整理された出現頻度のランクの情報を用いることが望ましい。   For example, when the patent from which the case component is extracted is a communication device-related technology, the information in which the rank of the appearance frequency is hierarchized is referred to in the technical field. In the information regarding the rank of the appearance frequency, for example, the rank of the appearance frequency of words as shown in FIG. By using this, more accurate hierarchization can be realized. In particular, if a technical specification is slightly different in a technical field, the wording used in the specification may be completely different. Therefore, information on the rank of appearance frequency arranged for each technical field corresponding to the patent to be extracted is used. It is desirable.

また、各技術分野についてそれぞれ出現頻度のランクが階層化された情報は、当該技術分野毎にそれぞれ正規化されていてもよい。例えば、その技術分野を母集団とする過去の特許明細書の記載をテキストマイニング技術を利用して分析した場合、出現頻度のランク上位から下位に至るまでの統計的分布を求めることもできる。その分布に基づいて、出現頻度のランク上位から下位に至るまで何らかの正規化処理を施し、これを評価値に反映させるようにしてもよい。正規化処理については、各技術分野の過去の母集団に基づくテキストマイニング分析を用いることで得られた分布に対して行うものであれば、いかなる公知の手法を用いるようにしてもよい。 さらに本発明では、上述したように複数の特許の母集団の中から出現頻度を識別する場合のみならず、格成分の分析対象である1件の明細書の中から出現頻度を識別するようにしてもよい。分析対象の1件の特許明細書について、特許請求の範囲の記載や明細書全文の記載等からテキストマイニング分析を行う。これにより当該1件の特許明細書中で使われている文言の出現回数を求め、そこから出現頻度を求めることが可能となる。   In addition, information in which ranks of appearance frequencies are hierarchized for each technical field may be normalized for each technical field. For example, when the description of a past patent specification having the technical field as a population is analyzed using a text mining technique, a statistical distribution from the higher rank to the lower rank of the appearance frequency can be obtained. Based on the distribution, some normalization processing may be performed from the higher rank of the appearance frequency to the lower rank, and this may be reflected in the evaluation value. As for the normalization processing, any known method may be used as long as it is performed on the distribution obtained by using the text mining analysis based on the past population of each technical field. Furthermore, in the present invention, as described above, not only when the appearance frequency is identified from a plurality of patent populations, but also the appearance frequency is identified from one specification that is an analysis target of the case component. May be. Text mining analysis is performed on one patent specification to be analyzed based on the description of the claims and the description of the entire specification. As a result, the number of appearances of the wording used in the one patent specification can be obtained, and the appearance frequency can be obtained therefrom.

その結果、当該1件の特許明細書中において高頻度に出てくる文言は、当該特許では特徴的なものと考えることができる。一方、当該1件の特許明細書中において低頻度にしか出てこない文言は、当該特許では非特徴的なもので一般化された用語と考えることができる。このように、分析対象の1件の特許明細書のみに焦点を当てて、出現頻度ランクを作成する。そして、その作成した出現頻度ランクに基づいて、分析対象の特許請求の範囲の各格成分における名詞について、出現頻度のランクを特定する。以降のプロセスは、上述と同様である。   As a result, words frequently appearing in the one patent specification can be considered characteristic in the patent. On the other hand, a word that appears only infrequently in the one patent specification can be considered as a generalized term that is non-characteristic in the patent. In this way, the appearance frequency rank is created by focusing on only one patent specification to be analyzed. And the rank of appearance frequency is specified about the noun in each case component of the claim of analysis object based on the created appearance frequency rank. The subsequent processes are the same as described above.

即ち、この出現頻度ランクとしては、1件の特許明細書中において多く出てくる文言は、当該1件の特許明細書中において特徴的であると考えるterm-frequency の考え方に基づいて行う。つまり出現頻度(ランク)の高いものは、その特許にとっては特徴的であるものの、普段よく使用される文言ではないものと考える。これに対して、出現頻度(ランク)の低いものは、普段からよく使用される文言であり、汎用性が高いものと認識する。   In other words, as the appearance frequency rank, words frequently appearing in one patent specification are performed based on the term-frequency concept considered to be characteristic in the one patent specification. In other words, those with a high appearance frequency (rank) are characteristic to the patent, but are not commonly used words. On the other hand, those with a low appearance frequency (rank) are words that are frequently used and are recognized as being highly versatile.

即ち、term-frequencyの考え方に基づき、1件の特許明細書中において出現頻度(ランク)の低い文言は、あまり限定されていない広い概念になり、逆に出現頻度(ランク)の高い文言は、汎用化された用語でより広い概念となるものと考える。   That is, based on the term-frequency concept, words with low appearance frequency (rank) in one patent specification become a broad concept that is not so limited. Conversely, words with high appearance frequency (rank) are: Think of it as a broader term in generalized terms.

このterm-frequencyでは、出現頻度のランクが高くなるにつれて特許の広さが狭くなる用に評価値を算出し、出現頻度のランクがより下位になるにつれて特許の広さが広くなるように評価値を算出するようにしてもよい。   In this term-frequency, an evaluation value is calculated so that the patent width becomes narrower as the appearance frequency rank increases, and the patent value becomes wider as the appearance frequency rank becomes lower. May be calculated.

またケースバイケースで、出現頻度のランクが高くなるにつれて特許の広さが広くなるように評価値を算出し、出現頻度のランクがより下位になるにつれて特許の広さが狭くなるように評価値を算出するようにしてもよい。   In addition, on a case-by-case basis, the evaluation value is calculated so that the width of the patent increases as the appearance frequency rank increases, and the patent value decreases as the appearance frequency rank becomes lower. May be calculated.

更に本発明では、document-frequencyとterm-frequencyとを組み合わせて評価を行うようにしてもよい。かかる場合には、複数の特許を母集団として検出した出現頻度ランクと、分析対象の特許を対象にして検出した出現頻度ランクとに基づいて、評価値を算出することとなる。   Furthermore, in the present invention, evaluation may be performed by combining document-frequency and term-frequency. In such a case, the evaluation value is calculated based on the appearance frequency rank detected for a plurality of patents as a population and the appearance frequency rank detected for the analysis target patent.

なお、上述した出現頻度のランクの情報は、本発明に係るプログラムに実装されている場合のみならず、ネットワークを介して新たに受信したもの、又は他のソフトウェア或いは他のデータベースから新たに取得したものを使用するようにしてもよいことは勿論である。   Note that the rank information of the appearance frequency described above is not only implemented in the program according to the present invention, but also newly received from the network, newly acquired from other software or another database. Of course, it may be used.

上述したプロセスを通じて、文法上の構造単位の大小関係と、それぞれの持つ名詞の概念階層の双方を考慮に入れ、特許の広さを評価することが可能となる。   Through the process described above, it is possible to evaluate the breadth of patents by taking into account both the size relationship of structural units in the grammar and the concept hierarchy of each noun.

本発明の実施方法
本発明を実施する上で、パーソナルコンピュータ(PC)を利用し、これに読み込まれたプログラムに基づいて行う。
Implementation Method of the Present Invention In implementing the present invention, a personal computer (PC) is used and is performed based on a program loaded therein.

先ず、電子データ化された特許明細書の記載から、電子データ化された特許明細書における特定の欄(特許請求の範囲の記載)に記載されている文字列を抽出する。また、この特定の欄とは、特許請求の範囲の1請求項分に相当する。このとき、独立請求項(例えば請求項1)のみについて文字列を抽出するようにしてもよい。   First, a character string described in a specific column (description of claims) in a patent specification converted into electronic data is extracted from the description of the patent specification converted into electronic data. The specific column corresponds to one claim in the scope of claims. At this time, character strings may be extracted only for independent claims (for example, claim 1).

次に、抽出した文字列から上述したルールに基づいて格成分を抽出する。この抽出した格成分に基づいて格成分数を求めるようにしてもよい。格成分数とは、1請求項における格成分の数を意味している。メインクレームの場合は、そのメインクレームが定義されている請求項から抽出した文字列からそのまま格成分数をカウントすればよいが、サブクレームの場合には、そのサブクレームが定義されている請求項から抽出した文字列からそのまま格成分数をカウントするとともに、当該サブクレームが従属するメインの請求項の格成分数をこれに加算する。   Next, a case component is extracted from the extracted character string based on the above-described rules. The number of case components may be obtained based on the extracted case components. The number of case components means the number of case components in one claim. In the case of a main claim, the number of case components may be counted as it is from the character string extracted from the claim in which the main claim is defined. In the case of a sub claim, the claim in which the sub claim is defined. The number of case components is counted as it is from the character string extracted from, and the number of case components of the main claim on which the subclaim is dependent is added to this.

そして、カウントされた格成分数を、発明の限定度合いとして例えばディスプレイ等を介して表示する。   Then, the counted number of case components is displayed, for example, via a display or the like as the degree of limitation of the invention.

このとき、格成分の抽出は、表1に示すような形態素を目印にして行ってもよい。ちなみに、ここでいう表1はあくまで一例であり、他のいかなる形態素に基づいてカウントしてもよいことは勿論である。   At this time, the case component may be extracted using a morpheme as shown in Table 1 as a mark. Incidentally, Table 1 here is merely an example, and it is needless to say that counting may be performed based on any other morpheme.

また、格成分の抽出は、上述した格成分の抽出プロセスに基づいて行うようにしてもよい。   The case component may be extracted based on the case component extraction process described above.

このとき上記カウントは、抽出された文字列において互いに重複する動作が定義されている文言を抽出し、当該抽出した文言に含まれる重複の格成分数をカウントし、カウントされた総格成分数から重複の格成分数を減算した値を、発明の限定度合いとして表示するようにしてもよい。これは上述した二重カウントを考慮したものである。   At this time, the above-mentioned count extracts words that define overlapping actions in the extracted character string, counts the number of duplicate case components included in the extracted word, and counts the total number of case components counted You may make it display the value which subtracted the number of case components of duplication as a limitation degree of invention. This takes into account the double count described above.

また、本発明では、補正前の特許明細書における特定の欄に記載されている文字列を抽出し、更に補正後の特許明細書における特定の欄に記載されている文字列を抽出し、補正前の特許明細書から抽出された文字列、並びに補正後の特許明細書から抽出された文字列からそれぞれ総格成分数をカウントし、カウントされた補正前の特許明細書の総格成分数と、補正後の特許明細書の総格成分数との差分を求め、これを特許請求の範囲の上述したような補正度合として表示するようにしてもよい。   In the present invention, a character string described in a specific column in the patent specification before correction is extracted, and further a character string described in a specific column in the corrected patent specification is extracted and corrected. The total number of components is counted from the character string extracted from the previous patent specification and the character string extracted from the corrected patent specification, respectively. Alternatively, the difference from the total number of components of the corrected patent specification may be obtained and displayed as the correction degree as described above in the claims.

また、本発明は、上述した分析を行うプログラムがインストールされたPC等のような装置として具体化されていてもよいし、これらをPCに実行させるためのプログラム、又はこれが記録された記録媒体として具体化されていてもよい。   Further, the present invention may be embodied as a device such as a PC on which the above-described analysis program is installed, or a program for causing a PC to execute the program or a recording medium on which the program is recorded. It may be embodied.

また、本発明は、ネットワークシステムにおいて適用されるようにしてもよい。先ず、サーバー側において、特許明細書について格成分数を予め数値化したデータをサーバーに記憶させておく。そして、クライアント側から、所望の特許について格成分数の送信要求があった場合、当該特許の格成分数をサーバーから読み出し、これをネットワークを介してクライアント側に送るようにしてもよい。   Further, the present invention may be applied to a network system. First, on the server side, data obtained by previously digitizing the number of case components for the patent specification is stored in the server. When the client side requests the number of case components for a desired patent, the number of case components of the patent may be read from the server and sent to the client side via the network.

また、クライアント側から送信要求のあった特許について未だ格成分数が求められていない場合には、サーバーは当該要求を受けた特許について格成分数をカウントし、これをネットワークを介してクライアント側に送るようにしてもよい。   In addition, when the number of case components has not yet been obtained for the patent requested for transmission from the client side, the server counts the number of case components for the requested patent and sends this to the client side via the network. You may make it send.

格成分の抽出においては既存のあらゆるテキストマイニング技術、データマイニング技術、言語解析処理技術等を用いるようにしてもよい。そして、これらの技術を利用し、上述したルールに基づいて、分析対象の各文字列について、格成分に相当するか否かを判断し、最終的に1請求項分の格成分を特定する。そして、この特定した格成分の1請求項分の総数を求め、これを当該請求項の格成分数として出力する。   For extraction of case components, any existing text mining technology, data mining technology, language analysis processing technology, or the like may be used. Then, using these techniques, it is determined whether or not each character string to be analyzed corresponds to a case component based on the above-described rules, and finally case components for one claim are specified. Then, the total number of the specified case components for one claim is obtained, and this is output as the number of case components of the claim.

なお、本発明では、単に請求項毎の格成分数を出力するのみならず、この出力したデータを、パテントマップやグラフ、その他の評価値等、あらゆる情報に付加するようにしてもよい。   In the present invention, not only the number of case components for each claim but also the output data may be added to any information such as a patent map, a graph, and other evaluation values.

ちなみに、上述した格成分数の代替として下記計算式に基づく評価値を求め、これを出力又は記憶するようにしてもよい。
評価値={α−log(CN+β)}×γ
ここでα=3〜8
β=15〜25
γ=15〜40
Incidentally, an evaluation value based on the following calculation formula may be obtained as an alternative to the number of case components described above, and this may be output or stored.
Evaluation value = {α-log (CN + β)} × γ
Where α = 3-8
β = 15-25
γ = 15-40

ここで、上記計算式は、格成分数と特許の査定率との関係に基づきフィッティングすることで導出した。評価値が大きいほど、格成分数は小さく、技術範囲が広いことを意味する。これがTechnology Size(登録商標)という特許の評価値である。当該評価値(Technology Size(登録商標))は、特許の価値評価やマクロ分析において活用することができる。また、被引用数や閲覧請求数等、他の指標値と組み合わせて、総合的なスコアとして活用することもできる。   Here, the above formula was derived by fitting based on the relationship between the number of case components and the patent assessment rate. The larger the evaluation value, the smaller the number of case components and the wider the technical range. This is the evaluation value of the patent called Technology Size (registered trademark). The evaluation value (Technology Size (registered trademark)) can be used in patent value evaluation and macro analysis. It can also be used as a comprehensive score in combination with other index values such as the number of citations and the number of requests for browsing.

この評価値の算出は、格成分抽出ステップS14又は後処理ステップS16において実行する。つまり、上述した格成分数の代替として、上記評価値を出力、表示、送信等の各処理を行うようにしてもよい。   The evaluation value is calculated in the case component extraction step S14 or the post-processing step S16. That is, as an alternative to the number of case components described above, processing such as output, display, and transmission of the evaluation value may be performed.

また評価値について、更に概念階層特定ステップS15において抽出した文言に含まれる格成分の名詞の概念階層を数値化した場合には、これも上述した評価値の算出時に反映させることもできる。Technology Size(登録商標)は、大きいほど権利が広くなり、小さいほど権利が狭くなることを示すパラメータである。このため、図5(a)に示すように上位概念ほど値を小さくなるようにし、下位概念ほど値を大きくなるようにする。それを上述したTechnology Size(登録商標)に補正係数として反映させるようにしてもよい。いかなる係数や演算式とするかは、ユーザの方にて自由に設定するようにしてもよいし、或いはソフトウェアの製作者側が自由に設定するようにしてもよい。また概念階層に加え、出現頻度のランクについても同様に補正係数として反映させるようにしてもよい。   Further, regarding the evaluation value, if the concept hierarchy of the case component noun included in the word extracted in the concept hierarchy specifying step S15 is digitized, this can also be reflected when the evaluation value is calculated. Technology Size (registered trademark) is a parameter indicating that the larger the right, the wider the right, and the smaller, the narrower the right. For this reason, as shown in FIG. 5A, the value is made smaller for the higher concept and the value is made larger by the lower concept. You may make it reflect it as a correction coefficient in Technology Size (trademark) mentioned above. What coefficients and arithmetic expressions are used may be freely set by the user, or may be freely set by the software producer. In addition to the concept hierarchy, the rank of appearance frequency may be similarly reflected as a correction coefficient.

また、本発明では、請求項毎に特定した格成分を、画面上に表示し、又は印刷し、或いはデータ化するようにしてもよい。つまり、以下の実施例に示すように、請求項について特定した格成分を視覚的に把握可能なように下線やハイライト表示等を行うようにしてもよい。   In the present invention, the case component specified for each claim may be displayed on a screen, printed, or converted into data. That is, as shown in the following embodiments, underline and highlight display may be performed so that the case components specified for the claims can be visually grasped.

このように、本発明では、いずれの特許請求の範囲の記載においても、同様のルールで図示して表示等することが可能となる。このとき格成分数も同時に併記するようにしてもよい。   As described above, according to the present invention, it is possible to display and display in accordance with similar rules in any claims. At this time, the number of case components may be written at the same time.

なお、本発明は、特許明細書の特許請求の範囲の記載の格成分抽出に限定されるものではなく、他のいかなる書類についても同様の方法に基づいて格成分を抽出する際にも適用することができる。   Note that the present invention is not limited to the case component extraction described in the claims of the patent specification, and is applicable to the case component extraction for any other document based on the same method. be able to.

また、本発明は、日本語に限らず、英語を始め他の言語においても適用可能であることは勿論である。   Of course, the present invention is not limited to Japanese but can be applied to other languages including English.

Claims (31)

電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、
上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて、上記抽出した名詞句から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する格成分抽出ステップと、
名詞の概念が上位概念から下位概念まで階層化されて記憶されている概念辞書を参照して、上記格成分抽出ステップにおいて抽出された各格成分に含まれる名詞の概念階層をそれぞれ特定する概念階層特定ステップとをコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step,
A noun phrase extraction step for extracting a noun phrase from the character string including the word that has undergone the word inclusion step;
In the noun phrase extraction step, a case component extraction step for extracting a case component as a noun phrase required for realizing the action of a verb related to each component constituting the claim from the extracted noun phrase; and ,
A concept hierarchy that identifies the noun concept hierarchy included in each case component extracted in the case component extraction step with reference to a concept dictionary in which noun concepts are stored in a hierarchy from upper concepts to lower concepts. A case component extraction program that causes a computer to execute a specific step.
上記格成分抽出ステップにより抽出された格成分の数と、上記概念階層特定ステップにより特定された各格成分における名詞の概念階層とをそれぞれ出力又は記憶し、又は上記抽出された格成分の数と各格成分における名詞の概念階層とに基づいて算出した評価値を出力又は記憶する後処理ステップを更に有すること
を特徴とする請求項1記載の格成分抽出プログラム。
Output or store the number of case components extracted in the case component extraction step and the concept hierarchy of nouns in each case component specified in the concept layer specification step, respectively, or the number of case components extracted The case component extraction program according to claim 1, further comprising a post-processing step of outputting or storing an evaluation value calculated based on a noun conceptual hierarchy in each case component.
上記後処理ステップでは、上記概念階層がより上位になるにつれて、より特許の広さが広くなるような評価値とし、上記概念階層がより下位になるにつれて、より特許の広さが狭くなるような評価値となるように算出すること
を特徴とする請求項2記載の格成分抽出プログラム。
In the post-processing step, an evaluation value is set such that the breadth of the patent becomes wider as the concept hierarchy becomes higher, and the breadth of the patent becomes narrower as the concept hierarchy becomes lower. The case component extraction program according to claim 2, wherein the case component is calculated so as to be an evaluation value.
上記概念階層特定ステップでは、上記概念辞書が技術分野毎に名詞の概念が階層化されて記憶され、抽出対象の特許明細書の技術分野に対応した概念辞書を参照すること
を特徴とする請求項1〜3のうち何れか1項記載の格成分抽出プログラム。
In the concept hierarchy specifying step, the concept dictionary stores a concept of nouns hierarchically for each technical field, and refers to a concept dictionary corresponding to the technical field of the patent specification to be extracted. The case component extraction program of any one of 1-3.
上記概念階層特定ステップでは、上記概念階層が技術分野毎に正規化された概念辞書を使用すること
を特徴とする請求項4項記載の格成分抽出プログラム。
5. The case component extraction program according to claim 4, wherein the concept hierarchy specifying step uses a concept dictionary in which the concept hierarchy is normalized for each technical field.
上記後処理ステップでは、上記各格成分をこれに含まれる名詞句毎に特定した概念階層に応じて重み付けし、その重み付けがなされた上記各格成分の総和に基づいて上記評価値を算出すること
を特徴とする請求項2又は3記載の格成分抽出プログラム。
In the post-processing step, each case component is weighted according to a concept hierarchy specified for each noun phrase included therein, and the evaluation value is calculated based on a sum of the weighted case components. The case component extraction program according to claim 2 or 3.
概念階層特定ステップでは、ネットワークを介して新たに受信した上記概念辞書、又は他のソフトウェア或いは他のデータベースから新たに取得した概念辞書を使用すること
を特徴とする請求項1〜6のうち何れか1項記載の格成分抽出プログラム。
The concept hierarchy specifying step uses the concept dictionary newly received via the network, or a concept dictionary newly acquired from other software or another database. The case component extraction program according to item 1.
電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、
上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて、上記抽出した名詞句から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する格成分抽出ステップと、
従来の特許を母集団として予めその特許明細書の記載を分析することによる名詞の出現頻度に関する情報を参照して、上記格成分抽出ステップにおいて抽出された各格成分に含まれる名詞の出現頻度のランクをそれぞれ特定する頻度ランク特定ステップとをコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step,
A noun phrase extraction step for extracting a noun phrase from the character string including the word that has undergone the word inclusion step;
In the noun phrase extraction step, a case component extraction step for extracting a case component as a noun phrase required for realizing the action of a verb related to each component constituting the claim from the extracted noun phrase; and ,
With reference to the information on the appearance frequency of nouns by analyzing the description of the patent specification in advance using a conventional patent as a population, the frequency of appearance of nouns included in each case component extracted in the case component extraction step is A case component extraction program that causes a computer to execute a frequency rank specifying step for specifying each rank.
上記格成分抽出ステップにより抽出された格成分の数と、上記頻度ランク特定ステップにより特定された各格成分における名詞の頻度ランクとをそれぞれ出力又は記憶し、又は上記抽出された格成分の数と各格成分における名詞の頻度ランクとに基づいて算出した評価値を出力又は記憶する後処理ステップを更に有すること
を特徴とする請求項8記載の格成分抽出プログラム。
Output or store the number of case components extracted in the case component extraction step and the frequency rank of nouns in each case component specified in the frequency rank specification step, or the number of case components extracted The case component extraction program according to claim 8, further comprising a post-processing step of outputting or storing an evaluation value calculated based on a noun frequency rank in each case component.
上記後処理ステップでは、頻度ランクがより高頻度になるにつれてより特許の広さが広くなるような評価値とし、上記頻度ランクがより低頻度になるにつれてより特許の広さが狭くなるような評価値となるように算出すること
を特徴とする請求項9記載の格成分抽出プログラム。
In the post-processing step, an evaluation value is set such that the width of the patent becomes wider as the frequency rank becomes higher, and the evaluation becomes such that the width of the patent becomes narrower as the frequency rank becomes lower. The case component extraction program according to claim 9, wherein the case component is calculated so as to be a value.
上記頻度ランク特定ステップでは、上記頻度ランクが技術分野毎に記憶され、抽出対象の特許明細書の技術分野に対応した上記頻度ランクを参照すること
を特徴とする請求項8〜10のうち何れか1項記載の格成分抽出プログラム。
The frequency rank specifying step stores the frequency rank for each technical field, and refers to the frequency rank corresponding to the technical field of the patent specification to be extracted. The case component extraction program according to item 1.
上記頻度ランク特定ステップでは、上記頻度ランクが技術分野毎に正規化され、又は分析対象の特許の出願年に応じて正規化されたものを使用すること
を特徴とする請求項8〜11のうち何れか1項記載の格成分抽出プログラム。
The frequency rank specifying step uses the frequency rank normalized for each technical field, or normalized according to the application year of the patent to be analyzed. The case component extraction program according to any one of the preceding claims.
上記後処理ステップでは、上記各格成分をこれに含まれる名詞句毎に特定した頻度ランクに応じて重み付けし、その重み付けがなされた上記各格成分の総和に基づいて上記評価値を算出すること
を特徴とする請求項9又は10項記載の格成分抽出プログラム。
In the post-processing step, each of the case components is weighted according to a frequency rank specified for each noun phrase included therein, and the evaluation value is calculated based on a sum of the weighted case components. The case component extraction program according to claim 9 or 10.
頻度ランク特定ステップでは、ネットワークを介して新たに受信した上記頻度ランク情報、又は他のソフトウェア或いは他のデータベースから新たに取得した頻度ランク情報を使用すること
を特徴とする請求項8〜13のうち何れか1項記載の格成分抽出プログラム。
The frequency rank specifying step uses the frequency rank information newly received via the network, or frequency rank information newly acquired from other software or another database. The case component extraction program according to any one of the preceding claims.
電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、
上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて、上記抽出した名詞句から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する格成分抽出ステップと、
分析対象の特許明細書の記載を分析することによる名詞の出現頻度に関する情報を参照して、上記格成分抽出ステップにおいて抽出された各格成分に含まれる名詞の出現頻度のランクをそれぞれ特定する頻度ランク特定ステップとをコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step,
A noun phrase extraction step for extracting a noun phrase from the character string including the word that has undergone the word inclusion step;
In the noun phrase extraction step, a case component extraction step for extracting a case component as a noun phrase required for realizing the action of a verb related to each component constituting the claim from the extracted noun phrase; and ,
Frequency of identifying the rank of appearance frequency of nouns included in each case component extracted in the case component extraction step with reference to information on appearance frequency of nouns by analyzing description of patent specification to be analyzed A case component extraction program causing a computer to execute a rank specifying step.
上記格成分抽出ステップにより抽出された格成分の数と、上記頻度ランク特定ステップにより特定された各格成分における名詞の頻度ランクとをそれぞれ出力又は記憶し、又は上記抽出された格成分の数と各格成分における名詞の頻度ランクとに基づいて算出した評価値を出力又は記憶する後処理ステップを更に有すること
を特徴とする請求項15記載の格成分抽出プログラム。
Output or store the number of case components extracted in the case component extraction step and the frequency rank of nouns in each case component specified in the frequency rank specification step, or the number of case components extracted The case component extraction program according to claim 15, further comprising a post-processing step of outputting or storing an evaluation value calculated based on a noun frequency rank in each case component.
上記格成分抽出ステップでは、上記文字列中の「〜を特徴とする」における「特徴」を上記文字列から除く名詞句を「少なくとも格成分として抽出すること
をコンピュータに実行させることを特徴とする請求項1〜16のうち何れか1項記載の格成分抽出プログラム。
In the case component extraction step, the computer is caused to execute “to extract at least as a case component” a noun phrase excluding the “feature” in the character string from the character string. The case component extraction program according to any one of claims 1 to 16.
請求項2〜7、9〜17のうち何れか1項記載の格成分抽出プログラムによって上記評価値を算出する評価値算出手段と、
上記評価値算出手段によって得られた評価値、及びこれに基づく図やデータの何れか1以上を記憶するサーバーと、
クライアント側から要求された上記評価値、及びこれに基づく図やデータを上記サーバーから読み出し、これをネットワークを介してクライアント側に送信する送信手段とを備えること
を特徴とする情報送信システム。
Evaluation value calculation means for calculating the evaluation value by the case component extraction program according to any one of claims 2 to 7 and 9 to 17,
A server that stores at least one of the evaluation value obtained by the evaluation value calculating means and a figure or data based on the evaluation value;
An information transmission system comprising: a transmission unit that reads the evaluation value requested from the client side and a figure or data based on the evaluation value from the server and transmits the read value to the client side via the network.
電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、 上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて、上記抽出した名詞句のうち、A、Bをそれぞれ名詞句としたときに、AとBが択一的に定義されていた場合には、A、Bの何れか一方を抽出すべき格成分から除外し、残りの名詞句を少なくとも格成分として抽出する格成分抽出ステップとをコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step and the above word inclusion step A noun phrase extraction step for extracting a noun phrase from the character string including the word that has undergone
In the noun phrase extraction step, if A and B are defined as alternative noun phrases in the extracted noun phrases, either A or B is defined. A case component extraction program that causes a computer to execute a case component extraction step that excludes from a case component to be extracted and extracts at least the remaining noun phrases as case components.
電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、
上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて抽出された名詞句から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する上で、名詞+並列助詞としての「か」又は「や」の何れかからなる文言を、抽出すべき格成分から除外すること
をコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step,
A noun phrase extraction step for extracting a noun phrase from the character string including the word that has undergone the word inclusion step;
In extracting a case component as a noun phrase required to realize the action of a verb related to each constituent element constituting a claim from the noun phrase extracted in the noun phrase extracting step, noun + parallel A case component extraction program that causes a computer to execute excluding a word composed of either “ka” or “ ya as a particle from case components to be extracted.
電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、
上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて抽出された名詞句から格成分を抽出する上で、抽出した文字列中に「〜が」、「〜は」、「〜には」、「〜も」の何れかで定義される主語と、これに係り受けする動詞の関係が含まれていた場合であって、その主語に相当する文言が、その上段で既に記載されている場合には、当該主語に相当する文言を抽出すべき格成分から除外し、その主語に相当する文言が、その上段で未だ記載されていない場合には、当該主語に相当する文言を抽出すべき格成分に含めるように処理する格成分抽出ステップとをコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step,
A noun phrase extraction step for extracting a noun phrase from the character string including the word that has undergone the word inclusion step;
In extracting the case component from the noun phrase extracted in the above noun phrase extraction step, the extracted character string is either “to is”, “to is”, “to” or “to”. If there is a relationship between the subject to be defined and the verb that depends on it, and if the wording corresponding to the subject has already been described above, the wording corresponding to the subject Is excluded from the case component to be extracted, and if the word corresponding to the subject is not yet described in the upper stage, the case component to be processed so that the word corresponding to the subject is included in the case component to be extracted A case component extraction program that causes a computer to execute an extraction step.
電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、
上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて抽出された名詞句から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する上で、動詞を順次抽出し、抽出した動詞が、その上段に記載されているか識別を行う識別工程と、上記識別工程における識別の結果、当該抽出した動詞が、その上段で既に記載されていた旨を識別した場合には、当該識別した動詞に係り受けする名詞句、並びにその上段で既に記載されている動詞が係り受けする主体を示す名詞句を特定する特定工程と、上記特定工程において特定した名詞句と、当該抽出した動詞に係り受けする名詞句との間で同一性を判定する同一性判定工程と、当該抽出した動詞に係り受けする名詞句のうち、上記同一性判定工程において同一と判定されたものについては、これを抽出すべき格成分から除外する除外工程とを有する格成分抽出ステップとをコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step,
A noun phrase extraction step for extracting a noun phrase from the character string including the word that has undergone the word inclusion step;
In extracting the case component as the noun phrase required to realize the action of the verb related to each component constituting the scope of claims from the noun phrase extracted in the noun phrase extracting step, the verbs are sequentially When the identification step of extracting and identifying whether the extracted verb is described in the upper stage, and as a result of the identification in the identification process, the extracted verb has been already described in the upper stage Includes a noun phrase that depends on the identified verb and a noun phrase that indicates a subject that the verb already described in the upper part depends on; a noun phrase that is identified in the above identifying step; The identity determination step for determining the identity between the extracted noun phrase and the noun phrase that depends on the extracted verb and the noun phrase that depends on the extracted verb are the same in the identity determination step. The determined for those, rated component extraction program characterized by executing the rated component extraction step on a computer having a exclude exclusion step from rated component to be extracted it.
電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、
上記単語包括化ステップを経た単語を含む上記文字列から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて抽出された名詞句から格成分を抽出する上で、名詞として抽出される「いずれか」又は「何れか」を抽出すべき格成分から除外するとともに、当該「いずれか」又は「何れか」に直接係り受けする文言が複数存在する場合には、そのうち先行する名詞句について抽出すべき格成分から除外する格成分抽出ステップとをコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step,
A noun phrase extraction step for extracting a noun phrase as a noun phrase requested to realize the action of a verb relating to each component constituting the claim from the character string including the word that has undergone the word inclusion step When,
In extracting the case component from the noun phrase extracted in the noun phrase extraction step, "any" or "any" extracted as a noun is excluded from the case components to be extracted, and the "any" Or a case component characterized by causing a computer to execute a case component extraction step of excluding a case component to be extracted for a preceding noun phrase when there are a plurality of words directly related to "any" Extraction program.
電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、 上記単語包括化ステップを経た単語を含む上記文字列から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて抽出された名詞句から格成分を抽出する上で、上記抽出した名詞句のうち、名詞+「的・自在・可能・不能・不可・よう」+(「な」・「に」・「の」・「と」)を含む名詞句、又はこれらの名詞句に平仮名が追加された文言を抽出すべき格成分から除外する格成分抽出ステップとをコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step and the above word inclusion step A noun phrase extraction step for extracting a noun phrase as a noun phrase requested to realize the action of a verb related to each component constituting the claim from the character string including the word that has undergone
In extracting the case component from the noun phrase extracted in the noun phrase extraction step, among the extracted noun phrases, the noun + “target / free / possible / impossible / impossible” + (“na” / “ (2), (2), (2), (2), (2), (2), (2), and (2) a case component extraction step of excluding from the case components to be extracted words having hiragana added to these noun phrases. Case component extraction program.
電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、
上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて抽出された名詞句から格成分を抽出する上で、「名詞又は名詞句」+「A」+「名詞又は名詞句」からなる文言を抽出した場合において、A=「までの」、「への」、「との」、「にて」、「や」の何れかの場合には、この「A」によって隔てられる個々の「名詞又は名詞句」を別々に格成分として抽出する格成分抽出ステップとをコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step,
A noun phrase extraction step for extracting a noun phrase from the character string including the word that has undergone the word inclusion step;
In extracting a case component from the noun phrase extracted in the noun phrase extraction step, when a word composed of “noun or noun phrase” + “A” + “noun or noun phrase” is extracted, A = “until In the case of any of “No”, “To”, “Tono”, “In”, “Ya”, each “noun or noun phrase” separated by “A” is separately used as a case component. A case component extraction program that causes a computer to execute a case component extraction step to be extracted.
電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、
上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて、上記名詞句抽出ステップにおいて抽出された名詞句から格成分を抽出する上で、更に上記抽出した文字列のうち、「これ」、「それ」、「あれ」、「どれ」、「ここ」、「そこ」、「あそこ」、「どこ」の何れかからなる代名詞を抽出すべき格成分に含めること
をコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step,
A noun phrase extraction step for extracting a noun phrase from the character string including the word that has undergone the word inclusion step;
In the noun phrase extraction step, when extracting a case component from the noun phrase extracted in the noun phrase extraction step, among the extracted character strings, “this”, “it”, “that”, “which , “Here”, “there”, “that”, “where”, a case component extraction program that causes a computer to execute the inclusion of a pronoun consisting of any one of the case components to be extracted.
電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、
上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて、上記名詞句抽出ステップにおいて抽出された名詞句から格成分を抽出する上で、動詞を「こと」につなげた、動詞の名詞形を格成分として抽出する格成分抽出ステップと
をコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step,
A noun phrase extraction step for extracting a noun phrase from the character string including the word that has undergone the word inclusion step;
In the noun phrase extraction step, in extracting a case component from the noun phrase extracted in the noun phrase extraction step, a case component extraction step of extracting the verb noun form as a case component, connecting the verb to “ko” A case component extraction program that causes a computer to execute and.
電子データ化された特許明細書における特許請求の範囲の記載から文字列を抽出する前処理ステップと、
上記前処理ステップにおいて処理された文字列について形態素解析及び構文解析を行うことにより、これらを単語に分解した上で、名詞+名詞・名詞+「の」+名詞・名詞+「のうち」+名詞・名詞+「的・自在・可能」・名詞+「とする」・名詞+「により・によって」・「少なくとも」+数量表現・名詞+「する・できる・させる・される」の何れかを一単語としてまとめ、又は「前記」・「上記」・「該」・「当該」・連体詞の何れかを後続の単語と一単語としてまとめ、又は名詞+「の」+「形容詞」+名詞・名詞+「とする・に係る・に関する・における・となる・である」の何れかを一単語としてまとめ、又は「略」・「若干」・「順次」の何れか+名詞を一単語としてまとめる単語包括化ステップと、
上記単語包括化ステップを経た単語を含む上記文字列から名詞句を抽出する名詞句抽出ステップと、
上記名詞句抽出ステップにおいて、上記名詞句抽出ステップにおいて抽出された名詞句から特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する格成分抽出ステップとを有し、
上記単語包括化ステップでは、「略」・「若干」・「順次」+名詞を一単語とすること
をコンピュータに実行させることを特徴とする格成分抽出プログラム。
A preprocessing step of extracting a character string from the description of the claims in the patent specification converted into electronic data;
By performing morphological analysis and syntactic analysis on the character string processed in the above preprocessing step, the character string is decomposed into words, and then noun + noun / noun + “no” + noun / noun + “out of” + noun・ Noun + “Target / Free / Possible” ・ Noun + “To” ・ Noun + “By ・” ・ “At least” + Quantity expression ・ Noun + “Yes” Summarize as a word, or combine "above", "above", "this", "this", and a conjunction with the following word as one word, or noun + "no" + "adjective" + noun and noun + A word inclusion that summarizes either “being, relating to, relating to, becoming, becoming, or being” as one word, or “abbreviated”, “slightly”, “sequential” + a noun as one word Step,
A noun phrase extraction step for extracting a noun phrase from the character string including the word that has undergone the word inclusion step;
In the noun phrase extraction step, a case component as a noun phrase required to realize the action of the verb related to each component constituting the claim is extracted from the noun phrase extracted in the noun phrase extraction step. A case component extraction step to
In the word inclusion step, a case component extraction program that causes a computer to execute “abbreviation”, “slightly”, “sequential” + a noun as one word.
上記格成分抽出ステップでは、上記文字列中の「〜を特徴とする」における「特徴」を上記文字列から除く名詞句を少なくとも格成分として抽出すること
をコンピュータに実行させることを特徴とする請求項19〜28のうち何れか1項記載の格成分抽出プログラム。
In the case component extraction step, the computer is caused to extract at least a noun phrase excluding “feature” in the character string from “characteristic” from the character string as a case component. Item case extraction program of any one of claim | item 19-28.
上記格成分抽出ステップでは、抽出した格成分の数をカウントしてこれを出力又は記憶し、当該格成分の数に基づく評価値、又は特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分の数(以下、CNという。)を下記計算式に基づく評価値として出力又は記憶すること
をコンピュータに実行させることを特徴とする請求項19〜29のうち何れか1項記載の格成分抽出プログラム。
評価値={α−log(CN+β)}×γ
ここでα=3〜8
β=15〜25
γ=15〜40
In the case component extraction step, the number of extracted case components is counted and output or stored, and the evaluation value based on the number of case components, or the action of the verb related to each component constituting the claim 20. The computer is caused to output or store the number of case components (hereinafter referred to as CN) as noun phrases required for realizing the above as an evaluation value based on the following calculation formula: The case component extraction program of any one of -29.
Evaluation value = {α-log (CN + β)} × γ
Where α = 3-8
β = 15-25
γ = 15-40
請求項19〜29のうち何れか1項記載の格成分抽出プログラムによって特許請求の範囲を構成する各構成要素に係る動詞の動作を実現させるために要求された名詞句としての格成分を抽出する格成分抽出手段と、
格成分抽出手段によって得られた格成分数又は当該格成分数に基づく評価値の何れか1以上を記憶するサーバーと、
クライアント側から要求された特許の格成分数、又は評価値を上記サーバーから読み出し、これをネットワークを介してクライアント側に送信する送信手段とを備えること
を特徴とする情報送信システム。
A case component as a noun phrase required for realizing the action of a verb related to each constituent element constituting a claim by the case component extraction program according to any one of claims 19 to 29 is extracted. Case component extraction means;
A server that stores at least one of the number of case components obtained by the case component extraction means or an evaluation value based on the number of case components;
An information transmission system comprising: a transmission unit that reads out the number of case components or an evaluation value of a patent requested from the client side from the server and transmits it to the client side via a network.
JP2013207546A 2013-10-02 2013-10-02 Case component extraction program Active JP6206874B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013207546A JP6206874B2 (en) 2013-10-02 2013-10-02 Case component extraction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013207546A JP6206874B2 (en) 2013-10-02 2013-10-02 Case component extraction program

Publications (2)

Publication Number Publication Date
JP2015072573A JP2015072573A (en) 2015-04-16
JP6206874B2 true JP6206874B2 (en) 2017-10-04

Family

ID=53014899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013207546A Active JP6206874B2 (en) 2013-10-02 2013-10-02 Case component extraction program

Country Status (1)

Country Link
JP (1) JP6206874B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7303614B2 (en) 2018-07-11 2023-07-05 株式会社野村総合研究所 making device
JP6694104B1 (en) * 2019-10-30 2020-05-13 株式会社 資生堂 Information processing system, method, program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4197699B2 (en) * 2002-10-23 2008-12-17 有限会社アイ・アール・ディー Information processing apparatus, information processing method, and program
JP2006155151A (en) * 2004-11-29 2006-06-15 Hajime Abiko Patent specification analysis display device
WO2006126409A1 (en) * 2005-05-26 2006-11-30 Sharp Kabushiki Kaisha Patent information analysis device, patent information analysis method, patent information analysis program, and computer-readable recording medium
JP5159410B2 (en) * 2008-04-21 2013-03-06 元 安彦 Patent specification analysis display device
JP2011257817A (en) * 2010-06-04 2011-12-22 Kenichiro Ayaki Patent specification analyzer and text analyzer

Also Published As

Publication number Publication date
JP2015072573A (en) 2015-04-16

Similar Documents

Publication Publication Date Title
RU2619193C1 (en) Multi stage recognition of the represent essentials in texts on the natural language on the basis of morphological and semantic signs
RU2571373C2 (en) Method of analysing text data tonality
RU2657173C2 (en) Sentiment analysis at the level of aspects using methods of machine learning
US10699081B2 (en) Human language analyzer for detecting clauses, clause types, and clause relationships
Chang et al. Practical linguistic steganography using contextual synonym substitution and a novel vertex coding method
US10942977B2 (en) Systems and methods for targeting, reviewing, and presenting online social network data by evidence context
CN102915322B (en) System and method of sentiment data generation
US8359193B2 (en) Pre-highlighting text in a semantic highlighting system
US20210026835A1 (en) System and semi-supervised methodology for performing machine driven analysis and determination of integrity due diligence risk associated with third party entities and associated individuals and stakeholders
US20110099052A1 (en) Automatic checking of expectation-fulfillment schemes
RU2639655C1 (en) System for creating documents based on text analysis on natural language
US9268768B2 (en) Non-standard and standard clause detection
RU2697647C1 (en) System and method for automatic creation of templates
US8750630B2 (en) Hierarchical and index based watermarks represented as trees
US20140047315A1 (en) Method for identifying potential defects in a block of text using socially contributed pattern/message rules
JP2017527913A (en) Systems and processes for analyzing, selecting, and capturing sources of unstructured data by experience attributes
US11651039B1 (en) System, method, and user interface for a search engine based on multi-document summarization
Sangwan et al. Denigrate comment detection in low-resource Hindi language using attention-based residual networks
Mahendhiran et al. CLSA-CapsNet: Dependency based concept level sentiment analysis for text
JP6206874B2 (en) Case component extraction program
Wang et al. Validating multimedia content moderation software via semantic fusion
Consuegra-Ayala et al. Automatic annotation of protected attributes to support fairness optimization
JP5311319B1 (en) Case component extraction program
US11017172B2 (en) Proposition identification in natural language and usage thereof for search and retrieval
CN111782917A (en) Method and apparatus for visual analysis of financial penalty data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160630

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170829

R150 Certificate of patent or registration of utility model

Ref document number: 6206874

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250