JP2020173849A - Information processing device, method, and program - Google Patents
Information processing device, method, and program Download PDFInfo
- Publication number
- JP2020173849A JP2020173849A JP2020118607A JP2020118607A JP2020173849A JP 2020173849 A JP2020173849 A JP 2020173849A JP 2020118607 A JP2020118607 A JP 2020118607A JP 2020118607 A JP2020118607 A JP 2020118607A JP 2020173849 A JP2020173849 A JP 2020173849A
- Authority
- JP
- Japan
- Prior art keywords
- information
- frequency distribution
- unit
- evaluation
- publication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、情報処理装置及び方法、並びにプログラムに関する。 The present invention relates to information processing devices and methods, and programs.
従来より、特許権は、実施予定や実施中の事業を保護する等を目的として、多くの企業により取得されている。また、特許権は、財産権であり、第三者に対して、譲渡したり、専用実施権の設定や通常実施権の許諾をすることで、有効活用することもできる。 Traditionally, patent rights have been acquired by many companies for the purpose of protecting projects scheduled to be implemented or projects underway. In addition, the patent right is a property right and can be effectively utilized by transferring it to a third party, setting an exclusive license, or granting a non-exclusive license.
特許権を取得するためには、願書の他、当該願書の添付書類の提出が必要になる。願書の添付書類としては、特許請求の範囲、明細書、図面、及び要約書が存在する。
このような願書の添付書類の作成を支援する技術(例えば特許文献1参照)や、願書の添付書類の文章構造等を解析する技術(例えば特許文献2参照)については、数多くの研究開発がなされている。
In order to obtain a patent right, it is necessary to submit the application and the attached documents of the application. Attachments to the application include claims, specification, drawings, and abstract.
A lot of research and development has been done on the technology to support the preparation of the attached documents of the application (see, for example, Patent Document 1) and the technology to analyze the sentence structure of the attached documents of the application (see, for example, Patent Document 2). ing.
しかしながら、明細書等の公報の品質の適切な評価手法の実現が要求されていたところ、特許文献1,2を含め従来の技術では当該要求に十分に応えることができない状況であった。
However, although there has been a demand for the realization of an appropriate evaluation method for the quality of publications such as specifications, there has been a situation in which conventional techniques including
本発明は、このような状況に鑑みてなされたものであり、明細書等の公報の品質の適切な評価手法を実現することを目的とする。 The present invention has been made in view of such a situation, and an object of the present invention is to realize an appropriate evaluation method for the quality of publications such as specifications.
本発明の一側面の情報処理装置は、
知的財産権に関する公報に含まれ得る第1書類の内容を、文字、図形、記号、又はそれらの結合からなる所定の単位情報に分離して、分離後の前記単位情報の頻度分布を示す第1情報を生成する第1情報生成手段と、
当該公報に含まれ得る第2書類の内容を前記単位情報に分離して、分離後の前記単位情報の頻度分布を示す第2情報を生成する第2情報生成手段と、
前記第1情報と前記第2情報とに基づいて、前記公報の内容を評価する評価情報を生成する評価情報生成手段と、
を備える。
The information processing device of one aspect of the present invention is
The content of the first document that can be included in the publication on intellectual property rights is separated into predetermined unit information consisting of characters, figures, symbols, or a combination thereof, and the frequency distribution of the unit information after separation is shown. 1 The first information generation means for generating information and
A second information generating means that separates the contents of the second document that can be included in the publication into the unit information and generates the second information indicating the frequency distribution of the unit information after the separation.
An evaluation information generating means for generating evaluation information for evaluating the contents of the publication based on the first information and the second information.
To be equipped.
ここで、前記第2情報における各単位情報を、前記第1情報の複数の単位情報の夫々に対応する複数のグループに分類し、分類後の前記複数のグループの夫々を単位とした頻度分布を示す第3情報を生成する第3情報生成手段とをさらに備え、
前記評価情報生成手段は、前記第1情報と前記第3情報とに基づいて、前記評価情報を生成する、
ことができる。
Here, each unit information in the second information is classified into a plurality of groups corresponding to each of the plurality of unit information in the first information, and the frequency distribution in each of the plurality of groups after classification is calculated. Further provided with a third information generating means for generating the third information shown,
The evaluation information generating means generates the evaluation information based on the first information and the third information.
be able to.
前記評価情報生成手段は、前記第1情報おける各単位情報毎に、前記第3情報における、対応するグループとの順位差に基づくスコアを演算し、
前記第1情報おける前記各単位情報の前記スコアの総合値に基づいて、前記評価情報を生成する、
ことができる。
The evaluation information generating means calculates a score based on the ranking difference from the corresponding group in the third information for each unit information in the first information.
The evaluation information is generated based on the total value of the scores of the unit information in the first information.
be able to.
前記評価情報生成手段は、前記第1情報における各単位情報の順位に基づいて、前記スコアを重み付けする、
ことができる。
The evaluation information generating means weights the score based on the order of each unit information in the first information.
be able to.
前記評価情報生成手段は、前記第1情報の前記単位情報毎に、前記第3情報における、対応するグループに属する各単位情報との関連度合に基づいて、前記スコアを重み付けする、
ことができる。
The evaluation information generating means weights the score for each unit information of the first information based on the degree of association with each unit information belonging to the corresponding group in the third information.
be able to.
前記評価情報生成手段は、前記第1情報の前記単位情報のうちノイズ情報を除去して、当該ノイズ情報が除去された後の前記単位情報毎の前記スコアの総合値に基づいて、前記評価情報を生成する、
ことができる。
The evaluation information generating means removes noise information from the unit information of the first information, and the evaluation information is based on the total value of the score for each unit information after the noise information is removed. To generate,
be able to.
本発明の一側面の情報処理方法及びプログラムは、上述の本発明の一側面の情報処理装置に対応する方法及びプログラムである。 The information processing method and program of one aspect of the present invention are the methods and programs corresponding to the above-mentioned information processing device of one aspect of the present invention.
本発明によれば、明細書等の公報の品質の適切な評価手法を実現することができる。 According to the present invention, it is possible to realize an appropriate evaluation method for the quality of publications such as specifications.
以下、本発明の実施形態について、図面を用いて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は、本発明の情報処理装置の一実施形態としての公報評価装置1のハードウェアの構成を示すブロック図である。
FIG. 1 is a block diagram showing a hardware configuration of a
公報評価装置1は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入出力インターフェース15と、入力部16と、出力部17と、記憶部18と、通信部19と、ドライブ20と、を備えている。
The
CPU11は、ROM12に記録されているプログラム、又は、記憶部18からRAM13にロードされたプログラムに従って各種の処理を実行する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
The
Data and the like necessary for the
CPU11、ROM12及びRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インターフェース15も接続されている。入出力インターフェース15には、入力部16、出力部17、記憶部18、通信部19及びドライブ20が接続されている。
The
入力部16は、キーボードやマウス等で構成され、オペレータの指示操作に応じて各種情報を入力する。
出力部17は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
記憶部18は、ハードディスクやDRAM(Dynamic Random Access Memory)等で構成され、各種データを記憶する。
通信部19は、インターネットを含むネットワーク4を介して他の装置(図示せず)との間で行う通信を制御する。
The
The
The
The
ドライブ20には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア31が適宜装着される。ドライブ20によってリムーバブルメディア31から読み出されたプログラムは、必要に応じて記憶部18にインストールされる。また、リムーバブルメディア31は、記憶部18に記憶されている各種データも、記憶部18と同様に記憶することができる。
A
このような構成を有する公報評価装置1は、本実施形態では、特許公報若しくは出願公開公報、又は実用新案登録公報に含まれ得る明細書の品質評価をする装置である。
なお、以下の説明では便宜上、特許権について説明するが、実用新案権の場合にも基本的に同様である。
In the present embodiment, the
In the following description, the patent right will be described for convenience, but the same is basically true for the utility model right.
特許権を取得するためには、願書の他、当該願書の添付書面として、特許請求の範囲、明細書、必要な図面、及び要約書の提出が必要になる。 In order to obtain a patent right, in addition to the application, it is necessary to submit the claims, specification, necessary drawings, and abstract as attachments to the application.
特許請求の範囲は、特許権の権利書としての使命を果たすべきものである。即ち、特許発明の技術的範囲が、特許請求の範囲の記載に基づいて定められる。
明細書は、発明の内容を第三者に公開する技術文献としての使命を果たすべきものである。
ここで、特許請求の範囲の記載について、「特許を受けようとする発明が発明の詳細な説明に記載したものであること。」という要件(以下、「サポート要件」と呼ぶ)が求められている。具体的には日本国でいえば、当該サポート要件は、特許法第36条第6項第1号に規定されている。
このサポート要件は、日本国では拒絶理由(特許法第49条4号)になっている。つまり、サポート要件を満たす明細書でなければ、日本国では特許権を取得することができない。
従って、サポート要件を満たすか否かは、明細書の品質にとって重要な要素の1つである。
そこで、本実施形態の公報評価装置1は、特許請求の範囲に含まれる単語の頻度分布と、明細書に含まれる単語の頻度分布とに基づいて、明細書の内容を評価する評価情報として、サポート要件の充実度合を示す評価値(以下、「サポート情報充実度指数」と呼ぶ)を生成する。
以下、評価対象の特許公報又は出願公開公報についての評価情報(サポート情報充実度指数)を生成するまでの一連の処理を、「評価情報生成処理」と呼ぶ。
The scope of claims should fulfill its mission as a title of patent right. That is, the technical scope of the patented invention is determined based on the description of the claims.
The specification should fulfill its mission as a technical document that discloses the contents of the invention to a third party.
Here, regarding the description of the scope of claims, the requirement that "the invention for which a patent is sought is described in the detailed description of the invention" (hereinafter referred to as "support requirement") is required. There is. Specifically, in Japan, the support requirements are stipulated in Article 36, Paragraph 6,
This support requirement is a reason for refusal (Patent Law Article 49, No. 4) in Japan. In other words, a patent right cannot be obtained in Japan unless the specification meets the support requirements.
Therefore, meeting the support requirements is one of the important factors for the quality of the specification.
Therefore, the
Hereinafter, a series of processes until the evaluation information (support information enrichment index) of the patent gazette or the application publication gazette to be evaluated is generated is referred to as "evaluation information generation process".
図2は、公報評価装置1の機能的構成のうち、評価情報生成処理を実行するための機能的構成を示す機能ブロック図である。
公報評価装置1のCPU11においては、評価情報生成処理が実行される場合、クレーム単語頻度分布生成部41と、明細書単語頻度分布生成部42と、明細書類義語頻度分布生成部43と、評価情報生成部44とが機能する。なお、評価情報生成部44には、重み付け部51が含まれている。
公報評価装置1の記憶部18の一領域には、公報情報DB61が設けられる。
FIG. 2 is a functional block diagram showing a functional configuration for executing the evaluation information generation process among the functional configurations of the
When the evaluation information generation process is executed in the
The
クレーム単語頻度分布生成部41は、評価対象の特許公報又は出願公開公報に含まれる特許請求の範囲の内容(クレームの内容)を各単語に分離して、分離後の単語の頻度分布を示す情報(以下、「クレーム単語頻度分布」と呼ぶ)を生成する。
The claim word frequency
明細書単語頻度分布生成部42は、評価対象の特許公報又は出願公開公報に含まれる明細書の内容を各単語に分離して、分離後の単語の頻度分布を示す情報(以下、「明細書単語頻度分布」と呼ぶ)を生成する。
The specification word frequency
ここで、サポート情報充実度指数を生成するにあたり、クレーム単語頻度分布と、明細書単語頻度分布とを比較してもよいが、当該比較では有効な比較とならない場合がある。この理由について以下説明する。 Here, in generating the support information enrichment index, the claim word frequency distribution and the specification word frequency distribution may be compared, but the comparison may not be a valid comparison. The reason for this will be described below.
ただし、明細書には、上述したサポート要件に加えて、発明の詳細な説明について、「その発明の属する技術の分野における通常の知識を有する者がその実施をすることができる程度に明確かつ十分に記載したものであること」という要件(以下、「実施可能要件」と呼ぶ)も求められている。具体的には日本国でいえば、当該実施可能要件は、特許法第36条第4項第1号に規定されている。
この実施可能要件は、日本国では拒絶理由(特許法第49条4号)になっている。つまり、実施可能要件を満たす明細書でなければ、日本国では特許権を取得することができない。
ここで、特許請求の範囲は、上述のように権利書としての性格を有することから、一般的に広い権利範囲となるように可能な限り上位概念で記載されることが多い。つまり、クレーム単語頻度分布に現れる各単語は、上位概念の漠然とした単語であることが多い。
これに対して、明細書には、実施可能要件を満たすべく、具体的な技術内容を示す単語、つまり、当該上位概念(特許請求の範囲に記載される単語)を例示した下位概念であることが多い。つまり、明細書内では、上位概念を説明する語として、具体的な技術内容を示す単語が登場することが多い。
換言すると、特許請求の範囲に記載の上位概念の単語がそのまま用いられて、明細書における実施形態が記載されていることは少なく、複数の下位概念(例示)の単語で記載されていることが多い。
このため、クレーム単語頻度分布と、明細書単語頻度分布とをそのまま比較しても、有効な比較とはならない場合があり得る。
However, in addition to the support requirements described above, the specification provides a detailed description of the invention, "clear and sufficient to the extent that a person having ordinary knowledge in the technical field to which the invention belongs can carry out the invention. The requirement that "it must be as described in" (hereinafter referred to as "enablement requirement") is also required. Specifically, in Japan, the enablement requirement is stipulated in Article 36, Paragraph 4,
This enablement requirement is a reason for refusal (Patent Law Article 49, No. 4) in Japan. In other words, a patent right cannot be obtained in Japan unless the specification meets the enablement requirements.
Here, since the scope of claims has the character of a title as described above, it is often described in the highest possible concept so as to have a broad scope of rights in general. In other words, each word that appears in the claim word frequency distribution is often a vague word of a superordinate concept.
On the other hand, the specification should be a word indicating a specific technical content, that is, a subordinate concept exemplifying the superordinate concept (word described in the claims) in order to satisfy the enablement requirement. There are many. That is, in the specification, a word indicating a specific technical content often appears as a word for explaining a superordinate concept.
In other words, the words of the superordinate concept described in the claims are used as they are, and the embodiments in the specification are rarely described, and the words of a plurality of subordinate concepts (exemplifications) are described. There are many.
Therefore, even if the claim word frequency distribution and the specification word frequency distribution are compared as they are, it may not be a valid comparison.
そこで、本実施形態では、明細書類義語頻度分布生成部43は、明細書から抽出された各単語を、特許請求の範囲の複数の単語(上位概念)の夫々に対応する複数のグループに分類する。
ここで、複数のグループへの分類手法は特に限定されないが、本実施形態では、複数の類義語の上位概念が特許請求の範囲の所定の1つの単語に対応するものとして、類義語を同一グループに分類するという分類手法が採用されている。
明細書類義語頻度分布生成部43は、分類後の複数のグループ(特許請求の範囲の複数の単語に対応するグループ)の夫々を単位とした頻度分布を示す情報を生成する。このような情報を、以下、「明細書類義語頻度分布」と呼ぶ。
Therefore, in the present embodiment, the specification document synonym frequency
Here, the method of classifying into a plurality of groups is not particularly limited, but in the present embodiment, the synonyms are classified into the same group assuming that the superordinate concept of the plurality of synonyms corresponds to a predetermined one word in the claims. The classification method of doing is adopted.
The specification document synonym frequency
評価情報生成部44は、クレーム単語類度分布と、明細書類義語頻度分布とに基づいて、サポート情報充実度指数(評価情報)を生成する。
例えば本実施形態では、評価情報生成部44は、クレーム単語頻度分布に含まれる単語の頻度ランキングと、明細書類義語頻度分布に含まれるグループ(クレーム単語頻度分布の所定単語に対応するグループ)の頻度ランキングとを対比することで、その類似度を算出する。評価情報生成部44は、当該類似度又はその加工値を、サポート情報充実度指数(評価情報)として生成する。
具体的には例えば、評価情報生成部44は、クレーム単語頻度分布における各単語毎に、明細書類義語頻度分布における、対応するグループとの順位差に基づくスコアを演算し、クレーム単語頻度分布における各単語のスコアの総合値に基づいて、サポート情報充実度指数(評価情報)を生成する。
The evaluation
For example, in the present embodiment, the evaluation
Specifically, for example, the evaluation
図3は、このような図2の機能的構成を有する公報評価装置1が実行する評価情報生成処理の概要を説明する模式図である。
FIG. 3 is a schematic diagram illustrating an outline of an evaluation information generation process executed by the
図3の例では、クレーム単語頻度71の頻度ランキングについては、第1位は「弾性体」であり、第2位は「応力」である。
ここで、明細書単語頻度72の頻度ランキングについては、第1位は「応力」であり、第2位は「バネ」であり、第3位は「ゴム」である。従って、頻度ランキングの点でクレーム単語頻度71と明細書単語頻度72とを比較すると、特許請求の範囲と明細書の第1位が異なっており、特許請求の範囲の第1位の「弾性体」は明細書ではランクインされていない。その結果、単にこの順位に基づいてサポート情報充実度指数(評価情報)が生成された場合には、類似度が低い(一致度が低い)として、低い値になってしまう可能性がある。
具体的には例えば、順位が一致する場合にはスコア「1」が与えられ、順位差が1の場合にはスコア「0.9」が与えられ、順位差が2の場合にはスコア「0.8」が与えられ、それ以降順位差が増える毎にスコアは0.1ずつ減少していき、スコア「0」となった後は一律スコア「0」になるものとする。この場合、クレーム単語頻度71について、第1位の「弾性体」のスコアは「0.9」となり、第2位の「応力」のスコアは「0」となる。これらのスコアの総合値がサポート情報充実度指数(評価情報)とするならば、その値は「0.9」になる。
このように本来高値となるべきサポート情報充実度指数(評価情報)が低くなる理由は、「弾性体」という上位概念と、その下位概念である「バネ」と「ゴム」との対応付けがなされていないからである。
In the example of FIG. 3, regarding the frequency ranking of the
Here, regarding the frequency ranking of the
Specifically, for example, if the rankings match, a score "1" is given, if the ranking difference is 1, a score "0.9" is given, and if the ranking difference is 2, a score "0" is given. 0.8 ”is given, and the score decreases by 0.1 each time the ranking difference increases thereafter, and after the score becomes“ 0 ”, the score becomes uniformly“ 0 ”. In this case, for the
The reason why the support information enrichment index (evaluation information), which should be originally high, is low is that the superordinate concept of "elastic body" is associated with the subordinate concepts of "spring" and "rubber". Because it is not.
そこで、本実施形態では、明細書類義語頻度分布生成部43は、明細書から抽出された「バネ」と「ゴム」を、特許請求の範囲の「弾性体」に対応するグループに属するように分類する。
このような分類の結果として、明細書類義語頻度73が生成される。明細書類義語頻度73の頻度ランキングについては、第1位は「バネ、グループ」が属するグループ、即ち、特許請求の範囲の「弾性体」に対応するグループである。そして、第2位は「応力」が属するグループ、即ち、特許請求の範囲の「応力」に対応するグループである。
この場合、クレーム単語頻度71と、明細書類義語頻度73との各順位は一致するので、この順位に基づいてサポート情報充実度指数(評価情報)が生成されると、類似度が高い(一致度が高い)として、高値になる。
具体的には例えば、上位スコアを用いるならば、クレーム単語頻度71について、第1位の「弾性体」のスコアは「1」となり、第2位の「応力」のスコアも「1」となる。従って、これらのスコアの総合値「2」という高値が、サポート情報充実度指数(評価情報)になる。
Therefore, in the present embodiment, the specification document synonym frequency
As a result of such classification, a detailed
In this case, the order of the
Specifically, for example, if a higher score is used, the score of the first-ranked "elastic body" is "1" and the score of the second-ranked "stress" is also "1" for the
ここで、クレーム単語頻度71も明細書類義語頻度54も、単純な単語の出現頻度に基づく分布である。このような単純な出現頻度同士で比較したサポート情報充実度指数(評価情報)の信頼性は高いといえない場合もでてくる。
そこで、本実施形態の評価情報生成部44には重み付け部51が設けられている。
Here, both the
Therefore, the evaluation
例えば上述の頻度ランキングに基づくスコアが採用されている場合、評価情報生成部44は、クレーム単語頻度71における各単語の順位に基づいて、スコアを重み付けすることができる。
例えば、順位が一致するといっても、第1位同士として一致する場合と、第10位同士として一致する場合とを比較すれば、前者の場合の方が、全体の類似度に貢献する割合が高いといえる。
そこで、重み付け部51は、第1位同士として一致する場合のスコアが高くなるように重み付けすると共に、第10位同士として一致する場合のスコアが低くなるように重み付けをする。例えば、第1位同士として一致する場合のスコアが「2」となる一方で、第10位同士として一致する場合のスコアが「0.2」となるように、重み付けされる。
For example, when the score based on the frequency ranking described above is adopted, the evaluation
For example, even if the rankings match, when comparing the cases where the first places match and the cases where the tenth places match each other, the former case contributes more to the overall similarity. It can be said that it is expensive.
Therefore, the
また例えば評価情報生成部44は、クレーム単語頻度71における各単語毎に、明細書類義語頻度73における、対応するグループに属する各単語との関連度合に基づいて、スコアを重み付けすることもできる。
例えば、特許請求の範囲の「弾性体」に対応するグループについては、明細書類義語頻度73における、対応するグループには「バネ、ゴム」が入っている。これらは、「弾性体」の下位概念であるが、「弾性体」という単語自体は当該グループに入っていない。
一方、特許請求の範囲の「応力」に対応するグループについては、明細書類義語頻度73における、対応するグループには「応力」という単語自体が入っている。
そこで、重み付け部51は、特許請求の範囲の「弾性体」よりも、特許請求の範囲の「応力」の方が、関連度の高い単語が対応するグループに属しているとして、重みを増すように重み付けをする。
Further, for example, the evaluation
For example, for the group corresponding to "elastic body" in the claims, "spring, rubber" is included in the corresponding group in the
On the other hand, for the group corresponding to "stress" in the claims, the word "stress" itself is included in the corresponding group in the
Therefore, the
このように各種重み付けをした後で生成されるサポート情報充実度指数(評価情報)は、より実体に近い値になっていると想定される。つまり、重み付けをすることで、より高精度なサポート情報充実度指数(評価情報)の生成が可能になる。 It is assumed that the support information enrichment index (evaluation information) generated after various weighting in this way has a value closer to the substance. That is, by weighting, it is possible to generate a more accurate support information enrichment index (evaluation information).
ここで、クレーム単語頻度71では、特許発明の特徴となる単語とは異なる単語、例えば図3に示す「前記」のように一般的な単語が、頻度ランキングで上位となる場合もある。そこで、このような単語をノイズ情報として、除去するとよい。
即ち、評価情報生成部44は、クレーム単語頻度71における各単語のうちノイズ情報(例えば「前記」という単語)を除去して、当該ノイズ情報が除去された後の各単語毎のスコアの総合値に基づいて、サポート情報充実度指数(評価情報)を生成する。
Here, in the
That is, the evaluation
このようにノイズ除去後に生成されるサポート情報充実度指数(評価情報)は、より実体に近い値になっていると想定される。つまり、ノイズ情報を除去をすることで、より高精度なサポート情報充実度指数(評価情報)の生成が可能になる。 It is assumed that the support information enrichment index (evaluation information) generated after noise removal is a value closer to the substance. That is, by removing the noise information, it is possible to generate a more accurate support information enrichment index (evaluation information).
図4は、図3の機能的構成を有する公報評価装置1が実行する評価情報生成処理の流れを説明するフローチャートである。
FIG. 4 is a flowchart illustrating a flow of evaluation information generation processing executed by the
ステップS1において、クレーム単語頻度分布生成部41は、クレーム単語頻度分布を生成する。
ステップS2において、明細書単語頻度分布生成部42は、明細書単語頻度分布を生成する。
ステップS3において、明細書類義語頻度分布生成部43は、明細書類義語頻度分布を生成する。
ステップS4において、評価情報生成部44は、クレーム単語類度分布と、明細書類義語頻度分布とに基づいて、サポート情報充実度指数(評価情報)を生成する。
これにより、評価情報生成処理は終了となる。
In step S1, the claim word frequency
In step S2, the specification word frequency
In step S3, the detailed document synonym frequency
In step S4, the evaluation
As a result, the evaluation information generation process is completed.
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。 Although the embodiments of the present invention have been described above, the present invention is not limited to the above-described embodiments. Further, the effects described in the present embodiment merely list the most preferable effects arising from the present invention, and the effects according to the present invention are not limited to those described in the present embodiment.
例えば、上述の実施形態では、特許掲載公報又は出願公開公報の特許請求の範囲から各単語が抽出されて頻度分布が生成され、明細書から各単語が抽出されて頻度分布が生成された。
しかしながら、上述の実施形態に特に限定されず、例えば明細書、図面、又は要約書から、文字、図形、若しくは記号又はこれらの結合(以下、「文字等」と呼ぶ)が抽出されてもよい。
さらにいえば、上述の実施形態では、特許に関する公報が採用されたが、特に特許に限定する必要は特になく、文字等を含む2種類以上の書類の提出を前提として付与される知的財産権に関する公報一般の評価に本発明を採用することができる。
For example, in the above-described embodiment, each word is extracted from the claims of the patent publication or the publication of the application to generate a frequency distribution, and each word is extracted from the specification to generate a frequency distribution.
However, it is not particularly limited to the above-described embodiment, and characters, figures, symbols, or combinations thereof (hereinafter, referred to as "characters and the like") may be extracted from, for example, a specification, a drawing, or a summary.
Furthermore, in the above-described embodiment, the publication relating to the patent is adopted, but it is not particularly necessary to limit the publication to the patent, and the intellectual property right granted on the premise of submitting two or more types of documents including characters and the like. The present invention can be adopted for general evaluation.
また例えば、上述の実施形態では、頻度分布の単位情報は、単語とされたが、特にこれに限定されず、文字、図形、記号、又はそれらの結合からなる任意の単位情報を採用することができる。 Further, for example, in the above-described embodiment, the unit information of the frequency distribution is a word, but the unit information is not particularly limited to this, and any unit information consisting of characters, figures, symbols, or a combination thereof may be adopted. it can.
換言すると、本実施形態が適用される情報処理装置は、次のような構成を有すれば足り、各種各様な実施の形態を取ることが可能である。 In other words, the information processing apparatus to which the present embodiment is applied only needs to have the following configuration, and can take various various embodiments.
即ち、本発明の情報処理装置は、
知的財産権に関する公報に含まれ得る第1書類(例えば特許請求の範囲)の内容を、文字、図形、記号、又はそれらの結合からなる所定の単位情報(例えば単語)に分離して、分離後の前記単位情報の頻度分布を示す第1情報(例えばクレーム単語頻度分布)を生成する第1情報生成手段(例えば図2のクレーム単語頻度分布生成部41)と、
当該公報に含まれ得る第2書類(例えば明細書)の内容を前記単位情報(例えば単語)に分離して、分離後の前記単位情報の頻度分布を示す第2情報(例えば明細書単語頻度分布)を生成する第2情報生成手段(例えば図2の明細書単語頻度分布生成部42)と、
前記第1情報と前記第2情報とに基づいて、前記公報の内容を評価する評価情報を生成する評価情報生成手段と、
を備える。
That is, the information processing device of the present invention
The contents of the first document (for example, claims) that can be included in the publication on intellectual property rights are separated into predetermined unit information (for example, words) consisting of characters, figures, symbols, or a combination thereof. A first information generating means (for example, the claim word frequency
The content of the second document (for example, the specification) that can be included in the publication is separated into the unit information (for example, a word), and the second information (for example, the specification word frequency distribution) showing the frequency distribution of the unit information after the separation is shown. ) (For example, the specification word frequency
An evaluation information generating means for generating evaluation information for evaluating the contents of the publication based on the first information and the second information.
To be equipped.
かかる情報処理装置を採用することで、知的財産権に関する公報をより適切に評価することが可能になる。 By adopting such an information processing device, it becomes possible to more appropriately evaluate the publication on intellectual property rights.
なお、公報に含まれ得る第1書類の内容及び第2書類の内容とは、必ずしも公報の謄本である必要はなく、仮に公報が発行されるならば当該公報に含まれるであろう第1書類及び第2書類の各内容も含む意である。
つまり、公報の発行は特に必須ではなく、未出願の段階又は出願後未公開の段階でも、第1書類や第2書類の内容を示す情報は存在する可能性があるため、これらも含める意として、「公報に含まれ得る」と記載している。
従って、公報に含まれ得る第1書類及び第2書類の内容としては、例えば、出願後未公開の「特許請求の範囲」や「明細書」等についての出願人側で保持しているコピーデータの内容や、出願前における「特許請求の範囲」や「明細書」の内容を記載した書類(例えば出願人側で作成する発明報告書等)の内容等も含む。
また、第2ユーザも、実施候補事業者である必要は特に無く、出願人側の知的財産担当者等も該当し得る。
以上のことから、例えば、特許出願人(企業)側の知的財産担当者等は、出願前の段階で明細書案の評価をすることができるので、低評価の明細書案を高評価になるように書きなおしたうえで出願することもできる。
The contents of the first document and the second document that can be included in the gazette do not necessarily have to be a copy of the gazette, and if the gazette is issued, the first document that will be included in the gazette. And each content of the second document is also included.
In other words, the issuance of a gazette is not particularly essential, and information indicating the contents of the first and second documents may exist even at the stage of unapplication or the stage of unpublished after filing, so we intend to include these as well. , "Can be included in the gazette".
Therefore, as the contents of the first document and the second document that can be included in the gazette, for example, the copy data held by the applicant regarding the "claims" and "specification" that have not been published after the application. It also includes the contents of documents (for example, invention reports prepared by the applicant) that describe the contents of the "claims" and "specifications" before filing the application.
Further, the second user does not have to be a candidate business operator, and the person in charge of intellectual property on the applicant side may also be applicable.
From the above, for example, the person in charge of intellectual property on the patent applicant (company) side can evaluate the draft specification at the stage before filing the application, so that the draft specification with a low evaluation is highly evaluated. You can also apply after rewriting in.
さらに、このような評価情報は、特許解析等の他分野に適用可能である。例えば、被引用件数に基づく特許評価インデックスの修正(ウエイト付け)に活用できる。
また例えば、特許分析に基づいて、ライセンス候補等を探索するにあたり、評価情報(サポート情報充実度指数)の高い明細書からなる特許を、「マッチング可能性の高い」特許として優先的に、ライセンス候補者等に提示するようなこともできる。
Furthermore, such evaluation information can be applied to other fields such as patent analysis. For example, it can be used to modify (weight) the patent evaluation index based on the number of citations.
Further, for example, when searching for a license candidate or the like based on patent analysis, a patent consisting of a specification having high evaluation information (support information enrichment index) is given priority as a patent with a "high matching possibility" as a license candidate. It can also be presented to others.
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
換言すると、図3の機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能が公報評価装置1に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に図2の例に限定されない。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
The series of processes described above can be executed by hardware or software.
In other words, the functional configuration of FIG. 3 is merely an example and is not particularly limited. That is, it suffices if the
Further, one functional block may be configured by a single piece of hardware, a single piece of software, or a combination thereof.
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
When a series of processes are executed by software, the programs constituting the software are installed on a computer or the like from a network or a recording medium.
The computer may be a computer embedded in dedicated hardware. Further, the computer may be a computer capable of executing various functions by installing various programs, for example, a general-purpose personal computer.
このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図1のリムーバブルメディア31により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。リムーバブルメディア31は、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD−ROM(Compact Disk−Read Only Memory),DVD(Digital Versatile Disk)等により構成される。光磁気ディスクは、MD(Mini−Disk)等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されている図1のROM12や、記憶部18に含まれるハードディスク等で構成される。
The recording medium including such a program is not only composed of the
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。 In the present specification, the steps for describing a program recorded on a recording medium are not necessarily processed in chronological order, but also in parallel or individually, even if they are not necessarily processed in chronological order. It also includes the processing to be executed.
1・・・公報評価装置、11・・・CPU、12・・・ROM、13・・・RAM、14・・・バス、15・・・入出力インターフェース、16・・・入力部、17・・・出力部、18・・・記憶部、19・・・通信部、20・・・ドライブ、31・・・リムーバブルメディア、41・・・クレーム単語頻度分布生成部、42・・・明細書単語頻度分布生成部、43・・・明細書類義語頻度分布生成部、44・・・評価情報生成部、51・・・重み付け部、61・・・公報情報DB 1 ... Publication evaluation device, 11 ... CPU, 12 ... ROM, 13 ... RAM, 14 ... Bus, 15 ... Input / output interface, 16 ... Input unit, 17 ... -Output unit, 18 ... Storage unit, 19 ... Communication unit, 20 ... Drive, 31 ... Removable media, 41 ... Claim word frequency distribution generation unit, 42 ... Specification word frequency Distribution generation unit, 43 ... Detailed document frequency distribution generation unit, 44 ... Evaluation information generation unit, 51 ... Weighting unit, 61 ... Publication information DB
Claims (8)
当該公報に含まれ得る第2書類の内容を前記単位情報に分離して、分離後の前記単位情報の頻度分布を示す第2情報を生成する第2情報生成手段と、
前記第1情報と前記第2情報とに基づいて、前記公報の内容を評価する評価情報を生成する評価情報生成手段と、
を備える情報処理装置。 The content of the first document that can be included in the publication on intellectual property rights is separated into predetermined unit information consisting of characters, figures, symbols, or a combination thereof, and the frequency distribution of the unit information after separation is shown. 1 The first information generation means for generating information and
A second information generating means that separates the contents of the second document that can be included in the publication into the unit information and generates the second information indicating the frequency distribution of the unit information after the separation.
An evaluation information generating means for generating evaluation information for evaluating the contents of the publication based on the first information and the second information.
Information processing device equipped with.
前記評価情報生成手段は、前記第1情報と前記第3情報とに基づいて、前記評価情報を生成する、
請求項1に記載の情報処理装置。 A third group in which each unit information in the second information is classified into a plurality of groups corresponding to each of the plurality of unit information in the first information, and the frequency distribution in each of the plurality of groups after classification is shown. Further equipped with a third information generation means for generating information,
The evaluation information generating means generates the evaluation information based on the first information and the third information.
The information processing device according to claim 1.
前記第1情報おける前記各単位情報の前記スコアの総合値に基づいて、前記評価情報を生成する、
請求項2に記載の情報処理装置。 The evaluation information generating means calculates a score based on the ranking difference from the corresponding group in the third information for each unit information in the first information.
The evaluation information is generated based on the total value of the scores of the unit information in the first information.
The information processing device according to claim 2.
請求項3に記載の情報処理装置。 The evaluation information generating means weights the score based on the order of each unit information in the first information.
The information processing device according to claim 3.
請求項3に記載の情報処理装置。 The evaluation information generating means weights the score for each unit information of the first information based on the degree of association with each unit information belonging to the corresponding group in the third information.
The information processing device according to claim 3.
請求項3に記載の情報処理装置。 The evaluation information generating means removes noise information from the unit information of the first information, and the evaluation information is based on the total value of the score for each unit information after the noise information is removed. To generate,
The information processing device according to claim 3.
知的財産権に関する公報に含まれ得る第1書類の内容を、文字、図形、記号、又はそれらの結合からなる所定の単位情報に分離して、分離後の前記単位情報の頻度分布を示す第1情報を生成する第1情報生成ステップと、
当該公報に含まれ得る第2書類の内容を前記単位情報に分離して、分離後の前記単位情報の頻度分布を示す第2情報を生成する第2情報生成ステップと、
前記第1情報と前記第2情報とに基づいて、前記公報の内容を評価する評価情報を生成する評価情報生成ステップと、
を含む情報処理方法。 In the information processing method executed by the information processing device
The content of the first document that can be included in the publication on intellectual property rights is separated into predetermined unit information consisting of characters, figures, symbols, or a combination thereof, and the frequency distribution of the unit information after separation is shown. 1 The first information generation step to generate information and
A second information generation step of separating the contents of the second document that can be included in the publication into the unit information and generating the second information indicating the frequency distribution of the unit information after the separation.
An evaluation information generation step for generating evaluation information for evaluating the contents of the publication based on the first information and the second information.
Information processing methods including.
知的財産権に関する公報に含まれ得る第1書類の内容を、文字、図形、記号、又はそれらの結合からなる所定の単位情報に分離して、分離後の前記単位情報の頻度分布を示す第1情報を生成する第1情報生成ステップと、
当該公報に含まれ得る第2書類の内容を前記単位情報に分離して、分離後の前記単位情報の頻度分布を示す第2情報を生成する第2情報生成ステップと、
前記第1情報と前記第2情報とに基づいて、前記公報の内容を評価する評価情報を生成する評価情報生成ステップと、
を含む制御処理を実行させるプラグラム。 On the computer
The content of the first document that can be included in the publication on intellectual property rights is separated into predetermined unit information consisting of characters, figures, symbols, or a combination thereof, and the frequency distribution of the unit information after separation is shown. 1 The first information generation step to generate information and
A second information generation step of separating the contents of the second document that can be included in the publication into the unit information and generating the second information indicating the frequency distribution of the unit information after the separation.
An evaluation information generation step for generating evaluation information for evaluating the contents of the publication based on the first information and the second information.
A program that executes a control process that includes.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020118607A JP7178388B2 (en) | 2020-07-09 | 2020-07-09 | Information processing device and method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020118607A JP7178388B2 (en) | 2020-07-09 | 2020-07-09 | Information processing device and method, and program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016198076A Division JP6734174B2 (en) | 2016-10-06 | 2016-10-06 | Information processing equipment |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020173849A true JP2020173849A (en) | 2020-10-22 |
JP7178388B2 JP7178388B2 (en) | 2022-11-25 |
Family
ID=72831560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020118607A Active JP7178388B2 (en) | 2020-07-09 | 2020-07-09 | Information processing device and method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7178388B2 (en) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002132790A (en) * | 2000-10-26 | 2002-05-10 | Seiko Epson Corp | Method and device for preparing retrieval knowledge for document retrieval |
JP2002245067A (en) * | 2001-02-14 | 2002-08-30 | Mitsubishi Electric Corp | Information retrieval unit |
JP2004280756A (en) * | 2003-03-19 | 2004-10-07 | Patolis Corp | Patent specification analysis system, patent specification analysis method, computer-readable recording medium recording program, and program |
JP2004361992A (en) * | 2003-05-30 | 2004-12-24 | Toshiba Corp | Related word extracting device, related word extracting method, and program |
JP2005301856A (en) * | 2004-04-15 | 2005-10-27 | Hitachi Ltd | Method and program for document retrieval, and document retrieving device executing the same |
WO2009001696A1 (en) * | 2007-06-22 | 2008-12-31 | Patent Result Co., Ltd. | Information processing device, program and information processing method |
JP2009086944A (en) * | 2007-09-28 | 2009-04-23 | Fuji Xerox Co Ltd | Information processor and information processing program |
WO2009150758A1 (en) * | 2008-06-13 | 2009-12-17 | 株式会社パテント・リザルト | Information processing device, program and information processing method |
-
2020
- 2020-07-09 JP JP2020118607A patent/JP7178388B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002132790A (en) * | 2000-10-26 | 2002-05-10 | Seiko Epson Corp | Method and device for preparing retrieval knowledge for document retrieval |
JP2002245067A (en) * | 2001-02-14 | 2002-08-30 | Mitsubishi Electric Corp | Information retrieval unit |
JP2004280756A (en) * | 2003-03-19 | 2004-10-07 | Patolis Corp | Patent specification analysis system, patent specification analysis method, computer-readable recording medium recording program, and program |
JP2004361992A (en) * | 2003-05-30 | 2004-12-24 | Toshiba Corp | Related word extracting device, related word extracting method, and program |
JP2005301856A (en) * | 2004-04-15 | 2005-10-27 | Hitachi Ltd | Method and program for document retrieval, and document retrieving device executing the same |
WO2009001696A1 (en) * | 2007-06-22 | 2008-12-31 | Patent Result Co., Ltd. | Information processing device, program and information processing method |
JP2009086944A (en) * | 2007-09-28 | 2009-04-23 | Fuji Xerox Co Ltd | Information processor and information processing program |
WO2009150758A1 (en) * | 2008-06-13 | 2009-12-17 | 株式会社パテント・リザルト | Information processing device, program and information processing method |
Also Published As
Publication number | Publication date |
---|---|
JP7178388B2 (en) | 2022-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200227026A1 (en) | System and method for using a question and answer engine | |
US20060294099A1 (en) | Document classification program, vector transformation program, lexical-distortion cancellation program, document classification method, and document classification apparatus | |
US20100287148A1 (en) | Method, System, and Apparatus for Targeted Searching of Multi-Sectional Documents within an Electronic Document Collection | |
WO2019049483A1 (en) | Synonym dictionary creation device, synonym dictionary creation program, and synonym dictionary creation method | |
US20220156634A1 (en) | Training Data Augmentation for Machine Learning | |
US11768958B2 (en) | System and method for objective quantification and mitigation of privacy risk | |
US11822589B2 (en) | Method and system for performing summarization of text | |
CN112434884A (en) | Method and device for establishing supplier classified portrait | |
McDonald et al. | A study of SVM kernel functions for sensitivity classification ensembles with POS sequences | |
WO2008062822A1 (en) | Text mining device, text mining method and text mining program | |
Zhao et al. | APIMatchmaker: Matching the right APIs for supporting the development of Android apps | |
JP6023254B1 (en) | Information processing apparatus and method, and program | |
JPWO2020065943A1 (en) | Security evaluation device, security evaluation method and security evaluation program | |
JP2020173849A (en) | Information processing device, method, and program | |
JP3787310B2 (en) | Keyword determination method, apparatus, program, and recording medium | |
AU2009345829A1 (en) | Method, system, and apparatus for targeted searching of multi-sectional documents within an electronic document collection | |
WO2011013587A1 (en) | Document data processing device | |
JP6734174B2 (en) | Information processing equipment | |
CN112668334B (en) | Entity identification method, electronic equipment and storage device | |
US20240104310A1 (en) | Adaptable Transformer Models via Key Term Replacement | |
JP6790488B2 (en) | Evaluation device, evaluation method and evaluation program | |
Das et al. | Prioritizing Public Grievance Redressal Using Text Mining and Sentimental Analysis | |
Lashkevich et al. | Discovery of improvement opportunities in knock-out checks of business processes | |
WO2021192050A1 (en) | Analysis assistance program, system, and method | |
CN112184275B (en) | Crowd subdivision method, device, equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200811 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200811 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211215 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220729 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220729 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220809 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220816 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7178388 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |