JP4674871B2 - Information processing apparatus and information processing method - Google Patents

Information processing apparatus and information processing method Download PDF

Info

Publication number
JP4674871B2
JP4674871B2 JP2007542309A JP2007542309A JP4674871B2 JP 4674871 B2 JP4674871 B2 JP 4674871B2 JP 2007542309 A JP2007542309 A JP 2007542309A JP 2007542309 A JP2007542309 A JP 2007542309A JP 4674871 B2 JP4674871 B2 JP 4674871B2
Authority
JP
Japan
Prior art keywords
information
patent document
document information
sample
representative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007542309A
Other languages
Japanese (ja)
Other versions
JPWO2007052460A1 (en
Inventor
英和 谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IRD CORP
Original Assignee
IRD CORP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IRD CORP filed Critical IRD CORP
Publication of JPWO2007052460A1 publication Critical patent/JPWO2007052460A1/en
Application granted granted Critical
Publication of JP4674871B2 publication Critical patent/JP4674871B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q90/00Systems or methods specially adapted for administrative, commercial, financial, managerial or supervisory purposes, not involving significant data processing

Landscapes

  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、特許価値情報や特許特性情報を算出する情報処理装置等に関する。   The present invention relates to an information processing apparatus that calculates patent value information and patent characteristic information.

従来、特許の価値を算出する場合に、所定の式を決定し、その式に基づいて特許の価値を算出することが行われていた(例えば、特許文献1参照)。
国際公開第2004/038628号パンフレット
Conventionally, when calculating the value of a patent, a predetermined formula is determined, and the value of the patent is calculated based on the formula (see, for example, Patent Document 1).
International Publication No. 2004/038628 Pamphlet

しかしながら、特許の価値には主観的な評価の要素が存在するため、評価を行うユーザに応じて、特許の価値を算出するための式が異なる場合が多い。すなわち、ユーザは主観的な評価を行うのが一般的である。したがって、ユーザごとに特許の価値を算出するための式を変更しなければならず、その式を変更するための煩雑な作業を行わなければならないという問題があった。   However, since there is a subjective evaluation element in the value of a patent, the formula for calculating the value of a patent often differs depending on the user performing the evaluation. That is, the user generally performs subjective evaluation. Therefore, the formula for calculating the value of the patent has to be changed for each user, and there is a problem that a complicated operation for changing the formula has to be performed.

本発明は、上記課題を解決するためになされたものであり、ユーザごとに特許の価値等を算出するための式を設定するという煩雑な作業を行うことなく、各ユーザの主観的な評価の要素を考慮した特許の価値等の算出を行うことができる情報処理装置等を提供することを目的とする。   The present invention has been made in order to solve the above-described problems, and it is possible to perform subjective evaluation of each user without performing a complicated operation of setting an expression for calculating the value of a patent for each user. An object of the present invention is to provide an information processing apparatus or the like that can calculate the value of a patent in consideration of factors.

上記目的を達成するため、本発明による情報処理装置は、特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報が記憶される文書属性情報記憶部と、教師情報として用いられる文書属性情報であるサンプル文書属性情報が記憶されるサンプル文書属性情報記憶部と、前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル特許価値情報が記憶されるサンプル特許価値情報記憶部と、前記サンプル文書属性情報記憶部が記憶しているサンプル文書属性情報と、前記サンプル特許価値情報記憶部が記憶しているサンプル特許価値情報とを教師情報として、前記文書属性情報記憶部が記憶している文書属性情報から、特許文書情報の価値を示す情報である特許価値情報を算出する特許価値情報算出部と、前記特許価値情報算出部が算出した特許価値情報を出力する特許価値情報出力部と、を具備するものである。   In order to achieve the above object, an information processing apparatus according to the present invention stores information acquired from patent document information that is information related to a patent document, and document attribute information that is information indicating an attribute of the patent document information. Document attribute information storage unit, sample document attribute information storage unit storing sample document attribute information which is document attribute information used as teacher information, and sample document attribute information stored in the sample document attribute information storage unit Sample patent value information storage unit storing sample patent value information which is information indicating the value of patent document information and is used as teacher information, and the sample document attribute information storage unit stores The sample document attribute information and the sample patent value information stored in the sample patent value information storage unit are used as teacher information. Patent value information calculation unit for calculating patent value information, which is information indicating the value of patent document information, from the document attribute information stored in the document attribute information storage unit, and the patent value calculated by the patent value information calculation unit And a patent value information output unit for outputting information.

このような構成により、ユーザごとに特許の価値を算出するための式を設定するという煩雑な作業を行うことなく、特許文書情報の文書属性情報から、各ユーザの主観的な評価の要素を考慮した特許の価値を算出することができる。   With such a configuration, the subjective evaluation elements of each user are taken into account from the document attribute information of the patent document information without performing the complicated work of setting an expression for calculating the patent value for each user. The value of a patent that has been acquired can be calculated.

また、本発明による情報処理装置では、前記特許価値情報算出部は、サポートベクターマシンにより特許価値情報を算出してもよい。
このような構成により、サポートベクターマシンを用いて特許価値情報を算出することができ、未学習データに対して高い汎化性能を得ることができる。
In the information processing apparatus according to the present invention, the patent value information calculation unit may calculate the patent value information using a support vector machine.
With such a configuration, patent value information can be calculated using a support vector machine, and high generalization performance can be obtained for unlearned data.

また、本発明による情報処理装置は、特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報が記憶される文書属性情報記憶部と、教師情報として用いられる文書属性情報であるサンプル文書属性情報が記憶されるサンプル文書属性情報記憶部と、前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報において発明の本質を抽出している程度を示す特性である発明本質抽出特性、特許文書情報において、発明にかかる出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程度を示す特性である強靱特性、特許文書情報において発明を展開している程度を示す特性である発明展開特性、及び特許文書情報において発明について実施可能に記載されている程度を示す特性である実施可能担保特性の群から選ばれる、特許文書情報の1以上の特性を示す情報であるサンプル特許特性情報が記憶されるサンプル特許特性情報記憶部と、前記サンプル文書属性情報記憶部が記憶しているサンプル文書属性情報と、前記サンプル特許特性情報記憶部が記憶しているサンプル特許特性情報とを教師情報として、前記文書属性情報記憶部が記憶している文書属性情報から、特許文書情報の特性を示す情報である特許特性情報を算出する特許特性情報算出部と、前記特許特性情報算出部が算出した特許特性情報を出力する特許特性情報出力部と、を具備するものである。   Further, the information processing apparatus according to the present invention is document attribute information that is acquired from patent document information that is information relating to a patent document, and that stores document attribute information that is information indicating an attribute of the patent document information. Information corresponding to the sample document attribute information stored in the storage unit, the sample document attribute information storage unit storing sample document attribute information which is document attribute information used as teacher information, and the sample document attribute information storage unit Yes, the invention essence extraction characteristic, which is a characteristic indicating the degree to which the essence of the invention is extracted from the patent document information, used as teacher information, the extent to which the application concerning the invention is rejected in the patent document information, or the invention The toughness characteristics that indicate the extent to which such patents become invalid, and the characteristics that indicate the extent to which the invention is developed in patent document information Sample patent characteristic information which is information indicating one or more characteristics of patent document information selected from a group of enablement collateral characteristics, which is a characteristic indicating the degree to which the invention is described as being feasible in the patent document information. Teacher information including a sample patent characteristic information storage unit storing sample document attribute information stored in the sample document attribute information storage unit and sample patent characteristic information stored in the sample patent characteristic information storage unit The patent property information calculation unit that calculates the patent property information that is the information indicating the characteristics of the patent document information from the document attribute information stored in the document attribute information storage unit, and the patent property information calculation unit A patent characteristic information output unit that outputs the patent characteristic information.

このような構成により、ユーザごとに特許の特性を算出するための式を設定するという煩雑な作業を行うことなく、特許文書情報の文書属性情報から、各ユーザの主観的な評価の要素を考慮した特許の特性を算出することができる。   With such a configuration, the subjective evaluation elements of each user are taken into account from the document attribute information of the patent document information without performing the complicated work of setting an expression for calculating the patent characteristics for each user. Patent properties can be calculated.

また、本発明による情報処理装置では、前記特許特性情報算出部は、サポートベクターマシンにより特許特性情報を算出してもよい。
このような構成により、サポートベクターマシンを用いて特許特性情報を算出することができ、未学習データに対して高い汎化性能を得ることができる。
In the information processing apparatus according to the present invention, the patent characteristic information calculation unit may calculate patent characteristic information using a support vector machine.
With such a configuration, patent characteristic information can be calculated using a support vector machine, and high generalization performance can be obtained for unlearned data.

また、本発明による情報処理装置では、1以上の特許文書情報が記憶される特許文書情報記憶部と、前記特許文書情報記憶部が記憶している特許文書情報から文書属性情報を取得する文書属性情報取得部と、前記文書属性情報取得部が取得した文書属性情報を前記文書属性情報記憶部に蓄積する文書属性情報蓄積部と、をさらに具備してもよい。   In the information processing apparatus according to the present invention, a patent document information storage unit that stores one or more patent document information, and a document attribute that acquires document attribute information from the patent document information stored in the patent document information storage unit You may further comprise an information acquisition part and the document attribute information storage part which accumulate | stores the document attribute information which the said document attribute information acquisition part acquired in the said document attribute information storage part.

このような構成により、特許文書情報から文書属性情報を取得し、その文書属性情報から、特許価値情報や特許特性情報等を算出することができる。したがって、文書属性情報取得部が取得した文書属性情報については、ユーザ等が手入力等によって入力する必要がなく、ユーザ等の負担が軽減されている。   With such a configuration, document attribute information can be acquired from patent document information, and patent value information, patent characteristic information, and the like can be calculated from the document attribute information. Therefore, it is not necessary for the user or the like to input the document attribute information acquired by the document attribute information acquisition unit by manual input or the like, and the burden on the user or the like is reduced.

また、本発明による情報処理装置では、前記特許文書情報記憶部では、前記サンプル文書属性情報を算出するための特許文書情報であるサンプル特許文書情報も記憶され、前記文書属性情報取得部は、前記サンプル特許文書情報からサンプル文書属性情報を取得し、前記文書属性情報蓄積部は、前記文書属性情報取得部が算出したサンプル文書属性情報を前記サンプル文書属性情報記憶部に蓄積してもよい。   In the information processing apparatus according to the present invention, the patent document information storage unit also stores sample patent document information that is patent document information for calculating the sample document attribute information, and the document attribute information acquisition unit Sample document attribute information may be acquired from sample patent document information, and the document attribute information storage unit may store the sample document attribute information calculated by the document attribute information acquisition unit in the sample document attribute information storage unit.

このような構成により、サンプル文書属性情報も、前述の文書属性情報と同様に、特許文書情報から取得することができ、そのサンプル文書属性情報を用いて、特許価値情報や特許特性情報を算出することができる。したがって、文書属性情報取得部が取得したサンプル文書属性情報については、ユーザ等が手入力等によって入力する必要がなく、ユーザ等の負担が軽減されている。   With such a configuration, sample document attribute information can also be obtained from patent document information, similar to the above-described document attribute information, and patent value information and patent characteristic information are calculated using the sample document attribute information. be able to. Therefore, the sample document attribute information acquired by the document attribute information acquisition unit does not need to be input manually by the user or the like, and the burden on the user or the like is reduced.

また、本発明による情報処理装置は、特許の文書に関する情報である特許文書情報において発明の本質を抽出している程度を示す特性である発明本質抽出特性、特許文書情報において、発明にかかる出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程度を示す特性である強靱特性、特許文書情報において発明を展開している程度を示す特性である発明展開特性、及び特許文書情報において発明について実施可能に記載されている程度を示す特性である実施可能担保特性の群から選ばれる、特許文書情報の1以上の特性を示す情報である特許特性情報が記憶される特許特性情報記憶部と、教師情報として用いられる特許特性情報であるサンプル特許特性情報が記憶されるサンプル特許特性情報記憶部と、前記サンプル特許特性情報記憶部で記憶されるサンプル特許特性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル特許価値情報が記憶されるサンプル特許価値情報記憶部と、前記サンプル特許特性情報記憶部が記憶しているサンプル特許特性情報と、前記サンプル特許価値情報記憶部が記憶しているサンプル特許価値情報とを教師情報として、前記特許特性情報記憶部が記憶している特許特性情報から、特許文書情報の価値を示す情報である特許価値情報を算出する特許価値情報算出部と、前記特許価値情報算出部が算出した特許価値情報を出力する特許価値情報出力部と、を具備するものである。   In addition, the information processing apparatus according to the present invention has an invention essence extraction characteristic, which is a characteristic indicating the degree to which the essence of the invention is extracted from patent document information, which is information relating to a patent document, and patent application information. Inventions in toughness characteristics that indicate the degree of rejection or the ineffectiveness of patents relating to the invention, invention development characteristics that indicate the degree to which the invention is developed in patent document information, and patent document information A patent characteristic information storage unit for storing patent characteristic information, which is information indicating one or more characteristics of patent document information, selected from the group of feasible collateral characteristics that are characteristics indicating the degree of being described as feasible A sample patent characteristic information storage unit for storing sample patent characteristic information, which is patent characteristic information used as teacher information, and the sample patent characteristic A sample patent value information storage unit for storing sample patent value information, which is information corresponding to the sample patent characteristic information stored in the information storage unit, and used as teacher information and indicating the value of the patent document information; The patent characteristic information storage unit stores the sample patent characteristic information stored in the sample patent characteristic information storage unit and the sample patent value information stored in the sample patent value information storage unit as teacher information. Patent value information calculation unit that calculates patent value information that is information indicating the value of patent document information from patent characteristic information that is present, and patent value information output unit that outputs the patent value information calculated by the patent value information calculation unit, Are provided.

このような構成により、ユーザごとに特許の価値を算出するための式を設定するという煩雑な作業を行うことなく、特許特性情報から、各ユーザの主観的な評価の要素を考慮した特許の価値を算出することができる。   With such a configuration, the patent value considering the factors of subjective evaluation of each user can be obtained from the patent characteristic information without performing the complicated work of setting the formula for calculating the patent value for each user. Can be calculated.

また、本発明による情報処理装置では、前記特許価値情報算出部は、サポートベクターマシンにより特許価値情報を算出してもよい。
このような構成により、サポートベクターマシンを用いて特許価値情報を算出することができ、未学習データに対して高い汎化性能を得ることができる。
In the information processing apparatus according to the present invention, the patent value information calculation unit may calculate the patent value information using a support vector machine.
With such a configuration, patent value information can be calculated using a support vector machine, and high generalization performance can be obtained for unlearned data.

また、本発明による情報処理装置では、前記サポートベクターマシンは、多クラスのクラス分類を行うものであってもよい。
このような構成により、特許の価値や特許の特性を3以上のクラスに分類することができうる。
In the information processing apparatus according to the present invention, the support vector machine may perform multi-class classification.
With such a configuration, patent value and patent characteristics can be classified into three or more classes.

また、本発明による情報処理装置では、前記サポートベクターマシンは、実数値を出力とするものであってもよい。
このような構成により、特許の価値や特許の特性を実数値で算出することができうる。
In the information processing apparatus according to the present invention, the support vector machine may output a real value.
With such a configuration, the value of the patent and the characteristics of the patent can be calculated with real values.

また、本発明による情報処理装置では、前記サポートベクターマシンは、2値のクラス分類を行うものであってもよい。
このような構成により、特許の価値や特許の特性を2値に分類することができ、例えば、特許文書情報を特許の価値が高いもの、低いものに分類してもよく、あるいは、特許文書情報を特許の特性(例えば、発明本質抽出特性など)が高いもの、低いものに分類してもよい。
In the information processing apparatus according to the present invention, the support vector machine may perform binary classification.
With such a configuration, it is possible to classify patent values and patent characteristics into binary values. For example, patent document information may be classified into high and low patent values, or patent document information. May be classified into those having high patent characteristics (for example, invention essential extraction characteristics) and those having low characteristics.

また、本発明による情報処理装置では、前記文書属性情報記憶部で記憶されている文書属性情報のうち、数値でないものを数値化して前記文書属性情報記憶部に蓄積する文書属性情報数値化部をさらに備えてもよい。
このような構成により、数値でない文書属性情報を、数値の文書属性情報に数値化することができる。その結果、例えば、特許価値情報算出部や、特許特性情報算出部が数値の文書属性情報を用いて特許価値情報等の算出を行う場合に、より多くの文書属性情報を用いて特許価値情報等を算出できることとなり、より適切な特許価値情報等の算出を行うことができるようになりうる。
In the information processing apparatus according to the present invention, a document attribute information digitizing unit that digitizes non-numeric values of document attribute information stored in the document attribute information storage unit and accumulates the document attribute information in the document attribute information storage unit. Further, it may be provided.
With this configuration, non-numeric document attribute information can be digitized into numeric document attribute information. As a result, for example, when the patent value information calculation unit or the patent characteristic information calculation unit calculates patent value information or the like using numerical document attribute information, the patent value information or the like using more document attribute information or the like. Can be calculated, and more appropriate patent value information and the like can be calculated.

また、本発明による情報処理装置では、前記文書属性情報数値化部は、非数値の文書属性情報と、数値の文書属性情報とを対応付けて有する情報である数値化対応情報を記録媒体において保持しており、前記数値化対応情報を用いて、数値でない文書属性情報を数値の文書属性情報に変換してもよい。
このような構成により、数値化対応情報を用いて、数値でない文書属性情報の数値化を行うことができる。数値化対応情報を用いた数値化では、非数値の文書属性情報と、数値の文書属性情報との対応付けを任意に設定することができるため、より適切な対応関係となるように設定することによって、より適切な特許価値情報等の算出を行うことができるようになりうる。
Also, in the information processing apparatus according to the present invention, the document attribute information digitizing unit holds digitization correspondence information, which is information having non-numeric document attribute information and numeric document attribute information in association with each other in a recording medium. The document attribute information that is not a numerical value may be converted into numerical document attribute information using the digitization correspondence information.
With such a configuration, it is possible to digitize document attribute information that is not a numeric value using the digitization correspondence information. In the digitization using the digitization correspondence information, the correspondence between the non-numeric document attribute information and the numeric document attribute information can be arbitrarily set, so that the correspondence relationship is more appropriate. Thus, it is possible to calculate more appropriate patent value information and the like.

また、本発明による情報処理装置では、前記分所属性情報数値化部は、前記サンプル文書属性情報記憶部で記憶されているサンプル文書属性情報のうち、数値でないものを数値化して前記サンプル文書属性情報記憶部に蓄積してもよい。
このような構成により、数値でないサンプル文書属性情報を、数値のサンプル文書属性情報に数値化することができる。
In the information processing apparatus according to the present invention, the segregation information quantification unit quantifies non-numeric values among the sample document attribute information stored in the sample document attribute information storage unit, and samples the sample document attributes. You may accumulate | store in an information storage part.
With this configuration, non-numeric sample document attribute information can be digitized into numeric sample document attribute information.

本発明による情報処理装置等によれば、ユーザ等が特許の価値等を算出するための式を設定することなく、特許の価値等の算出を行うことができる。   According to the information processing apparatus or the like according to the present invention, it is possible to calculate the value of a patent or the like without setting an expression for the user or the like to calculate the value or the like of a patent.

以下、本発明による情報処理装置について、実施の形態を用いて説明する。なお、以下の実施の形態において、同じ符号を付した構成要素及びステップは同一または相当するものであり、再度の説明を省略することがある。   Hereinafter, an information processing apparatus according to the present invention will be described using embodiments. In the following embodiments, components and steps denoted by the same reference numerals are the same or equivalent, and repetitive description may be omitted.

(実施の形態1)
本発明の実施の形態1による情報処理装置について、図面を参照しながら説明する。
図1は、本実施の形態による情報処理装置1の構成を示すブロック図である。図1において、本実施の形態による情報処理装置1は、特許文書情報記憶部11と、文書属性情報取得部12と、文書属性情報蓄積部13と、文書属性情報記憶部14と、サンプル文書属性情報記憶部15と、サンプル特許価値情報受付部16と、サンプル特許価値情報蓄積部17と、サンプル特許価値情報記憶部18と、特許価値情報算出部19と、特許価値情報出力部20とを備える。
(Embodiment 1)
An information processing apparatus according to Embodiment 1 of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a configuration of an information processing apparatus 1 according to the present embodiment. In FIG. 1, an information processing apparatus 1 according to the present embodiment includes a patent document information storage unit 11, a document attribute information acquisition unit 12, a document attribute information storage unit 13, a document attribute information storage unit 14, and a sample document attribute. An information storage unit 15, a sample patent value information receiving unit 16, a sample patent value information storage unit 17, a sample patent value information storage unit 18, a patent value information calculation unit 19, and a patent value information output unit 20 are provided. .

特許文書情報記憶部11では、1以上の特許文書情報が記憶される。ここで、特許文書情報とは、特許の文書に関する情報である。特許文書情報は、例えば、特許庁等によって公開される特許公開公報や特許公報の情報であってもよく、特許庁への電子出願時に用いられる明細書等を示す情報であってもよい。一の特許文書情報が、一の特許出願、あるいは一の特許に対応する情報であるとする。特許文書情報は、例えば、1以上の請求項を含む特許請求の範囲を示す情報、1以上の実施の形態を含む明細書を示す情報、要約書を示す情報、出願人や国際特許分類、出願番号等の出願の書誌的事項を示す情報などの任意の2以上の情報を含むものであってもよい。特許文書情報は、例えば、キーボードやマウス、タブレット、タッチパネルなどの入力デバイスを用いて入力された情報であってもよく、あるいは、紙媒体に印刷された公報等を光学的にスキャナで読み取り、その読み取った画像データに対してOCRソフトウェアを用いてテキスト変換された情報であってもよい。特許文書情報は、例えば、テキストデータであってもよく、HTML等のマークアップ言語のデータであってもよく、XML等のメタ言語のデータであってもよく、明細書等の情報を示すものであれば、そのデータ形式を問わない。特許文書情報記憶部では、1以上のサンプル特許文書情報が記憶されていてもよい。ここで、サンプル特許文書情報とは、後述するサンプル文書属性情報を取得するために用いられる特許文書情報であり、それ以外は上述の特許文書情報と同様のものである。本実施の形態では、特許文書情報記憶部11でサンプル特許文書情報も記憶されているものとする。なお、特許文書情報とサンプル特許文書情報との違いは、後述するように、それらの情報がどのように用いられるかである。したがって、特許文書情報記憶部11で記憶されている段階では、特許文書情報とサンプル特許文書情報とを特に区別しなくてもよい。なお、両者を区別して、例えば、特許文書情報を所定の領域に格納し、サンプル特許文書情報を他の領域に格納するようにしてもよい。特許文書情報やサンプル特許文書情報が特許文書情報記憶部11で記憶される過程は問わない。例えば、記録媒体を介して特許文書情報等が特許文書情報記憶部11で記憶されるようになってもよく、通信回線等を介して送信された特許文書情報等が特許文書情報記憶部11で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された特許文書情報等が特許文書情報記憶部11で記憶されるようになってもよい。特許文書情報記憶部11は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。   The patent document information storage unit 11 stores one or more pieces of patent document information. Here, the patent document information is information relating to a patent document. The patent document information may be, for example, information on a patent publication published by a patent office or the like, or information indicating a specification or the like used at the time of electronic application to the patent office. It is assumed that one piece of patent document information is information corresponding to one patent application or one patent. Patent document information includes, for example, information indicating claims including one or more claims, information indicating specifications including one or more embodiments, information indicating abstracts, applicants and international patent classifications, applications It may include any two or more pieces of information such as information indicating the bibliographic items of the application such as numbers. Patent document information may be, for example, information input using an input device such as a keyboard, mouse, tablet, touch panel, etc., or a gazette printed on a paper medium is optically read by a scanner, The read image data may be information obtained by text conversion using OCR software. The patent document information may be, for example, text data, markup language data such as HTML, or meta language data such as XML, which indicates information such as a description. If so, the data format is not limited. In the patent document information storage unit, one or more pieces of sample patent document information may be stored. Here, the sample patent document information is patent document information used for acquiring sample document attribute information described later, and the rest is similar to the above-described patent document information. In the present embodiment, it is assumed that sample patent document information is also stored in the patent document information storage unit 11. The difference between the patent document information and the sample patent document information is how the information is used, as will be described later. Therefore, at the stage stored in the patent document information storage unit 11, it is not necessary to particularly distinguish the patent document information and the sample patent document information. For example, the patent document information may be stored in a predetermined area and the sample patent document information may be stored in another area. The process in which the patent document information and the sample patent document information are stored in the patent document information storage unit 11 does not matter. For example, patent document information or the like may be stored in the patent document information storage unit 11 via a recording medium, and patent document information or the like transmitted via a communication line or the like may be stored in the patent document information storage unit 11. The patent document information or the like input via the input device may be stored in the patent document information storage unit 11. The patent document information storage unit 11 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).

文書属性情報取得部12は、特許文書情報記憶部11が記憶している特許文書情報から文書属性情報を取得する。ここで、文書属性情報とは、特許文書情報から取得された情報であって、その特許文書情報の属性を示す情報である。文書属性情報を取得するとは、例えば、特許文書情報から特許文書情報の一部の情報を文書属性情報として単に読み出すことであってもよく、特許文書情報に対する形態素解析や、所定の情報の数のカウントなどの処理、あるいは、その他の処理等を実行して、文書属性情報を算出することであってもよい。文書属性情報の具体例と、その取得の方法については後述する。特許文書情報記憶部11がサンプル特許文書情報も記憶している場合に、文書属性情報取得部12は、そのサンプル特許文書情報からサンプル文書属性情報を取得してもよい。サンプル文書属性情報とは、教師情報として用いられる文書属性情報であり、それ以外は上述の文書属性情報と同様のものである。   The document attribute information acquisition unit 12 acquires document attribute information from the patent document information stored in the patent document information storage unit 11. Here, the document attribute information is information acquired from the patent document information, and is information indicating the attribute of the patent document information. Obtaining document attribute information may be, for example, simply reading out part of patent document information from the patent document information as document attribute information. For example, the morphological analysis of the patent document information or the number of predetermined information The document attribute information may be calculated by executing processing such as counting, or other processing. A specific example of document attribute information and a method for acquiring the document attribute information will be described later. When the patent document information storage unit 11 also stores sample patent document information, the document attribute information acquisition unit 12 may acquire sample document attribute information from the sample patent document information. The sample document attribute information is document attribute information used as teacher information, and is otherwise the same as the document attribute information described above.

文書属性情報蓄積部13は、文書属性情報取得部12が取得した文書属性情報を文書属性情報記憶部14に蓄積する。また、文書属性情報取得部12がサンプル文書属性情報も取得した場合には、そのサンプル文書属性情報をサンプル文書属性情報記憶部15に蓄積する。   The document attribute information storage unit 13 stores the document attribute information acquired by the document attribute information acquisition unit 12 in the document attribute information storage unit 14. When the document attribute information acquisition unit 12 also acquires sample document attribute information, the sample document attribute information is stored in the sample document attribute information storage unit 15.

文書属性情報記憶部14では、文書属性情報が記憶される。文書属性情報記憶部14での記憶は、例えば、RAM等における一時的な記憶でもよく、あるいは、フラッシュメモリや磁気ディスク等における長期的な記憶でもよい。文書属性情報記憶部14は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。   Document attribute information is stored in the document attribute information storage unit 14. The storage in the document attribute information storage unit 14 may be temporary storage in a RAM or the like, or may be long-term storage in a flash memory or a magnetic disk, for example. The document attribute information storage unit 14 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).

サンプル文書属性情報記憶部15では、サンプル文書属性情報が記憶される。サンプル文書属性情報記憶部15での記憶は、例えば、RAM等における一時的な記憶でもよく、あるいは、フラッシュメモリや磁気ディスク等における長期的な記憶でもよい。サンプル文書属性情報記憶部15は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。   The sample document attribute information storage unit 15 stores sample document attribute information. The storage in the sample document attribute information storage unit 15 may be temporary storage in a RAM or the like, or may be long-term storage in a flash memory or a magnetic disk, for example. The sample document attribute information storage unit 15 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).

サンプル特許価値情報受付部16は、サンプル特許価値情報を受け付ける。ここで、サンプル特許価値情報とは、特許文書情報の価値を示す情報であり、サンプル文書属性情報記憶部15で記憶されるサンプル文書属性情報に対応する情報である。すなわち、あるサンプル特許文書情報の価値を示すサンプル特許価値情報がサンプル特許価値情報受付部16で受け付けられ、その同じサンプル特許文書情報から取得されたサンプル文書属性情報がサンプル文書属性情報記憶部15で記憶されることになる。サンプル特許価値情報は、教師情報として用いられる。サンプル特許価値情報受付部16は、例えば、入力デバイス(例えば、キーボードやマウス、タッチパネルなど)から入力された情報を受け付けてもよく、有線もしくは無線の通信回線を介して送信された情報を受信してもよく、所定の記録媒体(例えば、光ディスクや磁気ディスク、半導体メモリなど)から読み出された情報を受け付けてもよい。本実施の形態では、サンプル特許価値情報受付部16は、入力デバイスから入力されたサンプル特許価値情報を受け付けるものとする。なお、サンプル特許価値情報受付部16は、受け付けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んでもよく、あるいは含まなくてもよい。また、サンプル特許価値情報受付部16は、ハードウェアによって実現されてもよく、あるいは所定のデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。   The sample patent value information receiving unit 16 receives sample patent value information. Here, the sample patent value information is information indicating the value of the patent document information, and is information corresponding to the sample document attribute information stored in the sample document attribute information storage unit 15. That is, sample patent value information indicating the value of certain sample patent document information is received by the sample patent value information receiving unit 16, and sample document attribute information acquired from the same sample patent document information is stored in the sample document attribute information storage unit 15. Will be remembered. The sample patent value information is used as teacher information. For example, the sample patent value information receiving unit 16 may receive information input from an input device (for example, a keyboard, a mouse, a touch panel, etc.) and receive information transmitted via a wired or wireless communication line. Alternatively, information read from a predetermined recording medium (for example, an optical disk, a magnetic disk, a semiconductor memory, etc.) may be received. In the present embodiment, the sample patent value information reception unit 16 receives sample patent value information input from an input device. Note that the sample patent value information receiving unit 16 may or may not include a device (for example, a modem or a network card) for receiving. Further, the sample patent value information receiving unit 16 may be realized by hardware, or may be realized by software such as a driver that drives a predetermined device.

サンプル特許価値情報蓄積部17は、サンプル特許価値情報受付部16が受け付けたサンプル特許価値情報をサンプル特許価値情報記憶部18に蓄積する。
サンプル特許価値情報記憶部18では、サンプル特許価値情報が記憶される。サンプル特許価値情報記憶部18での記憶は、例えば、RAM等における一時的な記憶でもよく、あるいは、フラッシュメモリや磁気ディスク等における長期的な記憶でもよい。サンプル特許価値情報記憶部18は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。
The sample patent value information storage unit 17 stores the sample patent value information received by the sample patent value information reception unit 16 in the sample patent value information storage unit 18.
The sample patent value information storage unit 18 stores sample patent value information. The storage in the sample patent value information storage unit 18 may be temporary storage in a RAM or the like, or may be long-term storage in a flash memory or a magnetic disk, for example. The sample patent value information storage unit 18 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).

特許価値情報算出部19は、文書属性情報記憶部14が記憶している文書属性情報から、その文書属性情報に対応する特許文書情報の価値を示す特許価値情報を算出する。特許価値情報算出部19は、教師あり学習(supervised learning)によって特許価値情報を算出する。特許価値情報算出部19は、例えば、サポートベクターマシン(SVM:Support Vector Machine)により特許価値情報を算出してもよく、それ以外の方法を用いて特許価値情報を算出してもよい。本実施の形態では、特許価値情報算出部19は、サポートベクターマシンを用いて特許価値情報を算出するものとする。サポートベクターマシンについては、従来から公知であるため、その詳細な説明を省略する。特許価値情報算出部19は、サンプル文書属性情報記憶部15が記憶しているサンプル文書属性情報と、サンプル特許価値情報記憶部18が記憶しているサンプル特許価値情報とを教師情報として、特許価値情報を算出する。教師情報とは、教師あり学習において用いられる入力と出力とのペアの情報のことである。ここでは、サンプル文書属性情報が入力としての教師情報であり、サンプル特許価値情報が出力としての教師情報である。サポートベクターマシンでは、教師情報のことをトレーニングデータ(training data)と呼ぶこともある。なお、サポートベクターマシンは、2値のクラス分類を行うものであってもよく、多クラス(3クラス以上)のクラス分類を行うものであってもよく、実数値を出力とするものであってもよい。実数値を出力する場合には、サポートベクター回帰(SVR:Support Vector Regression)と呼ばれることもあるが、ここでは、サポートベクターマシンと呼ぶことにする。   The patent value information calculation unit 19 calculates patent value information indicating the value of the patent document information corresponding to the document attribute information from the document attribute information stored in the document attribute information storage unit 14. The patent value information calculation unit 19 calculates the patent value information by supervised learning. The patent value information calculation unit 19 may calculate the patent value information using, for example, a support vector machine (SVM: Support Vector Machine), or may calculate the patent value information using other methods. In the present embodiment, it is assumed that the patent value information calculation unit 19 calculates patent value information using a support vector machine. Since the support vector machine is conventionally known, its detailed description is omitted. The patent value information calculation unit 19 uses the sample document attribute information stored in the sample document attribute information storage unit 15 and the sample patent value information stored in the sample patent value information storage unit 18 as teacher information. Calculate information. The teacher information is information on a pair of input and output used in supervised learning. Here, sample document attribute information is teacher information as input, and sample patent value information is teacher information as output. In the support vector machine, the teacher information may be referred to as training data. The support vector machine may perform binary class classification, may perform multi-class (three or more classes) class classification, and outputs a real value. Also good. When outputting a real value, it may be called support vector regression (SVR), but here it will be called a support vector machine.

特許価値情報出力部20は、特許価値情報算出部19が算出した特許価値情報を出力する。ここで、この出力は、例えば、表示デバイス(例えば、CRTや液晶ディスプレイなど)への表示でもよく、所定の機器への通信回線を介した送信でもよく、プリンタによる印刷でもよく、スピーカによる音声出力でもよく、記録媒体への蓄積でもよい。なお、特許価値情報出力部20は、出力を行うデバイス(例えば、表示デバイスやプリンタなど)を含んでもよく、あるいは含まなくてもよい。また、特許価値情報出力部20は、ハードウェアによって実現されてもよく、あるいは、それらのデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。   The patent value information output unit 20 outputs the patent value information calculated by the patent value information calculation unit 19. Here, the output may be, for example, display on a display device (for example, a CRT or a liquid crystal display), transmission via a communication line to a predetermined device, printing by a printer, or audio output by a speaker. However, it may be stored in a recording medium. The patent value information output unit 20 may or may not include an output device (for example, a display device or a printer). In addition, the patent value information output unit 20 may be realized by hardware, or may be realized by software such as a driver that drives these devices.

なお、特許文書情報記憶部11と、文書属性情報記憶部14と、サンプル文書属性情報記憶部15と、サンプル特許価値情報記憶部18との任意の2以上の記憶部は、同一の記録媒体によって実現されてもよく、あるいは、別々の記録媒体によって実現されてもよい。前者の場合には、例えば、特許文書情報を記憶している領域が特許文書情報記憶部11となり、文書属性情報を記憶している領域が文書属性情報記憶部14となり、サンプル文書属性情報を記憶している領域がサンプル文書属性情報記憶部15となり、サンプル特許価値情報を記憶している領域がサンプル特許価値情報記憶部18となる。   Note that any two or more storage units of the patent document information storage unit 11, the document attribute information storage unit 14, the sample document attribute information storage unit 15, and the sample patent value information storage unit 18 are stored on the same recording medium. It may be realized or may be realized by a separate recording medium. In the former case, for example, an area storing patent document information is the patent document information storage unit 11, and an area storing document attribute information is the document attribute information storage unit 14, storing sample document attribute information. The area that stores the sample document attribute information storage unit 15, and the area that stores the sample patent value information becomes the sample patent value information storage unit 18.

ここで、文書属性情報について説明する。文書属性情報は、特許文書情報における請求項の数、特許文書情報における独立形式の請求項の数、特許文書情報における特許請求の範囲のカテゴリー数、特許文書情報における特許請求の範囲のネストレベル、特許文書情報における特許請求の範囲の文字数、特許文書情報における代表請求項の構成要素数、特許文書情報における代表請求項の読点の数、特許文書情報における代表請求項の文字数、特許文書情報における代表請求項の単位情報数、特許文書情報における代表請求項の前提部の文字数、特許文書情報における代表請求項の特徴部の文字数、特許文書情報における代表請求項の前提部の単位情報数、特許文書情報における代表請求項の特徴部の単位情報数、特許文書情報における代表請求項の代表構成要素の文字数、特許文書情報における代表請求項の代表構成要素の単位情報数、特許文書情報において引用されている特許文献数、特許文書情報において引用されている非特許文献数、特許文書情報における実施の形態の文字数、特許文書情報における実施の形態の単位情報数、特許文書情報における実施の形態での例示の数、特許文書情報における実施の形態での外延拡張表記の数、特許文書情報における実施の形態での数式の数、特許文書情報における実施の形態での化学式の数、特許文書情報における図面数、特許文書情報における構成を示す図の数、特許文書情報におけるフローチャートの数、特許文書情報におけるデータ構造を示す図の数、特許文書情報における画面出力を示す図の数、特許文書情報におけるハードウェア構成を示す図の数の群から選ばれる、1以上の属性を示す情報である。本実施の形態では、文書属性情報は、上記の全ての属性を示す情報であるとする。   Here, the document attribute information will be described. Document attribute information includes the number of claims in patent document information, the number of independent claims in patent document information, the number of categories of claims in patent document information, the nesting level of claims in patent document information, Number of characters in patent claims in patent document information, number of constituent elements in representative claims in patent document information, number of readings in representative claims in patent document information, number of characters in representative claims in patent document information, representative in patent document information Number of unit information of claim, number of characters of premise part of representative claim in patent document information, number of characters of characteristic part of representative claim in patent document information, number of unit information of premise part of representative claim in patent document information, patent document Number of unit information of characteristic part of representative claim in information, number of characters of representative component of representative claim in patent document information, patent document Number of unit information of representative component of representative claim in report, number of patent documents cited in patent document information, number of non-patent documents cited in patent document information, number of characters of embodiment in patent document information, patent The number of unit information in the embodiment in the document information, the number of examples in the embodiment in the patent document information, the number of extension extension notations in the embodiment in the patent document information, the formula in the embodiment in the patent document information The number of chemical formulas in the embodiment in the patent document information, the number of drawings in the patent document information, the number of diagrams showing the configuration in the patent document information, the number of flowcharts in the patent document information, and the data structure in the patent document information Selected from the group of number of figures, number of figures showing screen output in patent document information, number of figures showing hardware configuration in patent document information That is information indicating one or more attributes. In the present embodiment, it is assumed that the document attribute information is information indicating all the attributes described above.

ここで、文書属性情報取得部12は、特許文書情報における請求項の数として、特許請求の範囲における請求項の最も大きい番号を取得してもよい。例えば、[請求項5]等のタグの最も大きい番号が「5」であれば、請求項の数「5」を取得してもよい。文書属性情報取得部12は、特許文書情報における各請求項において、他の請求項を引用していない、すなわち、他の請求項の番号が含まれない請求項の数をカウントして独立形式の請求項の数を取得してもよい。文書属性情報取得部12は、特許文書情報における特許請求の範囲から各請求項の発明の名称を取得し、その発明の名称から各請求項のカテゴリーを判断し、異なるカテゴリー数をカウントすることにより、特許請求の範囲のカテゴリー数を取得してもよい。カテゴリーとは、例えば、装置、方法、プログラム等である。日本国特許法では、プログラムは装置のカテゴリーに入ることとなっているため、装置のカテゴリーと判断してもよく、あるいは、別のカテゴリーであると判断してもよい。各請求項から発明の名称を取得する方法としては、各請求項の末尾の単語を取得する方法がある。発明の名称からカテゴリーを判断する方法としては、発明の名称の語尾が「プログラム」であればプログラムのカテゴリーであると判断し、発明の名称の語尾が「方法」であれば方法のカテゴリーであると判断し、それ以外であれば装置のカテゴリーであると判断してもよい。特許請求の範囲のネストレベルとは、特許請求の範囲における請求項の階層の深さのことである。例えば、特許請求の範囲に請求項1から請求項3までがあり、請求項2が請求項1に従属しており、請求項3が請求項2に従属している場合には、特許請求の範囲のネストレベルは3となる。なお、ネストレベルは、特許請求の範囲の階層の深さのうち、最も深いものの値であるとする。文書属性情報取得部12は、各請求項からその請求項の従属している請求項を特定することを独立形式の請求項まで繰り返すことにより、各請求項の階層の深さを算出する。例えば、先の例の場合には、請求項1の階層の深さは「1」となり、請求項2の階層の深さは「2」となり、請求項3の階層の深さは「3」となる。文書属性情報取得部12は、その階層の深さのうち、一番深いもの(先の例では「3」)を、ネストレベルとして取得してもよい。   Here, the document attribute information acquisition unit 12 may acquire the largest number of claims in the claims as the number of claims in the patent document information. For example, if the largest tag number such as [Claim 5] is “5”, the number of claims “5” may be acquired. The document attribute information acquisition unit 12 counts the number of claims that do not include other claims in each claim in the patent document information, that is, does not include the number of other claims. The number of claims may be obtained. The document attribute information acquisition unit 12 acquires the name of the invention of each claim from the claims in the patent document information, determines the category of each claim from the name of the invention, and counts the number of different categories The number of categories in the claims may be acquired. A category is, for example, an apparatus, a method, a program, or the like. According to the Japanese Patent Law, since the program is in the device category, it may be determined as the device category or may be determined as another category. As a method for obtaining the name of the invention from each claim, there is a method for obtaining the last word of each claim. As a method of judging the category from the name of the invention, if the ending of the name of the invention is “program”, it is judged as the category of the program, and if the ending of the name of the invention is “method”, it is the category of the method. Otherwise, it may be determined that the device category. The nesting level of the claims is the depth of the claim hierarchy in the claims. For example, the claims include claims 1 to 3, claim 2 is dependent on claim 1, and claim 3 is dependent on claim 2, The range nesting level is 3. It is assumed that the nesting level is the deepest value among the depths of the claims. The document attribute information acquisition unit 12 calculates the depth of the hierarchy of each claim by repeating the identification of the dependent claims of each claim from each claim up to the independent claim. For example, in the case of the previous example, the depth of the hierarchy of claim 1 is “1”, the depth of the hierarchy of claim 2 is “2”, and the depth of the hierarchy of claim 3 is “3”. It becomes. The document attribute information acquisition unit 12 may acquire the deepest of the hierarchies (“3” in the previous example) as the nest level.

文書属性情報取得部12は、特許文書情報における特許請求の範囲の領域を特定し、その領域の文字数をカウントすることによって特許請求の範囲の文字数を取得してもよい。ここで、文字数をカウントする方法は従来から公知であり、その説明を省略する。文書属性情報取得部12は、特許文書情報における代表請求項における構成要素数をカウントし、そのカウント値を代表請求項の構成要素数として取得してもよい。なお、代表請求項とは、特許請求の範囲における代表的な請求項のことであり、例えば、1番目の請求項(請求項1)でもよく、あるいは、装置の請求項のうち、最も番号の小さい請求項でもよく、文字数が最も少ない請求項でもよく、その他のルールによって特定される請求項でもよい。また、請求項において構成要素数をカウントする方法としては、その請求項に含まれる「〜部」や、「〜手段」の個数を「部」や「手段」の前に付く言葉が重複しないように選択し、その選択した個数をカウントする方法や、「〜と、」といった構成要素を列挙するときに用いられる言葉の個数をカウントする方法などがある。文書属性情報取得部12は、特許文書情報における代表請求項の読点の数を、その代表請求項における読点「、」「,」をカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報における代表請求項の文字数を、その代表請求項の文字数をカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報における代表請求項の単位情報数を、その代表請求項について所定の解析を行って単位情報の数をカウントすることによって求めてもよい。ここで、単位情報とは、単語、文節、形態素、自立語などである。所定の解析とは、例えば、形態素解析等であり、文を単語、文節等の単位情報に分割する処理は従来から公知であるため、その説明を省略する。文書属性情報取得部12は、特許文書情報における代表請求項の前提部の文字数を、その代表請求項の先頭の文字から、「〜において」や「〜であって」等の前提部の最後の文字までの文字数をカウントすることによって取得してもよい。「において」や「であって」等の文字数を前提部の文字数に含めるかどうかなどは任意である。文書属性情報取得部12は、特許文書情報における代表請求項の特徴部の文字数を、その代表請求項の「〜において」や「〜であって」等の前提部の次の文字から、「〜を特徴とする」までの文字数をカウントすることによって取得してもよい。「を特徴とする」の文字数や、「を特徴とする」に続いて記載される発明の名称等の文字数を特徴部の文字数に含めるかどうかは任意である。文書属性情報取得部12は、特許文書情報における代表請求項の前提部の単位情報数を、前提部の文字数の場合と同様にして、形態素解析等を用いて単位情報数をカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報における代表請求項の特徴部の単位情報数を、特徴部の文字数の場合と同様にして、形態素解析等を用いて単位情報数をカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報における代表請求項の代表構成要素の文字数を、代表請求項の代表構成要素の文字数をカウントすることによって取得してもよい。ここで、代表構成要素とは、その請求項における代表的な構成要素のことであり、例えば、特徴部に1個の構成要素のみが存在する場合には、その構成要素を代表構成要素としてもよい。また、発明の詳細な説明(明細書)の効果の記載を参照し、その記載で言及されている構成要素を代表構成要素としてもよい。効果の記載は、「発明の効果」の欄の記載でもよく、一般に「以上のように、」や「このように、」等に続けて効果の記載がなされることが多いため、そのような導入句で始まるパラグラフの記載を効果の記載とみなしてもよい。文書属性情報取得部12は、請求項において、「〜部」や「〜手段」と記載されている「部」や「手段」を含む一連の単語を構成要素として抽出してもよく、あるいは、請求項において、「〜と、」と記載されている、その「と」の前の一連の単語を構成要素として抽出してもよい。一連の単語とは、例えば、漢字とカタカナからなる連続する単語のことである。文書属性情報取得部12は、例えば、「情報入力部」等を構成要素として抽出する。   The document attribute information acquisition unit 12 may acquire the number of characters in the claims by specifying the region of the claims in the patent document information and counting the number of characters in the region. Here, the method of counting the number of characters is conventionally known, and the description thereof is omitted. The document attribute information acquisition unit 12 may count the number of components in the representative claim in the patent document information and acquire the count value as the number of components in the representative claim. The representative claim is a representative claim in the scope of claims, and may be, for example, the first claim (Claim 1) or the most numbered claim among the claims of the apparatus. It may be a small claim, a claim with the least number of characters, or a claim specified by other rules. In addition, as a method of counting the number of constituent elements in a claim, the number of “˜part” or “˜means” included in the claim should not be duplicated before “part” or “means”. There are a method of counting and selecting the number of selected items, a method of counting the number of words used when enumerating components such as “to and”, and the like. The document attribute information acquisition unit 12 may acquire the number of reading points of the representative claim in the patent document information by counting the reading points “,” “,” in the representative claim. The document attribute information acquisition unit 12 may acquire the number of characters in the representative claim in the patent document information by counting the number of characters in the representative claim. The document attribute information acquisition unit 12 may obtain the number of unit information of the representative claim in the patent document information by performing a predetermined analysis on the representative claim and counting the number of unit information. Here, the unit information is a word, a phrase, a morpheme, an independent word, or the like. The predetermined analysis is, for example, morphological analysis and the like, and the process of dividing a sentence into unit information such as words and phrases is conventionally known, and thus the description thereof is omitted. The document attribute information acquisition unit 12 determines the number of characters of the premise part of the representative claim in the patent document information from the first character of the representative claim to the end of the premise part such as “in” or “to”. You may acquire by counting the number of characters to a character. Whether or not to include the number of characters such as “in” and “be” in the number of characters in the premise part is arbitrary. The document attribute information acquisition unit 12 calculates the number of characters of the characteristic part of the representative claim in the patent document information from the next character of the premise part such as “to” and “to” of the representative claim. May be obtained by counting the number of characters up to “characteristic”. Whether or not to include the number of characters “characteristic” or the number of characters such as the name of the invention described subsequent to “characteristic” in the character number of the characteristic part is arbitrary. The document attribute information acquisition unit 12 acquires the number of unit information of the premise part of the representative claim in the patent document information by counting the number of unit information using morphological analysis or the like, as in the case of the number of characters of the premise part. May be. The document attribute information acquisition unit 12 acquires the number of unit information of the characteristic part of the representative claim in the patent document information by counting the number of unit information using morphological analysis or the like, as in the case of the number of characters of the characteristic part. May be. The document attribute information acquisition unit 12 may acquire the number of characters of the representative component of the representative claim in the patent document information by counting the number of characters of the representative component of the representative claim. Here, the representative constituent element is a representative constituent element in the claims. For example, when there is only one constituent element in the characteristic part, the constituent element may be used as the representative constituent element. Good. In addition, referring to the description of the effect of the detailed description (specification) of the invention, the component referred to in the description may be used as the representative component. The description of the effect may be described in the column of “Effect of the invention”, and in general, the description of the effect is often made after “as described above”, “such as this”, etc. A paragraph beginning with an introductory phrase may be considered a statement of effect. The document attribute information acquisition unit 12 may extract a series of words including “part” or “means” described as “˜part” or “˜means” in the claims as a constituent element, or In the claims, a series of words before “to” described as “to” may be extracted as a constituent element. A series of words is a continuous word consisting of kanji and katakana, for example. For example, the document attribute information acquisition unit 12 extracts “information input unit” or the like as a constituent element.

ここで、代表構成要素を特定する一方法について、簡単に説明する。まず、上記のようにして文書属性情報取得部12は、効果の記載を特定すると共に、請求項から構成要素を抽出する。文書属性情報取得部12は、特定した効果の記載において、「〜により、・・・・できる。」や、「〜を備えたことで、・・・・できる。」といった効果の記載されている文をパターンマッチングにより特定する。次に、文書属性情報取得部12は、その特定された文において、効果を奏するための要因となる構成要素が記載されている部分(上の例では「〜」の部分)に、あらかじめ特許請求の範囲から抽出している構成要素が含まれるかどうか判断する。そして、含まれる場合には、その含まれる構成要素を代表構成要素としてもよい。   Here, one method for specifying the representative component will be briefly described. First, as described above, the document attribute information acquisition unit 12 specifies the description of the effect and extracts constituent elements from the claims. In the description of the identified effect, the document attribute information acquisition unit 12 describes an effect such as “can be done with ...” or “can be done with ...”. Identify sentences by pattern matching. Next, the document attribute information acquisition unit 12 claims in advance a portion (in the above example, “˜”) in which a component that is a factor for achieving an effect is described in the specified sentence. It is determined whether the component extracted from the range is included. If included, the included component may be the representative component.

文書属性情報取得部12は、特許文書情報における代表請求項の代表構成要素の単位情報数を、代表請求項の代表構成要素について形態素解析等を行って単位情報数をカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報において引用されている特許文献数を、「特許文献N」等の特許文献の見出しの数をカウントすることによって取得してもよく、「特許文献N」の最大のNの値を特定することによって取得してもよく、特許文献の記載の形式を有する記載が特許文書情報に何個あるかを重複しないように検索することによって取得してもよい。ここで、「N」は、任意の整数である。また、特許文献の記載の形式とは、例えば、「特開」と4桁の数字とハイフン「−」と6桁以内の数字とが順番に並んでいるという形式である。文書属性情報取得部12は、特許文書情報において引用されている非特許文献数を、「非特許文献N」等の非特許文献の見出しの数をカウントすることによって取得してもよく、「非特許文献N」の最大のNの値を特定することによって取得してもよく、非特許文献の記載の形式を有する記載が特許文書情報に何個あるかを重複しないように検索することによって取得してもよい。文書属性情報取得部12は、特許文書情報における実施の形態の文字数を、実施の形態の記載されている範囲の文字数をカウントすることによって取得してもよい。文書属性情報取得部12は、例えば、実施の形態の記載されている範囲を、「(実施の形態)」の表記から、「産業上の利用可能性」の表記までの範囲であると特定してもよい。文書属性情報取得部12は、特許文書情報における実施の形態の単位情報数を、実施の形態の記載されている範囲について形態素解析等を行って単位情報数をカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報における実施の形態での例示の数を、実施の形態の記載されている範囲において、「例えば」の個数をカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報における実施の形態での外延拡張表記の数を、実施の形態の記載されている範囲において、「もよい。」で終わる文の個数や、「など」の個数、「等」の個数をカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報における実施の形態での数式の数を、「数N」等の数式の見出しの数をカウントすることによって取得してもよく、「数N」の最大のNの値を特定することによって取得してもよい。文書属性情報取得部12は、特許文書情報における実施の形態での化学式の数を、「化N」等の数式の見出しの数をカウントすることによって取得してもよく、「化N」の最大のNの値を特定することによって取得してもよい。文書属性情報取得部12は、特許文書情報における図面数を、図面の簡単な説明等において説明されている図面の数をカウントすることによって取得してもよく、図面の簡単な説明等における図面の番号の最大値を特定することによって取得してもよく、発明の詳細な説明(明細書)において「図N」などが何個表示されているのかを重複しないようにカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報における構成を示す図の数を、図面の簡単な説明等における「ブロック図」や、「構成を示す図」、「構成図」等を含む説明を有する図面の数をカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報におけるフローチャートの数を、図面の簡単な説明等における「フローチャート」や、「流れ図」、「流れを示す図」、「フロー」、「流れ」、「手順」、等を含む説明を有する図面の数をカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報におけるデータ構造を示す図の数を、図面の簡単な説明等における「データ構造」や、「データの構成」、「情報の構造」等を含む説明を有する図面の数をカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報における画面出力を示す図の数を、図面の簡単な説明等における「画面表示」や、「画面出力」、「画面の表示」、「画面の出力」等を含む説明を有する図面の数をカウントすることによって取得してもよい。文書属性情報取得部12は、特許文書情報におけるハードウェア構成を示す図の数を、図面の簡単な説明等における「ハードウェア構成」や、「ハードウェアの構成」、等を含む説明を有する図面の数をカウントすることによって取得してもよい。
次に、本実施の形態による情報処理装置1の動作について、図2のフローチャートを用いて説明する。
The document attribute information acquisition unit 12 acquires the number of unit information of the representative component of the representative claim in the patent document information by performing morphological analysis on the representative component of the representative claim and counting the number of unit information. Also good. The document attribute information acquisition unit 12 may acquire the number of patent documents cited in the patent document information by counting the number of headings of patent documents such as “Patent Document N”. It may be obtained by specifying the maximum value of N, or may be obtained by searching the patent document information so that there are no duplicate descriptions having the format described in the patent document. Here, “N” is an arbitrary integer. The format described in the patent document is, for example, a format in which “JP,” a 4-digit number, a hyphen “-”, and a 6-digit number are arranged in order. The document attribute information acquisition unit 12 may acquire the number of non-patent documents cited in the patent document information by counting the number of headings of non-patent documents such as “Non-patent document N”. It may be acquired by specifying the maximum value of N in “Patent Document N”, or by searching the patent document information so that there are no duplicate descriptions having the format of non-patent document description. May be. The document attribute information acquisition unit 12 may acquire the number of characters of the embodiment in the patent document information by counting the number of characters in the range described in the embodiment. For example, the document attribute information acquisition unit 12 specifies the range described in the embodiment as a range from the notation “(embodiment)” to the notation “industrial applicability”. May be. The document attribute information acquisition unit 12 may acquire the number of unit information of the embodiment in the patent document information by performing morphological analysis on the range described in the embodiment and counting the number of unit information. . The document attribute information acquisition unit 12 may acquire the exemplary number in the embodiment of the patent document information by counting the number of “for example” within the range described in the embodiment. The document attribute information acquisition unit 12 sets the number of extended extension notations in the embodiment of patent document information in the range described in the embodiment, the number of sentences ending with “may”, “etc.” Or the number of “etc.” may be obtained. The document attribute information acquisition unit 12 may acquire the number of mathematical formulas in the embodiment in the patent document information by counting the number of formula headings such as “number N”, and the maximum of “number N” May be obtained by specifying the value of N. The document attribute information acquisition unit 12 may acquire the number of chemical formulas in the embodiment in the patent document information by counting the number of formula headings such as “Chemical N”. May be obtained by specifying the value of N. The document attribute information acquisition unit 12 may acquire the number of drawings in the patent document information by counting the number of drawings described in the brief description of drawings, etc. It may be obtained by specifying the maximum value of the number, or it may be obtained by counting the number of “Figure N” etc. displayed in the detailed description (specification) of the invention so as not to overlap. Also good. The document attribute information acquisition unit 12 has a description of the number of diagrams showing the configuration in the patent document information, including a “block diagram”, a “configuration diagram”, a “configuration diagram”, etc. in a brief description of the drawing. You may acquire by counting the number of drawings. The document attribute information acquisition unit 12 sets the number of flowcharts in the patent document information to “flowchart”, “flow diagram”, “flow diagram”, “flow”, “flow”, “procedure” in a brief description of drawings, etc. ”, Etc. may be obtained by counting the number of drawings having a description. The document attribute information acquisition unit 12 describes the number of figures indicating the data structure in the patent document information, including “data structure”, “data configuration”, “information structure”, etc. in a brief description of the drawing. You may acquire by counting the number of drawings which have. The document attribute information acquisition unit 12 sets the number of diagrams indicating screen output in patent document information to “screen display”, “screen output”, “screen display”, “screen output” in a brief description of the drawings. You may acquire by counting the number of drawings which have description including etc. The document attribute information acquisition unit 12 is a drawing having a description including the “hardware configuration”, “hardware configuration”, etc. in the brief description of the drawings, etc., regarding the number of diagrams showing the hardware configuration in the patent document information. May be obtained by counting the number of.
Next, the operation of the information processing apparatus 1 according to the present embodiment will be described using the flowchart of FIG.

(ステップS101)サンプル特許価値情報受付部16は、サンプル特許価値情報を受け付けたかどうか判断する。そして、サンプル特許価値情報を受け付けた場合には、ステップS102に進み、そうでない場合には、ステップS103に進む。   (Step S101) The sample patent value information receiving unit 16 determines whether sample patent value information has been received. If sample patent value information is received, the process proceeds to step S102, and if not, the process proceeds to step S103.

(ステップS102)サンプル特許価値情報蓄積部17は、サンプル特許価値情報受付部16が受け付けたサンプル特許価値情報をサンプル特許価値情報記憶部18に蓄積する。そして、ステップS101に戻る。   (Step S102) The sample patent value information storage unit 17 stores the sample patent value information received by the sample patent value information reception unit 16 in the sample patent value information storage unit 18. Then, the process returns to step S101.

(ステップS103)特許価値情報算出部19は、特許価値情報を算出するかどうか判断する。そして、特許価値情報を算出する場合には、ステップS104に進み、そうでない場合には、ステップS101に戻る。ここで、特許価値情報算出部19が特許価値情報を算出すると判断するタイミングは問わない。例えば、所定のイベントの発生(例えば、特許価値情報を算出する旨の指示が受け付けられたことなど)をトリガーとして特許価値情報を算出すると判断してもよい。   (Step S103) The patent value information calculation unit 19 determines whether to calculate patent value information. And when calculating patent value information, it progresses to step S104, and when that is not right, it returns to step S101. Here, the timing at which the patent value information calculation unit 19 determines to calculate the patent value information does not matter. For example, it may be determined that the patent value information is calculated with the occurrence of a predetermined event (for example, an instruction to calculate the patent value information is accepted) as a trigger.

(ステップS104)文書属性情報取得部12は、特許文書情報記憶部11で記憶されている特許文書情報から文書属性情報を取得する。また、文書属性情報取得部12は、特許文書情報記憶部11で記憶されているサンプル特許文書情報からサンプル文書属性情報を取得する。   (Step S104) The document attribute information acquisition unit 12 acquires the document attribute information from the patent document information stored in the patent document information storage unit 11. The document attribute information acquisition unit 12 acquires sample document attribute information from the sample patent document information stored in the patent document information storage unit 11.

(ステップS105)文書属性情報蓄積部13は、文書属性情報取得部12が取得した文書属性情報を文書属性情報記憶部14に蓄積する。また、文書属性情報蓄積部13は、文書属性情報取得部12が取得したサンプル文書属性情報をサンプル文書属性情報記憶部15に蓄積する。   (Step S105) The document attribute information storage unit 13 stores the document attribute information acquired by the document attribute information acquisition unit 12 in the document attribute information storage unit 14. The document attribute information storage unit 13 stores the sample document attribute information acquired by the document attribute information acquisition unit 12 in the sample document attribute information storage unit 15.

(ステップS106)特許価値情報算出部19は、サンプル文書属性情報記憶部15が記憶しているサンプル文書属性情報と、サンプル特許価値情報記憶部18が記憶しているサンプル特許価値情報とを教師情報として、文書属性情報記憶部14が記憶している文書属性情報から特許価値情報を算出する。
(ステップS107)特許価値情報出力部20は、特許価値情報算出部19が算出した特許価値情報を出力する。そして、ステップS101に戻る。
(Step S106) The patent value information calculation unit 19 uses the sample document attribute information stored in the sample document attribute information storage unit 15 and the sample patent value information stored in the sample patent value information storage unit 18 as teacher information. The patent value information is calculated from the document attribute information stored in the document attribute information storage unit 14.
(Step S107) The patent value information output unit 20 outputs the patent value information calculated by the patent value information calculation unit 19. Then, the process returns to step S101.

なお、図2のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。また、図2のフローチャートでは、特許価値情報を算出する際に文書属性情報やサンプル文書属性情報を取得する場合について説明したが、あらかじめ文書属性情報等の取得を行っておき、その取得された文書属性情報等を用いて特許価値情報の算出を行ってもよい。このように、図2のフローチャートにおいて、ある程度の任意性がある。   In the flowchart of FIG. 2, the process is terminated by powering off or a process termination interrupt. Further, in the flowchart of FIG. 2, the case where document attribute information and sample document attribute information are acquired when calculating patent value information has been described. However, document attribute information and the like are acquired in advance, and the acquired document Patent value information may be calculated using attribute information or the like. Thus, there is a certain degree of arbitraryness in the flowchart of FIG.

次に、本実施の形態による情報処理装置1の動作について、具体例を用いて説明する。この具体例において、情報処理装置1はスタンドアロンのPC(Personal Computer)であるとする。   Next, the operation of the information processing apparatus 1 according to this embodiment will be described using a specific example. In this specific example, it is assumed that the information processing apparatus 1 is a stand-alone PC (Personal Computer).

この具体例において、特許文書情報記憶部11では、図3で示されるように特許文書情報を識別する情報である特許文書IDと、特許文書情報とが対応付けられて記憶されているものとする。ここで、この特許文書情報には、サンプル特許文書情報が含まれるものとする。特許文書情報「P0001」等は、特許文書情報のデータそのものでもよく、特許文書情報の名称でもよく、あるいは、特許文書情報の記憶されている特許文書情報記憶部11におけるアドレス(ポインタ)でもよい。特許文書ID「P1999−123456」で識別される特許文書情報「P0001」は、図4で示されるテキストデータであるとする。図4において、特許文書情報「P0001」には、公開番号や公開日などの書誌的事項と、特許請求の範囲と、発明の詳細な説明(明細書)とが含まれている。特許文書情報には、図面のデータが含まれていてもよく、含まれていなくてもよい。   In this specific example, the patent document information storage unit 11 stores a patent document ID, which is information for identifying patent document information, and patent document information in association with each other as shown in FIG. . Here, it is assumed that the patent document information includes sample patent document information. The patent document information “P0001” or the like may be the data itself of the patent document information, the name of the patent document information, or the address (pointer) in the patent document information storage unit 11 in which the patent document information is stored. Assume that the patent document information “P0001” identified by the patent document ID “P1999-123456” is the text data shown in FIG. In FIG. 4, the patent document information “P0001” includes bibliographic items such as a publication number and a publication date, claims, and a detailed description (specification) of the invention. The patent document information may or may not include drawing data.

まず、ユーザが情報処理装置1を操作することにより、サンプル特許文書情報を入力する画面を表示させる。この画面表示は、図示しない表示部が特許文書情報記憶部11から特許文書IDを取得することによってなされる。ユーザは、図5で示されるように、キーボードやマウスを操作することにより、特許文書IDで識別されるサンプル特許文書情報のサンプル特許価値情報を入力する。その入力において、ユーザは、サンプル特許文書情報そのもの、あるいは、そのサンプル特許文書情報に対応する公報等を参照することにより、特許価値を算出して入力する。なお、サンプル特許価値情報を入力するユーザがサンプルとなる特許価値の算出を行うのではなく、他の専門的な人材、例えば、知的財産権部の専門家や、弁理士等にそのサンプルとなる特許価値の算出を依頼してもよい。また、図5で示される画面では、特許文書情報記憶部11で記憶されている全ての特許文書情報(サンプル特許文書情報を含む)に対応する特許文書IDが表示されるが、ユーザは、その表示されている特許文書IDのうち、サンプルとして用いたい特許文書情報に対応する特許文書IDについてのみ、サンプル特許価値情報を入力すればよい。すなわち、サンプル特許価値情報の入力された特許文書IDで識別される特許文書情報が、サンプル特許文書情報となるのである。   First, when the user operates the information processing apparatus 1, a screen for inputting sample patent document information is displayed. This screen display is performed when a display unit (not shown) acquires a patent document ID from the patent document information storage unit 11. As shown in FIG. 5, the user inputs sample patent value information of sample patent document information identified by the patent document ID by operating a keyboard and a mouse. In the input, the user calculates and inputs the patent value by referring to the sample patent document information itself or a bulletin corresponding to the sample patent document information. The user who inputs the sample patent value information does not calculate the sample patent value, but the sample is sent to other specialized human resources, for example, experts in the intellectual property rights department, patent attorneys, etc. The patent value may be requested to be calculated. In the screen shown in FIG. 5, patent document IDs corresponding to all patent document information (including sample patent document information) stored in the patent document information storage unit 11 are displayed. Of the displayed patent document IDs, sample patent value information may be input only for the patent document ID corresponding to the patent document information to be used as a sample. That is, the patent document information identified by the patent document ID to which the sample patent value information is input becomes the sample patent document information.

サンプル特許価値情報の入力が終了すると、ユーザは、マウスを操作することによって、図示しない「OK」ボタンをクリックする。すると、サンプル特許価値情報がサンプル特許価値情報受付部16で受け付けられ(ステップS101)、サンプル特許価値情報蓄積部17によってサンプル特許価値情報記憶部18に蓄積される(ステップS102)。図6は、サンプル特許価値情報記憶部18で記憶されている、サンプル特許価値情報と特許文書IDとの対応を示す図である。   When the input of the sample patent value information is completed, the user clicks an “OK” button (not shown) by operating the mouse. Then, the sample patent value information is received by the sample patent value information receiving unit 16 (step S101), and stored in the sample patent value information storage unit 18 by the sample patent value information storage unit 17 (step S102). FIG. 6 is a diagram showing the correspondence between the sample patent value information and the patent document ID stored in the sample patent value information storage unit 18.

次に、ユーザが情報処理装置1を操作することにより、特許価値情報の算出を開始する画面を表示させる。この画面表示は、図示しない表示部が特許文書情報記憶部11と、サンプル特許価値情報記憶部18とを参照し、サンプル特許価値情報と対応付けられていない特許文書IDを表示することによってなされる。ここでは、図7で示されるように、3個の特許文書IDが表示され、ユーザは、マウスを操作して特許文書ID「P1999−111111」の左側のラジオボタンをクリックすることにより、特許文書ID「P1999−111111」で識別される特許文書情報を選択したとする。そして、ユーザがマウスを操作することによって「OK」ボタンをクリックする。すると、特許価値情報算出部19は、特許文書ID「P1999−111111」で識別される特許文書情報について特許価値情報を算出する旨の指示を受け付けたと判断し(ステップS103)、文書属性情報取得部12に対して、特許文書ID「P1999−111111」で識別される特許文書情報の文書属性情報と、サンプル特許価値情報記憶部18で記憶されているサンプル特許価値情報に対応するサンプル文書属性情報とを取得する旨の指示を渡す。   Next, when the user operates the information processing apparatus 1, a screen for starting calculation of patent value information is displayed. This screen display is performed by displaying a patent document ID not associated with the sample patent value information by referring to the patent document information storage unit 11 and the sample patent value information storage unit 18 by a display unit (not shown). . Here, as shown in FIG. 7, three patent document IDs are displayed, and the user operates the mouse to click the radio button on the left side of the patent document ID “P1999-111111”, thereby It is assumed that the patent document information identified by the ID “P1999-111111” is selected. Then, the user clicks the “OK” button by operating the mouse. Then, the patent value information calculation unit 19 determines that an instruction to calculate the patent value information is received for the patent document information identified by the patent document ID “P1999-111111” (step S103), and the document attribute information acquisition unit 12, the document attribute information of the patent document information identified by the patent document ID “P1999-111111”, the sample document attribute information corresponding to the sample patent value information stored in the sample patent value information storage unit 18, and Give instructions to get

すると、文書属性情報取得部12は、特許文書情報記憶部11から特許文書ID「P1999−111111」で識別される特許文書情報を読み出し、その特許文書情報から文書属性情報を前述の説明のようにして取得する。また、文書属性情報取得部12は、サンプル特許価値情報記憶部18で記憶されているサンプル特許価値情報に対応する特許文書IDを読み出し、その特許文書IDで識別されるサンプル特許文書情報を特許文書情報記憶部11から読み出し、同様にして、そのサンプル特許文書情報からサンプル文書属性情報を取得する(ステップS104)。文書属性情報蓄積部13は、文書属性情報取得部12によって取得された文書属性情報を文書属性情報記憶部14に蓄積する。文書属性情報記憶部14に蓄積された文書属性情報は、図8で示されるものである。また、文書属性情報蓄積部13は、文書属性情報取得部12によって取得されたサンプル文書属性情報をサンプル文書属性情報記憶部15に蓄積する(ステップS105)。サンプル文書属性情報記憶部15に蓄積されたサンプル文書属性情報は、図9で示されるものである。図8,図9において、文書属性情報、及びサンプル文書属性情報は、特許文書IDに対応付けられている。また、文書属性情報、及びサンプル文書属性情報には、請求項数、独立請求項数、カテゴリー数、ネストレベル、請求の範囲の文字数、代表請求項の構成要素数等の前述した特許文書情報の各属性を示す情報が含まれている。   Then, the document attribute information acquisition unit 12 reads out the patent document information identified by the patent document ID “P1999-111111” from the patent document information storage unit 11, and sets the document attribute information from the patent document information as described above. Get. Further, the document attribute information acquisition unit 12 reads the patent document ID corresponding to the sample patent value information stored in the sample patent value information storage unit 18, and sets the sample patent document information identified by the patent document ID as the patent document. Similarly, sample document attribute information is obtained from the sample patent document information by reading from the information storage unit 11 (step S104). The document attribute information storage unit 13 stores the document attribute information acquired by the document attribute information acquisition unit 12 in the document attribute information storage unit 14. The document attribute information stored in the document attribute information storage unit 14 is as shown in FIG. Further, the document attribute information accumulation unit 13 accumulates the sample document attribute information acquired by the document attribute information acquisition unit 12 in the sample document attribute information storage unit 15 (step S105). The sample document attribute information stored in the sample document attribute information storage unit 15 is as shown in FIG. 8 and 9, document attribute information and sample document attribute information are associated with a patent document ID. The document attribute information and sample document attribute information include the number of claims, the number of independent claims, the number of categories, the nesting level, the number of characters in the claims, the number of constituent elements of the representative claims, etc. Information indicating each attribute is included.

次に、特許価値情報算出部19は、サンプル文書属性情報記憶部15から教師情報としてのサンプル文書属性情報を読み出し、サンプル特許価値情報記憶部18から教師情報としてのサンプル特許価値情報を読み出す。そして、それらの情報をサポートベクターマシンに読み込む形式に変換する。具体的には、図10で示されるようにサンプル文書属性情報と、サンプル特許価値情報とを変換する。図10において、各行が一の特許文書情報に対応している。例えば、1行目のデータは、特許文書ID「P1999−123456」で識別される特許文書情報に対応している。2行目のデータは、特許文書ID「P1999−234567」で識別される特許文書情報に対応している。各行において、一番左の値は、サンプル特許価値情報の示す値である。その右側には、サンプル文書属性情報の各属性を識別する識別番号にコロンで対応付けられた属性の値が順番に並んでいる。ここでは、例えば、属性「請求項数」を識別する識別番号が「1」であり、属性「独立請求項数」を識別する識別番号が「2」であり、属性「カテゴリー数」を識別する識別番号が「3」であるというようになっている。そして、特許価値情報算出部19は、文書属性情報記憶部14から特許価値情報を算出する特許文書情報の文書属性情報を読み出し、図10で示される情報を教師情報として読み込み、サポートベクターマシンを用いて、読み出した文書属性情報に対応する特許価値情報を算出する。ここで用いられるサポートベクターマシンでは、多クラスのクラス分類を行うものとする。ここでは、特許文書ID「P1999−111111」で識別される特許文書情報の特許価値情報が「70」と算出されたとする(ステップS106)。すると、特許価値情報出力部20は、その特許価値情報「70」を、図11で示されるように、情報処理装置1のディスプレイに表示する(ステップS107)。このようにして、ユーザは、特許価値情報について知ることができる。   Next, the patent value information calculation unit 19 reads sample document attribute information as teacher information from the sample document attribute information storage unit 15 and reads sample patent value information as teacher information from the sample patent value information storage unit 18. Then, the information is converted into a format that can be read into a support vector machine. Specifically, as shown in FIG. 10, sample document attribute information and sample patent value information are converted. In FIG. 10, each line corresponds to one piece of patent document information. For example, the data in the first row corresponds to the patent document information identified by the patent document ID “P1999-123456”. The data in the second row corresponds to the patent document information identified by the patent document ID “P1999-234567”. In each row, the leftmost value is a value indicated by the sample patent value information. On the right side, the attribute values associated with the identification numbers for identifying the attributes of the sample document attribute information by colons are arranged in order. Here, for example, the identification number for identifying the attribute “number of claims” is “1”, the identification number for identifying the attribute “number of independent claims” is “2”, and the attribute “number of categories” is identified. The identification number is “3”. Then, the patent value information calculation unit 19 reads the document attribute information of the patent document information for calculating the patent value information from the document attribute information storage unit 14, reads the information shown in FIG. 10 as teacher information, and uses a support vector machine. The patent value information corresponding to the read document attribute information is calculated. The support vector machine used here performs multi-class classification. Here, it is assumed that the patent value information of the patent document information identified by the patent document ID “P1999-111111” is calculated as “70” (step S106). Then, the patent value information output unit 20 displays the patent value information “70” on the display of the information processing apparatus 1 as shown in FIG. 11 (step S107). In this way, the user can know the patent value information.

以上のように、本実施の形態による情報処理装置1では、特許価値情報算出部19がサンプル特許価値情報とサンプル文書属性情報とを教師情報をして用いることにより、所望の特許文書情報の価値を示す特許価値情報を算出することができる。ユーザは一般に、主観的な評価を行うものであるが、教師情報を用いて特許価値情報の算出を行うことによって、ユーザの主観的な評価の要素を反映した特許価値の客観的な算出を行うことができる。一方、ユーザごとに特許価値情報を算出するための複雑な式等を設定する必要がなく、式を設定するための煩雑な作業を行わなくてよいことになる。例えば、6万件の特許を有する企業が自社の6万件の特許の価値を人手によって判断するには多大な労力が必要となるが、サンプルとなる100件の特許について価値を判断し、その価値をサンプル特許価値情報として情報処理装置1を用いることにより、その価値判断を用いて、他の特許の価値を同様に判断することができ、多大な労力の軽減に寄与することができうる。   As described above, in the information processing apparatus 1 according to the present embodiment, the patent value information calculation unit 19 uses the sample patent value information and the sample document attribute information as teacher information, so that the value of the desired patent document information is obtained. Can be calculated. In general, a user performs subjective evaluation, but by calculating patent value information using teacher information, an objective calculation of patent value reflecting elements of the user's subjective evaluation is performed. be able to. On the other hand, it is not necessary to set a complicated formula or the like for calculating patent value information for each user, and it is not necessary to perform complicated work for setting the formula. For example, a company with 60,000 patents requires a lot of labor to manually determine the value of their own 60,000 patents. By using the information processing apparatus 1 with the value as sample patent value information, it is possible to determine the value of other patents in the same manner by using the value determination, which can contribute to a great reduction in labor.

また、ユーザが特許文書情報の価値を評価する場合には、一般に、簡単に定式化できない潜在的なルールに基づいて判断すると考えられる。情報処理装置1を用いて特許文書情報の価値を評価することにより、その潜在的なルールに基づいた判断を行うことができうる。   In addition, when a user evaluates the value of patent document information, it is generally considered that a determination is made based on a potential rule that cannot be easily formulated. By evaluating the value of patent document information using the information processing apparatus 1, it is possible to make a determination based on the potential rule.

(実施の形態2)
本発明の実施の形態2による情報処理装置について、図面を参照しながら説明する。本実施の形態による情報処理装置は、特許価値情報に代えて特許特性情報を算出するものである。
(Embodiment 2)
An information processing apparatus according to Embodiment 2 of the present invention will be described with reference to the drawings. The information processing apparatus according to the present embodiment calculates patent characteristic information instead of patent value information.

図12は、本実施の形態による情報処理装置2の構成を示すブロック図である。図2において、本実施の形態による情報処理装置2は、特許文書情報記憶部11と、文書属性情報取得部12と、文書属性情報蓄積部13と、文書属性情報記憶部14と、サンプル文書属性情報記憶部15と、サンプル特許特性情報受付部21と、サンプル特許特性情報蓄積部22と、サンプル特許特性情報記憶部23と、特許特性情報算出部24と、特許特性情報出力部25とを備える。なお、サンプル特許特性情報受付部21、サンプル特許特性情報蓄積部22、サンプル特許特性情報記憶部23、特許特性情報算出部24、特許特性情報出力部25以外の構成及び動作は、実施の形態1と同様であり、その説明を省略する。   FIG. 12 is a block diagram showing the configuration of the information processing apparatus 2 according to this embodiment. 2, the information processing apparatus 2 according to the present embodiment includes a patent document information storage unit 11, a document attribute information acquisition unit 12, a document attribute information storage unit 13, a document attribute information storage unit 14, and a sample document attribute. An information storage unit 15, a sample patent characteristic information receiving unit 21, a sample patent characteristic information storage unit 22, a sample patent characteristic information storage unit 23, a patent characteristic information calculation unit 24, and a patent characteristic information output unit 25 are provided. . The configuration and operation other than the sample patent characteristic information receiving unit 21, the sample patent characteristic information storage unit 22, the sample patent characteristic information storage unit 23, the patent characteristic information calculation unit 24, and the patent characteristic information output unit 25 are the same as those in the first embodiment. The description is omitted.

サンプル特許特性情報受付部21は、サンプル特許特性情報を受け付ける。ここで、サンプル特許特性情報とは、特許文書情報の特性を示す情報であり、サンプル文書属性情報記憶部15で記憶されるサンプル文書属性情報に対応する情報である。すなわち、あるサンプル特許文書情報の特性を示すサンプル特許特性情報がサンプル特許特性情報受付部21で受け付けられ、その同じサンプル特許文書情報から取得されたサンプル文書属性情報がサンプル文書属性情報記憶部15で記憶されることになる。サンプル特許特性情報は、教師情報として用いられる。サンプル特許特性情報は、発明本質抽出特性と、強靱特性と、発明展開特性と、実施可能担保特性とを含むものである。ここで、発明本質抽出特性とは、特許文書情報において発明の本質を抽出している程度を示す特性である。強靱特性とは、特許文書情報において、発明にかかる出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程度を示す特性である。発明展開特性とは、特許文書情報において発明を展開している程度を示す特性である。実施可能担保特性とは、特許文書情報において発明について実施可能に記載されている程度を示す特性である。サンプル特許特性情報受付部21は、例えば、入力デバイス(例えば、キーボードやマウス、タッチパネルなど)から入力された情報を受け付けてもよく、有線もしくは無線の通信回線を介して送信された情報を受信してもよく、所定の記録媒体(例えば、光ディスクや磁気ディスク、半導体メモリなど)から読み出された情報を受け付けてもよい。本実施の形態では、サンプル特許特性情報受付部21は、入力デバイスから入力されたサンプル特許特性情報を受け付けるものとする。なお、サンプル特許特性情報受付部21は、受け付けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んでもよく、あるいは含まなくてもよい。また、サンプル特許特性情報受付部21は、ハードウェアによって実現されてもよく、あるいは所定のデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
サンプル特許特性情報蓄積部22は、サンプル特許特性情報受付部21が受け付けたサンプル特許特性情報をサンプル特許特性情報記憶部23に蓄積する。
The sample patent characteristic information receiving unit 21 receives sample patent characteristic information. Here, the sample patent characteristic information is information indicating the characteristic of the patent document information, and is information corresponding to the sample document attribute information stored in the sample document attribute information storage unit 15. That is, sample patent characteristic information indicating characteristics of a certain sample patent document information is received by the sample patent characteristic information receiving unit 21, and sample document attribute information acquired from the same sample patent document information is stored in the sample document attribute information storage unit 15. Will be remembered. The sample patent characteristic information is used as teacher information. The sample patent characteristic information includes invention essential extraction characteristics, toughness characteristics, invention development characteristics, and practicable security characteristics. Here, the invention essence extraction characteristic is a characteristic indicating the degree to which the essence of the invention is extracted from the patent document information. The toughness characteristic is a characteristic that indicates a degree to which an application concerning an invention is rejected or a patent concerning an invention becomes invalid in patent document information. The invention development characteristic is a characteristic indicating the degree to which the invention is developed in patent document information. The practicable collateral characteristic is a characteristic indicating the degree to which the invention is described as feasible in patent document information. For example, the sample patent characteristic information receiving unit 21 may receive information input from an input device (for example, a keyboard, a mouse, a touch panel, etc.) and receive information transmitted via a wired or wireless communication line. Alternatively, information read from a predetermined recording medium (for example, an optical disk, a magnetic disk, a semiconductor memory, etc.) may be received. In the present embodiment, the sample patent characteristic information receiving unit 21 receives sample patent characteristic information input from an input device. Note that the sample patent characteristic information receiving unit 21 may or may not include a device (for example, a modem or a network card) for receiving. Further, the sample patent characteristic information receiving unit 21 may be realized by hardware, or may be realized by software such as a driver that drives a predetermined device.
The sample patent characteristic information storage unit 22 stores the sample patent characteristic information received by the sample patent characteristic information reception unit 21 in the sample patent characteristic information storage unit 23.

サンプル特許特性情報記憶部23では、サンプル特許特性情報が記憶される。サンプル特許特性情報記憶部23での記憶は、例えば、RAM等における一時的な記憶でもよく、あるいは、フラッシュメモリや磁気ディスク等における長期的な記憶でもよい。サンプル特許特性情報記憶部23は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。   The sample patent characteristic information storage unit 23 stores sample patent characteristic information. The storage in the sample patent characteristic information storage unit 23 may be temporary storage in a RAM or the like, or may be long-term storage in a flash memory or a magnetic disk, for example. The sample patent characteristic information storage unit 23 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).

特許特性情報算出部24は、文書属性情報記憶部14が記憶している文書属性情報から、その文書属性情報に対応する特許文書情報の特性を示す特許特性情報を算出する。特許特性情報算出部24は、教師あり学習によって特許特性情報を算出する。この算出された特許特性情報にも発明本質抽出特性と、強靱特性と、発明展開特性と、実施可能担保特性とが含まれるのは、前述のサンプル特許特性情報と同様である。特許特性情報算出部24は、例えば、サポートベクターマシンにより特許特性情報を算出してもよく、それ以外の方法を用いて特許特性情報を算出してもよい。本実施の形態では、特許特性情報算出部24は、サポートベクターマシンを用いて特許特性情報を算出するものとする。サポートベクターマシンについては、前述のように、従来から公知であるため、その詳細な説明を省略する。特許特性情報算出部24は、サンプル文書属性情報記憶部15が記憶しているサンプル文書属性情報と、サンプル特許特性情報記憶部23が記憶しているサンプル特許特性情報とを教師情報として、特許特性情報を算出する。なお、教師情報や処理する情報が異なる以外、特許特性情報算出部24は、実施の形態1の特許価値情報算出部19と同様のものであり、その詳細な説明を省略する。   The patent characteristic information calculation unit 24 calculates patent characteristic information indicating the characteristic of the patent document information corresponding to the document attribute information from the document attribute information stored in the document attribute information storage unit 14. The patent characteristic information calculation unit 24 calculates patent characteristic information by supervised learning. The calculated patent characteristic information also includes the invention essential extraction characteristic, the toughness characteristic, the invention development characteristic, and the feasible security characteristic, as in the above-described sample patent characteristic information. For example, the patent characteristic information calculation unit 24 may calculate the patent characteristic information using a support vector machine, or may calculate the patent characteristic information using other methods. In the present embodiment, the patent characteristic information calculation unit 24 calculates the patent characteristic information using a support vector machine. As described above, since the support vector machine is conventionally known, detailed description thereof is omitted. The patent characteristic information calculation unit 24 uses the sample document attribute information stored in the sample document attribute information storage unit 15 and the sample patent characteristic information stored in the sample patent characteristic information storage unit 23 as teacher information. Calculate information. The patent characteristic information calculation unit 24 is the same as the patent value information calculation unit 19 of the first embodiment except that teacher information and information to be processed are different, and detailed description thereof is omitted.

特許特性情報出力部25は、特許特性情報算出部24が算出した特許特性情報を出力する。ここで、この出力は、例えば、表示デバイス(例えば、CRTや液晶ディスプレイなど)への表示でもよく、所定の機器への通信回線を介した送信でもよく、プリンタによる印刷でもよく、スピーカによる音声出力でもよく、記録媒体への蓄積でもよい。なお、特許特性情報出力部25は、出力を行うデバイス(例えば、表示デバイスやプリンタなど)を含んでもよく、あるいは含まなくてもよい。また、特許特性情報出力部25は、ハードウェアによって実現されてもよく、あるいは、それらのデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。   The patent characteristic information output unit 25 outputs the patent characteristic information calculated by the patent characteristic information calculation unit 24. Here, the output may be, for example, display on a display device (for example, a CRT or a liquid crystal display), transmission via a communication line to a predetermined device, printing by a printer, or audio output by a speaker. However, it may be stored in a recording medium. The patent characteristic information output unit 25 may or may not include an output device (for example, a display device or a printer). In addition, the patent characteristic information output unit 25 may be realized by hardware, or may be realized by software such as a driver that drives these devices.

なお、特許文書情報記憶部11と、文書属性情報記憶部14と、サンプル文書属性情報記憶部15と、サンプル特許特性情報記憶部23との任意の2以上の記憶部は、同一の記録媒体によって実現されてもよく、あるいは、別々の記録媒体によって実現されてもよい。   Note that any two or more storage units of the patent document information storage unit 11, the document attribute information storage unit 14, the sample document attribute information storage unit 15, and the sample patent characteristic information storage unit 23 are stored on the same recording medium. It may be realized or may be realized by a separate recording medium.

次に、本実施の形態による情報処理装置2の動作について、図13のフローチャートを用いて説明する。なお、ステップS104,S105の処理については、実施の形態1の図2のフローチャートと同様であり、その説明を省略する。   Next, the operation of the information processing apparatus 2 according to this embodiment will be described using the flowchart of FIG. Note that the processing in steps S104 and S105 is the same as that in the flowchart of FIG. 2 of the first embodiment, and a description thereof will be omitted.

(ステップS201)サンプル特許特性情報受付部21は、サンプル特許特性情報を受け付けたかどうか判断する。そして、サンプル特許特性情報を受け付けた場合には、ステップS202に進み、そうでない場合には、ステップS203に進む。   (Step S201) The sample patent characteristic information receiving unit 21 determines whether sample patent characteristic information has been received. If sample patent characteristic information has been received, the process proceeds to step S202. If not, the process proceeds to step S203.

(ステップS202)サンプル特許特性情報蓄積部22は、サンプル特許特性情報受付部21が受け付けたサンプル特許特性情報をサンプル特許特性情報記憶部23に蓄積する。そして、ステップS201に戻る。   (Step S202) The sample patent characteristic information storage unit 22 stores the sample patent characteristic information received by the sample patent characteristic information reception unit 21 in the sample patent characteristic information storage unit 23. Then, the process returns to step S201.

(ステップS203)特許特性情報算出部24は、特許特性情報を算出するかどうか判断する。そして、特許特性情報を算出する場合には、ステップS104に進み、そうでない場合には、ステップS201に戻る。ここで、特許特性情報算出部24が特許特性情報を算出すると判断するタイミングは問わない。例えば、所定のイベントの発生(例えば、特許特性情報を算出する旨の指示が受け付けられたことなど)をトリガーとして特許特性情報を算出すると判断してもよい。   (Step S203) The patent characteristic information calculation unit 24 determines whether to calculate patent characteristic information. If the patent characteristic information is calculated, the process proceeds to step S104. If not, the process returns to step S201. Here, the timing at which the patent characteristic information calculation unit 24 determines to calculate the patent characteristic information does not matter. For example, it may be determined that the patent characteristic information is calculated using a generation of a predetermined event (for example, an instruction to calculate the patent characteristic information is accepted) as a trigger.

(ステップS204)特許特性情報算出部24は、サンプル文書属性情報記憶部15が記憶しているサンプル文書属性情報と、サンプル特許特性情報記憶部23が記憶しているサンプル特許特性情報とを教師情報として、文書属性情報記憶部14が記憶している文書属性情報から特許特性情報を算出する。
(ステップS205)特許特性情報出力部25は、特許特性情報算出部24が算出した特許特性情報を出力する。そして、ステップS201に戻る。
(Step S204) The patent characteristic information calculation unit 24 uses the sample document attribute information stored in the sample document attribute information storage unit 15 and the sample patent characteristic information stored in the sample patent characteristic information storage unit 23 as teacher information. As a result, the patent characteristic information is calculated from the document attribute information stored in the document attribute information storage unit 14.
(Step S205) The patent characteristic information output unit 25 outputs the patent characteristic information calculated by the patent characteristic information calculation unit 24. Then, the process returns to step S201.

なお、図13のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。また、図13のフローチャートでは、特許特性情報を算出する際に文書属性情報やサンプル文書属性情報を取得する場合について説明したが、あらかじめ文書属性情報等の取得を行っておき、その取得された文書属性情報等を用いて特許特性情報の算出を行ってもよい。このように、図13のフローチャートにおいて、ある程度の任意性がある。   In the flowchart of FIG. 13, the process is terminated by powering off or a process termination interrupt. In the flowchart of FIG. 13, the case where document attribute information and sample document attribute information are acquired when calculating patent characteristic information has been described. However, document attribute information and the like are acquired in advance, and the acquired document Patent characteristic information may be calculated using attribute information or the like. Thus, there is a certain degree of arbitraryness in the flowchart of FIG.

次に、本実施の形態による情報処理装置2の動作について、具体例を用いて説明する。この具体例において、情報処理装置2はスタンドアロンのPCであるとする。なお、特許文書情報からの文書属性情報やサンプル文書属性情報の取得、及び蓄積に関する処理は、実施の形態1の具体例と同様であり、その説明を省略する。   Next, the operation of the information processing apparatus 2 according to the present embodiment will be described using a specific example. In this specific example, it is assumed that the information processing apparatus 2 is a stand-alone PC. Note that the processing related to the acquisition and storage of document attribute information and sample document attribute information from patent document information is the same as the specific example of the first embodiment, and a description thereof will be omitted.

また、サンプル特許特性情報の受け付け、及び蓄積に関する処理(ステップS201,S202)も、受け付けられる情報が発明本質抽出特性や、強靱特性などの複数になった以外、実施の形態1の具体例における特許価値情報の受け付け、及び蓄積に関する処理と同様であり、その説明を省略する。   In addition, the processing related to the reception and storage of sample patent characteristic information (steps S201 and S202) is also a patent in the specific example of the first embodiment, except that the received information includes a plurality of invention essential extraction characteristics and toughness characteristics. This is similar to the processing related to acceptance and storage of value information, and the description thereof is omitted.

図14は、サンプル特許価値情報蓄積部17によって蓄積されたサンプル特許特性情報を示す図である。図14において、特許文書IDに、サンプル特許特性情報に含まれる発明本質抽出特性、強靱特性、発明展開特性、実施可能担保特性が対応付けられている。これらの値は、実施の形態1の具体例における特許価値情報と同様に、ユーザ等が特許文書情報や公報等を参照することにより、決定した数値である。   FIG. 14 is a diagram showing sample patent characteristic information accumulated by the sample patent value information accumulation unit 17. In FIG. 14, the invention essential extraction characteristic, the toughness characteristic, the invention development characteristic, and the feasible security characteristic included in the sample patent characteristic information are associated with the patent document ID. These values are numerical values determined by the user or the like by referring to the patent document information or the gazette as in the case of the patent value information in the specific example of the first embodiment.

次に、ユーザは、実施の形態1の図7と同様の画面において、マウスを操作して特許文書ID「P1999−111111」の左側のラジオボタンをクリックすることにより、特許文書ID「P1999−111111」で識別される特許文書情報を選択したとする。そして、ユーザがマウスを操作することによって「OK」ボタンをクリックする。すると、特許特性情報算出部24は、特許文書ID「P1999−111111」で識別される特許文書情報について特許特性情報を算出する旨の指示を受け付けたと判断し(ステップS203)、文書属性情報取得部12に対して、特許文書ID「P1999−111111」で識別される特許文書情報の文書属性情報と、サンプル特許特性情報記憶部23で記憶されているサンプル特許特性情報に対応するサンプル文書属性情報とを取得する旨の指示を渡す。この指示に応じて文書属性情報と、サンプル文書属性情報とが取得され、蓄積されるのは実施の形態1の具体例と同様である。   Next, the user operates the mouse on the screen similar to that in FIG. 7 of the first embodiment and clicks the radio button on the left side of the patent document ID “P1999-111111”, thereby the patent document ID “P1999-111111”. ”Is selected. Then, the user clicks the “OK” button by operating the mouse. Then, the patent characteristic information calculation unit 24 determines that an instruction to calculate the patent characteristic information is received for the patent document information identified by the patent document ID “P1999-111111” (step S203), and the document attribute information acquisition unit 12, the document attribute information of the patent document information identified by the patent document ID “P1999-111111”, the sample document attribute information corresponding to the sample patent characteristic information stored in the sample patent characteristic information storage unit 23, and Give instructions to get Document attribute information and sample document attribute information are acquired and stored in response to this instruction, as in the specific example of the first embodiment.

次に、特許特性情報算出部24は、サンプル文書属性情報記憶部15から教師情報としてのサンプル文書属性情報を読み出し、サンプル特許特性情報記憶部23から教師情報としてのサンプル特許特性情報を読み出す。そして、特許特性情報算出部24は、それらの情報を実施の形態1の図10と同様にサポートベクターマシンに読み込む形式に変換する。そして、特許特性情報算出部24は、文書属性情報記憶部14から特許特性情報を算出する特許文書情報の文書属性情報を読み出し、教師情報を読み込み、サポートベクターマシンを用いて、読み出した文書属性情報に対応する特許特性情報を算出する。ここで用いられるサポートベクターマシンでは、多クラスのクラス分類を行うものとする。ここでは、特許文書ID「P1999−111111」で識別される特許文書情報の特許特性情報が発明本質抽出特性「70」、強靱特性「75」、発明展開特性「70」、実施可能担保特性「75」と算出されたとする(ステップS204)。すると、特許特性情報出力部25は、算出された特許特性情報を、実施の形態1の図11と同様に、情報処理装置2のディスプレイに表示する(ステップS205)。このようにして、ユーザは、特許特性情報について知ることができる。   Next, the patent characteristic information calculation unit 24 reads sample document attribute information as teacher information from the sample document attribute information storage unit 15, and reads sample patent characteristic information as teacher information from the sample patent characteristic information storage unit 23. Then, the patent characteristic information calculation unit 24 converts the information into a format that is read into the support vector machine in the same manner as in FIG. 10 of the first embodiment. Then, the patent characteristic information calculation unit 24 reads the document attribute information of the patent document information for calculating the patent characteristic information from the document attribute information storage unit 14, reads the teacher information, and uses the support vector machine to read the read document attribute information. Patent characteristic information corresponding to is calculated. The support vector machine used here performs multi-class classification. Here, the patent characteristic information of the patent document information identified by the patent document ID “P1999-111111” is the invention essential extraction characteristic “70”, the toughness characteristic “75”, the invention development characteristic “70”, the feasible security characteristic “75”. ”(Step S204). Then, the patent characteristic information output unit 25 displays the calculated patent characteristic information on the display of the information processing apparatus 2 as in FIG. 11 of the first embodiment (step S205). In this way, the user can know the patent characteristic information.

以上のように、本実施の形態による情報処理装置2では、特許特性情報算出部24がサンプル特許特性情報とサンプル文書属性情報とを教師情報として用いることにより、所望の特許文書情報の特性を示す特許特性情報を算出することができる。このように、教師情報を用いて特許特性情報の算出を行うため、ユーザの主観的な評価の要素を考慮した特許特性の算出を行うことができる。一方、ユーザごとに特許特性情報を算出するための複雑な式等を設定する必要がなく、式を設定するための煩雑な作業を行わなくてよいことになる。   As described above, in the information processing apparatus 2 according to the present embodiment, the patent characteristic information calculation unit 24 uses the sample patent characteristic information and the sample document attribute information as teacher information to indicate the characteristics of desired patent document information. Patent characteristic information can be calculated. In this way, since the patent characteristic information is calculated using the teacher information, the patent characteristic can be calculated in consideration of the user's subjective evaluation factors. On the other hand, it is not necessary to set a complicated formula or the like for calculating the patent characteristic information for each user, and it is not necessary to perform complicated work for setting the formula.

なお、上記各実施の形態で用いた文書属性情報は一例であって、他の文書属性情報を用いてもよいことはいうまでもない。例えば、文書属性情報は、特許文書情報の国際特許分類、特許文書情報のFターム、特許文書情報のフェーズ、特許文書情報で示される発明の技術分野、特許文書情報に関する権利の存続期間、特許文書情報で示される発明の種類、特許文書情報における請求項の数、特許文書情報における独立形式の請求項の数、特許文書情報における特許請求の範囲のカテゴリー数、特許文書情報における特許請求の範囲のネストレベル、特許文書情報における特許請求の範囲の文字数、特許文書情報における代表請求項の構成要素数、特許文書情報における代表請求項の読点の数、特許文書情報における代表請求項の文字数、特許文書情報における代表請求項の単位情報数、特許文書情報における代表請求項の前提部の文字数、特許文書情報における代表請求項の特徴部の文字数、特許文書情報における代表請求項の前提部の単位情報数、特許文書情報における代表請求項の特徴部の単位情報数、特許文書情報における代表請求項の代表構成要素の文字数、特許文書情報における代表請求項の代表構成要素の単位情報数、特許文書情報において引用されている特許文献数、特許文書情報において引用されている非特許文献数、特許文書情報における実施の形態の文字数、特許文書情報における実施の形態の単位情報数、特許文書情報における実施の形態での例示の数、特許文書情報における実施の形態での外延拡張表記の数、特許文書情報における実施の形態での数式の数、特許文書情報における実施の形態での化学式の数、特許文書情報における図面数、特許文書情報における構成を示す図の数、特許文書情報におけるフローチャートの数、特許文書情報におけるデータ構造を示す図の数、特許文書情報における画面出力を示す図の数、特許文書情報におけるハードウェア構成を示す図の数の群から選ばれる、1以上の属性を示す情報であってもよい。ここで、特許文書情報のフェーズとは、特許文書情報が出願されているが審査請求前であるのか、審査に係属しているのか、審判に係属しているのか、訴訟に係属しているのか、特許になっているのか、存続期間の満了等によって権利が失効したのかなどのフェーズである。また、特許文書情報で示される発明の技術分野とは、例えば、半導体分野や、家電分野、科学分野などの大きな分野であってもよく、冷蔵庫、洗濯機、洗剤等の細かい分野であってもよい。特許文書情報に関する権利の存続期間とは、権利の最大の存続期間のことであり、権利になっていない場合には、権利となった場合の最大の存続期間のことである。権利の存続期間は、一般には、出願日から20年となる。特許文書情報で示される発明の種類とは、例えば、基本発明、応用発明といった発明の種類であってもよく、企画段階で出たコンセプト発明、外部(概要)設計段階で出た機能を付加する発明である機能発明、詳細設計段階で出た改良発明といった発明の種類であってもよい。   Note that the document attribute information used in each of the above embodiments is an example, and it goes without saying that other document attribute information may be used. For example, the document attribute information includes the international patent classification of patent document information, the F term of patent document information, the phase of patent document information, the technical field of the invention indicated by the patent document information, the duration of rights related to patent document information, the patent document The type of invention indicated by the information, the number of claims in patent document information, the number of independent claims in patent document information, the number of categories of claims in patent document information, the number of claims in patent document information Nest level, number of characters of patent claim in patent document information, number of constituent elements of representative claim in patent document information, number of readings of representative claim in patent document information, number of characters of representative claim in patent document information, patent document Number of unit information of representative claim in information, number of characters of premise part of representative claim in patent document information, proxy in patent document information The number of characters in the characteristic part of the claim, the number of unit information in the premise part of the representative claim in the patent document information, the number of unit information in the characteristic part of the representative claim in the patent document information, the representative component of the representative claim in the patent document information Number of characters, number of unit information of representative components of representative claims in patent document information, number of patent documents cited in patent document information, number of non-patent documents cited in patent document information, embodiment in patent document information , Number of unit information of embodiment in patent document information, number of examples in embodiment of patent document information, number of extended extension notation in embodiment of patent document information, embodiment in patent document information The figure which shows the number of formulas in the patent document information, the number of chemical formulas in the embodiment in the patent document information, the number of drawings in the patent document information, the configuration in the patent document information Select from the group of number, number of flowcharts in patent document information, number of figures showing data structure in patent document information, number of figures showing screen output in patent document information, number of figures showing hardware configuration in patent document information It may be information indicating one or more attributes. Here, the phase of patent document information means whether patent document information has been filed but before the request for examination, whether it is pending examination, whether it is pending trial, or pending lawsuit It is a phase of whether the right has expired due to the expiration of the lifetime or the like. In addition, the technical field of the invention indicated by the patent document information may be a large field such as a semiconductor field, a home appliance field, or a scientific field, or may be a small field such as a refrigerator, a washing machine, or a detergent. Good. The term of the right concerning the patent document information is the maximum duration of the right, and when it is not a right, it is the maximum duration when it becomes a right. The duration of a right is typically 20 years from the filing date. The type of invention indicated in the patent document information may be, for example, the type of invention such as a basic invention or an applied invention, and a concept invention that has emerged at the planning stage or a function that has emerged at the external (outline) design stage is added. It may be a kind of invention, such as a functional invention that is an invention, or an improved invention that has emerged in the detailed design stage.

なお、特許文書情報の国際特許分類、特許文書情報のFターム、特許文書情報のフェーズ、特許文書情報で示される発明の技術分野、特許文書情報に関する権利の存続期間、特許文書情報で示される発明の種類等は、特許文書情報から取得されたものであってもよく、あるいは、ユーザ等によって入力デバイス等を介して入力されたものであってもよい。例えば、実施の形態1の情報処理装置1は、図18で示されるように、文書属性情報を受け付ける文書属性情報受付部41と、文書属性情報受付部41が受け付けた文書属性情報を文書属性情報記憶部14に蓄積する文書属性情報蓄積部42とをさらに備えてもよい。文書属性情報受付部41は、例えば、入力デバイスから入力された情報を受け付けてもよく、有線もしくは無線の通信回線を介して送信された情報を受信してもよく、所定の記録媒体から読み出された情報を受け付けてもよい。なお、文書属性情報受付部41は、受け付けを行うためのデバイスを含んでもよく、あるいは含まなくてもよい。また、文書属性情報受付部41は、ハードウェアによって実現されてもよく、あるいは所定のデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。図19は、情報処理装置1が文書属性情報受付部41と、文書属性情報蓄積部42とを備えた場合のフローチャートである。ステップS401において、文書属性情報受付部41は、文書属性情報を受け付けたかどうか判断し、受け付けた場合には、ステップS402に進み、そうでない場合には、ステップS103に進む。ステップS402において、文書属性情報蓄積部42は、文書属性情報受付部41が受け付けた文書属性情報を文書属性情報記憶部14に蓄積する。なお、実施の形態2の情報処理装置2についても同様である。また、一般に、特許文書情報の国際特許分類、特許文書情報のFターム、特許文書情報のフェーズ、特許文書情報で示される発明の技術分野、特許文書情報で示される発明の種類等は、数字で表されるものではないため、それらの属性を教師情報として用いる場合には、それらの情報を数字に変換してから用いてもよい。例えば、各国際特許分類を、順番に数字に対応付けるようにしてもよい。   In addition, international patent classification of patent document information, F term of patent document information, phase of patent document information, technical field of invention indicated by patent document information, lifetime of rights related to patent document information, invention indicated by patent document information The type or the like may be acquired from patent document information, or may be input by a user or the like via an input device or the like. For example, as illustrated in FIG. 18, the information processing apparatus 1 according to the first embodiment includes a document attribute information receiving unit 41 that receives document attribute information, and document attribute information received by the document attribute information receiving unit 41 as document attribute information. A document attribute information accumulation unit 42 that accumulates in the storage unit 14 may be further included. For example, the document attribute information receiving unit 41 may receive information input from an input device, may receive information transmitted via a wired or wireless communication line, and read from a predetermined recording medium. Information may be accepted. Note that the document attribute information receiving unit 41 may or may not include a device for receiving. In addition, the document attribute information receiving unit 41 may be realized by hardware, or may be realized by software such as a driver that drives a predetermined device. FIG. 19 is a flowchart when the information processing apparatus 1 includes a document attribute information reception unit 41 and a document attribute information storage unit 42. In step S401, the document attribute information receiving unit 41 determines whether document attribute information has been received. If received, the process proceeds to step S402. If not, the process proceeds to step S103. In step S <b> 402, the document attribute information storage unit 42 stores the document attribute information received by the document attribute information reception unit 41 in the document attribute information storage unit 14. The same applies to the information processing apparatus 2 according to the second embodiment. In general, the international patent classification of patent document information, the F term of patent document information, the phase of patent document information, the technical field of the invention indicated by the patent document information, the type of invention indicated by the patent document information, etc. Since these attributes are not represented, when these attributes are used as teacher information, they may be used after being converted into numbers. For example, each international patent classification may be associated with a number in order.

ここで、数値化されていない文書属性情報を数値化する方法について説明する。実施の形態1,2で説明した情報処理装置1,2は、図20,図21で示されるように、文書属性情報数値化部51をさらに備えてもよい。その文書属性情報数値化部51は、文書属性情報記憶部14で記憶されている文書属性情報のうち、数値でないものを数値化して文書属性情報記憶部14に蓄積する。   Here, a method for digitizing document attribute information that has not been digitized will be described. The information processing apparatuses 1 and 2 described in the first and second embodiments may further include a document attribute information digitizing unit 51 as shown in FIGS. The document attribute information digitizing unit 51 digitizes non-numeric values among the document attribute information stored in the document attribute information storage unit 14 and accumulates them in the document attribute information storage unit 14.

その数値化の方法としては、例えば、(1)非数値の文書属性情報と、数値の文書属性情報とを対応付けて有する情報である数値化対応情報を用いて数値化する方法、(2)所定の式を用いた算出を行うことによって数値化する方法などがある。以下、それらについて説明する。   Examples of the digitization method include (1) a method of digitizing using non-numeric document attribute information and numeric correspondence information that is information having numeric document attribute information associated with each other, and (2) There is a method of digitizing by performing calculation using a predetermined formula. These will be described below.

(1)数値化対応情報を用いて数値化する方法
数値化対応情報は、例えば、図22で示されるものである。図22において、数値化対応情報は、非数値の文書属性情報と、数値の文書属性情報とを対応付けて有している。例えば、非数値の文書属性情報「発明回避容易性:高」に対しては、数値の文書属性情報「発明回避容易性:50」が対応付けられている。したがって、文書属性情報数値化部51は、数値化対応情報を参照することにより、文書属性情報記憶部14で記憶されている非数値の文書属性情報「発明回避容易性:高」を、数値の文書属性情報「発明回避容易性:50」に変換することができる。より具体的には、文書属性情報数値化部51は、非数値の文書属性情報「発明回避容易性:高」をキーとして数値化対応情報を検索し、その検索された非数値の文書属性情報「発明回避容易性:高」に対応する数値の文書属性情報「発明回避容易性:50」を取得することによって、その変換を行うことができる。そして、文書属性情報数値化部51は、変換後の数値の文書属性情報を文書属性情報記憶部14に蓄積する。
(1) Method of digitizing using digitization correspondence information The digitization correspondence information is, for example, as shown in FIG. In FIG. 22, the digitization correspondence information includes non-numeric document attribute information and numeric document attribute information in association with each other. For example, numerical document attribute information “invention avoidance: 50” is associated with non-numeric document attribute information “invention avoidance: high”. Therefore, the document attribute information digitizing unit 51 refers to the digitization correspondence information, and converts the non-numeric document attribute information “invention avoidance: high” stored in the document attribute information storage unit 14 into a numerical value. The document attribute information can be converted into “invention avoidance ease: 50”. More specifically, the document attribute information digitizing unit 51 searches the digitization correspondence information using the non-numeric document attribute information “ease of invention avoidance: high” as a key, and the retrieved non-numeric document attribute information. By obtaining the numerical document attribute information “invention avoidance ease: 50” corresponding to “invention avoidance ease: high”, the conversion can be performed. Then, the document attribute information digitizing unit 51 stores the converted numeric document attribute information in the document attribute information storage unit 14.

なお、図22で示されるように、IPC等の非数値の文書属性情報を、数値の文書属性情報に変換してもよい。図22では、例えば、「A01」から始まるIPCが、数値の文書属性情報「15」に変換されることになる。このようにIPCを数値に対応付ける場合に、そのIPCの対応する技術分野に応じて、値の大小を決定してもよい。例えば、製薬分野における1件の特許や発明の方が、家庭用電気機器における1件の特許や発明よりも価値があると考えることができうるため、製薬分野のIPCには、家庭用電気機器のIPCよりも大きな値を対応付けるようにしてもよい。なお、このような技術分野に応じた値の大小の決定は、IPCに限定されるものではなく、例えば、他の技術分野を示す非数値文書属性情報と、数値の文書属性情報との対応についても適用することができうる。   As shown in FIG. 22, non-numeric document attribute information such as IPC may be converted into numeric document attribute information. In FIG. 22, for example, an IPC starting from “A01” is converted into numerical document attribute information “15”. In this way, when an IPC is associated with a numerical value, the magnitude of the value may be determined according to the technical field corresponding to the IPC. For example, it can be considered that one patent or invention in the pharmaceutical field is more valuable than one patent or invention in a home electric device. A value larger than the IPC may be associated. The determination of the magnitude of the value according to the technical field is not limited to the IPC. For example, the correspondence between the non-numeric document attribute information indicating another technical field and the numerical document attribute information. Can also be applied.

(2)所定の式を用いた算出を行うことによって数値化する方法
まず、非数値の文書属性情報と、数値の情報とを対応付けて有している対応情報が存在するとする。対応情報は、例えば、図23で示されるものである。図23において、非数値の文書属性情報「A社」が、数値の情報「資本金:1億円」、「売上:2億円」、「経常利益:2千万円」、「従業員:100人」に対応付けられている。したがって、文書属性情報数値化部51は、対応情報を参照することにより、文書属性情報記憶部14で記憶されている非数値の文書属性情報「出願人:A社」に対応付けられている、数値の情報「資本金:1億円」等を取得することができる。そして、それらの数値の情報「資本金:1億円」等を、あらかじめ設定されている所定の式の引数として代入することにより、その式の値を求めることができる。そして、その求めた式の値を、文書属性情報「A社」に対応する数値の文書属性情報として文書属性情報記憶部14に蓄積してもよい。
(2) Method of Digitizing by Performing Calculation Using Predetermined First, it is assumed that there is correspondence information having non-numeric document attribute information and numeric information associated with each other. The correspondence information is, for example, shown in FIG. In FIG. 23, the non-numeric document attribute information “Company A” has numeric information “Capital: 100 million yen”, “Sales: 200 million yen”, “Ordinary profit: 20 million yen”, “Employee: 100 people ". Therefore, the document attribute information digitizing unit 51 refers to the correspondence information, and is associated with the non-numeric document attribute information “Applicant: Company A” stored in the document attribute information storage unit 14. Numerical information such as “Capital: 100 million yen” can be acquired. Then, by substituting such numerical information “capital: ¥ 100 million” as an argument of a predetermined formula set in advance, the value of the formula can be obtained. Then, the value of the obtained expression may be accumulated in the document attribute information storage unit 14 as numerical document attribute information corresponding to the document attribute information “Company A”.

ここで、その所定の式は、例えば、規模の大きな出願人ほど、大きな値となる式であってもよく、あるいは、効率的な経営をしている出願人ほど、大きな値となる式であってもよい。前者の場合としては、例えば、その所定の式は、資本金や売上等に関する増加関数であってもよい。また、後者の場合としては、例えば、その所定の式は、一従業員あたりの売上や、一従業員あたりの経常利益に関する増加関数であってもよい。なお、対応情報における売上は、例えば、会社の全体の売上であってもよく、あるいは、文書属性情報の対応する特許文書情報の示す発明を使用する商品等の売上であってもよい。   Here, the predetermined formula may be, for example, a formula with a larger value for a large-scale applicant, or a formula with a larger value for an applicant who operates efficiently. May be. In the former case, for example, the predetermined formula may be an increase function related to capital, sales, or the like. In the latter case, for example, the predetermined formula may be an increase function related to sales per employee or recurring profit per employee. Note that the sales in the correspondence information may be, for example, the sales of the entire company, or may be sales of products that use the invention indicated by the corresponding patent document information in the document attribute information.

このように、文書属性情報数値化部51は、対応情報を用いて、数値でない文書属性情報を数値の情報に変換し、その数値の情報を所定の式の引数として代入することにより、数値の文書属性情報を算出するものであってもよい。   As described above, the document attribute information digitizing unit 51 uses the correspondence information to convert the document attribute information that is not a numerical value into numerical information, and substitutes the numerical information as an argument of a predetermined expression, thereby Document attribute information may be calculated.

なお、図22や図23で示した数値化対応情報や、対応情報は一例であって、非数値の文書属性情報を数値の文書属性情報に変換するために用いることができるのであれば、その他の数値化対応情報や、その他の対応情報であってもよいことは言うまでもない。   Note that the digitization correspondence information and correspondence information shown in FIGS. 22 and 23 are examples, and other information can be used as long as it can be used to convert non-numeric document attribute information into numeric document attribute information. Needless to say, it may be the information corresponding to the digitization or other correspondence information.

また、ここでは、文書属性情報数値化部51が、図22で示される数値化対応情報や、図23で示される対応情報等を用いて、数値化を行う場合について説明したが、文書属性情報数値化部51が、結果として、文書属性情報記憶部14で記憶されている文書属性情報のうち、数値でないものを数値化して文書属性情報記憶部14に蓄積することができるのであれば、具体的な数値化の処理は、文書属性情報数値化部51以外のところで行われてもよい。例えば、文書属性情報数値化部51がアクセス可能な所定のサーバ等において、数値化対応情報を用いた数値化や、所定の式を用いた数値化が行われてもよい。そのような場合には、例えば、文書属性情報数値化部51は、非数値の文書属性情報をその所定のサーバに送信し、その送信に応じて、その所定のサーバから送信された数値の文書属性情報を受信することによって、数値化を行ってもよい。なお、文書属性情報数値化部51において数値化対応情報を用いた数値化や、所定の式を用いた数値化が行われる場合には、文書属性情報数値化部51は、その数値化対応情報、または、対応情報及び所定の式を示す情報を記録媒体において保持しており、それらの情報を用いて、数値でない文書属性情報を、数値の文書属性情報に変換するものとする。   Although the document attribute information digitizing unit 51 performs digitization using the digitization correspondence information shown in FIG. 22 and the correspondence information shown in FIG. 23, the document attribute information is described here. As a result, if the digitizing unit 51 can digitize and store the non-numeric values of the document attribute information stored in the document attribute information storage unit 14 in the document attribute information storage unit 14 The numerical digitization process may be performed at a place other than the document attribute information digitization unit 51. For example, in a predetermined server or the like accessible by the document attribute information digitizing unit 51, digitization using digitization correspondence information or digitization using a predetermined formula may be performed. In such a case, for example, the document attribute information digitizing unit 51 transmits non-numeric document attribute information to the predetermined server, and in response to the transmission, the numerical document sent from the predetermined server. Digitization may be performed by receiving attribute information. When the document attribute information digitizing unit 51 performs digitization using the digitization correspondence information or digitization using a predetermined formula, the document attribute information digitization unit 51 displays the digitization correspondence information. Alternatively, correspondence information and information indicating a predetermined expression are held in a recording medium, and document attribute information that is not a numerical value is converted into numerical document attribute information using the information.

また、文書属性情報数値化部51は、文書属性情報記憶部14で記憶されている文書属性情報のみについてではなく、サンプル文書属性情報記憶部15で記憶されているサンプル文書属性情報についても、数値化を行ってもよい。すなわち、文書属性情報数値化部51は、サンプル文書属性情報記憶部15で記憶されているサンプル文書属性情報のうち、数値でないものを数値にしてサンプル文書属性情報記憶部15に蓄積してもよい。また、文書属性情報数値化部51がサンプル文書属性情報についても数値化を行う場合に、数値化対応情報を用いて、数値でないサンプル文書属性情報を数値のサンプル文書属性情報に変換してもよい。その場合には、非数値のサンプル文書属性情報が、非数値の文書属性情報であると見なし、数値のサンプル文書属性情報が、数値の文書属性情報であると見なして、数値化対応情報を用いた数値化を行ってもよい。さらに、同様にして、文書属性情報数値化部51は、所定の式を用いた算出を行うことによって、数値でないサンプル文書属性情報の数値化を行ってもよい。なお、文書属性情報の数値化では、どの文書属性情報を用いて特許価値情報等を算出するのかについて決まっていないため、事前に手動で数値化を行うことは困難であると考えられる。一方、サンプル文書属性情報の数値化では、あらかじめサンプル文書属性情報の量が決まっているため、文書属性情報数値化部51を用いることなく、事前に手動で数値化を行ってもよい。もっとも、文書属性情報についても、手動で数値化を行ってもよいことは言うまでもない。   Further, the document attribute information digitizing unit 51 numerically displays not only the document attribute information stored in the document attribute information storage unit 14 but also the sample document attribute information stored in the sample document attribute information storage unit 15. May also be performed. That is, the document attribute information digitizing unit 51 may store the sample document attribute information stored in the sample document attribute information storage unit 15 in the sample document attribute information storage unit 15 as a numerical value. . When the document attribute information digitizing unit 51 also digitizes the sample document attribute information, the non-numeric sample document attribute information may be converted into numeric sample document attribute information using the digitization correspondence information. . In that case, the non-numeric sample document attribute information is regarded as non-numeric document attribute information, the numeric sample document attribute information is regarded as numeric document attribute information, and the digitization support information is used. Quantification may be performed. Further, similarly, the document attribute information digitizing unit 51 may digitize sample document attribute information that is not a numeric value by performing a calculation using a predetermined formula. In the digitization of document attribute information, since it is not determined which document attribute information is used to calculate patent value information or the like, it is considered difficult to manually digitize in advance. On the other hand, in the digitization of the sample document attribute information, since the amount of the sample document attribute information is determined in advance, the digitization may be performed manually in advance without using the document attribute information digitization unit 51. Of course, the document attribute information may also be digitized manually.

なお、実施の形態1,実施の形態2では、文書属性情報蓄積部13が文書属性情報を文書属性情報記憶部14に蓄積する場合について説明したが、文書属性情報記憶部14に文書属性情報が記憶される過程は問わない。例えば、記録媒体を介して情報が文書属性情報記憶部14で記憶されるようになってもよく、通信回線等を介して送信された情報が文書属性情報記憶部14で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が文書属性情報記憶部14で記憶されるようになってもよい。   In the first and second embodiments, the case where the document attribute information storage unit 13 stores the document attribute information in the document attribute information storage unit 14 has been described. However, the document attribute information is stored in the document attribute information storage unit 14. The memorized process is not limited. For example, information may be stored in the document attribute information storage unit 14 via a recording medium, and information transmitted via a communication line or the like is stored in the document attribute information storage unit 14. Alternatively, information input via the input device may be stored in the document attribute information storage unit 14.

また、実施の形態1,実施の形態2では、文書属性情報蓄積部13がサンプル文書属性情報をサンプル文書属性情報記憶部15に蓄積する場合について説明したが、サンプル文書属性情報記憶部15にサンプル文書属性情報が記憶される過程は問わない。例えば、記録媒体を介して情報がサンプル文書属性情報記憶部15で記憶されるようになってもよく、通信回線等を介して送信された情報がサンプル文書属性情報記憶部15で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報がサンプル文書属性情報記憶部15で記憶されるようになってもよい。   In the first and second embodiments, the case where the document attribute information storage unit 13 stores the sample document attribute information in the sample document attribute information storage unit 15 has been described. The process in which the document attribute information is stored does not matter. For example, information may be stored in the sample document attribute information storage unit 15 via a recording medium, and information transmitted via a communication line or the like may be stored in the sample document attribute information storage unit 15. Alternatively, the information input via the input device may be stored in the sample document attribute information storage unit 15.

(実施の形態3)
本発明の実施の形態3による情報処理装置について、図面を参照しながら説明する。本実施の形態による情報処理装置は、サンプル特許属性情報に代えてサンプル特許特性情報を教師情報として用いて特許価値情報を算出するものである。
(Embodiment 3)
An information processing apparatus according to Embodiment 3 of the present invention will be described with reference to the drawings. The information processing apparatus according to the present embodiment calculates patent value information using sample patent characteristic information as teacher information instead of sample patent attribute information.

図15は、本実施の形態による情報処理装置3の構成を示すブロック図である。図15において、ほん実施の形態による情報処理装置3は、サンプル特許価値情報受付部16と、サンプル特許価値情報蓄積部17と、サンプル特許価値情報記憶部18と、特許特性情報受付部31と、特許特性情報蓄積部32と、特許特性情報記憶部33と、サンプル特許特性情報記憶部34と、特許価値情報算出部35と、特許価値情報出力部36とを備える。なお、サンプル特許価値情報受付部16、サンプル特許価値情報蓄積部17、サンプル特許価値情報記憶部18の構成及び動作は、実施の形態1と同様であり、その説明を省略する。   FIG. 15 is a block diagram showing a configuration of the information processing apparatus 3 according to the present embodiment. In FIG. 15, the information processing apparatus 3 according to the embodiment includes a sample patent value information receiving unit 16, a sample patent value information accumulating unit 17, a sample patent value information storing unit 18, a patent characteristic information receiving unit 31, A patent characteristic information storage unit 32, a patent characteristic information storage unit 33, a sample patent characteristic information storage unit 34, a patent value information calculation unit 35, and a patent value information output unit 36 are provided. Note that the configuration and operation of the sample patent value information receiving unit 16, the sample patent value information storage unit 17, and the sample patent value information storage unit 18 are the same as those in the first embodiment, and a description thereof will be omitted.

特許特性情報受付部31は、特許特性情報を受け付ける。ここで、特許特性情報とは、実施の形態2の説明と同様であり、特許文書情報の特性を示す情報であって、発明本質抽出特性と、強靱特性と、発明展開特性と、実施可能担保特性とを含む情報である。特許特性情報受付部31は、サンプル特許特性情報も受け付ける。サンプル特許特性情報とは、実施の形態2の説明と同様であり、教師情報として用いられる特許特性情報である。特許特性情報受付部31は、例えば、入力デバイス(例えば、キーボードやマウス、タッチパネルなど)から入力された情報を受け付けてもよく、有線もしくは無線の通信回線を介して送信された情報を受信してもよく、所定の記録媒体(例えば、光ディスクや磁気ディスク、半導体メモリなど)から読み出された情報を受け付けてもよい。本実施の形態では、特許特性情報受付部31は、入力デバイスから入力された特許特性情報を受け付けるものとする。なお、特許特性情報受付部31は、受け付けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んでもよく、あるいは含まなくてもよい。また、特許特性情報受付部31は、ハードウェアによって実現されてもよく、あるいは所定のデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。   The patent characteristic information receiving unit 31 receives patent characteristic information. Here, the patent characteristic information is the same as the description of the second embodiment, and is information indicating the characteristics of the patent document information. The invention essential extraction characteristic, the toughness characteristic, the invention development characteristic, and the feasible security Information including characteristics. The patent characteristic information receiving unit 31 also receives sample patent characteristic information. The sample patent characteristic information is the same as that described in the second embodiment, and is patent characteristic information used as teacher information. For example, the patent characteristic information receiving unit 31 may receive information input from an input device (for example, a keyboard, a mouse, a touch panel, etc.) and receive information transmitted via a wired or wireless communication line. Alternatively, information read from a predetermined recording medium (for example, an optical disk, a magnetic disk, a semiconductor memory, etc.) may be received. In the present embodiment, it is assumed that the patent characteristic information receiving unit 31 receives patent characteristic information input from an input device. The patent characteristic information receiving unit 31 may or may not include a device (for example, a modem or a network card) for receiving. The patent characteristic information receiving unit 31 may be realized by hardware, or may be realized by software such as a driver that drives a predetermined device.

特許特性情報蓄積部32は、特許特性情報受付部31が受け付けた特許特性情報を特許特性情報記憶部33に蓄積する。また、特許特性情報蓄積部32は、特許特性情報受付部31が受け付けたサンプル特許特性情報をサンプル特許特性情報記憶部34に蓄積する。   The patent characteristic information accumulating unit 32 accumulates the patent characteristic information received by the patent characteristic information receiving unit 31 in the patent characteristic information storage unit 33. The patent characteristic information accumulating unit 32 accumulates the sample patent characteristic information received by the patent characteristic information receiving unit 31 in the sample patent characteristic information storage unit 34.

特許特性情報記憶部33では、特許特性情報が記憶される。特許特性情報記憶部33での記憶は、例えば、RAM等における一時的な記憶でもよく、あるいは、フラッシュメモリや磁気ディスク等における長期的な記憶でもよい。特許特性情報記憶部33は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。   The patent characteristic information storage unit 33 stores patent characteristic information. The storage in the patent characteristic information storage unit 33 may be temporary storage in a RAM or the like, or may be long-term storage in a flash memory or a magnetic disk, for example. The patent characteristic information storage unit 33 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).

サンプル特許特性情報記憶部34では、サンプル特許特性情報が記憶される。なお、本実施の形態では、サンプル特許特性情報記憶部34で記憶されるサンプル特許特性情報と、サンプル特許価値情報記憶部18で記憶されるサンプル特許価値情報とが対応する情報となる。サンプル特許特性情報記憶部34での記憶は、例えば、RAM等における一時的な記憶でもよく、あるいは、フラッシュメモリや磁気ディスク等における長期的な記憶でもよい。サンプル特許特性情報記憶部34は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。   The sample patent characteristic information storage unit 34 stores sample patent characteristic information. In the present embodiment, the sample patent characteristic information stored in the sample patent characteristic information storage unit 34 corresponds to the sample patent value information stored in the sample patent value information storage unit 18. The storage in the sample patent characteristic information storage unit 34 may be temporary storage in a RAM or the like, or may be long-term storage in a flash memory or a magnetic disk, for example. The sample patent characteristic information storage unit 34 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).

特許価値情報算出部35は、特許特性情報記憶部33が記憶している特許特性情報から、その特許特性情報に対応する特許文書情報の価値を示す特許価値情報を算出する。特許価値情報算出部35は、サンプル特許特性情報記憶部34が記憶しているサンプル特許特性情報と、サンプル特許価値情報記憶部18が記憶しているサンプル特許価値情報とを教師情報として、特許特性情報から特許価値情報を算出する以外、実施の形態1の特許価値情報算出部19と同様のものであり、その説明を省略する。   The patent value information calculation unit 35 calculates patent value information indicating the value of the patent document information corresponding to the patent characteristic information from the patent characteristic information stored in the patent characteristic information storage unit 33. The patent value information calculation unit 35 uses, as teacher information, the sample patent property information stored in the sample patent property information storage unit 34 and the sample patent value information stored in the sample patent value information storage unit 18 as patent information. Except for calculating the patent value information from the information, it is the same as the patent value information calculation unit 19 of the first embodiment, and the description thereof is omitted.

特許価値情報出力部36は、特許価値情報算出部35が算出した特許価値情報を出力する。特許価値情報出力部36は、実施の形態1の特許価値情報出力部20と同様のものであり、その説明を省略する。   The patent value information output unit 36 outputs the patent value information calculated by the patent value information calculation unit 35. The patent value information output unit 36 is the same as the patent value information output unit 20 of the first embodiment, and a description thereof is omitted.

なお、サンプル特許価値情報記憶部18と、特許特性情報記憶部33と、サンプル特許特性情報記憶部34との任意の2以上の記憶部は、同一の記録媒体によって実現されてもよく、あるいは、別々の記録媒体によって実現されてもよい。   Note that any two or more storage units of the sample patent value information storage unit 18, the patent characteristic information storage unit 33, and the sample patent characteristic information storage unit 34 may be realized by the same recording medium, or It may be realized by separate recording media.

次に、本実施の形態による情報処理装置3の動作について、図16のフローチャートを用いて説明する。なお、ステップS101,S102の処理については、実施の形態1の図2のフローチャートと同様であり、その説明を省略する。   Next, the operation of the information processing apparatus 3 according to this embodiment will be described using the flowchart of FIG. In addition, about the process of step S101, S102, it is the same as that of the flowchart of FIG. 2 of Embodiment 1, The description is abbreviate | omitted.

(ステップS301)特許特性情報受付部31は、特許特性情報またはサンプル特許特性情報を受け付けたかどうか判断する。そして、特許特性情報等を受け付けた場合には、ステップS302に進み、そうでない場合には、ステップS303に進む。   (Step S301) The patent characteristic information receiving unit 31 determines whether patent characteristic information or sample patent characteristic information has been received. If patent characteristic information or the like is received, the process proceeds to step S302. If not, the process proceeds to step S303.

(ステップS302)特許特性情報蓄積部32は、特許特性情報受付部31が特許特性情報を受け付けた場合には、その特許特性情報を特許特性情報記憶部33に蓄積する。特許特性情報蓄積部32は、特許特性情報受付部31がサンプル特許特性情報を受け付けた場合には、そのサンプル特許特性情報をサンプル特許特性情報記憶部34に蓄積する。そして、ステップS101に戻る。   (Step S <b> 302) When the patent characteristic information receiving unit 31 receives the patent characteristic information, the patent characteristic information storage unit 32 stores the patent characteristic information in the patent characteristic information storage unit 33. When the patent characteristic information receiving unit 31 receives sample patent characteristic information, the patent characteristic information storage unit 32 stores the sample patent characteristic information in the sample patent characteristic information storage unit 34. Then, the process returns to step S101.

(ステップS303)特許価値情報算出部35は、特許価値情報を算出するかどうか判断する。そして、特許価値情報を算出する場合には、ステップS304に進み、そうでない場合には、ステップS101に戻る。ここで、特許価値情報算出部35が特許価値情報を算出すると判断するタイミングは問わない。例えば、所定のイベントの発生(例えば、特許価値情報を算出する旨の指示が受け付けられたことなど)をトリガーとして特許価値情報を算出すると判断してもよい。   (Step S303) The patent value information calculation unit 35 determines whether to calculate patent value information. And when calculating patent value information, it progresses to step S304, and when that is not right, it returns to step S101. Here, the timing at which the patent value information calculation unit 35 determines to calculate the patent value information does not matter. For example, it may be determined that the patent value information is calculated with the occurrence of a predetermined event (for example, an instruction to calculate the patent value information is accepted) as a trigger.

(ステップS304)特許価値情報算出部35は、サンプル特許特性情報記憶部34が記憶しているサンプル特許特性情報と、サンプル特許価値情報記憶部18が記憶しているサンプル特許価値情報とを教師情報として、特許特性情報記憶部33が記憶している特許特性情報から特許価値情報を算出する。   (Step S304) The patent value information calculation unit 35 uses the sample patent characteristic information stored in the sample patent characteristic information storage unit 34 and the sample patent value information stored in the sample patent value information storage unit 18 as teacher information. The patent value information is calculated from the patent characteristic information stored in the patent characteristic information storage unit 33.

(ステップS305)特許価値情報出力部20は、特許価値情報算出部35が算出した特許価値情報を週力する。そして、ステップS101に戻る。
なお、図16のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
(Step S305) The patent value information output unit 20 works on the patent value information calculated by the patent value information calculation unit 35 weekly. Then, the process returns to step S101.
In the flowchart of FIG. 16, the process is terminated by power-off or a process termination interrupt.

次に、本実施の形態による情報処理装置3の動作について、具体例を用いて説明する。この具体例において、情報処理装置3は前述の具体例と同様にスタンドアロンのPCであるとする。   Next, the operation of the information processing apparatus 3 according to the present embodiment will be described using a specific example. In this specific example, it is assumed that the information processing apparatus 3 is a stand-alone PC as in the above specific example.

まず、実施の形態1の具体例と同様にして、サンプル特許価値情報が受け付けられ、サンプル特許価値情報記憶部18に蓄積されたとする(ステップS101,S102)。サンプル特許価値情報記憶部18が記憶しているサンプル特許価値情報は、図6で示されるものであるとする。   First, it is assumed that the sample patent value information is received and accumulated in the sample patent value information storage unit 18 as in the specific example of the first embodiment (steps S101 and S102). The sample patent value information stored in the sample patent value information storage unit 18 is assumed to be as shown in FIG.

また、サンプル特許価値情報と同様にして、特許特性情報、及びサンプル特許特性情報が特許特性情報受付部31で受け付けられ、特許特性情報記憶部33、及びサンプル特許特性情報記憶部34に蓄積されたとする(ステップS301,S302)。特許特性情報記憶部33が記憶している特許特性情報は、図17で示されるものであり、サンプル特許特性情報記憶部34が記憶しているサンプル特許特性情報は、図14で示されるものであるとする。   Similarly to the sample patent value information, the patent characteristic information and the sample patent characteristic information are received by the patent characteristic information receiving unit 31 and accumulated in the patent characteristic information storage unit 33 and the sample patent characteristic information storage unit 34. (Steps S301 and S302). The patent characteristic information stored in the patent characteristic information storage unit 33 is as shown in FIG. 17, and the sample patent characteristic information stored in the sample patent characteristic information storage unit 34 is as shown in FIG. Suppose there is.

次に、ユーザは、実施の形態1の図7と同様の画面において、マウスを操作して特許文書ID「P1999−111111」の左側のラジオボタンをクリックすることにより、特許文書ID「P1999−111111」で識別される特許文書情報を選択したとする。そして、ユーザがマウスを操作することによって「OK」ボタンをクリックする。すると、特許特性情報算出部24は、特許文書ID「P1999−111111」で識別される特許文書情報について特許特性情報を算出する旨の指示を受け付けたと判断する(ステップS303)。そして、特許価値情報算出部35は、サンプル特許特性情報記憶部34から教師情報としてのサンプル特許特性情報を読み出し、サンプル特許価値情報記憶部18から教師情報としてのサンプル特許価値情報を読み出す。特許価値情報算出部35は、それらの情報を実施の形態1の図10と同様にサポートベクターマシンに読み込む形式に変換する。特許価値情報算出部35は、特許特性情報記憶部33から特許価値情報を算出する特許文書情報の特許特性情報を読み出し、教師情報を読み込み、サポートベクターマシンを用いて、読み出した特許特性情報に対応する特許価値情報を算出する。ここで用いられるサポートベクターマシンでは、多クラスのクラス分類を行うものとする。ここでは、特許文書ID「P1999−111111」で識別される特許文書情報の特許価値「70」が算出されたとする(ステップS304)。すると、特許価値情報出力部36は、算出された特許価値情報を、実施の形態1の図11と同様に、情報処理装置3のディスプレイに表示する(ステップS305)。このようにして、ユーザは、特許価値情報について知ることができる。   Next, the user operates the mouse on the screen similar to that in FIG. 7 of the first embodiment and clicks the radio button on the left side of the patent document ID “P1999-111111”, thereby the patent document ID “P1999-111111”. ”Is selected. Then, the user clicks the “OK” button by operating the mouse. Then, the patent characteristic information calculation unit 24 determines that an instruction to calculate patent characteristic information for the patent document information identified by the patent document ID “P1999-111111” has been received (step S303). Then, the patent value information calculation unit 35 reads sample patent characteristic information as teacher information from the sample patent characteristic information storage unit 34, and reads sample patent value information as teacher information from the sample patent value information storage unit 18. The patent value information calculation unit 35 converts the information into a format that is read into the support vector machine, as in FIG. 10 of the first embodiment. The patent value information calculation unit 35 reads the patent characteristic information of the patent document information for calculating the patent value information from the patent characteristic information storage unit 33, reads the teacher information, and supports the read patent characteristic information using the support vector machine. The patent value information to be calculated is calculated. The support vector machine used here performs multi-class classification. Here, it is assumed that the patent value “70” of the patent document information identified by the patent document ID “P1999-111111” is calculated (step S304). Then, the patent value information output unit 36 displays the calculated patent value information on the display of the information processing device 3 as in FIG. 11 of the first embodiment (step S305). In this way, the user can know the patent value information.

以上のように、本実施の形態による情報処理装置3では、特許価値情報算出部35がサンプル特許特性情報とサンプル特許価値情報とを教師情報として用いることにより、所望の特許文書情報の価値を示す特許価値情報を算出することができる。このように、教師情報を用いて特許価値情報の算出を行うため、ユーザの主観的な評価の要素を考慮した特許価値の算出を行うことができる。一方、ユーザごとに特許価値情報を算出するための複雑な式等を設定する必要がなく、式を設定するための煩雑な作業を行わなくてよいことになる。   As described above, in the information processing apparatus 3 according to the present embodiment, the patent value information calculation unit 35 uses the sample patent characteristic information and the sample patent value information as teacher information to indicate the value of desired patent document information. Patent value information can be calculated. In this way, since the patent value information is calculated using the teacher information, the patent value can be calculated in consideration of the subjective evaluation elements of the user. On the other hand, it is not necessary to set a complicated formula or the like for calculating patent value information for each user, and it is not necessary to perform complicated work for setting the formula.

なお、実施の形態2,3では、特許特性情報や、サンプル特許特性情報がユーザ等によって決定され、その値が受付部で受け付けられる場合について説明したが、特許特性情報や、サンプル特許特性情報は、所定の処理によって機械的に決定されたものであってもよい。例えば、上記特許文献1で記載されているように、所定の式を用いて、特許特性情報等を算出し、その算出された特許特性情報等を情報処理装置において用いるようにしてもよい。   In the second and third embodiments, the case where the patent characteristic information and the sample patent characteristic information are determined by the user or the like and the value is received by the reception unit has been described. However, the patent characteristic information and the sample patent characteristic information are Alternatively, it may be determined mechanically by a predetermined process. For example, as described in Patent Document 1, patent characteristic information or the like may be calculated using a predetermined formula, and the calculated patent characteristic information or the like may be used in the information processing apparatus.

また、実施の形態2,3において、特許特性情報は、発明本質抽出特性、強靱特性、発明展開特性、及び実施可能担保特性を含むものであると説明したが、特許特性情報は、発明本質抽出特性、強靱特性、発明展開特性、及び実施可能担保特性の群から選ばれる、特許文書情報の1以上の特性を示す情報であってもよい。すなわち、特許特性情報は、特許特性情報は、発明本質抽出特性、強靱特性、発明展開特性、及び実施可能担保特性の任意の1以上の情報であってもよい。サンプル特許特性情報についても同様である。   In Embodiments 2 and 3, it has been described that the patent characteristic information includes the invention essential extraction characteristic, the toughness characteristic, the invention development characteristic, and the practicable collateral characteristic, but the patent characteristic information includes the invention essential extraction characteristic, It may be information indicating one or more characteristics of patent document information selected from the group of toughness characteristics, invention development characteristics, and feasible security characteristics. That is, the patent characteristic information may be any one or more information of the invention essential extraction characteristic, the toughness characteristic, the invention development characteristic, and the practicable security characteristic. The same applies to sample patent characteristic information.

また、上記各実施の形態の具体例では、サポートベクターマシンによって多クラスのクラス分類を行う場合について説明したが、サポートベクターマシンによって2値のクラス分類や実数値の出力を行ってもよいことは、前述の通りである。前者の場合には、例えば、特許文書情報を、価値のある特許文書情報と、価値のない特許文書情報とに分類することができる。具体的には、過去にライセンス交渉や権利行使などにおいて用いた特許のうち、ライセンス交渉や権利行使の成功した特許に対応する特許文書情報を、価値のある特許文書情報として、ライセンス交渉や権利行使の失敗した特許に対応する特許文書情報を、価値のない特許文書情報としてもよい。   In the specific examples of the above embodiments, the case where multi-class classification is performed by the support vector machine has been described. However, the binary classification and real value output may be performed by the support vector machine. As described above. In the former case, for example, patent document information can be classified into valuable patent document information and worthless patent document information. Specifically, out of the patents used in license negotiations and rights exercises in the past, the patent document information corresponding to the patents for which license negotiations and rights have been successfully executed are used as valuable patent document information. The patent document information corresponding to the failed patent may be worthless patent document information.

また、上記各実施の形態では、サンプル特許価値情報や特許特性情報、サンプル特許特性情報等が受付部によって受け付けられ、記憶部に蓄積される場合について説明したが、それらの情報があらかじめ記憶されている着脱可能な記憶部が情報処理装置に装着されることにより、それらの情報を記憶している記憶部が構成されるようにしてもよい。   In each of the above embodiments, sample patent value information, patent characteristic information, sample patent characteristic information, etc. are received by the receiving unit and stored in the storage unit. However, such information is stored in advance. A removable storage unit may be mounted on the information processing apparatus to configure a storage unit that stores such information.

また、上記各実施の形態の具体例では、特許価値情報の算出や特許特性情報の算出においてサポートベクターマシンを用いる場合について説明したが、サポートベクターマシン以外の方法によって特許価値情報等を算出してもよいことは、前述のとおりである。例えば、特許価値情報の式が次のように定められているとする。   Further, in the specific examples of the above embodiments, the case where the support vector machine is used in the calculation of the patent value information and the calculation of the patent characteristic information has been described, but the patent value information and the like are calculated by a method other than the support vector machine. As described above, it is also possible. For example, it is assumed that the formula of patent value information is determined as follows.

(特許価値情報)=A1×(請求項の数)+A2×(独立形式の請求項の数)+A3×(カテゴリー数)+A4×(ネストレベル)+A5×(特許請求の範囲の文字数)+A6×(代表請求項の構成要素数)+A7×(代表請求項の読点の数)+A8×(代表請求項の文字数)+A9×(代表請求項の前提部の文字数)+A10×(代表請求項の特徴部の文字数)+A11×(代表請求項の代表構成要素の文字数)+A12×(特許文献数)+A13×(非特許文献数)+A14×(実施の形態の文字数)+A15×(実施の形態での例示の数)+A16×(実施の形態での外延拡張表記の数)+A17×(図面数)   (Patent value information) = A1 × (number of claims) + A2 × (number of independent claims) + A3 × (number of categories) + A4 × (nesting level) + A5 × (number of characters in claims) + A6 × ( Number of components of representative claim) + A7 × (number of readings of representative claim) + A8 × (number of characters of representative claim) + A9 × (number of characters of premise part of representative claim) + A10 × (characteristic part of representative claim) Number of characters) + A11 × (number of characters of representative component of representative claim) + A12 × (number of patent documents) + A13 × (number of non-patent documents) + A14 × (number of characters in the embodiment) + A15 × (number of examples in the embodiment) ) + A16 × (number of extended extension notations in the embodiment) + A17 × (number of drawings)

この場合に、サンプル特許価値情報と、サンプル文書属性情報とを用いて、A1〜A17の各係数の値を算出してもよい。この場合に、サンプル特許価値情報と、サンプル文書属性情報との組を未定の係数の個数である17組以上用意しておき、最小二乗法等を用いて、最も確からしい係数A1〜A17の値を算出し、その係数の値を用いて、文書属性情報を代入することによって、特許価値情報を算出してもよい。なお、複数存在する属性のうち、特許価値情報と相関のある属性のみを用いてもよい。例えば、サンプル文書属性情報に含まれる各属性(例えば、請求項の数や独立形式の請求項の数など)について、一の属性の値の集合と、対応するサンプル特許価値情報の値の集合との間の相関係数を算出する。そして、その相関係数の絶対値が所定のしきい値(例えば、0.5など)よりも大きい場合にのみ、その属性を上記の特許価値情報の式の変数として用いるようにしてもよい。このようにすることで、特許価値情報と相関の低い属性を特許価値情報の変数から除外することができ、より適切な特許価値情報の算出を行うことができうる。なお、相関係数の絶対値と所定のしきい値との比較を行うのではなく、相関係数の絶対値が大きいものから所定の個数(例えば、10個など)の属性を選択して、その選択した属性のみを特許価値情報の変数として用いるようにしてもよい。実施の形態2,3の場合にも、同様にすることができる。この場合も、係数を求めるために用いられるサンプル特許価値情報や、サンプル文書属性情報等が教師情報となる。なお、上記式において、どのような文書属性情報を用いるのか、また、各属性値について線形であるか、あるいは、非線形であるか、各属性値の1次の式とするのか、あるいは、2次以上の式にするのか、などについては任意であり、ユーザ等が自由に式を決定できることはいうまでもない。   In this case, the values of the coefficients A1 to A17 may be calculated using the sample patent value information and the sample document attribute information. In this case, 17 or more pairs of sample patent value information and sample document attribute information, which are the number of undetermined coefficients, are prepared, and the most probable values of the coefficients A1 to A17 using the least square method or the like. Patent value information may be calculated by substituting document attribute information using the coefficient value. Of the plurality of attributes, only the attribute correlated with the patent value information may be used. For example, for each attribute included in the sample document attribute information (for example, the number of claims and the number of independent claims), a set of values of one attribute and a set of values of the corresponding sample patent value information The correlation coefficient between is calculated. Then, only when the absolute value of the correlation coefficient is larger than a predetermined threshold (for example, 0.5), the attribute may be used as a variable in the above-described patent value information formula. By doing so, it is possible to exclude an attribute having a low correlation with the patent value information from the variable of the patent value information, and to calculate more appropriate patent value information. Instead of comparing the absolute value of the correlation coefficient with a predetermined threshold value, a predetermined number (for example, 10) of attributes having a large absolute value of the correlation coefficient is selected, Only the selected attribute may be used as a variable of patent value information. The same can be applied to the second and third embodiments. In this case, the sample patent value information used for obtaining the coefficient, the sample document attribute information, and the like are teacher information. In the above formula, what kind of document attribute information is used, whether each attribute value is linear, non-linear, a primary formula of each attribute value, or secondary The above formula is arbitrary, and it goes without saying that the user can freely determine the formula.

また、上記各実施の形態では、特許価値情報や特許特性情報が数値として算出され、出力する場合について説明したが、それらの出力時に、その数値を定性的な指標に変換してもよい。例えば、特許価値情報が1から5の5段階で算出される場合に、特許価値情報「5」の場合には、特許価値情報「高」を出力し、特許価値情報「4」の場合には、特許価値情報「やや高」を出力し、特許価値情報「3」の場合には、特許価値情報「中」を出力してもよい。   Further, although cases have been described with the above embodiments where patent value information and patent characteristic information are calculated and output as numerical values, the numerical values may be converted into qualitative indicators at the time of output. For example, when the patent value information is calculated in five stages from 1 to 5, if the patent value information is “5”, the patent value information “high” is output, and if the patent value information is “4”, The patent value information “slightly high” may be output, and in the case of the patent value information “3”, the patent value information “medium” may be output.

また、特許文書情報は、上記各実施の形態で説明した以外の情報、例えば、拒絶理由通知書や、意見書、審判請求書等の出願の包袋に含まれうる文書の情報を含んでもよく、さらに、他の特許出願の拒絶理由において引用された回数等を含んでもよい。また、特許文書情報がそれらの情報を含む場合に、それらの情報に含まれる情報、例えば、他の特許出願の拒絶理由において引用された回数や、拒絶理由通知書の数等を文書属性情報が含んでもよい。   Further, the patent document information may include information other than that described in each of the above embodiments, for example, information on documents that can be included in the wrapping of the application, such as a notice of reasons for refusal, an opinion, or a request for appeal. In addition, the number of times cited in reasons for refusal of other patent applications may be included. In addition, when the patent document information includes such information, the document attribute information indicates the information included in the information, for example, the number of times cited in reasons for refusal of other patent applications, the number of notifications of reasons for refusal, etc. May be included.

また、特許価値情報の算出や特許特性情報の算出において、サポートベクターマシン等からの算出値を正規化してもよい。例えば、0から150までのいずれかの整数で示される値を、0から100までの値に正規化してもよい。   In addition, in the calculation of the patent value information and the calculation of the patent characteristic information, the calculated value from the support vector machine or the like may be normalized. For example, a value represented by any integer from 0 to 150 may be normalized to a value from 0 to 100.

また、上記各実施の形態の具体例において、情報処理装置がスタンドアロンである場合について説明したが、情報処理装置は、スタンドアロンの装置であってもよく、サーバ・クライアントシステムにおけるサーバ装置であってもよい。   Further, in the specific examples of the above embodiments, the case where the information processing apparatus is a stand-alone has been described. However, the information processing apparatus may be a stand-alone apparatus or a server apparatus in a server / client system. Good.

また、上記各実施の形態において、各処理または各機能は、単一の装置または単一のシステムによって集中処理されることによって実現されてもよく、あるいは、複数の装置または複数のシステムによって分散処理されることによって実現されてもよい。   In each of the above embodiments, each processing or each function may be realized by centralized processing by a single device or a single system, or distributed processing by a plurality of devices or a plurality of systems. May be realized.

また、上記各実施の形態において、各構成要素は専用のハードウェアにより構成されてもよく、あるいは、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されてもよい。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。なお、上記実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータに、文書属性情報記憶部が記憶している、特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報から、サンプル文書属性情報記憶部が記憶している、教師情報として用いられる文書属性情報であるサンプル文書属性情報と、サンプル特許価値情報記憶部が記憶している、前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル特許価値情報とを教師情報として、特許文書情報の価値を示す情報である特許価値情報を算出する特許価値情報算出ステップと、前記特許価値情報算出ステップで算出した特許価値情報を出力する特許価値情報出力ステップと、を実行させるためのものである。   In each of the above embodiments, each component may be configured by dedicated hardware, or a component that can be realized by software may be realized by executing a program. For example, each component can be realized by a program execution unit such as a CPU reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory. Note that the software that realizes the information processing apparatus in the above embodiment is the following program. That is, this program is information obtained from patent document information that is information related to a patent document and stored in the computer in the document attribute information storage unit, and is information indicating the attribute of the patent document information. Sample document attribute information, which is document attribute information used as teacher information, stored in the sample document attribute information storage unit from the document attribute information, and the sample document attribute information stored in the sample patent value information storage unit Information corresponding to the sample document attribute information stored in the storage unit and indicating the value of the patent document information using the sample patent value information, which is the information indicating the value of the patent document information, used as the teacher information. Patent value information calculation step for calculating patent value information as information, and patent value information calculated in the patent value information calculation step , The patent value information output step of outputting is intended for causing the execution.

また、上記実施の形態における情報処理装置を実現する他のソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータに、文書属性情報記憶部が記憶している、特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報から、サンプル文書属性情報記憶部が記憶している、教師情報として用いられる文書属性情報であるサンプル文書属性情報と、サンプル特許特性情報記憶部が記憶している、前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報において発明の本質を抽出している程度を示す特性である発明本質抽出特性、特許文書情報において、発明にかかる出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程度を示す特性である強靱特性、特許文書情報において発明を展開している程度を示す特性である発明展開特性、及び特許文書情報において発明について実施可能に記載されている程度を示す特性である実施可能担保特性の群から選ばれる、特許文書情報の1以上の特性を示す情報であるサンプル特許特性情報とを教師情報として、特許文書情報の特性を示す情報である特許特性情報を算出する特許特性情報算出ステップと、前記特許特性情報算出ステップで算出した特許特性情報を出力する特許特性情報出力ステップと、を実行させるためのものである。   Other software that realizes the information processing apparatus according to the above embodiment is a program as described below. That is, this program is information obtained from patent document information that is information related to a patent document and stored in the computer in the document attribute information storage unit, and is information indicating the attribute of the patent document information. Sample document attribute information, which is document attribute information used as teacher information, stored in the sample document attribute information storage unit from the document attribute information, and the sample document attribute information stored in the sample patent characteristic information storage unit Inventor essence extraction characteristics, which are information corresponding to sample document attribute information stored in the storage unit, and used as teacher information, which are characteristics indicating the degree to which the essence of the invention is extracted from patent document information, in patent document information , Toughness characteristics, which are characteristics that indicate the degree to which an invention application is rejected or the invention patent is invalidated; Selected from the group of invention development characteristics, which are characteristics indicating the degree of development of the invention in the permitted document information, and practicable collateral characteristics, which are characteristics indicating the degree of implementation of the invention in the patent document information, Patent characteristic information calculating step for calculating patent characteristic information, which is information indicating characteristics of patent document information, by using, as teacher information, sample patent characteristic information which is information indicating one or more characteristics of the patent document information, and the patent characteristic information And a patent characteristic information output step for outputting the patent characteristic information calculated in the calculation step.

また、上記実施の形態における情報処理装置を実現する他のソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータに、特許特性情報記憶部が記憶している、特許の文書に関する情報である特許文書情報において発明の本質を抽出している程度を示す特性である発明本質抽出特性、特許文書情報において、発明にかかる出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程度を示す特性である強靱特性、特許文書情報において発明を展開している程度を示す特性である発明展開特性、及び特許文書情報において発明について実施可能に記載されている程度を示す特性である実施可能担保特性の群から選ばれる、特許文書情報の1以上の特性を示す情報である特許特性情報から、サンプル特許特性情報記憶部が記憶している、教師情報として用いられる特許特性情報であるサンプル特許特性情報と、サンプル特許価値情報記憶部が記憶している、前記サンプル特許特性情報記憶部で記憶されるサンプル特許特性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル特許価値情報とを教師情報として、特許文書情報の価値を示す情報である特許価値情報を算出する特許価値情報算出ステップと、前記特許価値情報算出ステップで算出した特許価値情報を出力する特許価値情報出力ステップと、を実行させるためのものである。   Other software that realizes the information processing apparatus according to the above embodiment is a program as described below. That is, this program is an invention essence extraction characteristic that is a characteristic indicating the degree to which the essence of the invention is extracted in the patent document information, which is information related to the patent document, stored in the patent characteristic information storage unit in the computer. In patent document information, it is a toughness characteristic that indicates the degree to which an application relating to an invention is rejected or the patent for an invention becomes invalid, and a characteristic that indicates the degree to which the invention is being developed in patent document information Patent characteristic information, which is information indicating one or more characteristics of patent document information, selected from the group of practicable collateral characteristics, which is a characteristic indicating the degree to which the invention can be implemented in the patent document information. Sample patent characteristic information stored in the sample patent characteristic information storage unit, which is patent characteristic information used as teacher information, and This is information corresponding to the sample patent characteristic information stored in the sample patent characteristic information storage unit and stored in the pull patent value information storage unit, and is information indicating the value of the patent document information used as teacher information Patent value information calculating step for calculating patent value information, which is information indicating the value of patent document information, using the sample patent value information as teacher information, and a patent value for outputting the patent value information calculated in the patent value information calculating step And an information output step.

なお、上記プログラムにおいて、情報を送信する出力ステップや、情報を受け付ける受付ステップなどでは、ハードウェアでしか行われない処理、例えば、出力ステップにおけるモデムやインターフェースカードなどで行われる処理は少なくとも含まれない。   In the above program, the output step for transmitting information and the reception step for receiving information do not include at least processing performed only by hardware, for example, processing performed by a modem or an interface card in the output step. .

また、このプログラムは、サーバなどからダウンロードされることによって実行されてもよく、所定の記録媒体(例えば、CD−ROMなどの光ディスクや磁気ディスク、半導体メモリなど)に記録されたプログラムが読み出されることによって実行されてもよい。   Further, this program may be executed by being downloaded from a server or the like, and a program recorded on a predetermined recording medium (for example, an optical disk such as a CD-ROM, a magnetic disk, a semiconductor memory, or the like) is read out. May be executed by

また、このプログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
また、本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
Further, the computer that executes this program may be singular or plural. That is, centralized processing may be performed, or distributed processing may be performed.
Further, the present invention is not limited to the above-described embodiment, and various modifications are possible, and it goes without saying that these are also included in the scope of the present invention.

以上より、本発明による情報処理装置等によれば、各ユーザの主観的な評価の要素を考慮した特許の価値等の算出を行うことができ、特許価値等を算出する情報処理装置等として有用である。   As described above, according to the information processing apparatus and the like according to the present invention, it is possible to calculate the value of a patent in consideration of an element of subjective evaluation of each user, which is useful as an information processing apparatus that calculates a patent value and the like. It is.

本発明の実施の形態1による情報処理装置の構成を示すブロック図The block diagram which shows the structure of the information processing apparatus by Embodiment 1 of this invention. 同実施の形態による情報処理装置の動作を示すフローチャートThe flowchart which shows operation | movement of the information processing apparatus by the embodiment 同実施の形態における特許文書IDと特許文書情報との対応の一例を示す図The figure which shows an example of a response | compatibility with the patent document ID and patent document information in the embodiment 同実施の形態における特許文書情報の一例を示す図The figure which shows an example of the patent document information in the embodiment 同実施の形態による情報処理装置の外観の一例を示す模式図The schematic diagram which shows an example of the external appearance of the information processing apparatus by the embodiment 同実施の形態におけるサンプル特許価値情報の一例を示す図The figure which shows an example of the sample patent value information in the embodiment 同実施の形態による情報処理装置の外観の一例を示す模式図The schematic diagram which shows an example of the external appearance of the information processing apparatus by the embodiment 同実施の形態における文書属性情報の一例を示す図The figure which shows an example of the document attribute information in the embodiment 同実施の形態におけるサンプル文書属性情報の一例を示す図The figure which shows an example of the sample document attribute information in the embodiment 同実施の形態におけるサポートベクターマシンに入力するデータの一例を示す図The figure which shows an example of the data input into the support vector machine in the embodiment 同実施の形態による情報処理装置の外観の一例を示す模式図The schematic diagram which shows an example of the external appearance of the information processing apparatus by the embodiment 本発明の実施の形態2による情報処理装置の構成を示すブロック図The block diagram which shows the structure of the information processing apparatus by Embodiment 2 of this invention. 同実施の形態による情報処理装置の動作を示すフローチャートThe flowchart which shows operation | movement of the information processing apparatus by the embodiment 同実施の形態におけるサンプル特許特性情報の一例を示す図The figure which shows an example of the sample patent characteristic information in the embodiment 本発明の実施の形態3による情報処理装置の構成を示すブロック図The block diagram which shows the structure of the information processing apparatus by Embodiment 3 of this invention. 同実施の形態による情報処理装置の動作を示すフローチャートThe flowchart which shows operation | movement of the information processing apparatus by the embodiment 同実施の形態における特許特性情報の一例を示す図The figure which shows an example of the patent characteristic information in the embodiment 他の実施の形態による情報処理装置の構成を示すブロック図The block diagram which shows the structure of the information processing apparatus by other embodiment 他の実施の形態による情報処理装置の動作を示すフローチャートThe flowchart which shows operation | movement of the information processing apparatus by other embodiment. 他の実施の形態による情報処理装置の構成を示すブロック図The block diagram which shows the structure of the information processing apparatus by other embodiment 他の実施の形態による情報処理装置の構成を示すブロック図The block diagram which shows the structure of the information processing apparatus by other embodiment 他の実施の形態における数値化対応情報の一例を示す図The figure which shows an example of the digitization corresponding | compatible information in other embodiment 他の実施の形態における対応情報の一例を示す図The figure which shows an example of the correspondence information in other embodiment

Claims (16)

特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報が記憶される文書属性情報記憶部と、
教師情報として用いられる文書属性情報であるサンプル文書属性情報が記憶されるサンプル文書属性情報記憶部と、
前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル特許価値情報が記憶されるサンプル特許価値情報記憶部と、
前記サンプル文書属性情報記憶部が記憶しているサンプル文書属性情報と、前記サンプル特許価値情報記憶部が記憶しているサンプル特許価値情報とを教師情報として、前記文書属性情報記憶部が記憶している文書属性情報から、特許文書情報の価値を示す情報である特許価値情報をサポートベクター回帰により算出する特許価値情報算出部と、
前記特許価値情報算出部が算出した特許価値情報を出力する特許価値情報出力部と、を具備し、
前記文書属性情報は、特許文書情報における請求項の数、特許文書情報における独立形式の請求項の数、特許文書情報における特許請求の範囲のカテゴリー数、特許文書情報における特許請求の範囲のネストレベル、特許文書情報における特許請求の範囲の文字数、特許文書情報における代表請求項の構成要素数、特許文書情報における代表請求項の読点の数、特許文書情報における代表請求項の文字数、特許文書情報における代表請求項の単位情報数、特許文書情報における代表請求項の前提部の文字数、特許文書情報における代表請求項の特徴部の文字数、特許文書情報における代表請求項の前提部の単位情報数、特許文書情報における代表請求項の特徴部の単位情報数、特許文書情報における代表請求項の代表構成要素の文字数、特許文書情報における代表請求項の代表構成要素の単位情報数、特許文書情報において引用されている特許文献数、特許文書情報において引用されている非特許文献数、特許文書情報における実施の形態の文字数、特許文書情報における実施の形態の単位情報数、特許文書情報における実施の形態での例示の数、特許文書情報における実施の形態での外延拡張表記の数、特許文書情報における実施の形態での数式の数、特許文書情報における実施の形態での化学式の数、特許文書情報における図面数、特許文書情報における構成を示す図の数、特許文書情報におけるフローチャートの数、特許文書情報におけるデータ構造を示す図の数、特許文書情報における画面出力を示す図の数、特許文書情報におけるハードウェア構成を示す図の数の群から選ばれる、1以上の属性を示す情報を含む、情報処理装置。
A document attribute information storage unit for storing document attribute information that is information acquired from patent document information that is information related to a patent document, and that indicates attributes of the patent document information;
A sample document attribute information storage unit for storing sample document attribute information which is document attribute information used as teacher information;
Sample patent value information that is information corresponding to the sample document attribute information stored in the sample document attribute information storage unit, and that stores sample patent value information that is used as teacher information and indicates the value of the patent document information A storage unit;
The document attribute information storage unit stores the sample document attribute information stored in the sample document attribute information storage unit and the sample patent value information stored in the sample patent value information storage unit as teacher information. A patent value information calculation unit that calculates patent value information, which is information indicating the value of patent document information, by support vector regression from the document attribute information
Patent value information output unit that outputs the patent value information calculated by the patent value information calculation unit ,
The document attribute information includes the number of claims in patent document information, the number of independent claims in patent document information, the number of categories of claims in patent document information, and the nesting level of claims in patent document information , Number of characters of patent claim range in patent document information, number of constituent elements of representative claim in patent document information, number of reading points of representative claim in patent document information, number of characters of representative claim in patent document information, in patent document information Number of unit information of representative claim, number of characters of premise part of representative claim in patent document information, number of characters of characteristic part of representative claim in patent document information, number of unit information of premise part of representative claim in patent document information, patent Number of unit information of characteristic part of representative claim in document information, number of characters of representative component of representative claim in patent document information, patent The number of unit information of the representative component of the representative claim in the document information, the number of patent documents cited in the patent document information, the number of non-patent documents cited in the patent document information, the number of characters of the embodiment in the patent document information, Number of unit information of embodiment in patent document information, number of examples in embodiment of patent document information, number of extension extension notation in embodiment of patent document information, formula in embodiment of patent document information The number of chemical formulas in the embodiment in the patent document information, the number of drawings in the patent document information, the number of diagrams showing the configuration in the patent document information, the number of flowcharts in the patent document information, and the data structure in the patent document information From the group of number of figures, number of figures showing screen output in patent document information, number of figures showing hardware configuration in patent document information Barrel includes information indicating one or more attributes, the information processing apparatus.
特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報が記憶される文書属性情報記憶部と、A document attribute information storage unit for storing document attribute information that is information acquired from patent document information that is information related to a patent document, and that indicates attributes of the patent document information;
教師情報として用いられる文書属性情報であるサンプル文書属性情報が記憶されるサンプル文書属性情報記憶部と、A sample document attribute information storage unit for storing sample document attribute information which is document attribute information used as teacher information;
前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル特許価値情報が記憶されるサンプル特許価値情報記憶部と、Sample patent value information that is information corresponding to the sample document attribute information stored in the sample document attribute information storage unit, and that stores sample patent value information that is used as teacher information and indicates the value of the patent document information A storage unit;
前記サンプル文書属性情報記憶部が記憶しているサンプル文書属性情報と、前記サンプル特許価値情報記憶部が記憶しているサンプル特許価値情報とを教師情報として、前記文書属性情報記憶部が記憶している文書属性情報から、特許文書情報の価値を示す情報である特許価値情報をサポートベクター回帰により算出する特許価値情報算出部と、The document attribute information storage unit stores the sample document attribute information stored in the sample document attribute information storage unit and the sample patent value information stored in the sample patent value information storage unit as teacher information. A patent value information calculation unit that calculates patent value information, which is information indicating the value of patent document information, by support vector regression from the document attribute information
前記特許価値情報算出部が算出した特許価値情報を出力する特許価値情報出力部と、を具備し、Patent value information output unit that outputs the patent value information calculated by the patent value information calculation unit,
前記文書属性情報は、特許文書情報の国際特許分類、特許文書情報のFターム、特許文書情報のフェーズ、特許文書情報で示される発明の技術分野、特許文書情報に関する権利の存続期間、特許文書情報で示される発明の種類、特許文書情報における請求項の数、特許文書情報における独立形式の請求項の数、特許文書情報における特許請求の範囲のカテゴリー数、特許文書情報における特許請求の範囲のネストレベル、特許文書情報における特許請求の範囲の文字数、特許文書情報における代表請求項の構成要素数、特許文書情報における代表請求項の読点の数、特許文書情報における代表請求項の文字数、特許文書情報における代表請求項の単位情報数、特許文書情報における代表請求項の前提部の文字数、特許文書情報における代表請求項の特徴部の文字数、特許文書情報における代表請求項の前提部の単位情報数、特許文書情報における代表請求項の特徴部の単位情報数、特許文書情報における代表請求項の代表構成要素の文字数、特許文書情報における代表請求項の代表構成要素の単位情報数、特許文書情報において引用されている特許文献数、特許文書情報において引用されている非特許文献数、特許文書情報における実施の形態の文字数、特許文書情報における実施の形態の単位情報数、特許文書情報における実施の形態での例示の数、特許文書情報における実施の形態での外延拡張表記の数、特許文書情報における実施の形態での数式の数、特許文書情報における実施の形態での化学式の数、特許文書情報における図面数、特許文書情報における構成を示す図の数、特許文書情報におけるフローチャートの数、特許文書情報におけるデータ構造を示す図の数、特許文書情報における画面出力を示す図の数、特許文書情報におけるハードウェア構成を示す図の数の群から選ばれる、1以上の属性を示す情報を含む、情報処理装置。The document attribute information includes the international patent classification of patent document information, the F term of patent document information, the phase of patent document information, the technical field of the invention indicated by the patent document information, the duration of rights related to patent document information, and patent document information The number of claims in patent document information, the number of independent claims in patent document information, the number of categories of claims in patent document information, and the nesting of claims in patent document information Level, number of characters of patent claims in patent document information, number of constituent elements of representative claims in patent document information, number of readings of representative claims in patent document information, number of characters of representative claims in patent document information, patent document information The number of unit information of the representative claim in the patent, the number of characters of the premise part of the representative claim in the patent document information, the representative request in the patent document information The number of characters in the characteristic part of the term, the number of unit information in the premise part of the representative claim in the patent document information, the number of unit information in the characteristic part of the representative claim in the patent document information, the number of characters in the representative component of the representative claim in the patent document information , The number of unit information of the representative component of the representative claim in the patent document information, the number of patent documents cited in the patent document information, the number of non-patent documents cited in the patent document information, the embodiment of the patent document information Number of characters, number of unit information of embodiment in patent document information, number of examples in embodiment of patent document information, number of extension extension notation in embodiment of patent document information, embodiment in patent document information The number of mathematical formulas, the number of chemical formulas in the embodiment of the patent document information, the number of drawings in the patent document information, the number of diagrams showing the configuration in the patent document information Selected from the group of the number of flowcharts in patent document information, the number of diagrams showing the data structure in patent document information, the number of diagrams showing screen output in patent document information, the number of diagrams showing the hardware configuration in patent document information, An information processing apparatus including information indicating one or more attributes.
特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報が記憶される文書属性情報記憶部と、
教師情報として用いられる文書属性情報であるサンプル文書属性情報が記憶されるサンプル文書属性情報記憶部と、
前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報において発明の本質を抽出している程度を示す特性である発明本質抽出特性、特許文書情報において、発明にかかる出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程度を示す特性である強靱特性、特許文書情報において発明を展開している程度を示す特性である発明展開特性、及び特許文書情報において発明について実施可能に記載されている程度を示す特性である実施可能担保特性の群から選ばれる、特許文書情報の1以上の特性を示す情報であるサンプル特許特性情報が記憶されるサンプル特許特性情報記憶部と、
前記サンプル文書属性情報記憶部が記憶しているサンプル文書属性情報と、前記サンプル特許特性情報記憶部が記憶しているサンプル特許特性情報とを教師情報として、前記文書属性情報記憶部が記憶している文書属性情報から、特許文書情報の特性を示す情報である特許特性情報をサポートベクター回帰により算出する特許特性情報算出部と、
前記特許特性情報算出部が算出した特許特性情報を出力する特許特性情報出力部と、を具備する情報処理装置。
A document attribute information storage unit for storing document attribute information that is information acquired from patent document information that is information related to a patent document, and that indicates attributes of the patent document information;
A sample document attribute information storage unit for storing sample document attribute information which is document attribute information used as teacher information;
Invention essence extraction characteristics which are information corresponding to the sample document attribute information stored in the sample document attribute information storage unit, and which are characteristics indicating the degree to which the essence of the invention is extracted from patent document information, used as teacher information In patent document information, it is a toughness characteristic that indicates the degree to which an application relating to an invention is rejected, or a patent that relates to an invention is invalid, and a characteristic that indicates the degree to which the invention is being developed in patent document information A sample patent that is information indicating one or more characteristics of patent document information selected from the group of enablement collateral characteristics, which is a characteristic indicating the degree to which the invention can be implemented in patent document information. A sample patent characteristic information storage unit for storing characteristic information;
The document attribute information storage unit stores the sample document attribute information stored in the sample document attribute information storage unit and the sample patent property information stored in the sample patent property information storage unit as teacher information. Patent characteristic information calculation unit that calculates patent characteristic information, which is information indicating the characteristic of patent document information, by support vector regression from the document attribute information
An information processing apparatus comprising: a patent characteristic information output unit that outputs the patent characteristic information calculated by the patent characteristic information calculation unit.
前記文書属性情報は、特許文書情報における請求項の数、特許文書情報における独立形式の請求項の数、特許文書情報における特許請求の範囲のカテゴリー数、特許文書情報における特許請求の範囲のネストレベル、特許文書情報における特許請求の範囲の文字数、特許文書情報における代表請求項の構成要素数、特許文書情報における代表請求項の読点の数、特許文書情報における代表請求項の文字数、特許文書情報における代表請求項の単位情報数、特許文書情報における代表請求項の前提部の文字数、特許文書情報における代表請求項の特徴部の文字数、特許文書情報における代表請求項の前提部の単位情報数、特許文書情報における代表請求項の特徴部の単位情報数、特許文書情報における代表請求項の代表構成要素の文字数、特許文書情報における代表請求項の代表構成要素の単位情報数、特許文書情報において引用されている特許文献数、特許文書情報において引用されている非特許文献数、特許文書情報における実施の形態の文字数、特許文書情報における実施の形態の単位情報数、特許文書情報における実施の形態での例示の数、特許文書情報における実施の形態での外延拡張表記の数、特許文書情報における実施の形態での数式の数、特許文書情報における実施の形態での化学式の数、特許文書情報における図面数、特許文書情報における構成を示す図の数、特許文書情報におけるフローチャートの数、特許文書情報におけるデータ構造を示す図の数、特許文書情報における画面出力を示す図の数、特許文書情報におけるハードウェア構成を示す図の数の群から選ばれる、1以上の属性を示す情報である、請求項記載の情報処理装置。The document attribute information includes the number of claims in patent document information, the number of independent claims in patent document information, the number of categories of claims in patent document information, and the nesting level of claims in patent document information , Number of characters of patent claim range in patent document information, number of constituent elements of representative claim in patent document information, number of reading points of representative claim in patent document information, number of characters of representative claim in patent document information, in patent document information Number of unit information of representative claim, number of characters of premise part of representative claim in patent document information, number of characters of characteristic part of representative claim in patent document information, number of unit information of premise part of representative claim in patent document information, patent Number of unit information of characteristic part of representative claim in document information, number of characters of representative component of representative claim in patent document information, patent The number of unit information of the representative component of the representative claim in the document information, the number of patent documents cited in the patent document information, the number of non-patent documents cited in the patent document information, the number of characters of the embodiment in the patent document information, Number of unit information of embodiment in patent document information, number of examples in embodiment of patent document information, number of extension extension notation in embodiment of patent document information, formula in embodiment of patent document information The number of chemical formulas in the embodiment in the patent document information, the number of drawings in the patent document information, the number of diagrams showing the configuration in the patent document information, the number of flowcharts in the patent document information, and the data structure in the patent document information From the group of number of figures, number of figures showing screen output in patent document information, number of figures showing hardware configuration in patent document information Barrel is information indicating one or more attributes, the information processing apparatus according to claim 3, wherein. 前記文書属性情報は、特許文書情報の国際特許分類、特許文書情報のFターム、特許文書情報のフェーズ、特許文書情報で示される発明の技術分野、特許文書情報に関する権利の存続期間、特許文書情報で示される発明の種類、特許文書情報における請求項の数、特許文書情報における独立形式の請求項の数、特許文書情報における特許請求の範囲のカテゴリー数、特許文書情報における特許請求の範囲のネストレベル、特許文書情報における特許請求の範囲の文字数、特許文書情報における代表請求項の構成要素数、特許文書情報における代表請求項の読点の数、特許文書情報における代表請求項の文字数、特許文書情報における代表請求項の単位情報数、特許文書情報における代表請求項の前提部の文字数、特許文書情報における代表請求項の特徴部の文字数、特許文書情報における代表請求項の前提部の単位情報数、特許文書情報における代表請求項の特徴部の単位情報数、特許文書情報における代表請求項の代表構成要素の文字数、特許文書情報における代表請求項の代表構成要素の単位情報数、特許文書情報において引用されている特許文献数、特許文書情報において引用されている非特許文献数、特許文書情報における実施の形態の文字数、特許文書情報における実施の形態の単位情報数、特許文書情報における実施の形態での例示の数、特許文書情報における実施の形態での外延拡張表記の数、特許文書情報における実施の形態での数式の数、特許文書情報における実施の形態での化学式の数、特許文書情報における図面数、特許文書情報における構成を示す図の数、特許文書情報におけるフローチャートの数、特許文書情報におけるデータ構造を示す図の数、特許文書情報における画面出力を示す図の数、特許文書情報におけるハードウェア構成を示す図の数の群から選ばれる、1以上の属性を示す情報である、請求項記載の情報処理装置。The document attribute information includes the international patent classification of patent document information, the F term of patent document information, the phase of patent document information, the technical field of the invention indicated by the patent document information, the duration of rights related to patent document information, and patent document information The number of claims in patent document information, the number of independent claims in patent document information, the number of categories of claims in patent document information, and the nesting of claims in patent document information Level, number of characters of patent claims in patent document information, number of constituent elements of representative claims in patent document information, number of readings of representative claims in patent document information, number of characters of representative claims in patent document information, patent document information The number of unit information of the representative claim in the patent, the number of characters of the premise part of the representative claim in the patent document information, the representative request in the patent document information The number of characters in the characteristic part of the term, the number of unit information in the premise part of the representative claim in the patent document information, the number of unit information in the characteristic part of the representative claim in the patent document information, the number of characters in the representative component of the representative claim in the patent document information , The number of unit information of the representative component of the representative claim in the patent document information, the number of patent documents cited in the patent document information, the number of non-patent documents cited in the patent document information, the embodiment of the patent document information Number of characters, number of unit information of embodiment in patent document information, number of examples in embodiment of patent document information, number of extension extension notation in embodiment of patent document information, embodiment in patent document information The number of mathematical formulas, the number of chemical formulas in the embodiment of patent document information, the number of drawings in patent document information, the number of diagrams showing the configuration in patent document information Selected from the group of the number of flowcharts in patent document information, the number of diagrams showing the data structure in patent document information, the number of diagrams showing screen output in patent document information, the number of diagrams showing the hardware configuration in patent document information, The information processing apparatus according to claim 3 , wherein the information processing apparatus is information indicating one or more attributes. 1以上の特許文書情報が記憶される特許文書情報記憶部と、
前記特許文書情報記憶部が記憶している特許文書情報から文書属性情報を取得する文書属性情報取得部と、
前記文書属性情報取得部が取得した文書属性情報を前記文書属性情報記憶部に蓄積する文書属性情報蓄積部と、をさらに具備する請求項1から請求項5のいずれか記載の情報処理装置。
A patent document information storage unit for storing one or more patent document information;
A document attribute information acquisition unit for acquiring document attribute information from the patent document information stored in the patent document information storage unit;
The information processing apparatus according to any one of claims 1 to 5, wherein the document attribute information acquiring unit and the document attribute information storage unit the document attribute information acquired accumulated in the document attribute information storage unit, the further comprising.
前記特許文書情報記憶部では、前記サンプル文書属性情報を算出するための特許文書情報であるサンプル特許文書情報も記憶され、
前記文書属性情報取得部は、前記サンプル特許文書情報からサンプル文書属性情報を取得し、
前記文書属性情報蓄積部は、前記文書属性情報取得部が算出したサンプル文書属性情報を前記サンプル文書属性情報記憶部に蓄積する、請求項記載の情報処理装置。
The patent document information storage unit also stores sample patent document information which is patent document information for calculating the sample document attribute information,
The document attribute information acquisition unit acquires sample document attribute information from the sample patent document information,
The information processing apparatus according to claim 6 , wherein the document attribute information storage unit stores the sample document attribute information calculated by the document attribute information acquisition unit in the sample document attribute information storage unit.
文書属性情報記憶部が記憶している、特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報から、サンプル文書属性情報記憶部が記憶している、教師情報として用いられる文書属性情報であるサンプル文書属性情報と、サンプル特許価値情報記憶部が記憶している、前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル特許価値情報とを教師情報として、特許文書情報の価値を示す情報である特許価値情報をサポートベクター回帰により算出する特許価値情報算出ステップと、
前記特許価値情報算出ステップで算出した特許価値情報を出力する特許価値情報出力ステップと、を具備し、
前記文書属性情報は、特許文書情報における請求項の数、特許文書情報における独立形式の請求項の数、特許文書情報における特許請求の範囲のカテゴリー数、特許文書情報における特許請求の範囲のネストレベル、特許文書情報における特許請求の範囲の文字数、特許文書情報における代表請求項の構成要素数、特許文書情報における代表請求項の読点の数、特許文書情報における代表請求項の文字数、特許文書情報における代表請求項の単位情報数、特許文書情報における代表請求項の前提部の文字数、特許文書情報における代表請求項の特徴部の文字数、特許文書情報における代表請求項の前提部の単位情報数、特許文書情報における代表請求項の特徴部の単位情報数、特許文書情報における代表請求項の代表構成要素の文字数、特許文書情報における代表請求項の代表構成要素の単位情報数、特許文書情報において引用されている特許文献数、特許文書情報において引用されている非特許文献数、特許文書情報における実施の形態の文字数、特許文書情報における実施の形態の単位情報数、特許文書情報における実施の形態での例示の数、特許文書情報における実施の形態での外延拡張表記の数、特許文書情報における実施の形態での数式の数、特許文書情報における実施の形態での化学式の数、特許文書情報における図面数、特許文書情報における構成を示す図の数、特許文書情報におけるフローチャートの数、特許文書情報におけるデータ構造を示す図の数、特許文書情報における画面出力を示す図の数、特許文書情報におけるハードウェア構成を示す図の数の群から選ばれる、1以上の属性を示す情報を含む、情報処理方法。
Sample document attribute information from the document attribute information which is information acquired from the patent document information which is information related to the patent document and which is stored in the document attribute information storage unit and which indicates the attribute of the patent document information. Sample document attribute information, which is document attribute information used as teacher information, stored in the storage unit, and sample document attributes stored in the sample document attribute information storage unit, stored in the sample patent value information storage unit Information corresponding to information and used as teacher information, sample patent value information that is information indicating the value of patent document information is used as teacher information, and patent value information that is information indicating the value of patent document information is supported as a support vector. Patent value information calculation step calculated by regression,
A patent value information output step for outputting the patent value information calculated in the patent value information calculation step, and
The document attribute information includes the number of claims in patent document information, the number of independent claims in patent document information, the number of categories of claims in patent document information, and the nesting level of claims in patent document information , Number of characters of patent claim range in patent document information, number of constituent elements of representative claim in patent document information, number of reading points of representative claim in patent document information, number of characters of representative claim in patent document information, in patent document information Number of unit information of representative claim, number of characters of premise part of representative claim in patent document information, number of characters of characteristic part of representative claim in patent document information, number of unit information of premise part of representative claim in patent document information, patent Number of unit information of characteristic part of representative claim in document information, number of characters of representative component of representative claim in patent document information, patent The number of unit information of the representative component of the representative claim in the document information, the number of patent documents cited in the patent document information, the number of non-patent documents cited in the patent document information, the number of characters of the embodiment in the patent document information, Number of unit information of embodiment in patent document information, number of examples in embodiment of patent document information, number of extension extension notation in embodiment of patent document information, formula in embodiment of patent document information The number of chemical formulas in the embodiment in the patent document information, the number of drawings in the patent document information, the number of diagrams showing the configuration in the patent document information, the number of flowcharts in the patent document information, and the data structure in the patent document information From the group of number of figures, number of figures showing screen output in patent document information, number of figures showing hardware configuration in patent document information Barrel includes information indicating one or more attributes, the information processing method.
文書属性情報記憶部が記憶している、特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報から、サンプル文書属性情報記憶部が記憶している、教師情報として用いられる文書属性情報であるサンプル文書属性情報と、サンプル特許価値情報記憶部が記憶している、前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル特許価値情報とを教師情報として、特許文書情報の価値を示す情報である特許価値情報をサポートベクター回帰により算出する特許価値情報算出ステップと、Sample document attribute information from the document attribute information which is information acquired from the patent document information which is information related to the patent document and which is stored in the document attribute information storage unit and which indicates the attribute of the patent document information. Sample document attribute information, which is document attribute information used as teacher information, stored in the storage unit, and sample document attributes stored in the sample document attribute information storage unit, stored in the sample patent value information storage unit Information corresponding to information and used as teacher information, sample patent value information that is information indicating the value of patent document information is used as teacher information, and patent value information that is information indicating the value of patent document information is supported as a support vector. Patent value information calculation step calculated by regression,
前記特許価値情報算出ステップで算出した特許価値情報を出力する特許価値情報出力ステップと、を具備し、A patent value information output step for outputting the patent value information calculated in the patent value information calculation step, and
前記文書属性情報は、特許文書情報の国際特許分類、特許文書情報のFターム、特許文書情報のフェーズ、特許文書情報で示される発明の技術分野、特許文書情報に関する権利の存続期間、特許文書情報で示される発明の種類、特許文書情報における請求項の数、特許文書情報における独立形式の請求項の数、特許文書情報における特許請求の範囲のカテゴリー数、特許文書情報における特許請求の範囲のネストレベル、特許文書情報における特許請求の範囲の文字数、特許文書情報における代表請求項の構成要素数、特許文書情報における代表請求項の読点の数、特許文書情報における代表請求項の文字数、特許文書情報における代表請求項の単位情報数、特許文書情報における代表請求項の前提部の文字数、特許文書情報における代表請求項の特徴部の文字数、特許文書情報における代表請求項の前提部の単位情報数、特許文書情報における代表請求項の特徴部の単位情報数、特許文書情報における代表請求項の代表構成要素の文字数、特許文書情報における代表請求項の代表構成要素の単位情報数、特許文書情報において引用されている特許文献数、特許文書情報において引用されている非特許文献数、特許文書情報における実施の形態の文字数、特許文書情報における実施の形態の単位情報数、特許文書情報における実施の形態での例示の数、特許文書情報における実施の形態での外延拡張表記の数、特許文書情報における実施の形態での数式の数、特許文書情報における実施の形態での化学式の数、特許文書情報における図面数、特許文書情報における構成を示す図の数、特許文書情報におけるフローチャートの数、特許文書情報におけるデータ構造を示す図の数、特許文書情報における画面出力を示す図の数、特許文書情報におけるハードウェア構成を示す図の数の群から選ばれる、1以上の属性を示す情報を含む、情報処理方法。The document attribute information includes the international patent classification of patent document information, the F term of patent document information, the phase of patent document information, the technical field of the invention indicated by the patent document information, the duration of rights related to patent document information, and patent document information The number of claims in patent document information, the number of independent claims in patent document information, the number of categories of claims in patent document information, and the nesting of claims in patent document information Level, number of characters of patent claims in patent document information, number of constituent elements of representative claims in patent document information, number of readings of representative claims in patent document information, number of characters of representative claims in patent document information, patent document information The number of unit information of the representative claim in the patent, the number of characters of the premise part of the representative claim in the patent document information, the representative request in the patent document information The number of characters in the characteristic part of the term, the number of unit information in the premise part of the representative claim in the patent document information, the number of unit information in the characteristic part of the representative claim in the patent document information, the number of characters in the representative component of the representative claim in the patent document information , The number of unit information of the representative component of the representative claim in the patent document information, the number of patent documents cited in the patent document information, the number of non-patent documents cited in the patent document information, the embodiment of the patent document information Number of characters, number of unit information of embodiment in patent document information, number of examples in embodiment of patent document information, number of extension extension notation in embodiment of patent document information, embodiment in patent document information The number of mathematical formulas, the number of chemical formulas in the embodiment of the patent document information, the number of drawings in the patent document information, the number of diagrams showing the configuration in the patent document information Selected from the group of the number of flowcharts in patent document information, the number of diagrams showing the data structure in patent document information, the number of diagrams showing screen output in patent document information, the number of diagrams showing the hardware configuration in patent document information, An information processing method including information indicating one or more attributes.
文書属性情報記憶部が記憶している、特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報から、サンプル文書属性情報記憶部が記憶している、教師情報として用いられる文書属性情報であるサンプル文書属性情報と、サンプル特許特性情報記憶部が記憶している、前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報において発明の本質を抽出している程度を示す特性である発明本質抽出特性、特許文書情報において、発明にかかる出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程度を示す特性である強靱特性、特許文書情報において発明を展開している程度を示す特性である発明展開特性、及び特許文書情報において発明について実施可能に記載されている程度を示す特性である実施可能担保特性の群から選ばれる、特許文書情報の1以上の特性を示す情報であるサンプル特許特性情報とを教師情報として、特許文書情報の特性を示す情報である特許特性情報をサポートベクター回帰により算出する特許特性情報算出ステップと、
前記特許特性情報算出ステップで算出した特許特性情報を出力する特許特性情報出力ステップと、を具備する情報処理方法。
Sample document attribute information from the document attribute information which is information acquired from the patent document information which is information related to the patent document and which is stored in the document attribute information storage unit and which indicates the attribute of the patent document information. Sample document attribute information, which is document attribute information used as teacher information, stored in the storage unit, and sample document attributes stored in the sample document attribute information storage unit, stored in the sample patent characteristic information storage unit The invention application is rejected in the invention essence extraction characteristic, which is the information corresponding to the information and used as the teacher information, the characteristic indicating the degree to which the essence of the invention is extracted from the patent document information, and the patent document information. Degree, or toughness characteristic that indicates the degree to which the patent of the invention becomes invalid, the degree to which the invention is developed in patent document information Information indicating one or more characteristics of the patent document information selected from the group of the invention development characteristics that are the characteristics to be exhibited and the feasible collateral characteristics that are the characteristics indicating the degree to which the invention can be implemented in the patent document information. Patent characteristic information calculating step for calculating patent characteristic information, which is information indicating the characteristic of patent document information, by support vector regression, using a certain sample patent characteristic information as teacher information,
A patent characteristic information output step of outputting the patent characteristic information calculated in the patent characteristic information calculation step.
コンピュータに、
文書属性情報記憶部が記憶している、特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報から、サンプル文書属性情報記憶部が記憶している、教師情報として用いられる文書属性情報であるサンプル文書属性情報と、サンプル特許価値情報記憶部が記憶している、前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル特許価値情報とを教師情報として、特許文書情報の価値を示す情報である特許価値情報をサポートベクター回帰により算出する特許価値情報算出ステップと、
前記特許価値情報算出ステップで算出した特許価値情報を出力する特許価値情報出力ステップと、を実行させ
前記文書属性情報は、特許文書情報における請求項の数、特許文書情報における独立形式の請求項の数、特許文書情報における特許請求の範囲のカテゴリー数、特許文書情報における特許請求の範囲のネストレベル、特許文書情報における特許請求の範囲の文字数、特許文書情報における代表請求項の構成要素数、特許文書情報における代表請求項の読点の数、特許文書情報における代表請求項の文字数、特許文書情報における代表請求項の単位情報数、特許文書情報における代表請求項の前提部の文字数、特許文書情報における代表請求項の特徴部の文字数、特許文書情報における代表請求項の前提部の単位情報数、特許文書情報における代表請求項の特徴部の単位情報数、特許文書情報における代表請求項の代表構成要素の文字数、特許文書情報における代表請求項の代表構成要素の単位情報数、特許文書情報において引用されている特許文献数、特許文書情報において引用されている非特許文献数、特許文書情報における実施の形態の文字数、特許文書情報における実施の形態の単位情報数、特許文書情報における実施の形態での例示の数、特許文書情報における実施の形態での外延拡張表記の数、特許文書情報における実施の形態での数式の数、特許文書情報における実施の形態での化学式の数、特許文書情報における図面数、特許文書情報における構成を示す図の数、特許文書情報におけるフローチャートの数、特許文書情報におけるデータ構造を示す図の数、特許文書情報における画面出力を示す図の数、特許文書情報におけるハードウェア構成を示す図の数の群から選ばれる、1以上の属性を示す情報を含む、プログラム。
On the computer,
Sample document attribute information from the document attribute information which is information acquired from the patent document information which is information related to the patent document and which is stored in the document attribute information storage unit and which indicates the attribute of the patent document information. Sample document attribute information, which is document attribute information used as teacher information, stored in the storage unit, and sample document attributes stored in the sample document attribute information storage unit, stored in the sample patent value information storage unit Information corresponding to information and used as teacher information, sample patent value information that is information indicating the value of patent document information is used as teacher information, and patent value information that is information indicating the value of patent document information is supported as a support vector. Patent value information calculation step calculated by regression,
A patent value information output step for outputting the patent value information calculated in the patent value information calculation step ;
The document attribute information includes the number of claims in patent document information, the number of independent claims in patent document information, the number of categories of claims in patent document information, and the nesting level of claims in patent document information , Number of characters of patent claim range in patent document information, number of constituent elements of representative claim in patent document information, number of reading points of representative claim in patent document information, number of characters of representative claim in patent document information, in patent document information Number of unit information of representative claim, number of characters of premise part of representative claim in patent document information, number of characters of characteristic part of representative claim in patent document information, number of unit information of premise part of representative claim in patent document information, patent Number of unit information of characteristic part of representative claim in document information, number of characters of representative component of representative claim in patent document information, patent The number of unit information of the representative component of the representative claim in the document information, the number of patent documents cited in the patent document information, the number of non-patent documents cited in the patent document information, the number of characters of the embodiment in the patent document information, Number of unit information of embodiment in patent document information, number of examples in embodiment of patent document information, number of extension extension notation in embodiment of patent document information, formula in embodiment of patent document information The number of chemical formulas in the embodiment in the patent document information, the number of drawings in the patent document information, the number of diagrams showing the configuration in the patent document information, the number of flowcharts in the patent document information, and the data structure in the patent document information From the group of number of figures, number of figures showing screen output in patent document information, number of figures showing hardware configuration in patent document information Barrel includes information indicating one or more attributes, the program.
コンピュータに、On the computer,
文書属性情報記憶部が記憶している、特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報から、サンプル文書属性情報記憶部が記憶している、教師情報として用いられる文書属性情報であるサンプル文書属性情報と、サンプル特許価値情報記憶部が記憶している、前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル特許価値情報とを教師情報として、特許文書情報の価値を示す情報である特許価値情報をサポートベクター回帰により算出する特許価値情報算出ステップと、Sample document attribute information from the document attribute information which is information acquired from the patent document information which is information related to the patent document and which is stored in the document attribute information storage unit and which indicates the attribute of the patent document information. Sample document attribute information, which is document attribute information used as teacher information, stored in the storage unit, and sample document attributes stored in the sample document attribute information storage unit, stored in the sample patent value information storage unit Information corresponding to information and used as teacher information, sample patent value information that is information indicating the value of patent document information is used as teacher information, and patent value information that is information indicating the value of patent document information is supported as a support vector. Patent value information calculation step calculated by regression,
前記特許価値情報算出ステップで算出した特許価値情報を出力する特許価値情報出力ステップと、を実行させ、A patent value information output step for outputting the patent value information calculated in the patent value information calculation step;
前記文書属性情報は、特許文書情報の国際特許分類、特許文書情報のFターム、特許文書情報のフェーズ、特許文書情報で示される発明の技術分野、特許文書情報に関する権利の存続期間、特許文書情報で示される発明の種類、特許文書情報における請求項の数、特許文書情報における独立形式の請求項の数、特許文書情報における特許請求の範囲のカテゴリー数、特許文書情報における特許請求の範囲のネストレベル、特許文書情報における特許請求の範囲の文字数、特許文書情報における代表請求項の構成要素数、特許文書情報における代表請求項の読点の数、特許文書情報における代表請求項の文字数、特許文書情報における代表請求項の単位情報数、特許文書情報における代表請求項の前提部の文字数、特許文書情報における代表請求項の特徴部の文字数、特許文書情報における代表請求項の前提部の単位情報数、特許文書情報における代表請求項の特徴部の単位情報数、特許文書情報における代表請求項の代表構成要素の文字数、特許文書情報における代表請求項の代表構成要素の単位情報数、特許文書情報において引用されている特許文献数、特許文書情報において引用されている非特許文献数、特許文書情報における実施の形態の文字数、特許文書情報における実施の形態の単位情報数、特許文書情報における実施の形態での例示の数、特許文書情報における実施の形態での外延拡張表記の数、特許文書情報における実施の形態での数式の数、特許文書情報における実施の形態での化学式の数、特許文書情報における図面数、特許文書情報における構成を示す図の数、特許文書情報におけるフローチャートの数、特許文書情報におけるデータ構造を示す図の数、特許文書情報における画面出力を示す図の数、特許文書情報におけるハードウェア構成を示す図の数の群から選ばれる、1以上の属性を示す情報を含む、プログラム。The document attribute information includes the international patent classification of patent document information, the F term of patent document information, the phase of patent document information, the technical field of the invention indicated by the patent document information, the duration of rights related to patent document information, and patent document information The number of claims in patent document information, the number of independent claims in patent document information, the number of categories of claims in patent document information, and the nesting of claims in patent document information Level, number of characters of patent claims in patent document information, number of constituent elements of representative claims in patent document information, number of readings of representative claims in patent document information, number of characters of representative claims in patent document information, patent document information The number of unit information of the representative claim in the patent, the number of characters of the premise part of the representative claim in the patent document information, the representative request in the patent document information The number of characters in the characteristic part of the term, the number of unit information in the premise part of the representative claim in the patent document information, the number of unit information in the characteristic part of the representative claim in the patent document information, the number of characters in the representative component of the representative claim in the patent document information , The number of unit information of the representative component of the representative claim in the patent document information, the number of patent documents cited in the patent document information, the number of non-patent documents cited in the patent document information, the embodiment of the patent document information Number of characters, number of unit information of embodiment in patent document information, number of examples in embodiment of patent document information, number of extension extension notation in embodiment of patent document information, embodiment in patent document information The number of mathematical formulas, the number of chemical formulas in the embodiment of the patent document information, the number of drawings in the patent document information, the number of diagrams showing the configuration in the patent document information Selected from the group of the number of flowcharts in patent document information, the number of diagrams showing the data structure in patent document information, the number of diagrams showing screen output in patent document information, the number of diagrams showing the hardware configuration in patent document information, A program containing information indicating one or more attributes.
コンピュータに、
文書属性情報記憶部が記憶している、特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報から、サンプル文書属性情報記憶部が記憶している、教師情報として用いられる文書属性情報であるサンプル文書属性情報と、サンプル特許特性情報記憶部が記憶している、前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報において発明の本質を抽出している程度を示す特性である発明本質抽出特性、特許文書情報において、発明にかかる出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程度を示す特性である強靱特性、特許文書情報において発明を展開している程度を示す特性である発明展開特性、及び特許文書情報において発明について実施可能に記載されている程度を示す特性である実施可能担保特性の群から選ばれる、特許文書情報の1以上の特性を示す情報であるサンプル特許特性情報とを教師情報として、特許文書情報の特性を示す情報である特許特性情報をサポートベクター回帰により算出する特許特性情報算出ステップと、
前記特許特性情報算出ステップで算出した特許特性情報を出力する特許特性情報出力ステップと、を実行させるためのプログラム。
On the computer,
Sample document attribute information from the document attribute information which is information acquired from the patent document information which is information related to the patent document and which is stored in the document attribute information storage unit and which indicates the attribute of the patent document information. Sample document attribute information, which is document attribute information used as teacher information, stored in the storage unit, and sample document attributes stored in the sample document attribute information storage unit, stored in the sample patent characteristic information storage unit The invention application is rejected in the invention essence extraction characteristic, which is the information corresponding to the information and used as the teacher information, the characteristic indicating the degree to which the essence of the invention is extracted from the patent document information, and the patent document information. Degree, or toughness characteristic that indicates the degree to which the patent of the invention becomes invalid, the degree to which the invention is developed in patent document information Information indicating one or more characteristics of the patent document information selected from the group of the invention development characteristics that are the characteristics to be exhibited and the feasible collateral characteristics that are the characteristics indicating the degree to which the invention can be implemented in the patent document information. Patent characteristic information calculating step for calculating patent characteristic information, which is information indicating the characteristic of patent document information, by support vector regression, using a certain sample patent characteristic information as teacher information,
A patent characteristic information output step for outputting the patent characteristic information calculated in the patent characteristic information calculation step.
前記文書属性情報記憶部で記憶されている文書属性情報のうち、数値でないものを数値化して前記文書属性情報記憶部に蓄積する文書属性情報数値化部をさらに備えた、請求項1から請求項のいずれか記載の情報処理装置。The document attribute information digitizing unit that digitizes non-numeric values of the document attribute information stored in the document attribute information storage unit and accumulates the document attribute information in the document attribute information storage unit. 8. The information processing apparatus according to any one of 7 . 前記文書属性情報数値化部は、非数値の文書属性情報と、数値の文書属性情報とを対応付けて有する情報である数値化対応情報を記録媒体において保持しており、前記数値化対応情報を用いて、数値でない文書属性情報を数値の文書属性情報に変換する、請求項14記載の情報処理装置。The document attribute information digitizing unit holds digitization correspondence information, which is information having non-numeric document attribute information and numeric document attribute information associated with each other, in the recording medium, and the digitization correspondence information is stored in the recording medium. The information processing apparatus according to claim 14, wherein the document attribute information is converted into numerical document attribute information. 前記分所属性情報数値化部は、前記サンプル文書属性情報記憶部で記憶されているサンプル文書属性情報のうち、数値でないものを数値化して前記サンプル文書属性情報記憶部に蓄積する、請求項14または請求項15記載の情報処理装置。The divisional membership information digitizing unit digitizes non-numeric values among sample document attribute information stored in the sample document attribute information storage unit, and accumulates them in the sample document attribute information storage unit. The information processing apparatus according to claim 15.
JP2007542309A 2005-10-31 2006-10-13 Information processing apparatus and information processing method Expired - Fee Related JP4674871B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005315726 2005-10-31
JP2005315726 2005-10-31
PCT/JP2006/320452 WO2007052460A1 (en) 2005-10-31 2006-10-13 Information processing device and information processing method

Publications (2)

Publication Number Publication Date
JPWO2007052460A1 JPWO2007052460A1 (en) 2009-04-30
JP4674871B2 true JP4674871B2 (en) 2011-04-20

Family

ID=38005613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007542309A Expired - Fee Related JP4674871B2 (en) 2005-10-31 2006-10-13 Information processing apparatus and information processing method

Country Status (2)

Country Link
JP (1) JP4674871B2 (en)
WO (1) WO2007052460A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021090394A1 (en) * 2019-11-06 2021-05-14 本田技研工業株式会社 Evaluation system of intellectual property rights, evaluation method of intellectual property rights, evaluation program, and correction data
CN112733549B (en) * 2020-12-31 2024-03-01 厦门智融合科技有限公司 Patent value information analysis method and device based on multiple semantic fusion

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004038628A1 (en) * 2002-10-23 2004-05-06 Ird Corp. Information processor and program
JP2004185421A (en) * 2002-12-04 2004-07-02 Mitsubishi Trust & Banking Corp Financial quantitative evaluation system
WO2004084096A1 (en) * 2003-03-19 2004-09-30 Fujitsu Limited Case classification apparatus and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004038628A1 (en) * 2002-10-23 2004-05-06 Ird Corp. Information processor and program
JP2004185421A (en) * 2002-12-04 2004-07-02 Mitsubishi Trust & Banking Corp Financial quantitative evaluation system
WO2004084096A1 (en) * 2003-03-19 2004-09-30 Fujitsu Limited Case classification apparatus and method

Also Published As

Publication number Publication date
WO2007052460A1 (en) 2007-05-10
JPWO2007052460A1 (en) 2009-04-30

Similar Documents

Publication Publication Date Title
EP2527991B1 (en) Analysis method, analysis device, and analysis program
Lancaster et al. Classifications of plagiarism detection engines
JP5827208B2 (en) Document management system, document management method, and document management program
US20200293528A1 (en) Systems and methods for automatically generating structured output documents based on structural rules
US20180253486A1 (en) Aggregating Procedures for Automatic Document Analysis
WO2015118617A1 (en) Data analysis system, data analysis method, and data analysis program
Burgard et al. Reducing literature screening workload with machine learning
JP5371589B2 (en) Infant vocabulary development database creation method, infant vocabulary development database creation device, infant vocabulary development database creation program
JP2011145996A (en) Reviewer evaluation apparatus, reviewer evaluation method and program
JP2006323517A (en) Text classification device and program
JP4674871B2 (en) Information processing apparatus and information processing method
US11676231B1 (en) Aggregating procedures for automatic document analysis
JP6124936B2 (en) Data analysis system, data analysis method, and data analysis program
JP2005267095A (en) Information display method and device, and information display program
JP2018022331A (en) Sound symbolism word and personality information providing device, sound symbolism word and personality information providing method, and sound symbolism word and personality information providing program
CN114254109B (en) Method and device for determining industry category
JP5326387B2 (en) Progress information output method and progress information output program
CN105677827B (en) A kind of acquisition methods and device of list
JP2005004797A (en) Information processor and program
JP6964891B2 (en) Counter business management device, counter business management method and counter business management program
JPWO2023037398A5 (en)
JPWO2023037399A5 (en)
JP5008152B2 (en) Procurement information search system
KR101078966B1 (en) System for analyzing documents
JP2011070541A (en) Method and device for supporting internet marketing

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090907

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090907

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20100825

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20100909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110121

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140204

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4674871

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees