WO2007052460A1 - 情報処理装置、及び情報処理方法 - Google Patents

情報処理装置、及び情報処理方法 Download PDF

Info

Publication number
WO2007052460A1
WO2007052460A1 PCT/JP2006/320452 JP2006320452W WO2007052460A1 WO 2007052460 A1 WO2007052460 A1 WO 2007052460A1 JP 2006320452 W JP2006320452 W JP 2006320452W WO 2007052460 A1 WO2007052460 A1 WO 2007052460A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
document
sample
patent document
value
Prior art date
Application number
PCT/JP2006/320452
Other languages
English (en)
French (fr)
Inventor
Hidekazu Tanigawa
Original Assignee
Ird Corp.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ird Corp. filed Critical Ird Corp.
Priority to JP2007542309A priority Critical patent/JP4674871B2/ja
Publication of WO2007052460A1 publication Critical patent/WO2007052460A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q90/00Systems or methods specially adapted for administrative, commercial, financial, managerial or supervisory purposes, not involving significant data processing

Definitions

  • the present invention relates to an information processing apparatus that calculates patent value information and patent characteristic information.
  • Patent Document 1 International Publication No. 2004Z038628 Pamphlet
  • the present invention has been made to solve the above-described problems, and is an object of each user without performing a complicated operation of setting an expression for calculating a patent value or the like for each user. It is an object of the present invention to provide an information processing apparatus and the like that can calculate the value of a patent in consideration of the elements of typical evaluation.
  • an information processing apparatus is a document that is information acquired from patent document information that is information related to a patent document, and is information that indicates an attribute of the patent document information.
  • Document attribute information storage unit storing attribute information
  • sample document attribute information storage unit storing sample document attribute information which is document attribute information used as teacher information
  • sample document attribute information storage unit Sample document value information storage that stores sample patent value information that is the information corresponding to the attribute information of the sample document and that indicates the value of the patent document information used as teacher information
  • the patent value information calculation unit that calculates the patent value information that indicates the value of the patent document information and the patent value information calculated by the patent value information calculation unit are output.
  • a patent value information output unit From the document attribute information stored in the storage unit, the patent value information calculation unit that calculates the patent value information that indicates the value of the patent document information and the patent value information calculated by the patent value information calculation unit are output.
  • the patent value information calculation unit may calculate the patent value information by a support vector machine.
  • patent value information can be calculated using a support vector machine, and high generalization performance can be obtained for unlearned data.
  • the information processing apparatus stores information acquired from patent document information that is information relating to a patent document, and document attribute information that is information indicating an attribute of the patent document information.
  • Document attribute information storage unit sample document attribute information storage unit storing sample document attribute information which is document attribute information used as teacher information, and sample document attribute information stored in the sample document attribute information storage unit
  • the invention essence extraction characteristic which is a characteristic indicating the degree to which the essence of the invention is extracted from the patent document information, is used as teacher information.
  • Toughness which is a characteristic indicating the degree to which a patent concerning an invention is invalidated, and patent document information! Develop your invention!
  • Sample patent characteristic information storage unit storing sample patent characteristic information that is information indicating one or more characteristics, sample document attribute information stored in the sample document attribute information storage unit, and sample patent characteristic information
  • the document attribute is stored in the document attribute information storage unit and the document attribute is stored in the document attribute information as teacher information.
  • a patent characteristic information calculation unit that calculates patent characteristic information that is information indicating characteristics of patent document information from the information; a patent characteristic information output unit that outputs the patent characteristic information calculated by the patent characteristic information calculation unit; It comprises.
  • the patent characteristic information calculation unit may calculate the patent characteristic information using a support vector machine.
  • patent characteristic information can be calculated using a support vector machine, and high generalization performance can be obtained for unlearned data.
  • a patent document information storage unit storing one or more pieces of patent document information and the patent document information stored in the patent document information storage unit!
  • a document attribute information acquisition unit that acquires attribute information and a document attribute information storage unit that stores the document attribute information acquired by the document attribute information acquisition unit in the document attribute information storage unit may be further included.
  • document attribute information can be acquired from patent document information, and patent value information, patent characteristic information, and the like can be calculated from the document attribute information. Therefore, the burden on the user etc. that the user etc. does not need to input by hand etc. about the document attribute information acquired by the document attribute information acquisition unit is reduced.
  • the patent document information storage unit also stores sample patent document information that is patent document information for calculating the sample document attribute information, and acquires the document attribute information.
  • the unit acquires sample document attribute information from the sample patent document information, and the document attribute information storage unit stores the sample document attribute information calculated by the document attribute information acquisition unit in the sample document attribute information storage unit. Also good.
  • sample document attribute information can also be obtained from patent document information in the same manner as the document attribute information described above, and patent value information and patent characteristic information can be obtained using the sample document attribute information. Can be calculated. Therefore, document attribute information acquisition For the sample document attribute information acquired by the department, the burden on the user etc. that the user etc. does not need to input manually is reduced.
  • the information processing apparatus provides an invention essence extraction characteristic, which is a characteristic indicating the degree to which the essence of the invention is extracted in patent document information, which is information relating to a patent document.
  • Characteristics indicating the degree to which an application related to refusal is rejected, or toughness characteristics indicating the extent to which a patent related to an invention becomes invalid, and characteristics indicating the extent to which the invention is developed based on patent document information One or more of patent document information selected from the group of practicable collateral characteristics, which are characteristics indicating the extent to which the invention development characteristics and patent document information are described as being practicable.
  • Patent characteristic information storage unit storing patent characteristic information which is information indicating the characteristics of the sample, sample patent characteristic information storage unit storing sample patent characteristic information which is patent characteristic information used as teacher information, and the support Sample patent characteristic information that is stored in the sample patent characteristic information storage unit and that stores sample patent value information that is information indicating the value of patent document information used as teacher information
  • the patent information that is stored in the value information storage unit, the sample patent characteristic information storage unit, and the sample patent value information stored in the sample patent value information storage unit is used as teacher information.
  • the patent value information calculation unit that calculates the patent value information that indicates the value of the patent document information from the patent characteristic information stored in the characteristic information storage unit! /, And the patent value information calculation unit calculates A patent value information output unit for outputting the issued patent value information.
  • the patent value information calculation unit may calculate the patent value information by a support vector machine.
  • patent value information can be calculated using a support vector machine, and high generalization performance can be obtained for unlearned data.
  • the support vector machine may perform multi-class classification. With such a configuration, it is possible to classify patent value and patent characteristics into three or more classes.
  • the support vector machine may output a real value.
  • the support vector machine may perform binary class classification.
  • patent value and patent characteristics can be classified into two values.
  • patent document information can be classified into high and low patent values, or patent documents.
  • Information may be classified into those with high patent characteristics (for example, invention essential extraction characteristics) and those with low characteristics.
  • the document attribute information that is stored in the document attribute information storage unit and is converted into a numerical value and stored in the document attribute information storage unit. It is also possible to provide an information numerical section.
  • document attribute information that is not a numerical value can be converted into numerical document attribute information.
  • patent value information calculation unit or patent characteristic information calculation unit calculates patent value information etc. using numerical document attribute information, patent value information etc. using more document attribute information etc. This makes it possible to calculate more appropriate patent value information and the like.
  • the document attribute information digitizing unit includes digitization correspondence information which is information having non-numeric document attribute information and numeric document attribute information associated with each other. It is held in the recording medium, and the numerical value corresponding information may be used to convert the document attribute information into numerical document attribute information!
  • non-numeric document attribute information can be digitized using numeric key correspondence information.
  • numerical key using numerical key correspondence information the correspondence between non-numeric document attribute information and numerical document attribute information can be arbitrarily set, so that a more appropriate correspondence can be achieved. By setting, calculate more appropriate patent value information, etc. Can be performed.
  • the segregation information quantification unit stores non-numeric values among the sample document attribute information stored in the sample document attribute information storage unit!
  • the numerical value may be stored in the sample document attribute information storage unit.
  • non-numeric sample document attribute information can be converted to numeric sample document attribute information.
  • FIG. 1 is a block diagram showing the configuration of the information processing apparatus 1 according to this embodiment.
  • the information processing apparatus 1 includes a patent document information storage unit 11, a document attribute information acquisition unit 12, a document attribute information storage unit 13, a document attribute information storage unit 14, Sample document attribute information storage unit 15, sample patent value information reception unit 16, sample patent value information storage unit 17, sample patent value information storage unit 18, patent value information calculation unit 19, patent value information output Part 20 is provided.
  • the patent document information storage unit 11 stores one or more pieces of patent document information.
  • patent document information is information relating to patent documents.
  • the patent document information may be, for example, information on a patent publication published by a patent office or the like, information on a patent publication, or information indicating a specification used when an electronic application is filed with the patent office. It is assumed that one piece of patent document information is information corresponding to one patent application or one patent.
  • Patent document information is, for example, information indicating a claim including one or more claims, one or more embodiments It may include any two or more pieces of information such as information indicating a description including information, information indicating a summary, information indicating the bibliographic items of an application such as an applicant, an international patent classification, and an application number.
  • patent document information may be information input using an input device such as a keyboard, mouse, tablet, touch panel, or the like. It may be information obtained by converting the read image data into text using OCR software.
  • Patent document information indicates information such as text data or specification data that may be markup language data such as HTML or meta language data such as XML. Any data format can be used.
  • the patent document information storage unit may store one or more pieces of sample patent document information.
  • the sample patent document information is patent document information used to acquire sample document attribute information to be described later, and is otherwise the same as the above-described patent document information. In the present embodiment, it is assumed that sample patent document information is also stored in the patent document information storage unit 11.
  • patent document information and the sample patent document information need not be particularly distinguished at the stage stored in the patent document information storage unit 11.
  • patent document information may be stored in a predetermined area and sample patent document information may be stored in another area.
  • the process in which the patent document information and the sample patent document information are stored in the patent document information storage unit 11 does not matter.
  • patent document information transmitted via a communication line or the like may be stored in the patent document information storage unit 11 even if the patent document information is stored in the patent document information storage unit 11 via a recording medium.
  • the patent document information or the like input via the input device may be stored in the patent document information storage unit 11.
  • the patent document information storage unit 11 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).
  • the document attribute information acquisition unit 12 acquires the document attribute information from the patent document information stored in the patent document information storage unit 11.
  • the document attribute information is information obtained from patent document information, and is information indicating attributes of the patent document information.
  • Document attribute information Acquisition of, for example, morphological analysis on patent document information, which may be simply reading out part of the patent document information from the document information as document attribute information, counting the number of predetermined information, etc.
  • the document attribute information may be calculated by executing the above process or other processes. A specific example of document attribute information and how to obtain it will be described later.
  • the patent document information storage unit 11 also stores sample patent document information
  • the document attribute information acquisition unit 12 may acquire the sample patent document information and the sample document attribute information.
  • the sample document attribute information is document attribute information used as teacher information, and is otherwise the same as the document attribute information described above.
  • the document attribute information storage unit 13 stores the document attribute information acquired by the document attribute information acquisition unit 12 in the document attribute information storage unit 14.
  • the document attribute information acquisition unit 12 also acquires sample document attribute information
  • the sample document attribute information is stored in the sample document attribute information storage unit 15.
  • the document attribute information storage unit 14 stores document attribute information.
  • the storage in the document attribute information storage unit 14 may be temporary storage in a RAM or the like, or may be long-term storage in a flash memory or a magnetic disk, for example.
  • the document attribute information storage unit 14 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).
  • the sample document attribute information storage unit 15 stores sample document attribute information.
  • the storage in the sample document attribute information storage unit 15 may be temporary storage in a RAM or the like, or may be long-term storage in a flash memory or a magnetic disk, for example.
  • the sample document attribute information storage unit 15 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).
  • the sample patent value information receiving unit 16 receives sample patent value information.
  • the sample patent value information is information indicating the value of the patent document information, and is information corresponding to the sample document attribute information stored in the sample document attribute information storage unit 15.
  • sample patent value information indicating the value of a certain sample patent document information is received by the sample patent value information receiving unit 16, and from the same sample patent document information.
  • the acquired sample document attribute information is stored in the sample document attribute information storage unit 15.
  • the sample patent value information is used as teacher information.
  • the sample patent value information receiving unit 16 is, for example, information transmitted via a wired or wireless communication line that can accept input information (for example, a keyboard, mouse, touch panel, etc.).
  • a predetermined recording medium may receive the read information.
  • the sample patent value information receiving unit 16 receives sample patent value information input from the input device.
  • the sample patent value information receiving unit 16 may or may not include a device (for example, a modem or a network card) for receiving.
  • the sample patent value information receiving unit 16 may be realized by a hard disk or may be realized by software such as a driver for driving a predetermined device!
  • the sample patent value information accumulating unit 17 accumulates the sample patent value information received by the sample patent value information receiving unit 16 in the sample patent value information storage unit 18.
  • the sample patent value information storage unit 18 stores sample patent value information.
  • the storage in the sample patent value information storage unit 18 may be, for example, a temporary storage in a RAM or the like, or a long-term storage in a flash memory or a magnetic disk.
  • the sample patent value information storage unit 18 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).
  • the patent value information calculation unit 19 calculates patent value information indicating the value of the patent document information corresponding to the document attribute information from the document attribute information stored in the document attribute information storage unit 14.
  • the patent value information calculation unit 19 calculates patent value information by supervised learning.
  • the patent value information calculation unit 19 may calculate the patent value information using a method other than that, for example, by calculating the patent value information using a support vector machine (SVM).
  • SVM support vector machine
  • the patent value information calculation unit 19 calculates the patent value information using a support vector machine.
  • the support vector machine is well known in the prior art and will not be described in detail.
  • Patent value information calculation unit 19 is a sample document attribute information storage unit.
  • Patent value information is calculated using the sample document attribute information 15 stored and the sample patent value information stored and stored by the sample patent value information storage unit 18 as teacher information.
  • the teacher information is information of an input / output pair used in supervised learning.
  • sample document attribute information is teacher information as input
  • sample patent value information is teacher information as output.
  • teacher information is sometimes called training data. Note that a single support vector machine can output real values that can be used to classify binary classes or can be used to classify multiple classes (three or more classes). There may be. When outputting real values, it is sometimes called Support Vector Regression (SVR), but here it is called a support vector machine.
  • SVR Support Vector Regression
  • the patent value information output unit 20 outputs the patent value information calculated by the patent value information calculation unit 19.
  • this output is output from a speaker that can be displayed on a display device (for example, a CRT or a liquid crystal display) or transmitted via a communication line to a predetermined device or printed by a printer. It may be stored in a recording medium by sound output.
  • the patent value information output unit 20 may or may not include an output device (for example, a display device or a printer). Also, the patent value information output unit 20 may be realized by hardware or software such as a driver for driving these devices.
  • any two or more storage units of the patent document information storage unit 11, the document attribute information storage unit 14, the sample document attribute information storage unit 15, and the sample patent value information storage unit 18 are the same. It may be realized by a recording medium or may be realized by a separate recording medium. In the former case, for example, the area storing the patent document information is the patent document information storage unit 11 and the area storing the document attribute information is the document attribute information storage unit 14, and the sample document attribute is stored. The area storing the information becomes the sample document attribute information storage unit 15, and the area storing the sample patent value information becomes the sample patent value information storage unit 18.
  • Document attribute information includes the number of claims in patent document information, the number of independent claims in patent document information, and the number of claims in patent document information.
  • the number of claim categories in the patent document, the nesting level of the claims in the patent document information, the number of characters in the claims in the patent document information, the number of components of the representative claims in the patent document information, the representative requests in the patent document information The number of reading points in the term, the number of characters in the representative claim in the patent document information, the number of unit information in the representative claim in the patent document information, the number of characters in the premise part of the representative claim in the patent document information, the representative in the patent document information Number of characters in the characterizing part of the claim, number of unit information in the premise part of the representative claim in the patent document information, number of unit information in the characteristic part of the representative claim in the patent document information, representative composition of the representative claim in the patent document information Number of characters of elements, number of unit information of representative constituent elements of representative claims in patent document information, number of patent documents
  • Information indicating one or more attributes is information indicating all the attributes described above.
  • the document attribute information acquisition unit 12 may acquire the largest number of claims in the scope of patent claims as the number of claims in the patent document information. For example, if the largest tag number such as [Claim 5] is “5”, the number of claims “5” may be acquired.
  • the document attribute information acquisition unit 12 counts the number of claims that do not cite other claims in each claim in the patent document information, that is, does not include the number of other claims. The number of claims may be obtained.
  • the document attribute information acquisition unit 12 acquires the name of the claimed invention in the patent document information, determines the category of each claim from the name of the invention, and counts the number of different categories. From the above, the number of categories in the claims may be acquired. Categories are, for example, devices, methods Laws, programs, etc.
  • the program is supposed to be in the device category, so it may be judged as the device category or it may be judged as another category.
  • a method for obtaining the name of the invention from each claim there is a method for obtaining the last word of each claim.
  • the method of judging the category of the name of the invention if the ending of the name of the invention is ⁇ program '', it is judged as the category of the program, and if the ending of the name of the invention is ⁇ method '', the category of the method is determined. If it is not, it may be determined that it is a device category! /.
  • the nesting level of the claims is the depth of the claim hierarchy in the claims.
  • the document attribute information acquisition unit 12 calculates the depth of the hierarchy of each claim by repeating the identification of the claim dependent on the claim from each claim up to the independent claim. For example, in the case of the previous example, the depth of claim 1 is “1”, the depth of claim 2 is “2”, and the depth of claim 3 is “3”. " The document attribute information acquisition unit 12 may acquire the deepest of the hierarchies (“3” in the previous example) as a nesting level.
  • the document attribute information acquisition unit 12 may acquire the number of characters in the claims by specifying the region of the claims in the patent document information and counting the number of characters in the region.
  • the method of counting the number of characters is well known in the art, and the description thereof is omitted.
  • the document attribute information acquisition unit 12 may count the number of components in the representative claim in the patent document information and acquire the count value as the number of components in the representative claim.
  • the representative claim is a representative claim in the scope of claims.
  • the first claim (Claim 1) may be used, or the device claim may be the highest number. It may be a claim with a small number of characters or a claim with the smallest number of characters, or a claim specified by other rules.
  • the document attribute information acquisition unit 12 may acquire the number of readings of the representative claim in the patent document information by counting the readings “,” “,” in the representative claim.
  • the document attribute information acquisition unit 12 may acquire the number of characters of the representative claim in the patent document information by counting the number of characters of the representative claim.
  • the document attribute information acquisition unit 12 may determine the number of unit information of the representative claim in the patent document information by performing a predetermined analysis on the representative claim and counting the number of unit information.
  • the unit information includes words, phrases, morphemes, and independent words.
  • the predetermined analysis is, for example, morphological analysis and the like, and the process of dividing a sentence into unit information such as words and phrases has been conventionally known, and the description thereof is omitted.
  • the document attribute information acquisition unit 12 determines the number of characters of the premise part of the representative claim in the patent document information from the first character of the representative claim, such as “ ⁇ te te” or “ ⁇ te te”. You can also get by counting the number of characters up to the last character of.
  • the document attribute information acquisition unit 12 determines the number of characters of the characteristic part of the representative claim in the patent document information by “to” or “to” of the representative claim.
  • the document attribute information acquisition unit 12 counts the number of unit information of the premise part of the representative claim in the patent document information by using the morphological analysis or the like in the same way as the case of the number of characters of the premise part. You may get it.
  • the document attribute information acquisition unit 12 counts the number of unit information by using morphological analysis in the same way as the number of characters in the characteristic part of the representative claim in the patent document information, as in the case of the number of characters in the characteristic part. You may acquire by doing.
  • the document attribute information acquisition unit 12 may acquire the number of characters of the representative component of the representative claim in the patent document information by counting the number of characters of the representative component of the representative claim.
  • the representative constituent element is a representative constituent element in the claim.
  • the constituent element may be used as the representative constituent element.
  • Good referring to the description of the effect in the detailed description of the invention (specification), The components mentioned in the description may be used as representative components. In the description of the effect, the description in the column of “Effect of invention” is generally used. In general, the description of the effect is often made after “as above” or “in this way”. A paragraph beginning with a simple introductory phrase may be considered a statement of effect.
  • the document attribute information acquisition unit 12 may extract a series of words including “part” and “means” described as “ ⁇ part” or “ ⁇ means” in a claim as a constituent element.
  • a series of words before “to” described as “to and” may be extracted as a constituent element.
  • a series of words is, for example, a continuous word consisting of kanji and power Takanaka.
  • the document attribute information acquisition unit 12 extracts “information input unit” or the like as a constituent element.
  • the document attribute information acquisition unit 12 specifies the description of the effect and extracts the constituent elements from the claims.
  • the document attribute information acquisition unit 12 describes an effect such as “can be done with“ ... ”or“ can be done with ... ”. Identify sentences by pattern matching.
  • the document attribute information acquisition unit 12 devotees power to the part (in the above example, “to”) in which the component that is a factor for achieving the effect is described in the identified sentence.
  • the document attribute information acquisition unit 12 counts the number of unit information of the representative component of the representative claim in the patent document information by performing morphological analysis etc. on the representative component of the representative claim. You may get it.
  • the document attribute information acquisition unit 12 may acquire the number of patent documents cited in the patent document information by counting the number of patent documents found such as “Patent Document N”. It can be obtained by specifying the maximum N value of ⁇ '', or it can be obtained by searching the patent document information so that there are no duplicate descriptions having the format of the patent document description. Good.
  • N is an arbitrary integer.
  • the format described in the patent document is, for example, a format in which “JP-A”, a 4-digit number, a hyphen “-”, and a 6-digit number are arranged in order.
  • the document attribute information acquisition unit 12 calculates the number of non-patent documents cited in the patent document information! It can be obtained by counting the number of headings of non-patent literature such as “Non-patent literature N”. It can also be obtained by specifying the maximum N value of “non-patent literature N”. It may be obtained by searching the patent document information so that there are no duplicate descriptions having the description format of non-patent literature.
  • the document attribute information acquisition unit 12 may acquire the number of characters in the embodiment in the patent document information by counting the number of characters in the range described in the embodiment.
  • the document attribute information acquisition unit 12 identifies the range described in the embodiment as the range from “(embodiment)” to “industrial applicability”. May be.
  • the document attribute information acquisition unit 12 sets the number of unit information of the embodiment in the patent document information within the range described in the embodiment! It may be obtained by performing morphological analysis or the like and counting the number of unit information.
  • the document attribute information acquisition unit 12 may acquire the number of examples in the embodiment of the patent document information by counting the number of “for example” within the range described in the embodiment.
  • the document attribute information acquisition unit 12 sets the number of extended extension notations in the embodiment in the patent document information within the range described in the embodiment, the number of sentences ending with “may”, May be obtained by counting the number of "” and the number of "etc.”
  • the document attribute information acquisition unit 12 may acquire the maximum number of formulas in the embodiment of patent document information by counting the number of formula headings such as “number N”. It may be obtained by specifying the value of N.
  • the document attribute information acquisition unit 12 may acquire the number of chemical formulas in the embodiment of the patent document information by counting the number of formula headings such as “I ⁇ N”. It may be obtained by specifying the maximum value of N.
  • the document attribute information acquisition unit 12 counts the number of drawings in the patent document information by counting the number of drawings described in the brief description of drawings, etc.
  • the document attribute information acquisition unit 12 determines the number of diagrams indicating the configuration in patent document information, including “block diagram”, “diagram illustrating configuration”, “configuration diagram”, etc. in a brief description of the drawing, etc. It may be obtained by counting the number of drawings having.
  • Document attribute information acquisition unit 12 The number of flowcharts in the document information should include “flow chart”, “flow diagram”, “flow diagram”, “flow”, “flow”, “procedure”, etc. You may acquire by counting the number of drawings which have.
  • the document attribute information acquisition unit 12 includes the number of diagrams indicating the data structure in patent document information, including “data structure”, “data structure”, “information structure”, etc. in a brief description of the drawing, etc. It may be obtained by counting the number of drawings having a description.
  • the document attribute information acquisition unit 12 sets the number of figures indicating screen output in patent document information to “screen display”, “screen output”, “screen display”, “screen output” in a brief description of the drawing, etc. It may be obtained by counting the number of drawings having descriptions including the above.
  • the document attribute information acquisition unit 12 is a figure having a description including the “hardware configuration”, “hardware configuration”, etc. You can get by counting the number of.
  • Step S 101 The sample patent value information receiving unit 16 determines whether sample patent value information has been received. If sample patent value information is received, the process proceeds to step S102, and if not, the process proceeds to step S103.
  • Step S 102 The sample patent value information storage unit 17 stores the sample patent value information received by the sample patent value information reception unit 16 in the sample patent value information storage unit 18. Then, the process returns to step S101.
  • Step S 103 The patent value information calculation unit 19 determines whether to calculate patent value information. If the patent value information is calculated, the process proceeds to step S104. If not, the process returns to step S101.
  • the timing at which the patent value information calculation unit 19 determines to calculate the patent value information does not matter. For example, it may be determined that the patent value information is calculated using a trigger of a predetermined event (for example, an instruction to calculate the patent value information is received) as a trigger.
  • the document attribute information acquisition unit 12 acquires document attribute information from the patent document information stored in the patent document information storage unit 11.
  • the document attribute information acquisition unit 12 Obtains sample document attribute information from the sample patent document information stored in the patent document information storage unit 11.
  • the document attribute information storage unit 13 stores the document attribute information acquired by the document attribute information acquisition unit 12 in the document attribute information storage unit 14. In addition, document attribute information storage unit 1
  • the patent value information calculation unit 19 is stored in the sample document attribute information storage unit 15!
  • the patent value information is obtained from the document attribute information stored in the document attribute information storage unit 14 by using the sample document attribute information stored in the sample patent value information storage unit 18 as the teacher information. calculate.
  • Step S107 The patent value information output unit 20 outputs the patent value information calculated by the patent value information calculation unit 19. Then, the process returns to step S101.
  • information processing apparatus 1 Next, the operation of information processing apparatus 1 according to the present embodiment will be described using a specific example.
  • the information processing apparatus 1 is a stand-alone PC (Personal Computer).
  • the patent document information storage unit 11 associates the patent document ID, which is information for identifying the patent document information, with the patent document information as shown in FIG. It shall be remembered.
  • this patent document information includes sample patent document information.
  • the patent document information ⁇ P0001 '' or the like may be the patent document information data itself or the name of the patent document information or the address (pointer) in the patent document information storage unit 11 where the patent document information is stored! / ⁇ .
  • the patent document information “P0001” identified by “Patent Document ID ⁇ 1999 — 123456” is the text data shown in FIG. Suppose that In FIG. 4, the patent document information “P0001” includes bibliographic items such as a publication number and publication date, claims, and a detailed description (specification) of the invention.
  • the patent document information may or may not include drawing data.
  • a screen for inputting sample patent document information is displayed.
  • This screen display is performed when a display unit (not shown) acquires a patent document ID from the patent document information storage unit 11.
  • the user inputs the sample patent value information of the sample patent document information identified by the patent document ID by operating the keyboard and mouse.
  • the user calculates and inputs the patent value by referring to the sample patent document information itself or the public information corresponding to the sample patent document information. It should be noted that the user who inputs sample patent value information does not calculate the patent value as a sample, such as an expert in the intellectual property right department or a patent attorney.
  • the patent value may be requested to be calculated.
  • the patent document IDs corresponding to all the patent document information (including sample patent document information) stored in the patent document information storage unit 11 are displayed. Of the displayed patent document IDs, it is only necessary to input sample patent value information for the patent document ID corresponding to the patent document information to be used as a sample. That is, the patent document information identified by the patent document ID in which the sample patent value information is input becomes the sample patent document information.
  • FIG. 6 is a diagram showing the correspondence between the sample patent value information stored in the sample patent value information storage unit 18 and the patent document ID.
  • a screen for starting calculation of patent value information is displayed.
  • the display unit (not shown) corresponds to the sample patent value information by referring to the patent document information storage unit 11 and the sample patent value information storage unit 18. This is done by displaying an unattached patent document ID.
  • three patent document IDs are displayed, and the user operates the mouse and clicks the radio button on the left side of the patent document ID “P1999-111111” to display the patent document ID. It is assumed that the patent document information identified by the ID “P1 999-111111” is selected. Then, the user clicks the “OK” button by operating the mouse.
  • the patent value information calculation unit 19 determines that the instruction to calculate the patent value information is received from the patent document information identified by the patent document ID ⁇ 1999-111111 (step S103), and the document attribute information The document attribute information of the patent document information identified by the patent document ID ⁇ 1999-111111 for the information acquisition unit 12 and the sample document corresponding to the sample patent value information stored in the sample patent value information storage unit 18 An instruction to acquire attribute information is passed.
  • the document attribute information acquisition unit 12 reads the patent document information identified by the patent document ID “P1 999-111111” from the patent document information storage unit 11, and reads the document attribute information from the patent document information. Get as described.
  • the document attribute information acquisition unit 12 reads the patent document ID corresponding to the sample patent value information stored in the sample patent value information storage unit 18, and reads the sample patent document information identified by the patent document ID as the patent document. Read from the information storage unit 11, and similarly, sample document attribute information is acquired from the sample patent document information (step S104).
  • the document attribute information storage unit 13 stores the document attribute information acquired by the document attribute information acquisition unit 12 in the document attribute information storage unit 14.
  • the document attribute information stored in the document attribute information storage unit 14 is as shown in FIG.
  • the document attribute information storage unit 13 stores the sample document attribute information acquired by the document attribute information acquisition unit 12 in the sample document attribute information storage unit 15 (step S105).
  • the sample document attribute information stored in the sample document attribute information storage unit 15 is as shown in FIG. 8 and 9, document attribute information and sample document attribute information are associated with patent document IDs.
  • the document attribute information and sample document attribute information include the number of claims, the number of independent claims, the number of categories, the nesting level, the number of characters in the claims, the number of components in the representative claims, etc. Contains information indicating each attribute!
  • the patent value information calculation unit 19 receives the teacher information from the sample document attribute information storage unit 15. And the sample patent value information as teacher information is read from the sample patent value information storage unit 18. Then, the information is converted into a format that can be read by a support vector machine. Specifically, as shown in FIG. 10, sample document attribute information and sample patent value information are converted. In Fig. 10, each line corresponds to one piece of patent document information. For example, the data in the first row corresponds to the patent document information identified by the patent document ID “P 1999-123456”. The data on the second line corresponds to the patent document information identified by “Patent Document ID ⁇ 1999-234567”. In each row, the leftmost value is the value indicated by the sample patent value information.
  • attribute values associated with identification numbers that identify each attribute in the sample document attribute information are arranged in order.
  • the identification number identifying the attribute “number of claims” is “1”
  • the identification number identifying the attribute “number of independent claims” is “2”
  • the attribute “number of categories” is The identification number to be identified is “3”.
  • the patent value information calculation unit 19 reads the document attribute information of the patent document information for calculating the patent value information from the document attribute information storage unit 14, reads the information shown in FIG. 10 as teacher information, and uses a support vector machine.
  • the patent value information corresponding to the read document attribute information is calculated.
  • the support vector machine used here performs multi-class classification.
  • the patent value information output unit 20 displays the patent value information “70” on the display of the information processing apparatus 1 as shown in FIG. 11 (step S 107). In this way, the user can know the patent value information.
  • the patent value information calculation unit 19 uses the sample patent value information and the sample document attribute information as teacher information, so that the desired patent document information Patent value information indicating the value can be calculated.
  • the desired patent document information Patent value information indicating the value can be calculated.
  • users perform subjective evaluations, but by calculating patent value information using teacher information, an objective patent value that reflects the user's subjective evaluation elements can be obtained. Calculations can be made.
  • the value judgment can be used to judge the value of other patents in the same way, which contributes to a great reduction in labor. Can be.
  • Embodiment 2 of the present invention An information processing apparatus according to Embodiment 2 of the present invention will be described with reference to the drawings.
  • the information processing apparatus according to the present embodiment calculates patent characteristic information instead of patent value information.
  • FIG. 12 is a block diagram showing a configuration of the information processing apparatus 2 according to the present embodiment.
  • the information processing apparatus 2 includes a patent document information storage unit 11, a document attribute information acquisition unit 12, a document attribute information storage unit 13, a document attribute information storage unit 14, and a sample document.
  • Attribute information storage unit 15, sample patent characteristic information reception unit 21, sample patent characteristic information storage unit 22, sample patent characteristic information storage unit 23, patent characteristic information calculation unit 24, patent characteristic information output unit 25 Is provided.
  • the configuration and operation other than the sample patent characteristic information receiving unit 21, sample patent characteristic information storage unit 22, sample patent characteristic information storage unit 23, patent characteristic information calculation unit 24, and patent characteristic information output unit 25 are the same as in the embodiment. The explanation is omitted because it is the same as 1.
  • the sample patent characteristic information receiving unit 21 receives sample patent characteristic information.
  • the sample patent characteristic information is information indicating characteristics of the patent document information, and is information corresponding to the sample document attribute information stored in the sample document attribute information storage unit 15. That is, sample patent characteristic information indicating the characteristics of a certain sample patent document information is received by the sample patent characteristic information receiving unit 21, and sample document attribute information acquired from the same sample patent document information is sample document attribute information storage unit 15 Remembered in It will be.
  • the sample patent characteristic information is used as teacher information.
  • the sample patent characteristic information includes invention essential extraction characteristics, toughness characteristics, invention development characteristics, and practicable collateral characteristics.
  • the invention essence extraction characteristic is a characteristic indicating the degree to which the essence of the invention is extracted from patent document information.
  • the toughness characteristic is a characteristic indicating the degree to which the application concerning the invention is rejected or the degree to which the patent concerning the invention becomes invalid in the patent document information.
  • Invention development characteristics are characteristics that indicate the degree to which an invention is developed in patent document information.
  • the practicable collateral characteristic is a characteristic indicating the degree to which the invention is described as feasible in the patent document information.
  • the sample patent characteristic information receiving unit 21 receives, for example, information transmitted via a wired or wireless communication line that can receive information input from an input device (for example, a keyboard, mouse, touch panel, etc.). However, a predetermined recording medium (for example, an optical disk, a magnetic disk, a semiconductor memory, etc.) may also read the read information.
  • the sample patent characteristic information receiving unit 21 receives sample patent characteristic information input from an input device.
  • the sample patent characteristic information receiving unit 21 may or may not include a device (for example, a modem or a network card) for receiving.
  • the sample patent characteristic information receiving unit 21 may be realized by hardware or may be realized by software such as a driver that drives a predetermined device.
  • the sample patent characteristic information accumulating unit 22 accumulates the sample patent characteristic information received by the sample patent characteristic information receiving unit 21 in the sample patent characteristic information storage unit 23.
  • the sample patent characteristic information storage unit 23 stores sample patent characteristic information.
  • the storage in the sample patent characteristic information storage unit 23 may be, for example, a temporary storage in a RAM or the like, or a long-term storage in a flash memory or a magnetic disk.
  • the sample patent characteristic information storage unit 23 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).
  • the patent characteristic information calculation unit 24 calculates, from the document attribute information stored in the document attribute information storage unit 14, patent characteristic information indicating the characteristics of the patent document information corresponding to the document attribute information. Patent characteristic information calculation unit 24 calculates patent characteristic information by supervised learning To do.
  • the calculated patent characteristic information includes the invention essential extraction characteristic, the toughness characteristic, the invention development characteristic, and the practicable guarantee characteristic, as in the above-described sample patent characteristic information.
  • the patent characteristic information calculation unit 24 may calculate the patent characteristic information using a method other than the calculation of the patent characteristic information using a support vector machine, for example. In the present embodiment, it is assumed that the patent characteristic information calculation unit 24 calculates patent characteristic information using a support vector machine.
  • the patent characteristic information calculation unit 24 uses the sample document attribute information stored in the sample document attribute information storage unit 15 and the sample patent characteristic information stored in the sample patent characteristic information storage unit 23 as teacher information. Patent characteristic information is calculated.
  • the patent characteristic information calculation unit 24 is the same as the patent value information calculation unit 19 of the first embodiment except that teacher information and information to be processed are different, and detailed description thereof is omitted.
  • the patent characteristic information output unit 25 outputs the patent characteristic information calculated by the patent characteristic information calculation unit 24.
  • this output is output from a speaker that can be displayed on a display device (for example, a CRT or a liquid crystal display) or transmitted via a communication line to a predetermined device or printed by a printer. It may be stored in a recording medium by sound output.
  • the patent characteristic information output unit 25 may or may not include a device that performs output (for example, a display device or a printer).
  • the patent characteristic information output unit 25 may be realized by hardware or software such as a driver for driving these devices.
  • any two or more storage units of the patent document information storage unit 11, the document attribute information storage unit 14, the sample document attribute information storage unit 15, and the sample patent characteristic information storage unit 23 are the same. It can be realized by a recording medium or by a separate recording medium.
  • steps S104 and S105 are the same as those in the flowchart of FIG. 2 of the first embodiment, and a description thereof will be omitted.
  • Step S201 The sample patent characteristic information receiving unit 21 receives the sample patent characteristic information. Judge whether or not. If sample patent characteristic information has been received, the process proceeds to step S202. If not, the process proceeds to step S203.
  • Step S202 The sample patent characteristic information storage unit 22 stores the sample patent characteristic information received by the sample patent characteristic information reception unit 21 in the sample patent characteristic information storage unit 23. Then, the process returns to step S201.
  • Step S203 The patent characteristic information calculation unit 24 determines whether to calculate patent characteristic information. If the patent characteristic information is to be calculated, the process proceeds to step S104. If not, the process returns to step S201.
  • the timing at which the patent characteristic information calculation unit 24 determines to calculate the patent characteristic information does not matter. For example, it may be determined that the patent characteristic information is calculated with the occurrence of a predetermined event (for example, an instruction to calculate the patent characteristic information is accepted) as a trigger.
  • the patent characteristic information calculation unit 24 stores the sample document attribute information stored in the sample document attribute information storage unit 15 and the sample patent characteristic information stored in the sample patent characteristic information storage unit 23. Is used as the teacher information, and the document attribute information power patent characteristic information stored in the document attribute information storage unit 14 is calculated.
  • Step S205 The patent characteristic information output unit 25 outputs the patent characteristic information calculated by the patent characteristic information calculation unit 24. Then, the process returns to step S201.
  • the processing is ended by powering off or interruption for aborting the processing in the flowchart in FIG.
  • the document attribute information and the sample document attribute information are obtained when calculating the patent characteristic information.
  • the document attribute information is obtained in advance, and the acquisition is performed.
  • Patent characteristic information may be calculated using the document attribute information and the like.
  • information processing apparatus 2 Next, the operation of information processing apparatus 2 according to the present embodiment will be described using a specific example.
  • the information processing apparatus 2 is a stand-alone PC. Note that the processing related to the acquisition and storage of document attribute information and sample document attribute information from patent document information is the same as the specific example of the first embodiment, and a description thereof will be omitted.
  • processing related to reception and storage of sample patent characteristic information is the same as the processing related to the reception and storage of patent value information in the specific example of Embodiment 1 except that the received information includes a plurality of the essential extraction characteristics and the toughness characteristics. Description is omitted.
  • FIG. 14 is a diagram showing sample patent characteristic information accumulated by the sample patent value information accumulating unit 17.
  • the patent document ID is associated with the invention essential extraction characteristics, toughness characteristics, invention development characteristics, and practicable collateral characteristics included in the sample patent characteristic information. These values are numerical values determined by the user or the like by referring to the patent document information or the gazette as in the case of the patent value information in the specific example of the first embodiment.
  • the user operates the mouse on the screen similar to FIG. 7 of the first embodiment and clicks the radio button on the left side of the patent document ID “P1999-111111” to display the patent document ID. It is assumed that the patent document information identified by “ ⁇ 1999-111111” is selected. Then, the user clicks the “OK” button by operating the mouse.
  • the patent characteristic information calculation unit 24 determines that the instruction to calculate the patent characteristic information is received from the patent document information identified by the patent document ID ⁇ 1999-111111 (step S203), and the document attribute information Sample attribute corresponding to the document attribute information of the patent document information identified by the patent document ID “P 1999-111111” and the sample patent characteristic information stored in the sample patent characteristic information storage unit 23 to the acquisition unit 12 Gives an instruction to obtain document attribute information.
  • the document attribute information and the sample document attribute information are acquired and accumulated, as in the specific example of the first embodiment.
  • the patent characteristic information calculation unit 24 reads the sample document attribute information as the teacher information from the sample document attribute information storage unit 15, and the sample patent characteristic information as the teacher information from the sample patent characteristic information storage unit 23. read out. Then, the patent characteristic information calculation unit 24 converts the information into a format that is read into the support vector machine in the same manner as in FIG. 10 of the first embodiment. Then, the patent characteristic information calculation unit 24 reads the document attribute information of the patent document information for calculating the patent characteristic information from the document attribute information storage unit 14, reads the teacher information, and uses the support vector machine to read the read document attribute information. The patent characteristic information corresponding to is calculated.
  • the support vector machine used here performs multi-class classification. Here, it is identified by the patent document ID “P1999-111111”.
  • the patent characteristic information of the patent document information to be calculated is the invention essential extraction characteristic “70”, the toughness characteristic “75”, the invention development characteristic “70”, and the feasible security characteristic “75” (step S204). Then, the patent characteristic information output unit 25 displays the calculated patent characteristic information on the display of the information processing apparatus 2 as in FIG. 11 of the first embodiment (step S205). In this way, the user can know the patent characteristic information.
  • the patent characteristic information calculation unit 24 uses the sample patent characteristic information and the sample document attribute information as teacher information, so that desired patent document information is obtained. Patent characteristic information indicating the characteristics of the above can be calculated. In this way, since the patent characteristic information is calculated using the teacher information, the patent characteristic can be calculated in consideration of the factor of subjective evaluation of the user. On the other hand, it is not necessary to perform a complicated work for setting an expression that does not require setting a complicated expression for calculating patent characteristic information for each user.
  • the document attribute information used in the above embodiments is an example, and it goes without saying that other document attribute information may be used.
  • the document attribute information includes the international patent classification of patent document information, the F term of patent document information, the phase of patent document information, the technical field of the invention indicated by the patent document information, the duration of rights related to patent document information, the patent Type of invention indicated by document information, number of claims in patent document information, number of independent claims in patent document information, one claim category in patent document information, claim in patent document information Nesting level, the number of claims in the patent document information, the number of constituent elements of the representative claim in the patent document information, the number of readings of the representative claim in the patent document information, the representative request in the patent document information
  • the number of characters in the term, the number of unit information of the representative claim in the patent document information, the number of characters in the premise part of the representative claim in the patent document information, and the patent document information The number of characters in the characteristic part of the representative claim, the number of unit information in the premise part of the representative claim in the patent document
  • the phase of patent document information refers to the power of patent document information being filed but before the request for examination, the power of pending examination, the power of pending trial, and the pending lawsuit. This is the phase of the power that has been revoked due to the expiration of the lifetime, etc.
  • the technical field of the invention indicated by the patent document information is a small field such as a refrigerator, a washing machine, a detergent, etc., which may be a large field such as a semiconductor field, a home appliance field, or a scientific field. Also good.
  • the term of the right for patent document information is the maximum duration of the right, and if it is not a right, it is the maximum duration of the right. In general, the duration of a right is 20 years of filing date.
  • the type of invention indicated in the patent document information may be, for example, a basic invention, an invention of concept, such as an applied invention, a concept invention that emerged in the planning stage, or a function that emerged in the external (outline) design stage Functional inventions that are inventions, improved inventions that came out in the detailed design stage, and / or the types of inventions!
  • the information processing apparatus 1 includes a document attribute information receiving unit 41 that receives document attribute information, and document attribute information received by the document attribute information receiving unit 41.
  • a document attribute information accumulation unit 42 that accumulates in the information storage unit 14 may be further included.
  • the document attribute information receiving unit 41 may receive information input from an input device via a wired or wireless communication line.
  • the read information may be received by a predetermined recording medium that receives the transmitted information.
  • the document attribute information receiving unit 41 may or may not include a device for receiving. Further, the document attribute information receiving unit 41 may be realized by hardware or may be realized by software such as a driver that drives a predetermined device.
  • FIG. 19 is a flowchart in the case where the information processing apparatus 1 includes a document attribute information receiving unit 41 and a document attribute information storage unit 42.
  • step S401 the document attribute information receiving unit 41 determines whether or not the document attribute information has been received. If the document attribute information is received, the process proceeds to step S402. If not, the process proceeds to step S103. .
  • the document attribute information storage unit 42 stores the document attribute information received by the document attribute information reception unit 41 in the document attribute information storage unit 14.
  • the information processing apparatus 2 of the second embodiment In general, the international patent classification of patent document information, the F term of patent document information, the phase of patent document information, the technical field of the invention indicated by patent document information, the type of invention indicated by patent document information, etc. Therefore, when using those attributes as teacher information, the information may be converted into numbers and used. For example, each international patent classification may be associated with a number in turn.
  • the information processing apparatuses 1 and 2 described in the first and second embodiments may further include a document attribute information numerical value input unit 51 as shown in FIGS.
  • the document attribute information digitizing unit 51 digitizes non-numeric values of the document attribute information stored in the document attribute information storage unit 14 and accumulates them in the document attribute information storage unit 14.
  • a method of the numerical value for example, (1) quantification is performed using digitization correspondence information that is information having non-numeric document attribute information and numerical document attribute information associated with each other. And (2) a method of calculating a numerical value by performing a calculation using a predetermined formula. These are described below.
  • the digitization correspondence information is, for example, shown in FIG. In FIG. 22, numerical key correspondence information includes non-numeric document attribute information and numeric document attribute information in association with each other. Yes. For example, non-numeric document attribute information “invention avoidance: high” is associated with numerical document attribute information “invention avoidance: 50”. Therefore, the document attribute information digitizing unit 51 refers to the digitization correspondence information and stores the non-numeric document attribute information “Ease of Invention Avoidance: High” stored in the document attribute information storage unit 14! Can be converted into numerical document attribute information “ease of invention avoidance: 50”.
  • the document attribute information digitizing unit 51 searches the digitization correspondence information using the non-numeric document attribute information “ease of invention avoidance: high” as a key, and the retrieved non-numeric document attribute. By obtaining the numerical document attribute information “Invention Avoidance: 50” corresponding to the information “Invention Avoidance: High”, the conversion can be performed. Then, the document attribute information numerical value storage unit 51 stores the converted numerical document attribute information in the document attribute information storage unit 14.
  • non-numeric document attribute information such as IPC may be converted into numeric document attribute information.
  • the document attribute information “15” of the IPC force numerical value that also starts “A01” force is converted.
  • IPC is associated with numerical values in this way, the magnitude of the value may be determined according to the technical field corresponding to the IPC.
  • a single patent or invention in the pharmaceutical field can be considered more valuable than a single patent or invention in a household electrical appliance.
  • a value larger than the IPC of the electric device may be associated.
  • the determination of the value according to the technical field is not limited to IPC.
  • the correspondence between non-numeric document attribute information indicating other technical fields and numerical document attribute information It can be applied.
  • the correspondence information is, for example, shown in FIG. In Figure 23, the non-numeric document attribute information “Company A” has the numerical information “Capital: 100 million yen”, “Sales: 200 million yen”, “Ordinary income: 20 million yen”, “Employee: 100 people ". Therefore, the document attribute information digitizing unit 51 refers to the correspondence information, and is associated with the non-numeric document attribute information “Applicant: Company A” stored in the document attribute information storage unit 14. It is possible to obtain numerical information such as “Capital: ⁇ 100 million”. And those numerical information " By substituting “capital: 100 million yen” etc. as the number of bow I in a predetermined formula, the value of that formula can be obtained. Then, the calculated value of the expression is stored in the document attribute information storage unit 14 as numerical document attribute information corresponding to the document attribute information “Company A”.
  • the predetermined formula may be, for example, a formula having a larger value as the applicant has a larger scale, or a larger value as the applicant having an efficient management. It may be an expression. In the former case, for example, the predetermined formula may be an increase function related to capital, sales, or the like. In the latter case, for example, the predetermined formula may be an increasing function related to sales per employee or recurring profit per employee.
  • the sales in the correspondence information may be, for example, the sales of the entire company, or sales of products using the invention indicated by the corresponding patent document information in the document attribute information.
  • the document attribute information numerical value section 51 converts the non-numeric document attribute information into numerical information using the correspondence information, and substitutes the numerical information as an argument of a predetermined expression. In this way, numerical document attribute information may be calculated.
  • digitization correspondence information and correspondence information shown in FIG. 22 and FIG. 23 are examples, and can be used to convert non-numeric document attribute information into numeric document attribute information. Needless to say, it may be other numerical correspondence information or other correspondence information.
  • the document attribute information digitizing unit 51 performs numeric value conversion using the digitization correspondence information shown in FIG. 22, the correspondence information shown in FIG. 23, and the like.
  • the document attribute information digitizing unit 51 can digitize and store non-numeric values of the document attribute information stored in the document attribute information storage unit 14 in the document attribute information storage unit 14.
  • the specific digitization process may be performed at a place other than the document attribute information digitization unit 51. For example, in a predetermined server or the like that can be accessed by the document attribute information numerical value section 51, numerical conversion using numerical conversion correspondence information or numerical expression using a predetermined formula may be performed.
  • the document attribute information digitizing unit 51 transmits non-numeric document attribute information to the predetermined server, and in response to the transmission, Digitization may be performed by receiving numerical document attribute information transmitted from a predetermined sano.
  • Digitization correspondence information, or correspondence information and information indicating a predetermined expression are held in a recording medium, and those information is used to convert non-numeric document attribute information into numeric document attribute information. To do.
  • the document attribute information digitizing unit 51 uses only the document attribute information stored in the document attribute information storage unit 14, and the sample document stored in the sample document attribute information storage unit 15.
  • the attribute information may also be digitized.
  • the document attribute information digitizing unit 51 stores the sample document attribute information stored in the sample document attribute information storage unit 15 in the sample document attribute information storage unit 15 as non-numeric values. Also good.
  • the document attribute information numerical value part 51 performs numerical values on the sample document attribute information
  • the numerical document correspondence information is used to convert the non-numeric sample document attribute information to the numerical sample document attribute information.
  • the non-numeric sample document attribute information is regarded as non-numeric document attribute information
  • the numeric sample document attribute information is regarded as numeric document attribute information
  • digitization support information is used. Quantification may be performed.
  • the document attribute information numerical value unit 51 may perform numerical values of sample document attribute information that is not a numerical value by performing a calculation using a predetermined formula. In the digitization of document attribute information, since it is not determined which document attribute information is used to calculate patent value information and the like, it is considered difficult to perform numerical values manually in advance. On the other hand, since the amount of sample document attribute information is determined in advance in the numerical value of the sample document attribute information, the numerical value is manually input before using the document attribute information numerical value part 51. May be. However, it goes without saying that the document attribute information can be digitized manually.
  • the document attribute information storage unit 13 stores the document attribute information in the document attribute information storage unit 14
  • the document attribute information storage unit 14 stores the document attribute information in the document attribute information storage unit 14.
  • the process in which attribute information is stored does not matter.
  • the information may be stored in the document attribute information storage unit 14 via a recording medium via a recording line. If the transmitted information may be stored in the document attribute information storage unit 14, the information input via the input device is stored in the document attribute information storage unit 14. Also good.
  • the document attribute information storage unit 13 stores the sample document attribute information in the sample document attribute information storage unit 15 .
  • the sample document attribute information storage unit The process of storing sample document attribute information in Fig. 15 does not matter. For example, information transmitted via a communication line or the like may be stored in the sample document attribute information storage unit 15 even if the information is stored in the sample document attribute information storage unit 15 via the recording medium. Or the information input via the input device may be stored in the sample document attribute information storage unit 15.
  • Embodiment 3 of the present invention calculates patent value information using sample patent characteristic information as teacher information instead of sample patent attribute information.
  • FIG. 15 is a block diagram showing a configuration of the information processing apparatus 3 according to the present embodiment.
  • the information processing apparatus 3 according to the embodiment includes a sample patent value information receiving unit 16, a sample patent value information accumulating unit 17, a sample patent value information storing unit 18, and a patent characteristic information receiving unit 31.
  • the patent characteristic information storage unit 32, the patent characteristic information storage unit 33, the sample patent characteristic information storage unit 34, the patent value information calculation unit 35, and the patent value information output unit 36 are provided.
  • the configurations and operations of the sample patent value information receiving unit 16, the sample patent value information accumulating unit 17, and the sample patent value information storing unit 18 are the same as those in the first embodiment, and the description thereof is omitted.
  • the patent characteristic information receiving unit 31 receives patent characteristic information.
  • the patent characteristic information is the same as the description in the second embodiment, and is information indicating the characteristics of the patent document information.
  • the patent characteristic information receiving unit 31 also receives sample patent characteristic information.
  • the sample patent characteristic information is the same as that described in the second embodiment, and is patent characteristic information used as teacher information.
  • the patent characteristic information receiving unit 31 is, for example, an input device (for example, (A keyboard, mouse, touch panel, etc.)
  • a predetermined recording medium for example, an optical disk or magnetic disk that can receive information sent via a wired or wireless communication line that accepts force information.
  • the patent characteristic information receiving unit 31 receives patent characteristic information input from an input device.
  • the patent characteristic information receiving unit 31 may or may not include a device for receiving (for example, a modem or a network card). Further, the patent characteristic information receiving unit 31 may be realized by hardware or may be realized by software such as a driver for driving a predetermined device.
  • the patent characteristic information accumulating unit 32 accumulates the patent characteristic information received by the patent characteristic information receiving unit 31 in the patent characteristic information storage unit 33. Further, the patent characteristic information accumulating unit 32 accumulates the sample patent characteristic information received by the patent characteristic information receiving unit 31 in the sample patent characteristic information storage unit 34.
  • the patent characteristic information storage unit 33 stores patent characteristic information.
  • the storage in the patent characteristic information storage unit 33 may be temporary storage in a RAM or the like, or may be long-term storage in a flash memory or a magnetic disk, for example.
  • the patent characteristic information storage unit 33 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).
  • the sample patent characteristic information storage unit 34 stores sample patent characteristic information.
  • the sample patent characteristic information stored in the sample patent characteristic information storage unit 34 corresponds to the sample patent value information stored in the sample patent value information storage unit 18.
  • the storage in the sample patent characteristic information storage unit 34 may be temporary storage in a RAM or the like, or may be long-term storage in a flash memory or a magnetic disk, for example.
  • the sample patent characteristic information storage unit 34 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.).
  • the patent value information calculation unit 35 calculates patent value information indicating the value of the patent document information corresponding to the patent characteristic information from the patent characteristic information stored in the patent characteristic information storage unit 33.
  • the patent value information calculation unit 35 is stored in the sample patent characteristic information storage unit 34.
  • the patent value of the first embodiment is calculated except that the patent value information is calculated from the patent characteristic information using the sample patent characteristic information and the sample patent value information stored in the sample patent value information storage unit 18 as teacher information. This is the same as the information calculation unit 19, and its description is omitted.
  • the patent value information output unit 36 outputs the patent value information calculated by the patent value information calculation unit 35.
  • the patent value information output unit 36 is the same as the patent value information output unit 20 of the first embodiment, and a description thereof will be omitted.
  • any two or more storage units of the sample patent value information storage unit 18, the patent characteristic information storage unit 33, and the sample patent characteristic information storage unit 34 may be realized by the same recording medium. Alternatively, it may be realized by a separate recording medium.
  • steps S 101 and S 102 is the same as that in the flowchart of FIG. 2 of the first embodiment, and a description thereof will be omitted.
  • Step S301 The patent characteristic information receiving unit 31 determines whether it has received the patent characteristic information or the sample patent characteristic information. If patent characteristic information or the like is received, the process proceeds to step S302, and if not, the process proceeds to step S303.
  • Step S302 When the patent characteristic information receiving unit 31 receives the patent characteristic information, the patent characteristic information accumulating unit 32 accumulates the patent characteristic information in the patent characteristic information storage unit 33. When the patent characteristic information receiving unit 31 receives the sample patent characteristic information, the patent characteristic information accumulating unit 32 accumulates the sample patent characteristic information in the sample patent characteristic information storing unit 34. Then, the process returns to step S101.
  • Step S 303 The patent value information calculation unit 35 determines whether to calculate patent value information. If the patent value information is calculated, the process proceeds to step S304. If not, the process returns to step S101.
  • the timing at which the patent value information calculation unit 35 determines to calculate the patent value information does not matter. For example, it may be determined that the patent value information is calculated using a trigger of a predetermined event (for example, an instruction to calculate the patent value information is received) as a trigger.
  • the patent value information calculation unit 35 includes a sample patent characteristic information storage unit 34. From the patent characteristic information stored in the patent characteristic information storage unit 33, the sample patent characteristic information stored in the sample patent value information storage unit 18 and stored in the patent characteristic information storage unit 33 as teacher information. Calculate patent value information.
  • Step S 305 The patent value information output unit 20 uses the patent value information calculated by the patent value information calculation unit 35 weekly. Then, the process returns to step S101.
  • the operation of the information processing apparatus 3 according to this embodiment will be described using a specific example.
  • the information processing apparatus 3 is a stand-alone PC as in the above specific example.
  • sample patent value information is received and accumulated in the sample patent value information storage unit 18 in the same manner as in the specific example of the first embodiment (steps S101 and S102). It is assumed that the sample patent value information stored in the sample patent value information storage unit 18 is as shown in FIG.
  • the patent characteristic information and the sample patent characteristic information are received by the patent characteristic information receiving unit 31, and the patent characteristic information storage unit 33 and the sample patent characteristic information storage unit 34 are received.
  • the patent characteristic information stored in the patent characteristic information storage unit 33 is shown in FIG. 17, and the sample patent characteristic information stored in the sample patent characteristic information storage unit 34 is shown in FIG. Suppose that it is a life.
  • the user operates the mouse on the screen similar to that shown in FIG. 7 of the first embodiment and clicks the radio button on the left side of the patent document ID “P1999-111111” to display the patent document ID. It is assumed that the patent document information identified by “ ⁇ 1999-111111” is selected. Then, the user clicks the “OK” button by operating the mouse. Then, the patent characteristic information calculation unit 24 determines that it has received an instruction to calculate patent characteristic information for the patent document information identified by the patent document ID ⁇ 1999-111111 (step S303). Then, the patent value information calculation unit 35 reads the sample patent characteristic information as the teacher information from the sample patent characteristic information storage unit 34 and reads the sample patent value information storage unit 18. The sample patent value information as teacher information is read out.
  • the patent value information calculation unit 35 converts the information into a format that is read into the support vector machine in the same manner as in FIG. 10 of the first embodiment.
  • the patent value information calculation unit 35 reads the patent characteristic information of the patent document information for calculating the patent value information from the patent characteristic information storage unit 33, reads the teacher information, and uses the support vector machine to convert the patent characteristic information into the read patent characteristic information. Calculate the corresponding patent value information.
  • the support vector machine used here performs multi-class class classification. Here, it is assumed that the patent value “70” of the patent document information identified by the patent document ID “P1999-111111” is calculated (step S304). Then, the patent value information output unit 36 displays the calculated patent value information on the display of the information processing device 3 as in FIG. 11 of the first embodiment (step S 305). In this way, the user can know the patent value information.
  • the patent value information calculation unit 35 uses the sample patent characteristic information and the sample patent value information as teacher information, so that desired patent document information is obtained. It is possible to calculate patent value information indicating the value of. In this way, since the patent value information is calculated using the teacher information, the patent value can be calculated in consideration of the user's subjective evaluation factors. On the other hand, it is not necessary to perform a complicated operation for setting an expression that does not require a complicated expression for calculating patent value information for each user.
  • patent characteristic information and the sample patent characteristic information are determined by the user and the values are received by the reception unit.
  • the patent characteristic information and the sample characteristic information are described.
  • the patent characteristic information may be determined mechanically by a predetermined process. For example, as described in Patent Document 1 above, patent characteristic information or the like is calculated using a predetermined formula, and the calculated patent characteristic information or the like is used in an information processing apparatus. Well ...
  • the patent characteristic information includes the invention essential extraction characteristic, the toughness characteristic, the invention development characteristic, and the practicable security characteristic. It may be information indicating one or more characteristics of patent document information selected from the group of extraction characteristics, toughness characteristics, invention development characteristics, and practicable collateral characteristics. Snow In other words, the patent characteristic information may be any one or more information of the invention essential extraction characteristic, the toughness characteristic, the invention development characteristic, and the practicable collateral characteristic. The same applies to sample patent characteristic information.
  • the force described in the case where multi-class classification is performed by the support vector machine may be performed, and binary class classification and real value output may be performed by the support vector machine.
  • patent document information can be classified into valuable patent document information and non-worthy patent document information.
  • patent document information corresponding to patents that have been successfully negotiated and exercised are licensed as valuable patent document information.
  • Patent document information corresponding to patents that have failed to be negotiated or enforced can be used as valuable document information! ⁇ .
  • sample patent value information, patent characteristic information, sample patent characteristic information, and the like are received by the receiving unit and stored in the storage unit.
  • a removable storage unit stored in advance may be attached to the information processing apparatus, so that a storage unit storing such information may be configured.
  • patent value information and the like may be calculated by a method. For example, it is assumed that the formula of patent value information is determined as follows.
  • the values of the coefficients Al to A17 may be calculated using the sample patent value information and the sample document attribute information.
  • Patent value information may be calculated by calculating a value and substituting document attribute information using the coefficient value.
  • the attribute correlated with the patent value information may be used. For example, for each attribute included in the sample document attribute information (for example, the number of claims and the number of independent claims), a set of attribute values and the corresponding sample patent value information values The correlation coefficient between the sets is calculated.
  • the attribute may be used as a variable in the above-mentioned patent value information formula.
  • a predetermined threshold value for example, 0.5
  • the attribute may be used as a variable in the above-mentioned patent value information formula.
  • the patent value information and the patent characteristic information are calculated and output as numerical values.
  • the numerical values are converted into qualitative indicators. May be. For example, if the patent value information is calculated in five stages from 1 to 5, if the patent value information is “5”, the patent value information “high” is output, and if the patent value information is “4”, The patent value information “slightly high” may be output, and in the case of the patent value information “3”, the patent value information “medium” may be output.
  • patent document information includes information other than those described in the above embodiments, for example, rejection. It may contain information on documents that can be included in the wrapping of the application, such as a notice of reason, written opinion, request for appeal, etc. It may also contain the number of times cited in the reasons for refusal of other patent applications. In addition, if the patent document information includes such information, the document attribute information indicates the information included in the information, for example, the number of times cited in the reason for refusal of other patent applications, the number of notifications of reasons for refusal, etc. Include.
  • the calculated value of the support vector machine or the like may be normalized.
  • a value represented by any integer from 0 to 150 may be normalized to a value from 0 to 100.
  • the information processing apparatus is a stand-alone.
  • the information processing apparatus may be a stand-alone apparatus. It can be a device!
  • each process or each function may be realized by centralized processing by a single device or a single system, or a plurality of devices or a plurality of systems. It may be realized by being distributedly processed.
  • each component may be configured by dedicated hardware, or a component that can be realized by software may be realized by executing a program.
  • each component can be realized by a program execution unit such as a CPU reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory.
  • the software that realizes the information processing apparatus in the above embodiment is the following program.
  • this program is information acquired from patent document information, which is information related to a patent document, stored in the document attribute information storage unit in the computer, and is information indicating the attribute of the patent document information.
  • the sample document attribute information storage unit stores the sample document attribute information, which is the document attribute information used as teacher information
  • the sample patent value information storage unit stores the sample attribute information.
  • Document attribute information Information corresponding to sample document attribute information stored in the storage unit, and used as teacher information, which is information indicating the value of patent document information and sample patent value information.
  • Patents that calculate patent value information, which is information indicating value A value information calculation step and a patent value information output step for outputting the patent value information calculated in the patent value information calculation step are executed.
  • the other software that realizes the information processing apparatus in the above embodiment is the following program.
  • this program is information acquired from patent document information, which is information related to a patent document, stored in the document attribute information storage unit in the computer, and indicates the attribute of the patent document information.
  • the sample document attribute information storage unit stores the sample document attribute information, which is stored in the sample document attribute information storage unit and is used as teacher information, and the sample patent property information storage unit. !
  • sample patent characteristic information which is information indicating one or more characteristics of patent document information, selected from the group of practicable collateral characteristics that are characteristics indicating the degree of
  • the other software realizing the information processing apparatus in the above embodiment is the following program.
  • this program is stored in the computer by the patent characteristic information storage unit! /,
  • the extent to which the essence of the invention can be extracted from the patent document information which is information related to the patent document!
  • the toughness characteristics and patent document information are characteristics indicating the degree to which the invention application is rejected or the invention patent is invalidated.
  • the invention development characteristics which are characteristics indicating the degree to which the invention is developed, and the practicable security characteristics, which are characteristics indicating the degree to which the invention is described as being feasible in the patent document information.
  • Group power is selected from patent characteristic information, which is information indicating one or more characteristics of patent document information.
  • the sample patent characteristic information storage unit stores the sample patent characteristic information which is patent characteristic information used as teacher information, and the sample patent characteristic information storage unit stores the sample patent characteristic information.
  • Patent information that indicates the value of the patent document information, using the sample patent value information as the teacher information and the information corresponding to the sample patent characteristic information to be used and the information indicating the value of the patent document information used as the teacher information
  • a patent value information calculating step for calculating value information and a patent value information outputting step for outputting the patent value information calculated in the patent value information calculating step are executed.
  • this program is recorded on a predetermined recording medium (for example, an optical disk such as a CD-ROM, a magnetic disk, a semiconductor memory, etc.) that can be executed by force downloading such as a server.
  • a predetermined recording medium for example, an optical disk such as a CD-ROM, a magnetic disk, a semiconductor memory, etc.
  • the program may be executed by being read.
  • the computer that executes this program may be singular or plural. That is, centralized processing or distributed processing may be performed.
  • FIG. 1 is a block diagram showing a configuration of an information processing device according to Embodiment 1 of the present invention.
  • FIG. 2 is a flowchart showing the operation of the information processing apparatus according to the embodiment
  • FIG. 3 is a diagram showing an example of correspondence between a patent document ID and patent document information in the embodiment.
  • FIG. 4 is a diagram showing an example of patent document information in the embodiment.
  • ⁇ 5] Schematic diagram showing an example of the appearance of the information processing apparatus according to the embodiment
  • ⁇ 6] Diagram showing an example of sample patent value information in the embodiment
  • FIG. 7 A schematic diagram showing an example of the appearance of the information processing apparatus according to the embodiment.
  • ⁇ 8 A diagram showing an example of document attribute information in the embodiment.
  • FIG. 11 Schematic diagram showing an example of the appearance of the information processing device according to the embodiment ⁇ 12] Block diagram showing the configuration of the information processing device according to the second embodiment of the present invention ⁇ 13] Information processing device according to the embodiment 14] A diagram showing an example of sample patent characteristic information in the same embodiment. [15] A block diagram showing a configuration of the information processing apparatus according to the third embodiment of the present invention. [16] According to the same embodiment. Flowchart showing the operation of the information processing apparatus ⁇ 17] A diagram showing an example of patent characteristic information in the embodiment
  • FIG. 18 is a block diagram showing a configuration of an information processing apparatus according to another embodiment.
  • FIG. 19 is a flowchart showing the operation of the information processing apparatus according to another embodiment.
  • FIG. 20 is a block diagram showing the configuration of the information processing apparatus according to another embodiment.
  • FIG. 21 A block diagram showing the configuration of an information processing apparatus according to another embodiment.
  • ⁇ 22 A diagram showing an example of numerical information correspondence information in another embodiment.
  • ⁇ 23 Correspondence information in other embodiments. Figure showing an example

Landscapes

  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】各ユーザの主観的な評価の要素を考慮した特許の価値の算出を行う。 【解決手段】特許の文書に関する情報である特許文書情報から取得された情報であって、当該特許文書情報の属性を示す情報である文書属性情報が記憶される文書属性情報記憶部14と、教師情報として用いられる文書属性情報であるサンプル文書属性情報が記憶されるサンプル文書属性情報記憶部15と、サンプル文書属性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル特許価値情報が記憶されるサンプル特許価値情報記憶部18と、サンプル文書属性情報と、サンプル特許価値情報とを教師情報として、文書属性情報から、特許文書情報の価値を示す情報である特許価値情報を算出する特許価値情報算出部19と、特許価値情報を出力する特許価値情報出力部20と、を備える。

Description

情報処理装置、及び情報処理方法
技術分野
[0001] 本発明は、特許価値情報や特許特性情報を算出する情報処理装置等に関する。
背景技術
[0002] 従来、特許の価値を算出する場合に、所定の式を決定し、その式に基づいて特許 の価値を算出することが行われていた (例えば、特許文献 1参照)。
特許文献 1:国際公開第 2004Z038628号パンフレット
発明の開示
発明が解決しょうとする課題
[0003] し力しながら、特許の価値には主観的な評価の要素が存在するため、評価を行うュ 一ザに応じて、特許の価値を算出するための式が異なる場合が多い。すなわち、ュ 一ザは主観的な評価を行うのが一般的である。したがって、ユーザごとに特許の価値 を算出するための式を変更しなければならず、その式を変更するための煩雑な作業 を行わなければならな 、と 、う問題があった。
[0004] 本発明は、上記課題を解決するためになされたものであり、ユーザごとに特許の価 値等を算出するための式を設定するという煩雑な作業を行うことなぐ各ユーザの主 観的な評価の要素を考慮した特許の価値等の算出を行うことができる情報処理装置 等を提供することを目的とする。
課題を解決するための手段
[0005] 上記目的を達成するため、本発明による情報処理装置は、特許の文書に関する情 報である特許文書情報から取得された情報であって、当該特許文書情報の属性を 示す情報である文書属性情報が記憶される文書属性情報記憶部と、教師情報として 用いられる文書属性情報であるサンプル文書属性情報が記憶されるサンプル文書 属性情報記憶部と、前記サンプル文書属性情報記憶部で記憶されるサンプル文書 属性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値 を示す情報であるサンプル特許価値情報が記憶されるサンプル特許価値情報記憶 部と、前記サンプル文書属性情報記憶部が記憶して!/、るサンプル文書属性情報と、 前記サンプル特許価値情報記憶部が記憶しているサンプル特許価値情報とを教師 情報として、前記文書属性情報記憶部が記憶している文書属性情報から、特許文書 情報の価値を示す情報である特許価値情報を算出する特許価値情報算出部と、前 記特許価値情報算出部が算出した特許価値情報を出力する特許価値情報出力部 と、を具備するものである。
[0006] このような構成により、ユーザごとに特許の価値を算出するための式を設定するとい う煩雑な作業を行うことなぐ特許文書情報の文書属性情報から、各ユーザの主観的 な評価の要素を考慮した特許の価値を算出することができる。
[0007] また、本発明による情報処理装置では、前記特許価値情報算出部は、サポートべ クタ一マシンにより特許価値情報を算出してもよい。
このような構成により、サポートベクターマシンを用いて特許価値情報を算出するこ とができ、未学習データに対して高い汎化性能を得ることができる。
[0008] また、本発明による情報処理装置は、特許の文書に関する情報である特許文書情 報から取得された情報であって、当該特許文書情報の属性を示す情報である文書 属性情報が記憶される文書属性情報記憶部と、教師情報として用いられる文書属性 情報であるサンプル文書属性情報が記憶されるサンプル文書属性情報記憶部と、前 記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する情 報であり、教師情報として用いられる、特許文書情報において発明の本質を抽出して いる程度を示す特性である発明本質抽出特性、特許文書情報において、発明にか 力る出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程度を示す 特性である強靱特性、特許文書情報にお!ヽて発明を展開して!/ヽる程度を示す特性 である発明展開特性、及び特許文書情報において発明について実施可能に記載さ れて ヽる程度を示す特性である実施可能担保特性の群から選ばれる、特許文書情 報の 1以上の特性を示す情報であるサンプル特許特性情報が記憶されるサンプル特 許特性情報記憶部と、前記サンプル文書属性情報記憶部が記憶して 、るサンプル 文書属性情報と、前記サンプル特許特性情報記憶部が記憶して!/、るサンプル特許 特性情報とを教師情報として、前記文書属性情報記憶部が記憶して!/、る文書属性 情報から、特許文書情報の特性を示す情報である特許特性情報を算出する特許特 性情報算出部と、前記特許特性情報算出部が算出した特許特性情報を出力する特 許特性情報出力部と、を具備するものである。
[0009] このような構成により、ユーザごとに特許の特性を算出するための式を設定するとい う煩雑な作業を行うことなぐ特許文書情報の文書属性情報から、各ユーザの主観的 な評価の要素を考慮した特許の特性を算出することができる。
[0010] また、本発明による情報処理装置では、前記特許特性情報算出部は、サポートべ クタ一マシンにより特許特性情報を算出してもよい。
このような構成により、サポートベクターマシンを用いて特許特性情報を算出するこ とができ、未学習データに対して高い汎化性能を得ることができる。
[0011] また、本発明による情報処理装置では、 1以上の特許文書情報が記憶される特許 文書情報記憶部と、前記特許文書情報記憶部が記憶して!/、る特許文書情報から文 書属性情報を取得する文書属性情報取得部と、前記文書属性情報取得部が取得し た文書属性情報を前記文書属性情報記憶部に蓄積する文書属性情報蓄積部と、を さらに具備してもよい。
[0012] このような構成により、特許文書情報から文書属性情報を取得し、その文書属性情 報から、特許価値情報や特許特性情報等を算出することができる。したがって、文書 属性情報取得部が取得した文書属性情報については、ユーザ等が手入力等によつ て入力する必要がなぐユーザ等の負担が軽減されている。
[0013] また、本発明による情報処理装置では、前記特許文書情報記憶部では、前記サン プル文書属性情報を算出するための特許文書情報であるサンプル特許文書情報も 記憶され、前記文書属性情報取得部は、前記サンプル特許文書情報からサンプル 文書属性情報を取得し、前記文書属性情報蓄積部は、前記文書属性情報取得部が 算出したサンプル文書属性情報を前記サンプル文書属性情報記憶部に蓄積しても よい。
[0014] このような構成により、サンプル文書属性情報も、前述の文書属性情報と同様に、 特許文書情報から取得することができ、そのサンプル文書属性情報を用いて、特許 価値情報や特許特性情報を算出することができる。したがって、文書属性情報取得 部が取得したサンプル文書属性情報については、ユーザ等が手入力等によって入 力する必要がなぐユーザ等の負担が軽減されている。
[0015] また、本発明による情報処理装置は、特許の文書に関する情報である特許文書情 報において発明の本質を抽出している程度を示す特性である発明本質抽出特性、 特許文書情報において、発明にかかる出願が拒絶される程度、あるいは、発明にか カゝる特許が無効になる程度を示す特性である強靱特性、特許文書情報にぉ ヽて発 明を展開して ヽる程度を示す特性である発明展開特性、及び特許文書情報にぉ ヽ て発明につ ヽて実施可能に記載されて ヽる程度を示す特性である実施可能担保特 性の群から選ばれる、特許文書情報の 1以上の特性を示す情報である特許特性情 報が記憶される特許特性情報記憶部と、教師情報として用いられる特許特性情報で あるサンプル特許特性情報が記憶されるサンプル特許特性情報記憶部と、前記サン プル特許特性情報記憶部で記憶されるサンプル特許特性情報に対応する情報であ り、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル特 許価値情報が記憶されるサンプル特許価値情報記憶部と、前記サンプル特許特性 情報記憶部が記憶して 、るサンプル特許特性情報と、前記サンプル特許価値情報 記憶部が記憶して ヽるサンプル特許価値情報とを教師情報として、前記特許特性情 報記憶部が記憶して!/、る特許特性情報から、特許文書情報の価値を示す情報であ る特許価値情報を算出する特許価値情報算出部と、前記特許価値情報算出部が算 出した特許価値情報を出力する特許価値情報出力部と、を具備するものである。
[0016] このような構成により、ユーザごとに特許の価値を算出するための式を設定するとい う煩雑な作業を行うことなぐ特許特性情報から、各ユーザの主観的な評価の要素を 考慮した特許の価値を算出することができる。
[0017] また、本発明による情報処理装置では、前記特許価値情報算出部は、サポートべ クタ一マシンにより特許価値情報を算出してもよい。
このような構成により、サポートベクターマシンを用いて特許価値情報を算出するこ とができ、未学習データに対して高い汎化性能を得ることができる。
[0018] また、本発明による情報処理装置では、前記サポートベクターマシンは、多クラスの クラス分類を行うものであってもよ 、。 このような構成により、特許の価値や特許の特性を 3以上のクラスに分類することが でさうる。
[0019] また、本発明による情報処理装置では、前記サポートベクターマシンは、実数値を 出力とするものであってもよい。
このような構成により、特許の価値や特許の特性を実数値で算出することができうる
[0020] また、本発明による情報処理装置では、前記サポートベクターマシンは、 2値のクラ ス分類を行うものであってもよ 、。
このような構成により、特許の価値や特許の特性を 2値に分類することができ、例え ば、特許文書情報を特許の価値が高いもの、低いものに分類してもよぐあるいは、 特許文書情報を特許の特性 (例えば、発明本質抽出特性など)が高いもの、低いも のに分類してもよい。
[0021] また、本発明による情報処理装置では、前記文書属性情報記憶部で記憶されて 、 る文書属性情報のうち、数値でないものを数値化して前記文書属性情報記憶部に蓄 積する文書属性情報数値ィ匕部をさらに備えてもょ 、。
このような構成により、数値でない文書属性情報を、数値の文書属性情報に数値ィ匕 することができる。その結果、例えば、特許価値情報算出部や、特許特性情報算出 部が数値の文書属性情報を用いて特許価値情報等の算出を行う場合に、より多くの 文書属性情報を用いて特許価値情報等を算出できることとなり、より適切な特許価値 情報等の算出を行うことができるようになりうる。
[0022] また、本発明による情報処理装置では、前記文書属性情報数値化部は、非数値の 文書属性情報と、数値の文書属性情報とを対応付けて有する情報である数値化対 応情報を記録媒体において保持しており、前記数値化対応情報を用いて、数値でな V、文書属性情報を数値の文書属性情報に変換してもよ!、。
このような構成により、数値ィ匕対応情報を用いて、数値でない文書属性情報の数値 化を行うことができる。数値ィ匕対応情報を用いた数値ィ匕では、非数値の文書属性情 報と、数値の文書属性情報との対応付けを任意に設定することができるため、より適 切な対応関係となるように設定することによって、より適切な特許価値情報等の算出 を行うことができるようになりうる。
[0023] また、本発明による情報処理装置では、前記分所属性情報数値化部は、前記サン プル文書属性情報記憶部で記憶されて!、るサンプル文書属性情報のうち、数値で ないものを数値ィ匕して前記サンプル文書属性情報記憶部に蓄積してもよい。
このような構成により、数値でないサンプル文書属性情報を、数値のサンプル文書 属性情報に数値ィ匕することができる。
発明の効果
[0024] 本発明による情報処理装置等によれば、ユーザ等が特許の価値等を算出するため の式を設定することなぐ特許の価値等の算出を行うことができる。
発明を実施するための最良の形態
[0025] 以下、本発明による情報処理装置について、実施の形態を用いて説明する。なお
、以下の実施の形態において、同じ符号を付した構成要素及びステップは同一また は相当するものであり、再度の説明を省略することがある。
[0026] (実施の形態 1)
本発明の実施の形態 1による情報処理装置について、図面を参照しながら説明す る。
図 1は、本実施の形態による情報処理装置 1の構成を示すブロック図である。図 1に おいて、本実施の形態による情報処理装置 1は、特許文書情報記憶部 11と、文書属 性情報取得部 12と、文書属性情報蓄積部 13と、文書属性情報記憶部 14と、サンプ ル文書属性情報記憶部 15と、サンプル特許価値情報受付部 16と、サンプル特許価 値情報蓄積部 17と、サンプル特許価値情報記憶部 18と、特許価値情報算出部 19と 、特許価値情報出力部 20とを備える。
[0027] 特許文書情報記憶部 11では、 1以上の特許文書情報が記憶される。ここで、特許 文書情報とは、特許の文書に関する情報である。特許文書情報は、例えば、特許庁 等によって公開される特許公開公報や特許公報の情報であってもよく、特許庁への 電子出願時に用いられる明細書等を示す情報であってもよい。一の特許文書情報が 、一の特許出願、あるいは一の特許に対応する情報であるとする。特許文書情報は 、例えば、 1以上の請求項を含む特許請求の範囲を示す情報、 1以上の実施の形態 を含む明細書を示す情報、要約書を示す情報、出願人や国際特許分類、出願番号 等の出願の書誌的事項を示す情報などの任意の 2以上の情報を含むものであっても よい。特許文書情報は、例えば、キーボードやマウス、タブレット、タツチパネルなどの 入力デバイスを用いて入力された情報であってもよぐあるいは、紙媒体に印刷され た公報等を光学的にスキャナで読み取り、その読み取った画像データに対して OCR ソフトウェアを用いてテキスト変換された情報であってもよい。特許文書情報は、例え ば、テキストデータであってもよぐ HTML等のマークアップ言語のデータであっても よぐ XML等のメタ言語のデータであってもよぐ明細書等の情報を示すものであれ ば、そのデータ形式を問わない。特許文書情報記憶部では、 1以上のサンプル特許 文書情報が記憶されていてもよい。ここで、サンプル特許文書情報とは、後述するサ ンプル文書属性情報を取得するために用いられる特許文書情報であり、それ以外は 上述の特許文書情報と同様のものである。本実施の形態では、特許文書情報記憶 部 11でサンプル特許文書情報も記憶されているものとする。なお、特許文書情報と サンプル特許文書情報との違いは、後述するように、それらの情報がどのように用い られるカゝである。したがって、特許文書情報記憶部 11で記憶されている段階では、特 許文書情報とサンプル特許文書情報とを特に区別しなくてもよい。なお、両者を区別 して、例えば、特許文書情報を所定の領域に格納し、サンプル特許文書情報を他の 領域に格納するようにしてもょ 、。特許文書情報やサンプル特許文書情報が特許文 書情報記憶部 11で記憶される過程は問わない。例えば、記録媒体を介して特許文 書情報等が特許文書情報記憶部 11で記憶されるようになってもよぐ通信回線等を 介して送信された特許文書情報等が特許文書情報記憶部 11で記憶されるようにな つてもよく、あるいは、入力デバイスを介して入力された特許文書情報等が特許文書 情報記憶部 11で記憶されるようになってもよい。特許文書情報記憶部 11は、所定の 記録媒体 (例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されう る。
文書属性情報取得部 12は、特許文書情報記憶部 11が記憶して!/、る特許文書情 報から文書属性情報を取得する。ここで、文書属性情報とは、特許文書情報から取 得された情報であって、その特許文書情報の属性を示す情報である。文書属性情報 を取得するとは、例えば、特許文書情報から特許文書情報の一部の情報を文書属 性情報として単に読み出すことであってもよぐ特許文書情報に対する形態素解析や 、所定の情報の数のカウントなどの処理、あるいは、その他の処理等を実行して、文 書属性情報を算出することであってもよい。文書属性情報の具体例と、その取得の 方法については後述する。特許文書情報記憶部 11がサンプル特許文書情報も記憶 している場合に、文書属性情報取得部 12は、そのサンプル特許文書情報力もサン プル文書属性情報を取得してもよい。サンプル文書属性情報とは、教師情報として 用いられる文書属性情報であり、それ以外は上述の文書属性情報と同様のものであ る。
[0029] 文書属性情報蓄積部 13は、文書属性情報取得部 12が取得した文書属性情報を 文書属性情報記憶部 14に蓄積する。また、文書属性情報取得部 12がサンプル文 書属性情報も取得した場合には、そのサンプル文書属性情報をサンプル文書属性 情報記憶部 15に蓄積する。
[0030] 文書属性情報記憶部 14では、文書属性情報が記憶される。文書属性情報記憶部 14での記憶は、例えば、 RAM等における一時的な記憶でもよぐあるいは、フラッシ ュメモリや磁気ディスク等における長期的な記憶でもよい。文書属性情報記憶部 14 は、所定の記録媒体 (例えば、半導体メモリや磁気ディスク、光ディスクなど)によって 実現されうる。
[0031] サンプル文書属性情報記憶部 15では、サンプル文書属性情報が記憶される。サン プル文書属性情報記憶部 15での記憶は、例えば、 RAM等における一時的な記憶 でもよぐあるいは、フラッシュメモリや磁気ディスク等における長期的な記憶でもよい 。サンプル文書属性情報記憶部 15は、所定の記録媒体 (例えば、半導体メモリゃ磁 気ディスク、光ディスクなど)によって実現されうる。
[0032] サンプル特許価値情報受付部 16は、サンプル特許価値情報を受け付ける。ここで 、サンプル特許価値情報とは、特許文書情報の価値を示す情報であり、サンプル文 書属性情報記憶部 15で記憶されるサンプル文書属性情報に対応する情報である。 すなわち、あるサンプル特許文書情報の価値を示すサンプル特許価値情報がサン プル特許価値情報受付部 16で受け付けられ、その同じサンプル特許文書情報から 取得されたサンプル文書属性情報がサンプル文書属性情報記憶部 15で記憶される ことになる。サンプル特許価値情報は、教師情報として用いられる。サンプル特許価 値情報受付部 16は、例えば、入力デバイス (例えば、キーボードやマウス、タツチパ ネルなど)力も入力された情報を受け付けてもよぐ有線もしくは無線の通信回線を介 して送信された情報を受信してもよぐ所定の記録媒体 (例えば、光ディスクや磁気デ イスク、半導体メモリなど)力も読み出された情報を受け付けてもよい。本実施の形態 では、サンプル特許価値情報受付部 16は、入力デバイスから入力されたサンプル特 許価値情報を受け付けるものとする。なお、サンプル特許価値情報受付部 16は、受 け付けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んでもよ ぐあるいは含まなくてもよい。また、サンプル特許価値情報受付部 16は、ハードゥエ ァによって実現されてもよぐあるいは所定のデバイスを駆動するドライバ等のソフトゥ エアによって実現されてもよ!、。
[0033] サンプル特許価値情報蓄積部 17は、サンプル特許価値情報受付部 16が受け付 けたサンプル特許価値情報をサンプル特許価値情報記憶部 18に蓄積する。
サンプル特許価値情報記憶部 18では、サンプル特許価値情報が記憶される。サン プル特許価値情報記憶部 18での記憶は、例えば、 RAM等における一時的な記憶 でもよぐあるいは、フラッシュメモリや磁気ディスク等における長期的な記憶でもよい 。サンプル特許価値情報記憶部 18は、所定の記録媒体 (例えば、半導体メモリゃ磁 気ディスク、光ディスクなど)によって実現されうる。
[0034] 特許価値情報算出部 19は、文書属性情報記憶部 14が記憶して 、る文書属性情 報から、その文書属性情報に対応する特許文書情報の価値を示す特許価値情報を 算出する。特許価値情報算出部 19は、教師あり学習(supervised learning)によ つて特許価値情報を算出する。特許価値情報算出部 19は、例えば、サポートベクタ 一マシン(SVM : Support Vector Machine)により特許価値情報を算出してもよ ぐそれ以外の方法を用いて特許価値情報を算出してもよい。本実施の形態では、 特許価値情報算出部 19は、サポートベクターマシンを用 、て特許価値情報を算出 するものとする。サポートベクターマシンについては、従来力も公知であるため、その 詳細な説明を省略する。特許価値情報算出部 19は、サンプル文書属性情報記憶部 15が記憶して 、るサンプル文書属性情報と、サンプル特許価値情報記憶部 18が記 憶して!/ヽるサンプル特許価値情報とを教師情報として、特許価値情報を算出する。 教師情報とは、教師あり学習において用いられる入力と出力とのペアの情報のことで ある。ここでは、サンプル文書属性情報が入力としての教師情報であり、サンプル特 許価値情報が出力としての教師情報である。サポートベクターマシンでは、教師情報 のことをトレーニングデータ(training data)と呼ぶこともある。なお、サポートベクタ 一マシンは、 2値のクラス分類を行うものであってもよぐ多クラス(3クラス以上)のクラ ス分類を行うものであってもよぐ実数値を出力とするものであってもよい。実数値を 出力する場合には、サポートベクター回帰(SVR: Support Vector Regression) と呼ばれることちあるが、ここでは、サポー卜ベクターマシンと呼ぶこと〖こする。
[0035] 特許価値情報出力部 20は、特許価値情報算出部 19が算出した特許価値情報を 出力する。ここで、この出力は、例えば、表示デバイス (例えば、 CRTや液晶ディスプ レイなど)への表示でもよぐ所定の機器への通信回線を介した送信でもよぐプリン タによる印刷でもよぐスピーカによる音声出力でもよぐ記録媒体への蓄積でもよい 。なお、特許価値情報出力部 20は、出力を行うデバイス (例えば、表示デバイスゃプ リンタなど)を含んでもよぐあるいは含まなくてもよい。また、特許価値情報出力部 20 は、ハードウェアによって実現されてもよぐあるいは、それらのデバイスを駆動するド ライバ等のソフトウェアによって実現されてもょ 、。
[0036] なお、特許文書情報記憶部 11と、文書属性情報記憶部 14と、サンプル文書属性 情報記憶部 15と、サンプル特許価値情報記憶部 18との任意の 2以上の記憶部は、 同一の記録媒体によって実現されてもよぐあるいは、別々の記録媒体によって実現 されてもよい。前者の場合には、例えば、特許文書情報を記憶している領域が特許 文書情報記憶部 11となり、文書属性情報を記憶して!/、る領域が文書属性情報記憶 部 14となり、サンプル文書属性情報を記憶している領域がサンプル文書属性情報記 憶部 15となり、サンプル特許価値情報を記憶して 、る領域がサンプル特許価値情報 記憶部 18となる。
[0037] ここで、文書属性情報につ!、て説明する。文書属性情報は、特許文書情報におけ る請求項の数、特許文書情報における独立形式の請求項の数、特許文書情報にお ける特許請求の範囲のカテゴリー数、特許文書情報における特許請求の範囲のネス トレベル、特許文書情報における特許請求の範囲の文字数、特許文書情報における 代表請求項の構成要素数、特許文書情報における代表請求項の読点の数、特許文 書情報における代表請求項の文字数、特許文書情報における代表請求項の単位情 報数、特許文書情報における代表請求項の前提部の文字数、特許文書情報におけ る代表請求項の特徴部の文字数、特許文書情報における代表請求項の前提部の単 位情報数、特許文書情報における代表請求項の特徴部の単位情報数、特許文書情 報における代表請求項の代表構成要素の文字数、特許文書情報における代表請求 項の代表構成要素の単位情報数、特許文書情報において引用されている特許文献 数、特許文書情報において引用されている非特許文献数、特許文書情報における 実施の形態の文字数、特許文書情報における実施の形態の単位情報数、特許文書 情報における実施の形態での例示の数、特許文書情報における実施の形態での外 延拡張表記の数、特許文書情報における実施の形態での数式の数、特許文書情報 における実施の形態での化学式の数、特許文書情報における図面数、特許文書情 報における構成を示す図の数、特許文書情報におけるフローチャートの数、特許文 書情報におけるデータ構造を示す図の数、特許文書情報における画面出力を示す 図の数、特許文書情報におけるハードウェア構成を示す図の数の群力 選ばれる、
1以上の属性を示す情報である。本実施の形態では、文書属性情報は、上記の全て の属性を示す情報であるとする。
ここで、文書属性情報取得部 12は、特許文書情報における請求項の数として、特 許請求の範囲における請求項の最も大きい番号を取得してもよい。例えば、 [請求項 5]等のタグの最も大きい番号が「5」であれば、請求項の数「5」を取得してもよい。文 書属性情報取得部 12は、特許文書情報における各請求項において、他の請求項を 引用していない、すなわち、他の請求項の番号が含まれない請求項の数をカウントし て独立形式の請求項の数を取得してもよい。文書属性情報取得部 12は、特許文書 情報における特許請求の範囲力 各請求項の発明の名称を取得し、その発明の名 称から各請求項のカテゴリーを判断し、異なるカテゴリー数をカウントすることにより、 特許請求の範囲のカテゴリー数を取得してもよい。カテゴリーとは、例えば、装置、方 法、プログラム等である。 日本国特許法では、プログラムは装置のカテゴリーに入るこ ととなつているため、装置のカテゴリーと判断してもよぐあるいは、別のカテゴリーで あると判断してもよい。各請求項から発明の名称を取得する方法としては、各請求項 の末尾の単語を取得する方法がある。発明の名称力もカテゴリーを判断する方法とし ては、発明の名称の語尾が「プログラム」であればプログラムのカテゴリーであると判 断し、発明の名称の語尾が「方法」であれば方法のカテゴリーであると判断し、それ以 外であれば装置のカテゴリーであると判断してもよ!/、。特許請求の範囲のネストレべ ルとは、特許請求の範囲における請求項の階層の深さのことである。例えば、特許請 求の範囲に請求項 1から請求項 3までがあり、請求項 2が請求項 1に従属しており、請 求項 3が請求項 2に従属している場合には、特許請求の範囲のネストレベルは 3とな る。なお、ネストレベルは、特許請求の範囲の階層の深さのうち、最も深いものの値で あるとする。文書属性情報取得部 12は、各請求項からその請求項の従属している請 求項を特定することを独立形式の請求項まで繰り返すことにより、各請求項の階層の 深さを算出する。例えば、先の例の場合には、請求項 1の階層の深さは「1」となり、請 求項 2の階層の深さは「2」となり、請求項 3の階層の深さは「3」となる。文書属性情報 取得部 12は、その階層の深さのうち、一番深いもの(先の例では「3」)を、ネストレべ ルとして取得してもよい。
文書属性情報取得部 12は、特許文書情報における特許請求の範囲の領域を特定 し、その領域の文字数をカウントすることによって特許請求の範囲の文字数を取得し てもよい。ここで、文字数をカウントする方法は従来力 公知であり、その説明を省略 する。文書属性情報取得部 12は、特許文書情報における代表請求項における構成 要素数をカウントし、そのカウント値を代表請求項の構成要素数として取得してもよ ヽ 。なお、代表請求項とは、特許請求の範囲における代表的な請求項のことであり、例 えば、 1番目の請求項 (請求項 1)でもよぐあるいは、装置の請求項のうち、最も番号 の小さい請求項でもよぐ文字数が最も少ない請求項でもよぐその他のルールによ つて特定される請求項でもよい。また、請求項において構成要素数をカウントする方 法としては、その請求項に含まれる「〜部」や、「〜手段」の個数を「部」や「手段」の前 に付く言葉が重複しないように選択し、その選択した個数をカウントする方法や、「〜 と、」といった構成要素を列挙するときに用いられる言葉の個数をカウントする方法な どがある。文書属性情報取得部 12は、特許文書情報における代表請求項の読点の 数を、その代表請求項における読点「、」「,」をカウントすることによって取得してもよ い。文書属性情報取得部 12は、特許文書情報における代表請求項の文字数を、そ の代表請求項の文字数をカウントすることによって取得してもよい。文書属性情報取 得部 12は、特許文書情報における代表請求項の単位情報数を、その代表請求項に ついて所定の解析を行って単位情報の数をカウントすることによって求めてもよい。こ こで、単位情報とは、単語、文節、形態素、自立語などである。所定の解析とは、例え ば、形態素解析等であり、文を単語、文節等の単位情報に分割する処理は従来から 公知であるため、その説明を省略する。文書属性情報取得部 12は、特許文書情報 における代表請求項の前提部の文字数を、その代表請求項の先頭の文字から、「〜 にお 、て」や「〜であって」等の前提部の最後の文字までの文字数をカウントすること によって取得してもよ 、。「にお 、て」や「であって」等の文字数を前提部の文字数に 含めるかどうかなどは任意である。文書属性情報取得部 12は、特許文書情報におけ る代表請求項の特徴部の文字数を、その代表請求項の「〜において」や「〜であって
」等の前提部の次の文字から、「〜を特徴とする」までの文字数をカウントすることによ つて取得してもよい。「を特徴とする」の文字数や、「を特徴とする」に続いて記載され る発明の名称等の文字数を特徴部の文字数に含めるかどうかは任意である。文書属 性情報取得部 12は、特許文書情報における代表請求項の前提部の単位情報数を、 前提部の文字数の場合と同様にして、形態素解析等を用いて単位情報数をカウント することによって取得してもよい。文書属性情報取得部 12は、特許文書情報におけ る代表請求項の特徴部の単位情報数を、特徴部の文字数の場合と同様にして、形 態素解析等を用いて単位情報数をカウントすることによって取得してもよい。文書属 性情報取得部 12は、特許文書情報における代表請求項の代表構成要素の文字数 を、代表請求項の代表構成要素の文字数をカウントすることによって取得してもよ 、 。ここで、代表構成要素とは、その請求項における代表的な構成要素のことであり、 例えば、特徴部に 1個の構成要素のみが存在する場合には、その構成要素を代表 構成要素としてもよい。また、発明の詳細な説明(明細書)の効果の記載を参照し、そ の記載で言及されている構成要素を代表構成要素としてもよい。効果の記載は、「発 明の効果」の欄の記載でもよぐ一般に「以上のように、」や「このように、」等に続けて 効果の記載がなされることが多いため、そのような導入句で始まるパラグラフの記載 を効果の記載とみなしてもよい。文書属性情報取得部 12は、請求項において、「〜 部」や「〜手段」と記載されて 、る「部」や「手段」を含む一連の単語を構成要素として 抽出してもよぐあるいは、請求項において、「〜と、」と記載されている、その「と」の前 の一連の単語を構成要素として抽出してもよい。一連の単語とは、例えば、漢字と力 タカナカもなる連続する単語のことである。文書属性情報取得部 12は、例えば、「情 報入力部」等を構成要素として抽出する。
[0040] ここで、代表構成要素を特定する一方法につ!、て、簡単に説明する。まず、上記の ようにして文書属性情報取得部 12は、効果の記載を特定すると共に、請求項から構 成要素を抽出する。文書属性情報取得部 12は、特定した効果の記載において、「〜 により、 · · · 'できる。」や、「〜を備えたことで、 · · · 'できる。」といった効果の記載され ている文をパターンマッチングにより特定する。次に、文書属性情報取得部 12は、そ の特定された文において、効果を奏するための要因となる構成要素が記載されてい る部分 (上の例では「〜」の部分)に、あら力じめ特許請求の範囲力も抽出している構 成要素が含まれるかどうか判断する。そして、含まれる場合には、その含まれる構成 要素を代表構成要素としてもよ ヽ。
[0041] 文書属性情報取得部 12は、特許文書情報における代表請求項の代表構成要素 の単位情報数を、代表請求項の代表構成要素について形態素解析等を行って単位 情報数をカウントすることによって取得してもよい。文書属性情報取得部 12は、特許 文書情報において引用されている特許文献数を、「特許文献 N」等の特許文献の見 出しの数をカウントすることによって取得してもよぐ「特許文献 N」の最大の Nの値を 特定することによって取得してもよぐ特許文献の記載の形式を有する記載が特許文 書情報に何個あるかを重複しないように検索することによって取得してもよい。ここで 、「N」は、任意の整数である。また、特許文献の記載の形式とは、例えば、「特開」と 4 桁の数字とハイフン「―」と 6桁以内の数字とが順番に並んで 、ると 、う形式である。 文書属性情報取得部 12は、特許文書情報にお!/ヽて引用されて!ヽる非特許文献数を 、「非特許文献 N」等の非特許文献の見出しの数をカウントすることによって取得して もよぐ「非特許文献 N」の最大の Nの値を特定することによって取得してもよぐ非特 許文献の記載の形式を有する記載が特許文書情報に何個あるかを重複しな 、ように 検索することによって取得してもよい。文書属性情報取得部 12は、特許文書情報に おける実施の形態の文字数を、実施の形態の記載されて 、る範囲の文字数をカウン トすることによって取得してもよい。文書属性情報取得部 12は、例えば、実施の形態 の記載されている範囲を、「(実施の形態)」の表記から、「産業上の利用可能性」の 表記までの範囲であると特定してもよい。文書属性情報取得部 12は、特許文書情報 における実施の形態の単位情報数を、実施の形態の記載されて 、る範囲につ!、て 形態素解析等を行って単位情報数をカウントすることによって取得してもよい。文書 属性情報取得部 12は、特許文書情報における実施の形態での例示の数を、実施の 形態の記載されている範囲において、「例えば」の個数をカウントすることによって取 得してもよい。文書属性情報取得部 12は、特許文書情報における実施の形態での 外延拡張表記の数を、実施の形態の記載されている範囲において、「もよい。」で終 わる文の個数や、「など」の個数、「等」の個数をカウントすることによって取得してもよ い。文書属性情報取得部 12は、特許文書情報における実施の形態での数式の数を 、「数 N」等の数式の見出しの数をカウントすることによって取得してもよぐ「数 N」の 最大の Nの値を特定することによって取得してもよい。文書属性情報取得部 12は、 特許文書情報における実施の形態での化学式の数を、「ィ匕 N」等の数式の見出しの 数をカウントすることによって取得してもよぐ「化 N」の最大の Nの値を特定することに よって取得してもよい。文書属性情報取得部 12は、特許文書情報における図面数を 、図面の簡単な説明等において説明されている図面の数をカウントすることによって 取得してもよぐ図面の簡単な説明等における図面の番号の最大値を特定すること によって取得してもよぐ発明の詳細な説明(明細書)において「図 N」などが何個表 示されて!/、るのかを重複しな 、ようにカウントすることによって取得してもよ!/、。文書属 性情報取得部 12は、特許文書情報における構成を示す図の数を、図面の簡単な説 明等における「ブロック図」や、「構成を示す図」、「構成図」等を含む説明を有する図 面の数をカウントすることによって取得してもよい。文書属性情報取得部 12は、特許 文書情報におけるフローチャートの数を、図面の簡単な説明等における「フローチヤ ート」や、「流れ図」、「流れを示す図」、「フロー」、「流れ」、「手順」、等を含む説明を 有する図面の数をカウントすることによって取得してもよい。文書属性情報取得部 12 は、特許文書情報におけるデータ構造を示す図の数を、図面の簡単な説明等にお ける「データ構造」や、「データの構成」、「情報の構造」等を含む説明を有する図面の 数をカウントすることによって取得してもよい。文書属性情報取得部 12は、特許文書 情報における画面出力を示す図の数を、図面の簡単な説明等における「画面表示」 や、「画面出力」、「画面の表示」、「画面の出力」等を含む説明を有する図面の数を カウントすることによって取得してもよい。文書属性情報取得部 12は、特許文書情報 におけるハードウ ア構成を示す図の数を、図面の簡単な説明等における「ハードウ エア構成」や、「ハードウェアの構成」、等を含む説明を有する図面の数をカウントする ことによって取得してもよ 、。
次に、本実施の形態による情報処理装置 1の動作について、図 2のフローチャート を用いて説明する。
[0042] (ステップ S101)サンプル特許価値情報受付部 16は、サンプル特許価値情報を受 け付けたかどうか判断する。そして、サンプル特許価値情報を受け付けた場合には、 ステップ S102に進み、そうでない場合には、ステップ S103に進む。
[0043] (ステップ S102)サンプル特許価値情報蓄積部 17は、サンプル特許価値情報受 付部 16が受け付けたサンプル特許価値情報をサンプル特許価値情報記憶部 18に 蓄積する。そして、ステップ S101に戻る。
[0044] (ステップ S103)特許価値情報算出部 19は、特許価値情報を算出するかどうか判 断する。そして、特許価値情報を算出する場合には、ステップ S104に進み、そうでな い場合には、ステップ S101に戻る。ここで、特許価値情報算出部 19が特許価値情 報を算出すると判断するタイミングは問わない。例えば、所定のイベントの発生 (例え ば、特許価値情報を算出する旨の指示が受け付けられたことなど)をトリガーとして特 許価値情報を算出すると判断してもよい。
[0045] (ステップ S104)文書属性情報取得部 12は、特許文書情報記憶部 11で記憶され ている特許文書情報から文書属性情報を取得する。また、文書属性情報取得部 12 は、特許文書情報記憶部 11で記憶されているサンプル特許文書情報からサンプル 文書属性情報を取得する。
[0046] (ステップ S105)文書属性情報蓄積部 13は、文書属性情報取得部 12が取得した 文書属性情報を文書属性情報記憶部 14に蓄積する。また、文書属性情報蓄積部 1
3は、文書属性情報取得部 12が取得したサンプル文書属性情報をサンプル文書属 性情報記憶部 15に蓄積する。
[0047] (ステップ S106)特許価値情報算出部 19は、サンプル文書属性情報記憶部 15が 記憶して!/、るサンプル文書属性情報と、サンプル特許価値情報記憶部 18が記憶し ているサンプル特許価値情報とを教師情報として、文書属性情報記憶部 14が記憶し ている文書属性情報から特許価値情報を算出する。
(ステップ S107)特許価値情報出力部 20は、特許価値情報算出部 19が算出した 特許価値情報を出力する。そして、ステップ S101に戻る。
[0048] なお、図 2のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は 終了する。また、図 2のフローチャートでは、特許価値情報を算出する際に文書属性 情報やサンプル文書属性情報を取得する場合について説明したが、あらかじめ文書 属性情報等の取得を行っておき、その取得された文書属性情報等を用いて特許価 値情報の算出を行ってもよい。このように、図 2のフローチャートにおいて、ある程度 の任意性がある。
[0049] 次に、本実施の形態による情報処理装置 1の動作について、具体例を用いて説明 する。この具体例において、情報処理装置 1はスタンドアロンの PC (Personal Com puter)であるとする。
[0050] この具体例にぉ 、て、特許文書情報記憶部 11では、図 3で示されるように特許文 書情報を識別する情報である特許文書 IDと、特許文書情報とが対応付けられて記 憶されているものとする。ここで、この特許文書情報には、サンプル特許文書情報が 含まれるものとする。特許文書情報「P0001」等は、特許文書情報のデータそのもの でもよぐ特許文書情報の名称でもよぐあるいは、特許文書情報の記憶されている 特許文書情報記憶部 11におけるアドレス (ポインタ)でもよ!/ヽ。特許文書 ID ΓΡ1999 — 123456」で識別される特許文書情報「P0001」は、図 4で示されるテキストデータ であるとする。図 4において、特許文書情報「P0001」には、公開番号や公開日など の書誌的事項と、特許請求の範囲と、発明の詳細な説明(明細書)とが含まれている 。特許文書情報には、図面のデータが含まれていてもよぐ含まれていなくてもよい。
[0051] まず、ユーザが情報処理装置 1を操作することにより、サンプル特許文書情報を入 力する画面を表示させる。この画面表示は、図示しない表示部が特許文書情報記憶 部 11から特許文書 IDを取得することによってなされる。ユーザは、図 5で示されるよう に、キーボードやマウスを操作することにより、特許文書 IDで識別されるサンプル特 許文書情報のサンプル特許価値情報を入力する。その入力において、ユーザは、サ ンプル特許文書情報そのもの、あるいは、そのサンプル特許文書情報に対応する公 報等を参照することにより、特許価値を算出して入力する。なお、サンプル特許価値 情報を入力するユーザがサンプルとなる特許価値の算出を行うのではなぐ他の専 門的な人材、例えば、知的財産権部の専門家や、弁理士等にそのサンプルとなる特 許価値の算出を依頼してもよい。また、図 5で示される画面では、特許文書情報記憶 部 11で記憶されて ヽる全ての特許文書情報 (サンプル特許文書情報を含む)に対 応する特許文書 IDが表示されるが、ユーザは、その表示されている特許文書 IDのう ち、サンプルとして用いたい特許文書情報に対応する特許文書 IDについてのみ、サ ンプル特許価値情報を入力すればよい。すなわち、サンプル特許価値情報の入力さ れた特許文書 IDで識別される特許文書情報が、サンプル特許文書情報となるので ある。
[0052] サンプル特許価値情報の入力が終了すると、ユーザは、マウスを操作することによ つて、図示しない「OK」ボタンをクリックする。すると、サンプル特許価値情報がサン プル特許価値情報受付部 16で受け付けられ (ステップ S101)、サンプル特許価値 情報蓄積部 17によってサンプル特許価値情報記憶部 18に蓄積される (ステップ S 1 02)。図 6は、サンプル特許価値情報記憶部 18で記憶されている、サンプル特許価 値情報と特許文書 IDとの対応を示す図である。
[0053] 次に、ユーザが情報処理装置 1を操作することにより、特許価値情報の算出を開始 する画面を表示させる。この画面表示は、図示しない表示部が特許文書情報記憶部 11と、サンプル特許価値情報記憶部 18とを参照し、サンプル特許価値情報と対応 付けられていない特許文書 IDを表示することによってなされる。ここでは、図 7で示さ れるように、 3個の特許文書 IDが表示され、ユーザは、マウスを操作して特許文書 ID 「P1999— 111111」の左側のラジオボタンをクリックすることにより、特許文書 ID「P1 999— 111111」で識別される特許文書情報を選択したとする。そして、ユーザがマ ウスを操作することによって「OK」ボタンをクリックする。すると、特許価値情報算出部 19は、特許文書 ID ΓΡ1999- 111111」で識別される特許文書情報にっ 、て特許 価値情報を算出する旨の指示を受け付けたと判断し (ステップ S103)、文書属性情 報取得部 12に対して、特許文書 ID ΓΡ1999- 111111」で識別される特許文書情 報の文書属性情報と、サンプル特許価値情報記憶部 18で記憶されているサンプル 特許価値情報に対応するサンプル文書属性情報とを取得する旨の指示を渡す。
[0054] すると、文書属性情報取得部 12は、特許文書情報記憶部 11から特許文書 ID「P1 999- 111111」で識別される特許文書情報を読み出し、その特許文書情報から文 書属性情報を前述の説明のようにして取得する。また、文書属性情報取得部 12は、 サンプル特許価値情報記憶部 18で記憶されているサンプル特許価値情報に対応 する特許文書 IDを読み出し、その特許文書 IDで識別されるサンプル特許文書情報 を特許文書情報記憶部 11から読み出し、同様にして、そのサンプル特許文書情報 からサンプル文書属性情報を取得する (ステップ S104)。文書属性情報蓄積部 13は 、文書属性情報取得部 12によって取得された文書属性情報を文書属性情報記憶部 14に蓄積する。文書属性情報記憶部 14に蓄積された文書属性情報は、図 8で示さ れるものである。また、文書属性情報蓄積部 13は、文書属性情報取得部 12によって 取得されたサンプル文書属性情報をサンプル文書属性情報記憶部 15に蓄積する( ステップ S 105)。サンプル文書属性情報記憶部 15に蓄積されたサンプル文書属性 情報は、図 9で示されるものである。図 8,図 9において、文書属性情報、及びサンプ ル文書属性情報は、特許文書 IDに対応付けられている。また、文書属性情報、及び サンプル文書属性情報には、請求項数、独立請求項数、カテゴリー数、ネストレベル 、請求の範囲の文字数、代表請求項の構成要素数等の前述した特許文書情報の各 属性を示す情報が含まれて!/、る。
[0055] 次に、特許価値情報算出部 19は、サンプル文書属性情報記憶部 15から教師情報 としてのサンプル文書属性情報を読み出し、サンプル特許価値情報記憶部 18から 教師情報としてのサンプル特許価値情報を読み出す。そして、それらの情報をサボ ートベクターマシンに読み込む形式に変換する。具体的には、図 10で示されるように サンプル文書属性情報と、サンプル特許価値情報とを変換する。図 10において、各 行が一の特許文書情報に対応している。例えば、 1行目のデータは、特許文書 ID「P 1999— 123456」で識別される特許文書情報に対応している。 2行目のデータは、 特許文書 ID ΓΡ1999- 234567」で識別される特許文書情報に対応して!/、る。各行 において、一番左の値は、サンプル特許価値情報の示す値である。その右側には、 サンプル文書属性情報の各属性を識別する識別番号にコロンで対応付けられた属 性の値が順番に並んでいる。ここでは、例えば、属性「請求項数」を識別する識別番 号が「1」であり、属性「独立請求項数」を識別する識別番号が「2」であり、属性「カテ ゴリー数」を識別する識別番号が「3」であるというようになっている。そして、特許価値 情報算出部 19は、文書属性情報記憶部 14から特許価値情報を算出する特許文書 情報の文書属性情報を読み出し、図 10で示される情報を教師情報として読み込み、 サポートベクターマシンを用いて、読み出した文書属性情報に対応する特許価値情 報を算出する。ここで用いられるサポートベクターマシンでは、多クラスのクラス分類 を行うものとする。ここでは、特許文書 ID「P1999— 111111」で識別される特許文書 情報の特許価値情報が「70」と算出されたとする (ステップ S106)。すると、特許価値 情報出力部 20は、その特許価値情報「70」を、図 11で示されるように、情報処理装 置 1のディスプレイに表示する(ステップ S 107)。このようにして、ユーザは、特許価値 情報について知ることができる。
以上のように、本実施の形態による情報処理装置 1では、特許価値情報算出部 19 がサンプル特許価値情報とサンプル文書属性情報とを教師情報をして用いることに より、所望の特許文書情報の価値を示す特許価値情報を算出することができる。ュ 一ザは一般に、主観的な評価を行うものであるが、教師情報を用いて特許価値情報 の算出を行うことによって、ユーザの主観的な評価の要素を反映した特許価値の客 観的な算出を行うことができる。一方、ユーザごとに特許価値情報を算出するための 複雑な式等を設定する必要がなぐ式を設定するための煩雑な作業を行わなくてよ いことになる。例えば、 6万件の特許を有する企業が自社の 6万件の特許の価値を人 手によって判断するには多大な労力が必要となる力 サンプルとなる 100件の特許に っ ヽて価値を判断し、その価値をサンプル特許価値情報として情報処理装置 1を用 いることにより、その価値判断を用いて、他の特許の価値を同様に判断することがで き、多大な労力の軽減に寄与することができうる。
[0057] また、ユーザが特許文書情報の価値を評価する場合には、一般に、簡単に定式ィ匕 できな 、潜在的なルールに基づ 、て判断すると考えられる。情報処理装置 1を用い て特許文書情報の価値を評価することにより、その潜在的なルールに基づいた判断 を行うことができうる。
[0058] (実施の形態 2)
本発明の実施の形態 2による情報処理装置について、図面を参照しながら説明す る。本実施の形態による情報処理装置は、特許価値情報に代えて特許特性情報を 算出するものである。
[0059] 図 12は、本実施の形態による情報処理装置 2の構成を示すブロック図である。図 2 において、本実施の形態による情報処理装置 2は、特許文書情報記憶部 11と、文書 属性情報取得部 12と、文書属性情報蓄積部 13と、文書属性情報記憶部 14と、サン プル文書属性情報記憶部 15と、サンプル特許特性情報受付部 21と、サンプル特許 特性情報蓄積部 22と、サンプル特許特性情報記憶部 23と、特許特性情報算出部 2 4と、特許特性情報出力部 25とを備える。なお、サンプル特許特性情報受付部 21、 サンプル特許特性情報蓄積部 22、サンプル特許特性情報記憶部 23、特許特性情 報算出部 24、特許特性情報出力部 25以外の構成及び動作は、実施の形態 1と同 様であり、その説明を省略する。
[0060] サンプル特許特性情報受付部 21は、サンプル特許特性情報を受け付ける。ここで 、サンプル特許特性情報とは、特許文書情報の特性を示す情報であり、サンプル文 書属性情報記憶部 15で記憶されるサンプル文書属性情報に対応する情報である。 すなわち、あるサンプル特許文書情報の特性を示すサンプル特許特性情報がサン プル特許特性情報受付部 21で受け付けられ、その同じサンプル特許文書情報から 取得されたサンプル文書属性情報がサンプル文書属性情報記憶部 15で記憶される ことになる。サンプル特許特性情報は、教師情報として用いられる。サンプル特許特 性情報は、発明本質抽出特性と、強靱特性と、発明展開特性と、実施可能担保特性 とを含むものである。ここで、発明本質抽出特性とは、特許文書情報において発明の 本質を抽出している程度を示す特性である。強靱特性とは、特許文書情報において 、発明にかかる出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程 度を示す特性である。発明展開特性とは、特許文書情報において発明を展開してい る程度を示す特性である。実施可能担保特性とは、特許文書情報において発明に っ 、て実施可能に記載されて 、る程度を示す特性である。サンプル特許特性情報 受付部 21は、例えば、入力デバイス(例えば、キーボードやマウス、タツチパネルなど )から入力された情報を受け付けてもよぐ有線もしくは無線の通信回線を介して送信 された情報を受信してもよぐ所定の記録媒体 (例えば、光ディスクや磁気ディスク、 半導体メモリなど)力も読み出された情報を受け付けてもよい。本実施の形態では、 サンプル特許特性情報受付部 21は、入力デバイスから入力されたサンプル特許特 性情報を受け付けるものとする。なお、サンプル特許特性情報受付部 21は、受け付 けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んでもよぐあ るいは含まなくてもよい。また、サンプル特許特性情報受付部 21は、ハードウェアに よって実現されてもよぐあるいは所定のデバイスを駆動するドライバ等のソフトウェア によって実現されてもよい。
サンプル特許特性情報蓄積部 22は、サンプル特許特性情報受付部 21が受け付 けたサンプル特許特性情報をサンプル特許特性情報記憶部 23に蓄積する。
[0061] サンプル特許特性情報記憶部 23では、サンプル特許特性情報が記憶される。サン プル特許特性情報記憶部 23での記憶は、例えば、 RAM等における一時的な記憶 でもよぐあるいは、フラッシュメモリや磁気ディスク等における長期的な記憶でもよい 。サンプル特許特性情報記憶部 23は、所定の記録媒体 (例えば、半導体メモリゃ磁 気ディスク、光ディスクなど)によって実現されうる。
[0062] 特許特性情報算出部 24は、文書属性情報記憶部 14が記憶している文書属性情 報から、その文書属性情報に対応する特許文書情報の特性を示す特許特性情報を 算出する。特許特性情報算出部 24は、教師あり学習によって特許特性情報を算出 する。この算出された特許特性情報にも発明本質抽出特性と、強靱特性と、発明展 開特性と、実施可能担保特性とが含まれるのは、前述のサンプル特許特性情報と同 様である。特許特性情報算出部 24は、例えば、サポートベクターマシンにより特許特 性情報を算出してもよぐそれ以外の方法を用いて特許特性情報を算出してもよい。 本実施の形態では、特許特性情報算出部 24は、サポートベクターマシンを用いて特 許特性情報を算出するものとする。サポートベクターマシンについては、前述のように 、従来力 公知であるため、その詳細な説明を省略する。特許特性情報算出部 24は 、サンプル文書属性情報記憶部 15が記憶しているサンプル文書属性情報と、サンプ ル特許特性情報記憶部 23が記憶しているサンプル特許特性情報とを教師情報とし て、特許特性情報を算出する。なお、教師情報や処理する情報が異なる以外、特許 特性情報算出部 24は、実施の形態 1の特許価値情報算出部 19と同様のものであり 、その詳細な説明を省略する。
[0063] 特許特性情報出力部 25は、特許特性情報算出部 24が算出した特許特性情報を 出力する。ここで、この出力は、例えば、表示デバイス (例えば、 CRTや液晶ディスプ レイなど)への表示でもよぐ所定の機器への通信回線を介した送信でもよぐプリン タによる印刷でもよぐスピーカによる音声出力でもよぐ記録媒体への蓄積でもよい 。なお、特許特性情報出力部 25は、出力を行うデバイス (例えば、表示デバイスゃプ リンタなど)を含んでもよぐあるいは含まなくてもよい。また、特許特性情報出力部 25 は、ハードウェアによって実現されてもよぐあるいは、それらのデバイスを駆動するド ライバ等のソフトウェアによって実現されてもょ 、。
[0064] なお、特許文書情報記憶部 11と、文書属性情報記憶部 14と、サンプル文書属性 情報記憶部 15と、サンプル特許特性情報記憶部 23との任意の 2以上の記憶部は、 同一の記録媒体によって実現されてもよぐあるいは、別々の記録媒体によって実現 されてちょい。
[0065] 次に、本実施の形態による情報処理装置 2の動作について、図 13のフローチャート を用いて説明する。なお、ステップ S104, S105の処理については、実施の形態 1の 図 2のフローチャートと同様であり、その説明を省略する。
[0066] (ステップ S201)サンプル特許特性情報受付部 21は、サンプル特許特性情報を受 け付けたかどうか判断する。そして、サンプル特許特性情報を受け付けた場合には、 ステップ S202に進み、そうでな ヽ場合に ίま、ステップ S203に進む。
[0067] (ステップ S202)サンプル特許特性情報蓄積部 22は、サンプル特許特性情報受 付部 21が受け付けたサンプル特許特性情報をサンプル特許特性情報記憶部 23に 蓄積する。そして、ステップ S201に戻る。
[0068] (ステップ S203)特許特性情報算出部 24は、特許特性情報を算出するかどうか判 断する。そして、特許特性情報を算出する場合には、ステップ S104に進み、そうでな い場合には、ステップ S201に戻る。ここで、特許特性情報算出部 24が特許特性情 報を算出すると判断するタイミングは問わない。例えば、所定のイベントの発生 (例え ば、特許特性情報を算出する旨の指示が受け付けられたことなど)をトリガーとして特 許特性情報を算出すると判断してもよい。
[0069] (ステップ S204)特許特性情報算出部 24は、サンプル文書属性情報記憶部 15が 記憶して 、るサンプル文書属性情報と、サンプル特許特性情報記憶部 23が記憶し ているサンプル特許特性情報とを教師情報として、文書属性情報記憶部 14が記憶し ている文書属性情報力 特許特性情報を算出する。
(ステップ S205)特許特性情報出力部 25は、特許特性情報算出部 24が算出した 特許特性情報を出力する。そして、ステップ S 201に戻る。
[0070] なお、図 13のフローチャートにおいて、電源オフや処理終了の割り込みにより処理 は終了する。また、図 13のフローチャートでは、特許特性情報を算出する際に文書 属性情報やサンプル文書属性情報を取得する場合にっ 、て説明したが、あらかじめ 文書属性情報等の取得を行っておき、その取得された文書属性情報等を用いて特 許特性情報の算出を行ってもよい。このように、図 13のフローチャートにおいて、ある 程度の任意性がある。
[0071] 次に、本実施の形態による情報処理装置 2の動作について、具体例を用いて説明 する。この具体例において、情報処理装置 2はスタンドアロンの PCであるとする。な お、特許文書情報からの文書属性情報やサンプル文書属性情報の取得、及び蓄積 に関する処理は、実施の形態 1の具体例と同様であり、その説明を省略する。
[0072] また、サンプル特許特性情報の受け付け、及び蓄積に関する処理 (ステップ S201 , S202)も、受け付けられる情報が発明本質抽出特性や、強靱特性などの複数にな つた以外、実施の形態 1の具体例における特許価値情報の受け付け、及び蓄積に 関する処理と同様であり、その説明を省略する。
[0073] 図 14は、サンプル特許価値情報蓄積部 17によって蓄積されたサンプル特許特性 情報を示す図である。図 14において、特許文書 IDに、サンプル特許特性情報に含 まれる発明本質抽出特性、強靱特性、発明展開特性、実施可能担保特性が対応付 けられている。これらの値は、実施の形態 1の具体例における特許価値情報と同様に 、ユーザ等が特許文書情報や公報等を参照することにより、決定した数値である。
[0074] 次に、ユーザは、実施の形態 1の図 7と同様の画面において、マウスを操作して特 許文書 ID「P1999— 111111」の左側のラジオボタンをクリックすることにより、特許 文書 ID ΓΡ1999- 111111」で識別される特許文書情報を選択したとする。そして、 ユーザがマウスを操作することによって「OK」ボタンをクリックする。すると、特許特性 情報算出部 24は、特許文書 ID ΓΡ1999- 111111」で識別される特許文書情報に っ 、て特許特性情報を算出する旨の指示を受け付けたと判断し (ステップ S203)、 文書属性情報取得部 12に対して、特許文書 ID「P 1999— 111111」で識別される 特許文書情報の文書属性情報と、サンプル特許特性情報記憶部 23で記憶されて ヽ るサンプル特許特性情報に対応するサンプル文書属性情報とを取得する旨の指示 を渡す。この指示に応じて文書属性情報と、サンプル文書属性情報とが取得され、 蓄積されるのは実施の形態 1の具体例と同様である。
[0075] 次に、特許特性情報算出部 24は、サンプル文書属性情報記憶部 15から教師情報 としてのサンプル文書属性情報を読み出し、サンプル特許特性情報記憶部 23から 教師情報としてのサンプル特許特性情報を読み出す。そして、特許特性情報算出部 24は、それらの情報を実施の形態 1の図 10と同様にサポートベクターマシンに読み 込む形式に変換する。そして、特許特性情報算出部 24は、文書属性情報記憶部 14 から特許特性情報を算出する特許文書情報の文書属性情報を読み出し、教師情報 を読み込み、サポートベクターマシンを用いて、読み出した文書属性情報に対応す る特許特性情報を算出する。ここで用いられるサポートベクターマシンでは、多クラス のクラス分類を行うものとする。ここでは、特許文書 ID「P1999— 111111」で識別さ れる特許文書情報の特許特性情報が発明本質抽出特性「70」、強靱特性「75」、発 明展開特性「70」、実施可能担保特性「75」と算出されたとする (ステップ S204)。す ると、特許特性情報出力部 25は、算出された特許特性情報を、実施の形態 1の図 11 と同様に、情報処理装置 2のディスプレイに表示する(ステップ S205)。このようにし て、ユーザは、特許特性情報について知ることができる。
[0076] 以上のように、本実施の形態による情報処理装置 2では、特許特性情報算出部 24 がサンプル特許特性情報とサンプル文書属性情報とを教師情報として用いることに より、所望の特許文書情報の特性を示す特許特性情報を算出することができる。この ように、教師情報を用いて特許特性情報の算出を行うため、ユーザの主観的な評価 の要素を考慮した特許特性の算出を行うことができる。一方、ユーザごとに特許特性 情報を算出するための複雑な式等を設定する必要がなぐ式を設定するための煩雑 な作業を行わなくてよいことになる。
[0077] なお、上記各実施の形態で用いた文書属性情報は一例であって、他の文書属性 情報を用いてもよいことはいうまでもない。例えば、文書属性情報は、特許文書情報 の国際特許分類、特許文書情報の Fターム、特許文書情報のフェーズ、特許文書情 報で示される発明の技術分野、特許文書情報に関する権利の存続期間、特許文書 情報で示される発明の種類、特許文書情報における請求項の数、特許文書情報に おける独立形式の請求項の数、特許文書情報における特許請求の範囲のカテゴリ 一数、特許文書情報における特許請求の範囲のネストレベル、特許文書情報におけ る特許請求の範囲の文字数、特許文書情報における代表請求項の構成要素数、特 許文書情報における代表請求項の読点の数、特許文書情報における代表請求項の 文字数、特許文書情報における代表請求項の単位情報数、特許文書情報における 代表請求項の前提部の文字数、特許文書情報における代表請求項の特徴部の文 字数、特許文書情報における代表請求項の前提部の単位情報数、特許文書情報に おける代表請求項の特徴部の単位情報数、特許文書情報における代表請求項の代 表構成要素の文字数、特許文書情報における代表請求項の代表構成要素の単位 情報数、特許文書情報において引用されている特許文献数、特許文書情報におい て引用されている非特許文献数、特許文書情報における実施の形態の文字数、特 許文書情報における実施の形態の単位情報数、特許文書情報における実施の形態 での例示の数、特許文書情報における実施の形態での外延拡張表記の数、特許文 書情報における実施の形態での数式の数、特許文書情報における実施の形態での 化学式の数、特許文書情報における図面数、特許文書情報における構成を示す図 の数、特許文書情報におけるフローチャートの数、特許文書情報におけるデータ構 造を示す図の数、特許文書情報における画面出力を示す図の数、特許文書情報に おけるハードウェア構成を示す図の数の群力 選ばれる、 1以上の属性を示す情報 であってもよい。ここで、特許文書情報のフェーズとは、特許文書情報が出願されて いるが審査請求前であるの力、審査に係属しているの力、審判に係属しているの力、 訴訟に係属しているの力、特許になっているの力 存続期間の満了等によって権利 が失効したの力などのフェーズである。また、特許文書情報で示される発明の技術分 野とは、例えば、半導体分野や、家電分野、科学分野などの大きな分野であってもよ ぐ冷蔵庫、洗濯機、洗剤等の細かい分野であってもよい。特許文書情報に関する 権利の存続期間とは、権利の最大の存続期間のことであり、権利になっていない場 合には、権利となった場合の最大の存続期間のことである。権利の存続期間は、一 般には、出願日力も 20年となる。特許文書情報で示される発明の種類とは、例えば、 基本発明、応用発明といった発明の種類であってもよぐ企画段階で出たコンセプト 発明、外部 (概要)設計段階で出た機能を付加する発明である機能発明、詳細設計 段階で出た改良発明と!/、つた発明の種類であってもよ!/、。
なお、特許文書情報の国際特許分類、特許文書情報の Fターム、特許文書情報の フェーズ、特許文書情報で示される発明の技術分野、特許文書情報に関する権利 の存続期間、特許文書情報で示される発明の種類等は、特許文書情報から取得さ れたものであってもよぐあるいは、ユーザ等によって入力デバイス等を介して入力さ れたものであってもよい。例えば、実施の形態 1の情報処理装置 1は、図 18で示され るように、文書属性情報を受け付ける文書属性情報受付部 41と、文書属性情報受付 部 41が受け付けた文書属性情報を文書属性情報記憶部 14に蓄積する文書属性情 報蓄積部 42とをさらに備えてもよい。文書属性情報受付部 41は、例えば、入力デバ イスカゝら入力された情報を受け付けてもよぐ有線もしくは無線の通信回線を介して 送信された情報を受信してもよぐ所定の記録媒体力 読み出された情報を受け付 けてもよい。なお、文書属性情報受付部 41は、受け付けを行うためのデバイスを含ん でもよぐあるいは含まなくてもよい。また、文書属性情報受付部 41は、ハードウェア によって実現されてもよぐあるいは所定のデバイスを駆動するドライバ等のソフトゥェ ァによって実現されてもよい。図 19は、情報処理装置 1が文書属性情報受付部 41と 、文書属性情報蓄積部 42とを備えた場合のフローチャートである。ステップ S401に おいて、文書属性情報受付部 41は、文書属性情報を受け付けた力どうか判断し、受 け付けた場合には、ステップ S402〖こ進み、そうでない場合には、ステップ S103に進 む。ステップ S402において、文書属性情報蓄積部 42は、文書属性情報受付部 41 が受け付けた文書属性情報を文書属性情報記憶部 14に蓄積する。なお、実施の形 態 2の情報処理装置 2についても同様である。また、一般に、特許文書情報の国際 特許分類、特許文書情報の Fターム、特許文書情報のフェーズ、特許文書情報で示 される発明の技術分野、特許文書情報で示される発明の種類等は、数字で表される ものではないため、それらの属性を教師情報として用いる場合には、それらの情報を 数字に変換してカゝら用いてもよい。例えば、各国際特許分類を、順番に数字に対応 付けるようにしてもよい。
[0079] ここで、数値化されて!/、な 、文書属性情報を数値ィ匕する方法にっ 、て説明する。
実施の形態 1, 2で説明した情報処理装置 1, 2は、図 20,図 21で示されるように、文 書属性情報数値ィ匕部 51をさらに備えてもよい。その文書属性情報数値化部 51は、 文書属性情報記憶部 14で記憶されている文書属性情報のうち、数値でないものを 数値化して文書属性情報記憶部 14に蓄積する。
[0080] その数値ィ匕の方法としては、例えば、(1)非数値の文書属性情報と、数値の文書属 性情報とを対応付けて有する情報である数値化対応情報を用いて数値化する方法、 (2)所定の式を用いた算出を行うことによって数値ィ匕する方法などがある。以下、そ れらについて説明する。
[0081] (1)数値化対応情報を用いて数値化する方法
数値化対応情報は、例えば、図 22で示されるものである。図 22において、数値ィ匕 対応情報は、非数値の文書属性情報と、数値の文書属性情報とを対応付けて有して いる。例えば、非数値の文書属性情報「発明回避容易性:高」に対しては、数値の文 書属性情報「発明回避容易性: 50」が対応付けられている。したがって、文書属性情 報数値化部 51は、数値化対応情報を参照することにより、文書属性情報記憶部 14 で記憶されて!、る非数値の文書属性情報「発明回避容易性:高」を、数値の文書属 性情報「発明回避容易性: 50」に変換することができる。より具体的には、文書属性 情報数値化部 51は、非数値の文書属性情報「発明回避容易性:高」をキーとして数 値化対応情報を検索し、その検索された非数値の文書属性情報「発明回避容易性: 高」に対応する数値の文書属性情報「発明回避容易性: 50」を取得することによって 、その変換を行うことができる。そして、文書属性情報数値ィ匕部 51は、変換後の数値 の文書属性情報を文書属性情報記憶部 14に蓄積する。
[0082] なお、図 22で示されるように、 IPC等の非数値の文書属性情報を、数値の文書属 性情報に変換してもよい。図 22では、例えば、「A01」力も始まる IPC力 数値の文書 属性情報「15」に変換されることになる。このように IPCを数値に対応付ける場合に、 その IPCの対応する技術分野に応じて、値の大小を決定してもよい。例えば、製薬分 野における 1件の特許や発明の方が、家庭用電気機器における 1件の特許や発明よ りも価値があると考えることができうるため、製薬分野の IPCには、家庭用電気機器の IPCよりも大きな値を対応付けるようにしてもよい。なお、このような技術分野に応じた 値の大小の決定は、 IPCに限定されるものではなぐ例えば、他の技術分野を示す 非数値文書属性情報と、数値の文書属性情報との対応についても適用することがで さうる。
[0083] (2)所定の式を用いた算出を行うことによって数値ィ匕する方法
まず、非数値の文書属性情報と、数値の情報とを対応付けて有している対応情報 が存在するとする。対応情報は、例えば、図 23で示されるものである。図 23において 、非数値の文書属性情報「A社」が、数値の情報「資本金: 1億円」、「売上: 2億円」、 「経常利益: 2千万円」、「従業員: 100人」に対応付けられている。したがって、文書 属性情報数値化部 51は、対応情報を参照することにより、文書属性情報記憶部 14 で記憶されている非数値の文書属性情報「出願人: A社」に対応付けられている、数 値の情報「資本金: 1億円」等を取得することができる。そして、それらの数値の情報「 資本金: 1億円」等を、あらかじめ設定されて 、る所定の式の弓 I数として代入すること により、その式の値を求めることができる。そして、その求めた式の値を、文書属性情 報「A社」に対応する数値の文書属性情報として文書属性情報記憶部 14に蓄積して ちょい。
[0084] ここで、その所定の式は、例えば、規模の大きな出願人ほど、大きな値となる式であ つてもよく、あるいは、効率的な経営をしている出願人ほど、大きな値となる式であつ てもよい。前者の場合としては、例えば、その所定の式は、資本金や売上等に関する 増加関数であってもよい。また、後者の場合としては、例えば、その所定の式は、一 従業員あたりの売上や、一従業員あたりの経常利益に関する増加関数であってもよ い。なお、対応情報における売上は、例えば、会社の全体の売上であってもよぐあ るいは、文書属性情報の対応する特許文書情報の示す発明を使用する商品等の売 上であってもよい。
[0085] このように、文書属性情報数値ィ匕部 51は、対応情報を用いて、数値でない文書属 性情報を数値の情報に変換し、その数値の情報を所定の式の引数として代入するこ とにより、数値の文書属性情報を算出するものであってもよい。
[0086] なお、図 22や図 23で示した数値化対応情報や、対応情報は一例であって、非数 値の文書属性情報を数値の文書属性情報に変換するために用いることができるので あれば、その他の数値化対応情報や、その他の対応情報であってもよいことは言うま でもない。
[0087] また、ここでは、文書属性情報数値化部 51が、図 22で示される数値化対応情報や 、図 23で示される対応情報等を用いて、数値ィ匕を行う場合について説明したが、文 書属性情報数値化部 51が、結果として、文書属性情報記憶部 14で記憶されている 文書属性情報のうち、数値でないものを数値化して文書属性情報記憶部 14に蓄積 することができるのであれば、具体的な数値化の処理は、文書属性情報数値化部 51 以外のところで行われてもよい。例えば、文書属性情報数値ィ匕部 51がアクセス可能 な所定のサーバ等において、数値化対応情報を用いた数値化や、所定の式を用い た数値化が行われてもよい。そのような場合には、例えば、文書属性情報数値化部 5 1は、非数値の文書属性情報をその所定のサーバに送信し、その送信に応じて、そ の所定のサーノから送信された数値の文書属性情報を受信することによって、数値 化を行ってもよい。なお、文書属性情報数値ィ匕部 51において数値ィ匕対応情報を用 いた数値ィ匕や、所定の式を用いた数値ィ匕が行われる場合には、文書属性情報数値 化部 51は、その数値化対応情報、または、対応情報及び所定の式を示す情報を記 録媒体において保持しており、それらの情報を用いて、数値でない文書属性情報を 、数値の文書属性情報に変換するものとする。
[0088] また、文書属性情報数値化部 51は、文書属性情報記憶部 14で記憶されている文 書属性情報のみにっ 、てではなぐサンプル文書属性情報記憶部 15で記憶されて いるサンプル文書属性情報についても、数値化を行ってもよい。すなわち、文書属性 情報数値化部 51は、サンプル文書属性情報記憶部 15で記憶されて 、るサンプル文 書属性情報のうち、数値でないものを数値にしてサンプル文書属性情報記憶部 15 に蓄積してもよい。また、文書属性情報数値ィ匕部 51がサンプル文書属性情報につ いても数値ィ匕を行う場合に、数値ィ匕対応情報を用いて、数値でないサンプル文書属 性情報を数値のサンプル文書属性情報に変換してもよい。その場合には、非数値の サンプル文書属性情報が、非数値の文書属性情報であると見なし、数値のサンプル 文書属性情報が、数値の文書属性情報であると見なして、数値化対応情報を用いた 数値化を行ってもよい。さら〖こ、同様にして、文書属性情報数値ィ匕部 51は、所定の 式を用いた算出を行うことによって、数値でないサンプル文書属性情報の数値ィ匕を 行ってもよい。なお、文書属性情報の数値化では、どの文書属性情報を用いて特許 価値情報等を算出するのかについて決まっていないため、事前に手動で数値ィ匕を 行うことは困難であると考えられる。一方、サンプル文書属性情報の数値ィ匕では、あ らかじめサンプル文書属性情報の量が決まっているため、文書属性情報数値ィ匕部 5 1を用いることなぐ事前に手動で数値ィ匕を行ってもよい。もっとも、文書属性情報に っ 、ても、手動で数値化を行ってもょ 、ことは言うまでもな 、。
[0089] なお、実施の形態 1,実施の形態 2では、文書属性情報蓄積部 13が文書属性情報 を文書属性情報記憶部 14に蓄積する場合について説明したが、文書属性情報記憶 部 14に文書属性情報が記憶される過程は問わない。例えば、記録媒体を介して情 報が文書属性情報記憶部 14で記憶されるようになってもよぐ通信回線等を介して 送信された情報が文書属性情報記憶部 14で記憶されるようになってもよぐある 、は 、入力デバイスを介して入力された情報が文書属性情報記憶部 14で記憶されるよう になってもよい。
[0090] また、実施の形態 1,実施の形態 2では、文書属性情報蓄積部 13がサンプル文書 属性情報をサンプル文書属性情報記憶部 15に蓄積する場合について説明したが、 サンプル文書属性情報記憶部 15にサンプル文書属性情報が記憶される過程は問 わない。例えば、記録媒体を介して情報がサンプル文書属性情報記憶部 15で記憶 されるようになってもよぐ通信回線等を介して送信された情報がサンプル文書属性 情報記憶部 15で記憶されるようになってもよぐあるいは、入力デバイスを介して入力 された情報がサンプル文書属性情報記憶部 15で記憶されるようになってもよ 、。
[0091] (実施の形態 3)
本発明の実施の形態 3による情報処理装置について、図面を参照しながら説明す る。本実施の形態による情報処理装置は、サンプル特許属性情報に代えてサンプル 特許特性情報を教師情報として用いて特許価値情報を算出するものである。
[0092] 図 15は、本実施の形態による情報処理装置 3の構成を示すブロック図である。図 1 5において、ほん実施の形態による情報処理装置 3は、サンプル特許価値情報受付 部 16と、サンプル特許価値情報蓄積部 17と、サンプル特許価値情報記憶部 18と、 特許特性情報受付部 31と、特許特性情報蓄積部 32と、特許特性情報記憶部 33と、 サンプル特許特性情報記憶部 34と、特許価値情報算出部 35と、特許価値情報出力 部 36とを備える。なお、サンプル特許価値情報受付部 16、サンプル特許価値情報 蓄積部 17、サンプル特許価値情報記憶部 18の構成及び動作は、実施の形態 1と同 様であり、その説明を省略する。
[0093] 特許特性情報受付部 31は、特許特性情報を受け付ける。ここで、特許特性情報と は、実施の形態 2の説明と同様であり、特許文書情報の特性を示す情報であって、 発明本質抽出特性と、強靱特性と、発明展開特性と、実施可能担保特性とを含む情 報である。特許特性情報受付部 31は、サンプル特許特性情報も受け付ける。サンプ ル特許特性情報とは、実施の形態 2の説明と同様であり、教師情報として用いられる 特許特性情報である。特許特性情報受付部 31は、例えば、入力デバイス (例えば、 キーボードやマウス、タツチパネルなど)力も入力された情報を受け付けてもよぐ有 線もしくは無線の通信回線を介して送信された情報を受信してもよぐ所定の記録媒 体 (例えば、光ディスクや磁気ディスク、半導体メモリなど)カゝら読み出された情報を受 け付けてもよい。本実施の形態では、特許特性情報受付部 31は、入力デバイスから 入力された特許特性情報を受け付けるものとする。なお、特許特性情報受付部 31は 、受け付けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んで もよぐあるいは含まなくてもよい。また、特許特性情報受付部 31は、ハードウェアに よって実現されてもよぐあるいは所定のデバイスを駆動するドライバ等のソフトウェア によって実現されてもよい。
[0094] 特許特性情報蓄積部 32は、特許特性情報受付部 31が受け付けた特許特性情報 を特許特性情報記憶部 33に蓄積する。また、特許特性情報蓄積部 32は、特許特性 情報受付部 31が受け付けたサンプル特許特性情報をサンプル特許特性情報記憶 部 34に蓄積する。
[0095] 特許特性情報記憶部 33では、特許特性情報が記憶される。特許特性情報記憶部 33での記憶は、例えば、 RAM等における一時的な記憶でもよぐあるいは、フラッシ ュメモリや磁気ディスク等における長期的な記憶でもよ ヽ。特許特性情報記憶部 33 は、所定の記録媒体 (例えば、半導体メモリや磁気ディスク、光ディスクなど)によって 実現されうる。
[0096] サンプル特許特性情報記憶部 34では、サンプル特許特性情報が記憶される。な お、本実施の形態では、サンプル特許特性情報記憶部 34で記憶されるサンプル特 許特性情報と、サンプル特許価値情報記憶部 18で記憶されるサンプル特許価値情 報とが対応する情報となる。サンプル特許特性情報記憶部 34での記憶は、例えば、 RAM等における一時的な記憶でもよぐあるいは、フラッシュメモリや磁気ディスク等 における長期的な記憶でもよい。サンプル特許特性情報記憶部 34は、所定の記録 媒体 (例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。
[0097] 特許価値情報算出部 35は、特許特性情報記憶部 33が記憶している特許特性情 報から、その特許特性情報に対応する特許文書情報の価値を示す特許価値情報を 算出する。特許価値情報算出部 35は、サンプル特許特性情報記憶部 34が記憶して いるサンプル特許特性情報と、サンプル特許価値情報記憶部 18が記憶しているサ ンプル特許価値情報とを教師情報として、特許特性情報から特許価値情報を算出す る以外、実施の形態 1の特許価値情報算出部 19と同様のものであり、その説明を省 略する。
[0098] 特許価値情報出力部 36は、特許価値情報算出部 35が算出した特許価値情報を 出力する。特許価値情報出力部 36は、実施の形態 1の特許価値情報出力部 20と同 様のものであり、その説明を省略する。
[0099] なお、サンプル特許価値情報記憶部 18と、特許特性情報記憶部 33と、サンプル特 許特性情報記憶部 34との任意の 2以上の記憶部は、同一の記録媒体によって実現 されてもよく、あるいは、別々の記録媒体によって実現されてもよい。
[0100] 次に、本実施の形態による情報処理装置 3の動作について、図 16のフローチャート を用いて説明する。なお、ステップ S 101, S 102の処理については、実施の形態 1の 図 2のフローチャートと同様であり、その説明を省略する。
[0101] (ステップ S301)特許特性情報受付部 31は、特許特性情報またはサンプル特許特 性情報を受け付けた力どうか判断する。そして、特許特性情報等を受け付けた場合 に ίま、ステップ S302に進み、そうでな ヽ場合に ίま、ステップ S303に進む。
[0102] (ステップ S302)特許特性情報蓄積部 32は、特許特性情報受付部 31が特許特性 情報を受け付けた場合には、その特許特性情報を特許特性情報記憶部 33に蓄積 する。特許特性情報蓄積部 32は、特許特性情報受付部 31がサンプル特許特性情 報を受け付けた場合には、そのサンプル特許特性情報をサンプル特許特性情報記 憶部 34に蓄積する。そして、ステップ S101に戻る。
[0103] (ステップ S303)特許価値情報算出部 35は、特許価値情報を算出するかどうか判 断する。そして、特許価値情報を算出する場合には、ステップ S304に進み、そうでな い場合には、ステップ S101に戻る。ここで、特許価値情報算出部 35が特許価値情 報を算出すると判断するタイミングは問わない。例えば、所定のイベントの発生 (例え ば、特許価値情報を算出する旨の指示が受け付けられたことなど)をトリガーとして特 許価値情報を算出すると判断してもよい。
[0104] (ステップ S304)特許価値情報算出部 35は、サンプル特許特性情報記憶部 34が 記憶して 、るサンプル特許特性情報と、サンプル特許価値情報記憶部 18が記憶し て 、るサンプル特許価値情報とを教師情報として、特許特性情報記憶部 33が記憶し て 、る特許特性情報から特許価値情報を算出する。
[0105] (ステップ S305)特許価値情報出力部 20は、特許価値情報算出部 35が算出した 特許価値情報を週力する。そして、ステップ S 101に戻る。
なお、図 16のフローチャートにおいて、電源オフや処理終了の割り込みにより処理 は終了する。
[0106] 次に、本実施の形態による情報処理装置 3の動作について、具体例を用いて説明 する。この具体例において、情報処理装置 3は前述の具体例と同様にスタンドアロン の PCであるとする。
[0107] まず、実施の形態 1の具体例と同様にして、サンプル特許価値情報が受け付けられ 、サンプル特許価値情報記憶部 18に蓄積されたとする (ステップ S101, S102)。サ ンプル特許価値情報記憶部 18が記憶して 、るサンプル特許価値情報は、図 6で示 されるちのであるとする。
[0108] また、サンプル特許価値情報と同様にして、特許特性情報、及びサンプル特許特 性情報が特許特性情報受付部 31で受け付けられ、特許特性情報記憶部 33、及び サンプル特許特性情報記憶部 34に蓄積されたとする (ステップ S301, S302)。特許 特性情報記憶部 33が記憶している特許特性情報は、図 17で示されるものであり、サ ンプル特許特性情報記憶部 34が記憶して 、るサンプル特許特性情報は、図 14で示 されるちのであるとする。
[0109] 次に、ユーザは、実施の形態 1の図 7と同様の画面において、マウスを操作して特 許文書 ID「P1999— 111111」の左側のラジオボタンをクリックすることにより、特許 文書 ID ΓΡ1999- 111111」で識別される特許文書情報を選択したとする。そして、 ユーザがマウスを操作することによって「OK」ボタンをクリックする。すると、特許特性 情報算出部 24は、特許文書 ID ΓΡ1999- 111111」で識別される特許文書情報に ついて特許特性情報を算出する旨の指示を受け付けたと判断する (ステップ S303) 。そして、特許価値情報算出部 35は、サンプル特許特性情報記憶部 34から教師情 報としてのサンプル特許特性情報を読み出し、サンプル特許価値情報記憶部 18か ら教師情報としてのサンプル特許価値情報を読み出す。特許価値情報算出部 35は 、それらの情報を実施の形態 1の図 10と同様にサポートベクターマシンに読み込む 形式に変換する。特許価値情報算出部 35は、特許特性情報記憶部 33から特許価 値情報を算出する特許文書情報の特許特性情報を読み出し、教師情報を読み込み 、サポートベクターマシンを用いて、読み出した特許特性情報に対応する特許価値 情報を算出する。ここで用いられるサポートベクターマシンでは、多クラスのクラス分 類を行うものとする。ここでは、特許文書 ID「P1999— 111111」で識別される特許文 書情報の特許価値「70」が算出されたとする (ステップ S304)。すると、特許価値情 報出力部 36は、算出された特許価値情報を、実施の形態 1の図 11と同様に、情報 処理装置 3のディスプレイに表示する(ステップ S 305)。このようにして、ユーザは、特 許価値情報について知ることができる。
[0110] 以上のように、本実施の形態による情報処理装置 3では、特許価値情報算出部 35 がサンプル特許特性情報とサンプル特許価値情報とを教師情報として用いることに より、所望の特許文書情報の価値を示す特許価値情報を算出することができる。この ように、教師情報を用いて特許価値情報の算出を行うため、ユーザの主観的な評価 の要素を考慮した特許価値の算出を行うことができる。一方、ユーザごとに特許価値 情報を算出するための複雑な式等を設定する必要がなぐ式を設定するための煩雑 な作業を行わなくてよいことになる。
[0111] なお、実施の形態 2, 3では、特許特性情報や、サンプル特許特性情報がユーザ等 によって決定され、その値が受付部で受け付けられる場合について説明したが、特 許特性情報や、サンプル特許特性情報は、所定の処理によって機械的に決定され たものであってもよい。例えば、上記特許文献 1で記載されているように、所定の式を 用いて、特許特性情報等を算出し、その算出された特許特性情報等を情報処理装 置にぉ 、て用いるようにしてもょ 、。
[0112] また、実施の形態 2, 3において、特許特性情報は、発明本質抽出特性、強靱特性 、発明展開特性、及び実施可能担保特性を含むものであると説明したが、特許特性 情報は、発明本質抽出特性、強靱特性、発明展開特性、及び実施可能担保特性の 群カゝら選ばれる、特許文書情報の 1以上の特性を示す情報であってもよい。すなわ ち、特許特性情報は、特許特性情報は、発明本質抽出特性、強靱特性、発明展開 特性、及び実施可能担保特性の任意の 1以上の情報であってもよい。サンプル特許 特性情報につ 、ても同様である。
[0113] また、上記各実施の形態の具体例では、サポートベクターマシンによって多クラス のクラス分類を行う場合について説明した力 サポートベクターマシンによって 2値の クラス分類や実数値の出力を行ってもよいことは、前述の通りである。前者の場合に は、例えば、特許文書情報を、価値のある特許文書情報と、価値のない特許文書情 報と〖こ分類することができる。具体的には、過去にライセンス交渉や権利行使などに ぉ ヽて用いた特許のうち、ライセンス交渉や権利行使の成功した特許に対応する特 許文書情報を、価値のある特許文書情報として、ライセンス交渉や権利行使の失敗 した特許に対応する特許文書情報を、価値のな!ヽ特許文書情報としてもよ!ヽ。
[0114] また、上記各実施の形態では、サンプル特許価値情報や特許特性情報、サンプル 特許特性情報等が受付部によって受け付けられ、記憶部に蓄積される場合につい て説明したが、それらの情報があらかじめ記憶されている着脱可能な記憶部が情報 処理装置に装着されることにより、それらの情報を記憶している記憶部が構成される ようにしてもよい。
[0115] また、上記各実施の形態の具体例では、特許価値情報の算出や特許特性情報の 算出にぉ 、てサポートベクターマシンを用いる場合にっ 、て説明した力 サポートべ クタ一マシン以外の方法によって特許価値情報等を算出してもよいことは、前述のと おりである。例えば、特許価値情報の式が次のように定められているとする。
[0116] (特許価値情報) =A1 X (請求項の数) +A2 X (独立形式の請求項の数) +A3 X
(カテゴリー数) +A4 X (ネストレベル) +A5 X (特許請求の範囲の文字数) +A6 X (代表請求項の構成要素数) +A7 X (代表請求項の読点の数) +A8 X (代表請求 項の文字数) +A9 X (代表請求項の前提部の文字数) +A10 X (代表請求項の特 徴部の文字数) +A11 X (代表請求項の代表構成要素の文字数) +A12 X (特許文 献数) +A13 X (非特許文献数) +A14 X (実施の形態の文字数) +A15 X (実施 の形態での例示の数) +A16 X (実施の形態での外延拡張表記の数) +A17 X (図 面数) [0117] この場合に、サンプル特許価値情報と、サンプル文書属性情報とを用いて、 Al〜 A17の各係数の値を算出してもよい。この場合に、サンプル特許価値情報と、サンプ ル文書属性情報との組を未定の係数の個数である 17組以上用意しておき、最小二 乗法等を用いて、最も確からしい係数 A1〜A17の値を算出し、その係数の値を用い て、文書属性情報を代入することによって、特許価値情報を算出してもよい。なお、 複数存在する属性のうち、特許価値情報と相関のある属性のみを用いてもよい。例 えば、サンプル文書属性情報に含まれる各属性 (例えば、請求項の数や独立形式の 請求項の数など)について、一の属性の値の集合と、対応するサンプル特許価値情 報の値の集合との間の相関係数を算出する。そして、その相関係数の絶対値が所定 のしきい値 (例えば、 0. 5など)よりも大きい場合にのみ、その属性を上記の特許価値 情報の式の変数として用いるようにしてもよい。このようにすることで、特許価値情報と 相関の低い属性を特許価値情報の変数力も除外することができ、より適切な特許価 値情報の算出を行うことができうる。なお、相関係数の絶対値と所定のしきい値との 比較を行うのではなぐ相関係数の絶対値が大きいもの力も所定の個数 (例えば、 10 個など)の属性を選択して、その選択した属性のみを特許価値情報の変数として用 いるようにしてもよい。実施の形態 2, 3の場合にも、同様にすることができる。この場 合も、係数を求めるために用いられるサンプル特許価値情報や、サンプル文書属性 情報等が教師情報となる。なお、上記式において、どのような文書属性情報を用いる の力、また、各属性値について線形である力、あるいは、非線形である力、各属性値 の 1次の式とするの力、あるいは、 2次以上の式にするの力 などについては任意で あり、ユーザ等が自由に式を決定できることはいうまでもない。
[0118] また、上記各実施の形態では、特許価値情報や特許特性情報が数値として算出さ れ、出力する場合について説明したが、それらの出力時に、その数値を定性的な指 標に変換してもよい。例えば、特許価値情報が 1から 5の 5段階で算出される場合に、 特許価値情報「5」の場合には、特許価値情報「高」を出力し、特許価値情報「4」の 場合には、特許価値情報「やや高」を出力し、特許価値情報「3」の場合には、特許 価値情報「中」を出力してもよ 、。
[0119] また、特許文書情報は、上記各実施の形態で説明した以外の情報、例えば、拒絶 理由通知書や、意見書、審判請求書等の出願の包袋に含まれうる文書の情報を含 んでもよぐさらに、他の特許出願の拒絶理由において引用された回数等を含んでも よい。また、特許文書情報がそれらの情報を含む場合に、それらの情報に含まれる 情報、例えば、他の特許出願の拒絶理由において引用された回数や、拒絶理由通 知書の数等を文書属性情報が含んでもょ 、。
[0120] また、特許価値情報の算出や特許特性情報の算出において、サポートベクターマ シン等力もの算出値を正規ィ匕してもよい。例えば、 0から 150までのいずれかの整数 で示される値を、 0から 100までの値に正規化してもよい。
[0121] また、上記各実施の形態の具体例において、情報処理装置がスタンドアロンである 場合について説明したが、情報処理装置は、スタンドアロンの装置であってもよぐサ ーバ ·クライアントシステムにおけるサーバ装置であってもよ!/、。
[0122] また、上記各実施の形態において、各処理または各機能は、単一の装置または単 一のシステムによって集中処理されることによって実現されてもよぐあるいは、複数 の装置または複数のシステムによって分散処理されることによって実現されてもよい。
[0123] また、上記各実施の形態において、各構成要素は専用のハードウェアにより構成さ れてもよぐあるいは、ソフトウェアにより実現可能な構成要素については、プログラム を実行することによって実現されてもよい。例えば、ハードディスクや半導体メモリ等 の記録媒体に記録されたソフトウェア 'プログラムを CPU等のプログラム実行部が読 み出して実行することによって、各構成要素が実現され得る。なお、上記実施の形態 における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つ まり、このプログラムは、コンピュータに、文書属性情報記憶部が記憶している、特許 の文書に関する情報である特許文書情報から取得された情報であって、当該特許文 書情報の属性を示す情報である文書属性情報から、サンプル文書属性情報記憶部 が記憶して 、る、教師情報として用いられる文書属性情報であるサンプル文書属性 情報と、サンプル特許価値情報記憶部が記憶している、前記サンプル文書属性情報 記憶部で記憶されるサンプル文書属性情報に対応する情報であり、教師情報として 用いられる、特許文書情報の価値を示す情報であるサンプル特許価値情報とを教師 情報として、特許文書情報の価値を示す情報である特許価値情報を算出する特許 価値情報算出ステップと、前記特許価値情報算出ステップで算出した特許価値情報 を出力する特許価値情報出力ステップと、を実行させるためのものである。
[0124] また、上記実施の形態における情報処理装置を実現する他のソフトウェアは、以下 のようなプログラムである。つまり、このプログラムは、コンピュータに、文書属性情報 記憶部が記憶して!/、る、特許の文書に関する情報である特許文書情報から取得され た情報であって、当該特許文書情報の属性を示す情報である文書属性情報から、サ ンプル文書属性情報記憶部が記憶して!/、る、教師情報として用いられる文書属性情 報であるサンプル文書属性情報と、サンプル特許特性情報記憶部が記憶して!/ヽる、 前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する 情報であり、教師情報として用いられる、特許文書情報において発明の本質を抽出 している程度を示す特性である発明本質抽出特性、特許文書情報において、発明 にかかる出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程度を 示す特性である強靱特性、特許文書情報にお!ヽて発明を展開して!/ヽる程度を示す 特性である発明展開特性、及び特許文書情報にお!ヽて発明につ!ヽて実施可能に記 載されて!、る程度を示す特性である実施可能担保特性の群から選ばれる、特許文書 情報の 1以上の特性を示す情報であるサンプル特許特性情報とを教師情報として、 特許文書情報の特性を示す情報である特許特性情報を算出する特許特性情報算 出ステップと、前記特許特性情報算出ステップで算出した特許特性情報を出力する 特許特性情報出力ステップと、を実行させるためのものである。
[0125] また、上記実施の形態における情報処理装置を実現する他のソフトウェアは、以下 のようなプログラムである。つまり、このプログラムは、コンピュータに、特許特性情報 記憶部が記憶して!/、る、特許の文書に関する情報である特許文書情報にお!、て発 明の本質を抽出して ヽる程度を示す特性である発明本質抽出特性、特許文書情報 において、発明にかかる出願が拒絶される程度、あるいは、発明にかかる特許が無 効になる程度を示す特性である強靱特性、特許文書情報にぉ ヽて発明を展開して V、る程度を示す特性である発明展開特性、及び特許文書情報にぉ 、て発明につ ヽ て実施可能に記載されている程度を示す特性である実施可能担保特性の群力 選 ばれる、特許文書情報の 1以上の特性を示す情報である特許特性情報から、サンプ ル特許特性情報記憶部が記憶して 、る、教師情報として用いられる特許特性情報で あるサンプル特許特性情報と、サンプル特許価値情報記憶部が記憶している、前記 サンプル特許特性情報記憶部で記憶されるサンプル特許特性情報に対応する情報 であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサンプル 特許価値情報とを教師情報として、特許文書情報の価値を示す情報である特許価 値情報を算出する特許価値情報算出ステップと、前記特許価値情報算出ステップで 算出した特許価値情報を出力する特許価値情報出力ステップと、を実行させるため のものである。
[0126] なお、上記プログラムにお 、て、情報を送信する出力ステップや、情報を受け付け る受付ステップなどでは、ハードウェアでし力、行われない処理、例えば、出力ステップ におけるモデムやインターフェースカードなどで行われる処理は少なくとも含まれな い。
[0127] また、このプログラムは、サーバなど力 ダウンロードされることによって実行されても よぐ所定の記録媒体 (例えば、 CD— ROMなどの光ディスクや磁気ディスク、半導 体メモリなど)に記録されたプログラムが読み出されることによって実行されてもよい。
[0128] また、このプログラムを実行するコンピュータは、単数であってもよぐ複数であって もよい。すなわち、集中処理を行ってもよぐあるいは分散処理を行ってもよい。
また、本発明は、以上の実施の形態に限定されることなぐ種々の変更が可能であ り、それらも本発明の範囲内に包含されるものであることは言うまでもない。
産業上の利用可能性
[0129] 以上より、本発明による情報処理装置等によれば、各ユーザの主観的な評価の要 素を考慮した特許の価値等の算出を行うことができ、特許価値等を算出する情報処 理装置等として有用である。
図面の簡単な説明
[0130] [図 1]本発明の実施の形態 1による情報処理装置の構成を示すブロック図
[図 2]同実施の形態による情報処理装置の動作を示すフローチャート
[図 3]同実施の形態における特許文書 IDと特許文書情報との対応の一例を示す図 [図 4]同実施の形態における特許文書情報の一例を示す図 圆 5]同実施の形態による情報処理装置の外観の一例を示す模式図 圆 6]同実施の形態におけるサンプル特許価値情報の一例を示す図
[図 7]同実施の形態による情報処理装置の外観の一例を示す模式図 圆 8]同実施の形態における文書属性情報の一例を示す図
圆 9]同実施の形態におけるサンプル文書属性情報の一例を示す図
[図 10]同実施の形態におけるサポートベクターマシンに入力するデータの一 す図
圆 11]同実施の形態による情報処理装置の外観の一例を示す模式図 圆 12]本発明の実施の形態 2による情報処理装置の構成を示すブロック図 圆 13]同実施の形態による情報処理装置の動作を示すフローチャート 圆 14]同実施の形態におけるサンプル特許特性情報の一例を示す図 圆 15]本発明の実施の形態 3による情報処理装置の構成を示すブロック図 圆 16]同実施の形態による情報処理装置の動作を示すフローチャート 圆 17]同実施の形態における特許特性情報の一例を示す図
[図 18]他の実施の形態による情報処理装置の構成を示すブロック図
[図 19]他の実施の形態による情報処理装置の動作を示すフローチャート [図 20]他の実施の形態による情報処理装置の構成を示すブロック図
[図 21]他の実施の形態による情報処理装置の構成を示すブロック図 圆 22]他の実施の形態における数値ィ匕対応情報の一例を示す図 圆 23]他の実施の形態における対応情報の一例を示す図

Claims

請求の範囲
[1] 特許の文書に関する情報である特許文書情報力 取得された情報であって、当該特 許文書情報の属性を示す情報である文書属性情報が記憶される文書属性情報記憶 部と、
教師情報として用いられる文書属性情報であるサンプル文書属性情報が記憶される サンプル文書属性情報記憶部と、
前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する 情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサン プル特許価値情報が記憶されるサンプル特許価値情報記憶部と、
前記サンプル文書属性情報記憶部が記憶して!/、るサンプル文書属性情報と、前記 サンプル特許価値情報記憶部が記憶しているサンプル特許価値情報とを教師情報 として、前記文書属性情報記憶部が記憶している文書属性情報から、特許文書情報 の価値を示す情報である特許価値情報を算出する特許価値情報算出部と、 前記特許価値情報算出部が算出した特許価値情報を出力する特許価値情報出力 部と、を具備する情報処理装置。
[2] 前記特許価値情報算出部は、サポートベクターマシンにより特許価値情報を算出す る、請求項 1記載の情報処理装置。
[3] 特許の文書に関する情報である特許文書情報力 取得された情報であって、当該特 許文書情報の属性を示す情報である文書属性情報が記憶される文書属性情報記憶 部と、
教師情報として用いられる文書属性情報であるサンプル文書属性情報が記憶される サンプル文書属性情報記憶部と、
前記サンプル文書属性情報記憶部で記憶されるサンプル文書属性情報に対応する 情報であり、教師情報として用いられる、特許文書情報において発明の本質を抽出 している程度を示す特性である発明本質抽出特性、特許文書情報において、発明 にかかる出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程度を 示す特性である強靱特性、特許文書情報にお!ヽて発明を展開して!/ヽる程度を示す 特性である発明展開特性、及び特許文書情報にお!ヽて発明につ!ヽて実施可能に記 載されて!、る程度を示す特性である実施可能担保特性の群から選ばれる、特許文書 情報の 1以上の特性を示す情報であるサンプル特許特性情報が記憶されるサンプル 特許特性情報記憶部と、
前記サンプル文書属性情報記憶部が記憶して!/、るサンプル文書属性情報と、前記 サンプル特許特性情報記憶部が記憶しているサンプル特許特性情報とを教師情報 として、前記文書属性情報記憶部が記憶している文書属性情報から、特許文書情報 の特性を示す情報である特許特性情報を算出する特許特性情報算出部と、 前記特許特性情報算出部が算出した特許特性情報を出力する特許特性情報出力 部と、を具備する情報処理装置。
[4] 前記特許特性情報算出部は、サポートベクターマシンにより特許特性情報を算出す る、請求項 3記載の情報処理装置。
[5] 1以上の特許文書情報が記憶される特許文書情報記憶部と、
前記特許文書情報記憶部が記憶している特許文書情報から文書属性情報を取得す る文書属性情報取得部と、
前記文書属性情報取得部が取得した文書属性情報を前記文書属性情報記憶部に 蓄積する文書属性情報蓄積部と、をさらに具備する請求項 1から請求項 4のいずれ か記載の情報処理装置。
[6] 前記特許文書情報記憶部では、前記サンプル文書属性情報を算出するための特許 文書情報であるサンプル特許文書情報も記憶され、
前記文書属性情報取得部は、前記サンプル特許文書情報からサンプル文書属性情 報を取得し、
前記文書属性情報蓄積部は、前記文書属性情報取得部が算出したサンプル文書 属性情報を前記サンプル文書属性情報記憶部に蓄積する、請求項 5記載の情報処 理装置。
[7] 前記文書属性情報は、特許文書情報における請求項の数、特許文書情報における 独立形式の請求項の数、特許文書情報における特許請求の範囲のカテゴリー数、 特許文書情報における特許請求の範囲のネストレベル、特許文書情報における特 許請求の範囲の文字数、特許文書情報における代表請求項の構成要素数、特許文 書情報における代表請求項の読点の数、特許文書情報における代表請求項の文字 数、特許文書情報における代表請求項の単位情報数、特許文書情報における代表 請求項の前提部の文字数、特許文書情報における代表請求項の特徴部の文字数、 特許文書情報における代表請求項の前提部の単位情報数、特許文書情報における 代表請求項の特徴部の単位情報数、特許文書情報における代表請求項の代表構 成要素の文字数、特許文書情報における代表請求項の代表構成要素の単位情報 数、特許文書情報において引用されている特許文献数、特許文書情報において引 用されている非特許文献数、特許文書情報における実施の形態の文字数、特許文 書情報における実施の形態の単位情報数、特許文書情報における実施の形態での 例示の数、特許文書情報における実施の形態での外延拡張表記の数、特許文書情 報における実施の形態での数式の数、特許文書情報における実施の形態での化学 式の数、特許文書情報における図面数、特許文書情報における構成を示す図の数 、特許文書情報におけるフローチャートの数、特許文書情報におけるデータ構造を 示す図の数、特許文書情報における画面出力を示す図の数、特許文書情報におけ るハードウェア構成を示す図の数の群力 選ばれる、 1以上の属性を示す情報である 、請求項 1から請求項 6の 、ずれか記載の情報処理装置。
前記文書属性情報は、特許文書情報の国際特許分類、特許文書情報の Fターム、 特許文書情報のフェーズ、特許文書情報で示される発明の技術分野、特許文書情 報に関する権利の存続期間、特許文書情報で示される発明の種類、特許文書情報 における請求項の数、特許文書情報における独立形式の請求項の数、特許文書情 報における特許請求の範囲のカテゴリー数、特許文書情報における特許請求の範 囲のネストレベル、特許文書情報における特許請求の範囲の文字数、特許文書情 報における代表請求項の構成要素数、特許文書情報における代表請求項の読点の 数、特許文書情報における代表請求項の文字数、特許文書情報における代表請求 項の単位情報数、特許文書情報における代表請求項の前提部の文字数、特許文書 情報における代表請求項の特徴部の文字数、特許文書情報における代表請求項の 前提部の単位情報数、特許文書情報における代表請求項の特徴部の単位情報数、 特許文書情報における代表請求項の代表構成要素の文字数、特許文書情報にお ける代表請求項の代表構成要素の単位情報数、特許文書情報において引用されて いる特許文献数、特許文書情報において引用されている非特許文献数、特許文書 情報における実施の形態の文字数、特許文書情報における実施の形態の単位情報 数、特許文書情報における実施の形態での例示の数、特許文書情報における実施 の形態での外延拡張表記の数、特許文書情報における実施の形態での数式の数、 特許文書情報における実施の形態での化学式の数、特許文書情報における図面数 、特許文書情報における構成を示す図の数、特許文書情報におけるフローチャート の数、特許文書情報におけるデータ構造を示す図の数、特許文書情報における画 面出力を示す図の数、特許文書情報におけるハードウェア構成を示す図の数の群 から選ばれる、 1以上の属性を示す情報である、請求項 1から請求項 6のいずれか記 載の情報処理装置。
特許の文書に関する情報である特許文書情報において発明の本質を抽出している 程度を示す特性である発明本質抽出特性、特許文書情報において、発明にかかる 出願が拒絶される程度、あるいは、発明にかかる特許が無効になる程度を示す特性 である強靱特性、特許文書情報にぉ ヽて発明を展開して ヽる程度を示す特性である 発明展開特性、及び特許文書情報において発明について実施可能に記載されてい る程度を示す特性である実施可能担保特性の群から選ばれる、特許文書情報の 1以 上の特性を示す情報である特許特性情報が記憶される特許特性情報記憶部と、 教師情報として用いられる特許特性情報であるサンプル特許特性情報が記憶される サンプル特許特性情報記憶部と、
前記サンプル特許特性情報記憶部で記憶されるサンプル特許特性情報に対応する 情報であり、教師情報として用いられる、特許文書情報の価値を示す情報であるサン プル特許価値情報が記憶されるサンプル特許価値情報記憶部と、
前記サンプル特許特性情報記憶部が記憶して!/、るサンプル特許特性情報と、前記 サンプル特許価値情報記憶部が記憶しているサンプル特許価値情報とを教師情報 として、前記特許特性情報記憶部が記憶している特許特性情報から、特許文書情報 の価値を示す情報である特許価値情報を算出する特許価値情報算出部と、 前記特許価値情報算出部が算出した特許価値情報を出力する特許価値情報出力 部と、を具備する情報処理装置。
[10] 前記特許価値情報算出部は、サポートベクターマシンにより特許価値情報を算出す る、請求項 9記載の情報処理装置。
[11] 前記サポートベクターマシンは、多クラスのクラス分類を行うものである、請求項 2、請 求項 4、請求項 10の 、ずれか記載の情報処理装置。
[12] 前記サポートベクターマシンは、実数値を出力とするものである、請求項 2、請求項 4 、請求項 10のいずれか記載の情報処理装置。
[13] 前記サポートベクターマシンは、 2値のクラス分類を行うものである、請求項 2、請求 項 4、請求項 10のいずれか記載の情報処理装置。
[14] 文書属性情報記憶部が記憶して!/、る、特許の文書に関する情報である特許文書情 報から取得された情報であって、当該特許文書情報の属性を示す情報である文書 属性情報から、サンプル文書属性情報記憶部が記憶している、教師情報として用い られる文書属性情報であるサンプル文書属性情報と、サンプル特許価値情報記憶 部が記憶して!/、る、前記サンプル文書属性情報記憶部で記憶されるサンプル文書 属性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値 を示す情報であるサンプル特許価値情報とを教師情報として、特許文書情報の価値 を示す情報である特許価値情報を算出する特許価値情報算出ステップと、 前記特許価値情報算出ステップで算出した特許価値情報を出力する特許価値情報 出力ステップと、を具備する情報処理方法。
[15] 文書属性情報記憶部が記憶して!/、る、特許の文書に関する情報である特許文書情 報から取得された情報であって、当該特許文書情報の属性を示す情報である文書 属性情報から、サンプル文書属性情報記憶部が記憶している、教師情報として用い られる文書属性情報であるサンプル文書属性情報と、サンプル特許特性情報記憶 部が記憶して!/、る、前記サンプル文書属性情報記憶部で記憶されるサンプル文書 属性情報に対応する情報であり、教師情報として用いられる、特許文書情報におい て発明の本質を抽出して ヽる程度を示す特性である発明本質抽出特性、特許文書 情報において、発明にかかる出願が拒絶される程度、あるいは、発明にかかる特許 が無効になる程度を示す特性である強靱特性、特許文書情報にぉ 、て発明を展開 して 、る程度を示す特性である発明展開特性、及び特許文書情報にぉ 、て発明に っ 、て実施可能に記載されて 、る程度を示す特性である実施可能担保特性の群か ら選ばれる、特許文書情報の 1以上の特性を示す情報であるサンプル特許特性情報 とを教師情報として、特許文書情報の特性を示す情報である特許特性情報を算出す る特許特性情報算出ステップと、
前記特許特性情報算出ステップで算出した特許特性情報を出力する特許特性情報 出力ステップと、を具備する情報処理方法。
[16] 特許特性情報記憶部が記憶して!/、る、特許の文書に関する情報である特許文書情 報において発明の本質を抽出している程度を示す特性である発明本質抽出特性、 特許文書情報において、発明にかかる出願が拒絶される程度、あるいは、発明にか カゝる特許が無効になる程度を示す特性である強靱特性、特許文書情報にぉ ヽて発 明を展開して!/ヽる程度を示す特性である発明展開特性、及び特許文書情報にぉ 、 て発明につ ヽて実施可能に記載されて ヽる程度を示す特性である実施可能担保特 性の群から選ばれる、特許文書情報の 1以上の特性を示す情報である特許特性情 報から、サンプル特許特性情報記憶部が記憶している、教師情報として用いられる 特許特性情報であるサンプル特許特性情報と、サンプル特許価値情報記憶部が記 憶して ヽる、前記サンプル特許特性情報記憶部で記憶されるサンプル特許特性情 報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す 情報であるサンプル特許価値情報とを教師情報として、特許文書情報の価値を示す 情報である特許価値情報を算出する特許価値情報算出ステップと、
前記特許価値情報算出ステップで算出した特許価値情報を出力する特許価値情報 出力ステップと、を具備する情報処理方法。
[17] コンピュータに、
文書属性情報記憶部が記憶して!/、る、特許の文書に関する情報である特許文書情 報から取得された情報であって、当該特許文書情報の属性を示す情報である文書 属性情報から、サンプル文書属性情報記憶部が記憶している、教師情報として用い られる文書属性情報であるサンプル文書属性情報と、サンプル特許価値情報記憶 部が記憶して!/、る、前記サンプル文書属性情報記憶部で記憶されるサンプル文書 属性情報に対応する情報であり、教師情報として用いられる、特許文書情報の価値 を示す情報であるサンプル特許価値情報とを教師情報として、特許文書情報の価値 を示す情報である特許価値情報を算出する特許価値情報算出ステップと、 前記特許価値情報算出ステップで算出した特許価値情報を出力する特許価値情報 出力ステップと、を実行させるためのプログラム。
[18] コンピュータに、
文書属性情報記憶部が記憶して!/、る、特許の文書に関する情報である特許文書情 報から取得された情報であって、当該特許文書情報の属性を示す情報である文書 属性情報から、サンプル文書属性情報記憶部が記憶している、教師情報として用い られる文書属性情報であるサンプル文書属性情報と、サンプル特許特性情報記憶 部が記憶して!/、る、前記サンプル文書属性情報記憶部で記憶されるサンプル文書 属性情報に対応する情報であり、教師情報として用いられる、特許文書情報におい て発明の本質を抽出して ヽる程度を示す特性である発明本質抽出特性、特許文書 情報において、発明にかかる出願が拒絶される程度、あるいは、発明にかかる特許 が無効になる程度を示す特性である強靱特性、特許文書情報にぉ 、て発明を展開 して 、る程度を示す特性である発明展開特性、及び特許文書情報にぉ 、て発明に っ 、て実施可能に記載されて 、る程度を示す特性である実施可能担保特性の群か ら選ばれる、特許文書情報の 1以上の特性を示す情報であるサンプル特許特性情報 とを教師情報として、特許文書情報の特性を示す情報である特許特性情報を算出す る特許特性情報算出ステップと、
前記特許特性情報算出ステップで算出した特許特性情報を出力する特許特性情報 出力ステップと、を実行させるためのプログラム。
[19] コンピュータに、
特許特性情報記憶部が記憶して!/、る、特許の文書に関する情報である特許文書情 報において発明の本質を抽出している程度を示す特性である発明本質抽出特性、 特許文書情報において、発明にかかる出願が拒絶される程度、あるいは、発明にか カゝる特許が無効になる程度を示す特性である強靱特性、特許文書情報にぉ ヽて発 明を展開して!/ヽる程度を示す特性である発明展開特性、及び特許文書情報にぉ 、 て発明につ ヽて実施可能に記載されて ヽる程度を示す特性である実施可能担保特 性の群から選ばれる、特許文書情報の 1以上の特性を示す情報である特許特性情 報から、サンプル特許特性情報記憶部が記憶している、教師情報として用いられる 特許特性情報であるサンプル特許特性情報と、サンプル特許価値情報記憶部が記 憶して ヽる、前記サンプル特許特性情報記憶部で記憶されるサンプル特許特性情 報に対応する情報であり、教師情報として用いられる、特許文書情報の価値を示す 情報であるサンプル特許価値情報とを教師情報として、特許文書情報の価値を示す 情報である特許価値情報を算出する特許価値情報算出ステップと、
前記特許価値情報算出ステップで算出した特許価値情報を出力する特許価値情報 出力ステップと、を実行させるためのプログラム。
[20] 前記文書属性情報記憶部で記憶されて!、る文書属性情報のうち、数値でな!、ものを 数値化して前記文書属性情報記憶部に蓄積する文書属性情報数値ィヒ部をさらに備 えた、請求項 1から請求項 8の 、ずれか記載の情報処理装置。
[21] 前記文書属性情報数値化部は、非数値の文書属性情報と、数値の文書属性情報と を対応付けて有する情報である数値化対応情報を記録媒体において保持しており、 前記数値化対応情報を用いて、数値でな!、文書属性情報を数値の文書属性情報に 変換する、請求項 20記載の情報処理装置。
[22] 前記分所属性情報数値化部は、前記サンプル文書属性情報記憶部で記憶されて!、 るサンプル文書属性情報のうち、数値でな 、ものを数値ィ匕して前記サンプル文書属 性情報記憶部に蓄積する、請求項 20または請求項 21記載の情報処理装置。
[23] 前記特許価値情報算出部は、サポートベクター回帰により特許価値情報を算出する 、請求項 1記載の情報処理装置。
[24] 前記特許特性情報算出部は、サポートベクター回帰により特許特性情報を算出する 、請求項 3記載の情報処理装置。
[25] 前記特許価値情報算出部は、サポートベクター回帰により特許価値情報を算出する 、請求項 9記載の情報処理装置。
PCT/JP2006/320452 2005-10-31 2006-10-13 情報処理装置、及び情報処理方法 WO2007052460A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007542309A JP4674871B2 (ja) 2005-10-31 2006-10-13 情報処理装置、及び情報処理方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005315726 2005-10-31
JP2005-315726 2005-10-31

Publications (1)

Publication Number Publication Date
WO2007052460A1 true WO2007052460A1 (ja) 2007-05-10

Family

ID=38005613

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/320452 WO2007052460A1 (ja) 2005-10-31 2006-10-13 情報処理装置、及び情報処理方法

Country Status (2)

Country Link
JP (1) JP4674871B2 (ja)
WO (1) WO2007052460A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733549A (zh) * 2020-12-31 2021-04-30 厦门智融合科技有限公司 一种基于多重语义融合的专利价值信息分析方法、装置
JPWO2021090394A1 (ja) * 2019-11-06 2021-05-14

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004038628A1 (ja) * 2002-10-23 2004-05-06 Ird Corp. 情報処理装置およびプログラム
JP2004185421A (ja) * 2002-12-04 2004-07-02 Mitsubishi Trust & Banking Corp 財務定量評価システム
WO2004084096A1 (ja) * 2003-03-19 2004-09-30 Fujitsu Limited 事例分類装置および方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004038628A1 (ja) * 2002-10-23 2004-05-06 Ird Corp. 情報処理装置およびプログラム
JP2004185421A (ja) * 2002-12-04 2004-07-02 Mitsubishi Trust & Banking Corp 財務定量評価システム
WO2004084096A1 (ja) * 2003-03-19 2004-09-30 Fujitsu Limited 事例分類装置および方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2021090394A1 (ja) * 2019-11-06 2021-05-14
WO2021090394A1 (ja) * 2019-11-06 2021-05-14 本田技研工業株式会社 知的財産権の評価システム、知的財産権の評価方法、評価用プログラム、及び修正用データ
JP7270059B2 (ja) 2019-11-06 2023-05-09 本田技研工業株式会社 知的財産権の評価システム、知的財産権の評価方法、及び評価用プログラム
CN112733549A (zh) * 2020-12-31 2021-04-30 厦门智融合科技有限公司 一种基于多重语义融合的专利价值信息分析方法、装置
CN112733549B (zh) * 2020-12-31 2024-03-01 厦门智融合科技有限公司 一种基于多重语义融合的专利价值信息分析方法、装置

Also Published As

Publication number Publication date
JPWO2007052460A1 (ja) 2009-04-30
JP4674871B2 (ja) 2011-04-20

Similar Documents

Publication Publication Date Title
Lancaster et al. Classifications of plagiarism detection engines
WO2016147276A1 (ja) データ分析システム及びデータ分析方法並びにデータ分析プログラム
US20180253486A1 (en) Aggregating Procedures for Automatic Document Analysis
JP2011107826A (ja) 行動情報抽出システム及び抽出方法
WO2014049708A1 (ja) 文書分析装置およびプログラム
JP2013033376A (ja) 情報処理装置、情報処理方法、および、プログラム
JP2009116457A (ja) インターネットサイト情報分析方法と装置
JP5056133B2 (ja) 情報抽出システム、情報抽出方法および情報抽出用プログラム
WO2014057965A1 (ja) フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
JP2006323517A (ja) テキスト分類装置およびプログラム
JP2011145996A (ja) レビューワ評価装置、レビューワ評価方法、及びプログラム
JP5469036B2 (ja) 電子書籍分析装置及び方法及びプログラム
JP5138621B2 (ja) 情報処理装置及び不満解決商品発見方法及びプログラム
JP5890385B2 (ja) データ処理装置、及びデータ処理方法
JP2006318005A (ja) 特許価値算出装置、特許価値算出方法およびプログラム
Shang et al. DIANES: A DEI Audit Toolkit for News Sources
JP7341786B2 (ja) 指標算出装置および指標算出プログラム
JP4674871B2 (ja) 情報処理装置、及び情報処理方法
JP6124936B2 (ja) データ分析システム、データ分析方法、および、データ分析プログラム
JP2018022331A (ja) 音象徴語・パーソナリティ情報提供装置、音象徴語・パーソナリティ情報提供方法および音象徴語・パーソナリティ情報提供プログラム
JP2009223372A (ja) リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法
CN114254109B (zh) 用于确定行业类别的方法及装置
JP2005004797A (ja) 情報処理装置およびプログラム
JP2006293616A (ja) 文書集約方法及び装置及びプログラム
JP2010020563A (ja) 経過情報出力方法および経過情報出力プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
ENP Entry into the national phase

Ref document number: 2007542309

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS EPO FORM 1205A DATED 28.07.2008.

122 Ep: pct application non-entry in european phase

Ref document number: 06821855

Country of ref document: EP

Kind code of ref document: A1