WO2021152809A1 - 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム - Google Patents

文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム Download PDF

Info

Publication number
WO2021152809A1
WO2021152809A1 PCT/JP2020/003571 JP2020003571W WO2021152809A1 WO 2021152809 A1 WO2021152809 A1 WO 2021152809A1 JP 2020003571 W JP2020003571 W JP 2020003571W WO 2021152809 A1 WO2021152809 A1 WO 2021152809A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
input
document information
unit
document
Prior art date
Application number
PCT/JP2020/003571
Other languages
English (en)
French (fr)
Inventor
白坂 一
崇志 三上
Original Assignee
株式会社 AI Samurai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社 AI Samurai filed Critical 株式会社 AI Samurai
Priority to PCT/JP2020/003571 priority Critical patent/WO2021152809A1/ja
Priority to JP2021574396A priority patent/JP7193890B2/ja
Publication of WO2021152809A1 publication Critical patent/WO2021152809A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents

Definitions

  • the present invention relates to a document information evaluation device, a document information evaluation method, and a document information evaluation program.
  • Patent Document 1 the weight of each document information is calculated from the frequency of appearance of keywords for each segment (constituent unit) constituting each part of the document information, and the similarity is scored based on a predetermined standard based on the weight. It is stated that. According to the system of Patent Document 1, since the similarity is scored for each segment of the document information, it is possible to reliably search even if the content close to the condition is described only in a part of the document information. ..
  • Patent Document 1 based on the system of Patent Document 1, only a part of the document information contains contents close to the conditions, and there may be a case where the document information having a low degree of similarity as a whole is searched.
  • literature information that the user does not intend is searched, it becomes necessary to restart the selection of keywords, phrases, sentences, etc. used for the search conditions from the beginning. Then, the selection of the search condition is repeated many times until the document information having the content close to the condition is searched. This takes a lot of time and is very burdensome for the user.
  • Patent Document 2 discloses a patent specification evaluation / preparation work support device that stores information on intellectual property, evaluates application documents before filing, and supports preparation.
  • the patent specification evaluation / preparation work support device described in Patent Document 1 stores information on the published patent gazette including the notice of reasons for refusal, and searches the stored information in a similar manner to the application documents before filing. It is stated to presume the description of the expected notice of reasons for refusal.
  • An object of the present invention is a document information evaluation device and a document information evaluation device capable of easily evaluating the possibility of acquiring the right of created input information and facilitating the creation of new intellectual property in view of the above problems.
  • the document information evaluation device compares the input information input from the user terminal that can be operated by the user and the text included in the preceding document information, and obtains the preceding document information similar to the input information.
  • a document information evaluation device that extracts and evaluates the degree of similarity between the input information and the extracted prior document information.
  • a document information input unit that accepts input of input information input from a user terminal that can be operated by the user, A storage unit that stores multiple preceding document information, A decision unit that determines the first technical classification of the input information, and A calculation unit that compares the input information and the text included in the preceding document information and calculates the degree of agreement with the input information as a score.
  • An output unit that outputs a comparison table showing the degree of difference between the input information and the document information for each component unit based on the score, and an output unit.
  • a judgment unit that determines the possibility of acquiring rights based on the score
  • a generation unit that generates additional information that improves the possibility of acquiring the right according to the possibility of acquiring the right related to the input information of the user.
  • the output unit outputs prior document information using a second technical classification different from the first technical classification determined by the determination unit according to the possibility of acquiring the right related to the input information of the user.
  • the generation unit is characterized in that it compares the preceding document information and the text included in the input information, and generates additional information based on the document information constituting the difference between the preceding document information and the input information. do.
  • the document information evaluation device further includes a selection unit for selecting the second technical classification.
  • the selection unit It may be characterized in that the technical classification given to the prior art information associated with the prior document information regarding the first technical classification determined by the determination unit is selected as the second technical classification.
  • the generation unit generates a sentence that exists in the preceding document information output using the second technical classification and does not exist in the input information as the additional information. , May be a feature.
  • the output unit can decompose and output the input information for each structural unit.
  • the generation unit may be characterized in that a word that does not exist in the plurality of words constituting the structural unit is generated as the additional information.
  • the display unit may further include a display unit that displays and outputs the evaluated document information as a patent map.
  • the input information input from the user terminal that can be operated by the user and the text included in the preceding document information are compared, and the preceding document information similar to the input information is obtained.
  • the computer A document information input step that accepts input of input information input from a user terminal that can be operated by the user, and A storage step to store multiple preceding document information, A decision step for determining the first technical classification of the input information, and A calculation step of comparing the input information and the text included in the preceding document information and calculating the degree of agreement with the input information as a score.
  • an output step that outputs a comparison table showing the degree of difference between the input information and the document information for each structural unit, and Judgment step to judge the possibility of acquisition of rights based on the above score
  • the output step outputs the preceding document information using a second technical classification different from the first technical classification determined in the determination step according to the possibility of acquiring the right related to the input information of the user.
  • the generation step is characterized in that the preceding document information and the text included in the input information are compared, and additional information is generated based on the document information constituting the difference between the preceding document information and the input information. do.
  • the document information evaluation program compares the input information input from the user terminal that can be operated by the user and the text included in the preceding document information, and obtains the preceding document information similar to the input information.
  • a document information evaluation program that extracts and evaluates the degree of similarity between the input information and the extracted prior document information.
  • On the computer A document information input function that accepts input of input information input from a user terminal that can be operated by the user, A memory function that stores multiple preceding document information, A decision function for determining the first technical classification of the input information and A calculation function that compares the input information and the text included in the preceding document information and calculates the degree of agreement with the input information as a score.
  • An output function that outputs a comparison table showing the degree of difference between the input information and the document information for each structural unit based on the score, and Judgment function to judge the possibility of acquisition of rights based on the above score,
  • a generation function that generates additional information that improves the possibility of acquiring the right according to the possibility of acquiring the right related to the input information of the user.
  • the output function outputs prior document information using a second technical classification different from the first technical classification determined by the determination function according to the possibility of acquiring the right related to the input information of the user.
  • the generation function is characterized in that it compares the preceding document information and the text included in the input information, and generates additional information based on the document information constituting the difference between the preceding document information and the input information. do.
  • a document information evaluation device a document information evaluation method, and knowledge that can easily evaluate the possibility of acquiring the right of created input information and facilitate the creation of new intellectual property. It is possible to provide an intellectual property document information evaluation support program.
  • FIG. 1 is a block diagram showing an example of a software configuration of the document information evaluation device 1 according to the embodiment of the present invention.
  • the document information evaluation device 1 has information acquisition unit 101, storage unit 102, calculation unit 103, output unit 104, and input unit 105.
  • Each of the above-mentioned functional units of the document information evaluation device 1 in the present embodiment will be described as a functional module realized by an information processing program (software) that controls the document information evaluation device 1.
  • the document information evaluation program operates on the document information evaluation device 1. That is, the document information evaluation device 1 refers to a device on which the document information evaluation program operates.
  • the output unit 104 outputs the result of calculating the degree of matching between the input information and the plurality of document information as a score for the input information related to the content that the user wants to search or analyze as a comparison table 100 (see FIG. 3). do. Based on the output result, the user can input a self-evaluation to the comparison table 100. As a result, the document information evaluation device 1 can improve the accuracy of the search or analysis, and is required for the search or analysis when searching or analyzing the document information having contents close to the conditions desired by the user. The time can be reduced and the search efficiency can be improved.
  • the document information evaluation device 1 is a device for connecting to the user terminal 2 via a network (NW) and providing the service of the document information evaluation system to the user terminal 2.
  • the document information evaluation device 1 is, for example, a so-called server device or computer (for example, a desktop, a laptop, a tablet, etc.). In one embodiment of the present invention, the document information evaluation device 1 is not limited to these.
  • the information acquisition unit 101 acquires information on these intellectual properties input from the user terminal 2 from the user terminal 2.
  • the user terminal 2 is a terminal device that can be operated by the user, and is, for example, a desktop PC, a notebook PC, a tablet PC, a smartphone, or the like.
  • a case where the input information and the document information are information related to intellectual property will be described.
  • intellectual property is an idea or creation created by human intellectual activity.
  • Intellectual property is, for example, an invention, a device, a design, a trademark, a copyrighted work, a circuit arrangement, or a new variety of plant.
  • the intellectual property is, for example, a document for explaining the content of the intellectual property, a figure, a table, a graph, a sketch or a photograph (figure, etc.) for explaining the content of the intellectual property, or a figure, etc. It may be a document or the like.
  • the information regarding the intellectual property in the present embodiment is the information for extracting the content that the user wants to search or analyze as described above.
  • Information on intellectual property includes not only information for which rights have been acquired, but also public information before acquisition of rights, undisclosed information, and invention information before filing an application.
  • the acquired information is, for example, information for which a patent right, a utility model right, a design right, a trademark right, a copyright, a circuit layout use right, a breeder's right, etc. are established.
  • the input information and the document information are information such as sentences (statement of claims, subject of invention, purpose of invention, etc.) or drawings indicating the content of the invention.
  • the input information and the document information are information such as a shape, a pattern or a color, or a drawing related to a combination thereof. If the intellectual property is a trademark, the input information and document information are identification marks of goods or services.
  • the storage unit 102 holds the document information.
  • the document information includes various data transmitted and received via the NW, and includes, for example, text data and numerical data.
  • Textual data includes, for example, information about intellectual property, idea sheets, idea memos, litigation-related information, treatises, books (including magazines and weekly magazines), reports and homepages.
  • Numerical data includes, for example, experimental data, measurement data, statistical data, and inspection data.
  • the text information includes mathematical formula data, chart data, photographic data, and image data (including still images and moving images).
  • the information on intellectual property may include information before the acquisition of rights as described above.
  • Information before the acquisition of rights is, for example, information that memorizes the process of creating an invention or design, materials or devices prepared for an experiment, experimental results, titles of research and development, purpose of research and development, and engineers.
  • Ancillary information such as name, engineer's affiliation name, project number, etc.
  • Ancillary information may include information on access rights to information about the acquired intellectual property.
  • the access authority is an authority that can execute processing such as viewing, editing, deleting, and authentication processing for information. For example, an access authority that can execute all processing for a technician who has stored information on intellectual property.
  • the engineers who collaborated in the creation of the intellectual property are given access authority to execute the browsing process, or the certifier (described later) who authenticates the information about the intellectual property is executed the authentication process. Grant access rights that can be done.
  • the information acquisition unit 101 may acquire such incidental information as information regarding intellectual property. Information about these intellectual properties entered by the user is acquired from the user terminal 2.
  • the intellectual property is an invention
  • the intellectual property is not limited to the invention. That is, the creation of intellectual property may include the selection of an identification mark in a trademark.
  • the calculation unit 103 calculates the degree of matching with the input information input from the user terminal 2 based on the document information stored in the storage unit 102. Specifically, the input information is decomposed into predetermined structural units, and the degree of matching with the document information of one of the plurality of document information stored in the storage unit 102 is used as a score for each decomposed structural unit. Can be calculated.
  • the decomposition of the constituent units for example, segmentes the constituent requirements of "information about intellectual property related as an inventor, creator, or applicant" for each punctuation mark. Alternatively, a certain sentence length or a segment may be used for each predicate.
  • the output unit 104 acquires similar information and calculates the degree of approximation between the constituent requirements and the similar information. If a keyword with the same or similar information as the keyword of the constituent requirement is a subordinate concept, it may be judged that the degree of matching is high.
  • the calculation unit 103 can calculate the presence / absence of a subordinate concept or a superordinate concept by the corpus dictionary of words stored in the storage unit 102 in advance.
  • the calculation unit 103 calculates the degree of coincidence between the constituent requirements and similar information, determines whether or not they match by threshold processing, and calculates the matching points and differences of the constituent requirements.
  • the threshold value may be predetermined, or a score calculated by machine learning may be used.
  • the calculation unit 103 specifically receives from the user terminal 2 using a model that has been machine-learned using the information on the intellectual property stored in the storage unit 102 so as to calculate the score of the degree of agreement. It is possible to calculate the degree of agreement between the input information and the information related to the intellectual property. As a result, the document information evaluation device 1 can calculate the score of the degree of coincidence based on the information about the intellectual property (for example, past patent information) more quickly, accurately and easily.
  • the information about the intellectual property used in machine learning is processed after the information about the intellectual property is quantified in advance for each item, and the input information about the intellectual property input from the user terminal 2 is also processed. After quantifying in the same way, the score of the degree of agreement is calculated.
  • the items related to information related to intellectual property that are quantified in advance may be, for example, various information associated with public publications related to intellectual property.
  • Various information related to the public gazette regarding intellectual property includes, for example, the publication date of the public gazette, the submission date of the application documents related to the public gazette (that is, the filing date), and the notice of reasons for refusal received in the application related to the public gazette. Number of times, content in the notice of reasons for refusal, content of response to the notice of reasons for refusal, number of amendments made in the application relating to the publication, content of the amendment, number of characters in the independent claim, number of claims And so on.
  • the calculation unit 103 stores the actual result of the information about the intellectual property whose match degree is calculated by using the document information evaluation device 1 in the past as feedback in the storage unit 102. , Can be used for machine learning. As a result, the document information evaluation device 1 can extract similar prior art documents (prior document information) with higher accuracy.
  • the calculation unit 103 sets a new keyword. You may extract and calculate the score again for the degree of agreement for each constituent requirement. For example, the calculation unit 103 calculates the score again when a new keyword extracted in place of or in addition to the keyword used in the information about the intellectual property input from the user terminal 2 is used. Can be done. At this time, the calculation unit 103 can repeat the extraction of the keywords until the score of the degree of agreement becomes high. When the score of the degree of matching is calculated to be high, the keyword extracted at this time can be output to the user terminal 2 from the output unit 104.
  • the keyword may be extracted at random from the document information about the intellectual property stored in the storage unit 102, or may be extracted from the input information about the intellectual property input from the user terminal 2.
  • Osborne checklist or the like may be used to predetermine a method for extracting keywords, and extraction may be performed based on the method.
  • the document information evaluation device 1 not only calculates the score of the degree of matching with respect to the information related to the intellectual property input from the user terminal 2, but also provides information on how to increase the degree of matching with respect to the information related to the intellectual property. It becomes possible to present it to the user, and it is possible to accurately search or analyze the content desired by the user.
  • Keywords are sentences, phrases, idioms, words, symbols, alphabets, chemical formulas, numbers, etc.
  • the calculation unit 103 stores it in the storage unit 102.
  • Keywords can be extracted from the document information related to the intellectual property, and at this time, the extracted keywords can be used in place of or in addition to the keywords used in the input information related to the intellectual property input from the user terminal 2. It is also possible to extract keywords that are located at the end of the distribution that has a high coincidence score when used. When extracting keywords, the center of the distribution in which the score of the degree of matching is high when the extracted keywords are used in place of or in addition to the keywords used in the information about intellectual property received from the user terminal 2.
  • the document information evaluation device 1 can use keywords that can lower the matching score when limiting information about intellectual property by the extracted keywords. Can be presented. For example, when the information on the intellectual property is an invention for which a patent application is to be filed, the document information evaluation device 1 affirms the possibility of acquiring the right to the invention, while reducing the limitation of the invention. Keywords that can be extracted can be extracted.
  • the calculation unit 103 calculates a new keyword to be added to the information on the intellectual property based on the learning data and the information on the possibility of acquiring the right from the input information on the intellectual property, and the output unit 104.
  • the document information evaluation device 1 can express information about intellectual property in an easy-to-understand manner by the user, and even a user who has little knowledge of the intellectual property law can easily understand the information about intellectual property.
  • the calculation unit 103 may obtain a new similar patent via the output unit 104 for the constituent requirements having a high difference (low coincidence point). .. Specifically, the calculation unit 103 determines that the coincidence point is low, commands the output unit 104 to output new similar information, and the output unit 104 fills in the structural unit having the low coincidence point. You may get new similar information for.
  • the calculation of the degree of matching by the calculation unit 103 is executed by the user pressing the search button 109 (see FIG. 3) and inputting the search signal to the calculation unit 103.
  • the output unit 104 outputs the evaluation result of the document information to the user terminal 2.
  • the evaluation result of the document information is a comparison table in which the degree of difference from the document information similar to the input information (hereinafter referred to as “similar information”) is compared (compared) for each structural unit.
  • similar information the degree of difference from the document information similar to the input information
  • the evaluation result of the document information is not limited to the comparison table.
  • a simulated notice of reasons for refusal (a simulated notice similar to a notice of reasons for refusal), information on intellectual property related as an inventor or an applicant, and the like are also included.
  • the information regarding the intellectual property related as the inventor or the applicant is the invention memo or claim information in which the invention information is described.
  • Similar information is, for example, prior art documents (prior art information), and comparison table 100 (see FIG. 3) is a so-called claim chart showing technical differences.
  • the degree of difference from the document information similar to the input information is not limited to the case of comparison (comparison) for each constituent unit.
  • the degree of difference the degree of difference (matching degree) between the input information and the preceding document information may be compared for each constituent unit (Element) based on the combination of sentences, phrases, and a plurality of phrases, or the input may be performed.
  • the degree of difference (concordance) between the information and the preceding document information may be compared as a whole sentence.
  • the self-evaluation mode indicating the user's self-evaluation is input to the input unit 105.
  • the user can select a self-evaluation mode that indicates the user's self-evaluation.
  • the self-evaluation mode is configured to be selectable by the self-evaluation mode changeover switch 115 (see FIG. 3).
  • the output unit 104 displays and outputs the self-evaluation mode changeover switch 115 with respect to the comparison table 100. Details will be described later.
  • Each of the functional units of the information acquisition unit 101, the storage unit 102, the calculation unit 103, the output unit 104, and the input unit 105 of the document information evaluation device 1 described above has shown an example of the functions of the document information evaluation device 1. This does not limit the functions of the document information evaluation device 1.
  • the document information evaluation device 1 does not have to have all the above-mentioned functions, and may have some functions. Further, the document information evaluation device 1 may have a function other than the above.
  • the document information evaluation device 1 may have an input function for setting a function and an output function for notifying the operating state of the device by an LED lamp or the like.
  • each of the above-mentioned functional units of the document information evaluation device 1 has been described as being realized by software. However, at least one or more of the functional units included in the document information evaluation device 1 may be realized by hardware.
  • any of the above-mentioned functional units included in the document information evaluation device 1 may be implemented by dividing one functional unit into a plurality of functional units. Further, any two or more functional units of the document information evaluation device 1 may be integrated into one function. That is, FIG. 1 shows the functions of the document information evaluation device 1 as functional blocks, and does not show, for example, that each functional unit is composed of a separate program file or the like.
  • the document information evaluation device 1 may be a device realized by one housing or a system realized by a plurality of devices connected via a network or the like.
  • the document information evaluation device 1 may realize a part or all of its functions by a virtual device such as a cloud service provided by a cloud computing system. That is, the document information evaluation device 1 may realize at least one or more of the above-mentioned functional units in another device.
  • the document information evaluation device 1 may be a general-purpose computer such as a server device, or may be a dedicated device having limited functions.
  • FIG. 2 is a block diagram showing an example of the hardware configuration of the document information evaluation device 1 according to the embodiment of the present invention.
  • the document information evaluation device 1 has a CPU (Central Processing Unit) 11, a RAM (Random Access Memory) 12, a ROM (Read Only Memory) 13, a touch panel 14, and a communication I / F (Interface) 15.
  • the document information evaluation device 1 is a device that executes the information processing program described with reference to FIG.
  • the CPU 11 controls the document information evaluation device 1 by executing an information processing program stored in the RAM 12 or the ROM 13.
  • the document information evaluation program is acquired from, for example, a storage medium storing the document information evaluation program, a program distribution server via a network, or the like, installed in the ROM 13, read from the CPU 11, and executed.
  • the touch panel 14 has an operation input function and a display function (operation display function).
  • the touch panel 14 enables the user of the document information evaluation device 1 to input an operation using a fingertip, a touch pen, or the like.
  • the document information evaluation device 1 in the present embodiment uses the touch panel 14 having the operation display function will be described, but the document information evaluation device 1 separates the display device having the display function and the operation input device having the operation input function. It may have.
  • the display screen of the touch panel 14 can be performed as the display screen of the display device, and the operation of the touch panel 14 can be performed as the operation of the operation input device.
  • the touch panel 14 may be realized in various forms such as a head mount type, a glasses type, and a wristwatch type display.
  • Communication I / F15 is an I / F for communication.
  • the communication I / F15 executes, for example, wireless LAN, wired LAN, short-range wireless communication such as infrared rays, and the like.
  • the communication I / F 15 realizes communication with the user terminal 2 via, for example, the NW.
  • the communication I / F 15 may realize communication with another document information evaluation device 1. Although only the communication I / F 15 is shown as the communication I / F in FIG. 2, the document information evaluation device 1 may have each communication I / F in a plurality of communication methods.
  • FIG. 3 is a schematic view showing an example of an output screen according to an embodiment of the present invention.
  • the self-evaluation mode indicating the user's self-evaluation is input to the input unit 105.
  • the self-evaluation mode changeover switch 115 indicating the self-evaluation of the document information as similar information with respect to the comparison table 100
  • the self-evaluation command signal is input to the input unit 105.
  • the output unit 104 displays and outputs a self-evaluation mode changeover switch 115 indicating the self-evaluation of the document information by the user to the comparison table 100.
  • the self-evaluation command signal is input to the input unit 105 by clicking the self-evaluation mode changeover switch 115 with the mouse or operating the keyboard.
  • the output unit 104 can output a self-evaluation to the comparison table 100 based on the selection by the user.
  • the output unit 104 displays and outputs the self-evaluation mode changeover switch 115 to the comparison table 100, and the user selects the self-evaluation mode changeover switch 115, that is, a mouse click or a keyboard operation. I do. Then, the output unit 104 can display and output, for example, a schematically designed figure (image) as the self-evaluation mode based on the selection operation of the self-evaluation mode changeover switch 115. In this way, the user operates the self-evaluation mode changeover switch 115 to select the self-evaluation mode, so that the user gives an instruction to select the self-evaluation, and the input unit 105 receives the self-evaluation command signal. ..
  • the user can select the self-evaluation mode indicating the self-evaluation by clicking the self-evaluation mode changeover switch 115 with the mouse. Then, based on the self-evaluation command signal from the input unit 105, the output unit 104 switches between a high evaluation mode indicating that the document information is good and a low evaluation mode indicating that the document information is not good, depending on the result of the self-evaluation. Can be output.
  • the self-evaluation mode changeover switch 115 may be, for example, a button, an icon, or the like, as long as it can be switched and output.
  • the high evaluation mode includes, for example, the "Like” function 115a indicating that the user's evaluation is high, such as "Like!, And "Not good! It is possible to switch and output the "No! Function 115b, which indicates that the evaluation is low.
  • the output unit 104 can output by changing the display mode of the “Like!” Function 115a and the “No!” Function 115b.
  • the display mode of the “Like” function 115a is a pose to be taken when expressing a positive event, for example, a mode in which the thumb is pointed upward while holding a hand. It is possible to output the figure of.
  • a figure with a smiling expression or a figure with a hurray expression may be output.
  • the display mode of the "Like! Function 115a may be configured to output a figure of " ⁇ ".
  • the display mode of the "No! Function 115b is a pose to be taken when expressing a negative event, for example, the thumb is directed downward while holding the hand. It is possible to output a figure of an aspect. In addition, a facial expression with a pessimistic expression or a swaying figure expressing a disappointing mode may be output. In addition, the display mode of the "No! Function 115b may be configured to output a figure of "x".
  • the display mode of the "Like! Function 115a and the "No! Function 115b is not limited to the case where the switch shape is changed and displayed.
  • the output unit 104 may be configured to display by changing the color of the switch by the "Like! Function 115a and the "No good! Function 115b.
  • the above self-evaluation mode (“Like” function 115a or “No good!” Function 115b) can be switched for each document information or for each component unit (Element) of input information. You can also do it. Since the self-evaluation mode can be switched for each of the constituent units in this way, the high score of the constituent units and the low score of the constituent units can be visually grasped at a glance.
  • the output unit 104 may select the mode of the first character 3 based on the new similar information. Specifically, it is configured to select which emotional and emotional output mode of the first character is to be selected according to the content of the self-evaluation mode (“Like” function 115a or “No good!” Function 115b). You may. For example, when the self-evaluation mode is the “Like” function 115a, it may be configured to be displayed and output in the output mode of “joy” or “comfort”, for example. Further, when the self-evaluation mode is the "No! Function 115b, it may be configured to be displayed and output in the output mode of "anger” or “sorrow”, for example. This display output is executed by the output unit 104.
  • the output unit 104 can output and control the mode of the first character 3 based on the score result of the degree of coincidence calculated by the calculation unit 103.
  • the document information evaluation device 1 expresses the information related to the intellectual property using the first character 3. This makes it possible for users with little knowledge of intellectual property law to understand information about intellectual property in an easy-to-understand manner.
  • the output unit 104 can output a plurality of document information as similar patents output in the comparison table 100. Then, the output unit 104 outputs the degree of difference (matching degree) between the input information and the plurality of document information to the comparison table 100 for each constituent unit (Element).
  • FIG. 3 shows an example of outputting five document information, the number of document information is not limited.
  • the output priority of the five document information is determined by whether or not the score indicating the degree of matching calculated for each constituent unit meets a predetermined criterion.
  • the predetermined standard may be configured to output the top five document information from the left column to the right column in descending order of the total value of the scores of the constituent units, for example.
  • the predetermined standard may be configured to output the top five document information from the left column to the right column in descending order of the average value of the scores of each structural unit.
  • the predetermined standard is to move the top five literature information from the left column to the right column, in which the average value of the scores of some arbitrary structural units is equal to or higher than the predetermined value among all the structural units divided into a plurality of units. It may be configured to output in descending order.
  • the specification of the arbitrary structural unit may be configured so that the user acquires an arbitrary structural unit input from the user terminal 2.
  • the information acquisition unit 101 executes the acquisition of an arbitrary structural unit. Further, any structural unit may be stored in the storage unit 102 in advance.
  • the document information output in the second column when viewed from the left side the document information having the highest average value of the matching score of each structural unit of the invention may be selected as the main reference.
  • the determination of the coincidence and difference between the invention and the main reference may be made based on whether or not the score of the degree of coincidence of each constituent unit of the invention is equal to or higher than a predetermined value.
  • the comparison table 100 may include the display of the main reference and the sub-reference in the prior art document (prior document information), and the display of the structural unit related to the main reference and the structural unit related to the sub-reference.
  • the score of the degree of coincidence for each constituent unit of the invention is output on the display screen 200.
  • the degree of agreement is, for example, a numerical value (%) indicating how much the extracted feature quantities of the invention are included in similar prior art documents (prior art document information), and the higher the numerical value, the more the constituent unit. It shows that it is disclosed in the prior art document (prior document information).
  • the degree of agreement for each structural unit is compared for each prior art document (prior document information) as document information and output to the comparison table 100. This output is executed by the output unit 104.
  • the structural units of the decomposed inventions (input information) are output in the first column when viewed from the left side of the comparison table 100. In the second to sixth columns when the five document information is viewed from the left side, the score of the degree of agreement with each prior art document (prior document information) is output for each component unit.
  • the output unit 104 can output the degree of matching between the input information and the document information as a score.
  • the score result is output to the display screen 200 by the output unit 104 together with the comparison table 100, for example.
  • the match score can be expressed in the form of, for example, ⁇ to% (for example, 80%).
  • the calculation of the degree of matching by the calculation unit 103 is executed by the user pressing the search button 109 (see FIG. 3) and inputting the search signal to the calculation unit 103.
  • the output unit 104 can select the mode of the first character 3 based on the new similar information, and specifically, which of the first characters is based on the new similar information and the high or low score of the constituent requirements. It may be configured to select whether to use the output mode of emotions.
  • the output unit 104 can output and control the mode of the first character 3 based on the score result of the degree of coincidence calculated by the calculation unit 103.
  • the document information evaluation device 1 expresses the information related to the intellectual property using the first character 3. This makes it possible for users with little knowledge of intellectual property law to understand information about intellectual property in an easy-to-understand manner.
  • the output unit 104 can select the mode of the first character 3 based on the newly output similar information.
  • the document information evaluation device 1 can express the information related to the intellectual property in an easy-to-understand manner by the user, and is intellectual. Even users with little knowledge of property law can understand information about intellectual property in an easy-to-understand manner.
  • the output unit 104 can specifically show the score result of the degree of agreement by the calculation unit 103 via the first character 3.
  • the document information evaluation device 1 can express the score result in an easy-to-understand manner by the user, and the user who lacks knowledge of the intellectual property law. Even so, it is possible to make people understand information about whether or not intellectual property is registered in an easy-to-understand manner.
  • the calculation unit 103 can recalculate the degree of agreement of the similar prior art document (prior document information) with respect to the input invention information, reflecting the switching of the self-evaluation mode selected by the user.
  • the "Like" function 115a and "No" can weight the output and displayed structural units and recalculate the degree of matching.
  • FIG. 4 is a flowchart showing an operation example of the document information evaluation device 1 according to the embodiment of the present invention.
  • the document information evaluation device 1 determines whether or not the information regarding the intellectual property has been acquired from the user terminal 2 (S11). Whether or not the information on the intellectual property has been acquired can be determined by whether or not the information acquisition unit 101 has acquired the information on the intellectual property input from the user terminal 2. When it is determined that the information on the intellectual property has not been acquired (step S11: NO), the document information evaluation device 1 repeats the process of S11 and waits for the acquisition of the information on the intellectual property.
  • the calculation unit 103 matches the input information input from the user terminal 2 based on the document information stored in the storage unit 102. Is calculated (S12). Specifically, the input information is decomposed into predetermined structural units, and the degree of matching with the document information of one of the plurality of document information stored in the storage unit 102 is used as a score for each decomposed structural unit. Can be calculated.
  • the decomposition of the constituent units for example, segmentes the constituent requirements of "information about intellectual property related as an inventor, creator, or applicant" for each punctuation mark. Alternatively, a certain sentence length or a segment may be used for each predicate.
  • the output unit 104 After executing the process of S12, the output unit 104 outputs a comparison table showing the degree of difference between the input information and the document information for each constituent unit based on the calculation result of the score (S13).
  • the evaluation result of the document information is a comparison table in which the degree of difference from the document information similar to the input information (hereinafter referred to as “similar information”) is compared (compared) for each structural unit.
  • similar information the evaluation result of the document information is not limited to the comparison table 100.
  • a simulated notice of reasons for refusal (a simulated notice similar to a notice of reasons for refusal), information on intellectual property related as an inventor or an applicant, and the like are also included.
  • the information regarding the intellectual property related as the inventor or the applicant is the invention memo or claim information in which the invention information is described. Similar information is, for example, prior art documents (prior art information), and comparison table 100 is a so-called claim chart showing technical differences.
  • the match score can be calculated as, for example, a numerical value of "0%" to "100%".
  • the input unit 105 After executing the process of S13, the input unit 105 inputs the self-evaluation of the document information by the user into the comparison table (S14). A self-evaluation mode indicating the user's self-evaluation is input to the input unit 105.
  • the self-evaluation mode changeover switch 115 When the user presses the self-evaluation mode changeover switch 115 indicating the self-evaluation of the document information as similar information with respect to the comparison table 100, the self-evaluation command signal is input to the input unit 105.
  • the output unit 104 displays and outputs a self-evaluation mode changeover switch 115 indicating the self-evaluation of the document information by the user to the comparison table 100.
  • the self-evaluation command signal is input to the input unit 105 by clicking the self-evaluation mode changeover switch 115 with the mouse or operating the keyboard. By clicking the self-evaluation mode changeover switch 115, the user can select the self-evaluation mode indicating self-evaluation. Further, the output unit 104 can output a self-evaluation to the comparison table 100 based on the selection by the user. More specifically, the output unit 104 displays and outputs the self-evaluation mode changeover switch 115 to the comparison table 100, and the user selects the self-evaluation mode changeover switch 115, that is, a mouse click or a keyboard operation. I do.
  • the output unit 104 can display and output, for example, a schematically designed figure (image) as the self-evaluation mode based on the selection operation of the self-evaluation mode changeover switch 115.
  • the user operates the self-evaluation mode changeover switch 115 to select the self-evaluation mode, so that the user gives an instruction to select the self-evaluation, and the input unit 105 receives the self-evaluation command signal. ..
  • the output unit 104 receives the self-evaluation selection instruction.
  • the user can select the self-evaluation mode indicating the self-evaluation by clicking the self-evaluation mode changeover switch 115 with the mouse. Then, based on the self-evaluation command signal from the input unit 105, the output unit 104 switches between a high evaluation mode indicating that the document information is good and a low evaluation mode indicating that the document information is not good, depending on the result of the self-evaluation. Can be output.
  • the self-evaluation mode changeover switch 115 may be, for example, a button, an icon, or the like, as long as it can be switched and output.
  • the score of the degree of agreement can be calculated by, for example, the following processing.
  • FIG. 5 is a flowchart showing an example of the score calculation process of the document information evaluation device 1 according to the first embodiment of the present invention.
  • the calculation unit 103 When the information acquisition unit 101 acquires the input information representing the evaluation target, the calculation unit 103 first creates a kNN graph (S101).
  • the kNN graph is created by the following procedure. First, technical information accompanying technical information related to intellectual property acquired by the information acquisition unit 101 via the user terminal 2, input information as prior technical information, and similar technology similar to the input information stored in the storage unit 102. Vectorize all sentences included in the information. The vectorization may be performed by a conventional technique such as Word2Vec, Doc2Vec (Paragraph2Vec), LDA (Latent Dirichlet Allocation) or NTSG (Neural enzyme Skip Gram). The vectorization is executed by the calculation unit 103. Create a distance matrix between sentences from a vector.
  • a kNN graph is created by the above procedure. Although explained as a sentence above, it may be a combination of a plurality of phrases, a phrase, or a word.
  • the calculation unit 103 displays similar document information as an output target for the input information as the technical information acquired from the information acquisition unit 101, similar technical information similar to the input information stored in the storage unit 102, and knowledge. It is set in all the sentences included in the property information (S102), the technical wording included in the input information (technical information) acquired from the information acquisition unit 101 is set as a query, and the output unit 104 is the output target in the CLIE. Outputs similar document information as (S103).
  • the output may be performed by a conventional technique such as ElasticSearch (registered trademark).
  • the output unit 104 sets the sentence with the highest score as the starting point as the output result (S104), adds the starting point to the final output result (S105), and repeats until the final output result becomes n or more (S106). If the number of cases is less than n, the process proceeds to S107, and if the number of cases is n or more, the process proceeds to S110.
  • the calculation unit 103 extracts the candidates for the query conversion rule (S107).
  • Candidates for query conversion rules are extracted by the following procedure. First, based on the created kNN graph, a sentence similar to the sentence set as the starting point is extracted. Then, in the sentence set as the starting point and the extracted similar sentence, the words recognized as having high importance are extracted. The degree of importance may be determined by a conventional technique such as the TF-IDF method. Acquires the adjacent words in the sentence set as the starting point and the extracted similar sentences with respect to the extracted words. For example, "file” and "processing" when the extracted word is "distributed” and the sentence is "distributed processing in a distributed file system".
  • the calculation unit 103 applies a conversion rule having a high score to the query (S108).
  • the number of conversion rules may be one or a plurality, and the number may be controlled by the calculation unit 103. Further, the number of new creators calculated by the conversion rule is determined by the calculation unit 103 based on the user's evaluation information on the evaluation result of the technical information (input information) representing the evaluation target acquired by the information acquisition unit 101. It may be controlled.
  • the score can be calculated by the following formula.
  • the sentence set as the start point is A
  • the adjacent word acquired in the sentence set as the start point is w1
  • the extracted similar sentence is B
  • the adjacent word acquired in the extracted similar sentence is w2
  • P (w, X) be the probability of occurrence of the word w in the sentence X.
  • Simularity is an index of the semantic closeness of words, and the larger this value is, the more semantically similar the two words are.
  • the similarity can be a value calculated by nltk, which is a Python package, based on the path length of WordNet.
  • the calculation unit 103 sets the sentence adjacent to the start point as the next output target (S109), and outputs again using the query newly calculated by S108 (returns to S103).
  • the output unit 104 may output the document information or the document information including the sentence serving as the starting point as the final output result.
  • the recalculation of the match score is performed by the following procedure.
  • the calculation unit 103 calculates the conforming document vector and the non-conforming document vector.
  • the calculation of the document vector may be performed by, for example, Word2Ves, Doc2Vec (Paragraph2Vec), LDA, NTSG, or the like.
  • the conforming document vector is a vector of the document information of the structural unit to which the “Like” function 115a is output.
  • the non-conforming document vector is a vector of the document information of the structural unit to which the "No! Function 115b is output.
  • the calculation unit 103 calculates a document vector (hereinafter, referred to as "input document vector") of input information input from the user terminal 2 that can be operated by the user.
  • the calculation of the document vector may be performed by, for example, Word2Ves, Doc2Vec (Paragraph2Vec), LDA, NTSG, or the like.
  • the calculation unit 103 calculates the center of gravity in consideration of each weight of the input document vector, the conforming document vector, and the nonconforming document vector.
  • the document information evaluation device 1 is configured to be able to recalculate the score of the degree of agreement.
  • the center of gravity refers to each weight of the input document vector, the conforming document vector, and the non-conforming document vector before the search is performed. Specifically, when recalculating the score of the second degree of matching, the weight calculated at the time of calculating the score of the first degree of matching before the calculation of the score of the second degree of matching is taken into consideration. Then, the center of gravity is calculated.
  • the calculation unit 103 executes the calculation of the weight and the center of gravity. Each time the match score is recalculated, the weights of the input document vector, the combined document vector, and the nonconforming document vector are recalculated, and the center of gravity is recalculated. Along with this, the input document vector and the conforming document are recalculated. Vector and non-conforming document vector correction processing is performed. This correction process is executed by the calculation unit 103. Specifically, the inner product of the input document vector for which the correction process is executed by the calculation unit 103, the conforming document vector, and the center of gravity vector of the center of gravity calculated in (3) is calculated.
  • the calculation unit 103 again executes the correction processing (recalculation) of the weights of the input document vector, the conforming document vector, and the nonconforming document vector based on the inner product calculated in (4).
  • the weight adjustment based on the correction process of the document vector can be performed by, for example, SCDV (Space Composite Document Vectors supporting Soft clustering over sparse representations).
  • the document vector may be calculated by Word2Ves, Doc2Vec (Paragraph2Vec), LDA, NTSG, or the like.
  • the calculation unit 103 determines the degree of matching of the document information with respect to the input information. Perform score recalculation.
  • the output unit 104 can execute the recalculation processing of the degree of matching as many times as necessary until the desired document information is output, and each time, a comparison table as an output result is obtained. It has a user interface capable of displaying 100.
  • the comparison table 100 is output as the search result.
  • the score result of the degree of agreement is output for each structural unit.
  • the output of the recalculation of the degree of matching is executed by pressing the search button 109 each time the recalculation is performed.
  • the user interface may be generated so that the search button 109 can be continuously pressed in a short time.
  • This recalculation can be repeated as many times as necessary until the document information desired by the user is output.
  • the recalculation of the degree of matching is executed when the user presses the search button 109 (see FIG. 3) and the search signal is input to the calculation unit 103.
  • the search button 109 see FIG. 3
  • the search signal is input to the calculation unit 103.
  • the center of gravity is set closer to the conforming document information and away from the non-conforming document information.
  • the conforming document vector is weighted.
  • the center of gravity is calculated by multiplying each conforming document vector by each weight corresponding to the conforming document vector.
  • the weight is calculated (adjusted) so that the center of gravity is set closer to the conforming document information and away from the non-conforming document information, and the center of gravity is calculated in consideration of the weight.
  • the calculation unit 103 executes the calculation of the weight and the center of gravity.
  • the weight adjustment can be calculated from the center of gravity vector of the center of gravity calculated in (1), and the parameters determined based on the conforming document vector and the non-conforming document vector.
  • the parameters are calculated based on the following formula.
  • the calculation unit 103 executes the calculation of the parameters.
  • the weight can be adjusted by, for example, SCDV (Space Composite Document Vectors supporting Soft clustering over sparse distribution).
  • the document vector may be calculated by Word2Ves, Doc2Vec (Paragraph2Vec), LDA, NTSG, or the like.
  • the document information fixing unit executes the fixing of the main document information.
  • the output unit 104 outputs a figure (image) of the main document information fixing switch 106 indicating that the main document information is fixed to the comparison table 100, and an operation in which the user selects this switch, that is, a mouse. Click with or use the keyboard. Then, the main document information fixing command signal is input to the document information fixing unit (not shown). The user selects the main information fixing mode by operating the main document information fixing switch 106, and is configured to receive a plurality of document information fixing instructions from the user based on the main document information fixing command signal. ..
  • the user can select the main information fixing mode by clicking the main document information fixing switch 106 with the mouse. It suffices if the main information fixing mode can be selected, and the main document information fixing switch 106 may be, for example, a button, an icon, or the like.
  • the user can freely select the main information fixed mode, and the output unit 104 selects any of the similar document information output to the comparison table 100 as the main document information. You may. Further, the selection of the main document information is not limited to one, and two or more document information may be selected as the main document information.
  • the main document information can be fixed by the user inputting the document information in the input box 107.
  • the document information that can be input in this case is not limited to one.
  • the user can input two or more document information.
  • the user inputs the main document information into the input box 107 and presses the specific switch 108 to recalculate the degree of matching.
  • the document information to be input in the input box 107 is, for example, a notice of reasons for refusal, a mock notice of reasons for refusal (a mock notice similar to the notice of reasons for refusal), or as an inventor or an applicant. It also includes information about related intellectual property.
  • the information regarding the intellectual property related as the inventor or the applicant is the invention memo or claim information in which the invention information is described. Similar information includes, for example, prior art documents (prior document information).
  • the document information to be input to the input box 107 is not limited to the preceding patent document number.
  • the document information to be input to the input box 107 includes text data and numerical data.
  • Textual data includes, for example, information about intellectual property, idea sheets, idea memos, litigation-related information, treatises, books (including magazines and weekly magazines), reports and homepages.
  • Numerical data includes, for example, experimental data, measurement data, statistical data, and inspection data.
  • the document information to be input to the input box 107 includes mathematical data, chart data, photographic data, and image data (including still images and moving images).
  • the PDF electronic data can be taken into the input box 107, for example, by dropping and dropping the PDF electronic data. It should be noted that the PDF electronic data of the preceding patent document can be captured by dropping and dropping.
  • the output unit 104 specifies at least one or more structural units among the plurality of structural units obtained by decomposing the input information, and outputs (extracts) a plurality of document information including the designated structural units. Can be done.
  • the configuration unit can be specified by switching to the "Like" function 115a on the self-evaluation mode changeover switch 115. Then, the degree of agreement is calculated for a plurality of similar prior art documents (prior document information) including a specific structural unit, and the document information is displayed and output in the comparison table 100. As a result, it is possible to output a more similar prior art document (prior document information) to the input information.
  • the calculation of the plurality of document information including the specific structural unit is performed by the same method as the calculation process of the recalculation described above. Then, among the document information output by the output unit 104, the specific document information can be fixed as the main document information by the user pressing the main document information fixing switch 106.
  • the recalculation is performed by adjusting the weight of the input document information based on the main document information.
  • the recalculation method is the same as the recalculation method based on the self-evaluation mode described above.
  • the main document information includes, for example, citation information and reference information cited as a result of past examinations at the patent offices of each country, as well as non-patent documents such as patent documents, books, and magazines that the user himself has searched for in the past. There may be.
  • the document information evaluation device 1 may include a determination unit 402 for determining the possibility of acquiring a right.
  • the determination unit 402 can search for similar prior art documents (prior document information) similar to the recognized invention, and execute, for example, a process of determining the possibility of acquiring a right depending on the presence or absence of a similar invention. Judgment as to whether or not the inventions are similar can be made, for example, by recognizing the meaning (implication) of the recognized invention and whether or not a cited invention having similar implications can be searched.
  • the cited invention is a published patent document or a non-patent document. As the patent document, for example, a document such as a patent gazette published by the Japan Patent Office can be used.
  • non-patent document a document published in an academic journal, a newspaper, a website, or the like can be used.
  • the patent document or non-patent document may be stored in, for example, a dedicated database (not shown) so that it can be searched by the determination unit 402, or may be stored in the storage unit 102.
  • keywords are extracted from the words included in the recognized invention, and synonyms, synonyms or derivative words (synonyms, etc.) are stored in a database (not shown) to obtain synonyms for the keywords.
  • the determination unit 402 may calculate the degree of similarity between sentences as the degree of similarity.
  • the determination unit 402 may determine that the possibility of acquiring the right is high. On the other hand, the determination unit 402 may determine that the possibility of acquiring the right is low when the calculated similarity of the sentences is large.
  • the determination unit 402 has, for example, "S rank (extremely high possibility)", “A rank (high possibility)", and “B rank (possible)” according to the high or low possibility of acquiring the right. , And “C rank (less likely)", etc., may be determined by rank. Further, the determination is not limited to the display from S rank to C rank. The determination may be, for example, displayed from ⁇ to ⁇ in descending order of probability.
  • Judgment unit 402 can determine the possibility of acquisition of rights based on the examination results of acquisition of rights that have been examined in the past by the patent offices of each country.
  • the examination result of acquisition of rights is the invention related to the application, the cited reference, and the examination result (whether or not it was rejected based on the cited document) in comparison between the two.
  • the determination unit 402 may calculate the similarity between the invention according to the application and the text of the cited document, learn the comparison between the calculated similarity and the examination result, and determine the possibility of acquiring the right. By learning the comparison between the calculated similarity and the past examination results, the judgment unit 402 can use the judgments made by the JPO in the past as the judgment criteria, thus improving the judgment accuracy regarding the possibility of acquiring the right. Can be made to.
  • the storage unit 102 may be configured to store the examination result in advance.
  • the examination result can be obtained, for example, from the examination information published by the patent offices of each country.
  • the determination unit 402 may determine the possibility of acquiring the right
  • the output unit 104 controls the information output to the user terminal 2 based on the data related to the intellectual property calculated by the calculation unit 103 or similar information. Specifically, the output unit 104 can output and control the mode of the first character 3 based on the information on the possibility of acquiring the right calculated by the calculation unit 103. For example, when the determination unit 402 determines that the above-mentioned information on the possibility of acquiring the right should be rejected, the output unit 104 selects a sad character from the character information stored in the storage unit 102 and displays the display screen 200. An output instruction is issued to the output unit 104 so as to be displayed in.
  • the character information stored in the storage unit 102 is based on the above score or the right acquisition possibility information.
  • the sad character may be selected and an output instruction may be issued to the output unit 104 so as to display the character.
  • the output unit 104 may output the keyword calculated by the calculation unit 103 via the first character 3.
  • the calculation unit 103 extracts a keyword from the information about the intellectual property stored in the storage unit 102. Specifically, when the determination unit 402 determines that the information on the possibility of acquiring the right should be rejected, what kind of new keyword should be added to determine that the information on the possibility of acquiring the right should not be rejected. A new keyword is calculated by the logic of whether to do it.
  • the calculation unit 103 may list innumerable new keywords, but since it is complicated, the calculation unit 103 may calculate the keywords described in the claims of the publication of the same or similar technology.
  • the determination unit 402 may machine-learn the past examination results and determine the possibility of acquiring the right.
  • the examination result is acquired by the information acquisition unit 101.
  • the determination unit 402 performs machine learning (supervised learning) using the input and output as a data set, inputting the invention according to the application and the cited document, and using the examination result as an output, and obtains the learned data set.
  • machine learning supervised learning
  • the dataset can be modeled as a different model depending on, for example, the country, applicable law (including revision of the law), field of invention, and the like.
  • the determination unit 402 can improve the determination accuracy regarding the possibility of acquiring the right by using the learning results learned in each modeling.
  • the determination unit 402 responds to the change in the examination tendency at the JPO by machine learning the new examination result acquired by the information acquisition unit 101. It is possible to judge the possibility of acquiring the right.
  • machine learning a supervised learning technique or an unsupervised learning technique may be used.
  • the learning technique of machine learning for example, a neural network (including deep learning), a support vector machine, clustering (for example, a task, a first embodiment, etc.), a Bayesian network, or the like may be used.
  • FIG. 6 is a block diagram showing an example of the software configuration of the document information evaluation device 1 according to the first modification of the embodiment of the present invention.
  • FIG. 7 is a schematic view showing an example of a search screen according to a first modification of the embodiment of the present invention.
  • FIG. 8 is a diagram showing an example of a synonym dictionary table according to the first modification of the embodiment of the present invention.
  • the document information evaluation device 1 includes a document information input unit 301, a search keyword input unit 302, a storage unit 102, a calculation unit 103, a synonym expansion selection unit 303, and an output unit 104. It has a functional part.
  • Each of the above-mentioned functional units of the document information evaluation device 1 in the present embodiment will be described as a functional module realized by an information processing program (software) that controls the document information evaluation device 1.
  • the document information evaluation program operates on the document information evaluation device 1. That is, the document information evaluation device 1 refers to a device on which the document information evaluation program operates.
  • the first modification as an example, a case where the input information and the document information are information related to intellectual property will be described.
  • the document information input unit 301 receives information (input information) related to intellectual property input from the input box 301a via the user terminal 2 via the user terminal.
  • the document information input unit 301 receives, for example, the content of the invention created by the user.
  • the document information evaluation device 1 generates the input box 301a.
  • the search keyword input unit 302 accepts the input of the search keyword from the user terminal 2 for the information related to these intellectual properties input from the input box 302a via the user terminal 2.
  • the search keyword is a keyword that is related to the information about the intellectual property entered by the user.
  • the search keyword is input by the user via the user terminal 2 for the purpose of improving the extraction accuracy of the prior art document (including similar prior document information) related to the intellectual property.
  • the search keyword input unit 302 accepts, for example, keywords related to the technical features of the information related to the intellectual property input from the input box 302a.
  • the document information evaluation device 1 creates an input box 302a.
  • the user terminal 2 is a terminal device that can be operated by the user, and is, for example, a desktop PC, a notebook PC, a tablet PC, a smartphone, or the like.
  • the synonym expansion selection unit 303 has a function of making it possible to select the range of synonym expansion of the search keyword input to the search keyword input unit 302. As shown in FIG. 7, the synonym expansion selection unit 303 can select three stages of "none", "standard", and "wide". “None” is a state in which a search is performed without expanding synonyms and a score of matching degree is calculated, and “standard” is, for example, 50% of the first synonym information ⁇ stored in the storage unit 102 in advance.
  • the state in which the first synonym information ⁇ of the above is expanded and searched to calculate the score of the degree of matching, “wide” means, for example, 100% of the first synonym information ⁇ stored in the storage unit 102 in advance.
  • the states in which the synonym information ⁇ is expanded, searched, and the score of the degree of matching is calculated are shown.
  • the three stages of “none", “standard”, and “wide” are examples, and how much of the first synonym information ⁇ stored in the storage unit 102 in advance is expanded to calculate the score of the degree of agreement. Can be adjusted as appropriate.
  • the search keyword input unit 302 expands the synonyms of the search keyword and executes the search or analysis process. Further, the search keyword input unit 302 executes a search or analysis process so that the search keyword is included when "include” is selected. Then, the search keyword input unit 302 executes the search or analysis process so that the search keyword is not included when "not included” is selected.
  • the output unit 104 displays and outputs the contents of the synonym-expanded first synonym information ⁇ to the user terminal 2 when "standard” or “wide” is selected based on the synonym expansion selection unit 303. It also has the function of In the display output, the first synonym information ⁇ is stored in a table format for each search keyword (see FIG. 8).
  • an information bar 303a (first information bar) that enables selection of a plurality of synonym developments searches the user terminal 2 by the output unit 104. It is displayed and output on the display screen 201.
  • the information bar 303a is provided with selection switches 303b of "none", “standard”, and “wide”, and by operating the selection switch 303b to select synonym expansion, the user can select synonym expansion.
  • the instruction is given, and the synonym expansion selection unit 303 accepts the input of the synonym expansion based on the synonym expansion command signal.
  • the synonyms corresponding to the selection of the selection switch 303b are expanded, and the search can be executed under the conditions of the synonym expansion.
  • the synonym expansion is selected, for example, "standard” based on the synonym expansion selection unit 303
  • the first synonym information ⁇ of the search keyword is displayed and output on the display screen 201 when the user terminal 2 is searched. Then, when the selection is changed from “standard” to "wide", the first synonym information ⁇ newly added from “standard” is used to search the user terminal 2 due to the change to "wide”. Is displayed and output on the display screen 201 of.
  • the output unit 104 may output the first synonym information ⁇ so that the transition state of the first synonym information ⁇ can be confirmed according to the change in selection (see the arrow portion in FIG. 8).
  • the user can add or delete the first synonym information ⁇ as appropriate.
  • the storage unit 102 can store a unique "a plurality of second synonym information ⁇ for each of a plurality of search keywords" held by the user. And, as shown in FIG. 7, the storage unit 102 stores the search keyword.
  • the second synonym information ⁇ to be added and the second synonym information ⁇ to be deleted may be stored in a table format (see FIG. 8). “Add” information (command information) as the second synonym information ⁇ to be added.
  • the user holds in advance "del” information (command information) as the second synonym information ⁇ to be deleted. For example, when the search keyword is "today", the "add” information is set to "yesterday".
  • the user's own second synonym dictionary Y whose "del” information is “today” may be held. Further, the storage unit 102 stores a user-specific second synonym dictionary Y in which the search keyword is "weather”, the "add” information is "snow”, and the "del” information is "energetic”. You may.
  • the user can select and delete the first synonym information ⁇ that he / she wants to delete directly from the first synonym information ⁇ displayed and output via the user terminal 2.
  • the user can directly input the first synonym information ⁇ to be added to the first synonym information ⁇ displayed and output via the user terminal 2.
  • a text box (not shown) is displayed and output, and even if the first synonym information ⁇ to be added to the text box is directly input. good.
  • the added or deleted contents may be reflected in the second synonym dictionary Y as "add" information or "del" information.
  • the second synonym dictionary Y having the second synonym information ⁇ may be executed by displaying and outputting a CSV format file on the display screen 201 when searching the user terminal 2, or a CSV format file. May be held and managed on the cloud.
  • the storage unit 102 includes a second synonym dictionary Y having a plurality of second synonym information ⁇ for each of a plurality of search keywords unique to the user, and a first synonym dictionary having the plurality of first synonym information ⁇ . It is stored in association with the search keyword of X.
  • the first synonym dictionary X for example, WordNet is used.
  • the first synonym information ⁇ for each search keyword and the second synonym information ⁇ for each search keyword are desired to be added or deleted.
  • the synonym information ⁇ is associated with each other.
  • the output unit 104 has a function of displaying and outputting a second synonym dictionary Y having a plurality of second synonym information ⁇ for each of a plurality of user-specific search keywords on the display screen 201 when searching the user terminal 2.
  • the output unit 104 can further display and output the second synonym information ⁇ to be added or deleted for each search keyword in a table format (see FIG. 8), and selects an add / delete button (not shown).
  • the second synonym information ⁇ selected from the first synonym information ⁇ of the search keyword may be added or deleted.
  • "add" information and "del" information are associated with each search keyword as command information, and when the command information is "add" information, the second synonym information ⁇ corresponding to each search keyword is automatically obtained. If the command information is "del" information, the second synonym information ⁇ corresponding to each search keyword may be automatically deleted.
  • the added or deleted first synonym information ⁇ can be stored in the storage unit 102 as a user-specific synonym dictionary.
  • this first modification it is possible to improve the accuracy of search or analysis, and it is possible to perform a certain level of search or analysis regardless of the user's experience.
  • synonymous information that could not be confirmed by the conventional document information evaluation device can be easily confirmed, and the scope of search or analysis can be clarified. Therefore, the opacity of the document information evaluation device is eliminated and the search is performed. Alternatively, the reliability of the analysis can be improved.
  • the document information evaluation device 1 is described in any part of the preceding document information (including similar preceding document information) related to the intellectual property when evaluating the document information.
  • a search text range selection unit 304 that allows the user to select whether or not to compare the text and the document information related to the intellectual property input by the user via the user terminal 2 may be provided.
  • the document information evaluation device 1 generates an information bar 304a (second information bar) that enables selection of a plurality of search sentence ranges, and the output unit 104 searches the user terminal 2. It is displayed and output on the display screen 201 when the operation is performed.
  • the information bar 304a is provided with a selection switch 304b for "claims", “claims / summaries", and "full text", and the user can select the search text range by operating the selection switch 304b.
  • the search sentence range selection instruction is given, and the search sentence range selection unit 304 accepts the selection of the search sentence range based on the search sentence range selection command signal.
  • the search sentence range selection unit 304 accepts the input, the search sentence range corresponding to the selection of the selection switch 304b is selected, and the search can be executed under the conditions for selecting the search sentence range.
  • the search sentence range selection unit 304 can accept three stages of input of "claim", "claim / summary", and "full text".
  • the "claim / summary” is the scope of the search or analysis of the part described in the claim of the prior document information (including similar prior document information) related to the intellectual property.
  • the "claim” is the scope of the search or analysis of the part described in the claim of the prior document information related to the intellectual property.
  • the “claims” may cover all claims, or only some specific claims may be included in the scope of search or analysis.
  • the search text range selection unit 304 may have a configuration in which the range of search or analysis can be selected from all claims or specific claims.
  • “Full text” includes applications, statements, claims and abstracts.
  • the “full text” may include drawings.
  • the “full text” may be configured to include the terms described in the drawings.
  • the scope of search or analysis can be appropriately changed according to the type of evaluation content (for example, prior art search, invalid material investigation, infringement investigation). Therefore, according to the document information evaluation device 1, the evaluation accuracy Can be improved.
  • the document information evaluation device 1 includes a technical field input unit 305 that accepts input of keywords related to the technical field of document information (input document information) related to the user's intellectual property.
  • the configuration may further include a technical feature input unit 306 that accepts input of keywords related to technical features of document information related to intellectual property.
  • the acceptance of input by the technical field input unit 305 and the technical feature input unit 306 is not limited to keywords.
  • the input reception may be a term combining a plurality of keywords, or may be configured to accept input of document information such as a phrase or a sentence.
  • the technical field input unit 305 receives the technical field of information related to intellectual property input from the input box 305a via the user terminal 2.
  • the technical feature input unit 306 receives the technical feature of the information regarding the intellectual property input from the input box 306a via the user terminal 2.
  • Input boxes 305a and 306a are generated by the document information evaluation device 1.
  • the document information evaluation device 1 is a specific embodiment of document information related to the user's intellectual property (input document information) supplementary information (for example, a specific embodiment of the document information related to the intellectual property, background technology). Etc.) may be added to the supplementary information input unit 307 that accepts the input.
  • the acceptance of input by the supplementary information input unit 307 is not limited to document information such as phrases and sentences, and may be keywords.
  • the supplementary information input unit 307 receives supplementary information of information related to the intellectual property input from the input box 307a via the user terminal 2.
  • the document information evaluation device 1 creates an input box 307a.
  • the evaluation accuracy can be further improved.
  • the document information evaluation device 1 may be configured to provide feedback on the search sentence range and synonym expansion range selected as described above, and store the result of the feedback in the storage unit 102. By learning the result of the feedback, the document information evaluation device 1 evaluates, for example, document information different from the previous one, which has a technical field and technical features similar to the document information to be evaluated last time. In this case, the search sentence range and the synonym expansion range selected at the time of the previous evaluation may be automatically set in the section without selecting again.
  • the document information evaluation device 1 may be configured to recommend (recommend) a search sentence range and a synonym development range that are frequently used for similar technical fields and technical features. The recommendation (recommendation) may be configured to be executed by a recommendation unit (not shown) included in the document information evaluation device 1.
  • FIG. 9 is a flowchart showing an operation example of the document information evaluation device 1 according to the first modification of the first embodiment.
  • the document information evaluation device 1 accepts input of input information regarding intellectual property from the user terminal 2 (S201).
  • the document information input unit 301 executes the acceptance of the input of the input information regarding the intellectual property.
  • the document information evaluation device 1 accepts input of a search keyword related to document information related to intellectual property from the user terminal 2 (S202).
  • the search keyword input unit 302 executes the acceptance of the input of the search keyword.
  • the synonym expansion selection unit 303 executes the acceptance of the input of the synonym expansion.
  • the first synonym information ⁇ of the synonym expansion selected in S203 is displayed and output (S204).
  • it is determined whether or not the first synonym information ⁇ relating to the displayed and output search keyword is appropriate S205.
  • the calculation unit 103 is input from the user terminal 2 based on the preceding document information stored in the storage unit 102.
  • the degree of coincidence with the document information as input information is calculated (S206), and this operation process is terminated.
  • the document information evaluation device uses a plurality of second synonym information ⁇ for each of a plurality of unique search keywords held by the user. Imported to 1 and displayed and output to the user terminal 2.
  • the display output is executed by, for example, importing the CSV format file created in the table format by the second synonym information ⁇ to be added for each search keyword and the second synonym information ⁇ to be deleted into the user terminal 2 and displaying and outputting the file.
  • the CSV format file may be held and managed on the cloud.
  • the second synonym dictionary Y having the captured second synonym information ⁇ is stored in, for example, the storage unit 102.
  • the second synonym information ⁇ to be added or deleted from the second synonym information ⁇ that is displayed and output is selected (S207). For example, by selecting the add / delete button (not shown), the second synonym information ⁇ selected from the first synonym information ⁇ of the search keyword may be added or deleted. After that, it shifts to S206 and ends this operation processing.
  • the document information evaluation device 1 can also be applied to synonym expansion of information (input information) related to intellectual property input from the input box 301a via the user terminal 2. Further, the document information evaluation device 1 can also execute synonym expansion for both the keyword and the search keyword included in the input information. That is, the document information evaluation device 1 is applicable to the synonym expansion of at least one of the keyword and the search keyword included in the input information.
  • the document information evaluation device 1 may be configured so that a plurality of selections for synonym expansion of the first synonym information can be set for each of the plurality of keywords included in the input information and the plurality of search keywords. ..
  • the output unit 104 may be configured to output the first synonym information in a table format for each keyword.
  • FIG. 10 is a block diagram showing an example of the software configuration of the document information evaluation device 1 according to the second modification of the embodiment of the present invention.
  • FIG. 11 is a schematic diagram showing an example of a search screen according to a second modification of the embodiment of the present invention. It should be noted that, with respect to the embodiment described with reference to FIGS. 1 to 5 and the same configuration as the first modification described with reference to FIGS. 6 to 9, the description of the figure is not redundant. , The description and description of the figure are omitted.
  • the document information evaluation device 1 has the functions of the document information input unit 301, the storage unit 102, the determination unit 401, the calculation unit 103, the determination unit 402, the output unit 104, and the generation unit 403. Has a part.
  • Each of the above-mentioned functional units of the document information evaluation device 1 in the second modification will be described as a functional module realized by an information processing program (software) that controls the document information evaluation device 1.
  • the document information evaluation program operates on the document information evaluation device 1. That is, the document information evaluation device 1 refers to a device on which the document information evaluation program operates.
  • the second modification as an example, a case where the input information and the document information are information related to intellectual property will be described.
  • the determination unit 401 determines the first technical classification of the information (input information) regarding the intellectual property input from the input box 301a via the user terminal 2. For example, the determination unit 401 may determine the first technical classification by using a word having a high frequency of appearance from a plurality of words included in the information regarding the intellectual property as the input information, and the plurality of words included in the input information.
  • the preceding document information containing many words of the above may be searched from the storage unit 102, and the technical classification associated with the extracted preceding document information may be used as the first technical classification of the input information.
  • the first technical classification may be determined using important terms. That is, the first technical classification is determined in order to specify the technical classification to which the input information (invention content) input by the user belongs.
  • the first technical classification is usually determined to be one, but when it is difficult to narrow down the first technical classification to one, a plurality of first technical classifications may be determined for the input information.
  • the technique for determining the first technical classification from the input information input to the input box 301a may be a general technique, and is not limited to the above method.
  • the determination unit 401 may determine the first technical classification based on a combination of sentences, phrases, and a plurality of phrases.
  • the first technical classification is a technical classification given to patent documents by the Japan Patent Office, and assumes IPC and FI.
  • patent classifications such as UPC, CPC, and F-term can also be used here.
  • the classification may be other than that prepared by the Japan Patent Office, and may be, for example, the classification of books in a library.
  • the determination unit 401 included in the document information evaluation device 1 has described the configuration for determining the first technology classification, but the present invention is not limited to this, and the user can use the first technology.
  • the classification may be determined.
  • the first technical classification determined by the user is input from the technical classification input box (not shown) via the user terminal 2.
  • the generation unit 403 generates additional information that improves the possibility of acquiring the right according to the possibility of acquiring the right related to the input information of the user.
  • the generation unit 403 is to improve the possibility of acquiring the right of the information (input information) related to the intellectual property whose input is accepted by the document information input unit 301 based on the possibility of acquiring the right determined by the determination unit 402.
  • the generation of additional information can be performed by AI (Artificial Intelligence).
  • the generation unit 403 generates, for example, additional information obtained by adding or deleting constituent requirements to the input information.
  • additional corrections that add constituent requirements for input information limit the scope of rights, but can increase the possibility of acquiring rights. That is, the generation unit 403 can generate additional information that enhances the possibility of acquiring the right by adding the constituent requirements of the input information.
  • the generation unit 403 when the determination unit 402 determines that the possibility of acquiring the right is low, the generation unit 403 generates additional information that increases the possibility of acquiring the right by supplementing and correcting the input information.
  • the generation unit 403, for example is based on the past examination by adding the constituent requirements (words or sentences) learned in machine learning to the constituent requirements of the invention, which have improved the possibility of acquiring the right in the past examination. It is possible to generate additional information that improves the possibility of acquiring rights.
  • the generation unit 403 may generate information that reduces the possibility of acquiring the right in the supplementary correction of the input information.
  • the generation unit 403 may consider the generation of information that reduces the possibility of acquiring the right in the supplementary correction of the input information.
  • the supplementary correction of input information can consider the generation of information that deletes a component with input information.
  • An amendment that deletes the constituent requirements of the content of the invention (input information) reduces the possibility of acquiring the right, but can expand the scope of the right of the invention.
  • the generation unit 403 can generate information that expands the scope of rights by deleting the constituent elements of the invention.
  • the generation unit 403 can expand the scope of rights of the invention while maintaining the possibility of acquiring the right by generating the information for deleting the constituent elements that have little influence on the possibility of acquiring the right.
  • the generation unit 403 may generate additional information based on the information recorded in the information recording unit (not shown).
  • the generation unit 403 can utilize the knowledge of the engineer by referring to the intellectual property created in the past by the engineer recorded in the information recording unit (not shown). As a result, the generation unit 403 may generate additional information similar to the information created by the engineer himself / herself on behalf of the engineer.
  • the generation unit 403 may generate additional information based on the information about the intellectual property recorded in the information recording unit (not shown) by another engineer (for example, an engineer of the same company).
  • another engineer for example, an engineer of the same company.
  • the generation unit 403 may be configured to delete a part of words, phrases, sentences, etc. included in the constituent requirements. Even in this case, the generation unit 403 maintains the possibility of acquiring the right by generating information for deleting words, phrases, sentences, etc. that have little influence on the possibility of acquiring the right as described above. It is possible to expand the scope of rights of the invention.
  • the generation unit 403 may detect the defect of the invention and exclude it from the creation target by applying the simulation technique to the created invention.
  • Simulation technology includes, for example, fluid analysis technology for models modeled by CAD, technology for simulating drug production, technology for calculating the cost or time required for implementation, technology for detecting scientific inconsistencies, and the like. Can be used.
  • the generation unit 403 generates, for example, additional information that is machine-learned by the determination unit 402 and adds a constituent requirement that makes it easy to obtain a patent decision in the same technical field as the invention created by the user.
  • the generation unit 403 may generate additional information that adds the constituent requirements of the invention created by the user in the past in the same technical field as the invention created by the user. That is, the generation unit 403 can also create a new invention on behalf of the user.
  • the determination unit 402 may redetermine the possibility of acquiring the right relating to the intellectual property based on the additional information generated by the generation unit 403. By re-determining the possibility of acquiring the right relating to the intellectual property, the generation unit 403 can generate additional information that improves the possibility of acquiring the right.
  • the generation unit 403 can generate a plurality of additional information. Then, the determination unit 402 may redetermine the possibility of acquiring each right based on the plurality of additional information generated by the generation unit 403. By re-determining the possibility of acquiring the rights related to the plurality of generated intellectual property, it becomes possible to select the one having a high possibility of acquiring the rights from the plurality of generated additional information. For example, the generation unit 401 may sort the additional information in the order of high possibility of acquiring the right in the result of the re-judgment from the plurality of additional information and make a proposal to the user.
  • the additional information generated by the generation unit 403 can be displayed and output on the screen of the user terminal 2 by the display unit (not shown).
  • the display unit (not shown).
  • the comparison table 100 is displayed and output as the output result on the user terminal 2
  • the score of the degree of matching is low and it is evaluated that the possibility of acquiring the right is negative (for example, C rank)
  • the generation unit 403 An evaluation signal based on the evaluation result may be input to and additional information may be generated.
  • the display unit (not shown) may display and output additional information on the comparison table 100 output to the user terminal 2.
  • the display unit (not shown) may display and output words, phrases, sentences, etc. corresponding to the additional information as balloons near the first character 3.
  • the first character 3 may be configured to utter (propose) the additional information based on the control unit (not shown). If the determination unit 402 determines that the possibility of acquiring the right is high, the generation unit 403 may generate information that reduces the possibility of acquiring the right in the supplementary correction of the input information. Further, the generation unit 403 may generate information for deleting words, phrases, sentences, etc. that have little influence on the possibility of acquiring the right in the determination unit 402.
  • the output unit 104 uses a second technical classification different from the first technical classification determined by the determination unit 401 according to the possibility of acquiring the right related to the user's input information determined by the determination unit 402. Output (extract) the preceding document information.
  • the generation unit 403 compares the preceding document information and the sentences included in the input information, and generates additional information based on the document information constituting the difference between the preceding document information and the input information.
  • the output unit 104 divides the preceding document information into each structural unit.
  • small term analysis can be used. That is, the preceding document information is divided into a plurality of word units, and the dependency relationship of which word modifies which word is extracted.
  • delimiter processing may be performed to divide the invention sentence according to the priority of a period, a colon, a semicolon, a comma, or a relative pronoun.
  • the output unit 104 may output (extract) an important term from a plurality of words included in the preceding document information.
  • the output unit 104 may output (extract) a word having a high frequency of occurrence, or may output (extract) an important term from the dependency relationship of the word.
  • the important term is usually one word, but if it is difficult to narrow down the important term to one, it may be a plurality of words.
  • the preceding document information included in the storage unit 102 may be simply searched by a keyword search.
  • the output unit 104 may improve the accuracy of the preceding document information in consideration of the importance of the keyword from the preceding document information including the keyword.
  • the output unit 104 may use the TF-IDF method or the like to evaluate how important the keyword is in the sentence included in the preceding document information.
  • a patent document in which a keyword appears in the entire patent document has a low importance, and if it appears only in a specific sentence in one patent document, it may be assumed to have a high importance. ..
  • the extraction of patent documents for keywords using the TFIDF method or the like may be performed when the user inputs input information to the user terminal 2 and the keywords are obtained, and the patent documents for typical keywords may be extracted. May be stored in the storage unit 102 in advance.
  • the search for prior art information is not limited to keyword search.
  • the degree of difference (matching degree) between the input information and the prior document information may be compared for each constituent unit (Element) based on the combination of sentences, phrases, and a plurality of phrases.
  • the degree of difference (matching degree) between the input information and the prior document information may be compared as a whole sentence.
  • the generation unit 403 compares the preceding document information and the input information output (extracted) using the second technical classification as described above for each of the preceding document information and the structural unit of the sentence included in the input information. Generates the document information that constitutes the difference between the preceding document information and the input information.
  • the document information constituting the difference may be a sentence for each structural unit, a phrase, or a word.
  • the output unit 104 can output all the sentences, phrases, and words as additional information.
  • the output unit 104 may be configured to select and output some of a plurality of sentences, phrases, and words.
  • the output unit 104 may select the top two places in descending order of the frequency of appearance of sentences, phrases, and words, or may configure the output unit 104 to select and output the top one place and the third place. In this way, the output unit 104 can appropriately select and output sentences, phrases, and words (additional information) that constitute the difference.
  • the generation unit 403 can generate a sentence or the like that exists in the preceding document information output using the second technical classification and does not exist in the input information as additional information.
  • additional information to which some configuration is externally added to the invention (input information) for which the possibility of acquiring the right is low, and the user can be presented with the additional information. It is possible to propose an invention that improves the possibility of acquiring a right.
  • the output unit 104 is configured to output synonyms other than the keyword, for example, a keyword belonging to the middle concept or the lower concept of the keyword by outputting the first synonym information of the keyword included in the input information. You may. Then, the generation unit 403 may generate related words (keywords, etc.) other than a plurality of words (keywords, idioms, etc.) constituting the constituent unit of the input information as additional information. According to the invention according to the second modification, the possibility of acquiring the right can be improved by correcting the keyword included in the constituent unit of the input information to a different keyword.
  • the keyword is used.
  • Preceding document information may be output (extracted).
  • the output unit 104 outputs (extracts) the dependency relationship of which keyword the keyword modifies in the preceding document information.
  • the output unit 104 may output (extract) the keyword as additional information.
  • the information to be modified is not limited to keywords, but may be sentences or phrases.
  • the invention according to the second modification it is possible to present additional information to which some configuration is internally added to the invention (input information) for which the possibility of acquiring the right is low, and the user can be presented with the additional information. It is possible to propose an invention that improves the possibility of acquiring a right.
  • the generation unit 403 may be configured to generate additional information that is machine-learned by the determination unit 402 and adds a configuration requirement that makes it easy to obtain a patent decision in the same technical field as the invention created by the user. good.
  • the generation unit 403 may generate additional information that adds the constituent requirements of the invention created by the user in the past in the same technical field as the invention created by the user. That is, the generation unit 403 can also create a new invention on behalf of the user.
  • the determination unit 402 can acquire the right using the additional information generated by the generation unit 403 by re-determining the possibility of acquiring the right related to the intellectual property based on the additional information generated by the generation unit 403. The sex can be improved.
  • the document information evaluation device 1 further includes a selection unit (not shown) for selecting the second technical classification.
  • the selection unit (not shown) selects a second technical classification different from the first technical classification determined by the determination unit 401.
  • the selection unit (not shown) uses the technology classification given to the prior art information (conventional patent document) associated with the prior document information regarding the first technology classification determined by the determination unit 401 as the second technology classification. You may choose.
  • the second technical classification is determined so as not to overlap with the first technical classification. Further, as the second technical classification, a technical classification that is not similar to the first technical classification may be selected.
  • the selection unit can select dissimilar technical classifications by excluding those that match a predetermined number of digits from the beginning of the technical classifications (patent classifications such as IPC and FI). That is, the selection method is not limited to the above as long as the selection unit (not shown) can specify the second technical classification at a distance from the first technical classification on the patent classification. Further, the predetermined distance may be set to a different value depending on the technical classification. For example, in the technical field of IT software, it is often judged that the combination is basically easy even across the technical classifications, so it is necessary to set a large predetermined distance.
  • the predetermined distance can be set as the first predetermined number of digits (for example, 4 digits) from the beginning of the first technical classification and the second predetermined digit number (for example, 3 digits) from the beginning.
  • the number of second predetermined digits needs to be smaller than the number of first predetermined digits.
  • the distance from the first technical classification has an appropriate distance. If the distance is too close, the patentability will be denied, and if the distance is too far, the technical field may be too different and meaningless.
  • various methods can be adopted as the method for selecting the second technical classification.
  • the selection unit does not match the first predetermined number of digits (for example, four digits) from the beginning of the first technical classification determined by the determination unit 401, and the second predetermined digit from the beginning does not match.
  • a patent classification that matches the number may be selected as the second technical classification.
  • the second technical classification is a technical classification given to patent documents by the Japan Patent Office, and assumes FI or IPC.
  • patent classifications such as CPC, UPC, and F-term can also be used here.
  • the classification may be other than that prepared by the Japan Patent Office, and may be, for example, the classification of books in a library.
  • the second patent classification it is preferable to use the same type of patent classification as the first patent classification.
  • FIG. 11 is a flowchart showing an operation example of the document information evaluation device 1 according to the second modification of the embodiment.
  • the document information evaluation device 1 accepts input of input information regarding intellectual property from the user terminal 2 (S301).
  • the document information input unit 301 executes the acceptance of the input of the input information regarding the intellectual property.
  • the document information evaluation device 1 determines the first technical classification (S302).
  • the determination unit 401 determines the first technical classification of the information (input information) regarding the intellectual property input from the input box 301a via the user terminal 2.
  • the determination unit 401 executes the determination of the first technical classification.
  • the calculation unit 103 calculates the degree of coincidence with the input information input from the user terminal 2 based on the preceding document information stored in the storage unit 102 (S303). Specifically, the input information is decomposed into predetermined structural units, and the degree of matching with the document information of one of the plurality of document information stored in the storage unit 102 is used as a score for each decomposed structural unit. Can be calculated.
  • the decomposition of the constituent units for example, segmentes the constituent requirements of "information about intellectual property related as an inventor, creator, or applicant" for each punctuation mark. Alternatively, the decomposition of the structural unit may be divided into a certain sentence length or a predicate.
  • the output unit 104 After executing the process of S303, the output unit 104 outputs a comparison table showing the degree of difference between the input information and the document information for each constituent unit based on the calculation result of the score (S304).
  • the evaluation result of the document information is a comparison table in which the degree of difference from the document information similar to the input information (hereinafter referred to as “similar information”) is compared (compared) for each structural unit.
  • similar information the evaluation result of the document information is not limited to the comparison table 100.
  • a simulated notice of reasons for refusal (a simulated notice similar to a notice of reasons for refusal), information on intellectual property related as an inventor or an applicant, and the like are also included.
  • the information regarding the intellectual property related as the inventor or the applicant is the invention memo or claim information in which the invention information is described. Similar information is, for example, prior art documents (prior art information), and comparison table 100 is a so-called claim chart showing technical differences.
  • the match score can be calculated as, for example, a numerical value of "0%" to "100%".
  • the document information evaluation device 1 searches for similar prior art documents (prior document information) similar to the recognized invention (input information), and determines, for example, the possibility of acquiring a right based on the presence or absence of a similar invention ( S305).
  • the determination is executed by the determination unit 402. Judgment as to whether or not the inventions are similar can be made, for example, by recognizing the meaning (implication) of the recognized invention and whether or not a cited invention having similar implications can be searched.
  • the cited invention is a published patent document or a non-patent document. As the patent document, for example, a document such as a patent gazette published by the Japan Patent Office can be used.
  • non-patent document a document published in an academic journal, a newspaper, a website, or the like can be used.
  • the patent document or non-patent document may be stored in, for example, a dedicated database (not shown) so that it can be searched by the determination unit 402, or may be stored in the storage unit 102.
  • the document information evaluation device 1 ends this operation process.
  • the generation unit 403 may consider generating information that reduces the possibility of acquiring the right in the supplementary correction of the input information.
  • the supplementary correction of input information can consider the generation of information that deletes a component with input information.
  • a correction that deletes the constituent requirements of the content of the invention (input information) reduces the possibility of acquiring the right, but can expand the scope of the right of the invention.
  • the generation unit 403 can generate information that expands the scope of rights by deleting the constituent elements of the invention.
  • the generation unit 403 can expand the scope of rights of the invention while maintaining the possibility of acquiring the right by generating the information for deleting the constituent elements that have little influence on the possibility of acquiring the right.
  • the document information evaluation device 1 determines the first unit by the determination unit 401.
  • a second technical classification different from the technical classification is selected (S307). The selection is performed by the selection unit (not shown).
  • a technical classification that is not similar to the first technical classification may be selected.
  • dissimilar technical classifications can be selected by setting the patent classifications that match a predetermined number of digits from the beginning of the technical classifications (patent classifications such as IPC and FI).
  • the output unit 104 outputs (extracts) the preceding document information using a second technical classification different from the first technical classification determined in S307 (S308).
  • the output is executed by the output unit 104.
  • the preceding document information included in the storage unit 102 may be simply searched by a keyword search.
  • the generation unit 403 compares the preceding document information and the sentences included in the input information, and generates additional information based on the document information constituting the difference between the preceding document information and the input information (S309).
  • the output unit 104 can appropriately select and output sentences, phrases, and words (additional information) that constitute the difference. As a result, it becomes possible to present additional information with some configuration externally added to the invention (input information) for which the possibility of acquiring the right is low, and the possibility of acquiring the right is improved for the user.
  • the invention can be proposed.
  • the input information divided for each constituent unit is divided into a plurality of words (keywords, etc.), and the dependency relationship of which keyword modifies which keyword is output (extracted). You may. This makes it possible to present additional information with some configuration internally added to inventions (input information) that are unlikely to acquire rights, improving the possibility of acquiring rights for users.
  • the invention can be proposed.
  • the determination unit 402 may redetermine the possibility of acquiring each right based on the plurality of additional information generated by the generation unit 403. By re-determining the possibility of acquiring the rights related to the plurality of generated intellectual property, it becomes possible to select the one having a high possibility of acquiring the rights from the plurality of generated additional information.
  • the generation unit 403 may be configured so that the additional information can be sorted from the plurality of additional information in the order of high possibility of acquiring the right in the result of the re-judgment and can be recommended to the user.
  • the generation unit 403 may generate information that reduces the possibility of acquiring the right in the supplementary correction of the input information.
  • the generation unit 403 may consider the generation of information that reduces the possibility of acquiring the right in the supplementary correction of the input information.
  • the supplementary correction of input information can consider the generation of information that deletes a component with input information.
  • An amendment that deletes the constituent requirements of the content of the invention (input information) reduces the possibility of acquiring the right, but can expand the scope of the right of the invention.
  • the generation unit 403 can generate information that expands the scope of rights by deleting the constituent elements of the invention.
  • the generation unit 403 can expand the scope of rights of the invention while maintaining the possibility of acquiring the right by generating the information for deleting the constituent elements that have little influence on the possibility of acquiring the right.
  • the document information evaluation device 1 uses words and sentences that frequently appear from the full text of the text described in the specification (statement of claims, subject of invention or purpose of invention, detailed description of invention, etc.).
  • the preceding document information may be output (extracted) based on a phrase, a drawing, a combination of a plurality of phrases, and the like.
  • the output (extraction) of the preceding document information may be performed by outputting (extracting) some sentences of the whole sentences described in the specification, for example, the preceding document information in which the subject of the invention is common.
  • the output (extraction) of the preceding document information may output (extract) the preceding document information having the same effect of the invention.
  • the document information evaluation device 1 searches for the preceding document information
  • the preceding document having a high frequency of appearance such as a keyword (word) described in the input information
  • This selection may be executed by the user inputting the output (extraction) condition of the preceding document information from the input box (not shown) via the user terminal 2.
  • the input box (not shown) for example, "the subject of the invention is common” or “the effect of the invention is common” is input.
  • the input is accepted by a condition input unit (not shown).
  • the output unit 104 may be configured to output (extract) the preceding document information according to the condition.
  • the document information evaluated by the document information evaluation device 1 may be displayed and output as a patent map.
  • the display output of the patent map may be performed by, for example, a display unit (not shown).
  • the patent map may be configured to display and output a plurality of document information as a patent map by classifying a plurality of document information into technical classifications such as IPC and FI, or by words (keywords, idioms, etc.).
  • the patent map includes a terrain map (for example, a map imitating the terrain of the battlefield, hereinafter referred to as “battlefield map”) 220 in which document information is arranged as a second character (for example, a warrior).
  • the document information evaluation device 1 may be configured so that the battlefield map 220, the bird's-eye view 230, and the chart 240 can be arbitrarily switched and displayed and output on the user terminal 2.
  • the switching is performed by, for example, a switching unit (not shown) included in the document information evaluation device 1.
  • the design registration or the trademark registration is determined based on the degree of agreement score and the degree of similarity. You may.
  • a program for realizing the functions constituting the apparatus described in the present embodiment and the modification is stored in a computer-readable storage medium, and the program stored in the storage medium is read into the computer system. By executing this, the various processes described above of the present embodiment may be performed.
  • the "computer system” referred to here may include hardware such as an OS and peripheral devices. Further, the “computer system” includes a homepage providing environment (or a display environment) if a WWW system is used.
  • the "computer-readable storage medium” includes a flexible disk, a magneto-optical disk, a ROM, a writable non-volatile memory such as a flash memory, a portable medium such as a CD-ROM, a hard disk built in a computer system, and the like. Refers to the storage device of.
  • the "computer-readable storage medium” is a volatile memory inside a computer system that serves as a server or client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line (for example, DRAM (Dynamic)). It also includes those that hold the program for a certain period of time, such as Random Access Memory)). Further, the program may be transmitted from a computer system in which this program is stored in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium.
  • a network such as the Internet or a communication line such as a telephone line (for example, DRAM (Dynamic)). It also includes those that hold the program for a certain period of time, such as Random Access Memory)).
  • the program may be transmitted from a computer system in which this program is stored in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium.
  • the "transmission medium” for transmitting a program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
  • the above program may be for realizing a part of the above-mentioned functions. Further, it may be a so-called difference file (difference program) that realizes the above-mentioned function in combination with a program already stored in the computer system.
  • An information acquisition unit that acquires input information input from a user terminal that can be operated by the user from the user terminal, and an information acquisition unit.
  • a storage unit that stores multiple document information
  • a calculation unit that decomposes the input information into predetermined structural units and calculates the degree of matching with the document information of one of the plurality of document information stored in the storage unit for each decomposed structural unit as a score.
  • An output unit that outputs a comparison table showing the degree of difference between the input information and the document information for each structural unit based on the score.
  • the comparison table is provided with an input unit for inputting a self-evaluation of the document information by the user.
  • Document information evaluation device that evaluates input information input from a user terminal that can be operated by the user from the user terminal, and an information acquisition unit.
  • a storage unit that stores multiple document information
  • a calculation unit that decomposes the input information into predetermined structural units and calculates the degree of matching with the document information of one of the plurality of document information stored in the storage unit for each
  • [Appendix 2] The output unit According to the self-evaluation result input by the input unit, the document information is switched between a high evaluation mode indicating that the document information is good and a low evaluation mode indicating that the document information is not good, and output.
  • the document information evaluation device according to [Appendix 1].
  • [Appendix 3] The output unit Each document information is output by switching between the high evaluation mode and the low evaluation mode for each of the structural units.
  • the document information evaluation device according to [Appendix 2].
  • [Appendix 4] The output unit For each structural unit of the input information, it is possible to output the degree of difference between the input information and the plurality of document information in the comparison table.
  • the output priority of the plurality of document information is determined by whether or not the score calculated for each structural unit satisfies a predetermined criterion.
  • the document information evaluation device according to any one of [Appendix 1] to [Appendix 3].
  • the input information and the plurality of document information include information on intellectual property.
  • the document information evaluation device according to any one of [Appendix 1] to [Appendix 4].
  • [Appendix 6] The calculation unit Reflecting the switching of the self-evaluation mode indicating the self-evaluation, the degree of matching of the document information with respect to the input information is recalculated.
  • the document information evaluation device according to [Appendix 5].
  • a document information fixing unit for fixing at least one desired document information desired by the user among the plurality of document information output to the comparison table as main document information is further provided.
  • the calculation unit Based on the main document information fixed by the document information fixing unit, the degree of matching of the document information with respect to the input information is recalculated.
  • the document information evaluation device according to [Appendix 5] or [Appendix 6].
  • a storage unit that stores multiple document information
  • a synonym expansion selection unit that accepts input for expanding the first synonym information of the keyword included in the input information and at least one of the search keywords.
  • the output unit that outputs the first synonym information and the output unit
  • a calculation unit that compares the input information and the text included in the preceding document information and calculates the degree of agreement with the input information as a score.
  • the output unit can display and output a first information bar in which a plurality of selections of synonym expansion of the first synonym information of the keyword included in the input information and at least one of the search keywords can be set.
  • the storage unit stores the second synonym dictionary having a plurality of second synonym information for each of the plurality of keywords unique to the user in association with the keywords of the first synonym dictionary having the plurality of first synonym information.
  • At least one second synonym information corresponding to the keyword can be deleted from the first synonym information corresponding to the output keyword, or any second synonym information can be added.
  • Document information evaluation device [Appendix 2]
  • search sentence range selection unit that accepts input that enables selection of whether or not to compare the text described in which part of the preceding document information with the input information.
  • the output unit is characterized in that it displays and outputs a second information bar on which a plurality of selections of the search sentence range can be set.
  • [Appendix 3] A technical field input unit that accepts the input of keywords related to the technical field of the input information, and A technical feature input unit that accepts input of a keyword related to the technical feature of the input information is further provided.
  • [Appendix 4] The computer The input information input from the user terminal that can be operated by the user and the sentences included in the plurality of document information are compared to extract the preceding document information similar to the input information, and the input information and the extracted preceding information are extracted. It is a document information evaluation method that evaluates the degree of similarity with document information.
  • a storage step to store multiple document information A synonym expansion selection step that accepts input for expanding the first synonym information of the keyword included in the input information and at least one of the search keywords, and When the synonym expansion is selected in the synonym expansion selection unit according to the operation of the user, the output step for outputting the first synonym information and the output step.
  • the output step can display and output a first information bar in which a plurality of selections of synonym expansion of the first synonym information of the keyword included in the input information and at least one of the search keywords can be set.
  • the second synonym dictionary having a plurality of second synonym information for each of the plurality of keywords unique to the user is stored in association with the keywords of the first synonym dictionary having the plurality of first synonym information.
  • At least one second synonym information corresponding to the keyword can be deleted from the first synonym information corresponding to the output keyword, or any second synonym information can be added.
  • Document information evaluation method is possible.
  • a memory function that stores multiple document information and A synonym expansion selection function that accepts input to expand the first synonym information of the keyword included in the input information and at least one of the search keywords, and When the synonym expansion is selected in the synonym expansion selection unit according to the operation of the user, the output function for outputting the first synonym information and the output function A calculation function that compares the input information and the text included in the preceding document information and calculates the degree of agreement with the input information as a score.
  • the output function can display and output a first information bar in which a plurality of selections of synonym expansion of the first synonym information of the keyword included in the input information and at least one of the search keywords can be set.
  • the storage function stores a second synonym dictionary having a plurality of second synonym information for each of a plurality of keywords unique to the user in association with a keyword of the first synonym dictionary having the plurality of first synonym information.
  • At least one second synonym information corresponding to the keyword can be deleted from the first synonym information corresponding to the output keyword, or any second synonym information can be added.
  • the input information input from the user terminal that can be operated by the user and the text included in the preceding document information are compared to extract the preceding document information similar to the input information, and the input information and the extracted preceding document are extracted.
  • a document information evaluation device that evaluates the degree of similarity with information.
  • a document information input unit that accepts input of input information input from a user terminal that can be operated by the user, A storage unit that stores multiple preceding document information, A decision unit that determines the first technical classification of the input information, and A calculation unit that compares the input information and the text included in the preceding document information and calculates the degree of agreement with the input information as a score.
  • An output unit that outputs a comparison table showing the degree of difference between the input information and the document information for each component unit based on the score, and an output unit.
  • a judgment unit that determines the possibility of acquiring rights based on the score
  • a generation unit that generates additional information that improves the possibility of acquiring the right according to the possibility of acquiring the right related to the input information of the user.
  • the output unit outputs prior document information using a second technical classification different from the first technical classification determined by the determination unit according to the possibility of acquiring the right related to the input information of the user.
  • the generation unit compares the preceding document information and the text included in the input information, and generates additional information based on the document information constituting the difference between the preceding document information and the input information.
  • Document information evaluation device that evaluates the document information to evaluate the document information.
  • the document information evaluation device according to [Appendix 2].
  • the output unit can decompose the input information into each structural unit and output it.
  • the generation unit generates words that do not exist in the plurality of words constituting the structural unit as the additional information.
  • the document information evaluation device according to any one of [Appendix 1] to [Appendix 3].
  • the display unit further includes a display unit that displays and outputs the evaluated document information as a patent map.
  • the document information evaluation device according to any one of [Appendix 1] to [Appendix 4].
  • the input information input from the user terminal that can be operated by the user and the text included in the preceding document information are compared to extract the preceding document information similar to the input information, and the input information and the extracted preceding document are extracted. It is a document information evaluation method that evaluates the degree of similarity with information.
  • the computer A document information input step that accepts input of input information input from a user terminal that can be operated by the user, and A storage step to store multiple preceding document information, A decision step for determining the first technical classification of the input information, and A calculation step of comparing the input information and the text included in the preceding document information and calculating the degree of agreement with the input information as a score. Based on the score, an output step that outputs a comparison table showing the degree of difference between the input information and the document information for each structural unit, and Judgment step to judge the possibility of acquisition of rights based on the above score, A generation step of generating additional information that improves the possibility of acquiring the right according to the possibility of acquiring the right related to the input information of the user.
  • the output step outputs the preceding document information using a second technical classification different from the first technical classification determined in the determination step according to the possibility of acquiring the right related to the input information of the user.
  • the generation step compares the preceding document information with the text contained in the input information, and generates additional information based on the document information constituting the difference between the preceding document information and the input information.
  • Document information evaluation method [Appendix 6] The input information input from the user terminal that can be operated by the user and the text included in the preceding document information are compared to extract the preceding document information similar to the input information, and the input information and the extracted preceding document are extracted.
  • a document information evaluation program that evaluates the degree of similarity with information.
  • a document information input function that accepts input of input information input from a user terminal that can be operated by the user, A memory function that stores multiple preceding document information, A decision function for determining the first technical classification of the input information and A calculation function that compares the input information and the text included in the preceding document information and calculates the degree of agreement with the input information as a score.
  • An output function that outputs a comparison table showing the degree of difference between the input information and the document information for each structural unit based on the score, and Judgment function to judge the possibility of acquisition of rights based on the above score, A generation function that generates additional information that improves the possibility of acquiring the right according to the possibility of acquiring the right related to the input information of the user.
  • the output function outputs prior document information using a second technical classification different from the first technical classification determined by the determination function according to the possibility of acquiring the right related to the input information of the user.
  • the generation function compares the preceding document information and the text included in the input information, and generates additional information based on the document information constituting the difference between the preceding document information and the input information.
  • Document information evaluation program
  • Document information evaluation device User terminal 101 Information acquisition unit 102 Storage unit 103 Calculation unit 104 Output unit 105 Input unit 115 Self-evaluation mode changeover switch 115a "Like! Function 115b "No! Function 106 Fixed switch 107 Input box 108 Specific switch 109 Search switch 100 Comparison table 200 Display screen NW network 11 CPU 12 RAM 13 ROM 14 Touch panel 15 Communication I / F 301 Text information input unit 401 Decision unit 402 Judgment unit 403 Generation unit

Abstract

創作された入力情報の権利取得の可能性を容易に評価できるとともに、新たな知的財産の創作を容易にすることができる、文書情報評価装置および文書情報評価方法並びに文書情報評価支援プログラムを提供する。 入力情報と類似する先行文書情報を抽出し、入力情報と先行文書情報との類似度を評価する文書情報評価装置であって、出力部は、利用者の権利取得の可能性に応じて、決定部にて決定した第1技術分類と異なる第2技術分類を用いて先行文書情報の出力を行い、生成部は、先行文書情報および入力情報に含まれる文章の比較を行い、先行文書情報と入力情報との差分を構成する文書情報に基づき追加情報を生成することができる。

Description

文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
 本発明は、文書情報評価装置および文書情報評価方法並びに文書情報評価プログラムに関するものである。
 近年、膨大な文書情報のなかから、条件に近い内容の文書情報を検索するシステムが提案されている(例えば、特許文献1参照。)。特許文献1には、文書情報の各部分を構成するセグメント(構成単位)ごとにキーワードの出現頻度から各文書情報の重みを計算し、その重みに基づいて所定の基準で類似度をスコア化することが記載されている。特許文献1のシステムによれば、文書情報のセグメントごとに類似度をスコア化しているため、文書情報の一部にしか条件に近い内容が記載されない場合であっても確実に検索することができる。
特開2015-203961号公報 特開2010-224984号公報
 しかし、特許文献1のシステムに基づくと、文書情報の一部にしか条件に近い内容が記載されておらず、文書情報の全体としては類似度が低い文献情報が検索される場合が生じ得る。利用者が意図しない文献情報が検索された場合、検索条件に用いるキーワード、文節、文章等の選定を最初からやり直す必要が生じる。そして、条件に近い内容の文書情報が検索されるまで、検索条件の選定を何回も繰り返すことになる。これには多大な時間を要し、利用者にとっての負担が非常に大きい。
 また、近年、出願前の発明を評価する装置が開発されている。特許文献2には、知的財産に関する情報を記憶し、出願前の出願書類についての評価、及び、作成の支援を行う、特許明細書評価・作成作業支援装置が開示されている。特許文献1に記載の特許明細書評価・作成作業支援装置は、拒絶理由通知書を含む公開特許公報に関する情報を格納し、該格納情報に対して出願前の出願書類を類似検索することによって、予測される拒絶理由通知書の記載を推定することが記載されている。
 そして、研究開発において発明を創作した技術者(発明者)は、自ら創作した発明が特許権等の知的財産に係る権利を取得できるか否かを確認するために、先行技術調査を行う場合がある。先行技術調査は、例えば、従来技術を検索可能なデータベースにおいて、自ら創作した発明の特徴を示すキーワードを入力して類似した従来技術の有無を検索する。技術者は、先行技術調査の結果から創作した発明について権利の取得の可能性を確認し、特許出願の可否について検討することができる。技術者は日々の研究開発において複数の発明を創作した場合、発明の創作の度に先行技術調査を行うことにより、それぞれの発明について権利の取得の可能性を確認することができる。
 しかし、継続した研究開発等の事業においては関連した発明等の知的財産が創作され、新たな知的財産は、過去に創作した関連した知的財産に対する新たな創作部分を付加することにより創作される場合がある。知的財産における権利取得の可能性を調査する先行技術調査の結果、権利取得の可能性が低いと評価された場合、新たな創作部分を改めて検討する必要が生じ得る。すなわち、アイデアの内容が新規性または進歩性の要件を満たしていない場合、新たな創作部分の検討に手間が掛かり特許出願が遅れる可能性がある。
 本発明の目的は、上記の課題に鑑み、創作された入力情報の権利取得の可能性を容易に評価できるとともに、新たな知的財産の創作を容易にすることができる、文書情報評価装置および文書情報評価方法並びに文書情報評価支援プログラムを提供することである。
 本発明の一実施形態における文書情報評価装置は、利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価装置であって、
 利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力部と、
 複数の先行文書情報を記憶する記憶部と、
 前記入力情報の第1技術分類を決定する決定部と、
 前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出部と、
 前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力部と、
 前記スコアに基づき、権利取得の可能性を判定する判定部と、
 前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成部と、
 を備え、
 前記出力部は、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定部にて決定した前記第1技術分類と異なる第2技術分類を用いて先行文書情報の出力を行い、
 前記生成部は、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、ことを特徴とする。
 本発明の一実施形態における文書情報評価装置において、前記第2技術分類を選択する選択部をさらに備え、
 前記選択部は、
 前記決定部にて決定した前記第1技術分類に関する前記先行文書情報に対応付けられた従来技術情報に付与されている技術分類を前記第2技術分類として選択する、ことを特徴としてもよい。
 本発明の一実施形態における文書情報評価装置において、前記生成部は、前記第2技術分類を用いて出力した前記先行文書情報に存在し、前記入力情報に存在しない文章を前記追加情報として生成する、ことを特徴としてもよい。
 本発明の一実施形態における文書情報評価装置において、前記出力部は、前記入力情報を構成単位ごとに分解して出力することが可能であり、
 前記生成部は、前記構成単位を構成する複数の単語に存在しない単語を前記追加情報として生成する、ことを特徴としてもよい。
 本発明の一実施形態における文書情報評価装置において、前記表示部は、評価された前記文書情報を、特許マップとして表示出力する表示部を、さらに備える、ことを特徴としてもよい。
 本発明の一実施形態における文書情報評価方法は、利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価方法であって、
 コンピュータが、
 利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力ステップと、
 複数の先行文書情報を記憶する記憶ステップと、
 前記入力情報の第1技術分類を決定する決定ステップと、
 前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出ステップと、
 前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力ステップと、
 前記スコアに基づき、権利取得の可能性を判定する判定ステップと、
 前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成ステップと、
 を備え、
 前記出力ステップは、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定ステップにて決定した前記第1技術分類と異なる第2技術分類を用いて先行文書情報の出力を行い、
 前記生成ステップは、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、ことを特徴とする。
 本発明の一実施形態における文書情報評価プログラムは、利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価プログラムであって、
 コンピュータに、
 利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力機能と、
 複数の先行文書情報を記憶する記憶機能と、
 前記入力情報の第1技術分類を決定する決定機能と、
 前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出機能と、
 前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力機能と、
 前記スコアに基づき、権利取得の可能性を判定する判定機能と、
 前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成機能と、
 を実行させ、
 前記出力機能は、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定機能にて決定した前記第1技術分類と異なる第2技術分類を用いて先行文書情報の出力を行い、
 前記生成機能は、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、ことを特徴とする。
 本発明によれば、創作された入力情報の権利取得の可能性を容易に評価できるとともに、新たな知的財産の創作を容易にすることができる、文書情報評価装置および文書情報評価方法並びに知的財産文書情報評価支援プログラムを提供させることができる。
本発明の一実施形態に係る文書情報評価装置1のソフトウェア構成の一例を示すブロック図である。 本発明の一実施形態における情報処理装置1のハードウェア構成の一例を示すブロック図である。 本発明の一実施形態に係る出力画面の例を示す模式図である。 本発明の一実施形態に係る文書情報評価装置1の動作例を示すフローチャートである。 本発明の第1の実施形態における、文書情報評価装置1のスコア算出処理の一例を示すフローチャートである。 本発明の一実施形態の第1変形例に係る文書情報評価装置1のソフトウェア構成の一例を示すブロック図である。 本発明の一実施形態の第1変形例に係る検索の画面の例を示す模式図である。 本発明の一実施形態の第1変形例に係る類義語辞書テーブルの一例を示す図である。 本発明の一実施形態の第1変形例に係る文書情報評価装置1の動作例を示すフローチャートである。 本発明の一実施形態の第2変形例に係る文書情報評価装置1のソフトウェア構成の一例を示すブロック図である。 本発明の一実施形態の第2変形例に係る文書情報評価装置1の動作例を示すフローチャートである。 本発明の実施形態に係る利用者端末へ出力される文書情報の評価結果の態様の例を示す地形マップである。 本発明の実施形態に係る利用者端末へ出力される文書情報の評価結果の態様の例を示す俯瞰図である。 本発明の実施形態に係る利用者端末へ出力される文書情報の評価結果の態様の例を示すチャートである。
 以下、図面を参照して本発明の一実施形態における情報処理文書情報評価装置、文書情報評価方法及び文書情報評価プログラムについて詳細に説明する。
 先ず、図1を用いて、文書情報評価装置1のソフトウェア構成を説明する。図1は、本発明の一実施形態における文書情報評価装置1のソフトウェア構成の一例を示すブロック図である。
 文書情報評価装置1は、情報取得部101と、記憶部102と、算出部103と、出力部104と、入力部105の各機能部を有する。本実施形態における文書情報評価装置1の上記各機能部は、文書情報評価装置1を制御する情報処理プログラム(ソフトウェア)によって実現される機能モジュールであるものとして説明する。文書情報評価プログラムは、文書情報評価装置1で動作する。すなわち、文書情報評価装置1は、文書情報評価プログラムが動作する装置をいう。
 出力部104は、利用者が検索または分析したい内容に関係する入力情報に対し、該入力情報と複数の文書情報との一致度をスコアとして算出した結果を比較表100(図3参照)として出力する。その出力結果に基づき、利用者は、比較表100に対して自己評価を入力することができる。これによって、文書情報評価装置1は、検索または分析の精度を向上させることが可能であって、利用者が希望する条件に近い内容の文書情報を検索または分析する場合に、検索または分析に要する時間を低減させることができ、検索の効率化を実現することができる。
 文書情報評価装置1は、ネットワーク(NW)を介して利用者端末2と接続し、該利用者端末2に対して文書情報評価システムのサービスを提供するための装置である。文書情報評価装置1は、例えば、いわゆるサーバ装置やコンピュータ(例えば、デスクトップ、ラップトップ、タブレットなど)である。なお、本発明の一実施形態において、文書情報評価装置1は、これらに限定されない。
 情報取得部101は、利用者端末2から入力されたこれら知的財産に関する情報を、利用者端末2から取得する。利用者端末2は、利用者が操作可能な端末装置であって、例えば、デスクトップPC、ノートPC、タブレットPCまたはスマートフォン等である。本実施形態では、一例として、入力情報および文書情報が知的財産に関する情報である場合について説明する。
 ここで、知的財産とは、人間の知的活動によって生み出されたアイデアや創作物等である。知的財産は、例えば、発明、考案、意匠、商標、著作物、回路配置または植物の新品種である。また、知的財産は、例えば、知的財産の内容を説明するための文書、知的財産の内容を説明するための図、表、グラフ、スケッチもしくは写真(図等)、または図等を説明する文書等であってもよい。本実施形態における知的財産に関する情報とは、上述した利用者が検索または分析したい内容を抽出するための情報である。知的財産に関する情報は、権利取得された情報のみならず、権利取得前の公開情報、未公開情報、出願前の発明情報を含む。権利取得された情報とは、例えば、特許権、実用新案権、意匠権、商標権、著作権、回路配置利用権または育成者権等が成立している情報である。例えば、知的財産が発明である場合、入力情報および文書情報は、発明の内容を示す文章(特許請求の範囲の記載、発明の課題または発明の目的等)または図面等の情報である。また、知的財産が意匠である場合、入力情報および文書情報は、形状、模様若しくは色彩又はこれらの結合に係る図面等の情報である。また、知的財産が商標である場合、入力情報および文書情報は、商品またはサービスの識別標識である。
 記憶部102は、文書情報を保持する。文書情報は、NWを介して送受信される様々なデータを含み、例えば、文章データ、数値データを含む。文章データは、例えば、知的財産に関する情報、アイデアシート、アイデアメモ、訴訟に関連する情報、論文、書籍(雑誌、週刊誌を含む)、レポート及びホームページを含む。数値データは、例えば、実験データ、測定データ、統計データ、検査データが含まれる。その他、文章情報は、数式データ、図表データ、写真データ及び画像データ(静止画像、動画像を含む)を含む。
 なお、知的財産に関する情報には、上述したように権利取得前の情報を含んでいてもよい。権利取得前の情報とは、例えば、発明や意匠を創作するまでの過程を記憶した情報、実験のために準備した材料もしくは装置、実験結果、研究開発の表題、研究開発の目的、技術者の氏名、技術者の所属名、プロジェクト番号等の付随的な情報である。付随的な情報には、取得された知的財産に関する情報に対するアクセス権限の情報を含んでいてもよい。アクセス権限とは、情報に対する閲覧、編集、削除、認証処理等の処理を実行できる権限であり、例えば、知的財産に関する情報を記憶した技術者に対しては、全ての処理を実行できるアクセス権限を付与し、知的財産の創作に共同した技術者には、閲覧の処理を実行できるアクセス権限を付与し、または、知的財産に関する情報を認証する認証者(後述)には認証処理を実行できるアクセス権限を付与する。情報取得部101は、知的財産に関する情報として、これらの付随的な情報を取得するようにしてもよい。利用者が入力したこれら知的財産に関する情報を、利用者端末2から取得する。
 また、以下の説明においては、知的財産が発明である場合を例示するが、知的財産は発明に限定されるものではない。すなわち、知的財産の創作には、商標における識別標識の選択等を含んでいてもよい。
 算出部103は、記憶部102において記憶された文書情報に基づき、利用者端末2から入力された入力情報に対する一致度を算出する。具体的には、入力情報を所定の構成単位に分解し、該分解された構成単位ごとに、記憶部102に記憶された複数の文書情報のうちの一の文書情報との一致度をスコアとして算出することができる。構成単位の分解は、例えば、「発明者、創作者、または出願人として関係する知的財産に関する情報」の構成要件を句読点ごとに分節をする。または、一定の文章の長さや、述語ごとに分節をしてもよい。算出部103は、構成要件を認定すると、出力部104により類似情報を取得し、構成要件と類似情報の近似の程度を算出する。構成要件のキーワードと同一または、そのキーワードよりも類似情報のキーワードが下位概念であれば一致度は高いと判断してもよい。算出部103は、記憶部102に、予め記憶された、単語のコーパス辞書により、その辞書により下位概念または上位概念の有無を算出できる。
 算出部103は、構成要件と類似情報の一致度をスコア算出し、一致するか否かを閾値処理により判定し、構成要件の一致点および相違点を算出する。閾値は予め定められていてもよいし、機械学習により算出されたスコアをもちいてもよい。
 また、算出部103は、具体的には、一致度をスコア算出するよう、記憶部102に記憶された知的財産に関する情報を用いて機械学習させたモデルを用いて、利用者端末2から受け付けた知的財産に関する情報に対する入力情報との内容の一致度をスコア算出することができる。これにより、文書情報評価装置1は、知的財産に関する情報(例えば、過去の特許情報)に基づいた一致度のスコア算出を、より素早く正確かつ容易に行うことができる。
 機械学習において用いられる知的財産に関する情報は、該知的財産に関する情報について項目ごとに予め数値化された上で処理されており、利用者端末2から入力された知的財産に関する入力情報も、同様に数値化した上で一致度のスコア算出が行われる。
 予め数値化される知的財産に関する情報に関する項目とは、例えば、知的財産に関する公開公報に紐づく各種情報であってもよい。知的財産に関する公開公報に紐づく各種情報は、例えば、公開公報の発行日、該公開公報に係る出願書類の提出日(すなわち出願日)、該公開公報に係る出願において受領した拒絶理由通知書の回数、該拒絶理由通知書における内容、該拒絶理由通知書に対する応答の内容、該公開公報に係る出願において行われた補正の回数、該補正の内容、独立請求項の文字数、請求項の数などであってもよい。
 算出部103は、一致度のスコア算出のため、過去に文書情報評価装置1を使用して一致度をスコア算出した知的財産に関する情報の実際の結果をフィードバックとして記憶部102が格納することによって、機械学習に使用することができる。これにより、文書情報評価装置1は、より精度の高い類似する先行技術文献(先行文書情報)の抽出を行うことができる。
 算出部103は、利用者が利用者端末2から入力した知的財産に関する入力情報に対して一致度のスコア算出を行った結果、相違点が高い(一致点が低い)場合、新たなキーワードを抽出し、構成要件ごとの一致度を改めてスコア算出してもよい。例えば、算出部103は、利用者端末2から入力された知的財産に関する情報において使用されるキーワードに代えて又は加えて抽出した新たなキーワードを使用した場合について一致度を改めて、スコア算出することができる。このとき、算出部103は、一致度のスコアが高くなるまで、キーワードの抽出を繰り返すことができる。一致度のスコアが高く算出された場合、このとき抽出したキーワードを出力部104より利用者端末2に出力することができる。キーワードの抽出は、記憶部102において記憶されている知的財産に関する文書情報からランダムに抽出してもよく、利用者端末2から入力された知的財産に関する入力情報から抽出するようにしてもよく、オズボーンのチェックリスト等を使用してキーワードの抽出の方法を予め定めておき、該方法に基づいて抽出してもよい。これにより、文書情報評価装置1は、利用者端末2から入力された知的財産に関する情報に対する一致度のスコア算出だけでなく、該知的財産に関する情報に関してどうすれば一致度が高くなるかの情報を利用者に提示することが可能となり、利用者が希望する内容を精度よく検索または分析することができる。
 キーワードとは、文章、語句、熟語、単語、記号、アルファベット、化学式、又は数字などである。
 また、算出部103は、利用者端末2から入力された知的財産に関する情報に対して一致度のスコア算出を行った結果、一致点が高い(相違点が低い)場合、記憶部102において記憶されている知的財産に関する文書情報からキーワードを抽出することができ、このとき、利用者端末2から入力された知的財産に関する入力情報において使用されるキーワードに代えて又は加えて抽出したキーワードを使用した場合の一致度のスコアが高くなる分布のうち端に位置するようなキーワードを抽出することとしてもよい。キーワードの抽出の際、利用者端末2から受け付けた知的財産に関する情報において使用されるキーワードに代えて又は加えて該抽出したキーワードを使用した場合の一致度のスコアが高くなる分布のうち、中央ではなく端に位置するようなキーワードを抽出することによって、文書情報評価装置1は、抽出するキーワードによる知的財産に関する情報についての限定に際し、より一致度のスコアを低くすることが可能なキーワードを提示することができる。例えば、知的財産に関する情報が特許出願予定の発明の場合、文書情報評価装置1は、該発明に対し、権利取得可能性を肯定的にしつつ、該発明の限定がより少ないものとなるようにすることが可能なキーワードを抽出することができる。
 算出部103は、具体的には、学習データ及び権利取得可能性の情報に基づいて、知的財産に関する情報に付加すべき新たなキーワードを、知的財産に関する入力情報から算出し、出力部104は、新たなキーワードを出力することができる。これにより、文書情報評価装置1は、知的財産に関する情報を利用者によりわかりやすく表現することができ、知的財産法の知識に乏しい利用者であっても、わかりやすく知的財産に関する情報として、新たなキーワードを含めた発明の提案をすることができる。
 また、算出部103は、相違性が認められた場合、その相違点の高い(一致点の低い)構成要件に対して、出力部104を介して、新たな類似特許を取得することとしてもよい。具体的には、算出部103は、一致点が低いと判断をし、出力部104に対して新たな類似情報を出力するように指令をし、出力部104は一致点の低い構成単位を埋めるための新たな類似情報を取得してもよい。算出部103による一致度の算出は、利用者が検索ボタン109(図3参照)を押すことによって、算出部103に検索信号が入力されることによって実行される。
 出力部104は、文書情報の評価結果を利用者端末2に出力する。例えば、文書情報の評価結果は、構成単位ごとに、入力情報に類似する文書情報(以下、「類似情報」という)との差異の程度を対比(比較)した比較表である。ただし、文書情報の評価結果は、比較表に限定されない。例えば、模擬拒絶理由通知書(拒絶理由通知書に似せた、模擬的な通知書)であったり、発明者または出願人として関係する知的財産に関する情報等も含まれる。特許の場合、発明者または出願人として関係する知的財産に関する情報は、発明情報が記載されている発明メモや請求項情報である。類似情報は、例えば先行技術文献(先行文書情報)であって、比較表100(図3参照)は、技術的な差異を示したいわゆるクレームチャートである。なお、入力情報に類似する文書情報との差異の程度は、構成単位ごとに対比(比較)する場合には限定されない。当該差異の程度は、文章、文節、複数の文節の組み合わせに基づいて、入力情報と先行文書情報との差異の程度(一致度)を構成単位(Element)ごとに比較してもよいし、入力情報と先行文書情報との差異の程度(一致度)を文章全体として比較してもよい。
 入力部105には、利用者の自己評価を示す自己評価モードが入力される。利用者は利用者の自己評価を示す自己評価モードの選択をすることができる。自己評価モードは、自己評価モード切り替えスイッチ115(図3参照)により選択できるように構成されている。出力部104は、比較表100に対し、自己評価モード切り替えスイッチ115を表示出力する。詳細は、後述する。
 以上説明した、文書情報評価装置1が有する、情報取得部101、記憶部102、算出部103、出力部104、入力部105の各機能部は、文書情報評価装置1の機能の一例を示したものであり、文書情報評価装置1が有する機能を限定したものではない。例えば、文書情報評価装置1は、上記全ての機能を有している必要はなく、一部の機能を有するものであってもよい。また、文書情報評価装置1は、上記以外の他の機能を有していてもよい。例えば、文書情報評価装置1は、機能の設定を行うための入力機能や、装置の稼働状態をLEDランプ等により報知する出力機能を有していてもよい。
 また、文書情報評価装置1が有する上記各機能部は、上述の通り、ソフトウェアによって実現されるものとして説明した。しかし、文書情報評価装置1が有する上記機能部の中で少なくとも1つ以上の機能部は、ハードウェアによって実現されるものであってもよい。
 また、文書情報評価装置1が有する上記何れかの機能部は、1つの機能部を複数の機能部に分割して実施してもよい。また、文書情報評価装置1が有する上記何れか2つ以上の機能部を1つの機能に集約して実施してもよい。すなわち、図1は、文書情報評価装置1が有する機能を機能ブロックで表現したものであり、例えば、各機能部がそれぞれ別個のプログラムファイル等で構成されていることを示すものではない。
 また、文書情報評価装置1は、1つの筐体によって実現される装置であっても、ネットワーク等を介して接続された複数の装置から実現されるシステムであってもよい。例えば、文書情報評価装置1は、その機能の一部または全部をクラウドコンピューティングシステムによって提供されるクラウドサービス等、仮想的な装置によって実現するものであってもよい。すなわち、文書情報評価装置1は、上記各機能部のうち、少なくとも1以上の機能部を他の装置において実現するようにしてもよい。また、文書情報評価装置1は、サーバ装置等の汎用的なコンピュータであってもよく、機能が限定された専用の装置であってもよい。
 次に、図2を用いて、文書情報評価装置1のハードウェア構成を説明する。図2は、本発明の一実施形態における文書情報評価装置1のハードウェア構成の一例を示すブロック図である。
 文書情報評価装置1は、CPU(Central Processing Unit)11、RAM(Random Access Memory)12、ROM(Read Only Memory)13、タッチパネル14および通信I/F(Interface)15を有する。文書情報評価装置1は、図1で説明した情報処理プログラムを実行する装置である。
 CPU11は、RAM12またはROM13に記憶された情報処理プログラムを実行することにより、文書情報評価装置1の制御を行う。文書情報評価プログラムは、例えば、文書情報評価プログラムを記憶した記憶媒体、または、ネットワークを介したプログラム配信サーバ等から取得されて、ROM13にインストールされ、CPU11から読出されて実行される。
 タッチパネル14は、操作入力機能と表示機能(操作表示機能)を有する。タッチパネル14は、文書情報評価装置1の利用者に対して指先又はタッチペン等を用いた操作入力を可能にする。本実施形態における文書情報評価装置1は操作表示機能を有するタッチパネル14を用いる場合を説明するが、文書情報評価装置1は、表示機能を有する表示装置と操作入力機能を有する操作入力装置とを別個有するものであってもよい。その場合、タッチパネル14の表示画面は表示装置の表示画面、タッチパネル14の操作は操作入力装置の操作として実施することができる。なお、タッチパネル14は、ヘッドマウント型、メガネ型、腕時計型のディスプレイ等の種々の形態によって実現されてもよい。
 通信I/F15は、通信用のI/Fである。通信I/F15は、例えば、無線LAN、有線LAN、または赤外線等の近距離無線通信等を実行する。通信I/F15は、例えば、NWを介して利用者端末2との通信を実現する。通信I/F15は、他の文書情報評価装置1との通信を実現するものであってもよい。なお、図2において通信用のI/Fは通信I/F15のみを図示するが、文書情報評価装置1は複数の通信方式においてそれぞれの通信用のI/Fを有するものであってもよい。
 次に、図3を用いて、文書情報評価装置1の出力画面の出力例を説明する。図3は、本発明の一実施形態に係る出力画面の例を示す模式図である。
 入力部105には、利用者の自己評価を示す自己評価モードが入力される。比較表100に対して、利用者が、類似情報としての文書情報の自己評価を示す自己評価モード切り替えスイッチ115を押すことにより、自己評価指令信号が入力部105に入力される。出力部104は、比較表100に対し、利用者による文書情報の自己評価を示す自己評価モード切り替えスイッチ115を表示出力する。この自己評価モード切り替えスイッチ115に対してマウスによるクリックやキーボードの操作を行うことにより、自己評価指令信号が入力部105に入力される。自己評価モード切り替えスイッチ115をクリックすることにより利用者は自己評価を示す自己評価モードの選択ができる。また、利用者による選択に基づいて、出力部104は、比較表100に対し自己評価を出力することができる。
 より詳細には、出力部104は、自己評価モード切り替えスイッチ115を比較表100に対して表示出力し、利用者がこの自己評価モード切り替えスイッチ115を選択する操作、すなわちマウスによるクリックやキーボードによる操作を行う。そして、出力部104は、自己評価モード切り替えスイッチ115の選択操作に基づき、例えば、模式的に図案化した図形(画像)を自己評価モードとして表示出力することができる。このように、利用者は、自己評価モード切り替えスイッチ115を操作し自己評価モードの選択を行うことにより、利用者からの自己評価の選択指示が行われ、自己評価指令信号を入力部105が受け付ける。
 利用者は、マウスにより、自己評価モード切り替えスイッチ115をクリックすることによって、自己の評価を示す自己評価モードを選択することができる。そして、入力部105からの自己評価指令信号に基づき、出力部104は、自己評価の結果に応じて、文書情報が良好であることを示す高評価モードと良好でないことを示す低評価モードに切り替えて出力することができる。なお、切り替えて出力することができればよく、自己評価モード切り替えスイッチ115は、例えば、ボタン、アイコン等であってもよい。
 図3に示すように、高評価モードとは、例えば、利用者の評価に対して「いいね!」といった評価が高いことを示す「いいね!」機能115aと、「よくないね!」といった評価が低いことを示す「ダメだね!」機能115bとを切り替えて出力することができる。出力部104は、「いいね!」機能115aと「ダメだね!」機能115bの表示態様を変更して出力することができる。視覚的に分かるように、例えば、「いいね!」機能115aの表示態様は、肯定的な事象に対して表現する場合にとるポーズ、例えば、手を握った状態で親指を上方向に向ける態様の図形を出力することができる。また、表情が笑顔の図形や万歳をしている態様の図形を出力してもよい。その他、「いいね!」機能115aの表示態様は、「○」の図形を出力するように構成してもよい。
 また、図3に示すように、「ダメだね!」機能115bの表示態様は、否定的な事象に対して表現する場合にとるポーズ、例えば、手を握った状態で親指を下方向に向ける態様の図形を出力することができる。また、表情が悲観的な顔の図形や残念モードを表現する首を横に振っている態様の図形を出力してもよい。その他、「ダメだね!」機能115bの表示態様は、「×」の図形を出力するように構成してもよい。
 「いいね!」機能115aと「ダメだね!」機能115bの表示態様はスイッチの図形を変更して表示する場合に限定されない。例えば、出力部104は、「いいね!」機能115aと「ダメだね!」機能115bとで、スイッチの色を変更して表示するように構成してもよい。また、上記の自己評価モード(「いいね!」機能115aまたは「ダメだね!」機能115b)の切り替えは、文書情報ごとに行うこともできるし、入力情報の構成単位(Element)ごとに行うこともできる。このように自己評価モードを該構成単位ごとに切り替えることができるため、構成単位の高いスコアと、構成単位の低いスコアを視覚的に一目で把握することができる。
 また、出力部104は、新たな類似情報に基づいて、第1キャラクター3の態様を選択してもよいとすることができる。具体的には、自己評価モード(「いいね!」機能115aまたは「ダメだね!」機能115b)の内容によって第1キャラクターのどの喜怒哀楽の出力態様にするかを選択するように構成してもよい。例えば、自己評価モードが「いいね!」機能115aの場合は、例えば、「喜」または「楽」の出力態様で表示出力されるように構成してもよい。また、自己評価モードが「ダメだね!」機能115bの場合は、例えば、「怒」または「哀」の出力態様で表示出力されるように構成してもよい。この表示出力は、出力部104が実行する。
 以上のように、出力部104は、算出部103により算出された一致度のスコア結果に基づいて、第1キャラクター3の態様を出力制御することができる。算出部103により算出された知的財産に関するデータに基づいて、第1キャラクター3の態様を出力制御することにより、文書情報評価装置1は、第1キャラクター3を使用した知的財産に関する情報の表現が可能となり、知的財産法の知識に乏しいユーザ利用者であっても、わかりやすく知的財産に関する情報を理解させることができる。
 図3に示すように、出力部104は、比較表100に出力される類似特許として複数の文書情報を出力することができる。そして、出力部104は、入力情報と複数の文書情報との差異の程度(一致度)を構成単位(Element)ごとに比較表100に出力する。図3では、5件の文書情報を出力する例が示されているが、文書情報の件数は限定されない。5件の文書情報の出力優先度は、構成単位ごとに算出される一致度を示すスコアが所定の基準を満たすか否かで決定する。所定の基準は、例えば、各構成単位のスコアを合算した値が高い順に上位5件の文献情報を左列から右列に向かって出力するように構成してもよい。また、所定の基準は、各構成単位のスコアの平均値が高い順に上位5件の文書情報を左列から右列に向かって出力するように構成してもよい。また、所定の基準は、複数に分割した全ての構成単位のうち、いくつかの任意の構成単位のスコアの平均値が所定値以上の、上位5件の文献情報を左列から右列に向かって、高い順に出力するように構成してもよい。任意の構成単位の特定は、利用者が利用者端末2から入力された任意の構成単位を取得するように構成してもよい。任意の構成単位の取得は、情報取得部101が実行する。また、任意の構成単位が、記憶部102に予め記憶されていてもよい。
 また、左側から見て第2列目に出力される文書情報は、発明の各構成単位の一致度のスコアの平均値が一番高い文書情報を主引例として選定してもよい。発明と主引例との一致点と相違点の認定は、発明の各構成単位の一致度のスコアが、それぞれ所定値以上であるか否かで判断することとしてもよい。そして、主引例以外の文書情報は、主引例で一致度のスコアが低い構成単位について、一致度のスコアが高い類似先行技術文献(先行文書情報)を副引例として選定するように構成してもよい。比較表100には、先行技術文献(先行文書情報)における主引例と副引例の表示、ならびに主引例に係る構成単位および副引例に係る構成単位の表示を含んでいてもよい。
 このように、図3に示すように、比較表100には、発明の構成単位ごとの一致度のスコアが表示画面200に出力される。ここで、一致度とは、例えば、抽出された発明の特徴量が類似する先行技術文献(先行文書情報)にどれくらい含まれているかを示す数値(%)であり、数値が高いほど構成単位が先行技術文献(先行文書情報)に開示されていることを示している。構成単位ごとの一致度は、文書情報としての先行技術文献(先行文書情報)ごとに比較されて比較表100に出力される。この出力は、出力部104が実行する。比較表100の左側から見て第1列目には、分解された発明(入力情報)の構成単位が出力される。5件の文書情報を左側から見て第2列目~第6列目は、それぞれの先行技術文献(先行文書情報)に対する一致度のスコアが構成単位ごとに出力される。
 そして、算出部103により算出された一致度のスコアに基づいて、出力部104は、入力情報と文書情報の一致度をスコアとして出力をすることができる。スコア結果は、例えば、比較表100とともに出力部104によって表示画面200に出力される。一致度のスコアは、例えば、~~%(例えば、80%)といった形式で表現することができる。算出部103による一致度の算出は、利用者が検索ボタン109(図3参照)を押すことによって、算出部103に検索信号が入力されることによって実行される。
 また、出力部104は、新たな類似情報に基づいて、第1キャラクター3の態様を選択することができ、具体的には、新たな類似情報と構成要件のスコアの高低によって第1キャラクターのどの喜怒哀楽の出力態様にするかを選択するように構成してもよい。
 以上のように、出力部104は、算出部103により算出された一致度のスコア結果に基づいて、第1キャラクター3の態様を出力制御することができる。算出部103により算出された知的財産に関するデータに基づいて、第1キャラクター3の態様を出力制御することにより、文書情報評価装置1は、第1キャラクター3を使用した知的財産に関する情報の表現が可能となり、知的財産法の知識に乏しいユーザ利用者であっても、わかりやすく知的財産に関する情報を理解させることができる。
 そして、出力部104は、新たに出力した類似情報に基づいて、第1キャラクター3の態様を選択することができる。新たな類似情報に基づいて、第1キャラクター3の態様を新たに選択可能とすることで、文書情報評価装置1は、知的財産に関する情報を利用者によりわかりやすく表現することができ、知的財産法の知識に乏しい利用者であっても、わかりやすく知的財産に関する情報を理解させることができる。
 そして、出力部104は、具体的には、第1キャラクター3を介して、算出部103による一致度のスコア結果を示すことができる。第1キャラクター3を介して、算出部103によるスコア結果を示すことで、文書情報評価装置1は、スコア結果を利用者によりわかりやすく表現することができ、知的財産法の知識に乏しい利用者であっても、わかりやすく知的財産の登録の有無に関する情報を理解させることができる。
 さらに、算出部103は、利用者により選択された自己評価モードの切り替えを反映し、入力された発明情報に対する類似先行技術文献(先行文書情報)の一致度を再算出することができる。具体的には、出力部104が出力した、入力情報に類似する先行技術文献(先行文書情報)との差異の程度を対比(比較)した比較表において、「いいね!」機能115aと「ダメだね!」機能115bが出力表示された構成単位の重みづけを行い、一致度を再算出することができる。
 次に、図4を用いて、文書情報評価装置1の動作処理の一例を説明する。図4は、本発明の一実施形態に係る文書情報評価装置1の動作例を示すフローチャートである。
<文書情報評価装置1の動作処理の一例>
 図4において、文書情報評価装置1は、利用者端末2からの知的財産に関する情報を取得したか否かを判断する(S11)。知的財産に関する情報を取得したか否かは、情報取得部101が利用者端末2から入力された知的財産に関する情報を取得したか否かで判断することができる。知的財産に関する情報を取得していないと判断した場合(ステップS11:NO)、文書情報評価装置1は、S11の処理を繰り返し、知的財産に関する情報の取得を待機する。
 一方、知的財産に関する情報を取得したと判断した場合(S11:YES)、算出部103は、記憶部102において記憶された文書情報に基づき、利用者端末2から入力された入力情報に対する一致度を算出する(S12)。具体的には、入力情報を所定の構成単位に分解し、該分解された構成単位ごとに、記憶部102に記憶された複数の文書情報のうちの一の文書情報との一致度をスコアとして算出することができる。構成単位の分解は、例えば、「発明者、創作者、または出願人として関係する知的財産に関する情報」の構成要件を句読点ごとに分節をする。または、一定の文章の長さや、述語ごとに分節をしてもよい。
 S12の処理を実行した後、スコアの算出結果に基づき、出力部104は、入力情報と文書情報との差異の程度を構成単位ごとに示した比較表を出力する(S13)。例えば、文書情報の評価結果は、構成単位ごとに、入力情報に類似する文書情報(以下、「類似情報」という)との差異の程度を対比(比較)した比較表である。ただし、文書情報の評価結果は、比較表100に限定されない。例えば、模擬拒絶理由通知書(拒絶理由通知書に似せた、模擬的な通知書)であったり、発明者または出願人として関係する知的財産に関する情報等も含まれる。特許の場合、発明者または出願人として関係する知的財産に関する情報は、発明情報が記載されている発明メモや請求項情報である。類似情報は、例えば先行技術文献(先行文書情報)であって、比較表100は、技術的な差異を示したいわゆるクレームチャートである。一致度のスコアは、例えば、「0%」~「100%」の数値として算出することができる。
 S13の処理を実行した後、入力部105は、比較表に対して、利用者による文書情報の自己評価を入力する(S14)。入力部105には、利用者の自己評価を示す自己評価モードが入力される。比較表100に対して、利用者が、類似情報としての文書情報の自己評価を示す自己評価モード切り替えスイッチ115を押すことにより、自己評価指令信号が入力部105に入力される。出力部104は、比較表100に対し、利用者による文書情報の自己評価を示す自己評価モード切り替えスイッチ115を表示出力する。この自己評価モード切り替えスイッチ115に対してマウスによるクリックやキーボードの操作を行うことにより、自己評価指令信号が入力部105に入力される。自己評価モード切り替えスイッチ115をクリックすることにより利用者は自己評価を示す自己評価モードの選択ができる。また、利用者による選択に基づいて、出力部104は、比較表100に対し自己評価を出力することができる。より詳細には、出力部104は、自己評価モード切り替えスイッチ115を比較表100に対して表示出力し、利用者がこの自己評価モード切り替えスイッチ115を選択する操作、すなわちマウスによるクリックやキーボードによる操作を行う。そして、出力部104は、自己評価モード切り替えスイッチ115の選択操作に基づき、例えば、模式的に図案化した図形(画像)を自己評価モードとして表示出力することができる。このように、利用者は、自己評価モード切り替えスイッチ115を操作し自己評価モードの選択を行うことにより、利用者からの自己評価の選択指示が行われ、自己評価指令信号を入力部105が受け付ける。自己評価の選択指示を受け付けは、出力部104が行う。
 利用者は、マウスにより、自己評価モード切り替えスイッチ115をクリックすることによって、自己の評価を示す自己評価モードを選択することができる。そして、入力部105からの自己評価指令信号に基づき、出力部104は、自己評価の結果に応じて、文書情報が良好であることを示す高評価モードと良好でないことを示す低評価モードに切り替えて出力することができる。なお、切り替えて出力することができればよく、自己評価モード切り替えスイッチ115は、例えば、ボタン、アイコン等であってもよい。S14の処理を実行した後、文書情報評価装置1は、図示する動作を終了する。
 ここで、一致度のスコア算出は、例えば、以下の処理で行うことができる。
 図5は、本発明の第1の実施形態における、文書情報評価装置1のスコア算出処理の一例を示すフローチャートである。
<一致度のスコア算出処理>
 算出部103は、情報取得部101が評価対象を表す入力情報を取得すると、まずkNNグラフを作成する(S101)。kNNグラフは、以下の手順で作成される。まず、情報取得部101が利用者端末2を介して取得した知的財産に関する技術情報に付随する技術情報、先行技術情報としての入力情報、記憶部102に記憶された入力情報に類似する類似技術情報に含まれる文章を全てベクトル化する。ベクトル化は、Word2Vec、Doc2Vec(Paragraph2vec)、LDA(Latent Dirichlet Allocation)またはNTSG(Neural ensor Skip Gram)等の従来技術によって行われてよい。ベクトル化は算出部103が実行する。ベクトルから文章間の距離行列を作成する。各文章を頂点として、それぞれの文字データからそれと距離が短いものk個の文章へと辺を張る。以上の手順により、kNNグラフを作成する。上記にて文章として説明したが、複数の文節の組み合わせ、文節、または単語であってもよい。
 続いて、算出部103は、情報取得部101から取得された技術情報としての入力情報に対する出力対象としての類似文書情報を、記憶部102に記憶された入力情報に類似する類似技術情報、および知的財産情報に含まれる文章全てに設定し(S102)、情報取得部101から取得した入力情報(技術情報)に含まれる技術文言をクエリと設定し、出力部104は、該クリエで該出力対象としての類似文書情報を出力する(S103)。ここで、出力はElastic Search(登録商標)等の従来技術によって行われてよい。
 出力部104は、出力の結果、最もスコアが高い文章を始点として設定し(S104)、始点を最終出力結果へ追加し(S105)、最終出力結果がn件以上となるまで繰り返す(S106)。n件に満たない場合S107に進み、n件以上となった場合S110へ進む。
 最終出力結果がn件に満たない場合、算出部103は、クエリ変換ルールの候補を抽出する(S107)。クエリ変換ルールの候補は、以下の手順で抽出される。まず、作成したkNNグラフに基づき、始点として設定された文章と類似する文章を抽出する。続いて、始点として設定された文章と抽出された類似する文章とにおいて、重要度が高いと認定される単語を抽出する。重要度の認定は、TF-IDF法等の従来技術によって行われてよい。抽出された単語に対し、始点として設定された文章、および、抽出された類似する文章において、隣接する単語を取得する。例えば、抽出された単語が「分散」であって、文章が「分散ファイルシステムにおける分散処理」であった場合の、「ファイル」および「処理」などである。
 算出部103は、スコアが高い変換ルールをクエリに適用する(S108)。変換ルールは1つでも複数であってもよく、その数が算出部103によって制御されてもよい。また、変換ルールにより算出される新たなクリエの数は、情報取得部101によって取得した、評価対象を表す技術情報(入力情報)の評価の結果に対する利用者の評価情報に基づき、算出部103によって制御されてもよい。スコアは以下の式によって算出することができる。
Figure JPOXMLDOC01-appb-M000001
 式中、始点として設定された文章をA、始点として設定された文章において取得された隣接する単語をw1、抽出された類似する文章をB、抽出された類似する文章において取得された隣接する単語をw2とおき、P(w,X)を文章X中での単語wの出現確率とおく。similarityは、単語の意味的な近さの指標であって、この値が大きいほど2つの単語は意味的に似ていることを意味する。similarityは、PythonのパッケージであるnltkがWordNetのパス長に基づいて算出する値とすることができる。
 算出部103は、始点と隣接する文章を次の出力対象に設定し(S109)、S108によって新たに算出されたクエリを用いて、再度出力を行う(S103に戻る)。
 最終出力結果がn件以上となった場合、結果を出力する(S110)。このとき、出力部104は、最終出力結果とされる始点となる文章を含む文書情報または文書情報を出力してもよい。
 次に、文書情報評価装置1の再算出処理の一例を説明する
<再算出の算出処理>
 一致度のスコアの再算出は、例えば、以下の手順で行う。(1)まず、適合文書情報および非適合文書情報のベクトル化を行う(以下、それぞれ「適合文書ベクトル」および「非適合文書ベクトル」という)。算出部103は、適合文書ベクトルおよび非適合文書ベクトルを算出する。文書ベクトルの算出は、例えば、Word2Ves、Doc2Vec(Paragraph2vec)、LDA、NTSG等で行ってもよい。ここで、適合文書ベクトルとは、「いいね!」機能115aが出力された構成単位の文書情報をベクトル化したものをいう。また、非適合文書ベクトルとは、「ダメだね!」機能115bが出力された構成単位の文書情報をベクトル化したものをいう。
 (2)次いで、算出部103は、利用者が操作可能な利用者端末2から入力された入力情報の文書ベクトル(以下、「入力文書ベクトル」という)を算出する。文書ベクトルの算出は、例えば、Word2Ves、Doc2Vec(Paragraph2vec)、LDA、NTSG等で行ってもよい。
 (3)次いで、算出部103は、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの各重みを考慮した重心を算出する。本実施形態において、文書情報評価装置1は、一致度のスコアの再算出が可能に構成されている。ここで、該重心とは、検索を行う前の、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの各重みのことをいう。具体的には、2回目の一致度のスコアの再算出を行う場合は、該2回目の一致度のスコア算出する前の,1回目の一致度のスコア算出の際に算出された重みを考慮して、重心を算出する。1回目の一致度のスコア算出の場合には、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルについて重みに差はないため、例えば、(入力文書ベクトルの重み、適合文書ベクトルの重み、非適合文書ベクトルの重み)=(1、1、1)として、重心が算出される。
 (4)重みおよび重心の算出は、算出部103が実行する。一致度のスコアの再算出を行う都度、入力文書ベクトル、合文書ベクトルおよび非適合文書ベクトルの各重みを再計算し直し、重心の再算出が実行され、これに伴い、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの修正処理が行われる。この修正処理は、算出部103が実行する。具体的には、算出部103にて修正処理を実行した入力文書ベクトル、適合文書ベクトル、および(3)にて算出した重心の重心ベクトルの内積を算出する。
 (5)算出部103は、(4)にて算出した内積に基づき、再度、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの重みの修正処理(再算出)を実行する。文書ベクトルの修正処理に基づく重みの調整は、例えば、SCDV(Sparse Composite Document Vectors using Soft clustering over distributional reprensentations)で行うことができる。なお、文書ベクトルの算出は、Word2Ves、Doc2Vec(Paragraph2vec)、LDA、NTSG等で行ってもよい。
 (6)次いで、(4)、(5)にて新たに算出した入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの各重みに基づき、算出部103は、入力情報に対する文書情報の一致度のスコアの再算出を実行する。
 (7)一致度ぐあいの再算出は、例えば、出力部104は、所望の文書情報を出力するまで、何回でも一致度のスコアの再算出処理を実行でき、都度、出力結果としての比較表100を表示することができるユーザインタフェースを備える。
 (8)利用者が入力情報を入力し、検索ボタン109を押すと、検索結果として比較表100が出力される。比較表には、一致度のスコア結果が、構成単位ごとに出力される。一致度の再算出の出力は、再算出の都度、検索ボタン109を押すことにより実行される。ユーザインタフェースは、検索ボタン109が短時間に連続押しをすることができるように生成してもよい。
 この再算出は、利用者が所望する文献情報が出力するまで、何回でも繰り返すことができる。一致度の再算出は、利用者が検索ボタン109(図3参照)を押すことによって、算出部103に検索信号が入力されることによって実行される。これにより、検索の精度を向上させることが可能であって、利用者は、条件に近い内容の文書情報(類似文書情報)を検索するために必要な時間を低減し、検索の効率化を実現させることができる。
<重心の算出方法>
 続いて、重心の算出方法について詳細に説明する。重心は、適合文書情報から近く、非適合文書情報から離れた位置に設定する。(1)まず、適合文書ベクトルに重みを掛ける。適合文書ベクトルが複数ある場合は、それぞれの適合文書ベクトルに対し、該適合文書ベクトルに応じた各重みを掛けて重心を算出する。重心は、適合文書情報から近く、非適合文書情報から離れた位置に設定されるように重みの算出(調整)が行われ、該重みを考慮して重心の算出が行われる。この重みおよび重心の算出は、算出部103が実行する。
(2)重みの調整は、(1)にて算出した重心の重心ベクトル、および適合文書ベクトル、非適合文書ベクトルに基づいて決定されたパラメータにより算出することができる。パラメータは、下記の式に基づいて算出される。パラメータの算出は、算出部103が実行する。
パラメータ=(非適合文書ベクトルと重心ベクトル間の距離)/(適合文書ベクトルと重心ベクトル間の距離)
 (3)(2)にて算出したパラメータを用いて、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの重みの調整を行い、調整した重みに基づいて、各々のベクトルについて、新たなベクトルを算出する。この新たなベクトルの算出は、算出部103が実行する。 
 ここで、重みの調整は、例えば、SCDV(Sparse Composite Document Vectors using Soft clustering over distributional reprensentations)で行うことができる。なお、文書ベクトルの算出は、Word2Ves、Doc2Vec(Paragraph2vec)、LDA、NTSG等で行ってもよい。
 次に、文書情報評価装置1の文書情報の再算出の方法の別の実施形態について説明する。
 図4に示すように、比較表100に出力された複数の文書情報のうち、利用者が入力情報に最も類似すると判断する所望の少なくとも一の文書情報をメイン文書情報として固定することができる。メイン文書情報の固定は、文書情報固定部(図示せず)が実行する。
 より詳細には、出力部104は、メイン文書情報の固定を示すメイン文書情報固定スイッチ106の図形(画像)を比較表100に対して出力し、利用者がこのスイッチを選択する操作、すなわちマウスによるクリックやキーボードによる操作を行う。そして、文書情報固定部(図示せず)に、メイン文書情報固定指令信号が入力される。利用者は、メイン文書情報固定スイッチ106を操作することによりメイン情報固定モードの選択を行い、メイン文書情報固定指令信号に基づき、利用者からの複数の文書情報の固定指示を受け付けるように構成する。
 利用者は、マウスにより、メイン文書情報固定スイッチ106をクリックすることによって、メイン情報固定モードを選択することができる。なお、メイン情報固定モードを選択することができればよく、メイン文書情報固定スイッチ106は、例えば、ボタン、アイコン等であってもよい。
 なお、メイン情報固定モードの選択は、利用者が自由に選択可能であり、出力部104が、比較表100に出力した複数の類似文書情報のうち、何れの文書情報をメイン文書情報として選択してもよい。また、メイン文書情報の選択は1件に限らず2件以上の文書情報をメイン文書情報として選択してもよい。
 さらに、利用者がメイン文書情報を指定することも可能である。図4に示すように入力ボックス107に利用者が文書情報を入力することにより、メイン文書情報を固定することもできる。この場合に入力できる文書情報も1件に限定されない。利用者は、2件以上の文書情報を入力することが可能である。そして、利用者がメイン文書情報を入力ボックス107に入力し特定スイッチ108を押すことにより、一致度の再算出を実行する。ここで、入力ボックス107に入力する文書情報は、例えば、拒絶理由通知書、模擬拒絶理由通知書(拒絶理由通知書に似せた、模擬的な通知書)であったり、発明者または出願人として関係する知的財産に関する情報等も含まれる。特許の場合、発明者または出願人として関係する知的財産に関する情報は、発明情報が記載されている発明メモや請求項情報である。類似情報は、例えば先行技術文献(先行文書情報)が含まれる。なお、入力ボックス107に入力する文書情報は、先行する特許文献番号に限定されない。入力ボックス107に入力する文書情報は、文章データ、数値データを含む。文章データは、例えば、知的財産に関する情報、アイデアシート、アイデアメモ、訴訟に関連する情報、論文、書籍(雑誌、週刊誌を含む)、レポート及びホームページを含む。数値データは、例えば、実験データ、測定データ、統計データ、検査データが含まれる。その他、入力ボックス107に入力する文書情報は、数式データ、図表データ、写真データ及び画像データ(静止画像、動画像を含む)を含む。その場合は、入力ボックス107に、例えば、PDF電子データをドロップアンドドロップすることにより、該PDF電子データを取り込むことができる。なお、先行する特許文献のPDF電子データをドロップアンドドロップすることにより取り込むことができる。
 ここで、出力部104は、入力情報を分解した複数の構成単位のうち、少なくとも一以上の構成単位を指定して、この指定した構成単位が含まれる複数の文書情報を出力(抽出)することができる。構成単位の指定は、自己評価モード切り替えスイッチ115において、「いいね!」機能115aに切り替えることによって行うことができる。そして、特定の構成単位が含まれる複数の類似する先行技術文献(先行文書情報)について一致度をスコア算出し、比較表100に該文書情報を表示出力する。これにより、入力情報に、より類似する先行技術文献(先行文書情報)を出力することができる。特定の構成単位が含まれる複数の文書情報の算出は、上述した再算出の算出処理と同様の方法により行われる。そして、出力部104が出力した該文書情報のうち、特定の文書情報をメイン文書情報として、利用者がメイン文書情報固定スイッチ106を押すことにより固定することができる。
 再算出は、メイン文書情報に基づき、入力文書情報の重みを調整することにより行う。再算出の方法は、上述した自己評価モードに基づく再算出の方法と同様の方法により行われる。
 メイン文書情報としては、例えば、各国の特許庁において過去に審査された結果引用された引用情報、参考情報の他、利用者自身が過去に調査した特許文献、書籍、雑誌等の非特許文献であってもよい。
 なお、本実施形態に係る文書情報評価装置1は、権利取得の可能性を判定する判定部402を備えていてもよい。判定部402は、認定した発明と類似する類似先行技術文献(先行文書情報)を検索し、類似した発明の有無によって、例えば、権利取得の可能性を判定する処理を実行できる。発明が類似するか否かの判断は、例えば、認定された発明の意味(含意)を認識し、含意が類似した引用発明が検索できたか否かで判断することができる。ここで、引用発明は、公開されている特許文献または非特許文献である。特許文献は、例えば、各国特許庁により公開されている特許公報等の文献を利用することができる。また、非特許文献は、学術雑誌、新聞、またはWebサイト等に掲載された文献を利用することができる。特許文献または非特許文献は、例えば、図示しない専用のデータベースに保存しておき、判定部402から検索可能にしていてもよいし、記憶部102に保存しておいてもよい。発明の意味の類似は、例えば、認定された発明に含まれる単語の中からキーワードを抽出し、同義語、類義語または派生語(同義語等)を記憶した図示しないデータベースからキーワードに対する同義語等を検索した上で、同義語等によって構成される文章の意味内容が類似しているか否かで判断することができる。判定部402は、文章の類似の度合いを類似度として算出してもよい。判定部402は、算出した文章の類似度が小さい場合、権利取得の可能性が高いと判定してもよい。一方、判定部402は、算出した文章の類似度が大きい場合、権利取得の可能性が低いと判定してもよい。判定部402は、権利取得の可能性の高低に応じて、例えば、「Sランク(可能性が極めて高い)」、「Aランク(可能性が高い)」、「Bランク(可能性あり)」、および「Cランク(可能性が低い)」等、ランクによる判定をしてもよい。また、判定は、SランクからCランクの表示に限定されない。判定は、例えば、可能性が高い順に◎から×の表示であってもよい。
 判定部402は、各国の特許庁において過去に審査された権利取得の審査結果に基づき、権利取得の可能性を判定することができる。権利取得の審査結果とは、出願に係る発明、引用された引用文献、およびその両者の対比における審査結果(引用文献に基づき拒絶されたか否か)である。判定部402は、出願に係る発明と引用された引用文献の文章の類似度を算出し、算出した類似度と審査結果との対比を学習して、権利取得の可能を判定してもよい。判定部402は、算出した類似度と過去の審査結果との対比を学習することにより、過去の特許庁における判断を判定基準とすることができるので、権利取得の可能性についての判定精度を向上させることができる。記憶部102に、予め、審査結果が格納されるように構成してもよい。審査結果は、例えば、各国の特許庁が公開している審査情報から取得することができる。判定部402は、審査結果に基づき、権利取得の可能を判定してもよい。
 出力部104は、算出部103により算出された知的財産に関するデータ、または、類似情報に基づいて、利用者端末2に出力される情報を制御する。具体的には、出力部104は、算出部103により算出された権利取得可能性の情報に基づいて、第1キャラクター3の態様を出力制御することができる。例えば、出力部104は、上述した権利取得可能性の情報が拒絶すべきと判定部402が判定した場合、記憶部102に記憶されたキャラクター情報のうち、哀のキャラクターを選択し、表示画面200に表示するように出力部104に出力指示をだす。また、出力部104は、上述した権利取得可能性の情報が拒絶すべきと判定部402が判定した場合、上記スコアまたは権利取得可能性の情報に基づいて、記憶部102に記憶されたキャラクター情報のうち、哀のキャラクターを選択し、表示するように出力部104に出力指示をだしてもよい。
 また、出力部104は、算出部103により算出されたキーワードを、第1キャラクター3を介して出力してもよい。算出部103が、記憶部102に記憶された知的財産に関する情報からキーワードを抽出する。具体的には、判定部402が、権利取得可能性の情報が拒絶すべきと判定した際、どのような新たなキーワードを付加すれば、権利取得可能性の情報が拒絶すべきではないと判定するかというロジックで、新たなキーワードを算出する。算出部103は、新たなキーワードを無数に列挙してもよいが、煩雑となるため、算出に際しては、同一または類似技術の公報のクレーム記載のキーワードを算出してもよい。
 また、判定部402は、過去の審査結果を機械学習し、権利取得の可能性を判定してもよい。例えば、審査結果は情報取得部101が取得する。例えば、判定部402は、出願に係る発明と引用された引用文献を入力、審査結果を出力とした、入力と出力をデータセットとする機械学習(教師あり学習)を行い、学習したデータセットをモデリングすることにより、権利取得の可能性を判定することができる。データセットは、例えば、国、適用法(法改正を含む)、発明の分野等によってそれぞれ異なるモデルとしてモデリングすることができる。判定部402は、それぞれのモデリングにおいて学習された学習結果を用いることにより、権利取得の可能性についての判定精度を向上させることができる。また、判定部402は、情報取得部101において取得された新たな審査結果を機械学習していくことにより、特許庁における審査の傾向に変化があった場合においても、その傾向の変化に対応して権利取得の可能性についての判定することができる。なお、機械学習としては、教師ありの学習技法を用いても教師なしの学習技法を用いてもよい。機械学習の学習技法としては、例えば、ニューラルネットワーク(ディープラーニングを含む)、サポートベクターマシン、クラスタリング(例えば、課題、第1実施形態等)、またはベイジアンネットワーク等を用いてもよい。
 続いて、図6~図9を参照して、本実施形態の第1変形例について説明する。図6は、本発明の一実施形態の第1変形例に係る文書情報評価装置1のソフトウェア構成の一例を示すブロック図である。また、図7は、本発明の一実施形態の第1変形例に係る検索の画面の例を示す模式図である。また、図8は、本発明の一実施形態の第1変形例に係る類義語辞書テーブルの一例を示す図である。なお、図1~図5を参照して説明した実施形態と同様の構成については、図の説明が冗長となることを避けるため、図の記載と説明とを省略する。
 図6に示すように、文書情報評価装置1は、文書情報入力部301と、検索キーワード入力部302と、記憶部102と、算出部103と、類義語展開選択部303と、出力部104の各機能部を有する。本実施形態における文書情報評価装置1の上記各機能部は、文書情報評価装置1を制御する情報処理プログラム(ソフトウェア)によって実現される機能モジュールであるものとして説明する。文書情報評価プログラムは、文書情報評価装置1で動作する。すなわち、文書情報評価装置1は、文書情報評価プログラムが動作する装置をいう。第1変形例では、一例として、入力情報および文書情報が知的財産に関する情報である場合について説明する。
 文書情報入力部301は、利用者端末2を介して入力ボックス301aから入力された知的財産に関する情報(入力情報)を、利用者端末を介して受け付ける。文書情報入力部301には、例えば、利用者が創作した発明の内容が受け付けられる。文書情報評価装置1によって、入力ボックス301aが生成される。
 また、検索キーワード入力部302は、利用者端末2を介して入力ボックス302aから入力されたこれら知的財産に関する情報を、利用者端末2から検索キーワードの入力を受け付ける。検索キーワードとは、利用者が入力する知的財産に関する情報と関連性のあるキーワードのことをいう。検索キーワードは、知的財産に関連する先行技術文献(類似する先行文書情報を含む)の抽出精度を向上させることを目的として、利用者が利用者端末2を介して入力する。検索キーワード入力部302には、例えば、入力ボックス302aから入力された知的財産に関する情報の技術的特徴に関連するキーワードなどが受け付けられる。文書情報評価装置1によって、入力ボックス302aが生成される。
利用者端末2は、利用者が操作可能な端末装置であって、例えば、デスクトップPC、ノートPC、タブレットPCまたはスマートフォン等である。
 類義語展開選択部303は、検索キーワード入力部302に入力された検索キーワードの類義語展開の範囲を選択可能とする機能を有する。図7に示す通り、類義語展開選択部303は、「なし」、「標準」、「広い」の3段階の選択が可能である。「なし」とは、類義語の展開をしないで検索を行い一致度のスコアを算出する状態、「標準」とは、予め記憶部102に記憶されている第1類義語情報αのうち、例えば50%の第1類義語情報αを展開して検索を行い一致度のスコアを算出する状態、「広い」とは、予め記憶部102に記憶されている第1類義語情報αのうち、例えば100%の第1類義語情報αを展開して検索を行い一致度のスコアを算出する状態を、それぞれ示す。なお、「なし」「標準」、「広い」の3段階は例示であって、予め記憶部102に記憶されている第1類義語情報αのうちどの程度を展開し一致度のスコアを算出するかは適宜調整できるものとする。図7において、検索キーワード入力部302は、「あいまい」を選択した場合に検索キーワードの類義語展開を行い検索または分析の処理を実行する。また、検索キーワード入力部302は、「含む」を選択した場合に検索キーワードが含まれるように検索または分析の処理を実行する。そして、検索キーワード入力部302は、「含まない」を選択した場合に検索キーワードが含まれないように検索または分析の処理を実行する。
 また、出力部104は、上記の通り、類義語展開選択部303に基づき「標準」または「広い」を選択した場合における、類義語展開された第1類義語情報αの内容を利用者端末2に表示出力する機能をさらに有する。表示出力は、検索キーワードごとに第1類義語情報αがテーブル形式で記憶される(図8参照)。
 図7に示すように、文書情報評価装置1には、複数の類義語展開の選択を可能とする情報バー303a(第1情報バ―)が、出力部104によって、利用者端末2の検索を行う際の表示画面201に表示出力される。情報バー303aには、「なし」、「標準」、「広い」の選択スイッチ303bが設けられており、選択スイッチ303bを操作し類義語展開の選択を行うことにより、利用者からの類義語展開の選択指示が行われ、類義語展開指令信号に基づく類義語展開の入力を類義語展開選択部303が受け付ける。類義語展開選択部303にて入力の受け付けが行われると、選択スイッチ303bの選択に応じた類義語が展開され、当該類義語展開の条件で検索を実行することが可能となる。
 類義語展開選択部303に基づき類義語展開を例えば、「標準」と選択すると、検索キーワードの第1類義語情報αが利用者端末2の検索を行う際の表示画面201に表示出力される。そして、選択を「標準」から「広い」に変更した場合、「広い」に変更したことに伴い、「標準」から新たに追加される第1類義語情報αが利用者端末2の検索を行う際の表示画面201に表示出力される。このように、出力部104は、選択の変更に応じて、第1類義語情報αの遷移状態を確認できるように第1類義語情報αを出力してもよい(図8の矢印部参照)。本第1変形例では、「なし」「標準」、「広い」の3段階を例示して説明したが、これに限定されない。類義語展開の選択を4段階以上とすることも可能である。文書情報評価装置1によれば、選択位置に基づく第1類義語情報αの遷移状態を一目で確認することができる。
 第1類義語情報αは、利用者が、適宜追加または削除することが可能である。記憶部102は、利用者が保持する独自の「複数の検索キーワードごとの複数の第2類義語情報βを記憶することができる。そして、図7に示すように、記憶部102には、検索キーワードごとに追加したい第2類義語情報βと、削除したい第2類義語情報βがテーブル形式で記憶されてもよい(図8参照)。追加したい第2類義語情報βとしての”add”情報(コマンド情報)と、削除したい第2類義語情報βとしての”del”情報(コマンド情報)を利用者が予め保持している。例えば、検索キーワードを「今日」とした場合、”add”情報を「一昨日」とし、”del”情報を「今日は」とする利用者独自の第2類義語辞書Yを保持していてもよい。また、記憶部102は、検索キーワードを「天気」とした場合、”add”情報を「雪」とし、”del”情報を「元気」とする利用者独自の第2類義語辞書Yを記憶していてもよい。
 なお、利用者は利用者端末2を介して表示出力された第1類義語情報αから直接削除したい第1類義語情報αを選択して削除することができる。なお、利用者は利用者端末2を介して表示出力された第1類義語情報αに対して追加したい第1類義語情報αを直接入力することができる。利用者端末2を介して第1類義語情報αが表示出力された場合、テキストボックス(図示せず)が表示出力されており、当該テキストボックスに追加したい第1類義語情報αを直接入力してもよい。このように、第1類義語情報αから直接追加または削除を実行した場合、追加または削除した内容が、”add”情報または”del”情報として、第2類義語辞書Yに反映されてもよい。
 第2類義語情報βを有する第2類義語辞書Yは、CSV形式のファイルを、利用者端末2の検索を行う際の表示画面201に表示出力することにより実行してもよいし、CSV形式のファイルを、クラウド上で保持し管理していてもよい。
 具体的には、記憶部102は、利用者独自の複数の検索キーワードごとの複数の第2類義語情報βを有する第2類義語辞書Yを、前記複数の第1類義語情報αを有する第1類義語辞書Xの検索キーワードと対応付けて記憶している。第1類義語辞書Xには、例えばWordNetが用いられる。
 出力部104にて表示出力された検索キーワードの第1類義語情報αからある検索キーワードを追加または削除したい場合、当該検索キーワードごとの第1類義語情報αと、検索キーワードごとの追加または削除したい第2類義語情報βはそれぞれ対応付けられている。
 出力部104は、利用者独自の複数の検索キーワードごとの複数の第2類義語情報βを有する第2類義語辞書Yを、利用者端末2の検索を行う際の表示画面201に表示出力する機能を有する。出力部104は、さらに、検索キーワードごとに追加または削除したい第2類義語情報βがテーブル形式で表示出力することが可能であり(図8参照)、追加・削除ボタン(図示せず)を選択することにより、検索キーワードの第1類義語情報αから選択した第2類義語情報βを追加または削除できるように構成されていてもよい。また、”add”情報および”del”情報がコマンド情報として検索キーワードごとに対応付けられており、コマンド情報が”add”情報の場合は当該検索キーワードごとに対応する第2類義語情報βは自動で追加され、コマンド情報が”del”情報の場合は当該検索キーワードごとに対応する第2類義語情報βは自動で削除されるように構成してもよい。
 このように、追加または削除された第1類義語情報αを利用者独自の類義語辞書として、記憶部102に記憶することができる。
 本第1変形例によれば、検索または分析の精度を向上させることが可能であって、利用者の経験によらず一定水準の検索または分析をすることが可能となる。また、従来の文書情報評価装置では確認できなかった類義語情報を容易に確認することができ、検索または分析の範囲を明確にすることが可能にするため、文書情報評価装置の不透明性をなくし検索または分析の信頼性を向上させることができる。
 また、本第1変形例によれば、文書情報評価装置1は、文書情報の評価を行うに際して、知的財産に関連する先行文書情報(類似する先行文書情報を含む)のどの部分に記載されている文章と、利用者が利用者端末2を介して入力する知的財産に関連する文書情報を比較するか否かを選択可能とする検索文章範囲選択部304を、さらに備えてもよい。
 図7に示すように、文書情報評価装置1は、複数の検索文章範囲の選択を可能とする情報バー304a(第2情報バー)を生成し、出力部104によって、利用者端末2の検索を行う際の表示画面201に表示出力される。情報バー304aには、「請求項」、「請求項・要約」、「全文」の選択スイッチ304bが設けられており、選択スイッチ304bを操作し検索文章範囲の選択を行うことにより、利用者からの検索文章範囲の選択指示が行われ、検索文章範囲選択指令信号に基づく検索文章範囲の選択を検索文章範囲選択部304が受け付ける。検索文章範囲選択部304にて入力の受け付けが行われると、選択スイッチ304bの選択に応じた検索文章範囲が選択され、当該検索文章範囲の選択の条件で検索を実行することが可能となる。
 図7に示す通り、検索文章範囲選択部304は、「請求項」、「請求項・要約」、「全文」の3段階の入力の受け付けが可能である。「請求項・要約」とは、知的財産に関連する先行文書情報(類似する先行文書情報を含む)の請求項に記載されている箇所を検索または分析の範囲とする。「請求項」とは、知的財産に関連する先行文書情報の請求項に記載されている箇所を検索または分析の範囲とする。「請求項」は全請求項を対象としてもよいし、特定の一部の請求項のみを検索または分析の範囲の対象としてもよい。検索文章範囲選択部304は、検索または分析の範囲を、全請求項とするか特定の請求項にするか選択可能な構成としてもよい。「全文」とは、願書、明細書、請求項、要約書を含む。なお、「全文」には、図面を含めてもよい。「全文」は、図面に記載の用語を含む構成としてもよい。
 このように評価内容(例えば、先行技術調査、無効資料調査、侵害性調査)の種類に応じて、検索または分析の範囲を適宜変更することができるため、文書情報評価装置1によれば評価精度を向上させることができる。
 また、本第1変形例によれば、文書情報評価装置1は、利用者の知的財産に関連する文書情報(入力文書情報)の技術分野に関するキーワードの入力を受け付ける技術分野入力部305と、知的財産に関連する文書情報の技術的特徴に関するキーワードの入力を受け付ける技術的特徴入力部306と、をさらに備える構成としてもよい。なお、技術分野入力部305および技術的特徴入力部306による入力の受け付けは、キーワードに限定されない。当該入力の受け付けは、複数のキーワードを組み合わせた用語であってもよいし、文節、文章などの文書情報の入力を受け付けるように構成してもよい。技術分野入力部305には、利用者端末2を介して入力ボックス305aから入力された知的財産に関する情報の技術分野が受け付けられる。また、技術的特徴入力部306には、利用者端末2を介して入力ボックス306aから入力された知的財産に関する情報の技術的特徴が受け付けられる。文書情報評価装置1によって、入力ボックス305a、306aが生成される。
 また、文書情報評価装置1は、利用者の知的財産に関連する文書情報(入力文書情報)の補足情報に関する文書情報(例えば知的財産に関連する文書情報の具体的な実施形態、背景技術等)の入力を受け付ける補足情報入力部307を追加してもよい。なお、補足情報入力部307による入力の受付けは、文節、文章などの文書情報に限定されずキーワードであってもよい。補足情報入力部307には、利用者端末2を介して入力ボックス307aから入力された知的財産に関する情報の補足情報が受け付けられる。文書情報評価装置1によって、入力ボックス307aが生成される。
 このように、検索キーワードに加え、技術分野関するキーワード、技術的特徴に関するキーワード、および補足情報に関する文書情報の、少なくとも一方のキーワードを入力することが可能になるため、文書情報評価装置1によれば、さらに評価精度を向上させることができる。
 さらに、文書情報評価装置1は、上述のように選択した検索文章範囲および類義語展開範囲のフィードバックを行い、当該フィードバックの結果を記憶部102に記憶するように構成してもよい。文書情報評価装置1が、当該フィードバックの結果を学習することにより、例えば、前回実施した評価の対象となる文書情報と類似の技術分野や技術的特徴を有する前回とは異なる文書情報について評価を実施する場合、改めて選択しなくても、前回評価したときに選択した検索文章範囲および類義語展開範囲を自動で設定する項に構成してもよい。または、文書情報評価装置1は、類似の技術分野や技術的特徴について多用されている検索文章範囲および類義語展開範囲を、リコメンド(推奨)するように構成してもよい。リコメンド(推奨)は、文書情報評価装置1が備える推奨部(図示せず)が実行するように構成してもよい。
 続いて、図9を用いて、一実施形態の第1変形例に係る文書情報評価装置1の動作例を説明する。図9は、一実施形態の第1変形例に係る文書情報評価装置1の動作例を示すフローチャートである。
<第1変形例に係る文書情報評価装置1の動作処理の一例>
 図8において、文書情報評価装置1は、利用者端末2からの知的財産に関する入力情報の入力を受付ける(S201)。知的財産に関する入力情報の入力の受け付けは、文書情報入力部301が実行する。次いで、文書情報評価装置1は、利用者端末2から知的財産に関する文書情報に関連する検索キーワードの入力を受け付ける(S202)。検索キーワードの入力の受け付けは、検索キーワード入力部302が実行する。
 次いで、類義語展開を選択する(S203)。類義語展開の入力の受け付けは、類義語展開選択部303が実行する。次いで、出力部104に基づき、S203にて選択した類義語展開の第1類義語情報αを表示出力する(S204)。次いで、表示出力された検索キーワードに関する第1類義語情報αが妥当か否かを判断する(S205)。S205にて、第1類義語情報αが妥当であると判断される場合(S205のYES)、算出部103は、記憶部102において記憶された先行文書情報に基づき、利用者端末2から入力された入力情報としての文書情報に対する一致度を算出して(S206)本動作処理を終了する。
 一方、S205にて、第1類義語情報αが妥当でないと判断される場合(S205のNO)、利用者が保持する独自の複数の検索キーワードごとの複数の第2類義語情報βを文書情報評価装置1に取り込み利用者端末2に表示出力を行う。表示出力は、例えば、検索キーワードごとに追加したい第2類義語情報βと、削除したい第2類義語情報βがテーブル形式で作成したCSV形式のファイルを、利用者端末2に取り込み表示出力することにより実行してもよいし、CSV形式のファイルを、クラウド上で保持し管理していてもよい。取り込まれた第2類義語情報βを有する第2類義語辞書Yは、例えば記憶部102に記憶される。そして、当該表示出力された、当該第2類義語情報βから追加または削除したい第2類義語情報βを選択する(S207)。例えば、追加・削除ボタン(図示せず)を選択することにより、検索キーワードの第1類義語情報αから選択した第2類義語情報βを追加または削除できるように構成されていてもよい。その後、S206に移行し本動作処理を終了する。
 なお、上記の第1変形例に係る文書情報評価装置1の動作処理の一例では、検索キーワードの類義語展開のバリエーションについて説明したが、これに限定されない。文書情報評価装置1は、利用者端末2を介して入力ボックス301aから入力された知的財産に関する情報(入力情報)の類義語展開についても適用可能である。また、文書情報評価装置1は、入力情報に含まれるキーワードおよび検索キーワードの両方について、類義語展開を実行することもできる。すなわち、文書情報評価装置1は、入力情報に含まれるキーワードおよび検索キーワードのうち少なくとも一方のキーワードの類義語展開について適用可能である。
 さらに、文書情報評価装置1は、入力情報に含まれる複数のキーワードおよび複数の検索キーワードの両方について、キーワードごとに、第1類義語情報の類義語展開の選択を複数設定できるように構成してもよい。この場合、出力部104は、第1類義語情報を、キーワードごとにテーブル形式で出力するように構成してもよい。
 続いて、図10~図11を参照して、本実施形態の第2変形例について説明する。図10は、本発明の一実施形態の第2変形例に係る文書情報評価装置1のソフトウェア構成の一例を示すブロック図である。また、図11は、本発明の一実施形態の第2変形例に係る検索の画面の例を示す模式図である。なお、図1~図5を参照して説明した実施形態、および図6~図9を参照して説明した第1変形例と同様の構成については、図の説明が冗長となることを避けるため、図の記載と説明とを省略する。
 図10に示すように、文書情報評価装置1は、文書情報入力部301と、記憶部102と、決定部401と、算出部103と、判定部402、出力部104、生成部403の各機能部を有する。本第2変形例における文書情報評価装置1の上記各機能部は、文書情報評価装置1を制御する情報処理プログラム(ソフトウェア)によって実現される機能モジュールであるものとして説明する。文書情報評価プログラムは、文書情報評価装置1で動作する。すなわち、文書情報評価装置1は、文書情報評価プログラムが動作する装置をいう。第2変形例では、一例として、入力情報および文書情報が知的財産に関する情報である場合について説明する。
 決定部401は、利用者端末2を介して入力ボックス301aから入力された知的財産に関する情報(入力情報)の第1技術分類を決定する。例えば、決定部401は、入力情報としての知的財産に関する情報に含まれる複数の単語の中から出現頻度の高い単語を用いて第1技術分類を決定してもよく、入力情報に含まれる複数の単語が多く含まれる先行文書情報を記憶部102から検索して、抽出された先行文書情報に対応付けられている技術分類を入力情報の第1技術分類としてもよく、単語の係り受け関係から重要な用語を用いて第1技術分類を決定してもよい。すなわち、第1技術分類は、利用者が入力した入力情報(発明内容)が属する技術分類を特定するために決定される。なお、第1技術分類は、通常1つに決定されるが、第1技術分類を1つに絞込み辛い場合などは、複数の第1技術分類を入力情報に対して決定してもよい。入力ボックス301aに入力された入力情報から第1技術分類を決定する技術は、一般的な技術を用いればよく、上記手法には限定されない。例えば、決定部401は、文章、文節、複数の文節の組み合わせに基づいて、第1技術分類を決定してもよい。
 第1技術分類は、特許庁によって特許文献に付与される技術分類であり、IPCやFIを想定する。しかしながら、ここではUPC、CPC、Fタームなどの特許分類を用いることもできる。更に、特許文献が異なる技術分野に分類されるための分類分けであれば、特許庁が用意するもの以外でもよく、例えば、図書館の書籍分類などであってもよい。
 本第2変形例に係る発明において、文書情報評価装置1が備える決定部401が、第1技術分類を決定する構成について説明したが、本発明はこれに限定されず、利用者が第1技術分類を決定してもよい。この場合、利用者が決定した第1技術分類は、利用者端末2を介して技術分類入力ボックス(図示せず)から入力される。
 生成部403は、利用者の前記入力情報に係る権利取得の可能性に応じて、権利取得の可能性を向上させた追加情報を生成する。生成部403は、判定部402において判定された権利取得の可能性に基づき、文書情報入力部301において入力を受け付けられた知的財産に関する情報(入力情報)の権利取得の可能性を向上させるための追加情報を生成する。なお、追加情報の生成はAI(Artificial Intelligence)によって行うことができる。
 生成部403は、例えば、入力情報に対して構成要件の付加または削除等をした追加情報を生成する。一般的に、入力情報の構成要件を付加する補充訂正は、権利範囲を限定することになるが、権利取得の可能性を高くすることができる。すなわち、生成部403は、入力情報の構成要件を付加することにより、権利の取得の可能性を高める追加情報を生成することができる。例えば、判定部402において権利取得の可能性が低いと判定された場合、生成部403は、入力情報の補充訂正によって権利の取得可能性が高くなる追加情報を生成する。生成部403は、例えば、機械学習において学習した、過去の審査において権利の取得の可能性を向上させた構成要件(文言または文章)を発明の構成要件に付加することにより過去の審査を踏まえて権利取得の可能性を向上させた追加情報を生成することができる。
 一方、判定部402において権利取得の可能性が高いと判定された場合、生成部403は、入力情報の補充訂正において、権利の取得可能性が低くなる情報の生成を行ってもよい。生成部403は、入力情報の補充訂正において、権利の取得可能性が低くなる情報の生成を検討してもよい。例えば、入力情報の補充訂正は、入力情報のある構成要件を削除する情報の生成を検討することができる。発明内容(入力情報)の構成要件を削除する補正は、権利取得の可能性を低くすることになるが、発明の権利範囲を広げることができる。生成部403は、発明の構成要件を削除することにより、権利範囲を広げる情報を生成することができる。生成部403は、権利の取得の可能性に影響の少ない構成要件を削除する情報を生成することにより、権利の取得の可能性を維持しつつ発明の権利範囲を広げることが可能となる。
 生成部403は、情報記録部(図示せず)に記録された情報に基づき、追加情報を生成してもよい。生成部403は、情報記録部(図示せず)に記録された技術者が過去に創作した知的財産を参照することにより技術者の知識を利用することができる。これにより、生成部403は、技術者が自ら作成する情報と類似した追加情報を技術者に代わって生成してもよい。生成部403は、他の技術者(例えば、同じ会社の技術者)によって情報記録部(図示せず)に記録された知的財産に関する情報に基づき、追加情報を生成してもよい。なお、第2変形例では、権利取得の可能性が高いと判定された場合、構成要件を削除する情報を追加情報として生成する場合について説明したが、これに限定されない。生成部403は、構成要件に含まれる単語、文節、文章などの一部を削除するように構成してもよい。この場合においても、生成部403は、上記と同様に権利の取得の可能性に影響の少ない単語、文節、文章などを削除する情報を生成することにより、権利の取得の可能性を維持しつつ発明の権利範囲を広げることが可能となる。
 また、生成部403は、創作された発明に対してシミュレーション技術を適用することにより、発明の不具合を検出して創作対象から排除するようにしてもよい。シミュレーション技術には、例えば、CAD等によりモデリングされたモデルに対する流体解析の技術、薬剤の生成をシミュレートする技術、実施に掛かるコストもしくは時間を算出する技術、または科学的な矛盾を検出する技術等を用いることができる。
 生成部403は、例えば、判定部402において機械学習された、利用者が創作した発明と同じ技術分野において特許査定を得やすい構成要件を付加する追加情報を生成する。また、生成部403は、利用者が創作した発明と同じ技術分野において利用者が過去に創作した発明の構成要件を付加する追加情報を生成してもよい。すなわち、生成部403は、利用者に代わって新たな発明を創作することもできる。判定部402は、生成部403において生成された追加情報に基づき、知的財産に係る権利取得の可能性を再判定してもよい。知的財産に係る権利取得の可能性を再判定することにより、権利取得の可能性を向上させた追加情報を生成部403において生成させることができる。
 さらに、生成部403は、複数の追加情報を生成することができる。そして、判定部402は、生成部403において生成された複数の追加情報に基づき、それぞれの権利取得の可能性を再判定してもよい。生成された複数の知的財産に係る権利取得の可能性を再判定することにより、生成された複数の追加情報の中から権利取得の可能性の高いものを選択することが可能になる。例えば、生成部401は、複数の追加情報の中から再判定の結果において権利取得の可能性が高い順に追加情報をソートして利用者に提言できるようにしてもよい。
 生成部403によって生成された追加情報は、表示部(図示せず)によって利用者端末2の画面上に表示出力することができる。例えば、利用者端末2に出力結果として比較表100が表示出力されたとき、一致度のスコアが低く権利取得可能性が否定的であると評価される場合(例えば、Cランク)、生成部403に評価結果に基づく評価信号が入力され、追加情報を生成するように構成してもよい。そして、表示部(図示せず)は、利用者端末2に出力された比較表100上に、追加情報を表示出力してもよい。また、表示部(図示せず)は、追加情報に対応する単語、文節、文章などを当該第1キャラクター3の近くに吹き出しとして表示出力してもよい。また、生成部403によって追加情報が生成された場合、制御部(図示せず)に基づき、例えば、第1キャラクター3が追加情報を発声(提言)するように構成してもよい。なお、判定部402において権利取得の可能性が高いと判定された場合、生成部403は、入力情報の補充訂正において、権利の取得可能性が低くなる情報の生成を行ってもよい。また、生成部403は、判定部402において権利の取得の可能性に影響の少ない単語、文節、文章などを削除する情報を生成してもよい。
<入力情報の補充訂正>
 入力情報の補充訂正は以下の手順にて行う。まず、出力部104は、判定部402が判定した、利用者の入力情報に係る権利取得の可能性に応じて、決定部401にて決定した第1技術分類と異なる第2技術分類を用いて先行文書情報の出力(抽出)を行う。次いで、生成部403が、当該先行文書情報および入力情報に含まれる文章の比較を行い、当該先行文書情報と入力情報との差分を構成する文書情報に基づき追加情報を生成することにより実行する。
 第2技術分類が含まれる先行文書情報のうち、入力情報に類似する先行文書情報の出力(抽出)は、一般的な手法を用いることができる。例えば、出力部104は、当該先行文書情報を構成単位ごとに分割する。具体的には、小用語解析を用いることができる。すなわち、先行文書情報を複数の単語単位に分割して、どの単語がどの単語を修飾しているかの係り受け関係を抽出する。発明文章が英文などの場合には、ピリオド、コロン、セミコロン、カンマ、や関係代名詞の優先順位で分割をするデリミタ処理を行ってもよい。そして、出力部104は、先行文書情報中に含まれる複数の単語の中から重要な用語を出力(抽出)してもよい。例えば、出力部104は、出現頻度の高い単語を出力(抽出)してもよく、単語の係り受け関係から重要な用語を出力(抽出)してもよい。なお、重要な用語は、通常1つの単語であるが、重要な用語を1つに絞込み辛い場合などは、複数の単語としてもよい。
 このように、出力部104による第2技術分類が含まれる先行文書情報の出力(抽出)は、記憶部102に含まれる先行文書情報を単にキーワード検索によって検索してもよい。
 出力部104は、出力(抽出)される文献の精度を高めるために、キーワードが含まれる先行文書情報の中から当該キーワードの重要度を考慮して先行文書情報の精度を上げてもよい。例えば、出力部104は、TF-IDF法などを用いて、キーワードが先行文書情報に含まれる文章においてどの程度の重要度があるかを評価してもよい。ここでは、キーワードが1つの特許文献全体において出現する特許文献は、重要度が低いと仮定し、1つの特許文献において特定の文章にしか出現しない場合は、重要度が高いと仮定してもよい。なお、TFIDF法などを用いた、キーワードに対する特許文献の抽出は、利用者が利用端末2に入力情報を入力し、キーワードが得られた際に行なわれてもよく、代表的なキーワードに対する特許文献を予め記憶部102内に記憶しておいてもよい。
 なお、先行技術情報の検索は、キーワード検索に限定されない。先行技術情報の検索は、文章、文節、複数の文節の組み合わせに基づいて、入力情報と先行文書情報との差異の程度(一致度)を構成単位(Element)ごとに比較してもよいし、入力情報と先行文書情報との差異の程度(一致度)を文章全体として比較してもよい。
 生成部403は、上記のように第2技術分類を用いて出力(抽出)した先行文書情報と入力情報を、当該先行文書情報および当該入力情報に含まれる文章の構成単位ごとに比較を行い、先行文書情報と入力情報との差分を構成する文書情報を生成する。差分を構成する文書情報は、構成単位ごとの文章であってもよいし、文節、または単語であってもよい。差分を構成する文章、文節、単語が複数ある場合、出力部104は、全ての文章、文節、単語を追加情報として出力することができる。なお、出力部104は、複数ある文章、文節、単語のいくつかを選定して出力するように構成してもよい。また、出力部104は、文章、文節、単語の出現頻度が高い順に、上位2位を選定してもよいし、上位1位と3位を選定して出力するように構成してもよい。このように、出力部104は、差分を構成する文章、文節、単語(追加情報)を適宜選択して出力することができる。これにより、生成部403は、第2技術分類を用いて出力した先行文書情報に存在し、入力情報に存在しない文章などを追加情報として生成することができる。第2変形例に係る発明によれば、権利取得の可能性が低い発明(入力情報)に対して何らかの構成を外的に付加した追加情報を提示することが可能になり、利用者に対し、権利取得の可能性を向上させた発明を提言することができる。
 また、出力部104は、入力情報に含まれるキーワードの第1類義語情報を出力することにより、当該キーワード以外の類義語、例えば、キーワードの中位概念、下位概念に属するキーワードを出力するように構成してもよい。そして、生成部403は、入力情報の構成単位を構成する複数の単語(キーワード、熟語など)以外の関連する単語(キーワードなど)を追加情報として生成してもよい。第2変形例に係る発明によれば、入力情報の構成単位に含まれるキーワードを異なるキーワードに訂正することにより、権利取得の可能性を向上させることができる。
 なお、出力部104に基づき、どのキーワードがどのキーワードを修飾しているかの係り受け関係を出力(抽出)した結果、どのキーワードにも修飾されていないキーワードがある場合、当該キーワードが用いられている先行文書情報を出力(抽出)してもよい。具体的には、出力部104は、先行文書情報において、当該キーワードがどのキーワードを修飾しているかの係り受け関係を出力(抽出)する。その結果、先行文書情報に用いられているキーワードを修飾しているキーワードが存在する場合には、出力部104は、当該キーワードを追加情報として、出力(抽出)してもよい。なお、修飾する情報は、キーワードに限定されず、文章、文節であってもよい。第2変形例に係る発明によれば、権利取得の可能性が低い発明(入力情報)に対して何らかの構成を内的に付加した追加情報を提示することが可能になり、利用者に対し、権利取得の可能性を向上させた発明を提言することができる。
 なお、生成部403は、例えば、判定部402において機械学習された、利用者が創作した発明と同じ技術分野において特許査定を得やすい構成要件を付加する追加情報を生成するように構成してもよい。生成部403は、利用者が創作した発明と同じ技術分野において利用者が過去に創作した発明の構成要件を付加する追加情報を生成してもよい。すなわち、生成部403は、利用者に代わって新たな発明を創作することもできる。判定部402は、生成部403において生成された追加情報に基づき、知的財産に係る権利取得の可能性を再判定することにより、生成部403において生成された追加情報を利用した権利取得の可能性を向上させることができる。
 文書情報評価装置1は、さらに第2技術分類を選択する選択部(図示せず)を備える。選択部(図示せず)は、決定部401が決定した第1技術分類と異なる第2技術分類を選択する。選択部(図示せず)は、決定部401にて決定した第1技術分類に関する先行文書情報に対応付けられた従来技術情報(従来特許文献)に付与されている技術分類を第2技術分類として選択してもよい。この場合、第2技術分類は、第1技術分類と重複しないように決められる。更に、第2技術分類は、第1技術分類に類似しない技術分類が選択されるとよい。例えば、選択部(図示せず)は、技術分類(IPC、FI等の特許分類)の先頭から所定桁数一致しているものを除外することで、類似しない技術分類を選択できるようになる。すなわち、選択部(図示せず)は、第2技術分類を特許分類上で第1技術分類から所定距離離れたところで指定することができれば、選択方法は上記に限定されることはない。更に、所定距離は、技術分類によって異なる値が定められるとよい。例えば、ITソフトウェアの技術分野は、技術分類をまたいでも基本的に組み合わせが容易であると判断されることが多いため、所定距離を大きく設定することが必要である。すなわち、所定距離は、第1技術分類の先頭からの第1所定桁数(例えば4桁)、および先頭からの第2所定桁数(例えば3桁)と設定することができる。ここで、第2所定桁数は、第1所定桁数よりも少ない必要がある。この構成によって、第2技術分類が第1技術分類に限りなく近い特許分類になることを除外し、適度に近い第2技術分類に含まれる先行文書情報を出力(抽出)することができる。
 第2技術分類は、第1技術分類との距離が適切な距離を有していればよい。距離が近すぎる場合は、特許性が否定される原因となり、距離が遠すぎると技術分野としては、異分野過ぎて無意味となってしまう可能性がある。第2技術分類を選択する手法は、上述の通り、さまざまな手法が採用できる。例えば、選択部(図示せず)は、決定部401にて決定された第1技術分類の先頭からの第1所定桁数(例えば4桁)一致しておらず、先頭からの第2所定桁数(例えば3桁)一致している特許分類を第2技術分類として選択してもよい。
 第2技術分類は、特許庁によって特許文献に付与される技術分類であり、FIやIPCを想定する。しかしながら、ここではCPC、UPC、Fタームなどの特許分類を用いることもできる。更に、特許文献が異なる技術分野に分類されるための分類分けであれば、特許庁が用意するもの以外でもよく、例えば、図書館の書籍分類などであってもよい。ただし、第2特許分類は、第1特許分類と同種類の特許分類を用いることが好ましい。
 続いて、図11を用いて、一実施形態の第2変形例に係る文書情報評価装置1の動作例を説明する。図11は、一実施形態の第2変形例に係る文書情報評価装置1の動作例を示すフローチャートである。
<第2変形例に係る文書情報評価装置1の動作処理の一例>
 図11において、文書情報評価装置1は、利用者端末2からの知的財産に関する入力情報の入力を受付ける(S301)。知的財産に関する入力情報の入力の受け付けは、文書情報入力部301が実行する。次いで、文書情報評価装置1は、第1技術分類を決定する(S302)。決定部401は、利用者端末2を介して入力ボックス301aから入力された知的財産に関する情報(入力情報)の第1技術分類を決定する。第1技術分類の決定は、決定部401が実行する。
 次いで、算出部103は、記憶部102において記憶された先行文書情報に基づき、利用者端末2から入力された入力情報に対する一致度を算出する(S303)。具体的には、入力情報を所定の構成単位に分解し、該分解された構成単位ごとに、記憶部102に記憶された複数の文書情報のうちの一の文書情報との一致度をスコアとして算出することができる。構成単位の分解は、例えば、「発明者、創作者、または出願人として関係する知的財産に関する情報」の構成要件を句読点ごとに分節をする。または、構成単位の分解は、一定の文章の長さや、述語ごとに分節をしてもよい。
 S303の処理を実行した後、スコアの算出結果に基づき、出力部104は、入力情報と文書情報との差異の程度を構成単位ごとに示した比較表を出力する(S304)。例えば、文書情報の評価結果は、構成単位ごとに、入力情報に類似する文書情報(以下、「類似情報」という)との差異の程度を対比(比較)した比較表である。ただし、文書情報の評価結果は、比較表100に限定されない。例えば、模擬拒絶理由通知書(拒絶理由通知書に似せた、模擬的な通知書)であったり、発明者または出願人として関係する知的財産に関する情報等も含まれる。特許の場合、発明者または出願人として関係する知的財産に関する情報は、発明情報が記載されている発明メモや請求項情報である。類似情報は、例えば先行技術文献(先行文書情報)であって、比較表100は、技術的な差異を示したいわゆるクレームチャートである。一致度のスコアは、例えば、「0%」~「100%」の数値として算出することができる。
 次いで、文書情報評価装置1は、認定した発明(入力情報)と類似する類似先行技術文献(先行文書情報)を検索し、類似した発明の有無によって、例えば、権利取得の可能性を判定する(S305)。判定は、判定部402が実行する。発明が類似するか否かの判断は、例えば、認定された発明の意味(含意)を認識し、含意が類似した引用発明が検索できたか否かで判断することができる。ここで、引用発明は、公開されている特許文献または非特許文献である。特許文献は、例えば、各国特許庁により公開されている特許公報等の文献を利用することができる。また、非特許文献は、学術雑誌、新聞、またはWebサイト等に掲載された文献を利用することができる。特許文献または非特許文献は、例えば、図示しない専用のデータベースに保存しておき、判定部402から検索可能にしていてもよいし、記憶部102に保存しておいてもよい。
 次いで、文書情報評価装置1は、判定部402が権利取得の可能性を判定した結果、権利取得の可能性が高いと判定した場合は(S306のYES)、本動作処理を終了する。なお、判定部402が権利取得の可能性が高いと判定した場合、生成部403は、入力情報の補充訂正において、権利の取得可能性が低くなる情報の生成を検討してもよい。例えば、入力情報の補充訂正は、入力情報のある構成要件を削除する情報の生成を検討することができる。発明内容(入力情報)の構成要件を削除する訂正は、権利取得の可能性を低くすることになるが、発明の権利範囲を広げることができる。生成部403は、発明の構成要件を削除することにより、権利範囲を広げる情報を生成することができる。生成部403は、権利の取得の可能性に影響の少ない構成要件を削除する情報を生成することにより、権利の取得の可能性を維持しつつ発明の権利範囲を広げることが可能となる。
 一方、文書情報評価装置1は、判定部402が権利取得の可能性を判定した結果、権利取得の可能性が低いと判定した場合は(S306のNO)、決定部401にて決定した第1技術分類と異なる第2技術分類の選択を行う(S307)。選択は選択部(図示せず)が実行する。第2技術分類は、第1技術分類に類似しない技術分類が選択されるとよい。例えば、技術分類(IPC、FI等の特許分類)の先頭から所定桁数一致している特許分類に設定することで、類似しない技術分類を選択できる。
 次いで、出力部104は、S307にて決定した第1技術分類と異なる第2技術分類を用いて先行文書情報の出力(抽出)を行う(S308)。出力は出力部104が実行する。出力部104による第2技術分類が含まれる先行文書情報の出力(抽出)は、記憶部102に含まれる先行文書情報を単にキーワード検索によって検索してもよい。
 次いで、生成部403が、当該先行文書情報および入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する(S309)。出力部104は、差分を構成する文章、文節、単語(追加情報)を適宜選択して出力することができる。これにより、権利取得の可能性が低い発明(入力情報)に対して何らかの構成を外的に付加した追加情報を提示することが可能になり、利用者に対し、権利取得の可能性を向上させた発明を提案することができる。
 また、出力部104に基づき、構成単位ごとに分割された入力情報を複数の単語(キーワードなど)単位に分割して、どのキーワードがどのキーワードを修飾しているかの係り受け関係を出力(抽出)してもよい。これにより、権利取得の可能性が低い発明(入力情報)に対して何らかの構成を内的に付加した追加情報を提示することが可能になり、利用者に対し、権利取得の可能性を向上させた発明を提案することができる。
 なお、判定部402は、生成部403において生成された複数の追加情報に基づき、それぞれの権利取得の可能性を再判定してもよい。生成された複数の知的財産に係る権利取得の可能性を再判定することにより、生成された複数の追加情報の中から権利取得の可能性の高いものを選択することが可能になる。例えば、生成部403は、複数の追加情報の中から再判定の結果において権利取得の可能性が高い順に追加情報をソートして利用者に提言できるように構成してもよい。
 さらに、判定部402において権利取得の可能性が高いと判定された場合、生成部403は、入力情報の補充訂正において、権利の取得可能性が低くなる情報の生成を行ってもよい。生成部403は、入力情報の補充訂正において、権利の取得可能性が低くなる情報の生成を検討してもよい。例えば、入力情報の補充訂正は、入力情報のある構成要件を削除する情報の生成を検討することができる。発明内容(入力情報)の構成要件を削除する補正は、権利取得の可能性を低くすることになるが、発明の権利範囲を広げることができる。生成部403は、発明の構成要件を削除することにより、権利範囲を広げる情報を生成することができる。生成部403は、権利の取得の可能性に影響の少ない構成要件を削除する情報を生成することにより、権利の取得の可能性を維持しつつ発明の権利範囲を広げることが可能となる。
 S309にて追加情報が生成されると、本動作処理を終了する。
 また、文書情報評価装置1は、明細書に記載された文章の全文(特許請求の範囲の記載、発明の課題または発明の目的、発明の詳細な説明等)から、出現頻度の高い単語、文章、文節、図面、複数の文節の組み合わせ等に基づいて、先行文書情報を出力(抽出)してもよい。また、先行文書情報の出力(抽出)は、明細書に記載された文章の全文のうち、一部の文章、例えば、発明の課題が共通する先行文書情報を出力(抽出)してもよい。あるいは、先行文書情報の出力(抽出)は、発明の効果が共通する先行文書情報を出力(抽出)してもよい。このように、文書情報評価装置1は、先行文書情報を検索するに際して、どの部分に記載されている文章を基に、入力情報に記載されているキーワード(単語)などの出現頻度の高い先行文書情報を検索するかを、適宜選択することが可能である。この選択は、利用者が、利用者端末2を介して入力ボックス(図示せず)から先行文書情報の出力(抽出)条件を入力することによって実行されてよい。入力ボックス(図示せず)には、例えば、「発明の課題が共通」または「発明の効果が共通」と入力する。入力は、図示しない条件入力部によって受け付けられる。入力部によって先行文書情報の出力(抽出)条件を受け付けると、当該条件に従って、出力部104が先行文書情報の出力(抽出)を実行するように構成してもよい。
 さらに、文書情報評価装置1によって評価された文書情報を、特許マップとして表示出力するように構成してもよい。特許マップの表示出力は、例えば、図示しない表示部が行ってもよい。特許マップは、例えば、複数の文書情報をIPCやFIなどの技術分類、または単語(キーワード、熟語など)ごとに分類して特許マップとして表示出力するように構成してもよい。特許マップは、図12A~Cに示すように、文書情報を第2キャラクター(例えば、戦士)として配置した地形マップ(例えば、戦場の地形を模したマップ、以下「戦場マップ」という)220と、俯瞰図230と、チャート240であってもよい。そして、文書情報評価装置1は、戦場マップ220と、俯瞰図230と、チャート240と、を任意に切り替え利用者端末2上に表示出力することができるように構成してもよい。切り替えは、例えば、文書情報評価装置1が備える切替部(図示せず)により行う。
 また、上述した本実施形態および変形例においては、知的財産が発明である場合について主に説明したが、例えば、一致度のスコアおよび類似度において、意匠登録または商標登録について判定するものであってもよい。
 なお、本実施形態および変形例で説明した装置を構成する機能を実現するためのプログラムを、コンピュータ読み取り可能な記憶媒体に記憶して、当該記憶媒体に記憶されたプログラムをコンピュータシステムに読み込ませ、実行することにより、本実施形態の上述した種々の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記憶媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
 さらに「コンピュータ読み取り可能な記憶媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記憶されているプログラムとの組合せで実現するもの、いわゆる差分ファイル(差分プログラム)であっても良い。
 以上、本発明者によってなされた発明の実施形態および変形例について、図面を参照して説明してきたが、本発明は上述の実施の形態および変形例に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
 実施形態に記載された内容の一部を以下に記載する。
[付記1]
 利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得部と、
 複数の文書情報を記憶する記憶部と、
 前記入力情報を所定の構成単位に分解し、該分解された構成単位ごとに前記記憶部に記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出部と、
 前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を前記構成単位ごとに示した比較表を出力する出力部と、
 前記比較表に対して、前記利用者による前記文書情報の自己評価を入力する入力部とを備える、
 文書情報評価装置。
[付記2]
 前記出力部は、
 前記入力部により入力された自己評価の結果に応じて、前記文書情報が良好であることを示す高評価モードと良好でないことを示す低評価モードに切り替えて出力する、
 ことを特徴とする[付記1]に記載の文書情報評価装置。
[付記3]
 前記出力部は、
 各文書情報を前記構成単位ごとに、前記高評価モードおよび前記低評価モードに切り替えて出力する、
 ことを特徴とする[付記2]に記載の文書情報評価装置。
[付記4]
 前記出力部は、
 前記入力情報の構成単位ごとに、該入力情報と複数の前記文書情報との差異の程度を前記比較表に出力することが可能であって、
 複数の前記文書情報の出力優先度は、前記構成単位ごとに算出される前記スコアが所定の基準を満たすか否かで決定する、
 ことを特徴とする[付記1]乃至[付記3]のいずれか一項に記載の文書情報評価装置。
[付記5]
 前記入力情報および複数の前記文書情報は知的財産に関する情報を含む、
 ことを特徴とする[付記1]乃至[付記4]のいずれか一項に記載の文書情報評価装置。
[付記6]
 前記算出部は、
 前記自己評価を示す自己評価モードの切り替えを反映し、前記入力情報に対する前記文書情報の一致度ぐあいを再算出する、
 ことを特徴とする[付記5]に記載の文書情報評価装置。
[付記7]
 前記比較表に出力された前記複数の文書情報のうち、前記利用者が希望する所望の少なくとも一の文書情報をメイン文書情報として固定する文書情報固定部を、さらに備え、
 前記算出部は、
 前記文書情報固定部にて固定した前記メイン文書情報に基づき、前記入力情報に対する前記文書情報の一致度ぐあいを再算出する、
 ことを特徴とする[付記5]または[付記6]に記載の文書情報評価装置。
[付記8]
 コンピュータが、
 利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得ステップと、
 複数の文書情報を記憶する記憶ステップと、
 前記入力情報を所定の構成単位に分解し、該分解された構成単位ごとに前記記憶ステップに記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出ステップと、
 前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を前記構成単位ごとに示した比較表を出力する出力ステップと、
 前記比較表に対して、前記利用者による前記文書情報の自己評価を入力する入力ステップとを備える、
 文書情報評価方法。
[付記9]
 コンピュータに、
 利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得機能と、
 複数の文書情報を記憶する記憶機能と、
 前記入力情報を所定の構成単位に分解し、該分解された構成単位ごとに前記記憶機能に記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出機能と、
 前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を前記構成単位ごとに示した比較表を出力する出力機能と、
 前記比較表に対して、前記利用者による前記文書情報の自己評価を入力する入力機能とを実行させる、
 文書情報評価プログラム。
 また、第1変形例に記載された内容の一部を以下に記載する。
[付記1]
 利用者が操作可能な利用者端末から入力された入力情報および複数の文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価装置であって、
 利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力部と、
 前記利用者が操作可能な前記利用者端末から入力された前記入力情報に関する検索キーワードの入力を受け付ける検索キーワード入力部と、
 複数の文書情報を記憶する記憶部と、
 前記入力情報に含まれるキーワードおよび前記検索キーワードのうち少なくとも一方のキーワードの第1類義語情報を展開する入力を受け付ける類義語展開選択部と、
 前記利用者の操作に応じて前記類義語展開選択部にて類義語展開を選択する場合、前記第1類義語情報を出力する出力部と、
 前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出部と、
を備え、
 前記出力部は、前記入力情報に含まれるキーワードおよび前記検索キーワードのうち少なくとも一方のキーワードの前記第1類義語情報の類義語展開の選択を複数設定できる第1情報バーを表示出力することが可能であり、
 前記記憶部は、利用者独自の複数のキーワードごとの複数の第2類義語情報を有する第2類義語辞書を、前記複数の第1類義語情報を有する第1類義語辞書のキーワードと対応付けて記憶することが可能であり、
 前記出力されたキーワードに対応する前記第1類義語情報から、当該キーワードに対応する少なくとも1つの第2類義語情報を削除し、または任意の第2類義語情報を追加することができる、
 文書情報評価装置。
[付記2]
 入力情報の評価を行うに際して、前記先行文書情報のどの部分に記載されている文章と前記入力情報を比較するか否かを選択可能とする入力を受け付ける検索文章範囲選択部と、をさらに備え、
 前記出力部は、前記検索文章範囲の選択を複数設定できる第2情報バーを表示出力することを特徴とする、
 [付記1]に記載の文書情報評価装置。
[付記3]
 前記入力情報の技術分野に関するキーワードの入力を受け付ける技術分野入力部と、
 前記入力情報の技術的特徴に関するキーワードの入力を受け付ける技術的特徴入力部と、をさらに備えることを特徴とする、
 [付記1]または[付記2]に記載の文書情報評価装置。
[付記4]
 コンピュータが、
 利用者が操作可能な利用者端末から入力された入力情報および複数の文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価方法であって、
 利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得ステップと、
 前記利用者が操作可能な前記利用者端末から入力された前記入力情報に関する検索キーワードの入力を受け付ける検索キーワード入力ステップと、
 複数の文書情報を記憶する記憶ステップと、
 前記入力情報に含まれるキーワードおよび前記検索キーワードのうち少なくとも一方のキーワードの第1類義語情報を展開する入力を受け付ける類義語展開選択ステップと、
 前記利用者の操作に応じて前記類義語展開選択部にて類義語展開を選択する場合、前記第1類義語情報を出力する出力ステップと、
 前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出ステップと、
を備え、
 前記出力ステップは、前記入力情報に含まれるキーワードおよび前記検索キーワードのうち少なくとも一方のキーワードの前記第1類義語情報の類義語展開の選択を複数設定できる第1情報バーを表示出力することが可能であり、
 前記記憶ステップは、利用者独自の複数のキーワードごとの複数の第2類義語情報を有する第2類義語辞書を、前記複数の第1類義語情報を有する第1類義語辞書のキーワードと対応付けて記憶することが可能であり、
 前記出力されたキーワードに対応する前記第1類義語情報から、当該キーワードに対応する少なくとも1つの第2類義語情報を削除し、または任意の第2類義語情報を追加することができる、
 文書情報評価方法。
[付記5]
 コンピュータに、
 利用者が操作可能な利用者端末から入力された入力情報および複数の文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価プログラムであって、
 利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得機能と、
 前記利用者が操作可能な前記利用者端末から入力された前記入力情報に関する検索キーワードの入力を受け付ける検索キーワード入力機能と、
 複数の文書情報を記憶する記憶機能と、
 前記入力情報に含まれるキーワードおよび前記検索キーワードのうち少なくとも一方のキーワードの第1類義語情報を展開する入力を受け付ける類義語展開選択機能と、
 前記利用者の操作に応じて前記類義語展開選択部にて類義語展開を選択する場合、前記第1類義語情報を出力する出力機能と、
 前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出機能と、
を実行させ、
 前記出力機能は、前記入力情報に含まれるキーワードおよび前記検索キーワードのうち少なくとも一方のキーワードの前記第1類義語情報の類義語展開の選択を複数設定できる第1情報バーを表示出力することが可能であり、
 前記記憶機能は、利用者独自の複数のキーワードごとの複数の第2類義語情報を有する第2類義語辞書を、前記複数の第1類義語情報を有する第1類義語辞書のキーワードと対応付けて記憶することが可能であり、
 前記出力されたキーワードに対応する前記第1類義語情報から、当該キーワードに対応する少なくとも1つの第2類義語情報を削除し、または任意の第2類義語情報を追加することができる、
 文書情報評価プログラム。
 また、第2変形例に記載された内容の一部を以下に記載する。
[付記1]
 利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価装置であって、
 利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力部と、
 複数の先行文書情報を記憶する記憶部と、
 前記入力情報の第1技術分類を決定する決定部と、
 前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出部と、
 前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力部と、
 前記スコアに基づき、権利取得の可能性を判定する判定部と、
 前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成部と、
 を備え、
 前記出力部は、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定部にて決定した前記第1技術分類と異なる第2技術分類を用いて先行文書情報の出力を行い、
 前記生成部は、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、
 文書情報評価装置。
[付記2]
 前記第2技術分類を選択する選択部をさらに備え、
 前記選択部は、
 前記決定部にて決定した前記第1技術分類に関する前記先行文書情報に対応付けられた従来技術情報に付与されている技術分類を前記第2技術分類として選択する、
 ことを特徴とする[付記2]に記載の文書情報評価装置。
[付記3]
 前記生成部は、前記第2技術分類を用いて出力した前記先行文書情報に存在し、前記入力情報に存在しない文章を前記追加情報として生成する
 ことを特徴とする[付記1]または[付記2]に記載の文書情報評価装置。
[付記4]
 前記出力部は、前記入力情報を構成単位ごとに分解して出力することが可能であり、
 前記生成部は、前記構成単位を構成する複数の単語に存在しない単語を前記追加情報として生成する、
 ことを特徴とする[付記1]~[付記3]のいずれか一項に記載の文書情報評価装置。
[付記5]
 前記表示部は、評価された前記文書情報を、特許マップとして表示出力する表示部を、さらに備える、
 ことを特徴とする[付記1]~[付記4]のいずれか一項に記載の文書情報評価装置。
[付記6]
 利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価方法であって、
 コンピュータが、
 利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力ステップと、
 複数の先行文書情報を記憶する記憶ステップと、
 前記入力情報の第1技術分類を決定する決定ステップと、
 前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出ステップと、
 前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力ステップと、
 前記スコアに基づき、権利取得の可能性を判定する判定ステップと、
 前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成ステップと、
 を備え、
 前記出力ステップは、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定ステップにて決定した前記第1技術分類と異なる第2技術分類を用いて先行文書情報の出力を行い、
 前記生成ステップは、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、
 文書情報評価方法。
 [付記6]
 利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価プログラムであって、
 コンピュータに、
 利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力機能と、
 複数の先行文書情報を記憶する記憶機能と、
 前記入力情報の第1技術分類を決定する決定機能と、
 前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出機能と、
 前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力機能と、
 前記スコアに基づき、権利取得の可能性を判定する判定機能と、
 前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成機能と、
 を実行させ、
 前記出力機能は、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定機能にて決定した前記第1技術分類と異なる第2技術分類を用いて先行文書情報の出力を行い、
 前記生成機能は、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、
 文書情報評価プログラム。
 1    文書情報評価装置
 2    利用者端末
 101  情報取得部
 102  記憶部
 103  算出部
 104  出力部
 105  入力部
 115  自己評価モード切り替えスイッチ
 115a 「いいね!」機能
 115b 「ダメだね!」機能
 106  固定スイッチ
 107  入力ボックス
 108  特定スイッチ
 109  検索イッチ
 100  比較表
 200  表示画面
 NW   ネットワーク
 11   CPU
 12   RAM
 13   ROM
 14   タッチパネル
 15   通信I/F
 301  文章情報入力部
 401  決定部
 402  判定部
 403  生成部

Claims (7)

  1.  利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価装置であって、
     利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力部と、
     複数の先行文書情報を記憶する記憶部と、
     前記入力情報の第1技術分類を決定する決定部と、
     前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出部と、
     前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力部と、
     前記スコアに基づき、権利取得の可能性を判定する判定部と、
     前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成部と、
     を備え、
     前記出力部は、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定部にて決定した前記第1技術分類と異なる第2技術分類を用いて先行文書情報の出力を行い、
     前記生成部は、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、
     文書情報評価装置。
  2.  前記第2技術分類を選択する選択部をさらに備え、
     前記選択部は、
     前記決定部にて決定した前記第1技術分類に関する前記先行文書情報に対応付けられた従来技術情報に付与されている技術分類を前記第2技術分類として選択する、
     ことを特徴とする請求項1に記載の文書情報評価装置。
  3.  前記生成部は、前記第2技術分類を用いて出力した前記先行文書情報に存在し、前記入力情報に存在しない文章を前記追加情報として生成する、
     ことを特徴とする請求項1または2に記載の文書情報評価装置。
  4.  前記出力部は、前記入力情報を構成単位ごとに分解して出力することが可能であり、
     前記生成部は、前記構成単位を構成する複数の単語に存在しない単語を前記追加情報として生成する、
     ことを特徴とする請求項1~3のいずれか一項に記載の文書情報評価装置。
  5.  前記表示部は、評価された前記文書情報を、特許マップとして表示出力する表示部を、さらに備える、
     ことを特徴とする請求項1~4のいずれか一項に記載の文書情報評価装置。
  6.  利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価方法であって、
     コンピュータが、
     利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力ステップと、
     複数の先行文書情報を記憶する記憶ステップと、
     前記入力情報の第1技術分類を決定する決定ステップと、
     前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出ステップと、
     前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力ステップと、
     前記スコアに基づき、権利取得の可能性を判定する判定ステップと、
     前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成ステップと、
     を備え、
     前記出力ステップは、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定ステップにて決定した前記第1技術分類と異なる第2技術分類を用いて先行文書情報の出力を行い、
     前記生成ステップは、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、
     文書情報評価方法。
  7.  利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価プログラムであって、
     コンピュータに、
     利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力機能と、
     複数の先行文書情報を記憶する記憶機能と、
     前記入力情報の第1技術分類を決定する決定機能と、
     前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出機能と、
     前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力機能と、
     前記スコアに基づき、権利取得の可能性を判定する判定機能と、
     前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成機能と、
     を実行させ、
     前記出力機能は、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定機能にて決定した前記第1技術分類と異なる第2技術分類を用いて先行文書情報の出力を行い、
     前記生成機能は、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、
     文書情報評価プログラム。
PCT/JP2020/003571 2020-01-30 2020-01-30 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム WO2021152809A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2020/003571 WO2021152809A1 (ja) 2020-01-30 2020-01-30 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
JP2021574396A JP7193890B2 (ja) 2020-01-30 2020-01-30 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/003571 WO2021152809A1 (ja) 2020-01-30 2020-01-30 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム

Publications (1)

Publication Number Publication Date
WO2021152809A1 true WO2021152809A1 (ja) 2021-08-05

Family

ID=77078757

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/003571 WO2021152809A1 (ja) 2020-01-30 2020-01-30 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム

Country Status (2)

Country Link
JP (1) JP7193890B2 (ja)
WO (1) WO2021152809A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017041112A (ja) * 2015-08-20 2017-02-23 ヤフー株式会社 情報提供装置、情報提供方法および情報提供プログラム
US20180189909A1 (en) * 2016-12-30 2018-07-05 At&T Intellectual Property I, L.P. Patentability search and analysis
JP6506489B1 (ja) * 2018-07-31 2019-04-24 株式会社AI Samurai 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム
JP6555704B1 (ja) * 2019-04-08 2019-08-07 株式会社AI Samurai 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
JP2019179493A (ja) * 2018-03-30 2019-10-17 株式会社AI Samurai 情報処理装置、情報処理方法及び情報処理プログラム
JP6618103B1 (ja) * 2019-06-03 2019-12-11 株式会社AI Samurai 文章生成装置、文章生成方法、および文章生成プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017041112A (ja) * 2015-08-20 2017-02-23 ヤフー株式会社 情報提供装置、情報提供方法および情報提供プログラム
US20180189909A1 (en) * 2016-12-30 2018-07-05 At&T Intellectual Property I, L.P. Patentability search and analysis
JP2019179493A (ja) * 2018-03-30 2019-10-17 株式会社AI Samurai 情報処理装置、情報処理方法及び情報処理プログラム
JP6506489B1 (ja) * 2018-07-31 2019-04-24 株式会社AI Samurai 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム
JP6555704B1 (ja) * 2019-04-08 2019-08-07 株式会社AI Samurai 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
JP6618103B1 (ja) * 2019-06-03 2019-12-11 株式会社AI Samurai 文章生成装置、文章生成方法、および文章生成プログラム

Also Published As

Publication number Publication date
JPWO2021152809A1 (ja) 2021-08-05
JP7193890B2 (ja) 2022-12-21

Similar Documents

Publication Publication Date Title
Arulmurugan et al. RETRACTED ARTICLE: Classification of sentence level sentiment analysis using cloud machine learning techniques
JP6975377B2 (ja) テキスト相関度を確定するためのコンピュータ実施方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
Zhao et al. CAPER: Context-aware personalized emoji recommendation
Rai Identifying key product attributes and their importance levels from online customer reviews
JP6555704B1 (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
Bansal et al. Hybrid attribute based sentiment classification of online reviews for consumer intelligence
US10025978B2 (en) Assigning of topical icons to documents to improve file navigation
EP3203383A1 (en) Text generation system
US20200192921A1 (en) Suggesting text in an electronic document
JP6653833B1 (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
JP2021086592A (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
KR20200053334A (ko) 융합 연구 촉진을 위한 연구원 맵 구축 방법 및 시스템
Tuarob et al. Automated discovery of product feature inferences within large-scale implicit social media data
Tutubalina et al. Automated prediction of demographic information from medical user reviews
RU2719463C1 (ru) Тематические модели с априорными параметрами тональности на основе распределенных представлений
JP2021128620A (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
Yang et al. Automatic text summarization for government news reports based on multiple features
WO2021152809A1 (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
JP7029204B1 (ja) 技術調査支援装置、技術調査支援方法、および技術調査支援プログラム
Litvak et al. Improving summarization quality with topic modeling
JP6916476B2 (ja) 知的財産支援装置および知的財産支援方法並びに知的財産支援プログラム
JP2020173759A (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム
Rizun et al. Modeling the customer’s contextual expectations based on latent semantic analysis algorithms
Elmenshawy et al. Automatic arabic text summarization (AATS): A survey
WO2021245814A1 (ja) 文書情報評価装置、文書情報評価方法、および文書情報評価プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20917039

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021574396

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20917039

Country of ref document: EP

Kind code of ref document: A1