JP2021043955A5 - Invention document analysis system, invention document analysis method, and invention document analysis processing program - Google Patents

Invention document analysis system, invention document analysis method, and invention document analysis processing program Download PDF

Info

Publication number
JP2021043955A5
JP2021043955A5 JP2020122433A JP2020122433A JP2021043955A5 JP 2021043955 A5 JP2021043955 A5 JP 2021043955A5 JP 2020122433 A JP2020122433 A JP 2020122433A JP 2020122433 A JP2020122433 A JP 2020122433A JP 2021043955 A5 JP2021043955 A5 JP 2021043955A5
Authority
JP
Japan
Prior art keywords
information
key
phrase
document
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020122433A
Other languages
Japanese (ja)
Other versions
JP7448205B2 (en
JP2021043955A (en
Filing date
Publication date
Application filed filed Critical
Publication of JP2021043955A publication Critical patent/JP2021043955A/en
Publication of JP2021043955A5 publication Critical patent/JP2021043955A5/en
Application granted granted Critical
Publication of JP7448205B2 publication Critical patent/JP7448205B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本開示は、発明文書分析システム及び関連技術に関する。 The present disclosure relates to an invention document analysis system and related technology.

従来、機械翻訳装置が知られている(例えば、特許文献1参照)。 Conventionally, a machine translation device is known (see Patent Document 1, for example).

特開2018-190287号公報JP 2018-190287 A

従来の機械翻訳装置は、翻訳対象の日本語の文書が一定のフォーマットで記述されている等の条件を満たす場合に限って適切な翻訳結果を出力し得るものの、技術的思想を日本語で表した発明文書を、翻訳者等が翻訳する場合等において、必ずしも有用とは限らない。例えば、従来の機械翻訳装置により、発明文書が適正に翻訳されるとは限らず、翻訳者は、機械翻訳装置により翻訳された結果を、確認して適宜修正する必要がある。 A conventional machine translation device can output an appropriate translation result only when the Japanese document to be translated is described in a certain format. It is not necessarily useful when a translator or the like translates an invention document. For example, it is not always the case that an invention document is properly translated by a conventional machine translation device, and the translator needs to check the result translated by the machine translation device and correct it as appropriate.

本開示は、技術的思想を日本語で表した発明文書を分析して、発明文書を用いる者に有用な情報を出力し得る発明文書システムを提供する。本開示は、例えば、技術的思想を日本語で表した発明文書に基づく翻訳結果文書(つまり発明文書を例えば英語、中国語等の外国語に翻訳した結果である文書)を、翻訳者が効率的又は適正に作成するために有用な情報を出力し得る発明文書分析システムを提供する。また、本開示は、その発明文書分析システムに関連する方法(発明文書分析方法)及び発明文書分析処理プログラムを提供する。また、本開示は、その発明文書分析方法により生成され、コンピュータプログラムとしてのスクリプトを含み得るデータであって、マークアップ言語により記述された文書を含む表示用文書を提供する。 The present disclosure provides an invention document system capable of analyzing invention documents expressing technical ideas in Japanese and outputting useful information to those who use the invention documents. The present disclosure, for example, allows a translator to efficiently translate a translation result document based on an invention document that expresses a technical idea in Japanese (that is, a document that is the result of translating the invention document into a foreign language such as English or Chinese). To provide an invention document analysis system capable of outputting information useful for purposeful or proper preparation. The present disclosure also provides a method (invention document analysis method) and an invention document analysis processing program related to the invention document analysis system. The present disclosure also provides a document for display including a document written in a markup language, the data generated by the inventive document analysis method and which may include a script as a computer program.

本開示における発明文書分析システムは、技術的思想を日本語で表した、特許出願用のクレーム及び明細書を記載した文書である発明文書を、分析する発明文書分析システムであって、重要語句の抽出の条件を示す条件情報を含む設定情報を取得する設定情報取得部と、発明文書を取得する文書取得部と、前記文書取得部により取得された発明文書を、前記設定情報に基づいて分析する分析部と、前記文書取得部により取得された発明文書についての前記分析部による分析結果に基づいて生成された情報を出力する出力部とを含み、前記分析部は、前記文書取得部により取得された発明文書から前記設定情報に基づいて重要語句を抽出する重要語句抽出部を含み、前記出力部は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々に基づいて生成された情報を出力する。 The invention document analysis system in the present disclosure is an invention document analysis system that analyzes an invention document, which is a document describing claims and specifications for a patent application in which technical ideas are expressed in Japanese. A setting information acquiring unit for acquiring setting information including condition information indicating extraction conditions, a document acquiring unit for acquiring an invention document, and an invention document acquired by the document acquiring unit is analyzed based on the setting information. and an output unit configured to output information generated based on an analysis result of the invention document acquired by the document acquisition unit, wherein the analysis unit outputs information acquired by the document acquisition unit. an important phrase extraction unit for extracting important phrases from the invention document based on the setting information, and the output unit extracts a plurality of important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit Outputs information generated based on each phrase.

また、本開示における発明文書分析方法は、マイクロプロセッサを備える機器に、技術的思想を日本語で表した特許出願用のクレーム及び明細書を記載した文書である発明文書を分析して表示用文書を生成する発明文書分析処理を、行わせる発明文書分析方法であって、前記発明文書分析処理は、発明文書を取得する文書取得ステップと、前記文書取得ステップにより取得された発明文書を、予め定められた重要語句の抽出の条件に基づく重要語句の抽出を行うことにより、分析する分析ステップと、前記文書取得ステップにより取得された発明文書についての前記分析ステップによる分析結果に基づいて生成された特許出願関連情報を表示するための前記表示用文書を生成して出力する出力ステップとを含み、前記表示用文書は、マークアップ言語で記述された文書を含み、マイクロプロセッサを備える機器におけるブラウザによる解釈の対象とされ、技術的思想を日本語で表した特許出願用の発明文書におけるクレームの内容を表すクレーム情報と、当該発明文書における明細書の内容を表す明細書情報とを含む特許出願関連情報が表示されるべき内容として含まれたものであり、前記クレームの内容を表す前記クレーム情報は、当該クレームの各語句のうち、予め定められた重要語句の抽出の前記条件に基づいて抽出される各重要語句について、当該重要語句の表示要素の表示態様を制御するための表示制御情報を含み、前記クレーム情報に表される重要語句のうち、重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る前記表示制御情報各々は、当該複数の重要語句各々の表示要素を、互いに相違する表示色を付加した表示態様で表示するように制御するための情報を含み、前記クレーム情報に表される重要語句のうち、重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の文字列で構成される重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記1つの重要語句の表示要素の表示態様として付加された表示色と同一の表示色を付加した表示態様で表示するように制御するための情報を含み、前記明細書の内容を表す前記明細書情報は、当該明細書中の各語句のうち、重要語句の抽出の前記条件に基づいて抽出される各重要語句について、当該重要語句の表示要素の表示態様を制御するための表示制御情報を含み、前記明細書情報に表される重要語句のうち、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記クレーム情報における前記1つの重要語句の表示要素の表示態様として付加された表示色と同一の表示色を付加した表示態様で表示するように制御するための情報を含む。
また、本開示における発明文書分析処理プログラムは、マイクロプロセッサを備える機器に、技術的思想を日本語で表した特許出願用のクレーム及び明細書を記載した文書である発明文書を分析して表示用文書を生成する発明文書分析処理を行わせることで、上述の発明文書分析方法を実現するためのプログラムである
In addition, the invention document analysis method according to the present disclosure analyzes an invention document, which is a document describing claims and specifications for a patent application in which a technical idea is expressed in Japanese, in a device equipped with a microprocessor, and analyzes the invention document as a document for display. wherein the invention document analysis process includes a document acquisition step of acquiring an invention document, and a predetermined invention document acquired by the document acquisition step. A patent generated based on the analysis result of the analysis step for the invention document acquired by the document acquisition step by extracting the key phrase based on the extracted key phrase extraction condition and an output step of generating and outputting the display document for displaying the application-related information, the display document including a document written in a markup language and interpreted by a browser in a device equipped with a microprocessor. Patent application-related information including claim information that represents the content of claims in an invention document for a patent application that expresses the technical idea in Japanese, and specification information that represents the content of the specification in the invention document. is included as content to be displayed, and the complaint information representing the content of the complaint is extracted based on the conditions for extracting predetermined key phrases from among the phrases of the complaint. For each key phrase, display control information for controlling the display mode of the display element of the key phrase is included, and among the key phrases represented in the claim information, a plurality of character strings constituting the key phrase are different from each other. Each of the display control information related to each of the key phrases includes information for controlling display elements of the plurality of key phrases to be displayed in a display mode in which different display colors are added, and the claim information includes: The display control information related to the important phrase composed of the same character string as any one of the plurality of important phrases having different character strings constituting the important phrase among the important phrases to be expressed. contains information for controlling the display element of the key phrase to be displayed in a display mode in which the same display color as the display mode of the display element of the one key phrase is added, The specification information representing the content of the specification includes, for each key phrase extracted based on the conditions for extraction of key phrases among the terms in the specification, the display mode of the display element of the key phrase. any one of the plurality of important phrases in which the character strings constituting the important phrases in the claim information are different from each other among the important phrases represented in the specification information The display control information related to the same important phrase as the two important phrases has the same display color as the display color added as the display mode of the display element of the one important phrase in the claim information. Contains information for controlling to display in a display mode with the addition of
In addition, the invention document analysis processing program in the present disclosure analyzes and displays invention documents, which are documents describing claims and specifications for patent applications expressing technical ideas in Japanese, in a device equipped with a microprocessor. It is a program for realizing the invention document analysis method described above by executing invention document analysis processing for generating a document .

本開示における発明文書分析システム、発明文書分析方法及び発明文書分析処理プログラムによれば、有用な情報が出力され得る。本開示における表示用文書によれば、有用な情報が表示され得る。また、本開示における発明文書分析システム、発明文書分析方法、表示用文書、及び、発明文書分析処理プログラムは、例えば、発明文書に基づく翻訳結果文書を、翻訳者が効率的又は適正に作成するためには、有用であり得る。 According to the invention document analysis system , the invention document analysis method , and the invention document analysis processing program according to the present disclosure, useful information can be output. Useful information may be displayed according to the display document in the present disclosure. In addition, the invention document analysis system, invention document analysis method, display document, and invention document analysis processing program in the present disclosure are, for example, for the translator to efficiently or properly create a translation result document based on the invention document. can be useful for

図1は発明文書の翻訳に関連する作業の流れの一例を示す図である。FIG. 1 is a diagram showing an example of a work flow related to translation of an invention document. 図2は翻訳者による翻訳作業の流れの一例を示す図である。FIG. 2 is a diagram showing an example of the flow of translation work by a translator. 図3は有用な権利取得のための翻訳の効率又は適正化を阻害する要因となる事項の一例を列挙した図である。FIG. 3 is a diagram listing an example of factors that hinder the efficiency or appropriateness of translation for obtaining useful rights. 図4は実施形態1に係る発明文書分析システムの構成の一例を示す図である。FIG. 4 is a diagram showing an example of the configuration of the invention document analysis system according to the first embodiment. 図5は実施形態1に係る設定情報の内容の一例を示す図である。FIG. 5 is a diagram showing an example of contents of setting information according to the first embodiment. 図6は実施形態1に係る特許出願関連情報の内容の一例を示す図である。FIG. 6 is a diagram showing an example of contents of patent application related information according to the first embodiment. 図7は実施形態1に係る発明文書分析処理の一例を示すフローチャートである。FIG. 7 is a flowchart showing an example of invention document analysis processing according to the first embodiment. 図8は実施形態1及び2に係る発明文書分析システムのハードウェア構成の一例を示す図である。FIG. 8 is a diagram showing an example of the hardware configuration of the invention document analysis system according to the first and second embodiments. 図9は実施形態1及び2に係る発明文書分析システムのハードウェア構成及びネットワーク構成の一例を示す図である。FIG. 9 is a diagram showing an example of the hardware configuration and network configuration of the invention document analysis system according to the first and second embodiments. 図10は実施形態1及び2に係る発明文書分析システムのハードウェア構成及びネットワーク構成の別の一例を示す図である。FIG. 10 is a diagram showing another example of the hardware configuration and network configuration of the invention document analysis system according to the first and second embodiments. 図11は実施形態2に係る発明文書分析システムの構成の一例を示す図である。FIG. 11 is a diagram showing an example of the configuration of an invention document analysis system according to the second embodiment. 図12は実施形態2に係る発明文書分析システムが取り扱う主なデータ類の一例を示す図である。FIG. 12 is a diagram showing an example of main data handled by the invention document analysis system according to the second embodiment. 図13は実施形態2に係る設定情報の内容の一例を示す図である。FIG. 13 is a diagram showing an example of contents of setting information according to the second embodiment. 図14は翻訳用発明文書標準規定の一例を示す図である。FIG. 14 is a diagram showing an example of invention document standard specifications for translation. 図15は実施形態2に係る特許出願関連情報の内容の一例を示す図である。FIG. 15 is a diagram showing an example of contents of patent application related information according to the second embodiment. 図16は特許出願関連情報に係る表示用文書の一例であるHTML文書の構成例を示す図である。FIG. 16 is a diagram showing a configuration example of an HTML document, which is an example of a display document related to patent application related information. 図17は特許出願関連情報に係る表示用文書に基づいてブラウザ等により表示される表示画面の一例を示す図である。FIG. 17 is a diagram showing an example of a display screen displayed by a browser or the like based on a display document related to patent application related information. 図18は重要語句管理情報の一例を示す図である。FIG. 18 is a diagram showing an example of key phrase management information. 図19は重要語句管理情報における重要語句の属性情報の項目の一例を示す図である。FIG. 19 is a diagram showing an example of items of attribute information of important phrases in the important phrase management information. 図20は表示用文書としての特許出願関連情報の重要語句関係情報における包含関係情報部分の表示例を示す図である。FIG. 20 is a diagram showing a display example of the inclusion relation information portion in the important word relation information of the patent application related information as a display document. 図21は特許出願関連情報の警告情報の項目及び記載事項の一例を示す図である。FIG. 21 is a diagram showing an example of warning information items and description items of patent application related information. 図22はブラウザに表示された表示用文書としての特許出願関連情報におけるクレーム情報の一例を示す図である。FIG. 22 is a diagram showing an example of claim information in patent application related information as a display document displayed on the browser. 図23はブラウザに表示されたクレーム情報における重要語句に対する操作に応じて表示された情報の一例を示す図である。FIG. 23 is a diagram showing an example of information displayed in response to an operation on important terms in complaint information displayed on the browser. 図24はブラウザに表示されたクレーム情報における重要語句に対する操作に応じて表示された画面の一例を示す図である。FIG. 24 is a diagram showing an example of a screen displayed in response to an operation on important terms in complaint information displayed on the browser. 図25はブラウザに表示された表示用文書としての特許出願関連情報におけるクレームベース明細書情報の一例を示す図である。FIG. 25 is a diagram showing an example of claim-based specification information in patent application related information as a display document displayed on the browser. 図26はブラウザに表示された表示用文書としての特許出願関連情報における明細書情報の一例を示す図である。FIG. 26 is a diagram showing an example of specification information in patent application related information as a display document displayed on the browser. 図27はブラウザに表示された明細書情報における重要語句に付加された符号に対する操作に応じて表示された画面の一例を示す図である。FIG. 27 is a diagram showing an example of a screen displayed in response to an operation on a code added to an important phrase in specification information displayed on the browser. 図28はブラウザに表示された表示用文書としての特許出願関連情報における明細書見出しリストの一例を示す図である。FIG. 28 is a diagram showing an example of a specification heading list in patent application related information as a document for display displayed on the browser. 図29はブラウザに表示された表示用文書としての特許出願関連情報における明細書見出しリストの別の一例を示す図である。FIG. 29 is a diagram showing another example of a specification heading list in patent application related information as a display document displayed on the browser. 図30はブラウザに表示された表示用文書としての特許出願関連情報における符号リスト及び図面符号リストの一例を示す図である。FIG. 30 is a diagram showing an example of a code list and a drawing code list in patent application related information as a display document displayed on the browser. 図31はブラウザに表示された符号リストにおける符号に対する操作に応じて表示された画面の一例を示す図である。FIG. 31 is a diagram showing an example of a screen displayed in response to an operation on a code in the code list displayed on the browser. 図32はブラウザに表示された表示用文書としての特許出願関連情報における構成クレームツリーの一例を示す図である。FIG. 32 is a diagram showing an example of a configuration claim tree in patent application related information as a display document displayed on a browser. 図33はブラウザに表示された構成クレームツリーにおける引用関係の表現用の記号に対する操作に応じて引用関係が切断された例を示す図である。FIG. 33 is a diagram showing an example in which citation relationships are cut in accordance with an operation on symbols for expressing citation relationships in the constituent claim tree displayed on the browser. 図34はブラウザに表示された表示用文書としての特許出願関連情報におけるクレーム翻訳情報の一例を示す図である。FIG. 34 is a diagram showing an example of claim translation information in patent application related information as a display document displayed on the browser. 図35はブラウザに表示されたクレーム翻訳情報における重要語句の翻訳語句への操作に応じて表示された翻訳語候補集合の要素の選択メニューの一例を示す図である。FIG. 35 is a diagram showing an example of a selection menu of elements of a translation word candidate set displayed in response to an operation on a translation word of an important word in the complaint translation information displayed on the browser. 図36はブラウザに表示された表示用文書としての特許出願関連情報における重要語句リストの一例を示す図である。FIG. 36 is a diagram showing an example of an important phrase list in patent application related information as a display document displayed on the browser. 図37はブラウザに表示された重要語句リストにおける翻訳語候補集合をその要素を選択する操作に応じて対応翻訳語に変更した一例を示す図である。FIG. 37 is a diagram showing an example in which a translation word candidate set in an important phrase list displayed on a browser is changed to a corresponding translation word according to an operation of selecting the element. 図38はブラウザに表示された表示用文書としての特許出願関連情報における重要語句リストの別の一例を示す図である。FIG. 38 is a diagram showing another example of an important phrase list in patent application related information as a display document displayed on the browser. 図39は実施形態2に係る発明文書分析システムの表示部により表示される表示画面の一例を示す図である。FIG. 39 is a diagram showing an example of a display screen displayed by the display unit of the invention document analysis system according to the second embodiment. 図40は実施形態2に係る発明文書分析処理の一例を示すフローチャートである。FIG. 40 is a flowchart showing an example of invention document analysis processing according to the second embodiment. 図41は引用関係分析処理の一例を示すフローチャートである。FIG. 41 is a flow chart showing an example of the citation relationship analysis process. 図42はクレーム重要語句抽出処理の一例を示すフローチャートである。FIG. 42 is a flow chart showing an example of the complaint key phrase extraction processing. 図43は明細書重要語句抽出処理の一例を示すフローチャートである。FIG. 43 is a flow chart showing an example of a specification key phrase extraction process. 図44は要素間関係判別処理の一例を示すフローチャートである。FIG. 44 is a flow chart showing an example of inter-element relationship determination processing. 図45は各重要語句の重要度の決定処理の一例を示すフローチャートである。FIG. 45 is a flow chart showing an example of processing for determining the degree of importance of each key phrase. 図46は警告情報生成処理の一例を示すフローチャートである。FIG. 46 is a flowchart showing an example of warning information generation processing. 図47はクレーム情報等生成処理の一例を示すフローチャートである。FIG. 47 is a flow chart showing an example of processing for generating complaint information. 図48はクレーム情報生成処理の一例を示すフローチャートである。FIG. 48 is a flow chart showing an example of complaint information generation processing. 図49は符号決定処理の一例を示すフローチャートである。FIG. 49 is a flowchart showing an example of code determination processing. 図50はクレームベース図面情報生成処理の一例を示すフローチャートである。FIG. 50 is a flow chart showing an example of claim-based drawing information generation processing. 図51はクレームベース明細書情報生成処理の一例を示すフローチャートである。FIG. 51 is a flow chart showing an example of claim-based specification information generation processing. 図52はクレームベース要約書情報生成処理の一例を示すフローチャートである。FIG. 52 is a flow chart showing an example of claim-based abstract information generation processing. 図53は修正版クレーム情報生成処理の一例を示すフローチャートである。FIG. 53 is a flow chart showing an example of modified complaint information generation processing. 図54はクレームツリー等生成処理の一例を示すフローチャートである。FIG. 54 is a flow chart showing an example of claim tree generation processing. 図55は明細書情報等生成処理の一例を示すフローチャートである。FIG. 55 is a flow chart showing an example of the detailed information generation process. 図56は各種翻訳情報の生成処理の一例を示すフローチャートである。FIG. 56 is a flow chart showing an example of processing for generating various translation information. 図57は重要語句リスト等生成処理の一例を示すフローチャートである。FIG. 57 is a flowchart showing an example of processing for generating an important phrase list, etc. FIG. 図58は重要語句翻訳用学習モデル生成処理の一例を示すフローチャートである。FIG. 58 is a flow chart showing an example of processing for generating a learning model for translation of important phrases. 図59は翻訳用学習モデル生成処理の一例を示すフローチャートである。FIG. 59 is a flow chart showing an example of a learning model generation process for translation.

本開示における発明文書分析システムは、技術的思想を日本語で表した、特許出願用のクレーム及び明細書を記載した文書である発明文書を、分析する発明文書分析システムであって、重要語句の抽出の条件を示す条件情報を含む設定情報を取得する設定情報取得部と、発明文書を取得する文書取得部と、前記文書取得部により取得された発明文書を、前記設定情報に基づいて分析する分析部と、前記文書取得部により取得された発明文書についての前記分析部による分析結果に基づいて生成された情報を出力する出力部とを含み、前記分析部は、前記文書取得部により取得された発明文書から前記設定情報に基づいて重要語句を抽出する重要語句抽出部を含み、前記出力部は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々に基づいて生成された情報を出力する発明文書分析システムである。 The invention document analysis system in the present disclosure is an invention document analysis system that analyzes an invention document, which is a document describing claims and specifications for a patent application in which technical ideas are expressed in Japanese. A setting information acquiring unit for acquiring setting information including condition information indicating extraction conditions, a document acquiring unit for acquiring an invention document, and an invention document acquired by the document acquiring unit is analyzed based on the setting information. and an output unit configured to output information generated based on an analysis result of the invention document acquired by the document acquisition unit, wherein the analysis unit outputs information acquired by the document acquisition unit. an important phrase extraction unit for extracting important phrases from the invention document based on the setting information, and the output unit extracts a plurality of important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit It is an invention document analysis system that outputs information generated based on each word.

これにより、発明文書分析システムは、例えば発明者等(例えば発明者若しくはその関係者)又は弁理士により作成された、クレーム及び明細書を記載した発明文書を分析した結果に基づく情報を出力するので、例えば、その発明文書を翻訳する翻訳者等(例えば翻訳者又はその他の発明文書を用いる者)にとっては、出力された情報を参照することにより、発明文書の理解が促進される可能性がある。発明文書の理解の促進は、翻訳者にとって発明文書を適切に又は効率的に翻訳するために有用となる。発明文書における重要語句に基づいて生成された情報は、翻訳者が、発明文書の重要語句に対応する対応翻訳語を決定してから発明文書全体を翻訳するような場合において、有用となり得る。 As a result, the invention document analysis system outputs information based on the results of analysis of invention documents describing claims and specifications prepared by, for example, inventors (for example, inventors or their related parties) or patent attorneys. For example, for translators who translate the invention document (for example, translators or other people who use the invention document), referring to the output information may facilitate understanding of the invention document. . Facilitating the understanding of the invention document is useful for translators to translate the invention document appropriately or efficiently. Information generated based on key words in an invention document can be useful in cases where a translator determines corresponding translation words corresponding to key words in the invention document before translating the entire invention document.

ここで、前記条件情報は、重要語句の候補となる文字列のパターンを表した重要語句候補文字列パターンを示す重要語句候補文字列パターン情報と、先行記載した文字列の参照用に用いられる参照文字列のパターンを表した参照文字列パターンを示す参照文字列パターン情報と、要素名を表す文字列に後続して付記される符号の文字列のパターンを表した符号文字列パターンを示す符号文字列パターン情報と、所定の助詞である文字列のパターンを表した特定助詞文字列パターンを示す特定助詞文字列パターン情報とを含み、前記重要語句候補文字列パターン情報は、少なくとも、先頭文字が漢字である所定の文字列、及び、先頭文字が片仮名である所定の文字列が、当該重要語句候補文字列パターンに該当するように定められており、前記参照文字列パターン情報は、少なくとも、「前記」という文字列が、当該参照文字列パターンに該当するように定められており、前記符号文字列パターン情報は、少なくとも、先頭文字が数字である所定の文字列が、当該符号文字列パターンに該当するように定められており、前記特定助詞文字列パターン情報は、少なくとも、「を」、「に」、「が」、「と」、「から」、「へ」及び「は」のいずれかの文字が、当該特定助詞文字列パターンに該当するように定められており、前記重要語句抽出部は、前記文書取得部により取得された発明文書に、前記参照文字列パターンに該当する第1文字列に後続して前記重要語句候補文字列パターンに該当する第2文字列が存在する場合に、当該第2文字列と同一の文字列を重要語句として抽出する第1抽出部と、前記文書取得部により取得された発明文書のクレーム中に、前記重要語句候補文字列パターンに該当する第3文字列に後続して句点文字が存在するときには、当該第3文字列と同一の文字列を重要語句として抽出する第2抽出部と、前記文書取得部により取得された発明文書に、前記重要語句候補文字列パターンに該当する第4文字列に後続して前記符号文字列パターンに該当する第5文字列が存在する場合に、当該第4文字列と同一の文字列を重要語句として抽出する第3抽出部と、前記文書取得部により取得された発明文書に、前記重要語句候補文字列パターンに該当する第6文字列に後続して前記特定助詞文字列パターンに該当する第7文字列が存在する場合に、当該第6文字列と同一の文字列を重要語句として抽出する第4抽出部とを含み、前記重要語句抽出部は重要語句の前記抽出においては、前記重要語句候補文字列パターンに複数の文字列が該当していた場合において当該複数の文字列のうちの一の文字列が他の文字列に発明文書の記載上包含されていたときには、当該複数の文字列のうち当該一の文字列を除外した残余の文字列を選択対象として重要語句を選択して抽出し、前記出力部は、前記文書取得部により取得された発明文書についての前記分析部による分析結果に基づいて生成された特許出願関連情報を出力し、前記特許出願関連情報は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々が、表示されるべき内容として含まれた、表示用文書として出力され、前記特許出願関連情報は、前記表示用文書において表示されるべき、前記文書取得部により取得された発明文書の前記クレームの内容を表すクレーム情報を含み、前記文書取得部により取得された発明文書のクレームの内容を表す前記クレーム情報は、当該発明文書から前記重要語句抽出部により抽出された当該クレーム中の複数の重要語句各々について、当該重要語句の表示態様を制御するための表示制御情報を含み、前記特許出願関連情報は、前記表示用文書において表示されるべき、前記文書取得部により取得された発明文書の前記明細書の内容を表す明細書情報を含み、前記文書取得部により取得された発明文書の明細書の内容を表す前記明細書情報は、当該発明文書から前記重要語句抽出部により抽出された当該明細書中の複数の重要語句各々について、当該重要語句の表示態様を制御するための表示制御情報を含み、前記クレーム情報及び前記明細書情報における、前記重要語句抽出部により抽出された複数の重要語句各々についての、当該重要語句の表示態様を制御するための前記表示制御情報は、当該表示制御情報に対応する当該重要語句の表示態様を、前記クレーム情報及び前記明細書情報における当該複数の重要語句以外の語句の表示態様と相違させるための強調表示情報を含み、前記クレーム情報に表される重要語句のうち、重要語句を構成する文字列が互いに相違する複数の重要語句各々に対応する、表示態様を制御するための前記表示制御情報各々は、当該複数の重要語句各々を互いに相違する表示態様で表示するように制御するための、互いに相違する識別情報を含み、前記明細書情報に表される重要語句のうち、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の重要語句の表示態様を制御するための前記表示制御情報は、当該重要語句の表示要素を、前記クレーム情報における前記1つの重要語句の表示要素の表示態様と少なくとも一部において同様の表示態様で表示するように制御するための情報を含み、前記明細書情報に表される重要語句のうち、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句のいずれとも相違する重要語句の表示態様を制御するための前記表示制御情報は、当該重要語句の表示要素を、前記クレーム情報における当該複数の重要語句の表示要素のいずれとも相違する表示態様で表示させるように制御するための情報を含むこととしてもよい。 Here, the condition information includes key word candidate character string pattern information indicating a key word candidate character string pattern representing a character string pattern that is a key word candidate, and a reference used for referring to the previously described character string. Reference character string pattern information that indicates the reference character string pattern that indicates the pattern of the character string, and code character that indicates the code character string pattern that indicates the character string pattern of the code appended after the character string that indicates the element name It includes string pattern information and specific particle character string pattern information indicating a specific particle character string pattern representing a pattern of a character string that is a predetermined particle, and the important phrase candidate character string pattern information has at least the first character in Chinese characters. and a predetermined character string whose first character is katakana are determined to correspond to the important phrase candidate character string pattern, and the reference character string pattern information is at least "the above '' corresponds to the reference character string pattern, and the code character string pattern information includes at least a predetermined character string whose first character is a number corresponds to the code character string pattern. and the specific particle character string pattern information includes at least one of "wo", "ni", "ga", "to", "from", "he" and "ha" A character is determined to correspond to the specific particle character string pattern, and the important phrase extraction unit adds a first character string corresponding to the reference character string pattern to the invention document acquired by the document acquisition unit. a first extracting unit for extracting a character string identical to the second character string as an important phrase when a second character string corresponding to the important phrase candidate character string pattern exists following the above; In the claim of the invention document obtained by, when there is a full stop character following the third character string corresponding to the above-mentioned key phrase candidate character string pattern, the same character string as the third character string is used as the key phrase. a second extracting unit for extracting, from the invention document acquired by the document acquiring unit, a fourth character string corresponding to the key phrase candidate character string pattern followed by a fifth character string corresponding to the code character string pattern; a third extracting unit for extracting a character string identical to the fourth character string as an important phrase if there is, and the invention document acquired by the document acquisition unit corresponds to the important phrase candidate character string pattern a fourth extraction unit for extracting a character string identical to the sixth character string as an important phrase when a seventh character string corresponding to the specific particle character string pattern exists subsequent to the sixth character string. In the extraction of the key words, the key word extracting unit is configured such that, when a plurality of character strings correspond to the key word candidate character string pattern, one character string among the plurality of character strings is replaced by another character. When the string is included in the description of the invention document, the remaining character string excluding the one character string from among the plurality of character strings is selected and extracted as an important phrase, and the output unit outputting patent application related information generated based on the analysis result of the analysis unit for the invention document acquired by the document acquisition unit, wherein the patent application related information is obtained from the invention document acquired by the document acquisition unit; Each of the plurality of key phrases extracted by the key phrase extracting unit is output as a display document containing content to be displayed, and the patent application related information is to be displayed in the display document. including claim information representing the content of the claim of the invention document acquired by the document acquisition unit, wherein the claim information representing the content of the claim of the invention document acquired by the document acquisition unit is obtained from the invention document by the key phrase For each of the plurality of key words in the claim extracted by the extracting unit, display control information for controlling the display mode of the key word is included, and the patent application related information should be displayed in the display document. , including specification information representing the content of the specification of the invention document acquired by the document acquisition unit, wherein the specification information representing the content of the specification of the invention document acquired by the document acquisition unit is the invention For each of a plurality of key phrases in the specification extracted from the document by the key phrase extraction unit, display control information for controlling a display mode of the key phrase is included, and in the claim information and the specification information, For each of the plurality of key phrases extracted by the key phrase extracting unit, the display control information for controlling the display mode of the key phrase corresponds to the display mode of the key phrase corresponding to the display control information. It includes highlighting information for differentiating the display mode of words other than the plurality of important words in the claim information and the description information, and among the important words expressed in the claim information, the character string that constitutes the important words is Each of the display control information for controlling a display mode corresponding to each of a plurality of key phrases different from each other is a mutually different display control information for controlling each of the plurality of key phrases to be displayed in a mutually different display mode. includes identification information that is the same as any one of the plurality of key phrases in which the character strings constituting the key phrase in the claim information are different from each other, among the key phrases represented in the specification information The display control information for controlling the display mode of the key phrase is to display the display element of the key phrase in a display mode that is at least partially the same as the display mode of the display element of the one key phrase in the claim information. It includes information for controlling display, and among the key words and phrases represented in the specification information, the character strings constituting the key words and phrases in the claim information are different from any of the plurality of key words and phrases. The display control information for controlling the display mode of the key phrase controls the display element of the key phrase to be displayed in a display mode different from any of the display elements of the plurality of key phrases in the claim information. It may include information for

これにより、例えば、翻訳者等(翻訳者、発明者等又は弁理士、或いは、その他の者)は、ブラウザ等により表示された表示用文書に係る特許出願関連情報のクレーム情報及び明細書情報において表示態様が制御された重要語句を識別することが可能となり得る。また、特許出願関連情報を閲覧した翻訳者等は、特許出願関連情報中の明細書情報において記載された各重要語句が、クレームに記載されている重要語句か否かを識別することが可能となり、複数の重要語句が同一か相違するかを、各重要語句の表示態様により、迅速に把握することが可能となり得る。なお、発明文書分析システムにおいて、重要語句の表示態様の制御として、例えば強調表示(例えば太字で表示する等)がなされたとすれば、翻訳者等は、クレーム情報における重要語句の迅速な把握が可能となり得る。なお、この発明文書分析システムにより生成される表示用文書(つまり特許出願関連情報を表示させるべきものとして含む表示用文書)は、マイクロプロセッサを備える機器にインストールされたブラウザ等により、解釈の対象とされ、その結果として、特許出願関連情報が表示されることになる。翻訳者等は、発明文書に基づいて生成された表示用文書における特許出願関連情報を閲覧することで、その発明文書を効率的に理解することが可能になる。 As a result, for example, translators (translators, inventors, patent attorneys, or others) can use the claim information and specification information of the patent application-related information related to the display document displayed by the browser, etc. It may be possible to identify key phrases whose presentation is controlled. In addition, translators, etc., who have browsed the patent application-related information can identify whether each key phrase described in the specification information in the patent application-related information is the key phrase described in the claim. , it may be possible to quickly grasp whether a plurality of key words are the same or different, depending on the display mode of each key word. In addition, in the invention document analysis system, if, for example, highlighting (for example, displaying in bold) is performed as a control of the display mode of the important words, the translator, etc. can quickly grasp the important words in the claim information. can be. The display document generated by this invention document analysis system (that is, the display document including patent application-related information to be displayed) can be interpreted by a browser or the like installed in a device equipped with a microprocessor. As a result, the patent application related information is displayed. A translator or the like can efficiently understand the invention document by browsing the patent application related information in the display document generated based on the invention document.

また、例えば、前記文書取得部により取得された発明文書のクレームの内容を表す前記クレーム情報が含む、前記重要語句抽出部により抽出された当該クレーム中の複数の重要語句各々についての、当該重要語句に係る前記表示制御情報は、当該重要語句に付加される表示色を示す情報を含み、前記文書取得部により取得された発明文書の明細書の内容を表す前記明細書情報が含む、前記重要語句抽出部により抽出された当該明細書中の複数の重要語句各々についての、当該重要語句に係る前記表示制御情報は、当該重要語句に付加される表示色を示す情報を含み、前記クレーム情報に表される重要語句のうち、重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る前記表示制御情報は、当該複数の重要語句各々の表示要素を、重要語句毎の前記識別情報に対応して、相違する表示色を付加した表示態様で表示するように制御するための情報を含み、前記明細書情報に表される重要語句のうち、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記クレーム情報における前記1つの重要語句の表示要素の表示態様として付加された表示色と同一の表示色を付加した表示態様で表示するように制御するための情報を含むこととしてもよい。 Also, for example, for each of a plurality of key words in the claim extracted by the key word extracting unit, the key word is included in the claim information representing the content of the claim of the invention document acquired by the document acquiring unit. includes information indicating a display color to be added to the key phrase, and the description information representing the content of the specification of the invention document acquired by the document acquisition unit includes the key phrase For each of the plurality of key words in the specification extracted by the extraction unit, the display control information related to the key word includes information indicating a display color to be added to the key word, and is displayed in the claim information. The display control information related to each of a plurality of key phrases having different character strings constituting the key phrase among the key phrases to be displayed is such that the display element of each of the plurality of key phrases is the identification information for each of the key phrases. Correspondingly, a character string that includes information for controlling display in a display mode to which a different display color is added, and that constitutes important phrases in the claim information among the important phrases represented in the specification information. The display control information related to the same important phrase as any one of the plurality of important phrases different from each other controls the display element of the important phrase to display the one important phrase in the claim information. It may include information for controlling to display in a display mode in which the same display color as the display color added as the display mode of the element is added.

これにより、例えばブラウザを搭載したPC、スマートフォンその他のコンピュータを用いて、翻訳者等は表示用文書としての特許出願関連情報を閲覧できる。ブラウザ等により表示された表示用文書としての特許出願関連情報を閲覧した翻訳者等は、特許出願関連情報中において重要語句に対して付加された表示色を識別することにより、ある重要語句がクレームに記載されている重要語句か否かを識別することが可能となり、複数の重要語句が同一であるのか相違するのであるのかを迅速に把握できる。 As a result, the translator or the like can view the patent application-related information as a display document using, for example, a PC equipped with a browser, a smartphone, or other computer. Translators, etc., who have viewed the patent application-related information as a display document displayed by a browser, etc., can identify the display color added to the key words in the patent application-related information, and recognize that a certain key word is a claim. It is possible to identify whether or not it is an important phrase described in , and it is possible to quickly grasp whether a plurality of important phrases are the same or different.

また、例えば、前記表示用文書は、前記特許出願関連情報を表示されるべき内容として含み、HTML(Hypertext Markup Language)で記載されたHTMLファイルを含むHTML文書であり、前記クレーム情報における、重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の文字列で構成される、前記クレーム情報における重要語句に係る表示制御情報は、当該重要語句を、前記1つの重要語句の表示態様として付加された表示色と同一の表示色を付加した表示態様で表示するように制御するためのものであり、前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る前記表示制御情報は、当該複数の重要語句各々を、重要語句毎に相違する表示色で所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであり、前記明細書情報における、複数の重要語句各々について、当該重要語句が、前記クレーム情報における前記複数の重要語句のうちのいずれか1つの重要語句と同一であれば、前記明細書情報における当該重要語句に係る前記表示制御情報は、当該重要語句を、前記クレーム情報における前記1つの重要語句の表示態様に係る左境界線の表示色と同一の表示色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであり、前記明細書情報における当該重要語句が、前記クレーム情報における当該複数の重要語句のいずれとも相違すれば、前記明細書情報における当該重要語句に係る前記表示制御情報は、当該重要語句を、前記所定幅を有する左境界線が付加されていない表示態様で表示するように制御するためのものであることとしてもよい。 Further, for example, the display document is an HTML document including an HTML file written in HTML (Hypertext Markup Language), which includes the patent application-related information as content to be displayed. The display control information related to the important phrase in the claim information, which is composed of the same character string as any one of the plurality of important phrases in which the character string constituting the , for controlling to display in a display mode in which the same display color as that added as the display mode of the one key phrase is added, and the character string constituting the key phrase in the complaint information The display control information related to each of a plurality of key phrases different from each other displays each of the plurality of key phrases in a display mode in which a left border line having a predetermined width is added in a display color that differs for each key phrase. For each of the plurality of key phrases in the specification information, if the key phrase is the same as any one of the plurality of key phrases in the claim information For example, the display control information related to the key phrase in the specification information displays the key phrase in the same display color as the display color of the left boundary line according to the display mode of the one key phrase in the claim information. It is for controlling to display in a display mode with a left border line having a predetermined width added, and if the key phrase in the description information is different from any of the plurality of key phrases in the claim information For example, the display control information related to the key phrase in the specification information is for controlling the key phrase to be displayed in a display mode in which the left border line having the predetermined width is not added. You can do it.

これにより、HTMLに対応しているブラウザを搭載したPC、スマートフォンその他のコンピュータを用いて、翻訳者等はHTML文書である表示用文書としての特許出願関連情報を閲覧できる。ブラウザ等により表示された表示用文書としての特許出願関連情報を閲覧した翻訳者等は、特許出願関連情報中においてクレーム情報に含まれる相違する重要語句同士を、その各重要語句に付加された左境界線の表示色を識別することで、迅速に区別できる。なお、相違する重要語句同士について、重要語句に付加された左境界線の表示色を相違させて表現する方法には、重要語句の文字色或いは文字背景色を相違させて表現する方法より、表示領域の背景色が暗い色(例えば黒)か明るい色(例えば白)かに拘わらず重要語句自体の判読性を低下させないという利点がある。またHTML文書で一部の表示要素に付加可能な左境界線は、文字ではないので、重要語句を含む記載の表示内容のテキストについてのコピー&ペースト等を行う場合に無視されるため、表示内容をテキストエディタ等へとコピー&ペーストして、重要語句を含む記載等を編集するような場合において、邪魔にならない。 As a result, a translator or the like can browse the patent application-related information as a display document, which is an HTML document, using a PC, smartphone, or other computer equipped with an HTML-compatible browser. Translators, etc., who have viewed the patent application-related information as a display document displayed by a browser, etc., can identify different key phrases included in the claim information in the patent application-related information, By distinguishing the display color of the boundary line, the distinction can be made quickly. It should be noted that the method of expressing different key phrases by using different display colors for the left boundary line added to the key phrases is more important than the method of expressing key phrases by using different character colors or character background colors. There is an advantage that the readability of the important phrase itself is not degraded regardless of whether the background color of the region is dark (eg black) or bright (eg white). In addition, the left border line that can be added to some display elements in HTML documents is not a character, so it is ignored when copying and pasting the text of the display content that includes important phrases. It does not get in the way when copying and pasting into a text editor etc. and editing descriptions including important phrases.

また、例えば、前記文書取得部により取得された発明文書のクレームの内容を表す前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句についての、当該重要語句の前記識別情報は、当該重要語句と同一の文字列で構成された重要語句が当該クレームに記載されていた最先の位置の昇順に定められた通番を示す情報を含み、前記クレーム情報における前記複数の重要語句各々に係る前記表示制御情報は、当該複数の重要語句各々について、重要語句毎の前記識別情報に係る前記通番が所定数以下である第1グループの複数の重要語句のうち、2つの重要語句の組各々における各重要語句に付加される表示色の差異の、当該組の全てでの最小値が、前記通番が所定数より大きい第2グループの複数の重要語句と当該第1グループの複数の重要語句とを混合した混合グループの複数の重要語句のうち、2つの重要語句の組各々における各重要語句に付加される表示色の差異の、当該組の全てでの最小値より大きくなるように、各重要語句に付加する表示色を制御するためのものであることとしてもよい。 Further, for example, the identification information of the key words and phrases with respect to a plurality of key words and phrases having different character strings constituting the key words and phrases in the claim information representing the content of the claim of the invention document acquired by the document acquisition unit. includes information indicating a serial number determined in ascending order of the earliest position in which a key phrase composed of the same character string as the key phrase was stated in the claim, and the plurality of key phrases in the claim information The display control information relating to each of the plurality of important phrases is, for each of the plurality of important phrases, two of the plurality of important phrases of the first group in which the serial number related to the identification information for each of the important phrases is equal to or less than a predetermined number. The minimum value of the difference in the display color added to each key phrase in each group in all the groups is the plurality of key phrases in the second group and the plurality of key phrases in the first group whose serial number is larger than a predetermined number. Among the plurality of important phrases in the mixed group in which the phrase is mixed, the difference in the display color added to each important phrase in each of the two important phrase pairs is greater than the minimum value in all of the pairs, It may be for controlling the display color added to each important phrase.

これにより、ブラウザ等により表示用文書としての特許出願関連情報におけるクレーム情報中の各重要語句が表示された場合に、クレーム情報を閲覧した翻訳者等にとって、クレーム情報中の各重要語句の迅速な識別が可能となり得る。重要語句の表示制御情報による重要語句の識別情報に係る通番(例えば発明文書のクレームにおける重要語句の初出行番号)に基づく表示色の調整は、クレーム情報の項番が比較的小さい項の記載部分(つまり比較的重要な部分)において配置された複数の重要語句間の表示色の差異を比較的大きくし得るので、その部分での重要語句間の識別性を向上させ得る。 As a result, when each key word in the claim information in the patent application-related information as a display document is displayed by a browser, etc., it is possible for translators, etc. who browsed the claim information to quickly identify each key word in the claim information. identification may be possible. Adjustment of the display color based on the serial number (for example, the number of the first appearance of the important word in the claim of the invention document) related to the identification information of the important word by the display control information of the important word is the description part of the claim information with a relatively small item number. Since the difference in display color between a plurality of important words and phrases arranged in (that is, a relatively important part) can be made relatively large, the distinguishability between important words and phrases in that part can be improved.

また、例えば、前記所定幅は、1文字分の幅であり、前記クレーム情報における、重要語句を構成する文字列が互いに相違する前記複数の重要語句について、当該重要語句に係る前記表示制御情報は、当該重要語句を、右境界線、上境界線及び下境界線が付加されていない表示態様で表示するように制御するためのものであり、前記表示色の差異は、表示色の色相成分の差異、又は、表示色を表すRGB値の各成分の差異であることとしてもよい。 Further, for example, the predetermined width is a width of one character, and for the plurality of key words having different character strings constituting the key words in the complaint information, the display control information related to the key words is , to control the important words and phrases to be displayed in a display mode in which a right boundary line, an upper boundary line and a lower boundary line are not added, and the difference in the display color is the hue component of the display color The difference may be the difference, or the difference in each component of the RGB values representing the display color.

これにより、重要語句に付加される境界線が左境界線だけの簡潔なものとなるので、重要語句の視認性が向上する。また、左境界線が1文字分の幅(例えば1emで表現される幅)であることは、クレーム情報における前記複数の重要語句各々の直前に1文字分の表示色で塗られた四角形が表示されることになり、1文字分の四角形は、文字列に混在しても、クレーム情報における各文字の配置を乱しにくいので、その各文字の視認性を妨げにくいという効果が生じる。なお、例えば、表示用文書におけるクレーム情報中の各文字の表示用のフォントとして等幅フォントを用いることとしている場合には、1文字分の四角形が文字列に混在した場合に各文字の配置を整列状態に保つことが可能となり得るし、クレーム情報中の各文字の表示用のフォントとして等幅ではないプロポーショナルフォントを用いることとしていても1文字分の四角形の幅は、比較的多くの文字の幅(特に比較的多くの漢字、平仮名、片仮名等の日本語の全角文字の幅)に対して大差ない等により、クレーム情報を目視した場合に各文字の配置を乱して視認性を大きく妨げるようなことはない。 As a result, the boundary line added to the key phrase is a simple left boundary line, so that the visibility of the key phrase is improved. In addition, since the left boundary line has a width of one character (for example, a width expressed in 1 em), a rectangle painted in a display color of one character is displayed immediately before each of the plurality of important phrases in the claim information. Therefore, even if a rectangle for one character is included in the character string, it is difficult to disturb the arrangement of each character in the complaint information, so there is an effect that the visibility of each character is less likely to be disturbed. For example, if a monospaced font is used as the font for displaying each character in the complaint information in the document for display, if a rectangle for one character is mixed in the character string, the arrangement of each character will be changed. It may be possible to keep them aligned, and even if a proportional font is used as the font for displaying each character in the claim information, the width of the rectangle for one character is enough for a relatively large number of characters. Due to the fact that there is not much difference in width (especially the width of Japanese full-width characters such as relatively many kanji, hiragana, katakana, etc.), when viewing the complaint information, the arrangement of each character is disturbed and visibility is greatly hindered. There is no such thing.

また、例えば、前記特許出願関連情報は、前記クレーム情報の各行を包含して、包含した前記クレーム情報の一行毎又は一項毎に、当該一行又は当該一項の内容の直後に、当該一行又は当該一項に含まれる重要語句を当該重要語句に対応する対応翻訳語に置換した結果を含む翻訳行を挿入したクレーム翻訳情報を含み、前記特許出願関連情報は、前記明細書情報の各行を包含して、包含した前記明細書情報の一行毎に、当該一行の内容の直後に、当該一行に含まれる重要語句を当該重要語句に対応する対応翻訳語に置換した結果を含む翻訳行を挿入した明細書翻訳情報を含み、前記クレーム翻訳情報及び前記明細書翻訳情報は、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句各々と同一の重要語句に対応する対応翻訳語について、当該重要語句に対応する対応翻訳語の表示態様を制御するための表示制御情報を含み、前記クレーム翻訳情報及び前記明細書翻訳情報における前記重要語句に対応する前記対応翻訳語に係る前記表示制御情報は、当該対応翻訳語を、当該重要語句に付加された表示色と同色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであることとしてもよい。 Further, for example, the patent application related information includes each line of the claim information, and for each line or item of the included claim information, immediately after the content of the line or item, the line or It includes claim translation information in which a translation line containing the result of replacing key words included in the item with corresponding translated words corresponding to the key words is inserted, and the patent application related information includes each line of the specification information. Then, for each line of the included specification information, immediately after the content of the line, a translation line containing the result of replacing the key phrase contained in the line with the corresponding translated word corresponding to the key phrase was inserted. Description translation information is included, and the claim translation information and the description translation information are corresponding translations corresponding to the same important phrases as each of the plurality of important phrases in which the character strings constituting the important phrases in the claim information are different from each other. for the word, including display control information for controlling the display mode of the corresponding translated word corresponding to the relevant important word, and relating to the corresponding translated word corresponding to the important word in the claim translation information and the specification translation information; The display control information is for controlling the corresponding translated word to be displayed in a display mode in which a left boundary line having the predetermined width is added in the same color as the display color added to the key phrase. may be

これにより、例えば、ブラウザ等により表示された表示用文書に係る特許出願関連情報のクレーム翻訳情報及び明細書翻訳情報を閲覧した翻訳者等は、重要語句、及び、対応翻訳語に対して付加された左境界線の表示色を識別することにより、ある対応翻訳語が、クレームに記載されているどの重要語句に対応するのかを迅速に把握することが可能となる。 As a result, for example, a translator or the like who browses the claim translation information and the specification translation information of the patent application-related information related to the display document displayed by a browser or the like can By identifying the display color of the left boundary line, it is possible to quickly grasp which important phrase described in the claim corresponds to a corresponding translated word.

また、例えば、前記特許出願関連情報は、前記クレーム情報の内容に含まれる重要語句を当該重要語句に対応する対応翻訳語に置換した結果を表すクレーム翻訳情報を含み、前記特許出願関連情報は、前記明細書情報の内容に含まれる重要語句を当該重要語句に対応する対応翻訳語に置換した結果を表す明細書翻訳情報を含み、前記クレーム翻訳情報及び前記明細書翻訳情報は、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句各々と同一の重要語句に対応する対応翻訳語について、当該重要語句に対応する対応翻訳語の表示態様を制御するための表示制御情報を含み、前記クレーム翻訳情報及び前記明細書翻訳情報における前記重要語句に対応する前記対応翻訳語に係る前記表示制御情報は、当該対応翻訳語を、当該重要語句に付加された表示色と同色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであることとしてもよい。 Further, for example, the patent application-related information includes claim translation information representing a result of replacing a key phrase included in the content of the claim information with a corresponding translated word corresponding to the key phrase, and the patent application-related information includes: Includes specification translation information representing the result of replacing key phrases contained in the content of the specification information with corresponding translated words corresponding to the key phrases, and the claim translation information and the specification translation information are in the claim information display control information for controlling the display mode of the corresponding translated word corresponding to the same important phrase as each of the plurality of important phrases having different character strings constituting the important phrase; and the display control information related to the corresponding translated word corresponding to the key phrase in the claim translation information and the specification translation information displays the corresponding translated word in the same color as the display color added to the key phrase It may be for controlling to display in a display mode in which the left boundary line having the predetermined width is added.

これにより、例えば、ブラウザ等により表示された表示用文書に係る特許出願関連情報のクレーム情報、クレーム翻訳情報及び明細書翻訳情報を閲覧した翻訳者等は、クレーム情報の重要語句、及び、対応翻訳語に対して付加された左境界線の表示色を識別することにより、クレーム翻訳情報及び明細書翻訳情報における、ある対応翻訳語が、クレーム情報中のどの重要語句に対応するのかを迅速に把握することが可能となる。 As a result, for example, a translator who browses the claim information, the claim translation information, and the description translation information of the display document related to the display document displayed by a browser, etc., will be able to understand the important words and phrases of the claim information and the corresponding translation. By identifying the display color of the left boundary line added to the word, it is possible to quickly grasp which important word in the claim information corresponds to a corresponding translated word in the claim translation information and the specification translation information. It becomes possible to

また、例えば、前記設定情報は、抽出対象とすべき重要語句を列挙した重要語句設定辞書の特定用情報を含み、前記重要語句設定辞書では、列挙されている重要語句の少なくとも一部に対して対応翻訳語が対応付けられており、前記発明文書分析システムは、前記設定情報に基づいて前記重要語句設定辞書を取得する重要語句設定辞書取得部を含み、前記重要語句抽出部は、前記重要語句設定辞書に列挙されている重要語句が前記文書取得部により取得された発明文書に含まれている場合には、当該発明文書から当該重要語句を抽出し、前記クレーム情報又は前記明細書情報における重要語句が、前記重要語句設定辞書で対応翻訳語が対応付けられている重要語句である場合には、前記クレーム翻訳情報又は前記明細書翻訳情報における当該重要語句の対応翻訳語として、前記重要語句設定辞書で当該重要語句に対応付けられている対応翻訳語が用いられることとしてもよい。 Further, for example, the setting information includes information for specifying an important phrase setting dictionary that lists important phrases to be extracted, and in the important phrase setting dictionary, for at least some of the listed important phrases, Corresponding translation words are associated, the invention document analysis system includes an important phrase setting dictionary acquisition unit that acquires the important phrase setting dictionary based on the setting information, and the important phrase extraction unit extracts the important phrase When the key words listed in the setting dictionary are included in the invention document acquired by the document acquisition unit, the key words are extracted from the invention document, and the key words in the claim information or the specification information are extracted. If the phrase is an important phrase associated with a corresponding translated word in the important phrase setting dictionary, the important phrase setting is used as the corresponding translated word for the relevant important phrase in the complaint translation information or the specification translation information. A corresponding translated word associated with the key phrase in the dictionary may be used.

これにより、例えば、発明文書を作成した発明者等又は弁理士は、特定の語句を重要語句として定めておきたい場合、少なくとも一部の重要語句についての対応翻訳語を定めておきたい場合等に、重要語句設定辞書を生成しておくことで、発明文書分析システムにより、適切な特許出願関連情報が出力されるようになり得る。このため、翻訳者は、その特許出願関連情報を参考にして発明文書の翻訳を、効率的に又は適正に行うことが可能となり得る。また、翻訳者が、重要語句について対応翻訳語を定めている場合等において重要語句設定辞書を生成しておくことで、発明者等又は弁理士から提供された発明文書を、発明文書分析システムで分析させた場合に、適切な特許出願関連情報が出力されるようになり得る。 As a result, for example, when an inventor, etc. or a patent attorney who created an invention document wants to define specific words as important words, or when he wants to define corresponding translations for at least some of the important words, , by generating an important phrase setting dictionary in advance, the invention document analysis system can output appropriate patent application related information. Therefore, the translator may be able to translate the invention document efficiently or properly by referring to the patent application-related information. In addition, by creating a key phrase setting dictionary in cases such as when the translator has defined corresponding translation words for key phrases, invention documents provided by inventors or patent attorneys can be processed by the invention document analysis system. Appropriate patent application-related information can be output when analyzed.

また、例えば、前記文書取得部により取得された発明文書について生成された前記特許出願関連情報に係る前記表示用文書における、当該発明文書から前記重要語句抽出部により抽出された重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、操作に応じて、ネットワーク上の検索サイトで、当該重要語句を含むウェブページ、当該重要語句の定義、当該重要語句の類義語、若しくは、当該重要語句の関連画像を検索する処理、又は、ネットワーク上の翻訳サイトで当該重要語句を翻訳させる処理を、実行するグラフィカルユーザインタフェース(GUI)として機能させるものであることとしてもよい。 Further, for example, in the display document related to the patent application-related information generated for the invention document acquired by the document acquisition unit, the display related to the key phrase extracted from the invention document by the key phrase extraction unit The control information is to display the display elements of the relevant important phrases on a search site on the network according to the operation, such as a web page containing the relevant important phrases, a definition of the relevant important phrases, a synonym of the relevant important phrases, or a synonym of the relevant important phrases. It may function as a graphical user interface (GUI) that executes a process of searching for related images or a process of translating the relevant key words on a translation site on the network.

これにより、ブラウザ等により表示された表示用文書に係る特許出願関連情報を閲覧した翻訳者等は、表示された特許出願関連情報中の重要語句に対する操作(つまり重要語句の表示要素に対する操作)により、その重要語句の検索結果(例えば重要語句を含むウェブページ、重要語句の定義、類義語、関連画像)、重要語句の翻訳結果等の情報を知得することが可能となり得るので、発明文書における重要語句について効率的に又は適正に理解することが可能となり得る。このため、翻訳者は、重要語句に対する翻訳語句を効率的に又は適正に決定することが可能となり得る。 As a result, translators, etc., who have browsed the patent application-related information related to the display document displayed by a browser, etc., can operate the key phrases in the displayed patent application-related information (i.e., operate the display elements of the key phrases) to , the search results of the key words (e.g. web pages containing key words, definitions of key words, synonyms, related images), translation results of key words, etc. can be obtained. It may be possible to efficiently or properly understand about This may allow the translator to efficiently or properly determine translation terms for key terms.

また、例えば、前記文書取得部により取得された発明文書について生成された前記特許出願関連情報に係る前記表示用文書における、当該発明文書から前記重要語句抽出部により抽出された重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、操作に応じて、当該重要語句の属性情報の少なくとも一部の表示、又は、当該重要語句の属性情報に基づいて決定された当該重要語句の重要度の表示のためのGUIとして機能させるものであり、発明文書から抽出された重要語句の前記属性情報は、当該発明文書のクレーム中で当該重要語句を定義しているクレームの項が存在する場合に当該項の項番を示す情報と、当該発明文書のクレーム中で当該重要語句を参照しているクレームの項が存在する場合に当該項の項番を示す情報と、当該発明文書中において当該重要語句に符号が付加された記載が存在する場合に当該符号を示す情報と、当該発明文書中において当該重要語句が主語として使用された記載が存在するか否かを識別する情報とを含むこととしてもよい。 Further, for example, in the display document related to the patent application-related information generated for the invention document acquired by the document acquisition unit, the display related to the key phrase extracted from the invention document by the key phrase extraction unit The control information displays at least a part of the attribute information of the key phrase, or the importance of the key phrase determined based on the attribute information of the key phrase, depending on the operation of the display element of the key phrase. , and the attribute information of the key words extracted from the invention document, if there is a claim section defining the key words in the claim of the invention document Information indicating the paragraph number of the relevant paragraph, information indicating the paragraph number of the relevant paragraph if there is a claim paragraph that refers to the relevant important phrase in the claim of the invention document, and information indicating the relevant paragraph number in the invention document If there is a description with a code added to the words, information indicating the code, and information identifying whether or not there is a description in which the key word is used as a subject in the invention document. good too.

これにより、ブラウザ等により表示された表示用文書に係る特許出願関連情報を閲覧した翻訳者等は、表示された重要語句に対する操作により、その重要語句の重要度又は属性情報の情報を知得することが可能となり得るので、発明文書におけるどの重要語句が重要であるかを、ある程度、認識可能となり、重要語句について効率的に又は適正に理解することが可能となり得る。このため、翻訳者は、重要な重要語句についての翻訳語句の決定を優先的に実行する等により、効率的な翻訳が可能となり得る。 As a result, a translator or the like who browses the patent application-related information related to the document for display displayed by a browser or the like can obtain information on the importance or attribute information of the key phrase by operating the displayed key phrase. to some extent, it may be possible to recognize which key words in an invention document are important, and to efficiently or properly understand the key words. For this reason, the translator can perform efficient translation by preferentially determining translation terms for important key terms.

また、例えば、前記文書取得部により取得された発明文書について生成された前記特許出願関連情報に係る前記表示用文書における、当該発明文書から前記重要語句抽出部により抽出された重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、操作に応じて、前記クレーム情報及び前記明細書情報から当該重要語句を含む行を列挙して表示する重要語句包含記載列挙処理を実行するためのGUIとして機能させるものであり、前記重要語句包含記載列挙処理は、操作対象となった重要語句を含む行を前記クレーム情報及び前記明細書情報から列挙して表示し、当該列挙して表示した各行における当該重要語句については強調表示を行い、表示した行には、当該行に対する操作に応じて、前記クレーム情報又は前記明細書情報における当該行を含む複数行へのリンク表示のためのGUIとして当該行を機能させるための表示制御情報を付加する処理であることとしてもよい。 Further, for example, in the display document related to the patent application-related information generated for the invention document acquired by the document acquisition unit, the display related to the key phrase extracted from the invention document by the key phrase extraction unit The control information is a GUI for executing an important phrase inclusion description listing process for listing and displaying lines containing the relevant important phrase from the claim information and the specification information in accordance with the operation of the display element of the relevant important phrase. In the above-mentioned key phrase inclusion description listing process, the lines containing the key phrases to be operated are listed from the claim information and the specification information and displayed, and in each line that is listed and displayed The important phrase is highlighted, and the displayed line is displayed as a GUI for displaying links to multiple lines including the line in the claim information or the description information according to the operation on the line. may be a process of adding display control information for functioning.

これにより、ブラウザ等により表示された表示用文書に係る特許出願関連情報を閲覧した翻訳者等は、表示された特許出願関連情報中の重要語句に対する操作により、重要語句包含記載列挙処理の結果として列挙表示される、クレーム情報及び明細書情報におけるその重要語句を含む行を確認することができる。このため、翻訳者等は、発明文書における重要語句について効率的に又は適正に理解することが可能となり得る。また、このため、翻訳者は、重要語句に対する翻訳語句を効率的に又は適正に決定することが可能となり得る。また、翻訳者等は、操作した重要語句を含むことで重要語句包含記載列挙処理により列挙された行におけるその重要語句が強調表示されるので、その重要語句を的確に識別できる。また、翻訳者等は、操作した重要語句を含むことで重要語句包含記載列挙処理により列挙された行のうちの1つの行に対して更に操作することで、更に表示されることになる、その1つの行に前後する、クレーム情報、明細書情報又は別の発明文書における複数行を、容易に確認可能となる。 As a result, translators, etc., who have viewed the patent application-related information related to the display document displayed by a browser, etc., can operate the key phrases in the displayed patent application-related information, and as a result of listing the key phrase inclusion description processing, You can see the lines containing that key phrase in the claim information and specification information that are listed. Therefore, it may be possible for translators, etc., to efficiently or properly understand the important terms in the invention document. This may also allow the translator to efficiently or properly determine translation terms for key terms. In addition, by including the manipulated important phrase, the important phrase in the line listed by the important phrase inclusion description enumeration process is highlighted, so that the translator can accurately identify the important phrase. In addition, the translator or the like further operates one of the lines listed by the key phrase inclusion description enumeration process by including the operated key phrase, so that it is further displayed. Multiple lines of claim information, specification information, or other invention documents that precede or follow a single line can be readily identified.

また、例えば、前記特許出願関連情報は、発明文書から前記重要語句抽出部により抽出された重要語句毎に行を改めて重要語句を列挙した重要語句リストを含み、前記重要語句リストの各行は所定の順序で並べられ、当該順序は、行毎の重要語句について決定された重要度の高い順、行毎の重要語句について文字コード順でのソート結果に従った順、行毎の重要語句についての発明文書における使用数の多い順、又は、行毎の重要語句についての発明文書のクレームにおける使用数の多い順であることとしてもよい。 Further, for example, the patent application-related information includes an important phrase list in which important phrases are listed on a new line for each important phrase extracted from the invention document by the important phrase extraction unit, and each line of the important phrase list has a predetermined Arranged in order, the order is the order of importance determined for the important phrases for each line, the order according to the sort result of the character code order for the important phrases for each line, and the invention about the important phrases for each line It may be in order of frequency of use in the document, or in order of frequency of use in the claim of the invention document for each line of key words.

これにより、翻訳者は、特許出願関連情報における重要語句リストを確認することで、発明文書に含まれる重要語句を迅速に把握でき、例えば、重要語句リストに列挙された重要語句の翻訳語句を決定してから発明文書全体の翻訳に入ることで、効率的な翻訳が可能となり得る。また、重要度の高い順、発明文書における使用数の多い順、或いは、クレームにおける使用数の多い順に、重要語句が並べられた重要語句リストを閲覧した翻訳者にとっては、重要語句が並べられた順に、各重要語句についての翻訳語句の決定を行うことで、効率的な翻訳が可能となり得る。また、文字コード順でのソート結果に従った順に重要語句が並べられた重要語句リストを閲覧した翻訳者等にとっては、重要語句リストにおいて連続して並ぶ、語尾のみが相違する複数の重要語句(例えば「一時記録フォルダ」と「一時記録フォルダー」、或いは、「外部記憶装置」と「外部記憶送致」)を対比することで、重要語句の語尾に係る誤記の検出を迅速に行うことが可能となり得る。また、発明者等、弁理士、或いは、翻訳者は、発明文書分析システムに一旦発明文書を分析させた結果として出力される特許出願関連情報における重要語句リストを、編集することで、発明文書から適切に重要語句を抽出するために用いられ得る重要語句設定辞書の生成、更新等を効率的に行うことが可能となり得る。 By checking the list of important words in the patent application-related information, the translator can quickly grasp the important words contained in the invention document. Efficient translation can be achieved by starting the translation of the entire invention document after In addition, for translators who browsed a list of important words and phrases arranged in order of importance, number of uses in invention documents, or number of uses in claims, the important words were arranged. Efficient translation may be possible by determining translation terms for each key term in turn. In addition, for translators who view the list of important words and phrases arranged in the order according to the character code order, multiple important words and phrases ( For example, by comparing "temporary recording folder" and "temporary recording folder", or "external storage device" and "external storage transmission"), it is possible to quickly detect typos related to the ending of important phrases. obtain. In addition, the inventor, etc., patent attorney, or translator can edit the list of important words in the patent application-related information that is output as a result of having the invention document analysis system once analyze the invention document. It may be possible to efficiently generate, update, etc. an important phrase setting dictionary that can be used to appropriately extract important phrases.

また、例えば、前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る前記表示制御情報は、当該複数の重要語句各々を、重要語句毎に相違する表示色で所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであり、前記重要語句リストにおける各重要語句について、当該重要語句が、前記クレーム情報における前記複数の重要語句のうちのいずれか1つの重要語句と同一であれば、前記重要語句リストにおける当該重要語句には、当該重要語句を、前記クレーム情報における前記1つの重要語句の表示態様に係る左境界線の表示色と同一の表示色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御する表示制御情報が付加されることとしてもよい。 Further, for example, the display control information related to each of a plurality of key phrases having different character strings constituting the key phrase in the complaint information may display each of the plurality of key phrases in a different display color for each key phrase. It is for controlling to display in a display mode in which a left border line having a predetermined width is added, and for each important phrase in the important phrase list, the relevant important phrase is the plurality of important phrases in the claim information. If it is the same as any one of the key phrases, the key phrase in the key phrase list is displayed with a left border line according to the display mode of the one key phrase in the claim information. Display control information may be added for controlling display in a display mode in which the left boundary line having the predetermined width is added in the same display color as the color.

これにより、表示用文書としての特許出願関連情報を閲覧した翻訳者等は、重要語句リストにおける各重要語句のうち、クレーム情報において記載されている重要語句を区別可能となり、また、クレーム情報において記載されている各重要語句と対応する、重要語句リストにおける重要語句を迅速に識別可能となり得る。 As a result, translators, etc., who have browsed the patent application-related information as a display document can distinguish the key words and phrases described in the claim information among the key words and phrases in the key word list. It may be possible to quickly identify key phrases in the key phrase list that correspond to each key phrase being viewed.

また、例えば、前記分析部は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された1つ以上の重要語句について、当該重要語句についての対応翻訳語の候補の集合である翻訳語候補集合を特定するための翻訳語候補集合特定部を含み、前記重要語句リストの各行は、1つの重要語句と、当該重要語句に対応する対応翻訳語又は翻訳語候補集合とを含むこととしてもよい。 Further, for example, the analysis unit obtains a set of corresponding translation word candidates for one or more key phrases extracted by the key phrase extraction unit from the invention document acquired by the document acquisition unit. A translation word candidate set specifying unit for specifying a certain translation word candidate set, wherein each line of the important word list includes one important word and a corresponding translation word or a translation word candidate set corresponding to the important word/phrase You can do it.

これにより、発明文書分析システムにより出力される特許出願関連情報の重要語句リストに含まれる重要語句に対応する翻訳語候補集合又は対応翻訳語を参照することで、翻訳者は、例えば重要語句に対応する翻訳語候補集合から1つの翻訳語句を選択する等により、重要語句に対応する翻訳語句を効率的に又は適正に決定することが可能となり得る。 As a result, by referring to a translation word candidate set or a corresponding translation word corresponding to the key words included in the key word list of the patent application related information output by the invention document analysis system, the translator can, for example, correspond to the key words. It may be possible to efficiently or properly determine a translation word corresponding to an important word by selecting one translation word from a set of candidate translation words.

また、例えば、前記重要語句リスト中の、重要語句と、当該重要語句に対応する翻訳語候補集合とを含む行において、当該翻訳語候補集合の要素数が複数である場合には、当該翻訳語候補集合の複数の要素は、当該重要語句の翻訳語句として妥当な度合いの評価値を示す妥当性の高い順に並べて記載され、前記重要語句リストに含まれる、複数の要素を含む翻訳語候補集合に対応する表示要素には、当該翻訳語候補集合の各要素を選択可能に表示して選択された要素を対応翻訳語として決定し、当該翻訳語候補集合の表示要素の内容を、決定した当該対応翻訳語に置換して表示する処理と、当該重要語句と当該対応翻訳語とを対応付けた情報である翻訳補助情報を生成して出力する処理とを実行するGUIとしての機能を持たせるための表示制御情報が付加され、前記分析部は、前記発明文書分析システムにより、過去に出力された複数の翻訳補助情報を収集統合して生成されたデータに基づく予め定められた演算処理で前記翻訳語候補集合の要素に係る前記妥当性を算定する機能を有することとしてもよい。 Further, for example, in a row containing an important phrase and a translation word candidate set corresponding to the important phrase in the important phrase list, if the number of elements of the translation word candidate set is plural, the translation word A plurality of elements of the candidate set are listed in descending order of relevance indicating the evaluation value of the degree of relevance as a translation of the key phrase, and are included in the key phrase list, and are included in the translation word candidate set including the plurality of elements. In the corresponding display element, each element of the candidate translation set is displayed in a selectable manner, the selected element is determined as the corresponding translation word, and the content of the display element of the candidate translation word set is displayed as the determined correspondence To have a function as a GUI for executing a process of replacing with a translated word and displaying it, and a process of generating and outputting translation assistance information, which is information in which the important word and the corresponding translated word are associated with each other. Display control information is added, and the analysis unit extracts the translation word by predetermined arithmetic processing based on data generated by collecting and integrating a plurality of translation assistance information output in the past by the invention document analysis system. It may have a function of calculating the validity of the elements of the candidate set.

これにより、重要語句リストに含まれる重要語句に対応した、妥当性の高い順に要素を含む翻訳語候補集合を参照することで、翻訳者は、重要語句に対応する翻訳語句を効率的に又は適正に決定することが可能となり得る。また、その重要語句リストを閲覧する翻訳者、その翻訳者に関係ある者(例えばその翻訳者と同じ部署、グループ等に所属する他の翻訳者)等により、過去に、翻訳語候補集合から選択された結果に基づいて、重要語句に対応する翻訳語候補集合の要素に係る妥当性が算定され得るように発明文書分析システムを運用することは比較的容易なので、その妥当性を高く保つことが比較的容易に実現できる。 As a result, by referring to the translation word candidate set containing the elements in descending order of relevance corresponding to the important words included in the important word list, the translator can efficiently or properly translate the translation words corresponding to the important words. It may be possible to determine Also, in the past, a translator viewing the important word list, a person related to the translator (for example, other translators belonging to the same department or group as the translator), etc. selected from the translation word candidate set Since it is relatively easy to operate the invention document analysis system so as to calculate the validity of the elements of the translation word candidate set corresponding to the key phrase based on the results obtained, it is possible to maintain the validity at a high level. It can be realized relatively easily.

また、例えば、前記分析部は、前記文書取得部により取得された発明文書に基づいて警告情報を生成する警告情報生成部を含み、前記特許出願関連情報は、前記警告情報を含み、前記警告情報生成部は、前記文書取得部により取得された発明文書中に、同一の符号の直前には同一の要素名が記載されるという条件を満たしていない記載が含まれていることを検出した場合には、当該同一の符号と、当該符号が付加された複数の相違する表現の要素名とを示す指摘情報を、前記警告情報に含ませ、前記文書取得部により取得された発明文書の明細書中に、始め丸括弧と終わり丸括弧とで挟まれた括弧付き記載がある場合において、当該括弧付き記載と、当該括弧付き記載の直前の文字列の記載との関係が明確であるという条件を満たしていない括弧付き記載が含まれていることを検出したときには、括弧付き記載の意義が明確ではない旨と、発明文書の明細書における当該括弧付き記載の位置とを示す指摘情報を、前記警告情報に含ませ、前記文書取得部により取得された発明文書のクレームのいずれかの項に、参照文字列に後続して語句が記載されている場合にその語句と同一の被参照語句が、当該項の当該参照文字列に先行した部分に記載されている必要がある、又は、引用連鎖を踏まえて当該項が引用した項内に記載されている必要があるという条件を満たしていない参照文字列に係る記載が含まれていることを検出した場合には、先行した被参照語句の記載が存在しない旨と、当該検出した参照文字列に係る記載を含んでいる項の項番と、当該参照文字列に係る記載の内容とを示す指摘情報を、前記警告情報に含ませ、所定の下位概念語句リストを用いることで、前記文書取得部により取得された発明文書のクレームのうち、他の項を引用していない項である独立項について、下位概念を示す語句を用いないという条件を、満たしていない記載が含まれていることを検出した場合には、当該独立項の項番と、当該語句と、下位概念を示す語句が用いられている旨とを示す指摘情報を、前記警告情報に含ませ、前記文書取得部により取得された発明文書のクレームから前記重要語句抽出部により抽出された重要語句は明細書中に記載されているという条件を当該発明文書の明細書の記載が満たしていないことを検出した場合には、当該重要語句と、重要語句が明細書に記載されていない旨とを示す指摘情報を、前記警告情報に含ませ、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された2つの重要語句同士が、当該重要語句同士のうち一方の重要語句を構成するいずれかの、所定文字数分の文字を削除した場合に、当該削除後の当該一方の重要語句と、当該重要語句同士のうちの他方の重要語句とが同一となるという関係を有する場合に、当該2つの重要語句と、当該2つの重要語句の一方に誤記の可能性がある旨とを示す指摘情報を、前記警告情報に含ませ、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された2つの重要語句同士が、当該重要語句同士のうち一方の重要語句を構成する半角文字を全角文字に変換した場合に、当該変換後の当該一方の重要語句と、当該重要語句同士のうちの他方の重要語句とが同一となるという関係を有する場合に、当該2つの重要語句と、当該2つの重要語句の表記が形式的に不統一である旨とを示す指摘情報を、前記警告情報に含ませることとしてもよい。 Further, for example, the analysis unit includes a warning information generation unit that generates warning information based on the invention document acquired by the document acquisition unit, the patent application related information includes the warning information, and the warning information When the generation unit detects that the invention document acquired by the document acquisition unit includes a description that does not satisfy the condition that the same element name is described immediately before the same code, In the description of the invention document acquired by the document acquisition unit, the warning information includes indication information indicating the same code and the element names of a plurality of different expressions to which the code is added. , where there is a parenthesized statement sandwiched between the opening and closing parentheses, the relationship between the parenthesized statement and the character string statement immediately preceding the parenthesized statement is clear. When it is detected that a bracketed statement that is not included is included, indication information indicating that the meaning of the bracketed statement is not clear and the position of the parenthetical statement in the specification of the invention document is added to the warning information. , and if a word or phrase is described after the reference character string in any of the claims of the invention document acquired by the document acquisition unit, the referenced word or phrase that is the same as that word or phrase is to the reference string that does not meet the requirement that it must appear in the part preceding the reference string in the If it is detected that such a description is included, the fact that there is no description of the preceding referenced phrase, the section number of the section containing the description related to the detected reference character string, and the reference character By including in the warning information indication information indicating the content of the description related to the column and using a predetermined narrower concept phrase list, other items among the claims of the invention document acquired by the document acquisition unit are identified. If it is detected that an independent claim, which is a clause that is not cited, contains a statement that does not satisfy the condition of not using a word or phrase indicating a more specific concept, the number of the independent claim and the word or phrase and that a word indicating a subordinate concept is used is included in the warning information, and the important word extracted by the important word extraction unit from the claim of the invention document acquired by the document acquisition unit If it is detected that the description of the description of the invention document does not satisfy the condition that the words and phrases are described in the specification, the relevant key words and phrases and the fact that the key words and phrases are not described in the description is included in the warning information, and the two important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit are one of the important phrases When a predetermined number of characters are deleted from any of the Then, the two key phrases and indication information indicating that one of the two key phrases may be erroneously written are included in the warning information, and the invention document acquired by the document acquisition unit is extracted from the invention document. When two key phrases extracted by the key phrase extraction unit are converted from half-width characters constituting one of the key phrases to full-width characters, the one key phrase after the conversion; Pointing out that the notation of the two key words and the two key words is formally inconsistent when there is a relationship in which the other key words and phrases of the two key words and phrases are the same. Information may be included in the warning information.

これにより、発明文書分析システムにより出力された特許出願関連情報における警告情報(例えば警告情報中の指摘情報等)を参考にすることにより、発明文書を作成した発明者等又は弁理士は、必要であれば発明文書の修正を行い得る。また、翻訳者は、例えば、発明者等又は弁理士から、翻訳対象となる発明文書及び特許出願関連情報の提供を受けることにより、特許出願関連情報中の警告情報での指摘が残っていてもその指摘は特に対処の必要がないと発明者等又は弁理士が判断した結果であると推定できるので、翻訳対象となる適切な発明文書を取得することができ、この結果として、発明文書の翻訳を効率的に又は適正に行うことが可能となり得る。 As a result, by referring to the warning information in the patent application-related information output by the invention document analysis system (for example, information pointed out in the warning information, etc.), the inventor, etc. or patent attorney who created the invention document can Modifications to the invention document, if any, can be made. In addition, the translator, for example, receives invention documents to be translated and patent application-related information from the inventors, etc. or patent attorneys, so that even if the warning information in the patent application-related information remains pointed out, Since it can be presumed that the inventor, etc. or the patent attorney determined that there is no particular need to deal with the indication, it is possible to obtain an appropriate invention document to be translated, and as a result, the translation of the invention document can be performed efficiently or properly.

また、例えば、前記警告情報生成部は、前記表示用文書としての前記特許出願関連情報に含まれる前記警告情報における少なくとも1つの前記指摘情報の表示要素に、当該指摘情報の指摘に該当する前記クレーム情報又は前記明細書情報における記載箇所へのリンク表示のためのGUIとして当該表示要素を機能させるための表示制御情報を付加することとしてもよい。 Further, for example, the warning information generation unit may add the claim corresponding to the indication of the indication information to at least one display element of the indication information in the warning information included in the patent application related information as the display document. It is also possible to add display control information for causing the display element to function as a GUI for displaying links to the information or description locations in the specification information.

これにより、ブラウザ等により表示された表示用文書に係る特許出願関連情報の警告情報を閲覧した発明者等又は弁理士は、表示された警告情報中の指摘情報に対する操作により、その指摘情報の指摘に該当するクレーム情報中又は明細書情報中の記載箇所を確認することが可能となり得るので、必要に応じて発明文書を適切に修正し得る。 As a result, the inventor, etc. or the patent attorney who browses the warning information of the patent application-related information related to the display document displayed by a browser or the like can operate the indicated information in the displayed warning information to point out the indicated information. It will be possible to confirm the description in the claim information or specification information that corresponds to the above, so that the invention document can be appropriately corrected as necessary.

また、例えば、前記特許出願関連情報は、前記文書取得部により取得された発明文書の明細書における見出しの記載を含む行を、当該明細書における記載順に列挙した明細書見出しリストを含み、前記発明文書分析システムは、前記発明文書の前記明細書における各行のうち、行頭の位置に、又は、行頭の1つ以上の空白文字に後続した位置に、予め定められた1種類以上の括弧(例えば隅付き括弧、山括弧、丸括弧等)のいずれかに係る始め括弧と終わり括弧とで挟まれた記載を含む行を、無条件で、又は、行末に句点文字「。」がないことを条件として、前記見出しの記載を含む行として扱うこととしてもよい。
これにより、特許出願関連情報における明細書見出しリストを閲覧した翻訳者等は、発明文書の明細書に記載されていることの概要を知得し得る。また、発明者等又は弁理士は、明細書見出しリストを閲覧することで、発明文書の明細書における各見出しの記載が妥当であるか否かを迅速に確認することが可能となる。例えば、発明文書分析システムに出力された特許出願関連情報中の明細書見出しリストにおいて、連続した2行として「(第1実施形態)」、「(第3実施形態)」という記載が含まれていれば、発明文書分析システムにおける分析の対象となった発明文書の明細書において「(第2実施形態)」という見出しが欠落していることを把握することができる。
Further, for example, the patent application-related information includes a description heading list in which lines containing heading descriptions in the description of the invention document acquired by the document acquisition unit are listed in the order of description in the description, and the invention The document analysis system inserts one or more types of predetermined brackets (for example, corner Parentheses, angle brackets, round brackets, etc.), unconditionally, or on the condition that there is no period character "." at the end of the line , may be treated as a line including the description of the heading.
As a result, a translator or the like who browses the specification heading list in the patent application-related information can get an overview of what is described in the specification of the invention document. In addition, the inventors, etc. or the patent attorney can quickly confirm whether or not the description of each heading in the specification of the invention document is appropriate by browsing the description heading list. For example, in the specification heading list in the patent application related information output to the invention document analysis system, the descriptions "(first embodiment)" and "(third embodiment)" are included as two consecutive lines. , it can be understood that the heading "(Second Embodiment)" is missing in the specification of the invention document analyzed by the invention document analysis system.

また、例えば、前記発明文書分析システムは、始め隅付き括弧と終わり隅付き括弧とで挟まれた記載を含む行を、前記見出しの記載を含む行として扱い、前記明細書見出しリストにおける、前記発明文書の前記明細書中の段落番号を表す見出しの記載を含む行については、当該明細書における当該段落番号に係る段落範囲内に当該発明文書のクレーム中から前記重要語句抽出部により抽出された重要語句と同一の重要語句がある場合に、当該重要語句を、前記明細書見出しリストの当該行に追記することとしてもよい。
これにより、特許出願関連情報における明細書見出しリストを閲覧した翻訳者等は、発明文書の明細書に記載されていることの概要を迅速に推察又は確認し得るようになる可能性がある。翻訳者が明細書の概要を迅速に推察できると、翻訳者が明細書に記載されている文を効率的又は適正に翻訳できる可能性が高まる。なお、この明細書見出しリスト中の段落番号を表す見出しの記載を含む行に追記する各重要語句(つまりクレーム中から抽出された重要語句)には、同一文字列の重要語句には同じ表示色(例えば重要語句の左境界線の表示色)を付し、相互に異なる重要語句同士には相違する表示色を付すこととしてもよい。重要語句への表示色の付加は、例えば重要語句についての表示要素に対する表示制御情報により実現される。これにより、ブラウザ等により表示された表示用文書に係る明細書見出しリストを閲覧した翻訳者等は、各重要語句が同一か否かを迅速に認識できる可能性が高まり得る。また、明細書見出しリスト中の段落番号を表す見出しの記載を含む行に、クレーム中から抽出された重要語句を追記することに加えて、発明文書のクレームには含まれず明細書中から抽出された重要語句がその段落番号の段落に存在すれば、その重要語句を、クレーム中から抽出された重要語句とは異なる表示態様で表示されるようにして、追記することとしてもよい。
Further, for example, the invention document analysis system treats a line containing a description sandwiched between an opening square bracket and an closing square bracket as a line containing the description of the heading, and the invention document analysis system in the specification heading list. For the line containing the description of the heading representing the paragraph number in the specification of the document, the important words extracted by the important phrase extraction unit from the claims of the invention document within the paragraph range related to the paragraph number in the specification If there is an important phrase that is the same as the phrase, the important phrase may be added to the line of the description heading list.
As a result, a translator or the like who browses the specification heading list in the patent application-related information may be able to quickly guess or confirm the outline of what is described in the specification of the invention document. If the translator can quickly infer the outline of the specification, it is more likely that the translator will be able to translate the sentences described in the specification efficiently or properly. In addition, for each important phrase (that is, the important phrase extracted from the claim) added to the line containing the description of the heading representing the paragraph number in this specification heading list, the same display color is used for the important phrase of the same character string. (For example, the display color of the left boundary line of key phrases) may be attached, and different key phrases may be assigned different display colors. Adding a display color to an important phrase is realized, for example, by display control information for a display element for the important phrase. This can increase the possibility that a translator or the like who browses the specification heading list related to the document for display displayed by a browser or the like can quickly recognize whether or not the key words are the same. In addition, in addition to adding important phrases extracted from the claims to the line containing the description of the heading representing the paragraph number in the specification heading list, If the important phrase is present in the paragraph of that paragraph number, the important phrase may be added by displaying it in a display mode different from that of the important phrase extracted from the claim.

また、例えば、前記分析部は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された重要語句各々が表す要素間の関係について判別し、当該判別の結果を示す重要語句関係情報を生成する要素間関係判別部を含み、前記特許出願関連情報は、前記重要語句関係情報を含み、前記要素間関係判別部は、前記重要語句関係情報に、発明文書から前記重要語句抽出部により抽出された複数の重要語句各々が表す要素間の構成上の包含関係を表現した包含関係情報と、発明文書から前記重要語句抽出部により抽出された複数の重要語句各々が表す要素間が記録媒体とその記録媒体の内容との関係を有する場合の当該関係を表現した記録関係情報と、発明文書から前記重要語句抽出部により抽出された複数の重要語句各々が表す要素間がプログラムと当該プログラムによる実現内容との関係を有する場合の当該関係を表現したプログラム実現関係情報と、発明文書から前記重要語句抽出部により抽出された複数の重要語句各々が表す要素間に等価関係がある場合の当該関係を表現した等価関係情報と、発明文書から前記重要語句抽出部により抽出された複数の重要語句各々が表す要素間に概念上の上下関係がある場合の当該関係を表現した上下概念関係情報とを含ませることとしてもよい。
これにより、発明文書分析システムにより出力された特許出願関連情報における重要語句関連情報を閲覧した翻訳者は、発明文書分析システムでの分析対象となった発明文書における複数の重要語句間の関係について効率的に又は的確に理解することが可能となり、そのため、その複数の重要語句各々に対応する翻訳語句を、効率的に又は適正に決定することが可能となり得る。
Further, for example, the analysis unit discriminates the relationship between the elements represented by each of the key phrases extracted by the key phrase extraction unit from the invention document acquired by the document acquisition unit, and the key phrases indicating the result of the discrimination. an inter-element relationship determination unit that generates relationship information, wherein the patent application related information includes the important phrase relationship information; Inclusion relationship information expressing structural inclusion relationships between elements represented by each of the multiple key phrases extracted by the unit, and between elements represented by each of the multiple key phrases extracted from the invention document by the key phrase extraction unit Recording relationship information that expresses the relationship between a recording medium and the content of the recording medium when the relationship exists, and the relationship between elements represented by each of a plurality of important phrases extracted from the invention document by the above-mentioned important phrase extraction unit. Program implementation relationship information expressing the relationship when there is a relationship with the content implemented by the program, and when there is an equivalence relationship between the elements represented by each of the multiple key phrases extracted from the invention document by the key phrase extraction unit Equivalence relationship information expressing the relationship, and hierarchical conceptual relationship information expressing the relationship when there is a conceptual hierarchical relationship between elements represented by each of the plurality of key phrases extracted from the invention document by the key phrase extraction unit. and may be included.
As a result, a translator who browses the key phrase-related information in the patent application-related information output by the invention document analysis system can efficiently understand the relationships between multiple key phrases in the invention documents analyzed by the invention document analysis system. Therefore, it may be possible to efficiently or properly determine translation terms corresponding to each of the plurality of important terms.

また、例えば、前記設定情報取得部が取得する前記設定情報にはコメント行又はコメントを特定する情報であるコメント特定用情報が含まれ、前記分析部は、前記特許出願関連情報中の前記クレーム情報において表される前記クレームの各項の引用関係を木構造の形式で表現したクレームツリーを生成するクレームツリー生成部を含み、前記特許出願関連情報は、前記クレームツリーを含み、前記クレームツリー生成部は、前記クレーム情報におけるクレームの各項について、項番が小さい順に、行を改めて、当該項が引用している項の項番を示す情報を、引用関係の表現用の記号及び項番により表記したクレームツリーを生成し、当該クレームツリーの各行に係る各項について、前記クレーム情報における当該項の直前行が前記コメント特定用情報に基づいて特定される所定の形式のコメント行である場合には、当該コメント行の内容を、当該クレームツリーにおける当該項の項番を記載する行に付記し、前記クレーム情報における当該項の直前行が前記コメント行でない場合において、当該項の見出しと同一の行に、前記コメント特定用情報に基づいて特定される所定の形式でコメントが記載されているときには、当該コメントの内容を、当該クレームツリーにおける当該項の項番を記載する行に付記し、前記クレーム情報における当該項の直前行が前記コメント行でなく、かつ、当該項の見出しと同一の行に前記コメントが記載されていない場合において、前記発明文書のクレームの当該項に記載され前記重要語句抽出部により抽出された1つ以上の重要語句が存在するときには、当該1つ以上の重要語句のうち少なくとも1つの重要語句を、当該クレームツリーにおける当該項の項番を記載する行に付記することとしてもよい。
これにより、発明者等又は弁理士が発明文書のクレーム中に含ませたコメントを、翻訳者は、その発明文書に基づいて発明文書分析システムにより出力された特許出願関連情報におけるクレームツリーにより確認でき、クレームの各項の引用関係を踏まえてコメントにより各項の意義等を効率的又は的確に理解することが可能となり得る。また、発明文書のクレームの項についてのコメントが記載されていない項については、その発明文書に基づいて発明文書分析システムにより出力された特許出願関連情報におけるクレームツリーにその項の重要語句が示されるので、翻訳者、或いは、発明文書の作成から時間が経過してその内容を多少忘却した発明者等又は弁理士が、クレームのその項の意義を理解できる可能性があり得る。翻訳者は、クレームの各項の意義を十分に理解できていると、クレームの各項を効率的又は適正に翻訳し得る。
Further, for example, the setting information acquired by the setting information acquisition unit includes comment specifying information that is information specifying a comment line or a comment, and the analysis unit acquires the claim information in the patent application related information a claim tree generation unit that generates a claim tree that expresses the citation relationship of each item of the claim represented in the tree structure format, the patent application related information includes the claim tree, and the claim tree generation unit For each clause of the claim in the above claim information, write the information indicating the clause number of the clause cited by the clause on a new line in ascending order of the clause number, using the symbol for expressing the citation relationship and the clause number. generated a claim tree, and for each item related to each line of the claim tree, if the line immediately preceding that item in the claim information is a comment line in a predetermined format specified based on the comment specifying information , the content of the comment line is added to the line that describes the item number of the item in the claim tree, and if the line immediately preceding the item in the claim information is not the comment line, the same line as the heading of the item , when comments are written in a predetermined format specified based on the information for specifying comments, the content of the comments shall be added to the line in which the item number of the item in the claim tree is described, and the claim If the line immediately preceding the relevant paragraph in the information is not the comment line and the comment is not stated in the same line as the heading of the relevant paragraph, the extraction of the key words stated in the relevant paragraph of the claim of the invention document When there are one or more key phrases extracted by the Department, at least one of the one or more key phrases shall be added to the line describing the item number of the relevant paragraph in the claim tree. good too.
As a result, the translator can confirm the comments included in the claims of the invention document by the inventors or the patent attorney by looking at the claim tree in the patent application-related information output by the invention document analysis system based on the invention document. , it may be possible to efficiently or accurately understand the significance of each item through comments based on the citation relationships of each item in the claims. In addition, for clauses that do not contain any comments on the claim clauses of the invention document, the key phrases of that clause are shown in the claim tree in the patent application-related information output by the invention document analysis system based on the invention document. Therefore, it is possible that a translator, or an inventor or patent attorney who has somewhat forgotten the contents of the invention document after the passage of time can understand the meaning of that clause of the claim. Translators can translate claim terms efficiently or properly if they have a good understanding of the meaning of each claim term.

また、例えば、前記クレームツリー生成部は、前記特許出願関連情報中の前記クレーム情報において表される前記クレームの各項の引用関係を木構造の形式で表現した構成クレームツリーを生成し、前記特許出願関連情報は、前記構成クレームツリーを含み、前記クレームツリー生成部は、前記クレーム情報におけるクレームの各項について、項番が小さい順に、行を改めて、当該項が引用している項の項番を示す情報を、引用関係の表現用の記号及び項番により表記した構成クレームツリーを生成し、当該構成クレームツリーの各行に係る各項について、前記クレーム情報における当該項に記載され前記重要語句抽出部により抽出された1つ以上の重要語句が存在するときには、当該各重要語句を、当該項の項番を記載する行に付記し、当該項に付記すべき重要語句が複数であって当該複数の重要語句各々が表す要素間が構成上の包含関係を有するならば重要語句間の関係を表す記載を当該行に付記することとしてもよい。
これにより、発明文書に基づいて発明文書分析システムにより出力された特許出願関連情報における構成クレームツリーを閲覧することで、翻訳者、或いは、発明文書の作成から時間が経過してその内容を多少忘却した発明者等又は弁理士は、その発明文書におけるクレームの各項の引用関係を把握するとともに、クレームの項に記載された複数の重要語句間の関係を把握することができるので、クレームの各項の意義等を効率的に理解できる可能性があり得る。
Further, for example, the claim tree generation unit generates a configuration claim tree that expresses the citation relationship of each item of the claim represented in the claim information in the patent application related information in a tree structure format, The application-related information includes the constituent claim tree, and the claim tree generation unit replaces the lines in ascending order of the item number for each item of the claim in the claim information, and adds the item number of the item cited by the item. A constituent claim tree is generated in which the information indicating the When there are one or more key phrases extracted by the department, each key phrase is added to the line that describes the item number of the paragraph, and if there are multiple key phrases to be added to the paragraph, If the elements represented by each of the important terms have a compositional inclusion relationship, a description representing the relationship between the important terms may be appended to the line.
By viewing the configuration claim tree in the patent application-related information output by the invention document analysis system based on the invention document, the translator or the content of the invention document can be forgotten somewhat after the passage of time. The inventors, etc. or patent attorneys who have done so can grasp the citation relationship of each claim section in the invention document, and also grasp the relationship between multiple important terms described in the claim section. It may be possible to efficiently understand the significance of the term.

また、例えば、前記発明文書分析システムは、予め定められた不適切文字列パターン情報に対応付けられた修正情報に基づいて、当該不適切文字列パターン情報が示す不適切文字列パターンに該当する文字列が、前記文書取得部により取得された発明文書におけるクレーム中に存在した場合には、前記特許出願関連情報に、前記修正情報に基づいて当該クレームを修正することで修正後のクレームの内容を表すように生成される修正版クレーム情報を含ませ、前記クレームツリー生成部は、前記表示用文書としての前記特許出願関連情報の前記クレームツリー又は前記構成クレームツリーの項番についての表示要素に、当該表示要素の操作に応じて、当該表示用文書におけるクレーム情報の当該項番の項の記載部分を表示するためのGUIとしての機能を持たせるための表示制御情報を付加し、当該クレームツリー又は当該構成クレームツリーの、前記引用関係の表現用の記号についての表示要素に、当該表示要素の操作に応じて、当該記号で表されていた引用関係を切断する引用関係切断処理を実行するためのGUIとしての機能を持たせるための表示制御情報を付加し、当該引用関係切断処理は、前記表示用文書における前記修正版クレーム情報の内容を当該引用関係の切断を反映させるために更新する処理と、当該表示要素としての当該引用関係の表現用の記号を、当該引用関係が切断されたことを表現するために予め定められた記号に変更して、当該表示要素を再表示する処理とを含むこととしてもよい。
これにより、発明者等又は弁理士は、例えば、日本国への出願用に発明文書を作成した後に、各国への出願戦略、各国の特許に係る法制度の相違等に基づいて、外国出願等のために翻訳用の和文としてその発明文書を、クレーム編成を変更して活用したい場合において、その発明文書に基づいて発明文書分析システムが出力する表示用文書としての特許出願関連情報のクレームツリー又は構成クレームツリーの一部のGUIの操作により、効率的に、クレームの一項における他の項の引用を解除することができ、その引用が解除されたことを反映した修正版クレーム情報を生成又は更新させ得る。その後に表示用文書としての特許出願関連情報を取得して閲覧することにより、翻訳者は、修正版クレーム情報に基づいて外国出願等のための翻訳を行うことが可能となる。また、発明者等又は弁理士は、例えば、そのGUIの操作後の修正版クレーム情報の表示内容をコピー&ペーストして生成された文書を翻訳者に渡してその文書の翻訳を依頼し得る。
Further, for example, the invention document analysis system, based on the correction information associated with the predetermined inappropriate character string pattern information, character string corresponding to the inappropriate character string pattern indicated by the inappropriate character string pattern information If the column exists in the claim in the invention document acquired by the document acquisition unit, the content of the claim after amendment is added to the patent application related information by correcting the claim based on the correction information. The claim tree generation unit includes the modified claim information generated so as to represent the claim tree, and the claim tree generation unit causes the display element for the item number of the claim tree or the constituent claim tree of the patent application related information as the display document to be: Add display control information to have a function as a GUI for displaying the description part of the item number of the claim information in the display document according to the operation of the display element, and add the display control information to the claim tree or In the constituent claim tree, a display element for the symbol for expressing the citation relationship is provided with, in accordance with the operation of the display element, a citation relationship disconnection process for severing the citation relationship represented by the symbol. Display control information for providing a GUI function is added, and the citation relation disconnection processing updates the content of the modified claim information in the display document to reflect the disconnection of the citation relation. , changing the sign for expressing the citation relation as the display element to a predetermined sign to express that the citation relation has been severed, and re-displaying the display element. You can do it.
As a result, inventors, etc. or patent attorneys, for example, after creating invention documents for filing in Japan, can file foreign applications, etc., based on the application strategies for each country, the differences in the legal systems related to patents in each country, etc. If you want to use the invention document as a Japanese text for translation for the purpose of changing the composition of claims, the claim tree or claim tree of the patent application-related information as a display document output by the invention document analysis system based on the invention document Through some GUI manipulation of the constituent claim tree, one can effectively de-quote another term in one claim section and generate or modify modified claim information reflecting that de-citation. can update. After that, by acquiring and perusing the patent application-related information as a display document, the translator can translate for foreign applications, etc., based on the modified version of the claim information. In addition, the inventors or the patent attorney may, for example, copy and paste the display contents of the corrected claim information after the operation of the GUI, and pass the document generated to the translator to request translation of the document.

また、例えば、前記発明文書分析システムは、前記発明文書から前記重要語句抽出部により抽出された重要語句のうち、符号が対応する重要語句について、当該符号と当該重要語句とを関係付けて表したリストである符号リストを生成して前記特許出願関連情報に含ませ、前記発明文書分析システムは、前記発明文書から前記重要語句抽出部により抽出された重要語句に後続して記載された符号を列挙して、符号と対応する重要語句とを関連付けて表し、前記重要語句抽出部により抽出された重要語句に符号が後続して付加された記載が、前記発明文書中に存在しない場合において、当該重要語句が表す要素が他の重要語句が表す要素を構成上包含するか、又は、他の重要語句が表す要素に構成上包含されるときには、当該重要語句及び当該他の重要語句の構成上の包含関係に基づいて符号を決定して、決定した符号と当該重要語句とを関連付けて表すことにより、前記符号リストを生成することとしてもよい。
これにより、発明文書分析システムは、発明文書中の複数の重要語句各々が表す要素間に構成上の包含関係があるところのその各重要語句について符号が付加された記載がその発明文書に含まれない場合にその重要語句についての符号を、その包含関係に基づいて自動的に決定して、符号と重要語句とを対応付けた符号リストを生成するので、その符号リストを利用することで発明者等又は弁理士は効率的に又は適正に発明文書を完成させることが可能となり得る。発明者等又は弁理士は、例えば、符号を記載せずに発明文書を作成し、発明文書分析システムにより生成された符号リストに基づいて必要な符号を発明文書に挿入することで効率的に発明文書を完成させることが可能となり得る。
Further, for example, the invention document analysis system expresses, of the key words and phrases extracted from the invention document by the key word extraction unit, key words and phrases corresponding to codes, by associating the codes and the key words and phrases. A code list, which is a list, is generated and included in the patent application related information, and the invention document analysis system enumerates the codes described after the key words and phrases extracted from the invention documents by the key word extraction unit. Then, when the description in which the key phrase extracted by the key phrase extracting unit and the key phrase followed by the code does not exist in the invention document, the key phrase When an element represented by a phrase structurally includes an element represented by another key phrase or is structurally included in an element represented by another key phrase, the structural inclusion of the key phrase and the other key phrase The code list may be generated by determining a code based on the relationship and representing the determined code and the key phrase in association with each other.
As a result, the invention document analysis system determines that the invention document includes descriptions to which a code is added for each of the key terms in which there is a structural inclusion relationship between the elements represented by each of the plurality of key terms in the invention document. If there is no key word, the code for the key word is automatically determined based on the inclusion relationship, and a code list in which the code and the key word are associated is generated. Etc. or a patent attorney may be able to efficiently or properly complete the invention document. For example, inventors or patent attorneys prepare invention documents without describing codes, and insert necessary codes into the invention documents based on the code list generated by the invention document analysis system. It may be possible to complete the document.

また、例えば、前記文書取得部は更に、当該文書取得部により取得された発明文書に対応する図面文書を取得し、前記文書取得部により取得された発明文書についての分析結果に基づいて生成された前記特許出願関連情報の前記クレーム情報又は前記明細書情報における、前記重要語句抽出部により当該発明文書から抽出された複数の重要語句のうち、当該発明文書において符号が付加されて記載された要素名を表す語句と同一の重要語句について、当該重要語句に係る前記表示制御情報は、当該重要語句を、操作に応じて、当該発明文書に対応する前記図面文書中の当該重要語句に係る当該符号が記載された部分を表示するためのGUI要素として表示するための情報を含むこととしてもよい。
これにより、翻訳者は、表示用文書としての特許出願関連情報のクレーム情報中又は明細書情報中の重要語句で発明文書中に符号が付加された記載を含むものと同一の重要語句に係るGUIに対して操作することで、その重要語句に対応する符号が記載された図面の部分を迅速に確認することができるので、重要語句を効率的に理解することが可能となり、このため、翻訳者が発明文書を効率的又は適正に翻訳できる可能性が高まり得る。
Further, for example, the document acquisition unit further acquires the drawing document corresponding to the invention document acquired by the document acquisition unit, and the drawing document generated based on the analysis result of the invention document acquired by the document acquisition unit An element name described with a code added in the invention document, among a plurality of key phrases extracted from the invention document by the key phrase extraction unit, in the claim information or the specification information of the patent application related information , the display control information related to the key phrase is such that the code related to the key phrase in the drawing document corresponding to the invention document is It may include information for display as a GUI element for displaying the described portion.
As a result, the translator can use the GUI related to the same key words as the key words in the claim information or the specification information of the patent application-related information as the display document and the descriptions to which the code is added in the invention document. By operating on, it is possible to quickly check the part of the drawing where the code corresponding to the key phrase is described, so it is possible to efficiently understand the key phrase. may increase the likelihood that a patentee will be able to translate the invention document efficiently or correctly.

また、例えば、前記文書取得部は、複数の発明文書と、当該複数の発明文書各々の翻訳結果である、複数の翻訳結果文書とを取得し、前記発明文書分析システムは、翻訳対象となる発明文書が満たすべき複数の条件を定めた翻訳用発明文書標準規定を取得する翻訳用発明文書標準規定取得部と、前記文書取得部により取得された前記複数の発明文書各々について、当該発明文書が前記翻訳用発明文書標準規定で定められた前記複数の条件のうちの少なくとも一部の各条件を満たすか否かについての判定を行い、当該複数の発明文書のうち、当該判定がなされた前記条件を満たす程度が予め定めた所定程度を超えるところの発明文書を選出する文書評価部と、前記文書評価部により選出された発明文書と当該発明文書に対応する翻訳結果文書との組を教師データとして用いた機械学習により、機械翻訳のための学習モデルである翻訳用学習モデルを生成する機械学習部とを含み、前記出力部は、前記機械学習部により生成された前記翻訳用学習モデルを出力する学習モデル出力部を含むこととしてもよい。
これにより、翻訳用発明文書標準規定への適合性が比較的高い発明文書が選出されて、対応する翻訳結果文書との組が教師データに用いられるので、不適切な記載を含む発明文書である不適切発明文書とその不適切発明文書に基づいて生成された翻訳ミス等によりその不適切発明文書と内容に齟齬のある翻訳結果文書との組が教師データに用いられにくくなり、発明文書分析システムで、適切な翻訳用学習モデルが生成されるようになり得る。また、この生成された翻訳用学習モデルを利用した演算処理により発明文書を機械翻訳するシステム(例えば発明文書分析システム20等)によれば、ある程度、適切な翻訳結果が得られるので、翻訳者は、その翻訳結果を参照し、適宜修正することで、発明文書を効率的に又は適正に翻訳することが可能となり得る。
Further, for example, the document acquisition unit acquires a plurality of invention documents and a plurality of translation result documents that are translation results of each of the plurality of invention documents, and the invention document analysis system acquires the invention to be translated. An acquisition unit for acquiring invention document standard specifications for translation that defines a plurality of conditions to be satisfied by a document; A judgment is made as to whether or not at least some of the conditions among the plurality of conditions stipulated in the Standard Provisions for Invention Documents for Translation are satisfied, and among the plurality of invention documents, the conditions for which the judgment is made are selected. A document evaluation unit that selects invention documents whose degree of satisfaction exceeds a predetermined degree, and a set of invention documents selected by the document evaluation unit and translation result documents corresponding to the invention documents are used as training data. a machine learning unit that generates a learning model for translation, which is a learning model for machine translation, by machine learning, and the output unit outputs the learning model for translation generated by the machine learning unit. It may also include a model output unit.
As a result, an invention document having a relatively high conformity to the invention document standards for translation is selected, and a pair with the corresponding translation result document is used as training data. A combination of an inappropriate invention document and a translation result document whose content is inconsistent due to a translation error or the like generated based on the inappropriate invention document is less likely to be used as teacher data, and an invention document analysis system can generate an appropriate learning model for translation. In addition, according to a system (for example, the invention document analysis system 20, etc.) that machine-translates invention documents by arithmetic processing using this generated learning model for translation, appropriate translation results can be obtained to some extent, so the translator can , it may be possible to translate the invention document efficiently or properly by referring to the translation result and correcting it as appropriate.

上述の発明文書分析システム(例えばマイクロプロセッサを備える機器に発明文書分析処理プログラムを実行させることで発明文書分析処理を行わせること等で実現可能なシステム)により出力される、本開示における表示用文書(つまり特許出願関連情報を表示させるべきものとして含む表示用文書)は、コンピュータプログラムとしてのスクリプトを含み得るデータであり、マークアップ言語で記述された文書を含むデータであり、発明文書分析システムにより生成された前記特許出願関連情報が、表示されるべき内容として含まれている。本開示における表示用文書は、コンピュータが読み取り可能なROM、光ディスク、ハードディスク等の非一時的な記録媒体に記録して頒布、或いは、流通させられ得る。本開示における表示用文書が頒布された場合に、その表示用文書は、マイクロプロセッサを備える機器にインストールされたブラウザ等により解釈の対象とされ、その結果として、上述の発明文書分析システムで生成された特許出願関連情報が表示されることになる。翻訳者等は、発明文書に基づいて生成された表示用文書における特許出願関連情報を閲覧することで、その発明文書を効率的に理解することが可能になる。また、翻訳者は、表示される特許出願関連情報を閲覧することで、例えば特許出願関連情報に含まれるクレーム情報及び明細書情報がそれぞれ表す、発明文書のクレーム及び明細書を、効率的又は適正に翻訳可能となり得る。また、発明者等又は弁理士は、表示される特許出願関連情報を閲覧して参考にすることで、例えば特許出願関連情報に含まれるクレーム情報及び明細書情報がそれぞれ表す、発明文書のクレーム及び明細書を、例えば一層翻訳し易いような、適切な内容へと更新し得る。 Document for display according to the present disclosure, which is output by the invention document analysis system described above (for example, a system that can be realized by causing an invention document analysis process to be performed by causing a device equipped with a microprocessor to execute an invention document analysis process program) (that is, a display document that includes patent application-related information to be displayed) is data that can include a script as a computer program, is data that includes a document written in a markup language, and is data that includes a document written in a markup language. The generated patent application related information is included as content to be displayed. The display document in the present disclosure may be recorded in a non-temporary recording medium such as a computer-readable ROM, optical disk, hard disk, etc., and distributed or distributed. When the display document in the present disclosure is distributed, the display document is subject to interpretation by a browser or the like installed in a device equipped with a microprocessor, and as a result, it is generated by the invention document analysis system described above. This will display the patent application related information. A translator or the like can efficiently understand the invention document by browsing the patent application related information in the display document generated based on the invention document. In addition, by browsing the displayed patent application-related information, the translator can efficiently or properly translate the claims and the specification of the invention document represented by the claim information and the specification information included in the patent application-related information, for example. can be translated into By viewing and referring to the displayed patent application-related information, the inventors, etc. or patent attorneys can, for example, view the claims and specification information of the invention document represented by the claim information and specification information included in the patent application-related information, respectively. The specification may be updated with appropriate content, for example to make it easier to translate.

本開示における表示用文書は、例えば、マークアップ言語で記述された文書を含み、マイクロプロセッサを備える機器におけるブラウザ等による解釈の対象とされ、技術的思想を日本語で表した特許出願用の発明文書におけるクレームの内容を表すクレーム情報と、当該発明文書における明細書の内容を表す明細書情報とを含む特許出願関連情報が表示されるべき内容として含まれた表示用文書であって、前記クレームの内容を表す前記クレーム情報は、当該クレームの各語句のうち、予め定められた重要語句の抽出の条件に基づいて抽出される各重要語句について、当該重要語句の表示要素の表示態様を制御するための表示制御情報を含み、前記クレーム情報に表される重要語句のうち、重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る前記表示制御情報各々は、当該複数の重要語句各々の表示要素を、互いに相違する表示色を付加した表示態様で表示するように制御するためのものであり、前記クレーム情報に表される重要語句のうち、重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の文字列で構成される重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記1つの重要語句の表示要素の表示態様として付加された表示色と同一の表示色を付加した表示態様で表示するように制御するためのものであり、前記明細書の内容を表す前記明細書情報は、当該明細書中の各語句のうち、重要語句の抽出の前記条件に基づいて抽出される各重要語句について、当該重要語句の表示要素の表示態様を制御するための表示制御情報を含み、前記明細書情報に表される重要語句のうち、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記クレーム情報における前記1つの重要語句の表示要素の表示態様として付加された表示色と同一の表示色を付加した表示態様で表示するように制御するためのものであり、前記明細書情報に表される重要語句のうち、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句のいずれとも相違する重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記クレーム情報における当該複数の重要語句の表示要素のいずれとも相違する表示態様で表示させるように制御するためのものであるところの表示用文書である。
これにより、特許出願関連情報がブラウザ等により表示された状態では、発明文書のクレームから抽出された相互に異なる文字列で構成される複数の重要語句が、特許出願関連情報中のクレーム情報或いは明細書情報において、互いに相違する表示色が付加された表示態様で表示され、その複数の重要語句のいずれか1つの重要語句と同一の文字列で構成される、クレーム情報或いは明細書情報における重要語句については、その1つの重要語句と同一の表示色が付加された表示態様で表示される。このため、ブラウザにより表示された特許出願関連情報を閲覧した翻訳者等は、その複数の重要語句各々と同一の重要語句及び相違する重要語句を、付加された表示色により、迅速に識別可能となり、クレーム情報或いは明細書情報の内容を効率的に理解することが可能となり得る。翻訳者にとっては、クレーム情報或いは明細書情報の内容の効率的な理解は、クレーム及び明細書の効率的な翻訳に有用となる。従って、発明文書を作成した発明者等又は弁理士から、特許出願関連情報を含む表示用文書を取得した翻訳者は、表示用文書をブラウザに解釈させて特許出願関連情報を表示させてその内容を閲覧することで、発明文書を効率的に翻訳できる可能性がある。また、発明文書を作成した発明者等又は弁理士から、その発明文書を取得した翻訳者は、本開示における発明文書分析システム(例えば発明文書分析システム20等)を用いてその発明文書に基づく特許出願関連情報を含む表示用文書を生成し、その表示用文書をブラウザに解釈させて特許出願関連情報を表示させてその内容を閲覧することで、発明文書を効率的に翻訳できる可能性がある。
The display document in the present disclosure includes, for example, a document written in a markup language, is subject to interpretation by a browser or the like in a device equipped with a microprocessor, and is an invention for a patent application in which technical ideas are expressed in Japanese. A display document containing patent application-related information including claim information representing the content of the claims in the document and specification information representing the content of the specification in the invention document as content to be displayed, wherein the claim controls the display mode of display elements for key phrases extracted based on predetermined key phrase extraction conditions among the terms of the complaint. each of the display control information relating to each of a plurality of key phrases having different character strings constituting the key phrase among the key phrases represented in the complaint information, each of the plurality of key phrases It is for controlling each display element to be displayed in a display mode in which a display color different from each other is added. The display control information relating to an important phrase composed of the same character string as any one of the plurality of different important phrases causes the display element of the important phrase to display the one important phrase. It is for controlling to display in a display mode with the same display color added as the display mode of the element, and the description information representing the content of the specification is includes display control information for controlling the display mode of the display element of the key phrase for each key phrase extracted based on the conditions for extracting the key phrase, and is displayed in the specification information The display control information related to the same important phrase as any one of the plurality of important phrases in which the character strings constituting the important phrase in the claim information are different from each other It is for controlling the display elements of important phrases to be displayed in a display mode to which the same display color as the display mode of the display element of the one important phrase in the claim information is added. , the display control information related to important words and phrases different from any of the plurality of important words and phrases in which the character strings constituting the important words and phrases in the claim information are different from each other among the important words and phrases represented in the specification information, This display document is for controlling display elements of key phrases to be displayed in a display mode different from any of the display elements of the plurality of key phrases in the claim information.
As a result, when the patent application-related information is displayed by a browser or the like, a plurality of important phrases composed of mutually different character strings extracted from the claims of the invention document can be displayed in the claim information or specification in the patent application-related information. Important phrases in claim information or specification information displayed in a display mode to which display colors different from each other are added in the document information, and composed of the same character string as any one of the plurality of important phrases is displayed in a display mode in which the same display color as that one important phrase is added. Therefore, a translator or the like viewing the patent application-related information displayed by the browser can quickly identify key words that are the same as and different from each of the multiple key words by the added display colors. , the content of claim information or specification information can be efficiently understood. For translators, efficient understanding of the content of claim information or specification information is useful for efficient translation of claims and specification. Therefore, a translator who obtains a display document containing patent application-related information from an inventor, etc. or a patent attorney who created an invention document causes a browser to interpret the display document, displays the patent application-related information, and displays the contents of the document. By browsing, there is a possibility that the invention document can be translated efficiently. In addition, a translator who obtains the invention document from the inventor or patent attorney who created the invention document can use the invention document analysis system (for example, the invention document analysis system 20, etc.) in this disclosure to apply the patent based on the invention document. By generating a display document that includes application-related information and having the browser interpret the display document to display the patent application-related information and view the contents, there is a possibility that the invention document can be translated efficiently. .

また、例えば、前記表示用文書は、前記特許出願関連情報が表示されるべき内容としてHTML(Hypertext Markup Language)で記載されたHTMLファイルを含むHTML文書であり、重要語句の抽出の前記条件は、前記クレーム又は前記明細書に、先行記載した文字列の参照用に用いられる参照文字列のパターンを表した参照文字列パターンに該当する第1文字列に後続して、重要語句の候補となる文字列のパターンを表した重要語句候補文字列パターンに該当する第2文字列が存在する場合に、当該第2文字列と同一の文字列を重要語句として抽出する第1抽出条件と、前記クレームに、前記重要語句候補文字列パターンに該当する第3文字列に後続して句点文字が存在するときには、当該第3文字列と同一の文字列を重要語句として抽出する第2抽出条件と、前記クレーム又は前記明細書に、前記重要語句候補文字列パターンに該当する第4文字列に後続して、要素名を表す文字列に後続して付記される符号の文字列のパターンを表した符号文字列パターンに該当する第5文字列が存在する場合に、当該第4文字列と同一の文字列を重要語句として抽出する第3抽出条件と、前記クレーム又は前記明細書に、前記重要語句候補文字列パターンに該当する第6文字列に後続して、所定の助詞である文字列のパターンを表した特定助詞文字列パターンに該当する第7文字列が存在する場合に、当該第6文字列と同一の文字列を重要語句として抽出する第4抽出条件と、前記第1抽出条件、前記第2抽出条件、前記第3抽出条件、及び、前記第4抽出条件による前記抽出にあたり、前記重要語句候補文字列パターンに複数の文字列が該当していた場合において当該複数の文字列のうちの一の文字列が他の文字列に前記クレーム又は前記明細書の記載上包含されていたときには、当該複数の文字列のうち当該一の文字列を除外した残余の文字列を選択対象として重要語句を選択して抽出する選択抽出条件とを含み、前記重要語句候補文字列パターンには、少なくとも、先頭文字が漢字である所定の文字列、及び、先頭文字が片仮名である所定の文字列が該当し、前記参照文字列パターンには、少なくとも、「前記」という文字列が該当し、前記符号文字列パターンには、少なくとも、先頭文字が数字である所定の文字列が該当し、前記特定助詞文字列パターンには、少なくとも、「を」、「に」、「が」、「と」、「から」、「へ」及び「は」のいずれかの文字が該当し、前記クレーム情報における、重要語句を構成する文字列が互いに相違する前記複数の重要語句各々に係る前記表示制御情報は、当該複数の重要語句各々の表示要素を、重要語句毎に相違する表示色で所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであり、前記明細書情報における各重要語句について、当該重要語句が、前記クレーム情報における前記複数の重要語句のうちのいずれか1つの重要語句と同一であれば、前記明細書情報における当該重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記クレーム情報における前記1つの重要語句の表示要素の表示態様に係る左境界線の表示色と同一の表示色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御し、前記明細書情報における当該重要語句が、前記クレーム情報における当該複数の重要語句のいずれとも相違すれば、前記明細書情報における当該重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記所定幅を有する左境界線が付加されていない表示態様で表示するように制御するためのものであることとしてもよい。
これにより、ブラウザ等により表示された表示用文書としての特許出願関連情報を閲覧した翻訳者等は、特許出願関連情報中においてクレーム情報に含まれる相違する重要語句同士を、その各重要語句に付加された左境界線の表示色を識別することで、迅速に区別できる。なお、相違する重要語句同士について、重要語句に付加された左境界線の表示色を相違させて表現する方法には、重要語句の文字色或いは文字背景色を相違させて表現する方法より、表示領域の背景色が暗い色(例えば黒)か明るい色(例えば白)かに拘わらず重要語句自体の判読性を低下させないという利点があるので、例えば、ブラウザ等によって基本的な背景色を白、黒等に変更可能であるような場合、或いは、表示用文書が背景色を選択できるようなGUIを実装している場合等において、有用となる。またHTML文書で一部の表示要素に付加可能な左境界線は、文字ではないので、重要語句を含む記載の表示内容のテキストについてのコピー&ペースト等を行う場合に無視されるため、表示内容をテキストエディタ等へとコピー&ペーストして、重要語句を含む記載等を編集するような場合において、邪魔にならない。
Further, for example, the display document is an HTML document including an HTML file written in HTML (Hypertext Markup Language) as the content of the patent application-related information to be displayed, and the conditions for extracting key words are: A character that is a candidate for an important phrase following the first character string corresponding to the reference character string pattern representing the pattern of the reference character string used for referencing the character string previously described in the claim or the specification A first extraction condition for extracting a character string identical to the second character string as an important phrase when there is a second character string corresponding to the key phrase candidate character string pattern representing the pattern of the sequence; a second extraction condition for extracting a character string identical to the third character string as an important phrase when a period character exists following the third character string corresponding to the important phrase candidate character string pattern; Or, in the specification, a coded character string representing the pattern of the coded character string appended after the character string representing the element name following the fourth character string corresponding to the key phrase candidate character string pattern a third extraction condition for extracting a character string identical to the fourth character string as a key phrase when a fifth character string corresponding to the pattern exists; If the 6th character string corresponding to the pattern is followed by the 7th character string corresponding to the specific particle character string pattern representing the pattern of the character string that is a predetermined particle, it is the same as the 6th character string a fourth extraction condition for extracting a character string of as an important phrase; In the case where multiple character strings apply to the string pattern, if one character string among the multiple character strings is included in the other character strings in the description of the claim or the specification, the multiple character strings and a selection extraction condition for selecting and extracting key words from the remaining character strings after excluding the one character string, wherein the key word candidate character string pattern includes at least the first character. A predetermined character string of kanji characters and a predetermined character string whose first character is katakana, the reference character string pattern corresponds to at least the character string "above", and the code character string pattern corresponds to corresponds to at least a predetermined character string whose first character is a number, and the specific particle character string pattern includes at least "wo", "ni", "ga", "to", "kara", " The display control information related to each of the plurality of important phrases that correspond to any of the characters "he" and "wa" and that have different character strings constituting the important phrases in the claim information is the plurality of important phrases It is for controlling each display element to be displayed in a display mode in which a left border line having a predetermined width is added in a different display color for each key phrase, and for each key phrase in the specification information , if the key phrase is the same as any one of the plurality of key phrases in the claim information, the display control information related to the key phrase in the specification information is the key phrase of the key phrase The display elements are displayed in a display mode to which a left boundary line having the predetermined width is added in the same display color as the display color of the left boundary line according to the display mode of the display element of the one important phrase in the claim information. If the key phrase in the description information is different from any of the plurality of key phrases in the claim information, the display control information related to the key phrase in the description information is the key phrase may be controlled to display the display element in a display mode in which the left boundary line having the predetermined width is not added.
As a result, translators, etc., who view the patent application-related information as a display document displayed by a browser, etc., can add different key phrases included in the claim information in the patent application-related information to each of the key phrases. can be quickly distinguished by identifying the display color of the left border line. It should be noted that the method of expressing different key phrases by using different display colors for the left boundary line added to the key phrases is more important than the method of expressing key phrases by using different character colors or character background colors. There is an advantage that the readability of the key phrase itself is not degraded regardless of whether the background color of the area is a dark color (e.g. black) or a bright color (e.g. white). This is useful when the color can be changed to black or the like, or when the display document implements a GUI that allows selection of the background color. In addition, the left border line that can be added to some display elements in HTML documents is not a character, so it is ignored when copying and pasting the text of the display content that includes important phrases. It does not get in the way when copying and pasting to a text editor etc. and editing descriptions including important phrases.

また、例えば、前記所定幅は、1文字分の幅であり、前記特許出願関連情報は、前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句各々を、重要語句毎に行を改めて、列挙した重要語句リストを含み、前記重要語句リストにおける各重要語句については、当該重要語句の表示要素の表示態様を制御するための表示制御情報が付加され、前記重要語句リストにおける前記重要語句に係る前記表示制御情報は、当該重要語句が、前記クレーム情報における、重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一であれば、当該重要語句の表示要素を、前記クレーム情報における前記1つの重要語句の表示要素の表示態様に係る左境界線の表示色と同一の表示色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであることとしてもよい。
これにより、表示用文書としての特許出願関連情報を閲覧した翻訳者等は、重要語句リストにおける各重要語句のうち、クレーム情報において記載されている重要語句を区別可能となり、また、クレーム情報において記載されている各重要語句と対応する、重要語句リストにおける重要語句を迅速に識別可能となり得る。また、左境界線が1文字分の幅(例えば1emで表現される幅)であることは、クレーム情報における前記複数の重要語句各々の直前に1文字分の表示色で塗られた四角形が表示されることになり、1文字分の四角形は、文字列に混在しても、クレーム情報における各文字の配置を乱しにくいので、その各文字の視認性を妨げにくいという効果が生じる。なお、例えば、表示用文書におけるクレーム情報中の各文字の表示用のフォントとして等幅のフォントを用いることとしている場合には、1文字分の四角形が文字列に混在した場合に各文字の配置を整列状態に保つことが可能となり得るし、クレーム情報中の各文字の表示用のフォントとして等幅ではないフォントを用いることとしていても1文字分の四角形の幅は、比較的多くの文字の幅に対して大差ない等により、クレーム情報を目視した場合に各文字の配置を乱して視認性を大きく妨げるようなことはない。なお、特許出願関連情報の文字の視認性が良いこと、或いは、文字列が相違する重要語句各々を迅速に識別可能なことは、クレーム情報及び明細書情報の内容の効率的な理解を可能にし得る。翻訳者にとって、クレーム情報及び明細書情報の効率的な理解は、発明文書のクレーム及び明細書の効率的な翻訳に有用となる。
Further, for example, the predetermined width is a width of one character, and the patent application-related information includes, in the claim information, each of a plurality of important phrases in which the character strings constituting the important phrases are different from each other. In the next line, the list of important phrases listed is included, and for each important phrase in the list of important phrases, display control information for controlling the display mode of the display element of the important phrase is added, and in the list of important phrases The display control information related to the important phrase is the same as any one of the plurality of important phrases having different character strings constituting the important phrase in the claim information. For example, a left boundary line having the predetermined width is added to the display element of the key phrase in the same display color as the display color of the left boundary line according to the display mode of the display element of the one key phrase in the claim information. It may be for controlling to display in a different display mode.
As a result, translators, etc., who have browsed the patent application-related information as a display document can distinguish the key words and phrases described in the claim information among the key words and phrases in the key word list. It may be possible to quickly identify key phrases in the key phrase list that correspond to each key phrase being viewed. In addition, since the left boundary line has a width of one character (for example, a width expressed in 1 em), a rectangle painted in a display color of one character is displayed immediately before each of the plurality of important phrases in the claim information. Therefore, even if a rectangle for one character is included in the character string, it is difficult to disturb the arrangement of each character in the complaint information, so there is an effect that the visibility of each character is less likely to be disturbed. In addition, for example, if a monospaced font is used as the font for displaying each character in the complaint information in the display document, when a rectangle for one character is mixed in the character string, the arrangement of each character can be kept in alignment, and even if a non-monospaced font is used as the font for displaying each character in the claim information, the width of a rectangle for one character is sufficient for a relatively large number of characters. Since there is not much difference with respect to the width, when the claim information is visually observed, the arrangement of each character is not disturbed and visibility is not greatly hindered. In addition, it is possible to efficiently understand the contents of claim information and specification information by having good visibility of characters in patent application-related information or being able to quickly identify each important word with different character strings. obtain. For translators, efficient understanding of claim and specification information is useful for efficient translation of claims and specification of invention documents.

また、例えば、前記重要語句リストの各行は、1つの重要語句と、当該重要語句に対応する対応翻訳語、又は、当該重要語句についての対応翻訳語の候補の集合である翻訳語候補集合とを含み、前記重要語句リストにおける前記重要語句に係る前記表示制御情報は、当該重要語句についての前記翻訳語候補集合の表示要素を、操作に応じて、当該翻訳語候補集合のうちのいずれかの要素を選択可能にするグラフィカルユーザインタフェース(GUI)として機能するように制御するためのものであり、当該GUIとして機能している状態の当該翻訳語候補集合の表示要素に対しての操作に応じて選択された、当該翻訳語候補集合の要素を、当該重要語句に対応する対応翻訳語として決定して、当該翻訳語候補集合の表示要素の内容を、決定した当該対応翻訳語へと置換して表示する処理を実行するためのスクリプトを含むこととしてもよい。
これにより、表示用文書としての特許出願関連情報を閲覧した翻訳者等は、ブラウザ等により表示された特許出願関連情報中の重要語句リストにおける重要語句に対応する翻訳語候補集合のGUIの操作により、翻訳語候補集合のいずれかの要素を選択することで、重要語句リストにおける重要語句に対応する対応翻訳語を容易に決定して表示させ得る。また、翻訳者等は、例えば、その翻訳語候補集合のいずれかの要素の選択による重要語句に対応する対応翻訳語の決定後に、ブラウザ等により表示されている重要語句リストを、コピー&ペースト等により、テキストエディタ等に貼り付けて、必要に応じて編集することで、本開示における発明文書分析システム(例えば発明文書分析システム20等)が特許出願関連情報の生成の基礎となる発明文書から重要語句を抽出するために利用し得る重要語句設定辞書(例えば重要語句設定辞書取得部203により取得して利用し得る重要語句設定辞書)を、比較的容易に生成することが可能となる。
Further, for example, each row of the important phrase list includes one important phrase and a corresponding translated word corresponding to the relevant important phrase, or a translation word candidate set that is a set of candidates for the corresponding translated word for the relevant important phrase. and the display control information relating to the important phrase in the important phrase list is configured to display elements of the set of candidate translation words for the important phrase in response to an operation to display any element of the set of candidate translation words. selected according to the operation on the display element of the set of candidate translation words in the state of functioning as the GUI. determined element of the translation word candidate set is determined as the corresponding translated word corresponding to the important phrase, and the content of the display element of the translation word candidate set is replaced with the determined corresponding translated word and displayed. It is good also as including the script for performing the process to carry out.
As a result, translators, etc. who have browsed the patent application-related information as a display document can operate the GUI of the translation word candidate set corresponding to the key words in the key word list in the patent application-related information displayed by the browser etc. By selecting any element from the set of candidate translation words, the corresponding translation words corresponding to the important words in the list of important words can be easily determined and displayed. In addition, the translator etc. can, for example, copy and paste the important phrase list displayed by the browser etc. By pasting it into a text editor or the like and editing it as necessary, the invention document analysis system (for example, the invention document analysis system 20, etc.) in the present disclosure can extract important information from the invention document that is the basis for generating patent application related information. It is possible to relatively easily generate an important phrase setting dictionary that can be used to extract words (for example, an important phrase setting dictionary that can be obtained and used by the important phrase setting dictionary acquisition unit 203).

また、例えば、前記特許出願関連情報における前記重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、操作に応じて、ネットワーク上の検索サイトで、当該重要語句を含むウェブページ、当該重要語句の定義、当該重要語句の類義語、若しくは、当該重要語句の関連画像を検索する処理、又は、ネットワーク上の翻訳サイトで当該重要語句を翻訳させる処理を、実行するGUIとして機能させるものであることとしてもよい。
これにより、ブラウザ等により表示された表示用文書に係る特許出願関連情報を閲覧した翻訳者等は、表示された特許出願関連情報中の重要語句に対する操作(つまり重要語句の表示要素に対する操作)により、その重要語句の検索結果(例えば重要語句を含むウェブページ、重要語句の定義、類義語、関連画像)、又は、その重要語句の翻訳結果を、知得することが可能となり得るので、その特許出願関連情報の生成の基礎となった発明文書における重要語句について効率的に又は適正に理解することが可能となり得る。このため、翻訳者は、重要語句に対する翻訳語句を効率的に又は適正に決定することが可能となり得る。
In addition, for example, the display control information related to the key phrase in the patent application related information is such that the display element of the key phrase is displayed on a search site on the network in response to an operation, a web page including the key phrase, It functions as a GUI that executes the definition of important phrases, the synonyms of the relevant important phrases, the processing of searching for related images of the relevant important phrases, or the processing of translating the relevant important phrases on a translation site on the network. You can do it.
As a result, translators, etc., who have browsed the patent application-related information related to the display document displayed by a browser, etc., can operate the key phrases in the displayed patent application-related information (i.e., operate the display elements of the key phrases) to , the search results of the key words (for example, web pages containing key words, definitions of key words, synonyms, related images), or translation results of the key words, so that the patent application related It may be possible to efficiently or properly understand the key words in the invention document on which the information was generated. This may allow the translator to efficiently or properly determine translation terms for key terms.

また、例えば、前記特許出願関連情報における前記重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、操作に応じて、当該重要語句の属性情報の少なくとも一部の表示、又は、当該重要語句の属性情報に基づいて決定された当該重要語句の重要度の表示のためのGUIとして機能させるものであり、前記重要語句の前記属性情報は、前記クレーム情報が表すクレーム中で当該重要語句を定義しているクレームの項が存在する場合に当該項の項番を示す情報と、前記クレーム情報が表すクレーム中で当該重要語句を参照しているクレームの項が存在する場合に当該項の項番を示す情報と、前記明細書情報が表す明細書中において当該重要語句に符号が付加された記載が存在する場合に当該符号を示す情報とを含むこととしてもよい。
これにより、ブラウザ等により表示された表示用文書に係る特許出願関連情報を閲覧した翻訳者等は、表示された重要語句に対する操作により、その重要語句の重要度又は属性情報の情報を知得することが可能となり得るので、その特許出願関連情報の生成の基礎となった発明文書におけるどの重要語句が重要であるかを、ある程度、認識可能となり、重要語句について効率的に又は適正に理解することが可能となり得る。このため、翻訳者は、重要な重要語句についての翻訳語句の決定を優先的に実行する等により、効率的な翻訳が可能となり得る。
Further, for example, the display control information related to the key phrase in the patent application related information may display at least a part of the attribute information of the key phrase, or display the display element of the key phrase according to the operation. It functions as a GUI for displaying the degree of importance of the key phrase determined based on the attribute information of the key phrase, and the attribute information of the key phrase is the key phrase in the claim represented by the claim information. If there is a claim section that defines Information indicating an item number, and information indicating the code when there is a description with a code added to the key phrase in the specification represented by the description information may be included.
As a result, translators, etc., who view the patent application-related information related to the document for display displayed by a browser, etc., can obtain information on the degree of importance or attribute information of the key phrases by operating the displayed key phrases. Therefore, it becomes possible to recognize, to some extent, which key phrases in the invention document on which the patent application-related information was generated is important, and to understand the key phrases efficiently or properly. can be possible. For this reason, the translator can perform efficient translation by preferentially determining translation terms for important key terms.

また、例えば、前記特許出願関連情報における前記重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、操作に応じて、前記クレーム情報及び前記明細書情報から当該重要語句を含む行を列挙する重要語句包含記載列挙処理を実行するためのGUIとして機能させるものであり、前記重要語句包含記載列挙処理は、操作対象となった重要語句を含む行を前記クレーム情報及び前記明細書情報から列挙して表示し、当該列挙して表示した各行における当該重要語句については強調表示を行い、表示した行には、当該行に対する操作に応じて、前記クレーム情報又は前記明細書情報における当該行を含む複数行へのリンク表示のためのGUIとして当該行を機能させるための表示制御情報を付加する処理であることとしてもよい。
これにより、ブラウザ等により表示された表示用文書に係る特許出願関連情報を閲覧した翻訳者等は、表示された特許出願関連情報中の重要語句に対する操作により、重要語句包含記載列挙処理の結果として列挙表示される、クレーム情報及び明細書情報におけるその重要語句を含む行を確認することができる。このため、翻訳者等は、その特許出願関連情報の生成の基礎となった発明文書における重要語句について効率的に又は適正に理解することが可能となり得る。また、このため、翻訳者は、重要語句に対する翻訳語句を効率的に又は適正に決定することが可能となり得る。また、翻訳者等は、操作した重要語句を含むことで重要語句包含記載列挙処理により列挙された行におけるその重要語句が強調表示されるので、その重要語句を的確に識別できる。また、翻訳者等は、操作した重要語句を含むことで重要語句包含記載列挙処理により列挙された行のうちの1つの行に対して更に操作することで、更に表示されることになる、その1つの行に前後する、クレーム情報、明細書情報又は別の発明文書における複数行を、容易に確認可能となる。
Further, for example, the display control information related to the key phrase in the patent application related information may change the display element of the key phrase to a line containing the key phrase from the claim information and the specification information according to the operation. It functions as a GUI for executing an important phrase inclusion description enumeration process, wherein the important phrase inclusion description enumeration process selects lines containing important phrases to be operated from the claim information and the specification information. Enumerate and display, highlight the relevant important phrases in each of the enumerated and displayed lines, and in the displayed lines, according to the operation on the lines, the lines in the claim information or the description information are displayed. It may be a process of adding display control information for causing the line to function as a GUI for displaying links to multiple lines.
As a result, translators, etc., who have viewed the patent application-related information related to the display document displayed by a browser, etc., can operate the key phrases in the displayed patent application-related information, and as a result of listing the key phrase inclusion description processing, You can see the lines containing that key phrase in the claim information and specification information that are listed. Therefore, the translator or the like may be able to efficiently or properly understand the key terms in the invention document on which the patent application-related information was generated. This may also allow the translator to efficiently or properly determine translation terms for key terms. In addition, by including the manipulated important phrase, the important phrase in the line listed by the important phrase inclusion description enumeration process is highlighted, so that the translator can accurately identify the important phrase. In addition, the translator or the like further operates one of the lines listed by the key phrase inclusion description enumeration process by including the operated key phrase, so that it is further displayed. Multiple lines of claim information, specification information, or other invention documents that precede or follow a single line can be readily identified.

また、例えば、前記特許出願関連情報は、前記クレーム情報に表されるクレームについての機械翻訳の結果を表すクレーム翻訳情報と、前記明細書情報に表される明細書についての機械翻訳の結果を表す明細書翻訳情報とを含み、前記クレーム翻訳情報における、前記クレーム情報の一行又は一項を機械翻訳対象とした機械翻訳の結果を表す一行又は一項は、当該クレーム情報の行若しくは項の全体を翻訳先言語で表した完全翻訳行、又は、当該クレーム情報の行若しくは項に含まれる重要語句を、当該重要語句に対応する対応翻訳語、若しくは、当該重要語句についての翻訳語候補集合に、置換した結果である部分翻訳行であり、前記明細書翻訳情報における、前記明細書情報の一行を機械翻訳対象とした機械翻訳の結果を表す一行は、当該明細書情報の行の全体を翻訳先言語で表した完全翻訳行、又は、当該明細書情報の行に含まれる重要語句を、当該重要語句に対応する対応翻訳語、若しくは、当該重要語句についての翻訳語候補集合に、置換した結果である部分翻訳行であり、前記クレーム翻訳情報及び前記明細書翻訳情報は、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の重要語句について、当該重要語句を機械翻訳対象とした機械翻訳の結果の表示要素の表示態様を制御するための表示制御情報を含み、当該機械翻訳の結果の表示要素に係る当該表示制御情報は、当該表示要素の表示態様の少なくとも一部に、前記クレーム情報及び前記明細書情報における当該重要語句の表示要素に付加された表示色と同一の表示色が付加されるように、当該表示要素の表示態様を制御するためのものであることとしてもよい。
これにより、例えば、ブラウザ等により表示された表示用文書に係る特許出願関連情報を閲覧した翻訳者等は、特許出願関連情報中の重要語句、及び、重要語句の機械翻訳の結果に対して付加された表示色を識別することにより、クレーム翻訳情報又は明細書翻訳情報における、重要語句の機械翻訳の結果が、クレーム情報又は明細書情報におけるどの重要語句に対応するのかを迅速に把握することが可能となる。
Further, for example, the patent application related information includes claim translation information representing the results of machine translation of the claims represented in the claim information, and machine translation results of the specification represented in the specification information. Including specification translation information, one line or one item representing the result of machine translation for one line or one item of the claim information in the claim translation information is the entire line or item of the claim information Replace the complete translation line expressed in the target language, or the key phrase contained in the line or paragraph of the claim information with the corresponding translated word corresponding to the key phrase, or a set of candidate translation words for the key phrase. is a partial translation line that is the result of the translation, and one line representing the result of machine translation for one line of the description information in the description translation information is the entire line of the description information in the translation target language This is the result of replacing the complete translation line represented by or the key phrase contained in the line of the specification information with the corresponding translation word corresponding to the key phrase, or the translation word candidate set for the key phrase The claim translation information and the specification translation information are partial translation lines, and the claim translation information and the specification translation information are the same as any one of the plurality of key phrases in which the character strings constituting the key phrases in the claim information are different from each other. For key phrases, including display control information for controlling the display mode of the display element of the result of machine translation with the key phrase as the object of machine translation, the display control information related to the display element of the result of the machine translation is display of the display element in such a manner that at least part of the display mode of the display element has the same display color as the display color added to the display element of the important phrase in the claim information and the specification information; It may be for controlling the aspect.
As a result, for example, a translator who browses the patent application-related information related to the display document displayed by a browser etc. can add By identifying the displayed display color, it is possible to quickly grasp which key words in the claim information or specification information correspond to the results of the machine translation of the key words in the claim translation information or the description translation information. It becomes possible.

また、例えば、前記クレーム翻訳情報は、前記クレーム情報の各行を包含し、包含したクレーム情報の一行毎又は一項毎について、当該一行又は一項の内容の直後に、当該一行又は一項の内容である機械翻訳対象に対応する機械翻訳の結果を表す前記完全翻訳行又は前記部分翻訳行を、挿入したものであり、前記明細書翻訳情報は、前記明細書情報の各行を包含し、包含した明細書情報の一行毎について、当該一行の直後に、当該一行である機械翻訳対象に対応する機械翻訳の結果を表す前記完全翻訳行又は前記部分翻訳行を挿入したものであり、前記クレーム翻訳情報及び前記明細書翻訳情報には、前記クレーム翻訳情報及び前記明細書翻訳情報における機械翻訳対象の少なくとも一部分の表示要素の表示態様と、当該機械翻訳対象に対応する機械翻訳の結果の少なくとも一部分の表示要素の表示態様とが、文字背景色、文字色、文字装飾、フォントサイズ、フォントスタイル、及び、フォントウェイトのうちの少なくとも1つにおいて相違するように制御するために、当該各表示要素に表示制御情報が付加されていることとしてもよい。
これにより、ブラウザ等により表示された表示用文書としての特許出願関連情報を閲覧した翻訳者等は、特許出願関連情報中のクレーム翻訳情報及び明細書翻訳情報において、機械翻訳対象の行と、機械翻訳結果の行とを、文字背景色、文字色、文字装飾、フォントサイズ、フォントスタイル、及び、フォントウェイトのうちの少なくとも1つの相違により、迅速に識別可能となる。また、翻訳者は、クレーム翻訳情報及び明細書翻訳情報における機械翻訳対象の行を目視して確認しながら、その機械翻訳対象の行の後方に配置されている機械翻訳結果の行の内容を適宜修正して、より適切な翻訳文を効率的に作成することが可能となり得る。
Further, for example, the claim translation information includes each line of the claim information, and for each line or item of the included claim information, immediately after the content of the line or item, the content of the line or item The complete translation line or the partial translation line representing the result of machine translation corresponding to the machine translation target is inserted, and the description translation information includes and includes each line of the description information For each line of the specification information, immediately after the line, the complete translation line or the partial translation line representing the machine translation result corresponding to the machine translation target of the line is inserted, and the claim translation information And the description translation information includes a display mode of at least a part of the machine translation target in the claim translation information and the description translation information, and a display of at least a part of the machine translation result corresponding to the machine translation target display control for each display element in order to control the display mode of the element to be different in at least one of character background color, character color, character decoration, font size, font style, and font weight Information may be added.
As a result, translators, etc., who view patent application-related information as a display document displayed by a browser, etc., will be able to specify the lines to be machine-translated and the machine-translated Lines of translation results can be quickly identified by differences in at least one of character background color, character color, character decoration, font size, font style, and font weight. In addition, while visually confirming the lines to be machine-translated in the claim translation information and the description translation information, the translator appropriately adjusts the contents of the lines of the machine translation results that are placed after the lines to be machine-translated. It may be possible to modify and efficiently produce a better translation.

また、例えば、前記特許出願関連情報は、警告情報を含み、前記警告情報は、前記発明文書の前記クレーム又は前記明細書が、予め規定された翻訳用発明文書標準規定に定められた複数の条件を満たすか否かを検査して条件が満たされない場合にその旨を指摘する指摘情報と、前記発明文書の前記クレーム又は前記明細書が前記翻訳用発明文書標準規定に定められた複数の条件のうちの少なくとも一部の各条件を満たすか否かの検査の結果に基づいて予め定められた演算により算出された、当該発明文書の翻訳用発明文書標準規定への適合性の評価値を示す発明文書評価情報と、前記翻訳用発明文書標準規定へのアクセスのための規定アクセス情報と、前記翻訳用発明文書標準規定のバージョンを示すバージョン情報とを含むこととしてもよい。
これにより、ブラウザ等により表示された表示用文書としての特許出願関連情報における警告情報(例えば警告情報中の指摘情報等)を参考にすることにより、その特許出願関連情報の生成の基礎となった発明文書を作成した発明者等又は弁理士は、必要であれば発明文書の修正を行い得る。また、翻訳者は、例えば、発明者等又は弁理士から、特許出願関連情報に係る表示用文書の提供を受けることにより、特許出願関連情報中の警告情報での指摘が残っていてもその指摘は特に対処の必要がないと発明者等又は弁理士が判断した結果であると推定できるので、適切な翻訳対象の内容を把握することができ、この結果として、発明文書の翻訳を効率的に又は適正に行うことが可能となり得る。また、翻訳者等は、警告情報中の規定アクセス情報を参照することで、翻訳用発明文書標準規定にアクセスしてその内容を閲覧することが可能になる。また、翻訳者等は、警告情報中の翻訳用発明文書標準規定のバージョン情報を参照することで、どのバージョンの翻訳用発明文書標準規定が利用されたかについて確認することが可能になる。
Further, for example, the patent application-related information includes warning information, and the warning information indicates that the claim or the specification of the invention document satisfies a plurality of conditions stipulated in a predefined invention document standard specification for translation. Information indicating whether or not the conditions are satisfied and if the conditions are not satisfied, and information indicating that the claim or the specification of the invention document satisfies the multiple conditions specified in the standard provisions of the invention document for translation An invention indicating the evaluation value of conformity of the invention document to the Standard Provisions for Invention Documents for Translation, which is calculated by a predetermined calculation based on the results of inspections to determine whether or not at least some of the conditions are satisfied. It may include document evaluation information, specification access information for accessing the invention document standard specification for translation, and version information indicating a version of the invention document standard specification for translation.
As a result, by referring to the warning information (for example, information pointed out in the warning information) in the patent application-related information as a display document displayed by a browser, etc., it became the basis for generating the patent application-related information. The inventor, etc. or the patent attorney who created the invention document can amend the invention document if necessary. In addition, the translator, for example, receives a display document related to the patent application-related information from the inventor, etc. or the patent attorney, so that even if the warning information in the patent application-related information remains pointed out, the translator can Since it can be presumed that the inventor, etc. or patent attorney determined that there is no particular need to deal with the above, it is possible to grasp the appropriate content of the translation target, and as a result, the translation of the invention document can be efficiently performed Or it may be possible to do it properly. In addition, the translator or the like can access the standard specification of the invention document for translation and browse its contents by referring to the specified access information in the warning information. Also, the translator or the like can check which version of the standard specification of invention documents for translation has been used by referring to the version information of the standard specification of invention documents for translation in the warning information.

また、本開示に係る発明文書分析処理プログラムは、マイクロプロセッサを備える機器に、技術的思想を日本語で表した特許出願用のクレーム及び明細書を記載した文書である発明文書を分析する発明文書分析処理を行わせて、上述したような表示用文書を生成するための発明文書分析処理プログラムであって、前記発明文書分析処理は、発明文書を取得する文書取得ステップと、前記文書取得ステップにより取得された発明文書を、予め定められた重要語句の抽出の条件に基づく重要語句の抽出を行うことにより、分析する分析ステップと、前記文書取得ステップにより取得された発明文書についての前記分析ステップによる分析結果に基づいて生成された特許出願関連情報を表示するための前記表示用文書を生成して出力する出力ステップとを含む発明文書分析処理プログラムである。
この発明文書分析処理プログラムを、マイクロプロセッサを備える機器等にインストールすることで、その機器等は、前記発明文書分析処理を実現し得る。この発明文書分析処理プログラムにより実現される発明文書分析処理により、上述したような表示用文書が生成されるので、その表示用文書をブラウザ等で解釈させて表示用文書に係る特許出願関連情報を閲覧することで、翻訳者等にとっては、発明文書の理解が促進される可能性がある。発明文書の理解の促進は、翻訳者にとって発明文書を適切に又は効率的に翻訳するために有用となる。
In addition, the invention document analysis processing program according to the present disclosure analyzes invention documents, which are documents describing claims and specifications for patent applications expressing technical ideas in Japanese, in a device equipped with a microprocessor. An invention document analysis processing program for generating a document for display by performing analysis processing, wherein the invention document analysis processing includes a document acquisition step of acquiring an invention document, and the document acquisition step an analysis step of analyzing an acquired invention document by extracting key phrases based on predetermined key phrase extraction conditions; and an output step of generating and outputting the display document for displaying the patent application related information generated based on the analysis result.
By installing this invention document analysis processing program in a device or the like having a microprocessor, the device or the like can implement the invention document analysis processing. The display document as described above is generated by the invention document analysis processing realized by the invention document analysis processing program. Browsing may facilitate understanding of the invention document for translators and the like. Promoting the understanding of the invention document is useful for translators to translate the invention document appropriately or efficiently.

ここで、例えば、前記発明文書分析処理は、前記出力ステップにより出力済みの1つ以上の前記表示用文書のうちいずれかの選択操作を可能にするGUI画面を表示して、選択された表示用文書を前記機器におけるブラウザの解釈の対象とする処理を含むこととしてもよい。
これにより、マイクロプロセッサを備える機器に発明文書分析処理プログラムを実行させて、その実行結果として過去に生成されたいずれかの表示用文書を選択することで、その表示用文書に係る特許出願関連情報がブラウザにより表示されるようになる。従って、翻訳者等は、発明文書分析処理プログラムの実行の結果として生成された表示用文書が複数存在する場合に、複数の表示用文書各々に係る特許出願関連情報を、対比して閲覧すること等により、その複数の表示用文書のうちの、特定の発明文書に基づいて生成された表示用文書に係る特許出願関連情報を、効率的に理解できる可能性がある。
Here, for example, the invention document analysis process displays a GUI screen that enables a selection operation of one or more of the display documents output by the output step, and displays the selected display document. Processing may include subjecting the document to interpretation by a browser on the device.
As a result, by executing the invention document analysis processing program on a device equipped with a microprocessor and selecting one of the display documents generated in the past as the execution result, the patent application related information related to the display document can be obtained. will be displayed by the browser. Therefore, when there are multiple display documents generated as a result of executing the invention document analysis processing program, translators, etc. can compare and view the patent application related information related to each of the multiple display documents. Thus, there is a possibility that the patent application related information related to the display document generated based on the specific invention document among the plurality of display documents can be efficiently understood.

なお、上述した発明文書分析システム及びこれに関連する技術は、機器、装置、集積回路、システム、方法、プログラム(つまりコンピュータプログラム)、コンピュータで読み取り可能な記録媒体等の全体又は一部としての各種態様で具現化され得る。 In addition, the invention document analysis system and related technology described above can be used as a whole or a part of equipment, devices, integrated circuits, systems, methods, programs (that is, computer programs), computer-readable recording media, etc. It can be embodied in any manner.

以下、本開示における技術の理解を容易にすべく、実施形態を例示し、適宜図面を参照して、詳細に説明する。但し、周知技術については適宜説明を省略する。なお、図面は、模式図であり、厳密に図示されたものではない。また、この実施形態の説明及び図面における各種要素の数、配置、形状、属性、状態、数値、或いは、要素間の接続態様、実行順序、包含関係等は、一例に過ぎず、特許請求の範囲に記載した請求対象を限定するものではない。この実施形態の説明及び図面における各種要素のうち、独立請求項に記載されていない要素は、任意に付加可能である。 Hereinafter, in order to facilitate understanding of the technology in the present disclosure, embodiments will be illustrated and described in detail with reference to the drawings as appropriate. However, description of well-known techniques will be omitted as appropriate. The drawings are schematic diagrams and are not strictly illustrated. In addition, the number, arrangement, shape, attribute, state, numerical value, connection mode between elements, execution order, inclusion relationship, etc. of various elements in the description and drawings of this embodiment are only examples, and the scope of claims is not intended to limit the claimed subject matter described in Among the various elements in the description and drawings of this embodiment, elements not described in the independent claims can be arbitrarily added.

(実施形態1)
以下、発明文書分析システムの実施形態の一例について、図面を用いて説明する。
(Embodiment 1)
An example of an embodiment of an invention document analysis system will be described below with reference to the drawings.

[1.発明文書分析システムの実施形態に関連する情報]
本開示で実施形態例について示す発明文書分析システムは、発明文書を分析する発明文書分析処理を実行するシステムである。
[1. Information related to the embodiment of the invention document analysis system]
The invention document analysis system shown in the embodiment of the present disclosure is a system that executes invention document analysis processing for analyzing invention documents.

本開示において発明文書は、技術的思想を日本語で表した、特許出願用のクレーム又は明細書を記載した文書である。ところで、日本国以外の地域において特許の権利(例えば特許権)を取得するために(例えば、日本語以外の言語である外国語で記載された文書による、日本国以外の国である外国への、特許出願等のために)、発明者等が作成した発明文書を、翻訳者が翻訳して翻訳結果文書を作成する場合がある。翻訳結果文書は、主に外国語で記載したクレーム及び明細書の少なくとも一方を含む文書である。翻訳結果文書の記載に用いられる外国語は、一例としては英語であり、別の一例としては中国語である。以下、翻訳結果文書の記載に用いられる外国語の例として、便宜上、英語を用いて説明するが、翻訳結果文書の記載に用いられる言語を英語に限定する趣旨ではない。 In the present disclosure, an invention document is a document describing claims or a specification for a patent application in which a technical idea is expressed in Japanese. By the way, in order to obtain patent rights (e.g., patent rights) in regions other than Japan (e.g., documents written in a foreign language other than Japanese, to a foreign country other than Japan) , for patent applications, etc.), there are cases where an invention document prepared by an inventor is translated by a translator to create a translation result document. A translation result document is a document containing at least one of the claims and the specification written mainly in a foreign language. The foreign language used to describe the translation result document is English as an example, and Chinese as another example. For the sake of convenience, English will be used as an example of the foreign language used to describe the translation result document, but the language used to describe the translation result document is not limited to English.

本開示で実施形態例に示す発明文書分析システムの創作の目的の一例は、日本国以外の地域における有用な権利の取得のために、発明文書に基づく翻訳結果文書を、翻訳者が効率的又は適正に作成するために有用なシステムを提供することである。 One example of the purpose of creating the invention document analysis system shown in the embodiment in this disclosure is to obtain useful rights in regions other than Japan, so that the translator can efficiently or It is to provide a useful system for creating properly.

[1-1.発明文書]
発明文書は、技術的思想を日本語で表した文書であり、かつ、特許出願用のクレーム又は明細書を記載した文書である。ここで、文書は、文書データを意味し、文書の内容には、1つ以上の書類の記載が含まれ得る。なお、発明文書は、クレームと明細書との両方を記載した文書であってもよい。発明文書は、例えば、複数の行で構成される。各行は、文書データにおいて改行コードで区切られた各部分である。
[1-1. Invention document]
An invention document is a document in which a technical idea is expressed in Japanese and a claim or specification for a patent application is described. Here, a document means document data, and the content of a document may include descriptions of one or more documents. Note that the invention document may be a document that describes both the claims and the specification. An invention document, for example, consists of a plurality of lines. Each line is each part separated by a line feed code in the document data.

技術的思想を日本語で表した文書である発明文書の記載は、言語面においては、主として日本語で記載されていれば足り、部分的に外国語の語句が用いられていてもよい。クレームは、例えば、日本国内の特許出願における書類「特許請求の範囲」の記載内容、又は、日本国内の特許出願における1つ以上の「請求項」の記載内容である。なお、日本国内の特許出願の記載様式と異なる特定様式で文書が構成されていても、実質的に、日本国内の特許出願における「請求項」又は「明細書」の記載内容に相当する記載を含む文書は、特定様式を変換することで日本国内の特許出願の「請求項」又は「明細書」の記載を含む文書として扱うことができるので、特許出願用のクレーム又は明細書を記載した文書と看做す。例えば、クレームは、国際出願(つまり特許協力条約に基づく国際出願)における書類「請求の範囲」の記載内容であってもよい。 The description of the invention document, which is a document expressing the technical idea in Japanese, should be mainly written in Japanese in terms of language, and foreign language words may be used partially. A claim is, for example, the description of a document "claims" in a Japanese patent application, or the description of one or more "claims" in a Japanese patent application. In addition, even if the document is composed in a specific format different from the description format of the Japanese patent application, the description substantially equivalent to the description content of the "claims" or "description" in the Japanese patent application By converting the specified format, the document containing the document can be treated as a document containing the description of the "claims" or "description" of the patent application in Japan, so the document describing the claims or the description for the patent application I assume. For example, the claims may be the contents of the document "Claims" in an international application (that is, an international application under the Patent Cooperation Treaty).

発明文書の一例は、クレーム及び明細書を含む、技術的思想を日本語で表した、日本国内の特許出願の文書であり、出願の前後を問わない。また、発明文書の一例として、クレーム及び明細書の少なくとも一方を含む、技術的思想を日本語で表した、日本国内の特許出願の準備段階における未完成の文書が、挙げられる。また、発明文書の一例として、クレーム及び明細書の少なくとも一方に相当する記載を含む、技術的思想を日本語で表した、外国特許出願(つまり日本国以外の地域を出願先とする特許出願)の文書又は外国特許出願として外国語に翻訳する前段階の文書(例えば翻訳用和文原稿等)が、挙げられる。また、発明文書の一例として、クレーム及び明細書の少なくとも一方に相当する記載を含む、技術的思想を日本語で表した、発明メモ等の文書が、挙げられる。また、発明文書の一例として、日本国又は外国の官庁又は国際事務局により公開された、特許公報(例えば特許公開公報、特許掲載公報等)の内容に実質的に相当するデータが、挙げられる。 An example of an invention document is a document of a patent application in Japan that expresses a technical idea in Japanese, including claims and specifications, regardless of whether it is before or after the filing of the application. An example of an invention document is an incomplete document in the preparatory stage of a patent application in Japan that expresses a technical idea in Japanese, including at least one of claims and a specification. Also, as an example of an invention document, a foreign patent application (i.e., a patent application filed in a region other than Japan) that expresses the technical idea in Japanese, including at least one of claims and descriptions. documents or documents at the stage prior to being translated into foreign languages as foreign patent applications (for example, Japanese manuscripts for translation, etc.). An example of an invention document is a document such as an invention memo that expresses a technical idea in Japanese and includes descriptions corresponding to at least one of the claims and the specification. Also, examples of invention documents include data substantially equivalent to the contents of patent publications (e.g., patent publication publications, patent publication publications, etc.) published by Japanese or foreign government offices or international bureaus.

[1-2.発明文書の翻訳に関連する作業]
以下、発明文書の翻訳に関連する作業の流れの一例について説明する。
[1-2. Work related to translation of invention documents]
An example of the work flow related to the translation of invention documents will be described below.

図1は、発明文書の翻訳に関連する作業の流れの一例を示す。同図に示すように、発明者が、まず、創作した技術的思想の内容について記載した発明メモを作成し、その発明メモの内容を整理して、実質的に特許出願用のクレーム又は明細書を記載した発明文書を作成する。発明者等(例えば発明者、又は、発明者から特許を受ける権利を譲り受けた出願人、発明者の所属する組織における協力者等といった、発明者の関係者)は、発明文書の作成を弁理士に任せることもある。なお、発明者等又は弁理士は、更に、特許出願用の図面を記載した図面文書を作成することもある。 FIG. 1 shows an example of the work flow associated with translating invention documents. As shown in the figure, the inventor first prepares an invention memo describing the content of the technical idea he has created, organizes the content of the invention memo, and essentially forms a claim or specification for a patent application. Create an invention document stating The inventor, etc. (for example, the inventor, the applicant who has been assigned the right to obtain a patent from the inventor, the collaborators in the organization to which the inventor belongs, etc.) must have a patent attorney prepare the invention document. sometimes left to The inventor, etc. or the patent attorney may also create a drawing document describing the drawing for the patent application.

そして、発明者等又は弁理士は、翻訳者に発明文書の翻訳を依頼する際に、必要に応じて、発明文書中の重要語句(つまり所謂キーワード)について対応翻訳語を指定したり、権利を取得しようとしている地域に対応して(例えば出願対象の外国の法律、判例等を考慮した戦略に対応して)、特別な翻訳指示等を行ったりすることがある。主として日本語で記載された発明文書(つまり技術的思想を日本語で表した文書)中の重要語句は、1語又は複数語(つまり1文字以上からなる文字列)であり、日本語以外の語句の1語又は複数語であってもよい。翻訳者は、その発明文書、重要語句についての対応翻訳語の指定、特別な翻訳指示等に従って翻訳を行うことで、翻訳結果文書を作成する。 When the inventor, etc. or the patent attorney requests the translator to translate the invention document, the inventor, etc. or the patent attorney may, as necessary, specify corresponding translation words for important words (that is, so-called keywords) in the invention document, In some cases, special translation instructions may be given in accordance with the region in which the application is to be obtained (for example, in response to a strategy that considers the foreign laws, judicial precedents, etc.). An important phrase in an invention document written mainly in Japanese (that is, a document that expresses a technical idea in Japanese) is one or more words (that is, a character string consisting of one or more characters), and is not written in Japanese. It may be one or more words of a phrase. The translator creates a translation result document by translating according to the invention document, designation of corresponding translation words for key words, special translation instructions, and the like.

図2は、翻訳者による翻訳作業の流れの一例を示す。同図に示すように、例えば、翻訳者は、まず、発明文書の概要を理解し、対応翻訳語の指定を受けていれば参考にして発明文書中の重要語句についての対応翻訳語を決定する。そして、翻訳者は、必要に応じて、発明文書を翻訳し易くすべく、発明文書の校正、変更等を行う。それから、翻訳者は、校正、変更等が行われた後の発明文書について、翻訳を行って、その結果としての翻訳結果文書を作成する。翻訳者は、翻訳に際して、例えば、機械翻訳システム等に機械翻訳を行わせ、その機械翻訳による翻訳結果を活用して翻訳結果文書を作成し得る。最後に、翻訳者は、翻訳結果としての翻訳結果文書の見直しをし、必要に応じて翻訳結果文書の修正を行う。 FIG. 2 shows an example of the flow of translation work by a translator. As shown in the figure, for example, the translator first understands the outline of the invention document, and if a corresponding translation word has been specified, the translator determines the corresponding translation word for the important words in the invention document by referring to it. . Then, the translator proofreads, modifies, etc. the invention document as necessary to facilitate the translation of the invention document. Then, the translator translates the invention document after proofreading, alterations, etc., and creates a translation result document as a result. When translating, the translator may, for example, cause a machine translation system or the like to perform machine translation, and utilize the translation result of the machine translation to create a translation result document. Finally, the translator reviews the translation result document as the translation result, and corrects the translation result document as necessary.

[1-3.有用な権利取得のための翻訳の効率又は適正化を阻害する要因についての考察]
図3は、有用な権利取得のための翻訳の効率又は適正化を阻害する要因となる事項の一例を、列挙した図である。
[1-3. Consideration of Factors Hampering Efficiency or Appropriateness of Translation for Acquisition of Useful Rights]
FIG. 3 is a diagram listing an example of factors that hinder the efficiency or appropriateness of translation for obtaining useful rights.

発明文書が不適切である場合には、例えば技術専門家ではない翻訳者にとっては、発明文書を理解すること、或いは、発明文書をどのように修正して翻訳すべきかを決定することが困難となる。この結果として、発明文書の理解のための調査、或いは、発明文書の作成者等との確認のためのコミュニケーション等に時間がかかり、翻訳者が、翻訳を効率的に行えなくなる可能性がある。また、翻訳者が、不適切な発明文書を、誤って理解することで、適正な翻訳が行えなくなる可能性がある。 If the invention document is inappropriate, it may be difficult, for example, for a translator who is not a technical expert to understand the invention document or to decide how to modify and translate the invention document. Become. As a result, it takes time to investigate the invention document for understanding, or to communicate with the creator of the invention document for confirmation, and the translator may not be able to translate efficiently. In addition, there is a possibility that a translator may not be able to perform a proper translation due to an incorrect understanding of an inappropriate invention document.

有用な権利取得のために不適切な発明文書は、図3に示すように、例えば、誤記、不統一記載、曖昧表現、相対表現等を含むもの、対応する適切な翻訳語句がない語句を含むもの、正確な意味が明白ではない文章を含むもの、外国の法令及び判例に形式上適合しない記載を含むもの、特許権行使上の問題となり得る記載を含むもの等である。相対表現の例としては、「重い第1部材」という記載が、挙げられる。例えば相対表現が含まれていれば、有用な権利取得のために、その相対表現をどのように翻訳すれば良いのかについて翻訳者が迷う可能性がある。正確な意味が明白ではない文章の例としては、主語が欠如し、技術専門家でなければ何が主語であるかを判断し難いような文章が、挙げられる。外国の法令及び判例に形式上適合しない記載の例としては、所定の外国での特許権の取得のための翻訳結果文書が求められている条件の下で、その所定の外国では特許の保護対象でないもの(例えば米国におけるプログラム)を請求対象とするクレームの記載が、挙げられる。なお、特許権行使上の問題となり得る記載は、必ず問題となるという訳ではないが問題となる可能性を有する。特許権行使上の問題となり得る記載の例としては、「好ましくは、~である。」、米国において請求された主題の意義を有する「発明(invention)」の語を用いた「本発明の特徴は、~である。」等の記載が、挙げられる。このような記載を、有用な権利取得のために修正することについて翻訳者が迷う可能性がある。 Inappropriate invention documents for obtaining useful rights include, as shown in Fig. 3, for example, those containing clerical errors, inconsistent descriptions, ambiguous expressions, relative expressions, etc., and phrases without corresponding appropriate translated phrases. content, content whose exact meaning is unclear, content that does not formally conform to foreign laws and judicial precedents, content that may pose problems in enforcing patent rights, etc. An example of a relative expression is the description of “heavy first member”. For example, if a relative expression is included, the translator may be confused as to how to translate the relative expression in order to obtain useful rights. Examples of sentences where the exact meaning is not obvious include sentences that lack a subject and that make it difficult for anyone but a technical expert to determine what the subject is. Examples of statements that do not formally conform to foreign laws, regulations, and judicial precedents include: Claim recitations directed to what is not (eg, programs in the United States) are included. It should be noted that descriptions that may pose problems in exercising patent rights are not necessarily problematic, but they may be problematic. Examples of statements that may be subject to patent enforcement issues include "preferably is", "features of the present invention" using the word "invention" to have the meaning of the claimed subject matter in the United States. is ~.” and the like. Translators may hesitate to modify such statements to obtain useful rights.

有用な権利取得のために不適切な、特別な翻訳指示は、具体的な作業内容が不明確な特別な翻訳指示等である。具体的な作業内容が不明確な特別な翻訳指示の例としては、修正後の内容が必ずしも一通りに決定できないような複数従属クレームの解消指示等が、挙げられる。具体的な作業内容が不明確な特別な翻訳指示は、効率的な翻訳を阻害し得る。 Special translation instructions that are inappropriate for obtaining useful rights include special translation instructions that are unclear in specific work content. An example of a special translation instruction in which the specific content of the work is unclear is an instruction to resolve multiple dependent claims in which the content after modification cannot necessarily be determined in a single way. A special translation instruction with unclear specific work content can hinder efficient translation.

また、翻訳者が機械翻訳システム等による機械翻訳の翻訳結果を活用する場合において機械翻訳の翻訳精度が十分でないときには、翻訳者は、その機械翻訳の翻訳結果の見直しに多大な時間を要し得る。 In addition, when the translator utilizes the translation results of machine translation by a machine translation system etc., if the translation accuracy of the machine translation is not sufficient, the translator may need a lot of time to review the translation results of the machine translation. .

[1-4.発明文書分析システムの実施形態の利用例]
本開示における発明文書分析システムの一実施形態では、例えば、発明文書の不備について指摘、評価等をした情報を出力し得る。また、発明文書分析システムの一実施形態では、例えば、発明文書の重要語句の対応翻訳語の決定を支援する情報を出力し得る。また、発明文書分析システムの一実施形態では、例えば、発明文書についての機械翻訳の精度向上に有用な情報を出力し得る。
[1-4. Example of use of embodiment of invention document analysis system]
An embodiment of the invention document analysis system according to the present disclosure can output, for example, information pointing out, evaluating, etc. deficiencies in the invention document. Further, in one embodiment of the invention document analysis system, for example, information that supports determination of corresponding translation words for key words in the invention document can be output. Also, in one embodiment of the invention document analysis system, for example, information useful for improving the accuracy of machine translation of invention documents can be output.

従って、例えば、発明文書を作成した発明者等又は弁理士は、本開示における発明文書分析システムの一実施形態を利用し、その一実施形態による、その発明文書の分析に基づく出力を活用することで、不適切な発明文書を見直して適切に修正する契機を得ることができる可能性がある。 Therefore, for example, an inventor or patent attorney who created an invention document uses an embodiment of the invention document analysis system in the present disclosure, and utilizes the output based on the analysis of the invention document according to the embodiment. Therefore, it may be possible to obtain an opportunity to review the inappropriate invention document and correct it appropriately.

例えば、発明文書を作成した発明者等又は弁理士が、本開示における発明文書分析システムの一実施形態を利用し、その一実施形態による、その発明文書の分析に基づく出力結果に関する情報(例えば出力結果自体、或いは同様の出力結果を翻訳者に知得可能にするための情報等)を、翻訳者に提供する場合に、翻訳者は、翻訳作業(図2参照)を効率的又は適正に行える可能性がある。翻訳者は、提供されたその発明文書の分析結果に基づく出力結果に関する情報によって、有用な権利取得のために翻訳する際に生じる迷い等を容易に解消可能となり得るからである。 For example, an inventor, etc. or a patent attorney who created an invention document uses an embodiment of the invention document analysis system in the present disclosure, and information on the output result based on the analysis of the invention document (for example, output When providing the translator with the result itself, or information that makes it possible for the translator to know the similar output result, the translator can perform the translation work (see Figure 2) efficiently or properly. there is a possibility. This is because the information on the output result based on the provided analysis result of the invention document enables the translator to easily resolve any hesitation that may occur when translating for the purpose of obtaining useful rights.

例えば、発明者等又は弁理士から発明文書等を受領した翻訳者は、本開示における発明文書分析システムの一実施形態を利用し、その一実施形態による、その発明文書の分析に基づく出力を活用することで、その発明文書についての翻訳作業(図2参照)を効率的又は適正に行える可能性がある。また、翻訳者は、機械翻訳システム等を利用する場合において、本開示における発明文書分析システムの一実施形態により出力される情報の活用により、機械翻訳の精度を向上させることで、翻訳作業(図2参照)を効率的又は適正に行える可能性がある。 For example, a translator who receives an invention document from an inventor or a patent attorney uses an embodiment of the invention document analysis system in the present disclosure, and utilizes the output based on the analysis of the invention document according to the embodiment By doing so, there is a possibility that the translation work (see FIG. 2) for the invention document can be performed efficiently or appropriately. In addition, when using a machine translation system, etc., the translator can improve the accuracy of machine translation by utilizing the information output by one embodiment of the invention document analysis system in the present disclosure, thereby improving the translation work (Fig. 2) can be performed efficiently or appropriately.

[2-1.実施形態1に係る発明文書分析システムの構成例]
図4は、発明文書分析システム10の構成の一例を示す。
[2-1. Configuration Example of Invention Document Analysis System According to Embodiment 1]
FIG. 4 shows an example of the configuration of the invention document analysis system 10. As shown in FIG.

発明文書分析システム10は、発明文書を分析する発明文書分析処理を実行するシステムである。 The invention document analysis system 10 is a system that executes invention document analysis processing for analyzing invention documents.

発明文書分析システム10は、発明文書を分析して、分析結果に基づき、特許出願関連情報等の情報を出力するためのシステムであり、例えば、プログラムを実行するマイクロプロセッサを備える機器等で、実現される。ここでは、一例としての発明文書分析システム10が、ファイルシステム等を含むオペレーティングシステム(OS)とその他のプログラム(例えばアプリケーションプログラム等)を搭載したコンピュータで実現される例を想定して、説明を続ける。ここでマイクロプロセッサを備えるコンピュータの規模や態様は問わず、例えば、スーパーコンピュータ、汎用コンピュータ、ミニコンピュータ、PC(Personal Computer)、タブレット、スマートフォン等であってもよい。また、マイクロプロセッサは、一例としては、量子プロセッサであってもよく、マイクロプロセッサを備えるコンピュータは、一例としては、量子コンピュータであってもよい。コンピュータは、例えば、入力装置及び表示装置を備え得る。コンピュータの入力装置は、マウス等のポインティングデバイス、キーボード、タッチパッド、音声入力装置等であり得る。コンピュータの表示装置は、例えば、液晶ディスプレイ、有機EL(OEL:Organic Electro-Luminescence)ディスプレイ等であり得る。なお、コンピュータの入力装置と表示装置とは一体であってもよく、例えば、コンピュータが、表示装置の表示面の上にタッチパッドを重畳したタッチパネルを備えていてもよい。 The invention document analysis system 10 is a system for analyzing invention documents and outputting information such as patent application-related information based on the analysis results. be done. Here, as an example, the invention document analysis system 10 is assumed to be realized by a computer equipped with an operating system (OS) including a file system and other programs (for example, application programs, etc.). . Here, the size and aspect of the computer provided with the microprocessor do not matter, and may be, for example, a supercomputer, a general-purpose computer, a minicomputer, a PC (Personal Computer), a tablet, a smart phone, or the like. Also, the microprocessor may be, for example, a quantum processor, and the computer including the microprocessor may be, for example, a quantum computer. A computer, for example, may have an input device and a display device. The computer input device may be a pointing device such as a mouse, keyboard, touch pad, voice input device, or the like. The computer display device may be, for example, a liquid crystal display, an organic EL (OEL: Organic Electro-Luminescence) display, or the like. The input device and the display device of the computer may be integrated. For example, the computer may include a touch panel in which a touch pad is superimposed on the display surface of the display device.

発明文書分析システム10のユーザとしては、例えば発明文書の作成者(例えば発明者等又は弁理士)、或いは、発明文書を利用する翻訳者等(例えば、発明文書を基に外国語に翻訳して外国出願用の翻訳結果文書を作成する翻訳者、又は、翻訳者以外の発明文書の利用者)が想定される。なお、発明文書分析システム10のユーザは、発明者等、弁理士、及び、翻訳者等のいずれにも該当しない者であってもよい。 Users of the invention document analysis system 10 include, for example, a creator of the invention document (for example, an inventor or a patent attorney), or a translator who uses the invention document (for example, a person who translates the invention document into a foreign language based on the invention document). A translator who prepares a translation result document for a foreign application, or a user of the invention document other than the translator) is assumed. The user of the invention document analysis system 10 may be a person who does not correspond to any of inventors, patent attorneys, translators, and the like.

発明文書分析システム10は、図4に示すように、設定情報取得部101、文書取得部102、重要語句設定辞書取得部103、翻訳用発明文書標準規定取得部104、分析部105、文書評価部106、機械学習部107及び出力部108を含む。設定情報取得部101、文書取得部102、重要語句設定辞書取得部103、翻訳用発明文書標準規定取得部104、分析部105、文書評価部106、機械学習部107及び出力部108の各機能は、例えば、プログラムを実行する1台以上のコンピュータにより実現される。 As shown in FIG. 4, the invention document analysis system 10 includes a setting information acquisition unit 101, a document acquisition unit 102, an important phrase setting dictionary acquisition unit 103, an invention document standard definition acquisition unit 104 for translation, an analysis unit 105, and a document evaluation unit. 106 , a machine learning unit 107 and an output unit 108 . The functions of the setting information acquisition unit 101, the document acquisition unit 102, the keyword setting dictionary acquisition unit 103, the invention document standard definition acquisition unit 104 for translation, the analysis unit 105, the document evaluation unit 106, the machine learning unit 107, and the output unit 108 are , for example, by one or more computers executing a program.

[2-1-1.設定情報取得部]
設定情報取得部101は、発明文書分析システム10が発明文書を分析するための基礎として用いる設定情報を取得する。設定情報は、発明文書の分析に際して参照されるべき情報を含む。発明文書の分析は、発明文書からの重要語句の抽出を含む。図5は、設定情報の内容の一例を示す。
[2-1-1. Setting information acquisition part]
The setting information acquisition unit 101 acquires setting information used as a basis for the invention document analysis system 10 to analyze the invention document. The setting information includes information to be referred to when analyzing the invention document. Analysis of the invention document includes extraction of key terms from the invention document. FIG. 5 shows an example of the content of setting information.

設定情報は、発明文書分析システム10が参照する情報である。設定情報は、例えば、発明文書分析システム10の内部に存在しても、外部に存在してもよい。設定情報は、如何なる形式の情報であってもよい。設定情報は、例えば、ファイル(例えばテキストファイル等)の内容として存在しても、データベースの内容として存在しても、コンピュータのOSが管理する、ユーザにより定義された、1つ以上の環境変数の内容として存在しても、発明文書分析システム10の一部を構成するデータ(例えば発明文書分析システム10を実現するためのプログラム内に記述されたデータ)として存在してもよい。設定情報が、発明文書分析システム10の一部を構成するデータとして存在する場合に、発明文書分析システム10は、グラフィカルユーザインタフェース(GUI:Graphical User Interface)等を介して、その設定情報の全部又は一部の内容を表示して、設定情報の一部の内容をユーザに変更させられるようにしてもよい。 The setting information is information that the invention document analysis system 10 refers to. The setting information may exist inside or outside the invention document analysis system 10, for example. The configuration information may be any form of information. The setting information, for example, whether it exists as the contents of a file (such as a text file) or as the contents of a database, is one or more user-defined environment variables managed by the OS of the computer. It may exist as content or may exist as data constituting a part of the invention document analysis system 10 (for example, data described in a program for realizing the invention document analysis system 10). When the setting information exists as data constituting part of the invention document analysis system 10, the invention document analysis system 10 uses a graphical user interface (GUI) or the like to process all or all of the setting information. A part of the contents may be displayed so that the user can change the part of the setting information.

設定情報取得部101は、例えば、設定情報が発明文書分析システム10の外部に存在(例えば外部のファイルの内容等として存在)する場合には、その設定情報を発明文書分析システム10内に読み込んで、発明文書分析システム10内で利用し易いデータ形式に変換することで、設定情報の取得を実現してもよい。また、設定情報取得部101は、外部に存在する設定情報(例えばファイルの内容としての設定情報)を読み込んでその読み込んだ内容で、予め発明文書分析システム10の一部を構成するデータとして既定値が定められた設定情報の全部又は一部を、上書きすることで、設定情報の取得を実現してもよい。 For example, if the setting information exists outside the invention document analysis system 10 (for example, it exists as the content of an external file), the setting information acquisition unit 101 reads the setting information into the invention document analysis system 10. , the acquisition of setting information may be realized by converting into a data format that is easy to use within the invention document analysis system 10 . In addition, the setting information acquisition unit 101 reads external setting information (for example, setting information as the contents of a file), and uses the read contents as data constituting a part of the invention document analysis system 10 in advance. Setting information may be obtained by overwriting all or part of the setting information for which is defined.

設定情報は、発明文書分析システム10の分析対象となる発明文書からの重要語句の抽出の条件を示す条件情報を含む。条件情報が示す抽出の条件を満たす文字列が、重要語句である。この重要語句が、ある程度、重要であると推定される語句となるように条件情報が定められて運用されることを想定しているが、その重要であるとの推定の精度が100%である必要はない。重要語句は、例えばキーワード、キーフレーズ等である。文字列は、漢字、仮名文字、英字、数字、記号その他の、文字コードで表示可能な、1つ以上の文字で構成される。ある文字を表す文字コードは、例えば、UTF-8、Shift_JIS、Unicode等のエンコーディング(encoding)形式に応じて、1つに定まる。 The setting information includes condition information indicating conditions for extracting key words from invention documents to be analyzed by the invention document analysis system 10 . A character string that satisfies the extraction conditions indicated by the condition information is an important phrase. It is assumed that the condition information is defined and operated so that this important phrase is a phrase that is presumed to be important to some extent, but the accuracy of the estimation that it is important is 100%. No need. Important words and phrases are, for example, keywords and key phrases. A character string is composed of one or more characters that can be represented by character codes, such as kanji, kana characters, alphabetic characters, numbers, symbols, and others. One character code representing a character is determined according to an encoding format such as UTF-8, Shift_JIS, or Unicode.

条件情報は、一例としては、重要語句候補文字列パターン情報、参照文字列パターン情報、符号文字列パターン情報、特定助詞文字列パターン情報等を含む。重要語句候補文字列パターン情報、参照文字列パターン情報、符号文字列パターン情報及び特定助詞文字列パターン情報は、例えば、抽出するべき文字列の集合を示す文字列パターンを、正規表現で表した情報である。なお、条件情報は、重要語句を抽出するための、他の文字列パターンを示す抽出条件に係る情報、抽出の例外を示す抽出例外条件に係る情報等を含んでもよい。 The condition information includes, for example, important phrase candidate character string pattern information, reference character string pattern information, code character string pattern information, specific particle character string pattern information, and the like. Important phrase candidate character string pattern information, reference character string pattern information, code character string pattern information, and specific particle character string pattern information are, for example, information in which character string patterns indicating sets of character strings to be extracted are represented by regular expressions. is. Note that the condition information may include information related to extraction conditions indicating other character string patterns, information related to extraction exception conditions indicating extraction exceptions, and the like, for extracting important phrases.

重要語句候補文字列パターン情報は、重要語句の候補となる文字列のパターンを表した重要語句候補文字列パターンを示す。重要語句候補文字列パターン情報は、例えば、先頭文字が漢字である所定の文字列(例えば「制御装置」、「制御システム」等といった文字列)、及び、先頭文字が片仮名である別の所定の文字列(例えば「センサ」、「センシング方法」等といった文字列)が、その重要語句候補文字列パターンに該当するように定められている。なお、重要語句候補文字列パターン情報は、必ずしも、先頭文字が漢字又は片仮名である全ての文字列が重要語句候補文字列パターンに該当するように定めてある必要はない。例えば、発明文書に記載された「受信する」という動詞の文字列の一部である「受信」は、先頭文字が漢字である所定の文字列には含まれないこととしてもよい。所定の文字列であるためには文字列に一定の条件が付され得るので、例えば、動詞の先頭の一部分である文字列は、先頭文字が漢字又は片仮名であっても所定の文字列に含まれないこととしてもよいし、文字列の直後に「す」が続くような文字列は、先頭文字が漢字又は片仮名であっても所定の文字列に含まれないこととしてもよい。 The key phrase candidate character string pattern information indicates key phrase candidate character string patterns representing patterns of character strings that are candidates for key phrases. The key phrase candidate character string pattern information includes, for example, a predetermined character string whose first character is Kanji (for example, a character string such as "control device" or "control system"), and another predetermined character string whose first character is Katakana. A character string (for example, a character string such as "sensor" or "sensing method") is defined so as to correspond to the key phrase candidate character string pattern. Note that the key phrase candidate character string pattern information does not necessarily have to be defined so that all character strings whose leading characters are kanji or katakana correspond to the key phrase candidate character string pattern. For example, "receive", which is part of the character string of the verb "to receive" described in the invention document, may not be included in the predetermined character string whose first character is Chinese characters. Since certain conditions can be attached to a character string to be a predetermined character string, for example, a character string that is part of the beginning of a verb is not included in the predetermined character string even if the first character is Kanji or Katakana. Alternatively, a character string immediately followed by "su" may not be included in the predetermined character string even if the first character is kanji or katakana.

参照文字列パターン情報は、先行記載した文字列の参照用に用いられる参照文字列のパターンを表した参照文字列パターンを示す。参照文字列パターン情報は、例えば、「前記」、「上記」、「当該」、「上述した」、「その」等といった文字列が、その参照文字列パターンに該当するように定められている。 The reference character string pattern information indicates a reference character string pattern representing a reference character string pattern used for referencing the previously described character string. The reference character string pattern information is defined so that, for example, character strings such as "above", "above", "this", "above", "that", etc. correspond to the reference character string pattern.

符号文字列パターン情報は、要素名を表す文字列に後続して付記される符号の文字列のパターンを表した符号文字列パターンを示す。各符号は、特許出願用の図面において、図中の一部分に付加されて記載される。また、その図中の一部分に付加された符号と同一の符号が、特許出願用の明細書等において、その図中の一部分を参照するために、その図中の一部分を示す要素名に続けて、記載され得る。符号は、参照符号と称されることもある。 The coded character string pattern information indicates a coded character string pattern representing the pattern of the character string of the code appended after the character string representing the element name. Each reference numeral is added to a part of the drawing in the drawing for the patent application. In addition, in the specifications for patent applications, etc., the same reference numerals as the reference numerals added to the part in the figure are used after the element name indicating the part in the figure in order to refer to the part in the figure. , can be described. A code may also be referred to as a reference code.

符号文字列パターン情報は、例えば、先頭文字が数字である所定の文字列(例えば「100」、「101a」、「122-1」、「123’」等といった文字列)が、当該符号文字列パターンに該当するように定められている。なお、符号文字列パターン情報は、必ずしも、先頭文字が数字である全ての文字列が符号文字列パターンに該当するように定めてある必要はない。また、符号文字列パターン情報は、例えば、先頭文字が数字以外(例えば英字)の文字列が更に、符号文字列パターンに該当するように定めてあってもよい。 Code character string pattern information is, for example, a predetermined character string whose first character is a number (for example, a character string such as “100”, “101a”, “122-1”, “123′”, etc.) It is determined to correspond to the pattern. Note that the coded character string pattern information does not necessarily have to be defined so that all character strings whose first character is a number correspond to the coded character string pattern. Also, the code string pattern information may be defined such that, for example, a string whose first character is not a number (for example, an alphabetic character) further corresponds to the code string pattern.

特定助詞文字列パターン情報は、所定の助詞である文字列のパターンを表した特定助詞文字列パターンを示す。特定助詞文字列パターン情報は、助詞のうち、例えば、「を」、「に」、「が」、「と」、「から」、「へ」及び「は」のいずれかの文字が、特定助詞文字列パターンに該当するように定められている。 The specific particle character string pattern information indicates a specific particle character string pattern representing a pattern of character strings that are predetermined particles. The specific particle character string pattern information includes, among particles, any character of, for example, "wo", "ni", "ga", "to", "from", "he" and "wa" It is defined to correspond to a string pattern.

設定情報は、一例としては更に、重要語句設定辞書の特定用情報を含む。 The setting information, for example, further includes information for specifying important phrase setting dictionaries.

重要語句設定辞書の特定用情報は、発明文書分析システム10の重要語句設定辞書取得部103が重要語句設定辞書を取得するために必要な情報であり、例えば、重要語句設定辞書を内容とするファイル等の所在位置を示すファイルパス(File Path)の情報等といった、そのファイル等へのアクセスに必要な情報である。なお、例えば、重要語句設定辞書の特定用情報は、重要語句設定辞書そのものであってもよい。 The information for specifying the important phrase setting dictionary is information necessary for the important phrase setting dictionary acquisition unit 103 of the invention document analysis system 10 to acquire the important phrase setting dictionary. It is information necessary for accessing the file, such as information on the file path (File Path) indicating the location of the file. It should be noted that, for example, the identification information of the key phrase setting dictionary may be the key phrase setting dictionary itself.

設定情報は、例えば、出力ファイルの格納先の特定用情報を含んでもよい。出力ファイルの格納先の特定用情報の一例は、ファイルシステムにおける所定フォルダー(つまり所定ディレクトリ)を指定する情報である。 The setting information may include, for example, information for specifying the storage location of the output file. An example of information for specifying the storage destination of the output file is information specifying a predetermined folder (that is, a predetermined directory) in the file system.

[2-1-2.文書取得部]
文書取得部102は、発明文書を取得する。文書取得部102は、複数の発明文書各々を逐次取得し得るが、例えば、複数の発明文書を同時に取得可能であってもよい。文書取得部102により取得された発明文書は、分析部105及び機械学習部107で用いられ得る。
[2-1-2. Document Acquisition Unit]
The document acquisition unit 102 acquires invention documents. The document acquisition unit 102 can sequentially acquire each of a plurality of invention documents, but it may be capable of acquiring a plurality of invention documents at the same time, for example. The invention document acquired by the document acquisition unit 102 can be used by the analysis unit 105 and the machine learning unit 107 .

文書取得部102は、例えば、発明文書が記録媒体等に格納されたファイルとして存在する場合に、そのファイルを読むことでファイル内容である発明文書(つまり発明文書の文書データ)を取得する機能を有する。なお、文書取得部102は、例えば、発明文書が、データベースのデータ、発明文書分析システム10を構成するコンピュータのメモリに格納されたデータ(例えばOSにおいてクリップボードが利用可能であるときに、あるアプリケーションプログラムで使用されていた文書等のうちコピー等されてクリップボードとして用いられるメモリ領域に格納された状態となったデータ等)である場合に、そのデータを、データベース、メモリ等から読み出すことで、発明文書を取得する機能を有してもよい。 For example, when the invention document exists as a file stored in a recording medium or the like, the document acquisition unit 102 has a function of acquiring the invention document (that is, the document data of the invention document) by reading the file. have. Note that the document acquisition unit 102, for example, extracts the invention document from database data, data stored in the memory of a computer that constitutes the invention document analysis system 10 (for example, an application program when the clipboard is available in the OS). data that has been copied, etc. and stored in a memory area used as a clipboard), the data can be read out from a database, memory, etc. to reproduce the invention document. may have a function to obtain

文書取得部102は、例えば、複数の発明文書に加えて、その複数の発明文書各々の翻訳結果である、複数の翻訳結果文書を取得し得る。翻訳結果文書は、例えば機械学習部107で用いられる。 For example, the document acquisition unit 102 can acquire, in addition to a plurality of invention documents, a plurality of translation result documents that are translation results of each of the plurality of invention documents. The translation result document is used by the machine learning unit 107, for example.

文書取得部102は、例えば、発明文書に加えて、その発明文書に対応する図面文書を取得してもよい。発明文書に対応する図面文書は、その発明文書の明細書等において参照される図面を表した文書である。一般的に、特許出願用の図面中の一部分に付加された符号と同一の符号が、特許出願用の明細書においてその一部分に相当する要素を表す語句に後続して記載される。図面文書は、例えば、PDF(Portable Document Format)ファイル等のファイルとして存在する。図面文書が、テキスト情報を付加したPDFファイル(つまり文字列を検索可能な状態にしたPDFファイル)である検索可能PDFファイルとして存在する場合には、図面文書に表された各図面中の符号その他の文字列を容易に検索可能である。また、図面文書が、検索可能PDFファイルではないPDFファイルとして存在する場合においても、従来の光学的文字認識(OCR:Optical Character Recognition)技術、或いは、機械学習を用いた文字認識技術等を利用することで、例えば、図面文書に表された各図面中の符号その他の文字列の検索が可能であり、例えば、そのPDFファイルを、検索可能PDFファイルに変換することも既存技術により可能である。 For example, in addition to the invention document, the document acquisition unit 102 may acquire the drawing document corresponding to the invention document. A drawing document corresponding to an invention document is a document representing a drawing referred to in the specification or the like of the invention document. In general, the same reference numerals as those attached to a portion in a drawing for a patent application follow a word or phrase representing an element corresponding to that portion in the specification for a patent application. Drawing documents exist as files such as PDF (Portable Document Format) files, for example. If the drawing document exists as a searchable PDF file that is a PDF file with text information added (that is, a PDF file in which character strings are made searchable), the symbols in each drawing represented in the drawing document, etc. is easily searchable. Also, even if the drawing document exists as a PDF file that is not a searchable PDF file, conventional optical character recognition (OCR) technology or character recognition technology using machine learning is used. Thus, for example, it is possible to search for symbols and other character strings in each drawing represented in the drawing document, and for example, it is also possible to convert the PDF file into a searchable PDF file using existing technology.

[2-1-3.重要語句設定辞書取得部]
重要語句設定辞書取得部103は、設定情報取得部101により取得された設定情報における、重要語句設定辞書の特定用情報に基づいて、重要語句設定辞書を取得する。重要語句設定辞書は、抽出対象とすべき複数の重要語句を列挙した情報(つまり複数の重要語句を含む情報)であり、その複数の重要語句のうちの全部又は一部の重要語句各々に対して、その重要語句を日本語以外の所定の言語(例えば英語)に翻訳した対応翻訳語を対応付けてもよいように構成された情報である。重要語句設定辞書において、例えば、一部の重要語句には、対応翻訳語が対応付けられている。
[2-1-3. Important phrase setting dictionary acquisition unit]
The important phrase setting dictionary acquisition unit 103 acquires the important phrase setting dictionary based on the information for specifying the important phrase setting dictionary in the setting information acquired by the setting information acquiring unit 101 . The important phrase setting dictionary is information listing a plurality of important phrases to be extracted (that is, information including a plurality of important phrases). The information is configured so that the corresponding translated word obtained by translating the key word into a predetermined language other than Japanese (for example, English) may be associated with the key word. In the important phrase setting dictionary, for example, some important phrases are associated with corresponding translated words.

重要語句設定辞書は、例えば、ファイルとして存在しても、データベースの内容として存在しても、発明文書分析システム10内のデータとして存在してもよい。 The important phrase setting dictionary may exist, for example, as a file, as the content of a database, or as data within the invention document analysis system 10 .

重要語句設定辞書は、分析部105における重要語句抽出部1051による重要語句の抽出に利用され得る。 The important phrase setting dictionary can be used for extracting important phrases by the important phrase extraction unit 1051 in the analysis unit 105 .

[2-1-4.翻訳用発明文書標準規定取得部]
翻訳用発明文書標準規定取得部104は、翻訳対象となる発明文書が満たすべき複数の条件を定めた翻訳用発明文書標準規定を取得する。
[2-1-4. Acquisition Department for Standard Provisions of Invention Documents for Translation]
An invention document standard specification for translation acquisition unit 104 acquires an invention document standard specification for translation that defines a plurality of conditions to be satisfied by an invention document to be translated.

翻訳用発明文書標準規定は、例えば、翻訳対象となる発明文書が満たすべき条件を定める情報として、その条件を満たさない不適切な可能性がある記載部分についての文字列のパターンを表した不適切文字列パターンを示す不適切文字列パターン情報を含む。また、その翻訳対象となる発明文書が満たすべき条件を定める情報は、例えば、その条件を満たさない不適切な可能性がある記載部分についての文字列のパターンを表した不適切文字列パターン情報の全部又は一部に対応付けて、その不適切な可能性がある記載部分の修正方法に関する修正情報を含む。 For example, the Standard Provisions of Invention Documents for Translation are information that defines the conditions that an invention document to be translated should satisfy. Contains bad string pattern information that indicates the string pattern. In addition, the information that defines the conditions to be satisfied by the invention document to be translated is, for example, inappropriate character string pattern information representing the character string pattern of potentially inappropriate description parts that do not satisfy the conditions. Corresponding to all or part of it, it contains correction information on how to correct the part of the description that may be inappropriate.

翻訳用発明文書標準規定は、例えば、分析部105及び機械学習部107で用いられる。また、翻訳用発明文書標準規定の内容の一例としての修正情報は、出力部108により出力され得る特許出願関連情報に含まれ得る修正版クレーム情報及び修正版明細書情報を生成するために用いられ得る。 The invention document standard specification for translation is used by the analysis unit 105 and the machine learning unit 107, for example. In addition, the correction information as an example of the content of the invention document standard specification for translation is used to generate the corrected claim information and the corrected specification information that can be included in the patent application related information that can be output by the output unit 108. obtain.

[2-1-5.分析部]
分析部105は、文書取得部102により取得された発明文書を、設定情報取得部101により取得された設定情報に基づいて分析する。分析部105は、重要語句抽出部1051、翻訳語候補集合特定部1052、分類部1053及び翻訳部1054を含む。分析部105は、例えば、文書取得部102により取得された発明文書が翻訳用発明文書標準規定で定められた複数の条件のうちの少なくとも一部の各条件を満たすか否かについての判定を行い、その判定の結果に基づいて、その発明文書における、不適切な可能性がある部分を指摘するための警告情報を生成する。翻訳用発明文書標準規定で定められた複数の条件のうち、分析部105により、発明文書が条件を満たすか否かの判定対象とされる条件は、例えば、設定情報で定めた選択用の情報等に基づいて、或いは、発明文書分析システム10のユーザの選択操作によって、選定され(つまり絞り込まれ)得る。
[2-1-5. Analysis Department]
The analysis unit 105 analyzes the invention document acquired by the document acquisition unit 102 based on the setting information acquired by the setting information acquisition unit 101 . The analysis unit 105 includes an important phrase extraction unit 1051 , a translation word candidate set identification unit 1052 , a classification unit 1053 and a translation unit 1054 . For example, the analysis unit 105 determines whether or not the invention document acquired by the document acquisition unit 102 satisfies at least some of a plurality of conditions defined in the invention document standard specification for translation. , based on the determination result, generates warning information for pointing out potentially inappropriate parts in the invention document. Among the plurality of conditions defined in the standard specification of invention documents for translation, the conditions to be determined by the analysis unit 105 as to whether or not the invention document satisfies the conditions are, for example, information for selection defined in the setting information. etc., or by the user's selection operation of the invention document analysis system 10 (that is, narrowed down).

この警告情報は、出力部108により出力され得る特許出願関連情報に含まれ得る。なお、分析部105による、発明文書が翻訳用発明文書標準規定で定められた条件を満たすか否かについての判定は、例えば、翻訳用発明文書標準規定に含まれ得る不適切文字列パターン情報が示す不適切文字列パターンに該当する文字列がその発明文書に存在するか否かにより行われる。また、発明文書の分析部105による分析の結果として生成される警告情報は、例えば、その発明文書の、翻訳用発明文書標準規定への適合性を示す発明文書評価情報を含んでもよい。発明文書評価情報は、例えば、発明文書の翻訳用発明文書標準規定への適合性を評価した結果としての評価値を示す。発明文書の翻訳用発明文書標準規定への適合性の評価の結果としての評価値は、例えば、翻訳用発明文書標準規定で定めた複数の条件のうち判定対象として選定された条件の個数に対する、発明文書が満たしたと判定された条件の個数の比率である適合率であってもよい。また、例えば、その適合率の高さについて複数段階の範囲に区分して、判定結果の適合率が該当する区分を表す値(例えば区分に属する適合率が小さい方から順に各区分について定めた通番)を評価値としてもよい。 This warning information can be included in the patent application related information that can be output by the output unit 108 . It should be noted that the analysis unit 105 determines whether or not the invention document satisfies the conditions defined in the standard specification of invention documents for translation, for example, if inappropriate character string pattern information that can be included in the standard specification of invention documents for translation is used. This is done depending on whether or not a character string corresponding to the indicated inappropriate character string pattern exists in the invention document. The warning information generated as a result of the analysis by the analysis unit 105 of the invention document may also include, for example, invention document evaluation information indicating the compatibility of the invention document with the invention document standards for translation. The invention document evaluation information indicates, for example, an evaluation value as a result of evaluating the conformity of the invention document to the invention document standard specification for translation. For example, the evaluation value as a result of the evaluation of the conformity of the invention document to the standard provisions for invention documents for translation is the number of conditions selected as judgment targets from among the multiple conditions specified in the standard provisions for invention documents for translation. It may be a conformance rate, which is the ratio of the number of conditions determined to be satisfied by the invention document. In addition, for example, the level of the precision rate is divided into multiple stages, and the value representing the section to which the judgment result conformity rate corresponds (for example, the serial number determined for each section in order from the lowest ) may be used as the evaluation value.

[2-1-5-1.重要語句抽出部]
重要語句抽出部1051は、設定情報に含まれる条件情報に基づいて、文書取得部102により取得された発明文書から重要語句を抽出する。条件情報が適切に定められることにより、重要語句抽出部1051は、例えば、発明文書の一例としての、日本国の特許庁により公開された幾つかの特許公開公報のうちの個々の特許公開公報における特許請求の範囲又は明細書から、複数の重要語句を、抽出可能となる。
[2-1-5-1. Key phrase extraction part]
The key phrase extraction unit 1051 extracts key phrases from the invention document acquired by the document acquisition unit 102 based on the condition information included in the setting information. By appropriately defining the condition information, the key phrase extraction unit 1051 can, for example, extract It becomes possible to extract a plurality of key terms from the claims or the specification.

重要語句抽出部1051により抽出された重要語句は、例えば、発明文書分析システム10が出力する、特許出願関連情報等の情報の生成に利用される。ここでは、一例として発明文書がクレーム及び明細書を含む例を用いて、その発明文書から重要語句を抽出する重要語句抽出部1051について詳細に説明する。重要語句抽出部1051は、重要語句の抽出のための第1抽出条件、第2抽出条件、第3抽出条件及び第4抽出条件に係る抽出をそれぞれ行う、第1抽出部10511、第2抽出部10512、第3抽出部10513及び第4抽出部10514を含む。 The key phrases extracted by the key phrase extraction unit 1051 are used, for example, to generate information such as patent application related information output by the invention document analysis system 10 . Here, using an example in which an invention document includes a claim and a specification, the key phrase extraction unit 1051 for extracting key phrases from the invention document will be described in detail. The important word/phrase extraction unit 1051 performs extraction according to the first extraction condition, the second extraction condition, the third extraction condition, and the fourth extraction condition for the extraction of important words/phrases. 10512 , a third extractor 10513 and a fourth extractor 10514 .

第1抽出部10511は、文書取得部102により取得された発明文書のクレーム及び明細書に、条件情報における参照文字列パターン情報が示す参照文字列パターンに該当する文字列に後続して、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句として抽出する機能を有する。 The first extraction unit 10511 extracts the condition information following the character string corresponding to the reference character string pattern indicated by the reference character string pattern information in the condition information in the claim and specification of the invention document acquired by the document acquisition unit 102 . If there is a character string corresponding to the key phrase candidate character string pattern indicated by the key phrase candidate character string pattern information in , the same character string as the key phrase candidate character string pattern is extracted as an important phrase. have a function.

第2抽出部10512は、文書取得部102により取得された発明文書のクレームに、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して句点文字が存在するときには、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句として抽出する。句点文字は、例えば「。」である。 The second extraction unit 10512 extracts a period character following the character string corresponding to the important phrase candidate character string pattern indicated by the important phrase candidate character string pattern information in the condition information in the claim of the invention document acquired by the document acquisition unit 102. exists, the same character string as the character string corresponding to the key phrase candidate character string pattern is extracted as the key phrase. A punctuation character is, for example, ".".

第3抽出部10513は、文書取得部102により取得された発明文書に、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して、条件情報における符号文字列パターン情報が示す符号文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句として抽出する機能を有する。 The third extraction unit 10513 extracts from the invention document acquired by the document acquisition unit 102, following the character string corresponding to the key phrase candidate character string pattern indicated by the key phrase candidate character string pattern information in the condition information, If there is a character string corresponding to the coded character string pattern indicated by the coded character string pattern information, it has a function of extracting the same character string as the character string corresponding to the key phrase candidate character string pattern as an important phrase.

第4抽出部10514は、文書取得部102により取得された発明文書に、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列である重要語句候補文字列に後続して、条件情報における特定助詞文字列パターン情報が示す特定助詞文字列パターンに該当する文字列である特定助詞文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句として抽出する機能を有する。 The fourth extraction unit 10514 extracts an important phrase candidate character string, which is a character string corresponding to the important phrase candidate character string pattern indicated by the important phrase candidate character string pattern information in the condition information, from the invention document acquired by the document acquisition unit 102. Subsequently, if there is a specific particle character string that is a character string that corresponds to the specific particle character string pattern indicated by the specific particle character string pattern information in the condition information, the character string that corresponds to the important phrase candidate character string pattern is determined. It has a function to extract the same character string as an important phrase.

なお、重要語句抽出部1051は、例えば、条件情報に含まれる抽出条件に係る情報に基づいて、発明文書から重要語句を抽出してもよい。また、重要語句抽出部1051は、例えば、条件情報に含まれる抽出例外条件に係る情報に基づいて、第1抽出部10511、第2抽出部10512、第3抽出部10513又は第4抽出部10514により発明文書から抽出された重要語句のうちの一部を、重要語句でないものと取り扱うこととしてもよい。また、重要語句抽出部1051は、第1抽出部10511、第2抽出部10512、第3抽出部10513及び第4抽出部10514のいずれか1つを含まないように変形したものであってもよい。 Note that the key phrase extraction unit 1051 may extract key phrases from the invention document, for example, based on information related to extraction conditions included in the condition information. In addition, for example, the important phrase extraction unit 1051 uses the first extraction unit 10511, the second extraction unit 10512, the third extraction unit 10513 or the fourth extraction unit 10514 to Some of the key phrases extracted from the invention document may be treated as non-key phrases. Also, the important phrase extraction unit 1051 may be modified so as not to include any one of the first extraction unit 10511, the second extraction unit 10512, the third extraction unit 10513, and the fourth extraction unit 10514. .

また、重要語句抽出部1051は、例えば、重要語句設定辞書取得部103により取得された重要語句設定辞書に含まれている重要語句と同一の重要語句が文書取得部102により取得された発明文書に含まれている場合には、その重要語句設定辞書に含まれている重要語句と同一の重要語句をその発明文書から抽出することとしてもよい。
また、重要語句抽出部1051は、重要語句の抽出のために、比較的複雑な重要語句候補文字列パターンを1つ又は少数用いることとしてもよいし、比較的簡潔な重要語句候補文字列パターンを複数用いることとしてもよい。例えば、重要語句抽出部1051は、重要語句の抽出のために、重要語句候補文字列パターンに複数の文字列が該当していた場合においてその複数の文字列のうちの一の文字列が他の文字列に発明文書の記載上包含されていたときには、その複数の文字列のうちその一の文字列を除外した残余の文字列を選択対象として重要語句を選択して抽出することとしてもよい。即ち、重要語句抽出部1051は、第1抽出条件、第2抽出条件、第3抽出条件及び第4抽出条件による重要語句の抽出にあたり、重要語句候補文字列パターンに複数の文字列が該当していた場合においてその複数の文字列のうちの一の文字列が他の文字列に発明文書のクレーム又は明細書の記載上包含されていたときには、その複数の文字列のうちその一の文字列を除外した残余の文字列を選択対象として重要語句を選択して抽出する選択抽出条件を利用し得る。
Also, the important phrase extraction unit 1051 extracts, for example, the same important phrases as the important phrases included in the important phrase setting dictionary acquired by the important phrase setting dictionary acquisition unit 103 in the invention document acquired by the document acquisition unit 102. If it is included, the same key phrase as that included in the key phrase setting dictionary may be extracted from the invention document.
In addition, the important phrase extraction unit 1051 may use one or a small number of relatively complex important phrase candidate character string patterns for extracting important phrases, or use relatively simple important phrase candidate character string patterns. A plurality of them may be used. For example, in order to extract an important phrase, the important phrase extraction unit 1051 extracts, when a plurality of character strings correspond to an important phrase candidate character string pattern, one of the plurality of character strings When the character string is included in the description of the invention document, the remaining character string excluding one character string from among the plurality of character strings may be selected and extracted as an important phrase. That is, the important phrase extraction unit 1051 extracts important phrases according to the first extraction condition, the second extraction condition, the third extraction condition, and the fourth extraction condition. In the case where one of the multiple character strings is included in the description of the claim or specification of the invention document, that one character string out of the multiple character strings A selection extraction condition for selecting and extracting important phrases from the excluded remaining character strings can be used.

[2-1-5-2.翻訳語候補集合特定部]
翻訳語候補集合特定部1052は、文書取得部102により取得された発明文書から重要語句抽出部1051により抽出された重要語句各々について、その重要語句についての対応翻訳語の候補の集合である翻訳語候補集合を特定する。各重要語句について翻訳語候補集合特定部1052により特定された翻訳語候補集合を表す翻訳語候補情報は、例えば、発明文書分析システム10が出力する特許出願関連情報に含まれる。
[2-1-5-2. Translation word candidate set identification unit]
The translation word candidate set identifying unit 1052 identifies each of the key words extracted by the key word extraction unit 1051 from the invention document acquired by the document acquisition unit 102, and identifies a translation word that is a set of corresponding translation word candidates for the key words. Identify a candidate set. The translation word candidate information representing the translation word candidate set specified by the translation word candidate set specifying unit 1052 for each key word is included in the patent application related information output by the invention document analysis system 10, for example.

翻訳語候補集合は、1つ以上の要素(つまり対応翻訳語の候補)を含む。対応翻訳語は、重要語句を外国語に翻訳した結果の語句である。ここでは、一例として、対応翻訳語は英語の語句であるとして説明するが、対応翻訳語は英語以外の言語(例えば中国語)の語句であってもよい。例えば、重要語句が「変化量」である場合における翻訳語候補集合の要素の例としては、「variation」、「amount of change」等が、挙げられる。 The translation word candidate set includes one or more elements (that is, corresponding translation word candidates). A corresponding translated word is a word/phrase resulting from translating an important word/phrase into a foreign language. Here, as an example, it is assumed that the corresponding translated words are English words and phrases, but the corresponding translated words may be words and phrases of languages other than English (for example, Chinese). For example, when the important phrase is "amount of change", examples of elements of the translation word candidate set include "variation" and "amount of change".

翻訳語候補集合特定部1052は、一具体例としては、日本語の語句と外国語の語句とを対応付けた対訳辞書情報(例えば従来知られた和英辞書データ)を利用し、重要語句抽出部1051により抽出された重要語句をキーとしてその対訳辞書情報を検索することで、その重要語句に対応する1つ以上の対訳である語句を検出し、その検出した語句の集合を、その重要語句についての翻訳語候補集合として特定する。対訳辞書情報の具体例としては、例えば、オーストラリアのジム・ブリーン(James William Breen)氏により創設された日本語辞書プロジェクトにより作成された和英辞書「edict2」、或いは、その和英辞書を加工、編集等したデータ等が、挙げられる。翻訳語候補集合特定部1052は、例えば対訳辞書情報を保持し得る。 As a specific example, the translation word candidate set identification unit 1052 uses bilingual dictionary information (for example, conventionally known Japanese-English dictionary data) in which Japanese words and phrases are associated with foreign language words, and extracts important words and phrases. By searching the bilingual dictionary information using the key phrase extracted by 1051 as a key, one or more bilingual phrases corresponding to the key phrase are detected, and a set of the detected phrases is defined as the key phrase. is identified as a set of translation word candidates. As a specific example of the bilingual dictionary information, for example, the Japanese-English dictionary "dict2" created by the Japanese dictionary project founded by Mr. James William Breen of Australia, or the Japanese-English dictionary is processed, edited, etc. data obtained from The translation word candidate set identification unit 1052 can hold bilingual dictionary information, for example.

発明文書分析システム10により、各重要語句と、対応する翻訳語候補集合を表す翻訳語候補情報とを含む特許出願関連情報は、出力部108により出力され得る。なお、発明文書分析システム10は、発明文書中の各重要語句について、当該重要語句に対応して特定された翻訳語候補集合のうち、発明文書分析システム10のユーザによって選択された要素である対応翻訳語と当該重要語句とを対応付けた情報である翻訳補助情報を出力することとしてもよい。この場合には、複数の発明文書各々が発明文書分析システム10で逐次分析された際における重要語句に対応する対応翻訳語についての、1人又は複数人のユーザの選択の結果としての、1つ以上の翻訳補助情報が、発明文書分析システム10の内部又は外部の記録媒体等に蓄積され得る。記録媒体等は、メモリ、ハードディスク、光ディスク等のデータを記録可能な媒体であればよい。記録媒体等に蓄積された1つ以上の翻訳補助情報を統合して、重要語句毎に対応翻訳語の集合を対応付けた様式の翻訳補助情報を生成してもよい。翻訳補助情報は、ファイルの内容、データベースの内容等の態様で出力され得るし、表示されるという態様で出力されてもよい。既に生成された翻訳補助情報が利用できる場合においては、翻訳語候補集合特定部1052は、別の一具体例として、既に生成された翻訳補助情報を利用し、重要語句抽出部1051により抽出された重要語句をキーとしてその既に生成された翻訳補助情報を検索することで、その重要語句に対応する1つ以上の対応翻訳語として過去にいずれかのユーザに選択された語句を検出し、その検出した語句の集合を、その重要語句についての翻訳語候補集合として特定してもよい。 The invention document analysis system 10 can output the patent application related information including each key phrase and the translation word candidate information representing the corresponding translation word candidate set through the output unit 108 . For each key phrase in the invention document, the invention document analysis system 10 selects an element selected by the user of the invention document analysis system 10 from among the set of translation word candidates specified corresponding to the key phrase. It is also possible to output translation assistance information, which is information in which the translated word and the relevant important phrase are associated with each other. In this case, as a result of selection by one or more users, one The translation assistance information described above can be accumulated in a recording medium or the like inside or outside the invention document analysis system 10 . The recording medium or the like may be any medium capable of recording data, such as a memory, hard disk, or optical disk. One or more pieces of translation assistance information stored in a recording medium or the like may be integrated to generate translation assistance information in a format in which each key phrase is associated with a set of corresponding translated words. The translation assistance information can be output in the form of file contents, database contents, or the like, and may be output in the form of being displayed. In the case where already generated translation aid information can be used, the translation word candidate set identification unit 1052 uses the already generated translation aid information as another specific example, and uses the already generated translation aid information to extract the key phrase extraction unit 1051. By searching the already generated translation auxiliary information with key phrases as keys, phrases selected by any user in the past as one or more corresponding translated words corresponding to the key phrases are detected. A set of words and phrases that have been extracted may be specified as a set of translation word candidates for the important words and phrases.

翻訳語候補集合特定部1052は、また別の一具体例としては、分類部1053又は技術分野特定部10531により、文書取得部102により取得された発明文書が属するグループ、又は、その発明文書に対応する技術分野が、特定された場合に、複数の対訳辞書情報のうちから、そのグループ又は技術分野に対応した対訳辞書情報を選択して、重要語句抽出部1051により抽出された重要語句をキーとしてその選択した対訳辞書情報を検索することで、その重要語句に対応する1つ以上の対訳である語句を検出し、その検出した語句の集合を、その重要語句についての翻訳語候補集合として特定することとしてもよい。この一具体例は、複数のグループ又は技術分野の各々について、そのグループ又は技術分野に属する発明文書における日本語の語句と翻訳先の言語の語句とを対応付けた、グループ別又は技術分野別の複数の対訳辞書情報が存在する場合に利用可能である。この各対訳辞書情報においては、例えば、その対訳辞書情報に対応するグループ又は技術分野における発明文書中の重要語句に対応する語句として選択される可能性が高いと推定される順(つまり対応翻訳語としての妥当性の高い順)に、重要語句に対応する1つ以上の対訳の語句を順序付けておき、翻訳語候補集合特定部1052は、選択した対訳辞書情報における語句の順序と合わせるように、発明文書分析システム10から翻訳語候補集合に係る情報が出力される場合における、翻訳語候補集合の各要素の並び順を定めることとしてもよい。 As another specific example, the translation word candidate set identification unit 1052 identifies the group to which the invention document acquired by the document acquisition unit 102 belongs by the classification unit 1053 or the technical field identification unit 10531, or the group corresponding to the invention document. When the technical field to be used is specified, the bilingual dictionary information corresponding to the group or technical field is selected from a plurality of bilingual dictionary information, and the important phrase extracted by the important phrase extraction unit 1051 is used as a key. By searching the selected bilingual dictionary information, one or more bilingual words corresponding to the key words are detected, and a set of the detected words is specified as a translation word candidate set for the key words. You can do it. One specific example of this is, for each of a plurality of groups or technical fields, a group-by-group or technical-field-by-group correspondence in which Japanese words and phrases in invention documents belonging to that group or technical field are associated with words and phrases in the language to be translated. It can be used when multiple bilingual dictionary information exists. In each bilingual dictionary information, for example, the order in which it is estimated that the words corresponding to the important words in the invention document in the group or technical field corresponding to the bilingual dictionary information are highly likely to be selected (that is, the corresponding translated words one or more bilingual words/phrases corresponding to the important words/phrases are ordered in descending order of relevance as the It is also possible to determine the arrangement order of each element of the translation word candidate set when information relating to the translation word candidate set is output from the invention document analysis system 10 .

翻訳語候補集合特定部1052は、また別の一具体例としては、分類部1053により、文書取得部102により取得された一の発明文書が属するグループが特定された場合に、そのグループに属する別の複数の発明文書各々と、対応する翻訳結果文書各々とから、重要語句抽出部1051により抽出された重要語句と、その重要語句に対応する対応翻訳語との複数組を特定し、その複数組を重要語句翻訳用の機械学習のための教師データとして用いて機械学習により生成された学習モデルである重要語句翻訳用学習モデルを利用する機械翻訳により、その文書取得部102により取得されたその一の発明文書から重要語句抽出部1051により抽出された重要語句各々についての翻訳語候補集合の要素を特定(例えばその機械翻訳結果として得られた1つ又は複数の語句を翻訳語候補集合の要素として特定)することとしてもよい。 As another specific example, when the classification unit 1053 identifies a group to which one invention document obtained by the document obtaining unit 102 belongs, the translation word candidate set identification unit 1052 identifies another group belonging to the group. A plurality of sets of key phrases extracted by the key phrase extraction unit 1051 and corresponding translated words corresponding to the key phrases are specified from each of the plurality of invention documents and each of the corresponding translation result documents, and the plurality of sets as teacher data for machine learning for key phrase translation, the one acquired by the document acquisition unit 102 by machine translation using a learning model for key phrase translation, which is a learning model generated by machine learning Identify the elements of the translation word candidate set for each of the key words extracted by the key word extracting unit 1051 from the invention document (for example, one or more words obtained as the machine translation result as elements of the translation word candidate set specified).

[2-1-5-3.分類部]
分類部1053は、文書取得部102により取得された複数の発明文書各々について、重要語句抽出部1051により抽出された複数の重要語句である重要語句群を用いて、その各々抽出された重要語句群間の相関性に基づいて、その複数の発明文書各々が複数のグループのうちいずれに属するかを特定するためのグループ分類を行う。分類部1053は、重要語句群間の相関性を評価するために、両重要語句群に共通する同一の重要語句の数を計数するアルゴリズム、類義語辞書を利用して両重要語句群における同一又は類似する重要語句の数を計数するアルゴリズム、重要語句群各々に対してある程度十分な数(例えば数千、数万等)の予め定められた文字列各々を要素として、例えばその要素の文字列が重要語句として存在する場合に1、重要語句として存在しない場合に0という要素値を定めたベクトルデータを定義して、そのベクトルデータ間の相関係数を算定する各種アルゴリズム等の、如何なるアルゴリズムを用いてもよい。また、分類部1053は、例えば、発明文書分析システム10のユーザによる指定に基づいて、各発明文書が属するグループを特定する機能を有していてもよい。グループの分類の単位、方法等は、発明文書分析システム10の運用単位(例えば発明文書、対訳辞書情報、或いは、発明文書分析システム10が出力する情報を、相互に伝達し合うユーザ各々が利用する各発明文書分析システム10)において統一されていることが有用となり得る。
[2-1-5-3. Classification Department]
The classification unit 1053 classifies each of the plurality of invention documents acquired by the document acquisition unit 102 into groups of key phrases extracted by the key phrase extraction unit 1051, using key phrase groups that are multiple key phrases extracted by the key phrase extraction unit 1051. Based on the inter-correlation, group classification is performed to specify which of the plurality of groups each of the plurality of invention documents belongs to. In order to evaluate the correlation between the important phrase groups, the classification unit 1053 uses an algorithm for counting the number of identical important phrases common to both important phrase groups and a synonym dictionary to identify the same or similar in both important phrase groups. Algorithm for counting the number of important phrases to be used, with each of predetermined character strings of a certain sufficient number (for example, thousands, tens of thousands, etc.) for each important phrase group as elements, for example, the character strings of the elements are important Defining vector data with an element value of 1 when it exists as a phrase and 0 when it does not exist as an important phrase, and using any algorithm such as various algorithms for calculating the correlation coefficient between the vector data good too. Further, the classification unit 1053 may have a function of specifying a group to which each invention document belongs based on designation by the user of the invention document analysis system 10, for example. The group classification unit, method, etc. are used by each user who mutually communicates the operation unit of the invention document analysis system 10 (for example, invention documents, bilingual dictionary information, or information output by the invention document analysis system 10). It can be useful to be unified in each invention document analysis system 10).

分類部1053は、技術分野特定部10531を含む。 Classification section 1053 includes technical field identification section 10531 .

技術分野特定部10531は、複数の技術分野各々について、その技術分野に関することが知られている1つ以上の発明文書各々が文書取得部102で過去に取得されて重要語句抽出部1051により重要語句群を過去に抽出された結果を利用することで、複数の技術分野のうち、文書取得部102で取得された、技術分野が特定されていない発明文書から重要語句抽出部1051により抽出された重要語句群との相関性が予め定められた程度以上であると評価されたところの、いずれかの技術分野を、その技術分野が特定されていない発明文書に対応する技術分野として特定する。技術分野は、グループの一例とも言える。技術分野は、例えば、国際特許分類(IPC:International Patent Classification)で表現される。技術分野特定部10531は、技術分野として、IPCのどの階層までの分類を用いてもよく、例えばセクションだけ、或いは、セクション及びクラスだけ等を用いて1つの技術分野として取り扱うこととしてもよい。また、技術分野特定部10531は、技術分野を、IPCのセクション、クラス、サブクラス、メイングループ及びサブグループの全てを用いて表現することとしてもよい。例えば、技術分野をIPCのセクションだけで区別することとした場合に、技術分野特定部10531は、特許公報等を用いて、IPCのセクション毎にそのセクションに属する複数の発明文書を取得し、その各発明文書を発明文書分析システム10に取得させて重要語句抽出部1051により抽出された、セクションに対応した重要語句群を得ることができる。例えば、この過去に得られたセクション毎の重要語句群を利用することで、技術分野特定部10531は、文書取得部102で取得された、技術分野としてのセクションが特定されていない発明文書から重要語句抽出部1051により抽出された重要語句群との相関性が予め定められた程度以上であると評価されたところのセクションを、その発明文書の技術分野として特定することができる。 For each of a plurality of technical fields, the technical field identification unit 10531 extracts key phrases from one or more invention documents known to be related to the technical field that have been acquired by the document acquisition unit 102 in the past and are extracted by the key phrase extraction unit 1051 . By using the result of extracting groups in the past, important phrases extracted by the important phrase extraction unit 1051 from invention documents for which technical fields are not specified and which are acquired by the document acquisition unit 102 among a plurality of technical fields. Any technical field evaluated to have a correlation with the group of words or phrases equal to or greater than a predetermined degree is specified as a technical field corresponding to the invention document whose technical field is not specified. The technical field is an example of a group. The technical field is represented by, for example, the International Patent Classification (IPC). The technical field specifying unit 10531 may use classification up to any level of the IPC as the technical field, and for example, use only sections, or only sections and classes, etc., and treat them as one technical field. Further, the technical field specifying unit 10531 may express the technical field using all of IPC sections, classes, subclasses, main groups and subgroups. For example, if the technical field is to be distinguished only by the IPC section, the technical field identification unit 10531 uses patent gazettes and the like to acquire a plurality of invention documents belonging to each section of the IPC, and The key phrase group corresponding to the section, which is extracted by the key phrase extraction unit 1051 by causing the invention document analysis system 10 to acquire each invention document, can be obtained. For example, by using the group of important words and phrases for each section obtained in the past, the technical field specifying unit 10531 can extract the important words from the invention document, which is acquired by the document acquiring unit 102 and whose section as the technical field is not specified. A section that is evaluated to have a correlation with the group of important words and phrases extracted by the word and phrase extraction unit 1051 that is equal to or greater than a predetermined degree can be specified as the technical field of the invention document.

文書取得部102で取得した発明文書に対応して技術分野特定部10531により特定された技術分野(例えばIPC)を示す情報である技術分野情報は、例えば、発明文書分析システム10が出力する特許出願関連情報に含まれる。 The technical field information, which is information indicating the technical field (for example, IPC) identified by the technical field identifying unit 10531 corresponding to the invention document obtained by the document obtaining unit 102, is, for example, the patent application output by the invention document analysis system 10. Included in Related Information.

また、分類部1053により発明文書が属すると特定されたグループ、又は、技術分野特定部10531により発明文書に対応して特定された技術分野は、例えば、翻訳語候補集合特定部1052が、発明文書から抽出された各重要語句に対応する翻訳語候補集合を特定するための対訳辞書情報を選択するために利用され得る。また、分類部1053によるグループ分類は、機械学習部107においてグループ毎の翻訳用学習モデルを生成するために利用され得る。 The group identified by the classification unit 1053 to which the invention document belongs, or the technical field identified corresponding to the invention document by the technical field identification unit 10531, for example, the translation word candidate set identification unit 1052 identifies the invention document can be used to select bilingual dictionary information for specifying a translation word candidate set corresponding to each key phrase extracted from the . Also, the group classification by the classification unit 1053 can be used by the machine learning unit 107 to generate a translation learning model for each group.

[2-1-5-4.翻訳部]
翻訳部1054は、文書取得部102で取得された発明文書を入力として翻訳用学習モデルを利用した、翻訳のために予め定められた演算処理により、その発明文書についての機械翻訳を実行する。翻訳用学習モデルは、発明文書と、その発明文書に基づいて翻訳者等によって翻訳された結果としての翻訳結果文書との複数組を教師データとした機械学習により生成された、機械翻訳のための学習モデルである。
[2-1-5-4. Translation Department]
The translation unit 1054 receives the invention document acquired by the document acquisition unit 102 as an input and executes machine translation of the invention document by a calculation process predetermined for translation using a learning model for translation. The learning model for translation is a model for machine translation that is generated by machine learning using multiple pairs of invention documents and translation result documents as the result of translation by translators etc. based on the invention documents as training data. Learning model.

ここでは、一例として、翻訳用学習モデルは、主として日本語で記載された文書である発明文書を英語の文書に機械翻訳するために用いられる学習モデルであることとして説明するが、発明文書を、英語の代わりに中国語その他の言語の文書に、機械翻訳するために用いられる学習モデルであってもよい。日本語を英語に翻訳するための翻訳用学習モデルの生成のための方法の一例としては、日本語で記載された国際出願の国際公開公報と、その国際出願を米国、英国等の英語を用いる指定国の国内段階に移行するために英語に翻訳した翻訳結果文書に相当する内容が掲載された、その指定国の官庁等により公開された公報との組を、発明文書と翻訳結果文書との組として教師データとして取り扱って教師有りの機械学習を行う方法が、挙げられる。 Here, as an example, the learning model for translation is explained as a learning model used for machine-translating invention documents, which are mainly written in Japanese, into English documents. It may be a learning model used for machine translation into Chinese or other language documents instead of English. As an example of a method for generating a translation learning model for translating Japanese into English, an international publication of an international application written in Japanese and the international application using English of the United States, United Kingdom, etc. A combination of the invention document and the translation result document that contains the content equivalent to the translation result document translated into English for the transition to the national phase of the designated country and published by the government office of the designated country A method of performing supervised machine learning by treating a set as training data is exemplified.

また、発明文書が複数のグループに分類できる場合において、翻訳用学習モデルは、グループ毎に生成される方が、適切な翻訳用学習モデルを選択的に用いたときの機械翻訳の精度、つまり機械翻訳の適正度の向上が期待できる可能性が十分にある。グループの分類の一例としては、電気技術に関する発明文書のグループと、機械技術に関する発明文書のグループと、化学技術に関する発明文書のグループとに分類する例が、挙げられる。また、グループ分類の別の一例として、発明文書が属する技術分野について、IPCで分類した場合におけるIPCのセクション、或いは、セクション及びクラスが相違するものを互いに異なるグループとして分類する例が、挙げられる。また、グループ分類の更に別の一例として、一の発明文書で示された発明を創作した発明者の所属部門を、他の部門と区別するように、発明文書に係る発明者の所属部門別にグループを分類する例が、挙げられる。 In addition, when invention documents can be classified into multiple groups, it is better to generate a learning model for translation for each group, which is the accuracy of machine translation when an appropriate learning model for translation is selectively used. There is a good possibility that an improvement in the adequacy of translation can be expected. As an example of group classification, there is a group of invention documents related to electrical technology, a group of invention documents related to mechanical technology, and a group of invention documents related to chemical technology. Another example of group classification is to classify the technical field to which the invention document belongs, in the case of classifying by IPC, IPC sections, or different sections and classes are classified into different groups. In addition, as another example of group classification, the department to which the inventor who created the invention shown in one invention document belongs is grouped by the department to which the inventor pertaining to the invention document belongs so as to distinguish it from other departments. Examples of classifying are given.

複数のグループ毎或いは技術分野毎に、翻訳用学習モデルが存在する場合において、翻訳部1054は、例えば、文書取得部102で取得された発明文書が属するグループ或いは技術分野を分類部1053により特定し、その発明文書が属するグループ或いは技術分野に対応する翻訳用学習モデルを選択的に利用することで、その発明文書の全部又は一部の機械翻訳を実行することとしてもよい。 When there is a learning model for translation for each of a plurality of groups or technical fields, the translation unit 1054 causes the classification unit 1053 to specify, for example, the group or technical field to which the invention document acquired by the document acquisition unit 102 belongs. By selectively using a learning model for translation corresponding to the group or technical field to which the invention document belongs, all or part of the invention document may be machine-translated.

翻訳部1054による、発明文書についての機械翻訳の結果は、例えば、発明文書分析システム10が出力する特許出願関連情報に含まれ得る。 The result of the machine translation of the invention document by the translation unit 1054 can be included in the patent application related information output by the invention document analysis system 10, for example.

[2-1-6.文書評価部]
文書評価部106は、文書取得部102により取得された複数の発明文書各々について、その発明文書が翻訳用発明文書標準規定で定められた複数の条件のうちの少なくとも一部の各条件を満たすか否かについての判定を行い、その複数の発明文書のうち、その判定がなされた条件を満たす程度が、予め定めた所定程度を超えるところの1つ以上の発明文書を選出する。翻訳用発明文書標準規定で定められた複数の条件のうち、文書評価部106により、発明文書が条件を満たすか否かの判定対象とされる条件は、例えば、設定情報で定めた選択用の情報等に基づいて、或いは、発明文書分析システム10のユーザの選択操作によって、選定され得る。
[2-1-6. Document Evaluation Department]
The document evaluation unit 106 determines whether each of the plurality of invention documents acquired by the document acquisition unit 102 satisfies at least some of the conditions defined in the invention document standard specifications for translation. Then, one or more invention documents are selected from among the plurality of invention documents for which the degree of satisfaction of the determined condition exceeds a predetermined degree. Among a plurality of conditions defined in the standard specification of invention documents for translation, the conditions to be determined by the document evaluation unit 106 as to whether or not the invention document satisfies the conditions are, for example, the conditions for selection defined in the setting information. It can be selected based on information or the like, or by a user's selection operation of the invention document analysis system 10 .

文書評価部106により選出された発明文書は、例えば、機械学習部107で用いられ得る。 Invention documents selected by the document evaluation unit 106 can be used by the machine learning unit 107, for example.

[2-1-7.機械学習部]
機械学習部107は、機械学習により、発明文書に係る機械翻訳のための学習モデルを生成する。
[2-1-7. Machine Learning Department]
The machine learning unit 107 generates a learning model for machine translation of the invention document by machine learning.

機械学習部107は、一例としては、文書評価部106により選出された各発明文書について、その発明文書と、その発明文書に対応して文書取得部102により取得された翻訳結果文書との組を教師データとして、複数組の教師データを用いた機械学習の実行により、翻訳用学習モデルを生成する。 For example, for each invention document selected by the document evaluation unit 106, the machine learning unit 107 obtains a set of the invention document and the translation result document acquired by the document acquisition unit 102 corresponding to the invention document. A learning model for translation is generated by executing machine learning using a plurality of sets of teacher data as teacher data.

機械学習部107は、別の一例としては、複数のグループの各々毎に、文書取得部102により取得された複数の発明文書のうちそのグループに分類部1053により分類された各発明文書についての、その発明文書と、その発明文書の翻訳結果であって文書取得部102により取得された翻訳結果文書との各組を、教師データとして用いた機械学習により、機械翻訳のための学習モデルである翻訳用学習モデルを生成する。これにより発明文書に係る複数のグループ毎に、そのグループに対応する翻訳用学習モデルの生成が可能となる。この例においても、教師データとして用いる発明文書を、例えば、文書評価部106により選出された発明文書に限定してもよい。 As another example, for each of the plurality of groups, the machine learning unit 107 classifies each invention document, among the plurality of invention documents acquired by the document acquisition unit 102, into the group by the classification unit 1053, Translation, which is a learning model for machine translation, is performed by machine learning using each pair of the invention document and the translation result document obtained by the document obtaining unit 102 as the training data. Generate a learning model for As a result, it is possible to generate a learning model for translation corresponding to each group for each of a plurality of groups related to invention documents. In this example as well, invention documents used as training data may be limited to invention documents selected by the document evaluation unit 106, for example.

機械学習部107は、また別の一例としては、文書取得部102により取得された発明文書中に、翻訳用発明文書標準規定で定められた条件に係る不適切文字列パターン情報が示す不適切文字列パターンに該当する文字列が存在した場合には、その発明文書の内容と、翻訳用発明文書標準規定においてその不適切文字列パターン情報に対応付けられた修正情報とに基づいて、翻訳用発明文書標準規定で定められたその条件を満たすようにその発明文書の内容を修正することで生成される修正版発明文書(つまりその修正後の発明文書に相当する内容を有する文書)と、その発明文書に対応して文書取得部102により取得された翻訳結果文書との組を、教師データとして用いた機械学習により、翻訳用学習モデルを生成する。修正版発明文書は、例えば、発明文書中の文字列が、翻訳用発明文書標準規定において修正情報が対応付けられた不適切文字列パターン情報が示す不適切文字列パターンに該当する場合にその文字列をその修正情報に従って削除又は別の文字列に置換すること等によって生成され得る。修正版発明文書は、例えば、発明文書のクレームの文字列を、該当する不適切文字列パターンに対応する修正情報に基づいて修正した内容を表す修正版クレーム情報と、発明文書の明細書の文字列を、該当する不適切文字列パターンに対応する修正情報に基づいて修正した内容を表す修正版明細書情報との少なくとも一方を含む。 As another example, the machine learning unit 107 may extract inappropriate characters from the invention document acquired by the document acquisition unit 102 indicated by inappropriate character string pattern information related to the conditions defined by the standard rules for invention documents for translation. If there is a character string that corresponds to the string pattern, the invention for translation is determined based on the contents of the invention document and the correction information associated with the inappropriate character string pattern information in the standard provisions for invention documents for translation. A modified version of the invention document generated by modifying the content of the invention document so as to satisfy the conditions stipulated in the document standard provisions (that is, a document having content equivalent to the modified invention document), and the invention A learning model for translation is generated by machine learning using a combination of a document and a translation result document acquired by the document acquisition unit 102 corresponding to the document as teacher data. For example, when a character string in an invention document corresponds to an inappropriate character string pattern indicated by inappropriate character string pattern information associated with correction information in the invention document standard specifications for translation, the modified version of the invention document It can be generated by deleting or replacing a string with another string according to its modification information. The amended version of the invention document includes, for example, amended version claim information representing the content of a character string in the claim of the invention document that has been amended based on correction information corresponding to the corresponding inappropriate character string pattern, and the characters of the specification of the invention document. The column includes at least one of corrected version specification information representing contents corrected based on the correction information corresponding to the corresponding inappropriate character string pattern.

機械学習部107により生成された翻訳用学習モデルは、例えば、翻訳部1054で用いられ得る。機械学習部107により生成された翻訳用学習モデルは、例えば、発明文書の翻訳用の機械翻訳システム若しくは機械翻訳用のプログラム、又は、一般的な機械翻訳システム等において利用され得る。 The learning model for translation generated by the machine learning unit 107 can be used in the translation unit 1054, for example. The translation learning model generated by the machine learning unit 107 can be used, for example, in a machine translation system or a machine translation program for translating invention documents, or in a general machine translation system.

[2-1-8.出力部]
出力部108は、文書取得部102により取得された発明文書についての分析部105による分析結果に基づいて生成された情報を出力する。
[2-1-8. Output part]
The output unit 108 outputs information generated based on the analysis result of the analysis unit 105 for the invention document acquired by the document acquisition unit 102 .

出力部108は、例えば、文書取得部102により取得された発明文書から重要語句抽出部1051により抽出された複数の重要語句各々に基づいて生成された情報を出力する。 The output unit 108 outputs, for example, information generated based on each of the multiple key phrases extracted by the key phrase extraction unit 1051 from the invention document acquired by the document acquisition unit 102 .

出力部108は、具体例としては、文書取得部102により取得された発明文書についての分析部105による分析結果に基づいて生成された特許出願関連情報を出力する。図6は、出力部108が出力する特許出願関連情報の内容の一例を示す。 As a specific example, the output unit 108 outputs patent application related information generated based on the analysis result of the analysis unit 105 for the invention document acquired by the document acquisition unit 102 . FIG. 6 shows an example of the content of the patent application related information output by the output unit 108. As shown in FIG.

出力部108が出力する特許出願関連情報には、分析部105により生成された警告情報が含まれ得る。 The patent application related information output by the output unit 108 may include warning information generated by the analysis unit 105 .

出力部108は、例えば、特許出願関連情報を、文書取得部102により取得された発明文書から重要語句抽出部1051により抽出された複数の重要語句各々が、表示されるべき内容として含まれた、表示用文書として出力する機能を有する。表示用文書としての特許出願関連情報は、例えば、複数の重要語句を列挙した重要語句リストを含む。 The output unit 108 outputs, for example, the patent application-related information, each of which is a plurality of important phrases extracted by the important phrase extraction unit 1051 from the invention document acquired by the document acquisition unit 102, as content to be displayed. It has a function to output as a display document. The patent application related information as a display document includes, for example, an important phrase list listing a plurality of important phrases.

ここで、表示用文書は、例えば、ブラウザ(Web Browser)等のアプリケーションプログラムで表示可能な、マークアップ言語等で記述された文書である。表示用文書は、一例としては、HTML(Hypertext Markup Language)で記述されたHTML文書で構成される。HTML文書は、少なくともHTMLファイルを含んで構成され、HTMLファイルは、例えば、HTML5に準拠して記述される。表示用文書における、重要語句等の表示されるべき内容は、例えば、HTMLファイルの<body>タグの内容として記載(つまり<body>タグと</body>タグとの間に記述)されることで、ブラウザ等により表示される。例えば、<body>タグの内容又はその配下の階層のタグの内容における表示されるべき文字は、例えば、等幅フォントで表示されるように設定しておいてもよい。等幅フォントを用いると複数の文字が整列されて表示され得る。また、<body>タグの内容又はその配下の階層のタグの内容における表示されるべき文字は、等幅フォントでなくプロポーショナルフォントで表示されるように設定しておいてもよい。HTMLファイルは、例えば、必要に応じて、外部ファイルを読み込む記述を含んでいてもよいし、その代わりにその外部ファイルに相当する内容を直接HTMLファイル内に記述していてもよい。外部ファイルは、例えば、表示要素の表示態様等についてCSS(Cascading Style Sheets)で記述されたCSSファイル、JavaScript(登録商標)等のスクリプト言語で記述されたスクリプトを内容とするスクリプトファイル等である。このため、表示用文書の一例としてのHTML文書は、例えば、1つ以上のHTMLファイル、1つ以上のCSSファイル、1つ以上のスクリプトファイル等のファイル群で構成され得る。HTMLファイルには、例えばCSSファイル及びスクリプトファイルを特定する情報が含まれる。HTML文書は、HTMLファイルのみで構成されてもよいし、HTMLファイルとCSSファイルとで構成されてもよいし、HTMLファイルとスクリプトファイルとで構成されてもよい。なお、CSSによれば、例えば、特許出願関連情報における文字の表示態様の制御等が可能となり、例えば、CSSのfont-familyプロパティにより、表示されるべき文字のフォントの指定等が可能となる。 Here, the display document is, for example, a document described in a markup language or the like that can be displayed by an application program such as a browser (Web Browser). The display document is, for example, an HTML document written in HTML (Hypertext Markup Language). An HTML document includes at least an HTML file, and the HTML file is written according to HTML5, for example. The content to be displayed, such as key phrases, in the display document should be described as the content of the <body> tag of the HTML file (i.e., described between the <body> tag and the </body> tag). is displayed by a browser or the like. For example, characters to be displayed in the contents of the <body> tag or in the contents of the tags in the hierarchy below it may be set to be displayed in a monospaced font, for example. Multiple characters can be displayed aligned using a monospaced font. Also, characters to be displayed in the contents of the <body> tag or in the contents of the tags in the hierarchy below it may be set to be displayed in a proportional font instead of a monospaced font. For example, the HTML file may include a description for reading an external file as required, or instead, the content corresponding to the external file may be directly described in the HTML file. The external file is, for example, a CSS file in which the display mode of display elements is described in CSS (Cascading Style Sheets), a script file in which a script is described in a script language such as JavaScript (registered trademark), or the like. Therefore, an HTML document, which is an example of a display document, can be composed of files such as one or more HTML files, one or more CSS files, and one or more script files. The HTML file includes information specifying CSS files and script files, for example. The HTML document may consist of an HTML file only, may consist of an HTML file and a CSS file, or may consist of an HTML file and a script file. Incidentally, according to CSS, for example, it is possible to control the display mode of characters in the patent application-related information.

特許出願関連情報は、例えば、文書取得部102により取得された発明文書から重要語句抽出部1051により抽出された複数の重要語句各々について、その重要語句に、その重要語句に関連する付加情報を付加した情報を含む。なお、特許出願関連情報における付加情報は、必ずしも発明文書から重要語句抽出部1051により抽出された全ての重要語句各々に付加される必要はなく、抽出された全ての重要語句のうちの一部である複数の重要語句各々に限って付加されてもよい。 The patent application-related information is, for example, for each of a plurality of important phrases extracted by the important phrase extraction unit 1051 from the invention document acquired by the document acquisition unit 102, to each of the important phrases, additional information related to the important phrase is added. including information about Note that the additional information in the patent application-related information does not necessarily have to be added to each of the important phrases extracted from the invention document by the important phrase extraction unit 1051. It may be added only to each of a plurality of key phrases.

特許出願関連情報における重要語句に関連する付加情報は、例えば、その重要語句の意味を表す翻訳語句である対応翻訳語に関する情報としての翻訳語情報であってもよい。ここで、翻訳語句は、日本語以外の一種類の言語(例えば、英語、中国語等)で表された言葉を含む語句である。例えば重要語句が「物体」である場合における翻訳語句の一例は、「object」である。対応翻訳語に関する情報としての翻訳語情報は、例えば、対応翻訳語自体(例えば重要語句についての機械翻訳結果等)、対応翻訳語の候補の集合である翻訳語候補集合等を表す情報である。翻訳語情報が、重要語句についての翻訳語候補集合を表す情報である翻訳語候補情報である場合において、その翻訳語候補情報には、更に、翻訳語候補集合に関連する情報(例えば、翻訳語候補集合の各要素について、対応翻訳語としての妥当性の高さを示す値、順位等を示す情報)が含まれてもよい。 The additional information related to the key phrase in the patent application related information may be, for example, translation word information as information related to the corresponding translation word, which is the translation word expressing the meaning of the key phrase. Here, a translated phrase is a phrase including words expressed in one language other than Japanese (for example, English, Chinese, etc.). For example, an example of a translated word when the important word is "object" is "object". The translated word information as information about the corresponding translated word is, for example, information representing the corresponding translated word itself (for example, machine translation results of important words and phrases), a set of translated word candidates which is a set of candidates for the corresponding translated word, and the like. When the translation word information is translation word candidate information representing a translation word candidate set for key words, the translation word candidate information further includes information related to the translation word candidate set (for example, translation word candidate Each element of the candidate set may include a value indicating the degree of validity as a corresponding translated word, information indicating a rank, etc.).

また、特許出願関連情報における重要語句に関連する付加情報は、例えば、その重要語句について翻訳語候補集合特定部1052により特定された翻訳語候補集合のうちのいずれかの要素を、操作に応じて選択可能にするように、その翻訳語候補集合をグラフィカルユーザインタフェース(GUI:Graphical User Interface)要素として表示するための表示制御情報を含む。ここで、操作は、特許出願関連情報が、例えばブラウザ等でコンピュータの表示装置に表示された場合において、例えばコンピュータの入力装置に対して、コンピュータのユーザにより、実行され得る。GUI要素の一例は、表示された状態において、操作対象となり得るボタン(例えばプッシュボタン、ラジオボタン等)、メニュー等であるが、文字列等の表示要素であってもGUI要素となり得る。表示用文書の一例としてのHTML文書では、マウスオーバー操作(つまりマウスポインタを対象に重ねる操作)、マウスクリック操作等に対応して起動されるべきスクリプト(例えばJavaScript(登録商標)で記述された関数等)を付加可能なHTMLタグ(例えば<span>タグ)の内容として記述された文字列その他の要素が、操作可能なGUI要素である操作対応GUI要素となり得る。 Further, the additional information related to the key phrase in the patent application related information is, for example, any element of the translation word candidate set identified by the translation word candidate set identification unit 1052 for the key phrase, according to the operation. It includes display control information for displaying the translation word candidate set as a graphical user interface (GUI) element so as to be selectable. Here, the operation can be performed by the computer user, for example, on the input device of the computer when the patent application-related information is displayed on the display device of the computer, for example, by a browser. Examples of GUI elements are buttons (for example, push buttons, radio buttons, etc.), menus, etc. that can be operated in a displayed state, but display elements such as character strings can also be GUI elements. In an HTML document, which is an example of a document for display, a script (for example, a function written in etc.) can be added as the content of an HTML tag (for example, <span> tag) and other elements can be operation-responsive GUI elements that are operable GUI elements.

重要語句に関連する付加情報に含まれる表示制御情報は、一具体例としては、翻訳語候補集合を表す翻訳語候補情報と、GUI要素として表示された状態の、その重要語句についての翻訳語候補集合から、操作に応じて選択された要素を、その重要語句に対応する対応翻訳語として決定する決定処理を実行するためのスクリプトと、その決定処理の実行結果として対応翻訳語が決定された各重要語句についてその重要語句と該当の対応翻訳語とを対応付けた情報である翻訳補助情報を生成して出力する処理を実行するためのスクリプトとを含む。操作に応じてスクリプトが実行されることにより、何らかの処理(重要語句に対応する対応翻訳語として決定する決定処理等)が行われ、例えば、コンピュータの表示装置に表示されている特許出願関連情報に係る表示内容が、その処理の結果に応じて、変化し得る。翻訳語候補集合から選択された要素を対応翻訳語として決定する決定処理では、例えば、決定に伴って、表示されていた翻訳語候補集合が、対応翻訳語へと置換して表示され得る。 As a specific example, the display control information included in the additional information related to key words includes translation word candidate information representing a set of translation word candidates and translation word candidates for the key words displayed as GUI elements. A script for executing a determination process for determining an element selected from the set according to the operation as a corresponding translated word corresponding to the key phrase, and each corresponding translated word determined as a result of the execution of the determination process and a script for executing a process of generating and outputting translation assistance information, which is information in which important words and phrases are associated with corresponding translated words. By executing the script in response to the operation, some processing (such as determination processing for determining the corresponding translated word corresponding to the important phrase) is performed, and for example, the patent application related information displayed on the display device of the computer is displayed. Such display contents may change according to the result of the processing. In the determination process for determining an element selected from the candidate translation word set as the corresponding translation word, for example, the displayed translation word candidate set may be replaced with the corresponding translation word and displayed.

なお、表示用文書としての特許出願関連情報における、ブラウザにより表示された表示内容の全部又は一部は、ユーザの操作により、選択可能であってコピー&ペースト又はカット&ペーストの対象となり得るので、そのペースト(つまり貼り付けること)により、例えば、コンピュータ上で実行されている、あるアプリケーションプログラムが使用している文書等(例えばテキストファイル等)の内容として包含させることができる。また、特許出願関連情報に係るGUI要素に対するユーザ操作に応じて実行される処理の実行結果として、ブラウザにより表示される内容が変化した場合において変化後の表示内容の全部又は一部も、ユーザの操作により、選択可能であってコピー&ペースト等の対象となり得る。 In addition, all or part of the display contents displayed by the browser in the patent application related information as the display document can be selected by the user's operation and can be copied and pasted or cut and pasted. By pasting (that is, pasting), for example, it can be included as the contents of a document or the like (for example, a text file or the like) used by an application program running on a computer. In addition, when the content displayed by the browser changes as a result of the execution of the processing executed in response to the user operation on the GUI element related to the patent application related information, all or part of the display content after the change may also be changed by the user. Depending on the operation, it can be selected and can be the target of copy and paste.

また、重要語句抽出部1051が、重要語句設定辞書取得部103により取得された重要語句設定辞書で対応翻訳語が対応付けられている重要語句と同一の重要語句を、文書取得部102により取得された発明文書から抽出した場合におけるその重要語句に関連する付加情報は、一例としては、その対応翻訳語を表す。また、重要語句抽出部1051が、重要語句設定辞書で対応翻訳語が対応付けられている重要語句以外の重要語句を文書取得部102により取得された発明文書から抽出した場合におけるその抽出した重要語句に関連する付加情報は、一例としては、その重要語句の翻訳語候補集合のうちのいずれかの要素を操作に応じて選択可能となるように、その翻訳語候補集合をGUI要素として、表示するための表示制御情報を含む。この場合の表示制御情報は、例えば、重要語句の翻訳語候補集合を表す翻訳語候補情報と、GUI要素として表示された状態の、重要語句の翻訳語候補集合から、操作に応じて選択された要素を、その重要語句に対応する対応翻訳語として決定する決定処理を実行するためのスクリプトと、その決定処理の実行結果として対応翻訳語が決定された各重要語句についてその重要語句と該当の対応翻訳語とを対応付けた情報を含むように、重要語句設定辞書取得部103により取得された重要語句設定辞書を更新する更新処理を実行するためのスクリプトとを含む。 In addition, the important phrase extraction unit 1051 acquires the same important phrase as the important phrase associated with the corresponding translation word in the important phrase setting dictionary acquired by the important phrase setting dictionary acquisition unit 103, which is obtained by the document acquisition unit 102. As an example, the additional information related to the key phrase extracted from the invention document represents the corresponding translated word. Also, when the important phrase extraction unit 1051 extracts important phrases other than the important phrases associated with the corresponding translated words in the important phrase setting dictionary from the invention document acquired by the document acquisition unit 102, the extracted important phrases As an example, the additional information related to is displayed as a GUI element so that any element of the set of candidate translation words for the important phrase can be selected according to the operation. Contains display control information for The display control information in this case is, for example, selected according to the operation from the candidate translation information representing the set of candidate translation words for the key words and the set of candidate translation words for the key words displayed as GUI elements. A script for executing determination processing for determining an element as a corresponding translated word corresponding to the key phrase, and for each key phrase for which a corresponding translated word is determined as a result of the determination processing, the key phrase and the corresponding correspondence and a script for executing update processing for updating the important phrase setting dictionary acquired by the important phrase setting dictionary acquisition unit 103 so as to include information associated with the translated word.

特許出願関連情報における重要語句に関連する付加情報は、例えば、その重要語句の重要度、その重要語句の属性情報等であってもよい。また、重要語句に関連する付加情報は、重要語句に関連する何らかの処理を、GUI要素の操作に応じて実行するための表示制御情報であってもよい。この場合の表示制御情報は、例えば、GUI要素として表示される内容を示す情報と、GUI要素に対する操作(例えば、マウスクリック操作)を示す情報と、操作に対応して起動される処理を記述したスクリプトとを関連付けたものである。 The additional information related to the key phrase in the patent application related information may be, for example, the importance of the key phrase, the attribute information of the key phrase, and the like. Further, the additional information related to the key phrase may be display control information for executing some processing related to the key phrase in accordance with the operation of the GUI element. The display control information in this case describes, for example, information indicating the content displayed as a GUI element, information indicating an operation (for example, mouse click operation) on the GUI element, and processing to be activated corresponding to the operation. It is associated with a script.

なお、出力部108における、特許出願関連情報等の情報の出力の実現態様の例としては、その情報の記録媒体への書き出し、その情報のファイルとしての書き出し、その情報の表示、その情報の印刷、その情報の送信、その情報を表す音声の出力、その他、その情報を表す物理現象を起こすこと等が、挙げられる。 Examples of the output of information such as patent application-related information in the output unit 108 include writing the information to a recording medium, writing the information as a file, displaying the information, and printing the information. , transmission of the information, output of sound representing the information, and other physical phenomena representing the information.

出力部108は、例えば、ブラウザに相当する機能の全部又は一部を有してもよく、特許出願関連情報を表示することで、特許出願関連情報の出力を実現してもよい。出力部108は、特許出願関連情報を内容とする表示用文書(例えばHTML文書)を生成した上で、その表示用文書に従って、特許出願関連情報の表示を実現してもよい。 The output unit 108 may have, for example, all or part of a function corresponding to a browser, and may output the patent application related information by displaying the patent application related information. The output unit 108 may generate a display document (for example, an HTML document) containing patent application related information, and then display the patent application related information according to the display document.

文書取得部102により取得された発明文書にクレームが含まれている場合には、出力部108は、例えば、特許出願関連情報に、そのクレームの内容を表すクレーム情報を含めることとしてもよい。表示用文書としての特許出願関連情報においては、クレーム情報は表示されるべき内容の1つとなる。 If a claim is included in the invention document acquired by the document acquisition unit 102, the output unit 108 may include, for example, claim information representing the content of the claim in the patent application related information. In patent application-related information as a display document, claim information is one of the contents to be displayed.

表示用文書における、発明文書のクレームの内容を表すクレーム情報は、重要語句抽出部1051により抽出されたそのクレーム中の複数の重要語句各々についてのその重要語句に関連する付加情報に含まれる表示制御情報として、その重要語句の表示態様を制御するための情報、例えば、その重要語句に付加される色を示す情報等を含む。例えばHTML文書としての特許出願関連情報における、ある重要語句についての表示制御情報は、例えば、HTMLファイルにおいてその重要語句を内容として記載する<span>タグ(つまり内容となる重要語句に前置される<span>タグ)に付与された、その重要語句を他の重要語句と識別するように定められた識別情報の一例としてのクラス名と、CSSファイルにおいてそのクラス名の<span>タグの内容の表示態様としての表示色を定めた情報とを含んで構成される。この場合にCSSファイルには、例えば、複数の識別情報(例えば複数のクラス名)各々についての<span>タグの内容の表示態様としての色を示す情報が含まれ得る。重要語句に付加される色を示す情報は、例えば、重要語句の文字列に対する文字色、文字背景色等、或いは、重要語句の文字列を囲む最小矩形状の境界線の上下左右の少なくとも一辺に線幅を与えた場合のその一辺の線色等を、例えばRGB値等で表現した色情報である。出力部108は、例えば、クレーム情報中の、重要語句抽出部1051により抽出された重要語句を構成する文字列が互いに相違する複数の重要語句各々を、互いに相違する色(つまり表示色)を付加して、表示してもよい。これは、例えば、重要語句を構成する文字列が互いに相違する複数の重要語句について各々互いに異なるようにクラス名を定め、クラス名毎についての<span>タグの内容の表示態様としての表示色を示す色情報を、クラス毎に相違する色を示すように定めることで実現できる。また、出力部108は、例えば、クレーム情報中の、重要語句抽出部1051により抽出された重要語句を構成する文字列が互いに相違する上述の複数の重要語句のうちのいずれか1つの重要語句と同一の文字列で構成される、クレーム情報中の重要語句には、その前述の1つの重要語句と同じ色(つまり同一の表示色)を付加して表示してもよい。このような重要語句間で同じ表示色を付加することは、表示色に係る同じクラス名のクラスを利用することで実現可能である。なお、互いに相違する重要語句の数が予め定めた一定数(例えば500等)を超える場合については、重要語句の重要度、或いは、属性情報(例えば初出行番号)等に基づいて定めた順に一定数までは相違する重要語句を相違するRGB値の色で表現し、その一定数を超える分の重要語句については所定の1つのRGB値を用いた同一色で表現することとしてもよい。 The claim information representing the content of the claim of the invention document in the document for display is display control included in the additional information related to each of the key words in the claim extracted by the key word extracting unit 1051. The information includes information for controlling the display mode of the key phrase, such as information indicating the color added to the key phrase. For example, the display control information for a certain key phrase in the patent application-related information as an HTML document is, for example, a <span> tag that describes the key phrase as content in the HTML file (that is, the <span> tag), as an example of identification information determined to distinguish the important phrase from other important phrases, and the contents of the <span> tag of the class name in the CSS file and information defining a display color as a display mode. In this case, the CSS file may include, for example, information indicating colors as display modes of the contents of <span> tags for each of a plurality of pieces of identification information (for example, a plurality of class names). The information indicating the color to be added to the important phrase is, for example, the character color, the character background color, etc. for the character string of the important phrase. This is color information that expresses the line color of one side when the line width is given, for example, using RGB values. For example, the output unit 108 adds different colors (that is, display colors) to each of a plurality of key phrases having mutually different character strings constituting the key phrase extracted by the key phrase extraction unit 1051 in the complaint information. and display it. For example, for a plurality of key phrases having different character strings constituting key phrases, class names are defined so as to be different from each other, and the display color as a display mode of the content of the <span> tag for each class name is set. This can be achieved by defining the color information to be displayed so that different colors are displayed for each class. In addition, the output unit 108 outputs, for example, any one of the above-described key phrases in which the character strings constituting the key phrase extracted by the key phrase extraction unit 1051 in the complaint information are different from each other. Key phrases in the complaint information, which are composed of the same character string, may be displayed in the same color (that is, the same display color) as the aforementioned one key phrase. Adding the same display color to such important words can be realized by using classes with the same class name related to the display color. In addition, if the number of key phrases that differ from each other exceeds a predetermined number (for example, 500, etc.), a fixed order will be determined based on the importance of the key phrases or attribute information (eg, first appearance number). Up to a certain number, different key phrases may be expressed in colors of different RGB values, and important phrases exceeding the fixed number may be expressed in the same color using one predetermined RGB value.

文書取得部102により取得された発明文書に明細書が含まれている場合には、出力部108は、例えば、特許出願関連情報に、その明細書の内容を表す明細書情報を含めることとしてもよい。表示用文書としての特許出願関連情報においては、明細書情報は表示されるべき内容の1つとなる。 When the specification is included in the invention document acquired by the document acquisition unit 102, the output unit 108, for example, includes the specification information representing the content of the specification in the patent application related information. good. In patent application-related information as a display document, specification information is one of the contents to be displayed.

表示用文書における、発明文書の明細書の内容を表す明細書情報は、重要語句抽出部1051により抽出されたその明細書中の複数の重要語句各々についてのその重要語句に関連する付加情報に含まれる表示制御情報として、その重要語句の表示態様を制御するための情報、例えば、その重要語句に付加される色を示す情報等を含む。 The description information representing the content of the specification of the invention document in the display document is included in the additional information related to each of the key words in the specification extracted by the key word extracting unit 1051. The display control information included in the key phrase includes information for controlling the display mode of the key phrase, for example, information indicating the color to be added to the key phrase.

出力部108は、例えば、明細書情報における重要語句抽出部1051により抽出された複数の重要語句各々について、その重要語句が、クレーム情報における重要語句抽出部1051により抽出された複数の重要語句のいずれかと同一であれば、明細書情報におけるその重要語句を、クレーム情報におけるその同一の重要語句と同一の表示態様で表示(例えば同一の色を付加して表示)し、明細書情報におけるその重要語句が、クレーム情報における重要語句抽出部1051により抽出された複数の重要語句のいずれとも相違すれば、明細書情報におけるその重要語句を、クレーム情報におけるその複数の重要語句のいずれとも相違する表示態様で表示してもよい。なお、出力部108は、上述のように、明細書情報中の重要語句が、クレーム情報中の重要語句と同一の重要語句であるか否かを識別可能に表示することを、ブラウザ等によって可能とするように、明細書情報における各重要語句についての表示制御情報を適切に定めた表示用文書を構成して、出力することとしてもよい。表示用文書中の明細書情報における一の重要語句についての表示制御情報は、例えば、その一の重要語句がクレーム情報における重要語句抽出部1051により抽出された重要語句のいずれかと同一であれば、明細書情報におけるその一の重要語句を、クレーム情報における同一の重要語句と同様の表示態様で表示させ、明細書情報におけるその一の重要語句が、クレーム情報における重要語句抽出部1051により抽出された重要語句のいずれとも相違すれば、明細書情報におけるその一の重要語句を、クレーム情報における抽出された重要語句のいずれとも相違する表示態様で表示させるように制御する情報を含む。 For example, for each of the multiple key phrases extracted by the key phrase extraction unit 1051 in the specification information, the output unit 108 determines which of the multiple key phrases extracted by the key phrase extraction unit 1051 in the claim information. If it is the same as, the key phrase in the description information is displayed in the same display mode as the same key phrase in the claim information (for example, displayed with the same color added), and the key phrase in the description information However, if it differs from any of the multiple key phrases extracted by the key phrase extraction unit 1051 in the claim information, the key phrase in the specification information is displayed in a manner different from any of the multiple key phrases in the claim information. may be displayed. As described above, the output unit 108 can use a browser or the like to display whether or not the key words in the specification information are the same key words in the complaint information so as to be identifiable. , a display document in which the display control information for each key phrase in the specification information is appropriately determined may be configured and output. The display control information for one important phrase in the specification information in the display document is, for example, if the one important phrase is the same as any of the important phrases extracted by the important phrase extraction unit 1051 in the claim information, The one important phrase in the specification information is displayed in the same display mode as the same important phrase in the claim information, and the one important phrase in the specification information is extracted by the important phrase extraction unit 1051 in the claim information. If it differs from any of the important phrases, it includes information for controlling to display the one important phrase in the specification information in a display mode different from any of the extracted important phrases in the claim information.

分析部105による発明文書の分析結果に基づいて、出力部108が、表示用文書として生成する特許出願関連情報にクレーム情報及び明細書情報を含める場合において、重要語句抽出部1051によりその発明文書から抽出された、クレーム情報又は明細書情報中の複数の重要語句のうち、その発明文書において符号が付加されて記載された要素名を表す語句と同一の重要語句についての、その重要語句に関連する付加情報としての表示制御情報は、例えば、その重要語句を、操作に応じて、その発明文書に対応して文書取得部102により取得された図面文書(例えば検索可能PDFファイル)中のその重要語句に係るその符号が記載された部分(例えば図面文書においてその符号を検索することで特定された、その符号が記載された頁、位置等)の表示のための操作対応GUI要素(つまり操作に対応するGUI機能を有する表示要素)として表示するための情報を含む。 Based on the analysis result of the invention document by the analysis unit 105, when the output unit 108 includes the claim information and the specification information in the patent application related information generated as the document for display, the important phrase extraction unit 1051 extracts from the invention document Of the multiple extracted key words in the claim information or specification information, the key words that are the same as the key words that represent the element names that are added with a code in the invention document are related to the key words. The display control information as additional information is, for example, the key words in the drawing document (for example, searchable PDF file) acquired by the document acquisition unit 102 corresponding to the invention document according to the operation. Operation-responsive GUI element for displaying the part where the code is described (for example, the page, position, etc. where the code is described, specified by searching for the code in the drawing document) (that is, the operation-based It contains information to display as a display element with GUI function to

特許出願関連情報を表示する例における出力部108は、特許出願関連情報中のクレーム情報及び明細書情報における重要語句抽出部1051により抽出された複数の重要語句の表示態様を、その複数の重要語句以外の語句の表示態様と相違させて表示するようにするための強調表示情報を含んだ、表示制御情報等を含む表示用文書を生成して、その表示用文書に従って表示を行ってもよい。表示用文書の一例としてのHTML文書に基づいて表示を行うブラウザ等によりこの表示を実現させるための一例としては、出力部108は、HTML文書としての特許出願関連情報において、例えば、その複数の重要語句以外の語句の表示態様を制御する表示制御情報として、文字列に対する既定値としての文字色、文字背景色等を定めておく。そして、その複数の重要語句各々の表示態様を制御する表示制御情報に、上述したようにその複数の重要語句各々を識別可能に定められたクラス名の、重要語句を内容とする<span>タグの内容の表示態様としての文字色、文字背景色等を、その既定値以外となるように定めた色情報等の、強調表示情報を含ませる。 The output unit 108 in the example of displaying the patent application related information displays the display mode of the multiple key phrases extracted by the key phrase extraction unit 1051 in the claim information and the specification information in the patent application related information as the multiple key phrases. A display document containing display control information and the like including highlighting information for displaying in a manner different from the display mode of words other than the word may be generated, and display may be performed according to the display document. As an example of realizing this display by a browser or the like that displays based on an HTML document as an example of a document for display, the output unit 108 may output a plurality of important As display control information for controlling the display mode of words other than words, a character color, a character background color, etc., as default values for character strings, are determined. Then, in the display control information for controlling the display mode of each of the plurality of important phrases, a <span> tag having the content of the important phrase of the class name determined so as to be able to identify each of the plurality of important phrases as described above Highlight display information such as color information that sets the character color, character background color, etc. as the display mode of the contents of the above to values other than the default values is included.

特許出願関連情報を表示する例における出力部108は、特許出願関連情報中のクレーム情報における重要語句抽出部1051により抽出された複数の重要語句各々について、その重要語句を、操作に応じてその重要語句に係る情報付加表示を実行するためのGUI要素として表示するようにしてもよい。表示用文書に基づいて表示を行うブラウザ等によりこの表示を実現させるための一例としては、出力部108は、表示用文書としての特許出願関連情報中の各重要語句について、その重要語句の表示制御情報で、例えば、その重要語句に係る情報付加表示のための情報と、その重要語句を、操作に応じてその重要語句に係る情報付加表示を実行するためのGUI要素として表示するための情報とを含ませる。 The output unit 108 in the example of displaying the patent application related information converts each of the multiple key terms extracted by the key term extraction unit 1051 in the claim information in the patent application related information into the key terms according to the operation. It may be displayed as a GUI element for executing information addition display related to words. As an example for realizing this display by a browser or the like that displays based on the display document, the output unit 108 controls the display of each key phrase in the patent application-related information as the display document. Information, for example, information for displaying information added to the key phrase, and information for displaying the key phrase as a GUI element for executing the information added display related to the key phrase in response to an operation. include.

重要語句に係る情報付加表示は、その重要語句に、その重要語句に関連する付加情報を付加して表示する処理のことであり、例えば、その重要語句についての重要度、属性情報、翻訳語情報(例えば対応翻訳語、翻訳語候補集合)等、又は、その重要語句に関する検索結果を表示することである。重要語句についての重要度、属性情報、及び、重要語句に関する検索結果については、如何なる方法で特定したものであってもよく、例えば、後述する実施形態2で示すものと同様であってもよい。 The information-added display related to the important phrase is a process of adding additional information related to the important phrase to the important phrase and displaying it. (For example, a corresponding translation word, a translation word candidate set), etc., or to display search results related to the important phrase. The importance and attribute information of key words and the search results of key words may be specified by any method, and may be the same as those shown in Embodiment 2 described later, for example.

出力部108が、文書取得部102により取得された発明文書のクレームの内容を表すクレーム情報を含む特許出願関連情報を表示用文書として出力する場合における表示されるべきクレーム情報の一例は、クレームの内容に加えて、そのクレームの内容における重要語句抽出部1051により抽出された複数の重要語句各々について、そのクレームの内容におけるその重要語句の部分を、その重要語句に対応する対応翻訳語又は翻訳語候補集合に、置換した内容を含んでもよい。この場合において、クレーム情報は、例えば、発明文書のクレームを表した部分(例えば一行分の記載等)毎に、その部分に後続して、その部分をコピーした記載における重要語句を、対応翻訳語又は翻訳語候補集合に置換したものが挿入された態様であってもよい。 An example of the claim information to be displayed when the output unit 108 outputs, as a display document, patent application related information including claim information representing the content of the claims of the invention document acquired by the document acquisition unit 102 is In addition to the content, for each of a plurality of key phrases extracted by the key phrase extraction unit 1051 in the content of the claim, the portion of the key phrase in the content of the claim is converted into a corresponding translated word or translated word corresponding to the key phrase. The candidate set may contain the replaced content. In this case, the claim information is, for example, for each part (for example, one line of description, etc.) that represents the claim of the invention document, following that part, the important words in the description that copied that part, Alternatively, it may be a mode in which the replaced word is inserted into the translation word candidate set.

また、出力部108が、文書取得部102により取得された発明文書の明細書の内容を表す明細書情報を含む特許出願関連情報を表示用文書として出力する場合における表示されるべき明細書情報の一例は、明細書の内容に加えて、その明細書の内容における重要語句抽出部1051により抽出された複数の重要語句各々について、その明細書の内容におけるその重要語句の部分を、その重要語句に対応する対応翻訳語又は翻訳語候補集合に、置換した内容を含んでもよい。この場合において、明細書情報は、例えば、発明文書の明細書を表した部分(例えば一行分の記載等)毎に、その部分に後続して、その部分をコピーした記載における重要語句を、対応翻訳語又は翻訳語候補集合に置換したものが挿入された態様であってもよい。 Also, the specification information to be displayed when the output unit 108 outputs the patent application-related information including the specification information representing the content of the specification of the invention document acquired by the document acquisition unit 102 as a document for display. For example, in addition to the content of the specification, for each of a plurality of key phrases extracted by the key phrase extraction unit 1051 in the content of the specification, the key phrase part in the content of the specification is added to the key phrase. The corresponding translation word or translation word candidate set may include the replaced content. In this case, the description information is, for example, for each part that represents the description of the invention document (for example, one line of description, etc.), following that part, key phrases in the description that is a copy of that part A mode in which a replacement word or a translation word candidate set is inserted may also be used.

翻訳用発明文書標準規定取得部104により取得された翻訳用発明文書標準規定で定められた複数の条件のうちの幾つかの条件各々について、その条件に係る不適切文字列パターン情報が示す不適切文字列パターンに該当する文字列が、文書取得部102により取得された発明文書におけるクレーム中に存在した場合には、出力部108が出力する特許出願関連情報は、例えば、そのクレームと、翻訳用発明文書標準規定においてその不適切文字列パターン情報に対応付けられた修正情報とに基づいて、その条件を満たすようにそのクレームを修正することで生成される修正版クレーム情報を含み得る。翻訳用発明文書標準規定で定められた複数の条件のうちのその幾つかの条件は、例えば、設定情報で定めた選択用の情報に基づいて、或いは、発明文書分析システム10のユーザの選択操作によって、選定され得る。また、翻訳用発明文書標準規定取得部104により取得された翻訳用発明文書標準規定で定められた複数の条件のうちの幾つかの条件各々について、その条件に係る不適切文字列パターン情報が示す不適切文字列パターンに該当する文字列が、文書取得部102により取得された発明文書における明細書中に存在した場合には、出力部108が出力する特許出願関連情報は、例えば、その明細書と、翻訳用発明文書標準規定においてその不適切文字列パターン情報に対応付けられた修正情報とに基づいて、その条件を満たすようにその明細書を修正することで生成される修正版明細書情報を含み得る。 Inappropriateness indicated by inappropriate character string pattern information pertaining to each of several conditions out of a plurality of conditions defined in the invention document standard specification for translation acquired by the standard specification of invention document for translation acquisition unit 104 If a character string corresponding to the character string pattern exists in a claim in the invention document acquired by the document acquisition unit 102, the patent application related information output by the output unit 108 includes, for example, the claim and the translation Based on the correction information associated with the inappropriate character string pattern information in the standard specification of the invention document, it may include the corrected version claim information generated by correcting the claim so as to satisfy the conditions. Some of the conditions defined in the invention document standard specification for translation are, for example, based on information for selection defined in the setting information, or selected by the user of the invention document analysis system 10. can be selected by In addition, for each of several conditions among the plurality of conditions defined in the invention document standard specification for translation acquired by the standard specification of invention document for translation acquisition unit 104, inappropriate character string pattern information related to the condition is indicated. If a character string corresponding to the inappropriate character string pattern exists in the specification of the invention document acquired by the document acquisition unit 102, the patent application-related information output by the output unit 108 is, for example, the specification and the correction information associated with the inappropriate character string pattern information in the standard specifications for invention documents for translation, and amended specification information generated by correcting the specification to satisfy the conditions. can include

文書取得部102により取得された発明文書にクレームが含まれている場合において、そのクレームの所定の一項(例えば1つの請求項)が、複数の項(例えば複数の請求項)を引用しているときには、出力部108が出力する、分析部105による発明文書の分析結果に基づいて生成される特許出願関連情報は、例えば、その所定の一項を、その複数の項のうちの項番が最先の1つの項のみを引用するように変更した内容を含むように、そのクレームを修正した結果を表す修正版クレーム情報と、その修正版クレーム情報が表すクレームの各項の引用関係を、相互に引用関係のある項同士の項番間を線又は記号を用いて対応付けた表現で、表した情報としての修正版クレームツリーとを含み得る。 When a claim is included in the invention document acquired by the document acquisition unit 102, a predetermined claim (for example, one claim) of the claim refers to a plurality of claims (for example, a plurality of claims). patent application-related information generated based on the analysis result of the invention document by the analysis unit 105, which is output by the output unit 108, for example, one of the predetermined items, the item number of which is Amended claim information representing the result of amending the claim so as to include content changed to quote only the first paragraph, and the citation relationship between each clause of the claim represented by the amended claim information, It can include a modified claim tree as information represented by an expression in which the section numbers of mutually citation relationships are associated with each other using lines or symbols.

出力部108が出力する、分析部105による発明文書の分析結果に基づいて生成される特許出願関連情報は、例えば、その発明文書から重要語句抽出部1051により抽出された複数の重要語句各々の間の関係を示す重要語句関係情報を含んでもよい。この重要語句関係情報は、例えば、複数の重要語句各々が表す要素相互間における構成上の包含関係を示す包含関係情報を含む。例えば、発明文書に「入力部」と「表示部」とを含む「情報処理装置」が記載されていた場合において、重要語句として「情報処理装置」、「入力部」及び「表示部」が抽出されたときには、重要語句により表される要素「情報処理装置」が、重要語句により表される要素群としての「入力部」及び「表示部」を、構成上包含しているという関係を示す包含関係情報を含む特許出願関連情報を、出力部108は出力し得る。 The patent application-related information, which is output by the output unit 108 and generated based on the analysis result of the invention document by the analysis unit 105, is, for example, between each of the key phrases extracted from the invention document by the key phrase extraction unit 1051. It may also include key phrase relationship information indicating the relationship between. This important phrase relationship information includes, for example, inclusion relationship information indicating structural inclusion relationships between elements represented by each of a plurality of important phrases. For example, if an invention document describes an "information processing device" that includes an "input section" and a "display section," "information processing device," "input section," and "display section" are extracted as key phrases. Inclusion indicates the relationship that the element "information processing device" represented by the key phrase includes the "input unit" and "display unit" as the element group represented by the key phrase in terms of structure. The output unit 108 can output patent application related information including related information.

また、出力部108が出力する特許出願関連情報は、例えば、翻訳部1054による、発明文書についての機械翻訳の結果を含んでもよい。 Further, the patent application related information output by the output unit 108 may include the result of machine translation of the invention document by the translation unit 1054, for example.

出力部108は、一例として、学習モデル出力部1081を含む。 The output unit 108 includes a learning model output unit 1081 as an example.

出力部108により出力された、複数の重要語句それぞれを、翻訳語候補集合からの選択操作が可能なGUI要素として表示するための表示制御情報を含む表示用文書(例えばHTML文書)がブラウザ等で表示された場合において、その表示制御情報に含まれるスクリプトによって、重要語句に対する翻訳語候補集合から、操作に応じて選択された要素を、その重要語句に対応する対応翻訳語として決定する決定処理と、その決定処理の実行結果として対応翻訳語が決定された各重要語句について翻訳補助情報を生成して出力する処理とが実行される。 A display document (e.g., HTML document) containing display control information for displaying each of a plurality of key words output by the output unit 108 as a GUI element that can be selected from a translation word candidate set can be displayed in a browser or the like. determination processing for determining an element selected according to an operation from a translation word candidate set for a key phrase as a corresponding translation word corresponding to the key phrase by a script included in the display control information when it is displayed; , and a process of generating and outputting translation assistance information for each key phrase for which a corresponding translation word has been determined as a result of the determination process.

学習モデル出力部1081は、上述したように、文書取得部102により取得された複数の発明文書各々に対して出力された表示用文書各々が表示された結果として生成された複数の翻訳補助情報各々における、重要語句と、対応する対応翻訳語との組を、重要語句翻訳用の機械学習のための教師データとして用いて、機械学習により生成された学習モデルである重要語句翻訳用学習モデルを出力する。この機械学習は、例えば一般的な機械学習アルゴリズムを用い、一定の相関関係を有する重要語句とこれに対応する対応翻訳語との組を、教師データとした演算処理により実現される。一般的な機械学習アルゴリズムの例として、入力層、出力層、及び隠れ層から構成され層間に情報の伝達の程度を表す重みを持たせるニューラルネットワーク、その隠れ層を多数含ませた深層学習(Deep Learning)等が、挙げられる。深層学習では、ニューラルネットワークの入力と出力との組を教師データに近づける(つまり誤差を小さくする)ために、ニューラルネットワークの各層の重みを調整することで学習を行う。この重みの調整の方法として、例えば、誤差逆伝播法(Back Propagation)等が用いられ得る。 As described above, the learning model output unit 1081 outputs each of the plurality of translation assistance information generated as a result of displaying each of the display documents output for each of the plurality of invention documents acquired by the document acquisition unit 102. , using pairs of key phrases and corresponding translated words as training data for machine learning for key phrase translation, and outputting a learning model for key phrase translation, which is a learning model generated by machine learning. do. This machine learning is realized by arithmetic processing using, for example, a general machine learning algorithm and using pairs of important words and phrases having a certain correlation and corresponding translation words as teacher data. Examples of general machine learning algorithms include a neural network consisting of an input layer, an output layer, and a hidden layer, with weights representing the degree of information transmission between layers, and deep learning (Deep Learning) that includes many hidden layers. Learning) and the like. In deep learning, learning is performed by adjusting the weight of each layer of the neural network in order to bring the pair of input and output of the neural network closer to the teacher data (that is, to reduce the error). As a method for adjusting this weight, for example, the error back propagation method or the like can be used.

また、学習モデル出力部1081は、例えば、機械学習部107により生成された翻訳用学習モデルを出力する機能を有していてもよい。学習モデル出力部1081による学習モデル(重要語句翻訳用学習モデル又は翻訳用学習モデル)の出力形式は、例えば翻訳部1054、或いは、その他の機械翻訳のための処理システムが参照可能な、如何なる形式であってもよい。学習モデル出力部1081は、一例としては、学習モデルを、発明文書分析システム10の内部又は外部の記録媒体におけるファイル、データベースのデータ等の内容として出力する。 Also, the learning model output unit 1081 may have a function of outputting the learning model for translation generated by the machine learning unit 107, for example. The output format of the learning model (key phrase translation learning model or translation learning model) by the learning model output unit 1081 is any format that can be referred to, for example, by the translation unit 1054 or other processing systems for machine translation. There may be. As an example, the learning model output unit 1081 outputs the learning model as content such as a file in a recording medium inside or outside the invention document analysis system 10, data in a database, or the like.

[2-2.実施形態1に係る発明文書分析処理例]
上述した構成を備える発明文書分析システム10が実行する発明文書分析処理の一例について説明する。
[2-2. Invention document analysis processing example according to the first embodiment]
An example of invention document analysis processing executed by the invention document analysis system 10 having the above configuration will be described.

図7は、発明文書分析処理の一例を示すフローチャートである。 FIG. 7 is a flowchart showing an example of invention document analysis processing.

発明文書分析処理は、例えば、設定情報取得ステップS1と文書取得ステップS2と分析ステップS3と出力ステップS4とを含む。 The invention document analysis process includes, for example, a setting information acquisition step S1, a document acquisition step S2, an analysis step S3, and an output step S4.

発明文書分析システム10は、設定情報取得ステップS1において、重要語句の抽出の条件を示す条件情報を含む設定情報(図5参照)を取得する。 In the setting information acquisition step S1, the invention document analysis system 10 acquires setting information (see FIG. 5) including condition information indicating conditions for extracting key words.

発明文書分析システム10は、文書取得ステップS2において、発明文書を取得する。 The invention document analysis system 10 acquires the invention document in the document acquisition step S2.

発明文書分析システム10は、分析ステップS3において、文書取得ステップS2において取得された発明文書を、設定情報取得ステップS1において取得された設定情報に基づいて分析する。分析ステップS3は、重要語句抽出ステップS31を含む処理である。 In the analysis step S3, the invention document analysis system 10 analyzes the invention document acquired in the document acquisition step S2 based on the setting information acquired in the setting information acquisition step S1. The analysis step S3 is a process including an important phrase extraction step S31.

発明文書分析システム10は、重要語句抽出ステップS31において、文書取得ステップS2において取得された発明文書から、設定情報取得ステップS1において取得された設定情報の条件情報に基づいて、重要語句を抽出する。 In the important phrase extraction step S31, the invention document analysis system 10 extracts important phrases from the invention document acquired in the document acquisition step S2 based on the condition information of the setting information acquired in the setting information acquisition step S1.

発明文書分析システム10は、出力ステップS4において、文書取得ステップS2において取得された発明文書についての分析ステップS3における分析結果に基づいて生成された情報を出力する。発明文書分析システム10は、出力ステップS4では、文書取得ステップS2において取得された発明文書から重要語句抽出ステップS31において抽出された複数の重要語句各々に基づいて生成された情報を出力する。発明文書分析システム10により、出力ステップS4において出力される情報の一例が、特許出願関連情報(図6参照)である。発明文書分析システム10は、文書取得ステップS2で発明文書及び対応する翻訳結果文書を取得し、出力ステップS4において、一定条件を満たす発明文書と翻訳結果文書との組を教師データとした機械学習の結果として生成された、翻訳用学習モデル又は重要語句翻訳用学習モデルを出力してもよい。 In the output step S4, the invention document analysis system 10 outputs information generated based on the analysis result in the analysis step S3 of the invention document acquired in the document acquisition step S2. In the output step S4, the invention document analysis system 10 outputs information generated based on each of the multiple key phrases extracted in the key phrase extraction step S31 from the invention document acquired in the document acquisition step S2. An example of the information output in the output step S4 by the invention document analysis system 10 is the patent application related information (see FIG. 6). The invention document analysis system 10 acquires the invention document and the corresponding translation result document in the document acquisition step S2, and performs machine learning using pairs of the invention document and the translation result document satisfying certain conditions as training data in the output step S4. A learning model for translation or a learning model for important phrase translation that is generated as a result may be output.

重要語句抽出ステップS31では、例えば、条件情報における、重要語句候補文字列パターンを示す重要語句候補文字列パターン情報と、参照文字列パターンを示す参照文字列パターン情報と、符号文字列パターンを示す符号文字列パターン情報と、特定助詞文字列パターンを示す特定助詞文字列パターン情報とを参照することで、文書取得ステップS2において取得された発明文書中に、参照文字列パターンに該当する第1文字列に後続して重要語句候補文字列パターンに該当する第2文字列が存在する場合に、その第2文字列と同一の文字列を重要語句として抽出し、その発明文書にクレームが含まれている場合においてそのクレーム中に、重要語句候補文字列パターンに該当する第3文字列に後続して句点文字が存在するときには、その第3文字列と同一の文字列を重要語句として抽出し、その発明文書中に、重要語句候補文字列パターンに該当する第4文字列に後続して符号文字列パターンに該当する第5文字列が存在する場合に、その第4文字列と同一の文字列を重要語句として抽出し、その発明文書中に、重要語句候補文字列パターンに該当する第6文字列に後続して特定助詞文字列パターンに該当する第7文字列が存在する場合に、その第6文字列と同一の文字列を重要語句として抽出する。 In the important phrase extraction step S31, for example, important phrase candidate character string pattern information indicating an important phrase candidate character string pattern, reference character string pattern information indicating a reference character string pattern, and code indicating a code character string pattern in the condition information are extracted. By referring to the character string pattern information and the specific particle character string pattern information indicating the specific particle character string pattern, the first character string corresponding to the reference character string pattern is included in the invention document acquired in the document acquisition step S2. If there is a second character string corresponding to the key word candidate character string pattern following , the same character string as the second character string is extracted as a key word, and the claim is included in the invention document In that case, if there is a period character following the third character string corresponding to the keyword candidate character string pattern in the claim, the same character string as the third character string is extracted as the important phrase, and the invention If there is a fifth character string corresponding to the code character string pattern following the fourth character string corresponding to the key word candidate character string pattern in the document, the same character string as the fourth character string is regarded as important. If the invention document contains the sixth character string corresponding to the key word candidate character string pattern followed by the seventh character string corresponding to the specific particle character string pattern, the sixth character Extract the same string as the column as important phrases.

なお、図7の例は、一例にすぎず、発明文書分析システム10は、発明文書分析処理として、図7に示す一部のステップを省略又は変更した処理を実行してもよいし、図7に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図7に示す複数のステップの実行順序を変更して実行してもよいし、図7に示す複数のステップの全部又は一部を並列に実行してもよい。 The example of FIG. 7 is merely an example, and the invention document analysis system 10 may execute the invention document analysis process by omitting or changing some of the steps shown in FIG. may be executed by adding some processing steps to the plurality of steps shown in FIG. 7, the execution order of the plurality of steps shown in FIG. may be performed in parallel.

[2-3.発明文書分析システムのハードウェア構成又はネットワーク構成の例]
上述したように発明文書分析システム10は、例えば、メモリ、マイクロプロセッサ、入力装置及び表示装置を備えたコンピュータ等で実現される。発明文書分析システム10は、1台のコンピュータ等の装置で実現されてもよいし、複数台のコンピュータ等の装置で実現されてもよい。また、複数の発明文書分析システム10の各々が、1人又は複数人のユーザに利用され得る。
[2-3. Example of hardware configuration or network configuration of invention document analysis system]
As described above, the invention document analysis system 10 is realized by, for example, a computer equipped with a memory, a microprocessor, an input device and a display device. The invention document analysis system 10 may be realized by a device such as a single computer, or may be realized by a plurality of devices such as computers. Also, each of the plurality of invention document analysis systems 10 can be used by one or more users.

図8~図10は、発明文書分析システム10のハードウェア構成又はネットワーク構成の一例を示す。 8 to 10 show an example of the hardware configuration or network configuration of the invention document analysis system 10. FIG.

図8の例では、発明文書分析システム10は、1台の端末装置10aで構成される。端末装置10aは、例えば、表示用文書に基づく表示を実現するブラウザ機能を有するコンピュータである。端末装置10aは、具体例としては、例えばタッチパネル等を搭載し、OSを実行するコンピュータであり、OS配下でブラウザ機能を実現するためのアプリケーションプログラムを実行し得る。コンピュータは、例えば、マイクロプロセッサ(例えばCPU)、メモリ(例えば、ROM、RAM)、通信インタフェース、入出力装置等の接続インタフェース等を、バスで接続した構成を有する。コンピュータは、例えば入出力装置を包含し得る。命令群を含むOS、アプリケーションプログラム等は、例えばメモリに格納され、その命令群の命令は、マイクロプロセッサにより、メモリから読み出され、解釈され、実行される。端末装置10aは、例えば、デスクトップPCであっても、ノートPC(Laptop PC)、スマートフォン等であってもよい。発明文書分析処理(図7参照)を実行するためのプログラムである発明文書分析処理プログラムは、例えば、端末装置10aで実行される1つ又は複数のアプリケーションプログラムであってもよいし、端末装置10aで実行されるブラウザの一部を構成するプログラム(例えばブラウザに組み込むプラグインモジュール等)であってもよい。端末装置10aで実行される発明文書分析処理プログラムは如何なる言語で記述されたものであってもよい。発明文書分析処理プログラムの全部又は一部は、例えば、C言語、C++言語等で記述されてコンパイルされた実行形式のプログラムであってもよいし、Python(登録商標)言語等で記述されてインタープリタ等で実行されるプログラムであってもよい。また、発明文書分析処理プログラムの全部又は一部は、Microsoft(登録商標)のWord等といった文書作成編集機能を有するアプリケーションプログラムの実行に際して付随的に実行可能なマクロ(例えば、VisualBasic(登録商標)等で記述されたプログラム)であってもよい。 In the example of FIG. 8, the invention document analysis system 10 is composed of one terminal device 10a. The terminal device 10a is, for example, a computer having a browser function for realizing display based on a display document. As a specific example, the terminal device 10a is a computer equipped with a touch panel or the like, which executes an OS, and can execute an application program for realizing a browser function under the control of the OS. A computer has a configuration in which, for example, a microprocessor (for example, CPU), memory (for example, ROM, RAM), communication interface, connection interface for input/output devices, etc. are connected by a bus. A computer may include, for example, input/output devices. An OS, an application program, etc., including a group of instructions are stored, for example, in a memory, and the instructions of the group of instructions are read from the memory, interpreted, and executed by a microprocessor. The terminal device 10a may be, for example, a desktop PC, a notebook PC (Laptop PC), a smartphone, or the like. The invention document analysis processing program, which is a program for executing the invention document analysis processing (see FIG. 7), may be, for example, one or a plurality of application programs executed by the terminal device 10a. It may be a program (for example, a plug-in module or the like incorporated into the browser) that constitutes a part of the browser that is executed in the . The invention document analysis processing program executed by the terminal device 10a may be written in any language. All or part of the invention document analysis processing program may be, for example, an executable program written in C language, C++ language, etc. and compiled, or may be written in Python (registered trademark) language, etc. It may be a program executed by, for example. In addition, all or part of the invention document analysis processing program is a macro (for example, VisualBasic (registered trademark)) that can be executed incidentally when executing an application program having a document creation and editing function such as Microsoft (registered trademark) Word. It may be a program written in

発明文書分析処理プログラムが端末装置10aで実行されるアプリケーションプログラムとして実装される場合において、そのアプリケーションプログラムは、例えば、分析結果に基づく情報(例えば特許出願関連情報)を生成し、かつ、表示する機能を有していてもよい。 When the invention document analysis processing program is implemented as an application program executed on the terminal device 10a, the application program has a function of generating and displaying information (for example, patent application related information) based on the analysis result, for example. may have

発明文書分析処理プログラムが端末装置10aで実行されるアプリケーションプログラムとして実装される場合において、そのアプリケーションプログラムは、例えば、表示用文書(例えばHTML文書)としての特許出願関連情報を生成して、その表示用文書を、ブラウザ(例えば表示用文書の解釈及び表示に係るブラウザ機能を有するアプリケーションプログラム)による表示対象としてもよい。ブラウザは例えば所謂ローカルファイル群としての表示用文書にアクセスして特許出願関連情報に係る表示を行い得る。発明文書分析処理プログラムとしてのアプリケーションプログラムは、例えば、ウェブサーバとしての機能を実行して更にブラウザを起動することで、生成した表示用文書を、所謂ローカルホストにおけるリソースとして、起動したブラウザにアクセスさせて表示させてもよい。 When the invention document analysis processing program is implemented as an application program executed on the terminal device 10a, the application program generates, for example, patent application-related information as a document for display (for example, an HTML document) and displays it. The document for display may be displayed by a browser (for example, an application program having a browser function for interpreting and displaying the document for display). The browser may access the document for display as, for example, a group of so-called local files to display patent application related information. An application program as an invention document analysis processing program, for example, executes a function as a web server and further activates a browser, thereby allowing the activated browser to access the generated display document as a resource on a so-called local host. You can also display

発明文書分析システム10が出力する特許出願関連情報の出力態様としての表示用文書は、一例としてはHTML文書である。本開示では、特許出願関連情報の出力態様としての表示用文書として、主にHTML文書である例を用いて説明しているが、表示用文書は、HTML文書以外の、特許出願関連情報における重要語句等の各表示要素について、何らかの表示制御情報を付加することでその表示要素の表示態様(表示色等)を制御し得る文書であってもよく、具体的には例えば、Microsoft(登録商標)のWord等といった文書作成編集機能を有するアプリケーションプログラムが通常取り扱うフォーマットの文書(所謂DOCファイル)等であってもよく、重要語句等の表示要素に係る表示制御情報として、操作対応GUI要素等の表示制御を行うためのマクロが付随したDOCファイル等であってもよい。 The display document as an output form of the patent application related information output by the invention document analysis system 10 is, for example, an HTML document. In the present disclosure, an example in which an HTML document is mainly used as a display document as an output mode of patent application-related information is described. For each display element such as words, it may be a document that can control the display mode (display color, etc.) of the display element by adding some display control information. Specifically, for example, Microsoft (registered trademark) It may be a document in a format (so-called DOC file) normally handled by an application program having a document creation and editing function such as Word, etc. As display control information related to display elements such as important phrases, display of operation-responsive GUI elements, etc. A DOC file or the like accompanied by a macro for control may be used.

また、端末装置10aで実行される発明文書分析処理プログラムは、特許出願関連情報等を、如何なる形式のファイル(例えばテキストファイル)の内容として出力してもよい。 Further, the invention document analysis processing program executed by the terminal device 10a may output the patent application-related information and the like as contents of a file of any format (for example, a text file).

図9の例では、発明文書分析システム10は、例えば、1台のサーバ装置10bと、サーバ装置10bにLAN(Local Area Network)で接続された複数台の端末装置10c~10eとで構成される。端末装置10c~10eは、端末装置10aと同様であり、それぞれ別のユーザ(一例としては同一企業、同一会社、同一事務所、同一事業部、同一部署等の局所的な同一環境に所在する各ユーザ)に利用されることが想定される。また、図9の例において、LANをWAN(Wide Area Network)にして運用することも可能である。サーバ装置10bは、例えば、ファイルサーバ機能を有しており、例えば、ファイルを記録する記録媒体(例えばメモリ、ハードディスク等)を備えている。 In the example of FIG. 9, the invention document analysis system 10 includes, for example, one server device 10b and a plurality of terminal devices 10c to 10e connected to the server device 10b via a LAN (Local Area Network). . The terminal devices 10c to 10e are the same as the terminal device 10a, and different users (for example, the same company, the same company, the same office, the same business department, the same department, etc.) are located in the same local environment. users). In addition, in the example of FIG. 9, it is also possible to operate the LAN as a WAN (Wide Area Network). The server device 10b has, for example, a file server function, and includes, for example, a recording medium (for example, memory, hard disk, etc.) for recording files.

サーバ装置10bは、一例としては、端末装置10c~10eの各々がアクセスして取得するための設定情報を内容として含むファイルを記録媒体に保持している。サーバ装置10bは、一例としては、端末装置10c~10eの各々がアクセスして取得するための翻訳用発明文書標準規定を内容として含むファイルを記録媒体に保持している。サーバ装置10bは、一例としては、端末装置10c~10eそれぞれにおいて翻訳補助情報が生成された場合にそれを収集して統合し、統合した結果の翻訳補助情報を内容とするファイルを保持し、そのファイルの翻訳補助情報を、LANで接続された各端末装置に配信する機能を有し得る。 For example, the server device 10b holds, in a recording medium, a file containing setting information to be accessed and acquired by each of the terminal devices 10c to 10e. As an example, the server device 10b holds, in a recording medium, a file containing, as content, invention document standard specifications for translation for each of the terminal devices 10c to 10e to access and obtain. As an example, the server device 10b collects and integrates the translation assistance information generated by each of the terminal devices 10c to 10e, and holds a file containing the translation assistance information resulting from the integration. It may have a function of distributing the translation assistance information of the file to each terminal device connected by LAN.

サーバ装置10bは、一例としては、1つの対訳辞書情報を内容とするファイル、又は、複数のグループ(例えば技術分野)毎についての対訳辞書情報を内容とする各ファイルを保持し、LANで接続された端末装置10c~10eのいずれかにおいて必要とされる対訳辞書情報をその端末装置に配信する機能を有し得る。 For example, the server device 10b holds a file containing one piece of bilingual dictionary information or each file containing bilingual dictionary information for each of a plurality of groups (for example, technical fields), and is connected via a LAN. It can have a function of distributing required bilingual dictionary information to any one of the terminal devices 10c to 10e.

サーバ装置10bは、一例としては、端末装置10c~10eの各々において、発明文書と、その発明文書に基づく発明文書分析処理の結果に基づいて出力された情報(例えば発明文書評価情報を含む特許出願関連情報)と、その情報を利用してユーザに作成された翻訳結果文書とを、対応付けて収集して蓄積(つまり保持)する機能を有し得る。この機能をサーバ装置10bが有する場合において、端末装置10c~10eの各々は、サーバ装置10bが保持する一部の発明文書と、その発明文書に対応する翻訳結果文書との組を教師データとして用いた機械学習により学習モデルを生成して、例えば発明文書分析処理での分析対象の発明文書についての機械翻訳等にその学習モデルを活用することが可能となる。 As an example, the server device 10b, in each of the terminal devices 10c to 10e, outputs an invention document and information output based on the result of invention document analysis processing based on the invention document (for example, a patent application including invention document evaluation information). Related information) and the translation result document created by the user using that information are associated, collected, and stored (that is, stored). In the case where the server device 10b has this function, each of the terminal devices 10c to 10e uses a combination of some invention documents held by the server device 10b and translation result documents corresponding to the invention documents as teacher data. It is possible to generate a learning model by machine learning, and utilize the learning model for machine translation of an invention document to be analyzed in the invention document analysis process, for example.

図10の例では、発明文書分析システム10が、各地に分散した複数のコンピュータで構成されている。図10の例における発明文書分析システム10は、例えば、1台のサーバ装置10fと、サーバ装置10fにLAN又はインターネット等のWANで接続された複数台の端末装置10g、10hとで構成される。端末装置は1台であってもよい。サーバ装置10fは、サーバ装置10iとLAN又はWAN経由で通信可能であってもよい。WANで接続された装置間では、例えば、通信対象のデータが既存の暗号技術により暗号化されて、そのデータの通信が行われる。サーバ装置10iは、例えば、発明文書分析処理の一部の実行を担い得る。 In the example of FIG. 10, the invention document analysis system 10 is composed of a plurality of computers distributed in various places. The invention document analysis system 10 in the example of FIG. 10 includes, for example, one server device 10f and a plurality of terminal devices 10g and 10h connected to the server device 10f via a LAN or a WAN such as the Internet. The number of terminal devices may be one. The server device 10f may be able to communicate with the server device 10i via LAN or WAN. For example, data to be communicated is encrypted by an existing cryptographic technique, and the data is communicated between devices connected by a WAN. The server device 10i can, for example, perform part of the invention document analysis process.

端末装置10g、10hは、端末装置10aと同様であり、それぞれ別のユーザに利用されることが想定される。サーバ装置10fは、例えば、ウェブサーバ機能を有しており、例えば、表示用文書のファイルを格納可能な記録媒体(例えばメモリ、ハードディスク等)を備えている。サーバ装置10fは、例えば、発明文書分析処理の一部についてPerl言語等で記述したプログラムで実装したCGI(Common Gateway Interface)機能を備える。 The terminal devices 10g and 10h are similar to the terminal device 10a, and are assumed to be used by different users. The server device 10f has, for example, a web server function, and includes, for example, a recording medium (for example, memory, hard disk, etc.) capable of storing display document files. The server device 10f has, for example, a CGI (Common Gateway Interface) function implemented by a program written in Perl or the like for part of the invention document analysis processing.

端末装置10g、10hのいずれかは、例えば、ブラウザにより、発明文書をサーバ装置10fに送信する。発明文書を受信した、サーバ装置10fは、必要に応じてサーバ装置10fに一部の処理を依頼することで、発明文書分析処理を実行し、その結果としてその発明文書の分析結果に基づく情報(例えば特許出願関連情報)についての表示用文書(例えばHTML文書)を生成する。サーバ装置10fは、その表示用文書を、その生成の基礎となった発明文書の送信元の端末装置に送信することで、その発明文書の分析結果に基づく情報の出力を行う。表示用文書を受信した端末装置10g、10hのいずれかは、ブラウザにより、その表示用文書に基づく情報の表示制御等を実現する。これにより、ブラウザでの、発明文書の分析結果に基づく情報の出力が、実現される。ブラウザにより例えば表示用文書としての特許出願関連情報が表示される場合において、クレーム情報における重要語句及び明細書情報における重要語句は、各々予め表示制御情報で定められた表示態様(例えば文字色、文字背景色等)で表示され得る。また、ブラウザにより、発明文書に対する指摘、評価等を含む警告情報が表示され得る。警告情報が表示されると、ユーザは発明文書が問題を有するか否かについて確認することができる。ブラウザによる情報の表示制御の結果として、端末装置が備える表示装置等に、操作対応GUI要素等が表示された場合には、ユーザの操作に応じて、表示用文書の表示制御情報で定められた処理が実行され、例えば、表示内容が変化し得る。なお、必要に応じてユーザは、ブラウザにより表示された内容を、コピー&ペースト等によって、文書作成編集機能を有するアプリケーションプログラム(例えばテキストエディタ等)に取り込ませて、自由に編集することができる。 Either of the terminal devices 10g and 10h transmits the invention document to the server device 10f by using, for example, a browser. Upon receiving the invention document, the server device 10f executes invention document analysis processing by requesting the server device 10f to perform some processing as necessary, and as a result, information based on the analysis result of the invention document ( For example, a document for display (for example, HTML document) is generated for patent application related information). The server device 10f outputs information based on the analysis result of the invention document by transmitting the display document to the terminal device that sent the invention document on which the invention document was generated. Either of the terminal devices 10g and 10h that has received the display document implements display control and the like of information based on the display document using the browser. This realizes the output of information based on the analysis result of the invention document in the browser. For example, when patent application-related information is displayed as a display document by a browser, key words in the claim information and key words in the specification information are displayed in a display mode (e.g., character color, character background color, etc.). Also, the browser can display warning information including indications, evaluations, etc. for the invention document. When the warning information is displayed, the user can check whether the invention document has any problems. As a result of information display control by the browser, when operation-responsive GUI elements are displayed on the display device of the terminal device, etc. Processing may be performed and, for example, the display may change. If necessary, the user can freely edit the content displayed by the browser by importing it into an application program (for example, a text editor) having a document creation and editing function by copying and pasting.

サーバ装置10fは、例えば、アクセス元の端末装置(つまりクライアント端末)を、ユーザ、ユーザグループ、端末、又は、端末グループに、関連した識別情報(ID)、パスワード等を用いて認証し、予め登録、管理等された所定のクライアント端末に限って、発明文書のアップロードを可能とし、また、過去にアップロードされた発明文書の分析結果としての特許出願関連情報等の一覧表示を可能とし、指定された特許出願関連情報等の閲覧(つまりダウンロード)、削除等を可能とするように管理する機能を有してもよい。また、サーバ装置10fは、同じユーザグループ又は端末グループのIDの指定に基づいて同一グループと認証できた複数のクライアント端末に対して、同じ発明文書の分析結果としての特許出願関連情報を閲覧可能とすることとしてもよい。また、ID、パスワード等で認証した所定のクライアント端末と、サーバ装置10fとは、発明文書分析処理を構成する各処理ステップを、適宜分担して、実行してもよい。 For example, the server device 10f authenticates the access source terminal device (that is, the client terminal) to the user, the user group, the terminal, or the terminal group using the associated identification information (ID), password, etc., and registers it in advance. , it is possible to upload invention documents only to a predetermined managed client terminal, and it is possible to display a list of patent application related information etc. as an analysis result of invention documents uploaded in the past. It may have a function to manage so as to enable browsing (that is, downloading), deletion, etc. of patent application related information. In addition, the server device 10f allows a plurality of client terminals authenticated as being in the same group based on the designation of the ID of the same user group or terminal group to view the patent application related information as the analysis result of the same invention document. It is also possible to Further, a predetermined client terminal authenticated by an ID, a password, etc., and the server device 10f may appropriately divide and execute each processing step constituting the invention document analysis processing.

サーバ装置10fは、例えば、クライアント端末の要求に応じて検索を行う検索サイト(所謂検索エンジン)としての機能を有していてもよい。この場合に、サーバ装置10fが特許文献の検索を行った結果として取得された発明文書を分析対象として、発明文書分析処理を実行することとしてもよい。 The server device 10f may have, for example, a function as a search site (so-called search engine) that performs searches in response to requests from client terminals. In this case, the server device 10f may execute the invention document analysis process with the invention document acquired as a result of the patent document search performed as the analysis target.

サーバ装置10f又はサーバ装置10iは、例えば、各国の官庁及び国際機関によりインターネット上に公開された特許に関する公報に基づいて、公報で示された発明文書と、その発明文書に対応する翻訳結果文書との組を複数収集する機能を有していてもよい。 The server device 10f or the server device 10i, for example, based on patent publications published on the Internet by the government offices and international organizations of each country, the invention document shown in the publication and the translation result document corresponding to the invention document. may have a function of collecting a plurality of sets of

[2-4.実施形態1に係る発明文書分析システムの効果]
発明文書分析システム10は、発明者等又は弁理士により作成された発明文書から、設定情報に基づいて重要語句抽出部1051により重要語句を抽出し、抽出された各重要語句に基づいて生成された情報を出力部108により出力するので、翻訳者等にとっては、出力された情報を参照することにより、発明文書の理解が促進される可能性がある。発明文書の理解の促進は、翻訳者にとって発明文書を適切に又は効率的に翻訳するために有用となる。
[2-4. Effects of Invention Document Analysis System According to Embodiment 1]
The invention document analysis system 10 extracts key phrases from the invention document created by the inventors or patent attorneys by the key phrase extraction unit 1051 based on the setting information, and based on each of the extracted key phrases, the Since the information is output by the output unit 108, there is a possibility that a translator or the like will be able to facilitate understanding of the invention document by referring to the output information. Promoting the understanding of the invention document is useful for translators to translate the invention document appropriately or efficiently.

重要語句抽出部1051は、例えば、発明文書において語句を参照する表現がある場合に参照される語句を一定条件下で重要語句と扱い、発明文書のクレームにおいて句点文字の直前に記載された語句を一定条件下で重要語句と扱うので、注目して記載された語句及びクレームの請求対象を表す語句が重要語句として扱われ得る。重要語句抽出部1051は、例えば、日本語で記載された発明文書において助詞に先行する語句(例えば名詞句等)を一定条件下で重要語句と扱い、発明文書において符号が付されて記載された語句を一定条件下で重要語句と扱うので、主語、目的語等の比較的重要な語句及び発明文書に関連する図面中に図示されると推定される要素を表す語句が重要語句として扱われ得る。これらにより、発明文書分析システム10が発明文書において重要と推定される重要語句に基づいて出力部108により情報が出力されるので、その出力される情報は有用であり得る。 For example, when there is an expression that refers to a word in an invention document, the key word extraction unit 1051 treats the referenced word as a key word under certain conditions, and extracts the word or phrase written immediately before the full stop character in the claim of the invention document. Because of the treatment of key phrases under certain conditions, phrases that are noted and phrases that describe the claimed subject matter of a claim can be treated as key phrases. The important phrase extraction unit 1051 treats, for example, phrases (for example, noun phrases) that precede particles in an invention document written in Japanese as important phrases under certain conditions, and treats them as important phrases under certain conditions. Since words are treated as key words under certain conditions, relatively important words such as subjects and objects and words representing elements presumed to be illustrated in drawings related to invention documents can be treated as key words. . As a result, information is output by the output unit 108 based on key phrases that are estimated to be important in the invention document by the invention document analysis system 10, so the output information can be useful.

出力部108は、例えば、発明文書から重要語句抽出部1051により抽出された複数の重要語句各々についてその重要語句と、関連する付加情報(例えば、重要語句の重要度、属性情報、翻訳語候補集合等)とを含む特許出願関連情報を出力するので、その特許出願関連情報を得ることで翻訳者等は、発明文書の複数の重要語句を把握でき、翻訳者は、発明文書の翻訳のために付加情報に基づいて、重要語句に対応する、重要語句と同じ意味の翻訳先の言語である翻訳語句を、効率的に又は適正に決定することが可能となり得る。出力部108が出力する特許出願関連情報に、重要語句に対応して対応翻訳語に関する情報としての翻訳語情報(例えば、対応翻訳語そのもの、翻訳語候補集合等を表す情報)が含まれるので、その翻訳語情報を参照することで翻訳者は、重要語句に対応する翻訳語句を効率的に又は適正に決定することが可能となり得る。出力部108が、重要語句に対応して翻訳語候補集合を含む特許出願関連情報を出力する場合において、翻訳語候補集合の各要素に対応翻訳語となる妥当性の高さを示す値等が付記されているときには、翻訳者は、翻訳語候補集合から、重要語句に対応する翻訳語句を効率的に又は適正に決定することが可能となり得る。 For example, the output unit 108 extracts each of the key phrases extracted from the invention document by the key phrase extraction unit 1051, and related additional information (for example, the importance of the key phrase, attribute information, translation word candidate set). etc.), so that by obtaining the patent application related information, the translator, etc. can grasp multiple important words of the invention document, and the translator can use it to translate the invention document Based on the additional information, it may be possible to efficiently or properly determine the translated phrase corresponding to the key phrase, which is the target language and has the same meaning as the key phrase. Since the patent application-related information output by the output unit 108 includes translation word information (for example, information representing the corresponding translation word itself, a set of translation word candidates, etc.) as information related to the corresponding translation word corresponding to the key word, By referring to the translated word information, the translator may be able to efficiently or properly determine the translated word/phrase corresponding to the important word/phrase. When the output unit 108 outputs the patent application-related information including a translation word candidate set corresponding to the key words, each element of the translation word candidate set has a value indicating the degree of validity of the corresponding translation word. When annotated, the translator may be able to efficiently or properly determine the translation word corresponding to the key word from the translation word candidate set.

発明文書分析システム10では、例えば、発明文書から重要語句抽出部1051により抽出された重要語句群に基づいて分類部1053がグループ分類を行い、グループ(例えば技術分野)別の対訳辞書情報のうちから、発明文書が属すると特定されたグループの対訳辞書情報を選択的に用いてその発明文書の重要語句についての翻訳語候補集合を特定する。これにより、発明文書に適したグループの対訳辞書情報が用いられるので、重要語句に対して適切な翻訳語候補集合が特定され得る。 In the invention document analysis system 10, for example, the classification unit 1053 performs group classification based on the key phrase group extracted from the invention document by the key phrase extraction unit 1051, and from bilingual dictionary information by group (for example, technical field) , selectively using the bilingual dictionary information of the group to which the invention document belongs, to specify a translation word candidate set for the key words of the invention document. As a result, a group of bilingual dictionary information suitable for the invention document is used, so that a suitable translation word candidate set can be specified for the key phrase.

出力部108は、例えば、HTML文書等といった表示用文書として特許出願関連情報を出力し、表示用文書は、重要語句に対応する翻訳語候補集合の表示要素を操作対応GUI要素とするための表示制御情報を含み、このGUI要素は、操作で選択された翻訳語候補集合の1つの要素を対応翻訳語として決定し、重要語句と対応翻訳語とを翻訳補助情報として出力する処理を実行し得る。これにより、翻訳者は、表示用文書のGUI要素に対する選択の操作により、翻訳語候補集合から重要語句に対応する対応翻訳語を容易に決定することができる。また、翻訳者は、例えば、ブラウザ等による表示用文書の表示内容から、決定された対応翻訳語を、コピー&ペースト等により、テキストエディタ等で編集可能となり得る。また、翻訳者による選択の結果が、その後に、翻訳補助情報を介して、発明文書分析システム10による重要語句に対応する翻訳語候補集合の特定についての妥当性を向上させる可能性がある。 The output unit 108 outputs the patent application-related information as a display document such as an HTML document, for example. This GUI element, which includes control information, can execute a process of determining one element of the translation word candidate set selected by the operation as the corresponding translation word, and outputting the important phrase and the corresponding translation word as translation assistance information. . As a result, the translator can easily determine the corresponding translation word corresponding to the important word from the translation word candidate set by selecting the GUI element of the document for display. In addition, the translator can edit the corresponding translation word determined from the display content of the display document by the browser or the like using a text editor or the like by copying and pasting. In addition, the result of the selection by the translator may later improve the validity of identifying a translation word candidate set corresponding to the key words by the invention document analysis system 10 via the translation assistance information.

発明文書分析システム10では、例えば、学習モデル出力部1081が、翻訳補助情報における重要語句と対応翻訳語との組を、重要語句翻訳用の機械学習のための教師データとして用いた機械学習により生成された重要語句翻訳用学習モデルを、出力する。これにより、その重要語句翻訳用学習モデルを用いて重要語句を入力とする演算処理により、発明文書における重要語句についての機械翻訳が実現され得る。この機械翻訳の結果を参照することで、翻訳者は、発明文書における重要語句を翻訳した翻訳語句を効率的に又は適正に決定することが可能となり得る。 In the invention document analysis system 10, for example, the learning model output unit 1081 generates pairs of key words and corresponding translated words in the translation assistance information by machine learning using training data for machine learning for key word translation. output the important phrase translation learning model. As a result, the machine translation of the important phrases in the invention document can be realized by the arithmetic processing of inputting the important phrases using the learning model for the translation of the important phrases. By referring to the results of this machine translation, the translator may be able to efficiently or properly determine the translated words and phrases for the key words and phrases in the invention document.

発明文書分析システム10は、例えば、重要語句設定辞書に従って発明文書から重要語句を抽出し、重要語句と、重要語句設定辞書に従って決定した重要語句の対応翻訳語とを含む特許出願関連情報を出力する。これにより、発明者等又は弁理士は、特定の語句を重要語句として定めておきたい場合、重要語句についての対応翻訳語を定めておきたい場合等に重要語句設定辞書を生成しておくことで、発明文書分析システム10により、適切な特許出願関連情報が出力されるようになる。このため、翻訳者は、その特許出願関連情報を参考にして発明文書の翻訳を、効率的に又は適正に行うことが可能となり得る。 The invention document analysis system 10, for example, extracts key phrases from invention documents according to the key phrase setting dictionary, and outputs patent application related information including key phrases and corresponding translations of the key phrases determined according to the key phrase setting dictionary. . As a result, the inventors, etc. or patent attorneys can create an important phrase setting dictionary when they want to set specific phrases as important phrases, or when they want to set corresponding translated words for important phrases. , the invention document analysis system 10 outputs appropriate patent application related information. Therefore, the translator may be able to translate the invention document efficiently or properly by referring to the patent application-related information.

発明文書分析システム10は、例えば、発明文書における重要語句に対応する翻訳語候補集合の特定を、その発明文書と同一のグループに属する複数の発明文書と、対応する翻訳結果文書とから抽出した重要語句と対応翻訳語との組を機械学習用の教師データとした機械学習の結果として生成された重要語句翻訳用学習モデルを用いた演算処理による機械翻訳により行う。これにより、発明文書分析システム10では翻訳語候補集合の特定が適切になされ得る。 The invention document analysis system 10 identifies, for example, a translation word candidate set corresponding to an important phrase in an invention document by extracting important words from a plurality of invention documents belonging to the same group as the invention document and the corresponding translation result documents. Machine translation is performed by arithmetic processing using a learning model for important phrase translation generated as a result of machine learning using pairs of phrases and corresponding translated words as training data for machine learning. As a result, the invention document analysis system 10 can appropriately identify a translation word candidate set.

発明文書分析システム10は、例えば、HTML文書等といった表示用文書として、発明文書のクレームを表すクレーム情報を含む特許出願関連情報を出力し、クレーム情報に、クレーム中の重要語句の表示態様を制御する表示制御情報を含ませる。これにより、ブラウザ等により表示されたクレーム情報において表示態様が制御された重要語句を識別することが可能となり得る。発明文書分析システム10において、重要語句の表示態様の制御として、例えば強調表示(例えば太字で表示する等)がなされた場合には、クレーム情報における重要語句の迅速な把握が可能となり得る。発明文書分析システム10は、例えば、表示用文書のクレーム情報における重要語句の表示要素を、操作対応GUI要素として、操作に応じて重要語句についての重要度、属性情報、対応翻訳語、若しくは、翻訳語候補集合、又は、その重要語句の検索結果を表示するための表示制御情報をクレーム情報に含ませ得る。これにより、表示用文書のクレーム情報を閲覧した翻訳者等は、表示された重要語句に対する操作により、重要度、属性情報等の各種情報を知得することが可能となり、発明文書における重要語句について効率的に又は適正に理解することが可能となり、また、翻訳者は、重要語句に対する翻訳語句を効率的に又は適正に決定することが可能となり得る。 The invention document analysis system 10 outputs, for example, as a display document such as an HTML document, patent application-related information including claim information representing the claims of the invention document, and controls the display mode of important terms in the claims in the claim information. Include display control information to As a result, it may be possible to identify key words whose display mode is controlled in complaint information displayed by a browser or the like. In the invention document analysis system 10, if, for example, highlighting (for example, displaying in bold) is performed as control of the display mode of key words, it is possible to quickly grasp the key words in the claim information. For example, the invention document analysis system 10 uses the display elements of key words and phrases in the claim information of the display document as operation-responsive GUI elements, and analyzes the importance, attribute information, corresponding translation words, or translation The complaint information may include display control information for displaying the word candidate set or the search result of the key phrase. As a result, translators, etc., who have viewed the claim information in the display document can obtain various types of information, such as the level of importance and attribute information, by manipulating the displayed key words and phrases. In addition, the translator may be able to efficiently or properly determine translation terms for key terms.

発明文書分析システム10は、例えば、HTML文書等といった表示用文書として、発明文書の明細書を表す明細書情報を含む特許出願関連情報を出力し、明細書情報に、明細書中の重要語句の表示態様を制御しその重要語句がクレームに記載されているか否かを識別可能に表示するための表示制御情報を含ませ、また、相違する重要語句の表示態様を相違させるように制御する表示制御情報を含ませ得る。これにより、ブラウザ等により表示された表示用文書を閲覧した翻訳者等は、明細書情報において記載された各重要語句が、クレームに記載されている重要語句か否かを識別することが可能となり、複数の重要語句が同一か相違するかを、各重要語句の表示態様により、迅速に把握することが可能となり得る。発明文書分析システム10は、例えば、相互に異なる重要語句同士の表示態様としての色(例えば重要語句の文字色、文字背景色、重要語句を囲んで線幅を有する矩形枠の全辺又はいずれか一辺である境界線の色等)を、相互に異なるようにして各重要語句を表示するための表示制御情報を表示用文書に含ませ得る。これにより、ブラウザ等により表示された表示用文書を閲覧した翻訳者等は、複数の重要語句が同一か相違するかを、各重要語句に付加された色により、迅速に把握することが可能となり得る。 The invention document analysis system 10 outputs patent application related information including specification information representing the specification of the invention document as a display document such as an HTML document, for example. Display control information for controlling the display mode and including display control information for identifiably displaying whether or not the key phrase is stated in the claim, and display control for controlling the display mode of different key phrases to be different can contain information. As a result, translators, etc., who have browsed the display document displayed by a browser, etc., can identify whether or not each key phrase described in the specification information is the key phrase described in the claim. , it may be possible to quickly grasp whether a plurality of key words are the same or different, depending on the display mode of each key word. The invention document analysis system 10 can, for example, use colors as display modes for key phrases that are different from each other (for example, the character color of the key phrases, the character background color, the entire side of a rectangular frame having a line width surrounding the key phrases, or any one of The document for display may include display control information for displaying each important phrase with different colors, such as the color of the boundary line, which is one side, from each other. As a result, a translator or the like who browses a display document displayed by a browser or the like can quickly understand whether multiple key words are the same or different from the color added to each key word. obtain.

発明文書分析システム10は、例えば、発明文書の分析結果に基づいて出力する特許出願関連情報におけるクレーム情報及び明細書情報の各々の内容に、その内容における重要語句を対応翻訳語又は翻訳語候補集合に置換した内容を含ませる。一例としては、発明文書分析システム10は、クレーム情報及び明細書情報の各行の直後に、その行の内容における重要語句を対応翻訳語又は翻訳語候補集合に置換した内容の行を挿入し得る。翻訳者は、この重要語句を対応翻訳語又は翻訳語候補集合に置換した内容について編集することで、効率的に、発明文書の翻訳を行うことが可能となり得る。 The invention document analysis system 10, for example, for each content of the claim information and specification information in the patent application related information output based on the analysis result of the invention document, translates important words in the content, or a translation word candidate set. contains the replaced contents. As an example, the invention document analysis system 10 can insert, immediately after each line of claim information and specification information, a line of content in which key words in the content of the line are replaced with corresponding translation words or translation word candidate sets. The translator may be able to efficiently translate the invention document by editing the content in which the key words are replaced with the corresponding translation words or translation word candidate set.

発明文書分析システム10は、例えば、発明文書の分析結果に基づいて出力する表示用文書としての特許出願関連情報のクレーム情報又は明細書情報における重要語句が、その発明文書に対応して文書取得部102により取得された図面文書における図面に含まれる符号を付記した要素名の記載が発明文書中に含まれるところのその要素名を表す語句である場合に、その重要語句の表示要素に、操作に応じてその図面文書における符号が記載された部分を表示するためのGUIとしての機能を与えるための表示制御情報を付加するように、表示用文書を生成する。これにより、ブラウザ等により表示された表示用文書を閲覧した翻訳者等は、重要語句の操作により、図面文書中の、その重要語句が表す要素に対応する部分を表示させて確認することができるようになり、その重要語句の理解を効率的又は適正に行うことが可能となる。 The invention document analysis system 10 detects, for example, the important words in the claim information or the specification information of the patent application-related information as a display document output based on the analysis result of the invention document. If the description of the element name appended with the code included in the drawing in the drawing document acquired by 102 is a phrase that expresses the element name contained in the invention document, the display element of the important phrase is displayed in the operation Accordingly, a document for display is generated so as to add display control information for giving a function as a GUI for displaying the part in which the code is described in the drawing document. As a result, a translator or the like who browses the document for display displayed by a browser or the like can display and check the part corresponding to the element represented by the key phrase in the drawing document by manipulating the key phrase. As a result, it becomes possible to understand the important words efficiently or properly.

発明文書分析システム10は、例えば、翻訳対象となる発明文書が満たすべき複数の条件を定めた翻訳用発明文書標準規定に係る一部の条件を満たすか否かの判定結果に基づいて、発明文書における不適切な可能性がある部分を指摘する警告情報を含む特許出願関連情報を出力する。この特許出願関連情報を参考にすることにより、発明文書を作成した発明者等又は弁理士は、必要であれば発明文書の修正を行い得る。また、翻訳者は、例えば、発明者等又は弁理士から、翻訳対象となる発明文書及び特許出願関連情報を取得することにより、特許出願関連情報中の警告情報での指摘が残っていてもその指摘は特に対処の必要がないと発明者等又は弁理士が判断した結果であると推定できるので、翻訳対象となる適切な発明文書を取得することができ、この結果として、発明文書の翻訳を効率的に又は適正に行うことが可能となり得る。発明文書分析システム10は、例えば、翻訳用発明文書標準規定の複数の条件のうち警告情報での指摘のための判定に用いられる一部の条件を、設定情報等での指定に応じて絞り込めるようにしてもよい。これにより、発明者等又は弁理士は、設定情報の設定によって、発明文書分析システム10に、警告情報において不要な指摘を含まないような特許出願関連情報を出力させることが可能となり、その特許出願関連情報を翻訳者に提供すること等により、警告情報によって翻訳者に誤解を与えることを防止し得る。 The invention document analysis system 10, for example, based on the determination result of whether the invention document to be translated satisfies a part of the conditions related to the invention document standard specification for translation, which defines a plurality of conditions to be satisfied by the invention document output patent application related information including warning information pointing out potentially inappropriate parts in By referring to this patent application-related information, the inventor or patent attorney who prepared the invention document can correct the invention document if necessary. In addition, for example, by obtaining invention documents and patent application-related information to be translated from inventors, etc. or patent attorneys, the translator can Since it can be presumed that the inventor, etc. or the patent attorney determined that there is no particular need to deal with the indication, it is possible to obtain an appropriate invention document to be translated, and as a result, the translation of the invention document can be It may be possible to do so efficiently or properly. The invention document analysis system 10 can, for example, narrow down some of the conditions of the invention document standard specification for translation, which are used for judgment for pointing out in the warning information, according to the designation in the setting information etc. You may do so. As a result, the inventors, etc. or the patent attorney can cause the invention document analysis system 10 to output patent application-related information that does not include unnecessary indications in the warning information by setting the setting information. By providing relevant information to the translator, etc., it is possible to prevent the translator from being misled by the warning information.

発明文書分析システム10は、例えば、発明文書の分析結果に基づいて生成された特許出願関連情報における警告情報に、その発明文書の、翻訳用発明文書標準規定への適合性を示す発明文書評価情報を含ませ得る。適合性は、例えば、適合性の評価の結果としての評価値で表される。この発明文書評価情報を参考にすることで、発明者等又は弁理士は、その発明文書を適切に修正できる可能性がある。また、翻訳者は、発明文書評価情報を確認することで、翻訳対象として適切な発明文書であるか否かを認識することが可能となり得る。不適切な記載を含む発明文書は、例えば、翻訳ミスを招き易く、翻訳者が適切な権利取得のために発明文書を修正した上で翻訳するような事態も生じ得る。従って、発明文書に基づいて生成された特許出願関連情報における警告情報に、翻訳用発明文書標準規定への適合性が比較的低いことを示す発明文書評価情報が含まれていた場合には、その発明文書は、その発明文書に基づいて翻訳された結果である翻訳結果文書との間で、言語が異なる以外に内容の齟齬があり得ると判断でき、例えば、機械翻訳に用いる翻訳用学習モデルの生成のために、機械学習用の教師データとして用いるのには適さないとの判断が可能となり得る。 For example, the invention document analysis system 10 adds invention document evaluation information indicating conformity of the invention document to the invention document standards for translation to the warning information in the patent application related information generated based on the analysis result of the invention document. can be included. Suitability is represented, for example, by an evaluation value as a result of suitability evaluation. By referring to this invention document evaluation information, the inventors or the patent attorney may be able to appropriately correct the invention document. Also, the translator can recognize whether or not the invention document is suitable for translation by checking the invention document evaluation information. An invention document containing inappropriate descriptions, for example, is likely to cause translation errors, and a situation may arise in which the translator corrects the invention document in order to obtain appropriate rights before translating it. Therefore, if the warning information in the patent application-related information generated based on the invention document includes invention document evaluation information indicating relatively low conformity with the standard provisions for invention documents for translation, It can be determined that there may be discrepancies in content between the invention document and the translation result document, which is the result of translation based on the invention document, in addition to the difference in language. Because of its generation, it may be possible to determine that it is not suitable for use as teacher data for machine learning.

発明文書分析システム10は、例えば、翻訳用発明文書標準規定における修正情報等に基づいて、発明文書のクレームの不適切な可能性がある記載を修正した修正版クレーム情報と、発明文書の明細書の不適切な可能性がある記載を修正した修正版明細書情報とを含む特許出願関連情報を出力する。発明文書を作成した発明者等又は弁理士は、この修正版クレーム情報及び修正版明細書情報を参照することにより、効率的に発明文書を修正できる可能性がある。翻訳者は、修正版クレーム情報及び修正版明細書情報を参照することで修正された発明文書を提供されることで、その発明文書を効率的に又は適正に翻訳し得る。 The invention document analysis system 10, for example, based on the correction information in the invention document standard specification for translation, amended version claim information in which potentially inappropriate descriptions of the claims of the invention document are corrected, and the specification of the invention document Outputs patent application-related information including revised specification information in which descriptions that may be inappropriate in The inventor, etc. or the patent attorney who created the invention document may be able to efficiently revise the invention document by referring to this revised claim information and revised specification information. A translator can efficiently or properly translate the invention document by being provided with the invention document as amended by reference to the amended claim information and the amended specification information.

発明文書分析システム10は、例えば、発明文書のクレームにおける複数項を引用する項を、その複数項のうち項番が最先の1つの項のみを引用する項に変更する修正版クレーム情報と、その修正版クレーム情報が表すクレームの各項の引用関係を表した修正版クレームツリーとを含む特許出願関連情報を出力する。発明文書分析システム10は、例えば、表示用文書としての特許出願関連情報において発明文書のクレームの各項の引用関係を表したクレームツリーを、引用関係の変更が可能な操作対応GUI要素を含めて出力することができ、ブラウザ等でその表示用文書に基づいて表示されたクレームツリーへの操作に応じて変更された引用関係と整合するように、修正版クレームツリー及び修正版クレーム情報を更新し得る。この場合には、発明者等又は弁理士は、クレームツリーを操作することで、その操作を反映した修正版クレームツリー及び修正版クレーム情報を含む特許出願関連情報を翻訳者に提供し得る。発明者等又は弁理士から特許出願関連情報の提供を受け、発明文書のクレーム部分については修正版クレーム情報に基づいて翻訳すべき旨を伝達された翻訳者は、発明文書における複数項を引用する項を修正するか否か、修正するとしたらどのように修正すべきか等について迷うことなく、効率的に、翻訳を行うことが可能となり得る。また、翻訳者等は、修正版クレームツリーにより、修正版クレーム情報に表されたクレームの各項の引用関係を迅速に把握し得る。 The invention document analysis system 10, for example, amended claim information that changes a clause citing multiple clauses in the claims of the invention document to a clause quoting only one clause with the first clause number among the plurality of clauses, and It outputs patent application related information including a modified claim tree representing the citation relationship of each item of the claims represented by the modified claim information. The invention document analysis system 10, for example, in the patent application related information as a document for display, a claim tree representing the citation relationship of each claim of the claim of the invention document, including an operation corresponding GUI element that can change the citation relationship. update the modified claim tree and modified claim information to match the changed citation relationships in response to manipulation of the claim tree displayed based on the display document in a browser, etc. obtain. In this case, the inventors or patent attorney can manipulate the claim tree to provide the translator with patent application-related information, including a modified claim tree and modified claim information that reflects the manipulation. Translators who have received patent application-related information from inventors, etc. or patent attorneys, and have been informed that the claims of the invention document should be translated based on the modified version of the claim information, cite multiple paragraphs in the invention document. It may be possible to translate efficiently without hesitation as to whether or not to correct a term, and if so, how to correct it. In addition, the translator or the like can quickly grasp the citation relationship of each item of the claims represented in the modified claim information from the modified claim tree.

発明文書分析システム10は、例えば、発明文書から重要語句抽出部1051により抽出された複数の重要語句各々の間の関係を示す重要語句関係情報を含む特許出願関連情報を出力する。この重要語句関係情報は、例えば、複数の重要語句各々が表す要素相互間における構成上の包含関係を示す包含関係情報を含む。これにより、特許出願関連情報を取得した翻訳者は、発明文書における複数の重要語句間の関係を比較的迅速に把握可能となり、その関係の把握により各重要語句に対応する翻訳語句を効率的に又は適正に決定できる可能性があり、その結果として、発明文書を効率的に又は適正に翻訳することが可能となり得る。 The invention document analysis system 10 outputs, for example, patent application related information including key word relationship information indicating the relationship between each of the key words extracted by the key word extraction unit 1051 from the invention document. This important phrase relationship information includes, for example, inclusion relationship information indicating structural inclusion relationships between elements represented by each of a plurality of important phrases. As a result, translators who have acquired patent application-related information can relatively quickly grasp the relationships between multiple key words in an invention document. Or it may be possible to properly determine, as a result of which it may be possible to translate the invention document efficiently or properly.

発明文書分析システム10は、例えば、複数の発明文書各々から重要語句抽出部1051により抽出した重要語句群間の相関性に基づいて、分類部1053により発明文書のグループ分類を実行し、機械学習部107によりグループ毎に、発明文書と、対応する翻訳結果文書との複数組を教師データとした機械学習により翻訳用学習モデルを生成する。これにより、例えば機械翻訳システム等において、グループ毎の翻訳用学習モデルのうち、発明文書が属するグループに適合した翻訳用学習モデルを利用した演算処理により発明文書を機械翻訳することが可能となる。また、発明文書分析システム10が、例えば、グループ毎の翻訳用学習モデルのうち、発明文書が属するグループに適合した翻訳用学習モデルを利用した演算処理により発明文書の少なくとも一部を機械翻訳して、その機械翻訳結果を含む特許出願関連情報を出力することとしてもよい。このような発明文書の機械翻訳結果を参照することで、翻訳者は、発明文書を効率的に又は適正に翻訳することが可能となり得る。 For example, the invention document analysis system 10 performs group classification of invention documents by the classification unit 1053 based on the correlation between key phrase groups extracted from each of the plurality of invention documents by the key phrase extraction unit 1051, and the machine learning unit By 107, a learning model for translation is generated for each group by machine learning using a plurality of sets of invention documents and corresponding translation result documents as training data. As a result, for example, in a machine translation system or the like, it is possible to machine-translate an invention document by arithmetic processing using a translation learning model suitable for the group to which the invention document belongs among the translation learning models for each group. In addition, the invention document analysis system 10 machine-translates at least a part of the invention document by arithmetic processing using, for example, a translation learning model suitable for the group to which the invention document belongs among the translation learning models for each group. , the patent application related information including the machine translation result may be output. By referring to such machine translation results of the invention document, the translator may be able to translate the invention document efficiently or properly.

発明文書分析システム10は、例えば、文書評価部106により、翻訳用発明文書標準規定に係る条件を、所定程度を超える程度に、満たす発明文書を選出し、機械学習部107により、その選出された発明文書と、その発明文書に対応する翻訳結果文書との複数組を教師データとした機械学習により機械翻訳のための翻訳用学習モデルを生成し、学習モデル出力部1081により、その翻訳用学習モデルを出力する。これにより、不適切な記載を含む発明文書と、その発明文書に基づいて生成された翻訳ミス等によりその発明文書と内容に齟齬のある翻訳結果文書との組が教師データに用いられにくくなり、発明文書分析システム10から、適切な翻訳用学習モデルが出力され得る。これにより、例えば機械翻訳システム等において、発明文書分析システム10から出力された適切な翻訳用学習モデルを利用した演算処理により発明文書を機械翻訳することが可能となる。この発明文書の機械翻訳結果を参照することで、翻訳者は、発明文書を効率的に又は適正に翻訳することが可能となり得る。 For example, the invention document analysis system 10 selects an invention document that satisfies the conditions related to the standard specification of invention documents for translation by the document evaluation unit 106 to a degree exceeding a predetermined degree, and the machine learning unit 107 selects the selected invention document. A learning model for translation for machine translation is generated by machine learning using multiple sets of invention documents and translation result documents corresponding to the invention documents as training data, and the learning model for translation is generated by a learning model output unit 1081. to output As a result, it is difficult to use a combination of an invention document containing inappropriate descriptions and a translation result document that is inconsistent with the invention document due to a translation error or the like generated based on the invention document as training data. An appropriate learning model for translation can be output from the invention document analysis system 10 . As a result, for example, in a machine translation system or the like, it becomes possible to machine-translate an invention document by arithmetic processing using an appropriate learning model for translation output from the invention document analysis system 10 . By referring to the result of machine translation of the invention document, the translator may be able to translate the invention document efficiently or properly.

発明文書分析システム10は、例えば、機械学習部107により、翻訳用発明文書標準規定に含まれる修正情報に基づいて発明文書中の不適切な記載を修正した修正版発明文書と、その発明文書に対応する翻訳結果文書との組を教師データとした機械学習により、機械翻訳のための翻訳用学習モデルを生成し、学習モデル出力部1081により、その翻訳用学習モデルを出力する。発明文書と、発明文書中の不適切な記載を翻訳段階で修正することで生成された翻訳結果文書とは、相互に言語の相違はあるものの、相互の内容の齟齬が低減されたものとなる可能性があるので、この発明文書分析システム10から出力された翻訳用学習モデルは適切である可能性がある。これにより、例えば機械翻訳システム等において、発明文書分析システム10から出力された適切である可能性がある翻訳用学習モデルを利用した演算処理により発明文書を機械翻訳することが可能となる。この発明文書の機械翻訳結果を参照することで、翻訳者は、発明文書を効率的に又は適正に翻訳することが可能となり得る。 For example, the invention document analysis system 10 uses the machine learning unit 107 to generate a modified version of the invention document in which inappropriate descriptions in the invention document are corrected based on the correction information included in the invention document standard specification for translation, and the invention document A translation learning model for machine translation is generated by machine learning using pairs with corresponding translation result documents as teacher data, and the learning model output unit 1081 outputs the translation learning model. Although there are language differences between the invention document and the translation result document generated by correcting inappropriate descriptions in the invention document at the translation stage, the discrepancies between the contents are reduced. Since there is a possibility, the learning model for translation output from this invention document analysis system 10 may be appropriate. As a result, for example, in a machine translation system or the like, it is possible to machine-translate an invention document by arithmetic processing using a potentially appropriate learning model for translation output from the invention document analysis system 10 . By referring to the result of machine translation of the invention document, the translator may be able to translate the invention document efficiently or properly.

発明文書分析システム10は、例えば、マイクロプロセッサを備える機器に、図7に例示したような発明文書分析処理を実行させるための発明文書分析処理プログラムをインストールして構成される。発明文書分析システム10において発明文書分析処理プログラムが起動されると、発明文書分析処理が実行される。発明文書分析処理は、例えば、設定情報取得ステップS1で取得された設定情報に基づいて、文書取得ステップS2で取得された、発明者等又は弁理士により作成された発明文書を、分析ステップS3で分析し、その分析結果として生成された情報を出力ステップS4で出力する処理である。分析ステップS3は、発明文書から重要語句を抽出する重要語句抽出ステップS31を含む。翻訳者等にとっては、発明文書分析処理により出力された情報を参照することで、発明文書の理解が促進される可能性がある。発明文書の理解の促進は、翻訳者にとって発明文書を適切に又は効率的に翻訳するために有用となる。なお、発明文書分析システム10は、出力ステップS4により例えば特許出願関連情報を表示するための表示用文書を出力し得る。発明文書分析システム10が行う発明文書分析処理に、そのステップS4により過去に出力済みである1つ以上の表示用文書のうちいずれかの選択操作を可能にするGUI画面を表示して、選択された表示用文書を、マイクロプロセッサを備える機器におけるブラウザの解釈及び表示の対象とする処理を、含ませることとしてもよい。 The invention document analysis system 10 is configured, for example, by installing an invention document analysis processing program for executing invention document analysis processing as illustrated in FIG. 7 in a device having a microprocessor. When the invention document analysis processing program is started in the invention document analysis system 10, the invention document analysis processing is executed. In the invention document analysis process, for example, based on the setting information acquired in the setting information acquisition step S1, the invention document created by the inventor or the like or the patent attorney acquired in the document acquisition step S2 is analyzed in the analysis step S3. This is a process of analyzing and outputting the information generated as the analysis result in the output step S4. The analysis step S3 includes an important phrase extraction step S31 for extracting important phrases from the invention document. For a translator or the like, referring to the information output by the invention document analysis process may facilitate understanding of the invention document. Promoting the understanding of the invention document is useful for translators to translate the invention document appropriately or efficiently. The invention document analysis system 10 can output a display document for displaying patent application related information, for example, in the output step S4. In the invention document analysis processing performed by the invention document analysis system 10, a GUI screen is displayed that enables the selection operation of one or more display documents that have been output in the past in step S4, and the selected document is displayed. A process of subjecting the displayed document to interpretation and display by a browser in a microprocessor-equipped device may also be included.

(実施形態2)
以下、発明文書分析システムの実施形態の別の一例について、図面を用いて説明する。
(Embodiment 2)
Another example of an embodiment of the invention document analysis system will be described below with reference to the drawings.

本実施形態で示す発明文書分析システムは、基本的には、実施形態1で示した発明文書分析システム10と同様に、発明文書を分析する発明文書分析処理を実行するシステムである。本実施形態で示す発明文書分析システムは、実施形態1で示した発明文書分析システム10の一部を変形したものに相当し、本実施形態における発明文書分析処理は、実施形態1における発明文書分析処理を一部変形したものに相当する。本実施形態に係る発明文書分析システムは、本実施形態で説明する事項と矛盾しない限り、実施形態1で示した発明文書分析システム10の全ての構成要素を含み得る。本実施形態に係る発明文書分析システムについて、実施形態1で示した発明文書分析システム10に関する事項と、同様な事項についての説明は、適宜省略する。 The invention document analysis system shown in this embodiment is basically a system that executes invention document analysis processing for analyzing invention documents, like the invention document analysis system 10 shown in the first embodiment. The inventive document analysis system shown in the present embodiment corresponds to a part of the inventive document analysis system 10 shown in the first embodiment. This corresponds to a partially modified process. The invention document analysis system according to this embodiment can include all the constituent elements of the invention document analysis system 10 shown in the first embodiment as long as they do not contradict the items described in this embodiment. Regarding the invention document analysis system according to the present embodiment, the description of the same matters as those related to the invention document analysis system 10 shown in the first embodiment will be omitted as appropriate.

[3-1.実施形態2に係る発明文書分析システムの構成例]
図11は、発明文書分析システム20の構成の一例を示す。また、図12は、発明文書分析システム20が取り扱う、主なデータ類の一例を示す。発明文書分析システム20は、例えば、設定情報、プラグインモジュール、翻訳用発明文書標準規定、重要語句設定辞書、対訳辞書情報、翻訳補助情報、発明文書、図面文書、翻訳結果文書等を取得し得る。発明文書分析システム20は、例えば、設定情報表示用文書、特許出願関連情報、重要語句群情報、各種学習モデルの生成のための機械学習に用いられる教師データ、翻訳用学習モデル、重要語句翻訳用学習モデル、技術分野特定用学習モデル等を出力し得る。
[3-1. Configuration example of an invention document analysis system according to the second embodiment]
FIG. 11 shows an example of the configuration of the invention document analysis system 20. As shown in FIG. FIG. 12 shows an example of main data handled by the invention document analysis system 20. As shown in FIG. The invention document analysis system 20 can acquire, for example, setting information, plug-in modules, invention document standard specifications for translation, key phrase setting dictionaries, bilingual dictionary information, translation assistance information, invention documents, drawing documents, translation result documents, and the like. . The invention document analysis system 20 includes, for example, setting information display documents, patent application related information, important phrase group information, teacher data used in machine learning for generating various learning models, learning models for translation, important phrase translation A learning model, a learning model for technical field identification, etc. can be output.

発明文書分析システム20は、発明文書を取得し、発明文書を分析する発明文書分析処理を実行するシステムである。 The invention document analysis system 20 is a system that acquires invention documents and executes invention document analysis processing for analyzing the invention documents.

発明文書分析システム20は、発明文書を分析して、分析結果に基づき、特許出願関連情報等の情報(図12参照)を出力するためのシステムであり、例えば、プログラムを実行するマイクロプロセッサを備える機器等で、実現される。発明文書分析システム20は、例えば、実施形態1で示した発明文書分析システム10と同様に、特許出願関連情報を、表示用文書として出力する。また、発明文書分析システム20は、特許出願関連情報を、テキストファイル等の各種形式のファイルとして、出力してもよい。 The invention document analysis system 20 is a system for analyzing invention documents and outputting information such as patent application related information (see FIG. 12) based on the analysis results, and includes, for example, a microprocessor that executes a program. It is realized by a device or the like. The invention document analysis system 20 outputs the patent application related information as a document for display, for example, like the invention document analysis system 10 shown in the first embodiment. The invention document analysis system 20 may also output the patent application related information as files in various formats such as text files.

発明文書分析システム20は、実施形態1で示した発明文書分析システム10と同様に、例えば、図8~図10のいずれかに示すハードウェア構成又はネットワーク構成を有していてもよい。発明文書分析システム20は、1台のコンピュータ等の装置で実現されてもよいし、複数台のコンピュータ等の装置で実現されてもよい。また、複数の発明文書分析システム20の各々が、1人又は複数人のユーザに利用され得る。ここでは、一例としての発明文書分析システム20が、ファイルシステム等を含むOSとその他のプログラムを搭載したコンピュータで実現される例を想定して、説明を続ける。 The invention document analysis system 20 may have, for example, the hardware configuration or network configuration shown in any one of FIGS. 8 to 10, like the invention document analysis system 10 shown in the first embodiment. The invention document analysis system 20 may be realized by a device such as a single computer, or may be realized by a plurality of devices such as computers. Also, each of the plurality of invention document analysis systems 20 can be used by one or more users. Here, the explanation will be continued assuming that the invention document analysis system 20 as an example is realized by a computer equipped with an OS including a file system and other programs.

発明文書分析システム20のユーザとしては、例えば発明文書の作成者(例えば弁理士、発明者等)、或いは、発明文書を用いて処理を行う翻訳者等が想定される。ここで、翻訳者等は、発明文書を基に外国語に翻訳して外国出願用の翻訳結果文書を作成する翻訳者と、発明文書についての調査、分析、修正、評価、見解陳述等といった、発明文書を用いた各種処理を行う者とを含み得る。 A user of the invention document analysis system 20 is assumed to be, for example, a creator of the invention document (for example, a patent attorney, an inventor, etc.) or a translator who performs processing using the invention document. Here, translators, etc. are divided into translators who translate invention documents into foreign languages and prepare translation result documents for foreign applications, and translators who research, analyze, correct, evaluate, and state opinions about invention documents. and a person who performs various processes using the invention document.

発明文書分析システム20は、図11に示すように、設定情報取得部201、文書取得部202、重要語句設定辞書取得部203、翻訳用発明文書標準規定取得部204、分析部205、機械学習部207及び出力部208を含む。設定情報取得部201、文書取得部202、重要語句設定辞書取得部203、翻訳用発明文書標準規定取得部204、分析部205、機械学習部207及び出力部208の各機能は、例えば、発明文書分析処理プログラムの全部又は一部を実行する1台以上のコンピュータにより実現される。分析部205は、発明文書から重要語句を抽出するための重要語句抽出処理を実行する重要語句抽出部2051、発明文書に基づき警告情報を生成し得る警告情報生成部2059等を含む。 As shown in FIG. 11, the invention document analysis system 20 includes a setting information acquisition unit 201, a document acquisition unit 202, an important phrase setting dictionary acquisition unit 203, an invention document standard definition acquisition unit 204 for translation, an analysis unit 205, and a machine learning unit. 207 and output 208 . Each function of the setting information acquisition unit 201, the document acquisition unit 202, the keyword setting dictionary acquisition unit 203, the invention document standard definition acquisition unit 204 for translation, the analysis unit 205, the machine learning unit 207, and the output unit 208, for example, It is implemented by one or more computers that execute all or part of the analysis processing program. The analysis unit 205 includes an important phrase extraction unit 2051 that executes an important phrase extraction process for extracting important phrases from the invention document, a warning information generation unit 2059 that can generate warning information based on the invention document, and the like.

[3-1-1.設定情報取得部]
設定情報取得部201は、実施形態1で示した設定情報取得部101を一部変形したものである。設定情報取得部201と設定情報取得部101とは、同様であってもよい。設定情報取得部201は、発明文書分析システム20が発明文書を分析するための基礎として用いる設定情報を取得する。
[3-1-1. Setting information acquisition part]
The setting information acquisition unit 201 is obtained by partially modifying the setting information acquisition unit 101 shown in the first embodiment. The setting information acquisition unit 201 and the setting information acquisition unit 101 may be the same. The setting information acquisition unit 201 acquires setting information used as a basis for the invention document analysis system 20 to analyze the invention document.

設定情報は、データベースのデータ、OSの環境変数としてのデータ等、如何なるデータとして存在してもよいが、例えば、ファイルの内容として存在し得る。ファイルは、例えば、発明文書分析システム20の一構成要素としての機器(例えばコンピュータ)の内部に備えられた、又は、発明文書分析システム20を構成する機器と通信可能な外部の機器に備えられた、メモリ、ハードディスク、各種光ディスク、光磁気ディスク等に記録されていてもよいし、そのいずれかの機器に着脱自在な、メモリカード、USB(Universal Serial Bus)メモリ等に記録されていてもよい。 The setting information may exist as any data such as database data, data as environment variables of the OS, and may exist as the contents of a file, for example. For example, the file is provided inside a device (e.g., a computer) as one component of the invention document analysis system 20, or provided in an external device that can communicate with the devices that constitute the invention document analysis system 20. , a memory, a hard disk, various optical disks, a magneto-optical disk, or the like, or a memory card, a USB (Universal Serial Bus) memory, or the like, which is detachable from any of these devices.

設定情報取得部201は、例えば、設定情報を内容として含むファイルである設定情報ファイルを読み込むことで、設定情報の取得をしてもよい。設定情報取得部201は、複数の設定情報ファイルを読み込んで、複数のファイルの内容を、矛盾点については予め定めた優先順位に従って、統合することで、設定情報の取得を実現してもよい。設定情報ファイルには、技術分野等といったグループを問わない、一般的な設定情報が定義されていてもよい。また、1つの設定情報ファイル内において、技術分野別、発明者の所属部門別等といったグループ別に、複数種類の設定情報が定義されていてもよいし、グループ別に、別々の設定情報を含む別々の設定情報ファイルが存在してもよい。本開示における発明者の所属部門の具体的な一例としては、一企業内又は一会社内における発明者の所属する事業部、部署等、或いは、発明者の所属する企業、会社等が、挙げられる。 The setting information acquisition unit 201 may acquire setting information by, for example, reading a setting information file, which is a file containing setting information as content. The setting information acquisition unit 201 may read a plurality of setting information files and integrate the content of the plurality of files according to a predetermined priority order for discrepancies, thereby realizing acquisition of setting information. The setting information file may define general setting information regardless of the group such as the technical field. In one setting information file, a plurality of types of setting information may be defined for each group, such as for each technical field or each inventor's department. A configuration information file may exist. A specific example of the department to which the inventor belongs in the present disclosure is the division, department, etc. to which the inventor belongs within one company or one company, or the company, company, etc. to which the inventor belongs. .

設定情報取得部201は、発明文書分析システム20において取得された発明文書が属するグループを、一般的な設定情報に基づいて特定し、その特定されたグループに対応する設定情報を含む設定情報から、その特定されたグループに対応する設定情報を取得することとしてもよい。また、設定情報取得部201は、グループ別の複数の設定情報ファイルのうちユーザに指定された設定情報ファイルにおける設定情報、或いは、1つの設定情報ファイルにおける複数種類の設定情報のうちユーザに指定された設定情報を、取得することとしてもよい。 The setting information acquisition unit 201 identifies the group to which the invention document acquired by the invention document analysis system 20 belongs based on general setting information, and from the setting information including the setting information corresponding to the identified group, Setting information corresponding to the specified group may be obtained. The setting information acquisition unit 201 also acquires setting information in a setting information file specified by the user among a plurality of setting information files for each group, or setting information specified by the user among a plurality of types of setting information in one setting information file. It is also possible to obtain the setting information.

図13は、設定情報の内容の一例を示す。 FIG. 13 shows an example of the content of setting information.

設定情報は、例えば、翻訳用発明文書標準規定自体、又は、翻訳用発明文書標準規定の特定用情報を含み得る。翻訳用発明文書標準規定の特定用情報は、例えば翻訳用発明文書標準規定へのアクセスするために必要な情報である。翻訳用発明文書標準規定は、データベースのデータ、OSの環境変数としてのデータ等、如何なるデータとして存在してもよいが、例えば、ファイルの内容として存在し得る。翻訳用発明文書標準規定の特定用情報は、具体例としては、翻訳用発明文書標準規定を内容とするファイルにアクセスするために必要なファイルパス等の情報、或いは、ネットワークを介して、翻訳用発明文書標準規定としてのデータにアクセスするために必要なURL(Uniform Resource Locator)等である。 The setting information may include, for example, the invention document standard specification for translation itself or information for specifying the invention document standard specification for translation. The identification information of the invention document standard specification for translation is, for example, information necessary for accessing the invention document standard specification for translation. The invention document standard specification for translation may exist as any data such as database data, data as environment variables of the OS, etc. For example, it may exist as the contents of a file. Specific examples of the specification information of the standard provisions for invention documents for translation include information such as file paths required to access files containing the standard provisions for invention documents for translation, or information for translation via a network. It is a URL (Uniform Resource Locator) or the like necessary for accessing data as an invention document standard definition.

設定情報は、発明文書分析システム20の分析対象となる発明文書からの重要語句の抽出の条件を示す条件情報を含む。条件情報は、実施形態1で示した内容であってもよいし、その一部を変更したものであってもよい。条件情報は、例えば、重要語句候補文字列パターン情報、参照文字列パターン情報、符号文字列パターン情報、特定助詞文字列パターン情報等を含む。条件情報に係る各種の文字列パターン(例えば重要語句候補文字列パターン情報が示す重要語句候補文字列パターン)は、例えば、該当する1文字以上の文字列を1つ以上列挙した態様で表現された文字列パターンであってもよいし、該当する文字列の全部又は一部を、一定範囲の文字列とする文字コード範囲を限定する態様で、表現された文字列パターンであってもよいし、該当する文字列の一部を、全範囲の文字列とする所謂ワイルドカード指定を伴う態様で、表現された文字列パターンであってもよい。 The setting information includes condition information indicating conditions for extracting key words from invention documents to be analyzed by the invention document analysis system 20 . The condition information may be the contents shown in the first embodiment, or may be partially modified. The condition information includes, for example, important phrase candidate character string pattern information, reference character string pattern information, code character string pattern information, specific particle character string pattern information, and the like. Various character string patterns related to the condition information (for example, key phrase candidate character string patterns indicated by key phrase candidate character string pattern information) are expressed, for example, in a manner in which one or more corresponding character strings of one or more characters are listed. It may be a character string pattern, or it may be a character string pattern expressed in a manner that limits the character code range in which all or part of the corresponding character string is a character string within a certain range, It may be a character string pattern expressed in a manner involving a so-called wildcard specification in which a part of the applicable character string is a character string of the entire range.

重要語句候補文字列パターン情報は、予め定められた、技術用語に特有の語尾(例えば、「装置」、「基板」、「システム」、「手段」、「部」、「ステップ」、「媒体」、「剤」、「ファイル」等)を、語尾に含む技術用語特有語尾文字列が該当するような文字列パターンを表す情報を含んでもよい。重要語句候補文字列パターン情報は、予め定められた、技術用語と推定される語句(例えば、「受付部」、「受付け部」、「受け付け部」、「ねじ」、「ふるい」等)そのもの又はその語句を語尾に含む文字列が該当するような文字列パターンを表す情報を含んでもよい。また、設定情報は、1つ以上の技術用語特有語尾文字列を示す技術用語特有語尾情報を含んでもよい。 The important word candidate character string pattern information is defined in advance, and includes endings specific to technical terms (for example, "apparatus", "substrate", "system", "means", "unit", "step", "medium"). , “medicine”, “file”, etc.) may be included. The key word candidate character string pattern information is a predetermined word or phrase presumed to be a technical term (for example, "accepting part", "accepting part", "accepting part", "screw", "sieve", etc.) itself or It may also include information representing a character string pattern to which a character string including the word at the end corresponds. The setting information may also include technical term-specific ending information indicating one or more technical term-specific ending strings.

重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列は、基本的には、重要語句抽出部2051において重要語句として抽出される可能性がある。但し、条件情報は、重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列であっても重要語句として抽出されるべきでない文字列についての文字列パターンを示す、抽出例外条件に係る情報を含み得る。抽出例外条件に係る情報が示す文字列パターンに該当する文字列は、例えば、重要語句抽出部2051において重要語句として抽出されない。 A character string corresponding to an important phrase candidate character string pattern indicated by the important phrase candidate character string pattern information may basically be extracted as an important phrase by the important phrase extraction unit 2051 . However, the condition information is an extraction exception indicating a character string pattern for a character string that should not be extracted as an important phrase even if it corresponds to the important phrase candidate character string pattern indicated by the important phrase candidate character string pattern information. May contain information on conditions. A character string corresponding to the character string pattern indicated by the information related to the extraction exception condition is not extracted as an important phrase by the important phrase extraction unit 2051, for example.

重要語句候補文字列パターン情報は、例えば、複数の重要語句候補文字列パターンを示す情報であってもよい。重要語句候補文字列パターン情報は、一例としては、先頭文字が英字、漢字又は片仮名のいずれかで、かつ、末尾文字が英字、片仮名、漢字又は所定の平仮名であるような所定の文字列が、1つの重要語句候補文字列パターンに該当するように定められている。重要語句候補文字列パターン情報は、漢字の直後に所定の平仮名(例えば、「え」、「き」、「け」、「し」、「み」、「り」、「れ」等)のうちの1字を配置した組を1組以上含む文字列が、1つの重要語句候補文字列パターンに該当するように定められていてもよい。 The key phrase candidate character string pattern information may be, for example, information indicating a plurality of key phrase candidate character string patterns. The important phrase candidate character string pattern information, for example, is a predetermined character string whose first character is either an alphabetic character, a kanji character, or a katakana character, and whose last character is an alphabetic character, a katakana character, a kanji character, or a predetermined hiragana character, It is determined to correspond to one key phrase candidate character string pattern. The key phrase candidate character string pattern information consists of predetermined hiragana characters (e.g., ``e'', ``ki'', ``ke'', ``shi'', ``mi'', ``ri'', ``re'', etc.) immediately after kanji. A character string that includes one or more sets of one character may be determined to correspond to one key phrase candidate character string pattern.

重要語句候補文字列パターン情報が示す重要語句の候補となる文字列に係る文字列パターンは、例えば正規表現で表される。例えば、重要語句抽出部2051で実行される重要語句抽出処理が、一例としてPython(登録商標)言語で記述されたプログラムを実行するコンピュータにより実現される場合において、設定情報の条件情報に係る各種の文字列パターンは、例えば、Python(登録商標)の正規表現操作(例えば文字列検索等)のための標準ライブラリ「re」、或いは、「re」の機能を拡張した、サードパーティにより提供されたライブラリである「regex」等で利用可能な、正規表現によって表現可能な文字列パターンである。 A character string pattern related to a character string that is a candidate for an important phrase indicated by the important phrase candidate character string pattern information is represented by, for example, a regular expression. For example, when the key phrase extraction process executed by the key phrase extraction unit 2051 is implemented by a computer that executes a program written in Python (registered trademark) language, various A string pattern is, for example, a standard library "re" for regular expression operations (e.g., string search, etc.) of Python (registered trademark), or a library provided by a third party that extends the function of "re" It is a character string pattern that can be expressed by a regular expression, which can be used by "regex", etc.

重要語句抽出処理において、ライブラリ「re」の関数を用いて文字列検索を行うことで発明文書から参照文字列を抽出するための具体的な参照文字列パターンの1つの一例は、概ね、「'(前記|上記|当該|その|記載の|・・・(以下省略)'」のように参照文字列を列挙した文字列パターンである。また、ライブラリ「regex」の関数を用いて文字列検索を行うことで発明文書から重要語句候補文字列を抽出するための具体的な重要語句候補文字列パターンの1つの一例は、概ね、「r'([A-Za-zA-Za-z]+([ //::][A-Za-zA-Za-z]+)+)*[A-Za-zA-Za-z]*[ー・\p{Katakana}\p{Han}]+)・・・(以下省略)'」のような文字列パターンである。ここで、「\p{Katakana}」は片仮名を示し、「\p{Han}」は漢字を示す。重要語句候補文字列パターンは複数存在してもよく、例えば、いくつかの具体例を示すと「r'([A-Za-zA-Za-z]*[ー・\p{Katakana}\p{Han}]*[A-Za-zA-Za-z]*[--―・//]?[A-Za-zA-Za-z]+)'」、「r'([A-Za-zA-Za-z]*[ー・\p{Katakana}\p{Han}]+)'」、「r'([A-Za-zA-Za-zー・\p{Katakana}]*[\p{Han}]+[いうえきくけしすせちつてなねひみむめりるれぎげじぜぢびべ][ー・\p{Katakana}\p{Han}]*[A-Za-zA-Za-z]+[--―・//]?[A-Za-zA-Za-z]+)'」、「r'[A-Za-zA-Za-zー・\p{Katakana}]*[\p{Han}]+[いうえきくけしすせちつてなねひみむめりるれぎげじぜぢびべ][A-Za-zA-Za-z]*[ー・\p{Katakana}\p{Han}]+)'」、「r'([A-Za-zA-Za-zー・\p{Katakana}]*[\p{Han}]+[いうえきくけしすせちつてなねひみむめりるれぎげじぜぢびべ][\p{Han}][いうえきくけしすせちつてなねひみむめりるれぎげじぜぢびべ][ー・\p{Katakana}\p{Han}]*[A-Za-zA-Za-z]+[--―・//]?[A-Za-zA-Za-z]+)'」、「r'([A-Za-zA-Za-zー・\p{Katakana}]*[\p{Han}]+[いうえきくけしすせちつてなねひみむめりるれぎげじぜぢびべ][\p{Han}][いうえきくけしすせちつてなねひみむめりるれぎげじぜぢびべ][A-Za-zA-Za-z]*[ー・\p{Katakana}\p{Han}]+)'」等を、重要語句候補文字列の検索に用いることができる。また、符号文字列パターン情報が示す符号文字列パターンは、例えば、符号として用いることができる文字列が該当するように定められたパターンであり、更に、始め丸括弧に後続して、符号として用いることができる1つ以上の文字を配置して、その1つ以上の文字に後続して終わり丸括弧が配置されたような文字列が該当するように定められたパターンであってもよい。符号として用いることができる文字は、例えば、アラビア数字、英字、ギリシャ文字、ローマ数字、一部の記号等である。ライブラリ「re」の関数を用いて文字列検索を行うことで発明文書から符号として用いられる文字列を抽出するための具体的な符号文字列パターンの1つの一例は、概ね、「'([0-90-9A-Za-zA-Za-z][--―・//0-90-9A-Za-zA-Za-z]*)・・・(以下省略)'」等のようなパターンである。また、ライブラリ「re」の関数を用いて文字列検索を行うことで発明文書から所定の助詞である文字列を抽出するための具体的な特定助詞文字列パターン情報が示す特定助詞文字列パターンの1つの一例は、「'(を|に|が|と|から|へ|は|・・・(一部省略)・・・)'」等のようなパターンである。 In the important phrase extraction process, one example of a specific reference character string pattern for extracting a reference character string from an invention document by performing a character string search using the function of the library "re" is roughly "' It is a string pattern that enumerates reference strings such as (above|above|relevant|that|description|... (hereinafter omitted)'”. Also, a string search is performed using the function of the library “regex” One example of a specific key phrase candidate character string pattern for extracting key phrase candidate character strings from invention documents by performing ([//::][A-Za-zA-Za-z]+)+)*[A-Za-zA-Za-z]*[ー・\p{Katakana}\p{Han}]+ )... (hereinafter omitted) '" is a character string pattern. Here, "\p{Katakana}" indicates katakana, and "\p{Han}" indicates kanji. There may be multiple key phrase candidate character string patterns. {Han}]*[A-Za-zA-Za-z]*[---・//]?[A-Za-zA-Za-z]+)', "r'([A-Za -zA-Za-z]*[ー・\p{Katakana}\p{Han}]+)', ``r'([A-Za-zA-Za-zー・\p{Katakana}]* [\p{Han}]+[Iuekikukeshisusechitsutenane Himimumeriruregigejizejibibe][ー・\p{Katakana}\p{Han}]*[A-Za -zA-Za-z]+[---//]?[A-Za-zA-Za-z]+)', ``r'[A-Za-zA-Za-z-\p {Katakana}]*[\p{Han}]+[Iuekikukeshisusechitsutenane Himimumeriruregigejizejibibe][A-Za-zA-Za-z]*[ー・\p{Katakana}\p{Han}]+)'”, “r'([A-Za-zA-Za-zー・\p{Katakana}]*[\p{Han}]+[i Ueki Kukeshi Suse Chitane Himimumeri Ruregigejizejibibe][\p{Han}] ][ー・\p{Katakana}\p{Han}]*[A-Za-zA-Za-z]+[---・//]?[A-Za-zA-Za-z]+) ', ``r'([A-Za-zA-Za-zー・\p{Katakana}]*[\p{Han}]+[Iuekikukeshisusetetsutane Himimumerirure gigejizejibibe][\p{Han}][iuekikukeshisusechitsutenane himimumeriruregigejizejibibe][A-Za-zA-Za-z]*[ -\p{Katakana}\p{Han}]+)' and the like can be used to search for key phrase candidate character strings. Also, the code string pattern indicated by the code string pattern information is, for example, a pattern determined so as to correspond to a character string that can be used as a code. It may also be a pattern defined to apply to a string of characters such as one or more characters followed by a closing parenthesis. Characters that can be used as symbols are, for example, Arabic numerals, English letters, Greek letters, Roman numerals, some symbols, and the like. One example of a specific code string pattern for extracting a character string used as a code from an invention document by performing a string search using the function of the library "re" is roughly "'([0 -90-9A-Za-zA-Za-z][---・//0-90-9A-Za-zA-Za-z]*)... (Omitted) Patterns such as '" is. In addition, a specific particle character string pattern indicated by specific specific particle character string pattern information for extracting a character string that is a predetermined particle from an invention document by performing a character string search using the function of the library "re" One example is a pattern such as "'( to | is | and | to | to | is |... (partially omitted)...)'".

設定情報は、例えば、重要語句設定辞書の特定用情報(例えば重要語句設定辞書ファイルへアクセスするために用いられる情報)を含んでもよい。また、設定情報は、翻訳補助情報(つまり1つ以上の重要語句各々について重要語句と対応翻訳語とを対応付けた情報)の特定用情報を含んでもよく、発明文書分析システム20は、設定情報に基づいて翻訳補助情報を取得し、翻訳補助情報における重要語句群を、重要語句設定辞書として利用することとしてもよい。また、設定情報は、例えば、対訳辞書情報の特定用情報を含んでもよい。この対訳辞書情報の特定用情報は、発明文書分析システム20が例えば図9に示す各装置で構成されるような場合においては、例えば、LAN上のサーバ装置10bにおける対訳辞書情報を内容とするファイルの所在を示す、サーバ装置10bのホスト名を含むパス(Path)情報等となり得る。 The setting information may include, for example, information for specifying important phrase setting dictionaries (for example, information used to access the important phrase setting dictionary file). In addition, the setting information may include information for specifying translation auxiliary information (that is, information in which key words and corresponding translated words are associated with each of one or more key words). It is also possible to acquire translation assistance information based on and use the important phrase group in the translation assistance information as an important phrase setting dictionary. The setting information may also include information for specifying bilingual dictionary information, for example. When the invention document analysis system 20 is composed of the devices shown in FIG. 9, for example, the information for specifying the bilingual dictionary information is a file containing the bilingual dictionary information in the server device 10b on the LAN. can be path information including the host name of the server device 10b, etc., indicating the location of the server device 10b.

設定情報は、例えば、発明文書における重要語句を抽出すべき行の範囲を限定するための重要語句抽出範囲情報を含み得る。重要語句抽出範囲情報の例としては、発明文書のうち、クレーム(例えば請求項)の記載に実質的に相当する部分と、明細書における「発明を実施するための形態」及び「実施例」の記載に実質的に相当する部分とに、重要語句を抽出すべき行の範囲を限定する例が挙げられる。通常の運用においては、クレームは重要語句を抽出する範囲とするべきであると想定されるので、明細書中の重要語句を抽出すべき範囲を限定するために、重要語句抽出範囲情報が、利用されることとしてもよい。 The setting information may include, for example, important phrase extraction range information for limiting the range of lines from which important phrases should be extracted in the invention document. Examples of information on the scope of extracting key phrases include the parts of the invention document that substantially correspond to the claims (e.g., claims), and the "Mode for Carrying Out the Invention" and "Examples" in the specification. Examples include a portion that substantially corresponds to the description and a range of lines from which key words should be extracted. In normal operation, it is assumed that the claims should be the range from which key words and phrases should be extracted. It may be assumed that

設定情報は、例えば、発明文書の文字列のうち、符号でないものと判断する基準となる非符号基準を含んでいてもよい。この非符号基準は、符号文字列パターン情報が示す符号文字列パターンに内包されていてもよいし、符号文字列パターン情報とは別に存在してもよい。符号文字列パターン情報と別に非符号基準が存在する場合には、分析部205の重要語句抽出部2051等は、符号文字列パターン情報が示す符号文字列パターンに該当する文字列であっても、非符号基準に基づいて該当しない文字列と看做すことがあり得る。 The setting information may include, for example, a non-code criterion that is a criterion for judging that the character strings of the invention document are not codes. The non-code reference may be included in the code character string pattern indicated by the code character string pattern information, or may exist separately from the code character string pattern information. If there is a non-coded reference other than the coded character string pattern information, the important word/phrase extraction unit 2051 of the analysis unit 205, etc., even if the character string corresponds to the coded character string pattern indicated by the coded character string pattern information, It is possible to consider strings that do not match based on non-sign criteria.

設定情報は、例えば、発明文書における、コメントの部分又はコメント行を特定するためのコメント特定用情報を含んでもよい。コメントは、例えば、発明文書が特許出願の準備段階の文書である場合等において、注意喚起、覚書、注釈等のために発明文書に含まれる記載事項であって、後の特許出願段階では変更(例えば削除)が予定されている記載事項である。コメント行は、一行全部の内容がコメントである行である。コメント特定用情報の例として、「■」(つまり所謂ソリッドブロック)又は「※」(つまり所謂米印)が行頭に含まれる行がコメント行であることを表現した情報、行頭以外の「■{」(つまり所謂ソリッドブロック及び始め波括弧)から「}」(つまり終わり波括弧)までの部分がコメントであることを表現した情報等が挙げられる。 The setting information may include, for example, comment identifying information for identifying comment portions or comment lines in the invention document. For example, when the invention document is a document at the preparatory stage of a patent application, comments are items included in the invention document for purposes of calling attention, memorandums, annotations, etc., and are changed ( For example, deletion) is scheduled. A comment line is a line whose entire content is a comment. Examples of information for specifying comments include information expressing that a line including "■" (that is, a so-called solid block) or "*" (that is, a so-called asterisk) at the beginning of the line is a comment line, and "■{ (that is, a so-called solid block and opening curly brace) to "}" (that is, closing curly brace) is a comment.

設定情報は、例えば、発明文書から重要語句抽出部2051により抽出された重要語句の重要度を、一定条件下で、低い重要度であると決定する基準を示す重要度基準情報を含み得る。この一定条件は、例えば参照文字列に後続した使用及び符号に先行した使用のいずれもが発明文書中にない重要語句であるという条件等である。この重要度基準情報の例として、低い重要度の語句の語尾の文字列の低重要語尾文字列パターンを示す低重要語尾文字列パターン情報が挙げられる。低重要語尾文字列パターンに係る語尾の文字列である低重要語尾文字列の例としては、例えば、「番号」、「等」、「例」等が挙げられる。 The setting information can include, for example, importance criterion information indicating criteria for determining the importance of the important phrase extracted by the important phrase extraction unit 2051 from the invention document to be low under certain conditions. This fixed condition is, for example, the condition that both the use following the reference character string and the use preceding the sign are key phrases that are not in the invention document. An example of this importance level reference information is low-importance ending character string pattern information indicating a low-importance ending character string pattern of a character string at the end of a word with a low importance level. Examples of low-importance ending character strings, which are character strings at the end of words related to the low-importance ending character string pattern, include, for example, “number”, “etc”, and “example”.

設定情報は、例えば、発明文書分析システム20の機能の一部を代替又は拡張するために実行可能なプログラムモジュールとして外部から提供されるプラグインモジュールがある場合にそのプラグインモジュールにアクセスして実行するために必要な情報であるプラグインモジュール特定用情報を含み得る。プラグインモジュールとして、例えば、発明文書分析システム20の分析対象の発明文書が、翻訳用発明文書標準規定の複数の項目各々に適合しているか否かに係る判定を行うための処理を担うプログラムモジュール、重要語句の抽出の拡張等のために追加すべき文字列パターン及びその文字列パターンを利用した重要語句の抽出処理を担うプログラムモジュール、分析部205による分析結果を利用して予め定められた何らかの演算処理を行った結果を出力する処理を実行するためのプログラムモジュール等が挙げられる。プラグインモジュール特定用情報の具体例としては、プラグインモジュールを内容とするファイルにアクセスするために必要なファイルパス等の情報、或いは、ネットワークを介して、プラグインモジュールをダウンロードするために必要なURL等である。発明文書分析システム20は、例えば、プラグインモジュールにより代替又は拡張される機能を実行する際に、プラグインモジュールを実行する。プラグインモジュールにバージョン管理のためのバージョン情報(例えばバージョン番号等)が付されている場合には、発明文書分析システム20は、既に取得済みのプラグインモジュールより新しいバージョン(例えばバージョン番号)のプラグインモジュールが入手可能であれば、既に取得済みのプラグインモジュールを削除して、その新しいバージョンのプラグインモジュールを取得して利用する。発明文書分析システム20は、分析部205により発明文書を分析して得られた、重要語句、符号等に関する情報その他の各種情報を、プラグインモジュールから利用可能にするためのAPI(Application Programming Interface)等を提供することとしてもよい。発明文書分析システム20は、取得したプラグインモジュールを、そのプラグインモジュールの目的を達成するために適宜実行し得る。 For example, if there is a plug-in module externally provided as an executable program module for substituting or extending some of the functions of the invention document analysis system 20, the setting information is accessed and executed by the plug-in module. It may include information for plug-in module specification, which is information necessary for executing the plug-in module. As a plug-in module, for example, a program module responsible for processing for determining whether or not an invention document to be analyzed by the invention document analysis system 20 conforms to each of a plurality of items of the invention document standard specifications for translation. , a program module responsible for character string patterns to be added for extension of extraction of important phrases, and extraction processing of important phrases using the character string patterns; A program module or the like for executing a process of outputting a result of arithmetic processing is exemplified. A specific example of the plug-in module identification information is information such as a file path required to access a file containing the plug-in module, or information required to download the plug-in module via a network. URL or the like. The invention document analysis system 20 executes a plug-in module, for example, when executing a function substituted or extended by the plug-in module. If the plug-in module has version information (for example, a version number) for version management, the invention document analysis system 20 detects a plug-in module with a newer version (for example, a version number) than the already acquired plug-in module. If the in-module is available, delete the already acquired plug-in module and acquire and use the new version of the plug-in module. The invention document analysis system 20 provides an API (Application Programming Interface) for making available, from plug-in modules, information on important terms, symbols, etc., obtained by analyzing the invention document by the analysis unit 205, and other various types of information. etc. may be provided. The invention document analysis system 20 can appropriately execute the acquired plug-in module to achieve the purpose of the plug-in module.

設定情報は、例えば、重要語句抽出部2051が発明文書から抽出した重要語句が表す要素が、いずれのカテゴリーに属するかについて区別するための基準を示すカテゴリー区分基準情報を含み得る。カテゴリーの一例としては、物、方法、プログラム及びデータが挙げられる。カテゴリー区分基準情報は、例えば、重要語句の語尾に「プログラム」、「サブルーチン」等という文字列が含まれる場合にその重要語句により表される要素が、プログラムのカテゴリーに属するものであることを表現した情報である。カテゴリー区分基準情報は、例えば、重要語句の語尾に「方法」、「ステップ」、「手順」等という文字列が含まれる場合にその重要語句により表される要素は方法のカテゴリーに属するものであることを表現した情報である。カテゴリー区分基準情報は、例えば、重要語句の語尾に「データ」、「情報」等という文字列が含まれる場合にその重要語句により表される要素が、データのカテゴリーに属するものであることを表現した情報である。カテゴリー区分基準情報は、例えば、方法、プログラム及びデータのいずれのカテゴリーにも属さない重要語句により表される要素が物のカテゴリーに属するものであることを表現した情報である。 The setting information may include, for example, category grouping reference information indicating criteria for distinguishing to which category the element represented by the key phrase extracted from the invention document by the key phrase extraction unit 2051 belongs. Examples of categories include products, methods, programs and data. For example, when a key phrase includes a character string such as "program" or "subroutine" at the end of a key phrase, the category division criteria information expresses that the element represented by the key phrase belongs to the program category. It is the information The category classification criteria information is, for example, when a character string such as "method", "step", or "procedure" is included at the end of an important phrase, the element represented by the important phrase belongs to the category of method. It is information that expresses For example, when a key phrase includes a character string such as "data" or "information" at the end of a key phrase, the category division criteria information expresses that the element represented by the key phrase belongs to the data category. It is the information The category division criteria information is, for example, information expressing that an element represented by an important phrase that does not belong to any of the categories of method, program, and data belongs to the product category.

設定情報は、例えば、分析部205が、発明文書のクレームに基づいて、未完成の明細書の内容を表す明細書情報を生成する場合に用いられる定型文の内容、挿入位置及び挿入条件等を示す1つ以上の定型文情報を含み得る。定型文情報の一例としては、例えば、明細書の「発明を実施するための形態」という見出しの次の行等に、「本開示で用いる図面は、模式図であり、厳密に図示されたものではない。・・・」という内容の定型文を挿入することを表現した情報が、挙げられる。なお、各定型文情報における挿入条件の例として、発明文書のクレームに請求対象としてプログラムを請求する項が含まれるという条件、請求対象として物を請求する項、及び、記録媒体を請求する項が含まれるという条件等が挙げられる。 The setting information includes, for example, the content of fixed phrases used when the analysis unit 205 generates specification information representing the content of an incomplete specification based on the claims of the invention document, the insertion position, the insertion conditions, and the like. It may include one or more boilerplate information to indicate. As an example of fixed phrase information, for example, in the line next to the heading "Mode for Carrying out the Invention" in the specification, "The drawings used in this disclosure are schematic diagrams and are strictly illustrated It is not." Examples of insertion conditions in each fixed phrase information include a condition that a claim of an invention document includes a claim claiming a program as a claim subject, a claim claiming a product as a claim subject, and a claim claiming a recording medium. conditions such as being included.

設定情報は、例えば、分析部205が、発明文書のクレームに基づいて、未完成の明細書の内容を表す明細書情報を生成する場合に用いられる1つ以上の要素の説明に係る情報としての、記載支援用未完成メッセージの内容を示す未完成メッセージ情報を含み得る。記載支援用未完成メッセージは、例えば、一般的に記載すべき項目を例示列挙した文字列等を含み得る。未完成メッセージ情報は、例えば、発明文書のクレームから抽出された重要語句に基づいて、分析部205が生成するクレームベース明細書情報におけるその重要語句が示す要素の説明として、採用され得る記載支援用未完成メッセージを、その要素が物、方法、プログラム、データ等といった、いずれのカテゴリーに属するかに応じて、相違する内容に定義し得る情報である。 The setting information is, for example, information relating to the description of one or more elements used when the analysis unit 205 generates specification information representing the contents of an incomplete specification based on the claims of the invention document. , may include unfinished message information indicating the content of the unfinished message for writing support. The incomplete writing support message may include, for example, a character string listing items that should generally be written. The incomplete message information can be employed, for example, as an explanation of the elements indicated by the key phrases in the claim-based specification information generated by the analysis unit 205 based on the key phrases extracted from the claims of the invention document. It is information that can define an incomplete message with different contents depending on which category the element belongs to, such as an object, a method, a program, or data.

設定情報は、例えば、分析部205が、発明文書のクレームに基づいて、出願先として予定する地域(例えば出願先の国)に向けて修正したクレームを表す修正版クレーム情報を生成する場合に用いられる、その修正方法を定義した修正情報を含み得る。この修正情報は、例えば、発明文書のクレームに複数項を引用した項がある場合に、その項をその複数項のうち項番の最小の一項だけを引用するように変更することを表現した情報等である。修正情報は、例えば、翻訳用発明文書標準規定に含まれていてもよい。 The setting information is used, for example, when the analysis unit 205 generates amended version claim information representing claims amended based on the claims of the invention document for the region (for example, the country where the application is to be filed). may contain modification information that defines how to modify it. For example, if a claim of an invention document includes a term that cites multiple terms, this modification information expresses that the term should be changed so that only one term with the smallest number among the multiple terms is cited. Information, etc. Modification information may be included, for example, in the Standard Specification for Invention Documents for Translation.

設定情報は、修正版クレーム情報におけるクレームの形式に関して指定する情報を含んでもよい。 The configuration information may include information specifying the format of the claims in the modified claim information.

[3-1-2.文書取得部]
文書取得部202は、実施形態1で示した文書取得部102を一部変形したものである。文書取得部202と文書取得部102とは、同様であってもよい。文書取得部202は、発明文書取得部2021と図面文書取得部2022と翻訳結果文書取得部2023とを含む。
[3-1-2. Document Acquisition Unit]
A document acquisition unit 202 is obtained by partially modifying the document acquisition unit 102 shown in the first embodiment. The document acquisition unit 202 and the document acquisition unit 102 may be the same. The document acquisition section 202 includes an invention document acquisition section 2021 , a drawing document acquisition section 2022 and a translation result document acquisition section 2023 .

発明文書取得部2021は、例えば発明文書のユーザによる指定等に従って、発明文書分析システム20が分析する対象となる発明文書を取得する。発明文書取得部2021は、複数の発明文書を取得し得る。発明文書取得部2021により取得された発明文書は、分析部205及び機械学習部207で用いられ得る。 The invention document acquisition unit 2021 acquires an invention document to be analyzed by the invention document analysis system 20 according to, for example, specification of the invention document by the user. The invention document acquisition unit 2021 can acquire a plurality of invention documents. The invention document acquired by the invention document acquisition unit 2021 can be used by the analysis unit 205 and the machine learning unit 207 .

図面文書取得部2022は、例えば発明文書に対応する図面文書のユーザによる指定等に従って、発明文書取得部2021により取得された発明文書に対応する図面文書を取得する。図面文書取得部2022により取得された図面文書は、分析部205で用いられ得る。 The drawing document acquisition unit 2022 acquires the drawing document corresponding to the invention document acquired by the invention document acquisition unit 2021, for example, according to the designation of the drawing document corresponding to the invention document by the user. The drawing documents acquired by the drawing document acquisition unit 2022 can be used by the analysis unit 205 .

翻訳結果文書取得部2023は、例えば発明文書の翻訳結果である翻訳結果文書のユーザによる指定等に従って、発明文書取得部2021により取得された発明文書の翻訳結果である翻訳結果文書を取得する。翻訳結果文書取得部2023により取得された翻訳結果文書は、機械学習部207で用いられ得る。 The translation result document acquisition unit 2023 acquires the translation result document that is the translation result of the invention document acquired by the invention document acquisition unit 2021, for example, according to the user's designation of the translation result document that is the translation result of the invention document. The translation result document acquired by the translation result document acquisition unit 2023 can be used by the machine learning unit 207 .

発明文書、図面文書及び翻訳結果文書の各々は、データベースのデータ、OSの環境変数としてのデータ、クリップボードとして用いられるメモリ領域に格納されたデータ、インターネット等のネットワーク上のウェブサーバ等により提供されているデータ等、如何なるデータとして存在してもよいが、例えば、ファイルの内容として存在し得る。 Invention documents, drawing documents, and translation result documents are provided by database data, data as environment variables of the OS, data stored in a memory area used as a clipboard, and web servers on networks such as the Internet. It may exist as any data, such as data in a file, but may exist as the contents of a file, for example.

発明文書取得部2021、図面文書取得部2022及び翻訳結果文書取得部2023は、例えば、発明文書分析システム20のユーザによる各ファイルパスの指定に基づいて、それぞれ、発明文書を内容とするファイルである発明文書ファイル、図面文書を内容とするファイルである図面文書ファイル、翻訳結果文書を内容とするファイルである翻訳結果文書ファイルにアクセスすることで、発明文書、図面文書、翻訳結果文書を取得し得る。発明文書ファイル、図面文書ファイル、及び、翻訳結果文書ファイルが、所定のファイル名付与規則(例えばファイル種別毎に、ファイル名の先頭文字列、拡張子等を相違させるように定めた規則等)に従って命名されていることとしてもよく、この場合に、図面文書ファイルは、或いは、翻訳結果文書ファイルは、例えば、発明文書ファイルと同じフォルダー等に存在することにして、ユーザによるファイルパスの指定の手間を軽減してもよい。なお、所定のファイル名付与規則は、例えば、設定情報取得部201により取得される設定情報中に定められていてもよい。例えば、図面文書取得部2022は、発明文書取得部2021で取得された発明文書と、同一又は関連するフォルダー内の、所定のファイル名付与規則に合致するファイル(例えば発明文書と拡張子以外のファイル名が同一で拡張子がpdfであるファイル)から、図面文書を取得することとしてもよいし、発明文書の公報番号等に基づいてインターネット上のウェブサイト等から対応する図面文書を取得することとしてもよい。また、例えば、翻訳結果文書取得部2023は、発明文書取得部2021で取得された発明文書と、同一又は関連するフォルダー内の、所定のファイル名付与規則に合致するファイルから、翻訳結果文書を取得することとしてもよいし、発明文書の公報番号等に基づいてインターネット上のウェブサイト等から対応する翻訳結果文書を取得することとしてもよい。 The invention document acquisition unit 2021, the drawing document acquisition unit 2022, and the translation result document acquisition unit 2023 are, for example, files containing invention documents based on the specification of each file path by the user of the invention document analysis system 20. The invention document, the drawing document, and the translation result document can be obtained by accessing the invention document file, the drawing document file containing the drawing document, and the translation result document file containing the translation result document. . The invention document file, the drawing document file, and the translation result document file follow a predetermined file name assignment rule (for example, a rule that the first character string, extension, etc. of the file name are different for each file type, etc.) It may be named, and in this case, the drawing document file or the translation result document file may exist in the same folder as the invention document file, for example, so that the user does not have to specify the file path. may be reduced. Note that the predetermined file name assignment rule may be defined in the setting information acquired by the setting information acquiring unit 201, for example. For example, the drawing document acquisition unit 2022 selects a file in the same or related folder as the invention document acquired by the invention document acquisition unit 2021 (for example, a file other than the invention document and its extension) that matches a predetermined file naming rule. The drawing document may be obtained from a file with the same name and the extension pdf), or the corresponding drawing document may be obtained from a website, etc. on the Internet based on the publication number of the invention document. good too. Also, for example, the translation result document acquisition unit 2023 acquires the translation result document from a file matching a predetermined file name assignment rule in the same or related folder as the invention document acquired by the invention document acquisition unit 2021. Alternatively, the corresponding translation result document may be obtained from a website or the like on the Internet based on the publication number of the invention document.

図面文書ファイルは、例えばPDFファイルである。発明文書ファイル及び翻訳結果文書ファイルは、例えばテキストファイルである。発明文書ファイル及び翻訳結果文書ファイルは、例えば、PDFファイルであっても、Microsoft(登録商標)のWord等の文書作成編集機能を有する各種アプリケーションプログラムに主として用いられる形式のファイルであっても、XML(Extensible Markup Language)ファイルであってもよい。また、発明文書ファイル及び翻訳結果文書ファイルは、例えば、発明文書分析システム20が出力する表示用文書(例えばHTML文書)と同様の形式の1つ又は複数のファイルで構成されていてもよい。発明文書取得部2021は、例えば、発明文書分析システム20が過去に出力した表示用文書としての特許出願関連情報におけるクレーム情報及び明細書情報、或いは、修正版クレーム情報及び修正版明細書情報を、ユーザの指示に応じて、クレーム及び明細書を含む発明文書として取得してもよい。なお、PDFファイルは、内容における文字列が検索可能な状態で含まれたファイルとしての検索可能PDFファイルであってもよい。また、図面文書取得部2022は、検索可能PDFファイルでない図面文書ファイルを、例えば機械学習(例えば深層学習)等を用いた文字認識技術、或いは、OCR技術を用いた文字認識により、検索可能PDFファイルに変換して利用することとしてもよい。 The drawing document file is, for example, a PDF file. The invention document file and the translation result document file are, for example, text files. The invention document file and the translation result document file may be, for example, a PDF file, or a file in a format mainly used for various application programs having document creation and editing functions such as Microsoft (registered trademark) Word, etc., and XML. (Extensible Markup Language) file. Also, the invention document file and the translation result document file may consist of one or more files in the same format as the display document (for example, HTML document) output by the invention document analysis system 20, for example. For example, the invention document acquisition unit 2021 obtains the claim information and specification information in the patent application related information as display documents output by the invention document analysis system 20 in the past, or the modified claim information and modified specification information, It may be acquired as an invention document including claims and specifications according to the user's instructions. Note that the PDF file may be a searchable PDF file in which the character strings in the content are included in a searchable state. Also, the drawing document acquisition unit 2022 converts a drawing document file that is not a searchable PDF file into a searchable PDF file by character recognition technology using machine learning (for example, deep learning) or character recognition using OCR technology, for example. It may be converted to and used.

発明文書取得部2021、図面文書取得部2022及び翻訳結果文書取得部2023は、それぞれ、発明文書ファイル、図面文書ファイル、翻訳結果文書ファイルの内容を編集(例えば形式変換、部分的な削除等)した上で、発明文書、図面文書、翻訳結果文書を取得することとしてもよい。具体的な一例としては、発明文書取得部2021は、発明文書ファイルのエンコーディング形式(例えばUTF-8、EUC、Shift_JIS、CP932等)に応じた方式で発明文書ファイルの内容である発明文書を読み出して、必要に応じて形式変換をすることで、例えば、比較的多くの文字を表すことが可能な、予め定められたエンコーディング形式(例えばUTF-8)の文字コード列のデータとしての発明文書を取得する。発明文書ファイルのエンコーディング形式は、例えば試行錯誤で発明文書ファイルを読み込んでエラーが発生するか否かに応じてエンコーディング形式を特定してもよいし、発明文書ファイルをバイナリ(binary)のバイト(byte)列として仮に読んで内容を検査することでエンコーディング形式を特定してもよい。 The invention document acquisition unit 2021, the drawing document acquisition unit 2022, and the translation result document acquisition unit 2023 respectively edit the contents of the invention document file, the drawing document file, and the translation result document file (for example, format conversion, partial deletion, etc.). In addition, invention documents, drawing documents, and translation result documents may be obtained. As a specific example, the invention document acquisition unit 2021 reads the invention document, which is the content of the invention document file, in a method according to the encoding format of the invention document file (for example, UTF-8, EUC, Shift_JIS, CP932, etc.). , by converting the format as necessary, for example, obtaining an invention document as data of a character code string in a predetermined encoding format (for example, UTF-8) that can represent a relatively large number of characters. do. For the encoding format of the invention document file, for example, the encoding format may be specified according to whether or not an error occurs when the invention document file is read by trial and error. ) may identify the encoding type by reading it tentatively as a string and inspecting the contents.

なお、発明文書分析システム20が、文書作成編集機能を有して構成されてもよい(例えばテキストエディタ等の文書作成編集機能に係るアプリケーションプログラムを包含して構成されてもよい)。この場合には、発明文書分析システム20の文書作成編集機能において、ユーザの入力操作に応じて実行される処理によって生成又は編集された状態のデータである発明文書を、発明文書取得部2021が取得することとしてもよい。同様に、発明文書分析システム20の文書作成編集機能において、ユーザの入力操作に応じて実行される処理によって生成又は編集された状態のデータである翻訳結果文書を、翻訳結果文書取得部2023が取得することとしてもよい。また、発明文書分析システム20が、図面作成編集機能を有して構成されてもよい。この場合には、発明文書分析システム20の図面作成編集機能において、ユーザの入力操作に応じて実行される処理によって生成又は編集された状態のデータである図面文書を、図面文書取得部2022が取得することとしてもよい。 It should be noted that the invention document analysis system 20 may be configured to have a document creation and editing function (for example, it may be configured to include an application program related to the document creation and editing function such as a text editor). In this case, the invention document acquisition unit 2021 acquires the invention document, which is data in a state of being generated or edited by the process executed in response to the user's input operation in the document creation and editing function of the invention document analysis system 20. It is also possible to Similarly, in the document creation and editing function of the invention document analysis system 20, the translation result document acquisition unit 2023 acquires the translation result document, which is data in a state of being generated or edited by the process executed according to the user's input operation. It is also possible to Moreover, the invention document analysis system 20 may be configured to have a drawing creation and editing function. In this case, the drawing document acquisition unit 2022 acquires the drawing document, which is the data generated or edited by the process executed according to the user's input operation in the drawing creation editing function of the invention document analysis system 20. It is also possible to

発明文書、図面文書及び翻訳結果文書が、インターネットのウェブサーバ等のサーバ装置により提供されるデータとして存在する場合には、例えば、発明文書取得部2021、図面文書取得部2022及び翻訳結果文書取得部2023は、ユーザにより指定された、サーバ装置に係るURL、発明文書等を特定する情報(例えば発明文書について発行された公報に係る公報番号)等に基づいて、WANを介してそのサーバ装置にアクセスして、各データをダウンロードすることにより、それぞれ、発明文書、図面文書、翻訳結果文書を取得し得る。また、発明文書、図面文書及び翻訳結果文書が、発明文書分析システム20の一構成要素としての機器とLANで接続されたファイルサーバ、データベース又はスキャナの機能を搭載する機器により出力され得るファイル又はデータとして存在する場合には、例えば、発明文書取得部2021、図面文書取得部2022及び翻訳結果文書取得部2023は、その各ファイルの内容又は各データを、LAN経由で受信することにより、それぞれ、発明文書、図面文書、翻訳結果文書を取得し得る。従って、発明文書取得部2021は、例えば、手書きによる技術的思想のメモが、発明文書のクレーム又は明細書の内容に変換され得る実質的な内容を有している場合において、そのメモを読み取った、スキャナの機能を搭載する機器の出力するデータ等を、受信することで、発明文書を取得し得る。 If the invention document, the drawing document, and the translation result document exist as data provided by a server device such as a web server on the Internet, for example, the invention document acquisition unit 2021, the drawing document acquisition unit 2022, and the translation result document acquisition unit 2023 accesses the server device via the WAN based on the URL of the server device specified by the user, the information specifying the invention document (for example, the publication number of the publication issued for the invention document), etc. Then, by downloading each data, the invention document, the drawing document, and the translation result document can be acquired respectively. In addition, the invention document, the drawing document, and the translation result document are files or data that can be output by a device equipped with a file server, database, or scanner function connected to a device as one component of the invention document analysis system 20 via a LAN. , for example, the invention document acquisition unit 2021, the drawing document acquisition unit 2022, and the translation result document acquisition unit 2023 receive the content or data of each file via the LAN, thereby obtaining the invention Documents, drawing documents, and translation result documents can be obtained. Therefore, the invention document acquisition unit 2021 reads the handwritten memo of technical ideas, for example, when the memo has substantial contents that can be converted into the claims or the contents of the specification of the invention document. , the invention document can be obtained by receiving data output from a device equipped with a scanner function.

翻訳結果文書取得部2023は、例えば、発明文書取得部2021が、インターネット上で国際公開公報等が提供されている日本語の国際出願の内容である発明文書を取得した場合において、インターネット上に公開されている、その国際出願に関連する関連出願を示す情報を用いて、この国際出願に対応する翻訳内容に相当すると推定される、所定の国の官庁等に対する外国語で記載された出願内容が公開された特許公開公報等にアクセスすることで、翻訳結果文書を取得してもよい。 For example, when the invention document acquisition unit 2021 acquires an invention document that is the content of an international application in Japanese whose international publication is provided on the Internet, the translation result document acquisition unit 2023 publishes it on the Internet. The content of the application written in a foreign language to the Office of the prescribed country, etc., which is presumed to correspond to the translation corresponding to this international application, using the information indicating the related application related to the international application A translation result document may be obtained by accessing published patent publications or the like.

[3-1-3.重要語句設定辞書取得部]
重要語句設定辞書取得部203は、実施形態1で示した重要語句設定辞書取得部103を一部変形したものである。重要語句設定辞書取得部203と重要語句設定辞書取得部103とは、同様であってもよい。
[3-1-3. Important phrase setting dictionary acquisition unit]
The important phrase setting dictionary acquisition unit 203 is obtained by partially modifying the important phrase setting dictionary acquisition unit 103 shown in the first embodiment. The important phrase setting dictionary acquisition unit 203 and the important phrase setting dictionary acquisition unit 103 may be the same.

重要語句設定辞書取得部203は、設定情報取得部201により取得された設定情報における、重要語句設定辞書の特定用情報に基づいて、重要語句設定辞書を取得し得る。設定情報における重要語句設定辞書の特定用情報は、複数の重要語句設定辞書を特定し優先順位を定める情報であってもよく、この場合には、重要語句設定辞書取得部203は、複数の重要語句設定辞書を取得して、その優先順位に従ってメモリ内等で統合することにより、1つの重要語句設定辞書として利用し得る。 The important phrase setting dictionary acquisition unit 203 can acquire the important phrase setting dictionary based on the information for specifying the important phrase setting dictionary in the setting information acquired by the setting information acquiring unit 201 . The information for identifying the important phrase setting dictionary in the setting information may be information that specifies a plurality of important phrase setting dictionaries and determines their priority. By acquiring word/phrase setting dictionaries and integrating them in a memory or the like according to their priority, they can be used as one important word/phrase setting dictionary.

重要語句設定辞書の内容は、ユーザにより生成、編集され得る。 The content of the important phrase setting dictionary can be created and edited by the user.

重要語句設定辞書は、データベースのデータ、インターネット等のネットワーク上のウェブサーバ等により提供されているデータ等、如何なるデータとして存在してもよいが、例えば、ファイルの内容として存在し得る。 The important phrase setting dictionary may exist as any data such as database data, data provided by a web server or the like on a network such as the Internet, and may exist as the contents of a file, for example.

重要語句設定辞書は、発明文書ファイルの一部に含まれていてもよい。例えば発明文書ファイル内に<重要語句設定辞書>、<重要語句リスト>等といった所定の見出しを付加して、その見出しの後に、重要語句設定辞書に相当するデータが記載されていてもよい。この場合には、その所定の見出しを示す、設定情報における重要語句設定辞書の特定用情報に基づいて、重要語句設定辞書取得部203は、重要語句設定辞書を取得し得る。 The important phrase setting dictionary may be included as part of the invention document file. For example, predetermined headings such as <important phrase setting dictionary>, <important phrase list>, etc. may be added to the invention document file, and data corresponding to the important phrase setting dictionary may be described after the heading. In this case, the important phrase setting dictionary acquisition unit 203 can acquire the important phrase setting dictionary based on the information for identifying the important phrase setting dictionary in the setting information, which indicates the predetermined headline.

重要語句設定辞書取得部203により取得された重要語句設定辞書は、分析部205における重要語句抽出部2051による重要語句の抽出に利用され得る。重要語句設定辞書は、抽出対象とすべき複数の重要語句を列挙した情報である。重要語句設定辞書では、発明文書における発明を創作した発明者の所属部門別、その発明が属する技術分野別等といった何らかのグループ別に、分類されて、重要語句が列挙されていてもよい。重要語句設定辞書内の複数のグループ各々についての重要語句の集合のうち、設定情報、ユーザによる選択等に基づく1つのグループについての重要語句の集合が、重要語句抽出部2051による重要語句の抽出に利用されることとしてもよい。 The important phrase setting dictionary acquired by the important phrase setting dictionary acquisition unit 203 can be used by the important phrase extraction unit 2051 in the analysis unit 205 to extract important phrases. The important phrase setting dictionary is information listing a plurality of important phrases to be extracted. In the important phrase setting dictionary, important phrases may be listed by classifying them by some group, such as by the department to which the inventor who created the invention in the invention document belongs, or by the technical field to which the invention belongs. Of the sets of key phrases for each of the multiple groups in the key phrase setting dictionary, a set of key phrases for one group based on setting information, selection by the user, etc. is used for extraction of key phrases by the key phrase extraction unit 2051. It may be used.

重要語句設定辞書取得部203は、設定情報における重要語句設定辞書の特定用情報を参照して、ファイルシステムにおける所定フォルダーを特定することで、その所定フォルダー内にファイルとして格納されている重要語句設定辞書を取得してもよい。例えば、所定フォルダー内に、技術分野等といった何らかのグループ毎に分類してファイル名等により識別可能にされた複数の重要語句設定辞書のファイルを格納している場合に、重要語句設定辞書取得部203は、その複数のファイルのうち、発明文書取得部2021が取得した発明文書に関連があるグループ(例えばユーザが指定したグループ)に対応する重要語句設定辞書のファイルから重要語句設定辞書を取得してもよい。また、重要語句設定辞書取得部203は、重要語句設定辞書を用いずに条件情報等に基づいて重要語句抽出部2051により発明文書から抽出した重要語句群との相関性が所定程度より高い、技術分野等のグループに対応する重要語句設定辞書のファイルから、重要語句設定辞書を取得してもよい。 The important phrase setting dictionary acquisition unit 203 refers to the information for specifying the important phrase setting dictionary in the setting information, and by specifying a predetermined folder in the file system, obtains the important phrase setting stored as a file in the predetermined folder. You can get a dictionary. For example, in a case where a predetermined folder stores a plurality of key phrase setting dictionary files that are classified into groups such as technical fields and made identifiable by file names, etc., the key phrase setting dictionary acquisition unit 203 acquires an important phrase setting dictionary from files of important phrase setting dictionaries corresponding to a group (for example, a group designated by a user) related to the invention document acquired by the invention document acquiring unit 2021 among the plurality of files. good too. Also, the key phrase setting dictionary acquisition unit 203 has a higher correlation than a predetermined level with the key phrase group extracted from the invention document by the key phrase extraction unit 2051 based on condition information and the like without using the key phrase setting dictionary. An important phrase setting dictionary may be acquired from a file of an important phrase setting dictionary corresponding to a group such as field.

重要語句設定辞書では、重要語句に対応翻訳語を付記してもよい。なお、重要語句設定辞書における全ての重要語句各々について、その重要語句の対応翻訳語を付記したものは、翻訳補助情報であるとも言える。また、重要語句設定辞書において、対応翻訳語が対応付けられた重要語句についての重要語句及び対応翻訳語の組の集合を含む情報を、翻訳補助情報として利用可能である。なお、重要語句設定辞書において対応翻訳語が対応付けられた重要語句については、例えば、分析部205の翻訳部2054において発明文書に基づくクレーム情報、又は、明細書情報等に含まれるその重要語句に対して対応翻訳語が決定され、その決定結果に基づいてクレーム翻訳情報、又は、明細書翻訳情報等が生成され得る。ユーザ(例えば発明者等又は弁理士)が、特定の幾つかの重要語句について、対応翻訳語を対応付けるように重要語句設定辞書を定めておくことにより、発明文書分析システム20は、重要語句設定辞書に基づいて重要語句に対応する対応翻訳語を反映した情報を出力する。例えば、その出力された情報の提供を受ける翻訳者は、重要語句に対する翻訳語句の指定を明確に認識でき、発明文書の翻訳を適正又は効率的に行うことが可能となり得る。重要語句設定辞書の利用例を挙げると、例えば、ユーザが作成した発明文書のクレームに「情報表示タイミング制御部」、「情報送信タイミング制御部」、「機器制御部」等の重要語句が含まれている場合において、ユーザは、翻訳先言語におけるクレームの用語の簡明化を図るべく、重要語句設定辞書で、重要語句「情報表示タイミング制御部」、「情報送信タイミング制御部」及び「機器制御部」に、それぞれ、対応翻訳語として、「first controller」、「second controller」、「third controller」を、対応付ける例が、挙げられる。なお、ユーザは、例えば、発明文書分析システム20に一旦発明文書を分析させた結果として出力される特許出願関連情報における重要語句リストを、編集することで、効率的に、重要語句設定辞書の生成、更新等を行うことが可能となり得る。 In the key phrase setting dictionary, a corresponding translated word may be added to the key phrase. It can also be said that the translation assistance information is the addition of the corresponding translated words for each of the key words in the key word setting dictionary. In addition, in the important phrase setting dictionary, information containing a set of pairs of important phrases and corresponding translated words for important phrases associated with corresponding translated words can be used as translation assistance information. For important phrases associated with corresponding translated words in the keyword phrase setting dictionary, for example, the translation unit 2054 of the analysis unit 205 can Corresponding translated words are determined, and claim translation information, specification translation information, or the like can be generated based on the determination result. A user (for example, an inventor or a patent attorney) predefines an important phrase setting dictionary so that corresponding translated words are associated with some specific important phrases. output information reflecting the corresponding translated word corresponding to the key phrase based on For example, a translator who receives the output information can clearly recognize the designation of the translation words for the important words, and can translate the invention document properly or efficiently. As an example of using the important phrase setting dictionary, for example, a claim of an invention document created by a user includes important phrases such as "information display timing control section", "information transmission timing control section", and "equipment control section". In this case, in order to simplify the terms of complaints in the translation target language, the user can set important phrases "information display timing control section", "information transmission timing control section" and "equipment control section" in the important phrase setting dictionary. ", respectively, as corresponding translated words "first controller", "second controller", and "third controller". Note that the user can, for example, edit the key phrase list in the patent application-related information that is output as a result of having the invention document analysis system 20 analyze the invention document, thereby efficiently generating the key phrase setting dictionary. , updates, etc.

重要語句設定辞書では、重要語句に、その重要語句を主語としてその重要語句について説明する文を付記してもよい。 In the key phrase setting dictionary, the key phrase may be added with a sentence explaining the key phrase with the key phrase as the subject.

例えば図9に示す発明文書分析システム10のように、ファイルサーバ機能を有するサーバ装置10bにLANで接続された複数の端末装置10c~10eが存在する場合において、その各端末装置が、発明文書分析システム20として機能してもよい。この場合に、発明文書分析システム20として機能する各端末装置は、重要語句設定辞書をその端末装置が備える記録媒体(例えばメモリ、ハードディスク等)に記録し、その重要語句設定辞書を随時サーバ装置10bに送信してもよい。各端末装置における重要語句設定辞書は、各端末装置のユーザにより生成、編集されたものであり得る。そして、サーバ装置10bは、各端末装置から受信した重要語句設定辞書を統合した結果として生成した新たな重要語句設定辞書を、各端末装置に配信し、各端末装置はその配信された重要語句設定辞書に基づいて既存の重要語句設定辞書を更新してもよい。 For example, as in the invention document analysis system 10 shown in FIG. 9, when there are a plurality of terminal devices 10c to 10e connected by a LAN to a server device 10b having a file server function, each terminal device analyzes the invention document. It may function as system 20 . In this case, each terminal device functioning as the invention document analysis system 20 records the important phrase setting dictionary in a recording medium (for example, memory, hard disk, etc.) provided in the terminal device, and the important phrase setting dictionary is stored in the server device 10b at any time. may be sent to The important phrase setting dictionary in each terminal device can be created and edited by the user of each terminal device. Then, the server device 10b distributes to each terminal device a new key phrase setting dictionary generated as a result of integrating the key phrase setting dictionaries received from each terminal device, and each terminal device receives the distributed important phrase setting dictionary. An existing keyword setting dictionary may be updated based on the dictionary.

なお、発明文書分析システム20による発明文書の分析結果に基づく出力(例えば特許出願関連情報の出力)が、端末装置、機器等(例えばコンピュータ)が備える表示装置への表示として実現される場合には、発明文書分析システム20は、表示内容の一部の語句に関する操作対応GUI要素に対するユーザ操作に応じて、その語句を、重要語句設定辞書に追加してもよい。このような重要語句設定辞書への語句の追加がなされると、発明文書分析システム20がその後に発明文書分析処理を行う場合において、重要語句抽出部2051は、その語句の追加後の重要語句設定辞書に基づいて、重要語句の抽出を行う。また、発明文書分析システム20は、発明文書の分析結果に基づく情報の表示装置への表示に対するユーザ操作に応じて、語句を重要語句設定辞書に追加した後に、その追加後の重要語句設定辞書に基づいて、再分析指定用のGUI要素、つまり再びその発明文書を分析(例えば重要語句の抽出等)させるためのGUI要素(例えば、「再分析」と描かれたボタン等)を、先の分析結果に基づく情報の表示装置への表示に際して、表示してもよい。発明文書分析システム20は、再分析指定用のGUI要素を、例えば表示画面に適宜表示してもよいし、常に表示していてもよい。 In addition, when the output based on the analysis result of the invention document by the invention document analysis system 20 (for example, the output of patent application related information) is realized as a display on the display device provided in the terminal device, equipment, etc. (for example, computer) , the invention document analysis system 20 may add the word/phrase to the important word/phrase setting dictionary according to the user's operation on the operation-responsive GUI element related to the part of the word/phrase of the display content. When a phrase is added to the key phrase setting dictionary in this way, when the invention document analysis system 20 performs invention document analysis processing after that, the key phrase extraction unit 2051 sets the important phrase after the addition of the phrase. Important words are extracted based on the dictionary. In addition, the invention document analysis system 20 adds words to the important phrase setting dictionary according to the user's operation for displaying information based on the analysis result of the invention document on the display device. Based on this, a GUI element for specifying re-analysis, that is, a GUI element (for example, a button drawn as "re-analysis") for re-analyzing the invention document (for example, extracting key phrases, etc.) It may be displayed when the information based on the result is displayed on the display device. The invention document analysis system 20 may display the GUI elements for specifying re-analysis on the display screen, for example, as appropriate, or may always display them.

重要語句設定辞書取得部203は、更に、重要語句として抽出すべきではない複数の語句を列挙した情報(言わば複数の非重要語句を含む情報)である非重要語句設定辞書を取得することとしてもよい。この場合には、設定情報取得部201により取得される設定情報に、非重要語句設定辞書の特定用情報を定め得ることとし、重要語句設定辞書取得部203は、設定情報における非重要語句設定辞書の特定用情報に基づいて、非重要語句設定辞書を取得し得る。 The important phrase setting dictionary acquisition unit 203 may also acquire a non-important phrase setting dictionary that is information listing a plurality of phrases that should not be extracted as important phrases (information including a plurality of non-important phrases, so to speak). good. In this case, the setting information acquired by the setting information acquisition unit 201 can define the information for specifying the non-key phrase setting dictionary, and the key phrase setting dictionary acquisition unit 203 acquires the non-key phrase setting dictionary in the setting information. A non-important phrase setting dictionary can be acquired based on the identification information.

[3-1-4.翻訳用発明文書標準規定取得部]
翻訳用発明文書標準規定取得部204は、実施形態1で示した翻訳用発明文書標準規定取得部104を一部変形したものである。翻訳用発明文書標準規定取得部204と翻訳用発明文書標準規定取得部104とは、同様であってもよい。
[3-1-4. Acquisition Department for Standard Provisions of Invention Documents for Translation]
The invention document standard specification acquisition unit 204 for translation is obtained by partially modifying the invention document standard specification acquisition unit 104 for translation shown in the first embodiment. The invention document standard specification for translation acquisition unit 204 and the invention document standard specification for translation acquisition unit 104 may be the same.

翻訳用発明文書標準規定取得部204は、設定情報取得部201により取得された設定情報の内容(例えば翻訳用発明文書標準規定の特定用情報)に基づいて、翻訳対象となる発明文書が満たすべき複数の条件を定めた翻訳用発明文書標準規定を取得する。翻訳用発明文書標準規定における各条件は、例えば、発明文書が、翻訳対象として十分に適正な翻訳用和文原稿であるように、定められる。発明文書分析システム20において翻訳用発明文書標準規定取得部204により取得された翻訳用発明文書標準規定は、例えば、分析部205における警告情報生成部2059において発明文書に基づく警告情報の生成に用いられる。 The invention document standard stipulations for translation acquisition unit 204 is based on the content of the setting information acquired by the setting information acquisition unit 201 (for example, specification information of the standard stipulations for invention documents for translation), which the invention document to be translated should satisfy. Acquire invention document standard specifications for translation that define multiple conditions. Each of the conditions in the Standard Rules for Invention Documents for Translation is defined, for example, so that the invention document is a Japanese manuscript for translation that is adequately suitable for translation. The invention document standard specification for translation acquired by the invention document standard specification acquisition unit 204 for translation in the invention document analysis system 20 is used, for example, in the warning information generation unit 2059 in the analysis unit 205 to generate warning information based on the invention document. .

翻訳用発明文書標準規定は、翻訳用の発明文書の標準化を目的とした団体により制定された規定であることが想定されるが、その他の如何なる者によって、制定された規定であってもよい。また、標準化に係るこの団体は、企業、会社等の一部門であっても、複数の企業、会社等で構成されたものであってもよく、規模の大小を問わない。 The standard specifications for invention documents for translation are assumed to be the specifications established by an organization aiming at standardization of invention documents for translation, but may be the specifications established by any other person. Also, this organization related to standardization may be a division of a company, company, etc., or may be composed of a plurality of companies, companies, etc., regardless of the scale.

例えば、設定情報中の、翻訳用発明文書標準規定の特定用情報が、ファイルパスの情報である場合においては、翻訳用発明文書標準規定取得部204は、そのファイルパスに従って、ファイルにアクセスすることでそのファイルから翻訳用発明文書標準規定を読み出して取得する。例えば、設定情報中の、翻訳用発明文書標準規定の特定用情報が、URLの情報である場合においては、翻訳用発明文書標準規定取得部204は、そのURLに従って、ネットワーク上のサーバ装置等が提供するリソースとしての翻訳用発明文書標準規定にアクセスして、翻訳用発明文書標準規定をダウンロードして取得する。 For example, if the specification information for the standard specification of invention documents for translation in the setting information is file path information, the standard specification of invention documents for translation acquisition unit 204 accesses the file according to the file path. read and acquire the invention document standard specification for translation from the file. For example, when the specifying information of the invention document standard specification for translation in the setting information is URL information, the acquisition unit 204 of the invention document standard specification for translation acquires a server device or the like on the network according to the URL. Access Invention Document Standard Specification for Translation as a resource provided to download and obtain Invention Document Standard Specification for Translation.

翻訳用発明文書標準規定は、例えば、翻訳用発明文書標準規定のバージョンを示すバージョン番号等のバージョン情報を含んでもよい。翻訳用発明文書標準規定は、所定のバージョン管理方式の下で、随時規定内容が変更される度に、バージョンアップがなされてもよい。翻訳用発明文書標準規定取得部204は、設定情報取得部201により取得された設定情報の翻訳用発明文書標準規定の特定用情報(例えばネットワークを介して翻訳用発明文書標準規定にアクセスするためのURL)に基づいて、翻訳用発明文書標準規定にアクセスし、既に取得している翻訳用発明文書標準規定のバージョン(例えばバージョン番号)より新しいバージョンの翻訳用発明文書標準規定が取得可能であれば、例えば既に取得している翻訳用発明文書標準規定を削除し、その新しいバージョンの翻訳用発明文書標準規定を取得する。 The invention document standard specification for translation may include version information such as a version number indicating the version of the invention document standard specification for translation, for example. The invention document standard specification for translation may be upgraded whenever the content of the specification is changed under a predetermined version management system. The invention document standard specification for translation acquisition unit 204 acquires information for specifying the standard specification for invention document for translation of the setting information acquired by the setting information acquisition unit 201 (for example, information for accessing the standard specification for invention document for translation via a network). If it is possible to access the standard specifications for invention documents for translation based on the URL) and obtain a newer version of the standard specifications for invention documents for translation than the version (for example, version number) of the standard specifications for invention documents for translation that has already been acquired For example, the existing invention document standard specification for translation is deleted, and the new version of the invention document standard specification for translation is acquired.

翻訳用発明文書標準規定は、例えば、翻訳先言語と対応付けて規定を含むもの(つまり翻訳先言語毎の規定を含むもの)であってもよいし、特定言語(例えば英語)だけを対象とした規定であってもよい。翻訳用発明文書標準規定が、翻訳先言語毎の規定を含むものである場合には、例えば、設定情報により、又は、発明文書分析システム20に対するユーザ操作により、翻訳先言語を指定可能にしてもよい。 The standard specifications for invention documents for translation may include, for example, specifications in association with target languages (that is, specifications for each target language), or may target only a specific language (for example, English). It may be a provision that If the invention document standard specifications for translation include specifications for each language to be translated, the language to be translated may be designated by setting information or by user operation on the invention document analysis system 20, for example.

翻訳用発明文書標準規定は、例えば、データ、或いは、発明文書が満たすべき条件を備えているかを判定する処理のための検査プログラムを含み得る。この検査プログラムは、例えば、発明文書が、翻訳用発明文書標準規定の複数の項目(つまり条件を示す条件項目)各々に適合しているか否かに係る判定を行うための処理を担うプログラムであり、例えば、プラグインモジュールであってもよい。例えば、分析部205における警告情報生成部2059は、翻訳用発明文書標準規定に含まれる検査プログラムの実行により(つまりマイクロプロセッサにその検査プログラムを実行させることにより)、発明文書取得部2021により取得された発明文書が翻訳用発明文書標準規定で定められた複数の条件各々に適合しているか否かを判定し、その判定の結果を用いることで警告情報の生成を行うこととしてもよい。 The invention document standard specification for translation may include, for example, data or an inspection program for processing to determine whether the invention document has the conditions to be satisfied. This inspection program is, for example, a program responsible for determining whether or not an invention document conforms to each of a plurality of items (that is, condition items indicating conditions) of the invention document standard specifications for translation. , for example, may be a plug-in module. For example, the warning information generation unit 2059 in the analysis unit 205 executes the inspection program included in the invention document standard specification for translation (that is, by causing the microprocessor to execute the inspection program). It is also possible to determine whether or not the invention document obtained conforms to each of a plurality of conditions stipulated in the invention document standard specification for translation, and to generate warning information using the result of the determination.

翻訳用発明文書標準規定は、例えば、翻訳対象となる発明文書が満たすべき条件を定める情報として、発明文書中の、その条件を満たさない不適切な可能性がある記載部分についての文字列のパターンを表した不適切文字列パターンを示す不適切文字列パターン情報を含む。翻訳用発明文書標準規定は、例えば、不適切な可能性がある記載部分に係る不適切文字列パターンを示す不適切文字列パターン情報の全部又は一部に対応付けて、発明文書中のその不適切な可能性がある記載部分の修正方法に関する修正情報を含む。 The standard specifications for invention documents for translation include, for example, character string patterns for potentially inappropriate descriptions that do not satisfy the conditions in the invention documents as information that defines the conditions that the invention documents to be translated should meet. Inappropriate character string pattern information indicating an inappropriate character string pattern representing The Standard Provisions of Invention Documents for Translation, for example, correspond to all or part of the inappropriate character string pattern information indicating inappropriate character string patterns related to description parts that may be inappropriate, and indicate the inappropriate characters in the invention document. Contains correction information on how to correct the description that may be appropriate.

翻訳用発明文書標準規定は、例えば、発明文書に含まれ得る文字列の取り扱い、又は、特徴の相違等により、発明文書が満たすべき条件の項目である条件項目を区分し、条件項目毎に、例えば条件項目名と、発明文書中の不適切な記載を抽出するためのパターン情報(例えば不適切文字列パターン情報)とを含む。発明文書中の不適切な記載は、不適切な可能性がある記載であってもよく、発明文書に基づく翻訳結果文書を所定の地域(例えば米国)に提出することで特許権を取得する場合に何らかの不利益が生じる可能性がある記載であってもよい。不適切な記載を抽出するためのパターン情報には、文字列を特定するためのパターン以外のものを用いてもよく、例えば、クレームに複数項を引用している項がありその引用先の項が更に複数項を引用しているような記載を抽出するためのアルゴリズムに係るプログラム等を含めてもよい。翻訳用発明文書標準規定の全部又は一部の条件項目は、更に、修正情報を含んでもよい。修正情報には、不適切文字列パターン情報が示す不適切文字列パターンに該当した発明文書中の文字列の削除等といった、発明文書の修正を行うためのアルゴリズムに係るプログラム等を含めてもよい。また、クレームに複数項を引用している項がありその引用先の項が更に複数項を引用しているような記載があることを不適切な記載として抽出するためのパターン情報に対応する修正情報は、例えば、複数項を引用している項を、単数項を引用するように修正する処理を行うためのプログラム等を含んでもよい。 The standard provisions for invention documents for translation classify condition items, which are items of conditions to be satisfied by invention documents, for example, by handling character strings that may be included in invention documents or by differences in features, and for each condition item, For example, it includes condition item names and pattern information (for example, inappropriate character string pattern information) for extracting inappropriate descriptions in invention documents. Inappropriate descriptions in the invention documents may be potentially inappropriate descriptions, and patent rights are obtained by submitting translation results documents based on the invention documents to a prescribed region (for example, the United States). It may be a description that may cause some disadvantages to Pattern information for extracting inappropriate descriptions may use information other than patterns for specifying character strings. may also include a program or the like relating to an algorithm for extracting descriptions in which a citation of a plurality of items is cited. All or part of the conditional items of the Standard Provisions for Invention Documents for Translation may further include correction information. The correction information may include a program related to an algorithm for correcting the invention document, such as deletion of character strings in the invention document that correspond to the inappropriate character string pattern indicated by the inappropriate character string pattern information. . In addition, correction corresponding to pattern information for extracting as inappropriate description that there is a clause citing multiple clauses in a claim and the clause to which the claim refers further cites multiple clauses The information may include, for example, a program or the like for performing a process of correcting a multiple citation to a singular citation.

また、翻訳用発明文書標準規定の全部又は一部の条件項目は、更に、パターン情報が示すパターンに該当する、発明文書中の不適切な記載についての、不適切な理由のユーザへの説明、その記載が招く不利益についてのユーザへの説明、又は、適切に修正するための方法のユーザへの説明を示す条件項目説明メッセージを含んでもよい。なお、条件項目説明メッセージにおける、不適切な記載についての不適切な理由の説明には、例えば不適切な理由の根拠となる、法令の条項、判例等の情報を含ませてもよい。 In addition, all or part of the condition items of the Standard Provisions for Invention Documents for Translation further include explanations to the user of the reasons for inappropriate descriptions in the invention documents that correspond to the patterns indicated by the pattern information, A conditional item explanation message may be included that provides an explanation to the user of the disadvantage that the description causes, or an explanation to the user of a method for correcting it appropriately. In the condition item explanation message, the explanation of the reason for the inappropriate description may include information such as the provisions of laws and regulations, judicial precedents, etc., which serve as the basis for the reason for the inappropriate description.

図14は、翻訳用発明文書標準規定の一例として、条件項目毎に条件項目名とパターン情報が示すパターンとを定め、条件項目の一部に修正情報を付加した例を示す。同図に示した例は、簡単な一例に過ぎず、条件項目を付加してもよいし、一層詳細に区分した条件項目、一層詳細に区分したパターン情報が示すパターン等に対応して、更に適切な修正情報を付加してもよい。 FIG. 14 shows an example in which a condition item name and a pattern indicated by pattern information are defined for each condition item, and correction information is added to a part of the condition item, as an example of standard specifications for invention documents for translation. The example shown in the figure is only a simple example, and condition items may be added. Appropriate correction information may be added.

図14で示した「明細書の各文における主語の欠如」等の条件項目名は、条件に該当する不適切な記載を抽出するためのパターン情報が示すパターンが発明文書中に存在した場合に、例えば、警告情報生成部2059により生成されて特許出願関連情報に含まれる警告情報中で、表され得る。なお、「明細書の各文」は、例えば、句点文字の直後又は行末の改行コード部分で区切られる。なお、1つの条件項目に複数のパターン情報(例えば文字列パターン情報)を対応付けてもよい。例えば、図14に示す条件項目名「米国出願等で他の表現に変更した方が望ましい場合がある文字列」に係る条件項目について、発明文書の明細書中に「図2の(1)は、・・・を表した図であり、図2の(2)は、・・・を表した図である。」という文等の、1つの図面内に分離された複数の図が存在する可能性を示す文字列(例えば「「図2の(1)は」)が該当する文字列パターンを示す文字列パターン情報を、更に、対応付けてもよい。この文字列パターンは、一例としては、「図」の文字に後続する数字に後続して、「の」、「における」等の所定の文字が存在し、その所定の文字に後続して、始め丸括弧と終わり丸括弧とで英数字を挟む記載が存在するような記載が該当するように定められる。 Conditional item names such as "absence of subject in each sentence of specification" shown in FIG. , for example, in warning information generated by the warning information generator 2059 and included in the patent application related information. It should be noted that "each sentence in the specification" is delimited, for example, immediately after the period character or at the linefeed code portion at the end of the line. A plurality of pattern information (for example, character string pattern information) may be associated with one condition item. For example, regarding the conditional item name shown in FIG. 14, regarding the conditional item name "Character string that may be preferable to be changed to other expressions in US applications, etc.", the specification of the invention document states "(1) in FIG. , and (2) in FIG. 2 is a diagram representing . Character string pattern information indicating a character string pattern to which the character string indicating gender (for example, “(1) in FIG. 2”) may be associated. As an example, this character string pattern has a number following the character "figure" followed by a predetermined character such as "no", "in", etc., followed by the predetermined character Statements where there is a statement that encloses an alphanumeric character between parentheses and a closing parenthesis are defined as applicable.

図14で示した「クレーム中の重要語句のうち重要度が所定程度以上高いものが明細書中に記載されていない」という条件項目名の条件項目における「明細書に重要度が所定程度以上の重要語句が記載されていないことを検出するパターン」のパターン情報は、具体的な一例としては、発明文書のクレームから重要語句抽出部2051により抽出された重要語句のうち、設定情報中の重要度基準情報に基づいて、低い重要度と決定されなかった各重要語句についての、その重要語句を発明文書の明細書から検出する文字列パターンの集合を示す情報である。 In the condition item with the condition item name "Among the important phrases in the claim, the importance of which is higher than a predetermined level is not stated in the specification" shown in FIG. As a specific example, the pattern information of "Pattern for detecting absence of important phrases" is the degree of importance in the setting information of the important phrases extracted by the important phrase extraction unit 2051 from the claims of the invention document. This is information indicating a set of character string patterns for detecting key words and phrases from the specification of the invention document, for key words and phrases that were not determined to be of low importance based on the reference information.

翻訳用発明文書標準規定における条件項目の別の一例としては、例えば、条件項目「多重括弧の記載」という条件項目名と、不適切な記載としての、括弧内に括弧が含まれた多重括弧の記載を抽出するためのパターンを示すパターン情報と、括弧を減らすことが望ましい等の条件項目説明メッセージとを含む条件項目が挙げられる。この条件項目を用いることで、発明文書中に多重括弧の記載が含まれていると、警告情報生成部2059により生成されて特許出願関連情報に含まれる警告情報中に、明確な記載にする修正を促す注意喚起等のために多重括弧の記載に係る指摘が含まれ得る。 Another example of a conditional item in the Standard Provisions for Invention Documents for Translation is, for example, the conditional item name "statement of multiple parentheses" and the inappropriate description of multiple parentheses containing parentheses within parentheses. Condition items include pattern information indicating patterns for extracting descriptions and condition item explanation messages such as desirability of reducing parentheses. By using this conditional item, if the description of multiple brackets is included in the invention document, the warning information generated by the warning information generation unit 2059 and included in the patent application related information is corrected to be clearly described. It may include indications related to the description of multiple parentheses to call attention to

翻訳用発明文書標準規定における条件項目の更に別の一例としては、例えば、条件項目「クレームにおける機能手段の記載」という条件項目名と、不適切な記載としての、機能手段の記載を抽出するためのパターンを示すパターン情報とを含む条件項目が挙げられる。この条件項目を用いることで、発明文書のクレームに機能手段の記載が含まれていると、警告情報生成部2059により生成されて特許出願関連情報に含まれる警告情報中に、機能手段の記載に係る指摘が含まれ得る。このパターン情報が示すパターンは、例えば、「・・・手段」、「・・・部」等という所謂機能ブロックの記載が該当するようなパターンである。クレーム中の機能手段の記載は必ずしも不適切とは限らず、戦略的に機能手段が記載されている場合もあり得るが、クレームに機能手段の記載が含まれていると米国出願において不利益を生じる可能性があり得ることから、警告情報における、この指摘は、一応の注意喚起等のために有用な可能性があり得る。 As yet another example of the conditional items in the standard provisions for invention documents for translation, for example, the conditional item name "description of functional means in claims" and the description of functional means as an inappropriate description are extracted. condition items including pattern information indicating the pattern of By using this condition item, if the claim of the invention document includes the description of the functional means, the warning information generated by the warning information generation unit 2059 and included in the patent application related information includes the description of the functional means. Such indications may be included. The pattern indicated by this pattern information is, for example, a pattern corresponding to descriptions of so-called functional blocks such as "...means" and "...unit". It is not necessarily inappropriate to describe functional means in a claim, and there may be cases where functional means are described strategically. Since there is a possibility of occurrence, this pointing out in the warning information may be useful for a prima facie call for attention.

翻訳用発明文書標準規定は、例えば、分析部205の警告情報生成部2059で用いられる。また、翻訳用発明文書標準規定の内容の一例としての修正情報は、例えば、出力部208により出力される特許出願関連情報に含まれ得る修正版クレーム情報及び修正版明細書情報を生成するために分析部205で用いられる。 The invention document standard specification for translation is used, for example, in the warning information generation section 2059 of the analysis section 205 . In addition, the correction information as an example of the content of the invention document standard specification for translation may be included in the patent application related information output by the output unit 208, for example, in order to generate the corrected claim information and the corrected specification information. Used in analysis unit 205 .

[3-1-5.分析部]
分析部205は、実施形態1で示した分析部105を一部変形したものであり、ここで特に示さない点については分析部105と同様である。
[3-1-5. Analysis Department]
The analysis unit 205 is a partial modification of the analysis unit 105 shown in the first embodiment, and is the same as the analysis unit 105 except for points not specifically shown here.

分析部205は、発明文書取得部2021により取得された発明文書を、設定情報取得部201により取得された設定情報に基づいて分析する。 The analysis unit 205 analyzes the invention document acquired by the invention document acquisition unit 2021 based on the setting information acquired by the setting information acquisition unit 201 .

分析部205は、重要語句抽出部2051、分類部2053、翻訳部2054、重要度決定部2055、属性特定部2056、クレーム引用関係検出部2057、要素間関係判別部2058、警告情報生成部2059、クレーム情報生成部205a、明細書情報生成部205b及びクレームツリー生成部205cを含む。 The analysis unit 205 includes an important phrase extraction unit 2051, a classification unit 2053, a translation unit 2054, an importance determination unit 2055, an attribute identification unit 2056, a complaint citation relationship detection unit 2057, an inter-element relationship determination unit 2058, a warning information generation unit 2059, It includes a complaint information generator 205a, a statement information generator 205b, and a claim tree generator 205c.

分析部205による発明文書の分析結果は、例えば、出力部208において、出力する特許出願関連情報の生成のために利用され、また、機械学習部207において、発明文書の評価のために利用される。 The analysis result of the invention document by the analysis unit 205 is used, for example, in the output unit 208 to generate patent application-related information to be output, and in the machine learning unit 207 to evaluate the invention document. .

図15は、分析部205により生成され、出力部208において出力される特許出願関連情報の内容の一例を示す。図16は、特許出願関連情報の一表現形式としての表示用文書の一例であるHTML文書の構成例を示す。図17は、特許出願関連情報を表現する表示用文書(例えばHTML文書)に基づいてブラウザ等により表示される表示画面の一例を示す。図17に例示する表示画面には、特許出願関連情報における各種情報項目を選択するためのメニューを表示するメニュー欄、メニュー選択に応じた特許出願関連情報の項目の内容表示欄等が含まれている。図17に例示する表示画面における、発明文書の再分析指定等の操作欄には、例えば、上述した再分析指定用のGUI要素が表示され得る。 FIG. 15 shows an example of the contents of the patent application related information generated by the analysis unit 205 and output by the output unit 208. FIG. FIG. 16 shows a configuration example of an HTML document, which is an example of a display document as one expression format of patent application related information. FIG. 17 shows an example of a display screen displayed by a browser or the like based on a display document (for example, HTML document) representing patent application related information. The display screen illustrated in FIG. 17 includes a menu column for displaying a menu for selecting various information items in the patent application related information, a content display column for items of the patent application related information according to the menu selection, and the like. there is In the display screen illustrated in FIG. 17, for example, the above-described GUI element for specifying reanalysis can be displayed in the operation column for specifying reanalysis of the invention document.

[3-1-5-1.重要語句抽出部]
重要語句抽出部2051は、実施形態1で示した重要語句抽出部1051を一部変形したものである。重要語句抽出部2051は、重要語句抽出部1051と同様であってもよい。重要語句抽出部2051による発明文書からの重要語句の抽出は、ある程度的確であれば有用であり、必ずしも完全に的確である必要はない。
[3-1-5-1. Key phrase extraction part]
The key phrase extraction unit 2051 is a partial modification of the key phrase extraction unit 1051 shown in the first embodiment. The important phrase extraction unit 2051 may be similar to the important phrase extraction unit 1051 . Extraction of key phrases from invention documents by the key phrase extraction unit 2051 is useful if it is accurate to some extent, and does not necessarily have to be completely accurate.

重要語句抽出部2051は、例えば、第1抽出部10511、第2抽出部10512、第3抽出部10513、及び、第4抽出部10514と同様の機能構成を含み得る。重要語句抽出部2051は、例えば、文書取得部202により取得された発明文書のクレーム及び明細書に、設定情報取得部201により取得された設定情報中の条件情報における参照文字列パターン情報が示す参照文字列パターンに該当する文字列に後続して、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句として抽出する機能を有する第1抽出部を備えてもよい。重要語句抽出部2051は、例えば、文書取得部202により取得された発明文書のクレームに、設定情報取得部201により取得された設定情報中の条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して句点文字が存在するときには、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句として抽出する機能を有する第2抽出部を備えてもよい。重要語句抽出部2051は、例えば、文書取得部202により取得された発明文書に、設定情報取得部201により取得された設定情報中の条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して、条件情報における符号文字列パターン情報が示す符号文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句として抽出する機能を有する第3抽出部を備えてもよい。また、重要語句抽出部2051は、例えば、文書取得部202により取得された発明文書に、設定情報取得部201により取得された設定情報中の条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して、条件情報における特定助詞文字列パターン情報が示す特定助詞文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句として抽出する機能を有する第4抽出部を備えてもよい。 The key phrase extraction unit 2051 may include functional configurations similar to those of the first extraction unit 10511, the second extraction unit 10512, the third extraction unit 10513, and the fourth extraction unit 10514, for example. The key phrase extraction unit 2051 extracts, for example, references indicated by the reference character string pattern information in the condition information in the setting information acquired by the setting information acquisition unit 201 in the claim and specification of the invention document acquired by the document acquisition unit 202. If there is a string corresponding to the keyword candidate character string pattern indicated by the key phrase candidate character string pattern information in the condition information following the character string that corresponds to the character string pattern, the key phrase candidate character string pattern is A first extractor having a function of extracting the same character string as the relevant character string as an important phrase may be provided. The important phrase extraction unit 2051 extracts, for example, key phrases indicated by the important phrase candidate character string pattern information in the condition information in the setting information acquired by the setting information acquisition unit 201 in the claims of the invention document acquired by the document acquisition unit 202. A second extraction unit having a function of extracting, as an important phrase, a character string identical to the character string corresponding to the key phrase candidate character string pattern when a period character exists following the character string corresponding to the candidate character string pattern. may be provided. The key phrase extraction unit 2051 extracts key phrase candidate characters indicated by the key phrase candidate character string pattern information in the condition information in the setting information acquired by the setting information acquisition unit 201, for example, in the invention document acquired by the document acquisition unit 202. If there is a character string corresponding to the coded character string pattern indicated by the coded character string pattern information in the condition information following the character string corresponding to the column pattern, the character string corresponding to the key phrase candidate character string pattern A third extractor having a function of extracting the same character string as an important phrase may be provided. Also, the important phrase extraction unit 2051 extracts key phrases indicated by the important phrase candidate character string pattern information in the condition information in the setting information acquired by the setting information acquisition unit 201, for example, in the invention document acquired by the document acquisition unit 202. If a character string corresponding to the specific particle character string pattern indicated by the specific particle character string pattern information in the condition information exists following the character string corresponding to the candidate character string pattern, it corresponds to the key phrase candidate character string pattern. A fourth extraction unit may be provided that has a function of extracting the same character string as the important phrase as the important phrase.

重要語句抽出部2051は、設定情報取得部201により取得された設定情報に含まれる条件情報に基づいて、発明文書取得部2021により取得された発明文書から重要語句を抽出する重要語句抽出処理を実行する。条件情報が適切に定められることにより、重要語句抽出部2051は、例えば、発明文書の一例としての、日本国の特許庁により公開された幾つかの特許公開公報のうちの個々の特許公開公報における特許請求の範囲又は明細書から、複数の重要語句を、抽出可能となる。 The key phrase extraction unit 2051 executes key phrase extraction processing for extracting key phrases from the invention documents acquired by the invention document acquisition unit 2021 based on the condition information included in the setting information acquired by the setting information acquisition unit 201. do. By appropriately defining the condition information, the key phrase extraction unit 2051 can, for example, extract It becomes possible to extract a plurality of key terms from the claims or the specification.

重要語句抽出部2051により抽出された重要語句は、例えば、発明文書分析システム20が出力する、特許出願関連情報等の情報の生成に利用される。ここでは、一例として発明文書がクレーム及び明細書を含む例を用いて、その発明文書のクレームと明細書とのそれぞれから重要語句を抽出する重要語句抽出部2051について詳細に説明する。重要語句抽出部2051は、重要語句抽出処理として、発明文書のクレームから重要語句を抽出するクレーム重要語句抽出処理と、発明文書の明細書から重要語句を抽出する明細書重要語句抽出処理とを実行する。 The key phrases extracted by the key phrase extraction unit 2051 are used to generate information such as patent application related information output by the invention document analysis system 20, for example. Here, using an example in which an invention document includes a claim and a specification, the key word extracting unit 2051 for extracting key words from each of the claims and the specification of the invention document will be described in detail. The key phrase extraction unit 2051 executes, as key phrase extraction processing, a claim key phrase extraction process for extracting key phrases from the claims of the invention document, and a specification key phrase extraction process for extracting important phrases from the specification of the invention document. do.

分析部205では、例えば、重要語句抽出部2051が、重要語句を、クレーム及び明細書のうちいずれから抽出したのかを区別して、抽出した重要語句について、管理する。分析部205は、重要語句の管理のための重要語句管理情報を保持し得る。重要語句管理情報は、発明文書から抽出された各重要語句について識別情報、重要度、属性情報、対応翻訳語、翻訳語候補集合等を対応付けた情報である。 In the analysis unit 205, for example, the key phrase extraction unit 2051 distinguishes whether the key phrase is extracted from the claim or the specification, and manages the extracted key phrase. The analysis unit 205 can hold important phrase management information for managing important phrases. The key word management information is information in which identification information, importance, attribute information, corresponding translation words, translation word candidate sets, etc. are associated with each key word extracted from the invention document.

重要語句抽出部2051は、発明文書取得部2021により取得された発明文書における、設定情報中の重要語句抽出範囲情報に従った範囲において、重要語句の抽出を行う。ここでは、設定情報において、クレームの全項の範囲と、明細書における「発明を実施するための形態」及び1つ以上の「実施例」の記載がなされている範囲とが、重要語句の抽出範囲として設定されている例を想定して、説明する。なお、クレームの各項の範囲は、一例としては、発明文書の行順に、始め隅付き括弧と終わり隅付き括弧で挟まれた「請求項n」(nは自然数)というクレームの一項の見出し行から、次の隅付き括弧で挟まれた文字列(例えば、「請求項」で始まる文字列、「書類名」等)で表された見出し行か発明文書の末尾かのうち最先の方までである。また、明細書の「発明を実施するための形態」の記載がなされている範囲は、一例としては、隅付き括弧で挟まれた「発明を実施するための形態」という見出し行から、次の隅付き括弧で挟まれた文字列(例えば、「実施例」、「符号の説明」等)で表された見出し行か発明文書の末尾かのうち最先の方までである。また、明細書の1つの「実施例」の記載がなされている範囲は、一例としては、隅付き括弧で挟まれた「実施例」又は「実施例m」(mは自然数)という見出し行から、次の隅付き括弧で挟まれた文字列で表された見出し行か発明文書の末尾かのうち最先の方までである。 The important phrase extraction unit 2051 extracts important phrases in the range according to the important phrase extraction range information in the setting information in the invention document acquired by the invention document acquisition unit 2021 . Here, in the setting information, the scope of all claims and the scope of the description of "modes for carrying out the invention" and one or more "embodiments" in the specification are extracted as key phrases. Description will be made assuming an example where the range is set. As an example, the scope of each claim is defined by the heading of one claim, "Claim n" (where n is a natural number) sandwiched between the opening and closing square brackets in the line order of the invention document. From the line to the beginning of the heading or the end of the invention document, as indicated by the following string of characters enclosed in square brackets (e.g., the string beginning with "Claim", "Title of Document", etc.) is. In addition, the scope of the description of "Method for Carrying Out the Invention" in the specification is, for example, from the heading line "Method for Carrying Out the Invention" enclosed in square brackets to the following: This is up to whichever of the headings or the end of the invention document, which is represented by a string of characters enclosed in square brackets (e.g., "Example", "Description of Symbols", etc.). In addition, the range in which one "Example" is described in the specification is, for example, from the heading line "Example" or "Example m" (m is a natural number) sandwiched between square brackets , to either the heading indicated by the next bracketed string or the end of the invention document, whichever is first.

重要語句抽出部2051は、例えば、重要語句の抽出処理を担うプラグインモジュールを利用して、発明文書からの重要語句の抽出を行うこととしてもよい。 The key phrase extraction unit 2051 may extract key phrases from the invention document, for example, using a plug-in module that performs the key phrase extraction process.

[3-1-5-1-1.クレーム中の重要語句の抽出]
重要語句抽出部2051は、クレーム重要語句抽出処理として、例えば、発明文書のクレームの行毎に、重要語句の候補を探索し、重要語句の候補を抽出したら、定められた基準(例えば抽出例外条件)に基づいて重要語句であり得るか否かの判別を行って、重要語句であり得ると判別したものを、重要語句として抽出する。なお、重要語句抽出部2051は、例えば、設定情報のコメント特定用情報に基づいてコメント行又はコメントの部分については探索対象範囲から除外して、重要語句の候補の探索を行う。
[3-1-5-1-1. Extraction of Important Words in Claims]
The key phrase extraction unit 2051 searches for key phrase candidates for each claim line of the invention document, for example, as the claim key phrase extraction process, and extracts the key phrase candidates. ) to determine whether or not it can be an important phrase, and extract a phrase that is determined to be an important phrase as an important phrase. Note that the key phrase extraction unit 2051 searches for key phrase candidates by, for example, excluding comment lines or comment portions from the search target range based on the comment specifying information of the setting information.

重要語句抽出部2051は、例えば、クレームの各行について、重要語句の候補を探索する前に、探索のために発明文書のクレームの各行に対して文字形式の変換を施し、その変換を施したものを探索に利用してもよい。文字形式の変換の一例としては、半角文字の全角文字への変換、英字の小文字(例えば「a」)の英字の大文字(例えば「A」)への変換等が挙げられる。このような文字形式の変換を施すことにより、重要語句の候補を探索するために必要となる文字列パターン(例えば重要語句候補文字列パターン)の簡明化、重要語句の抽出に係る処理の迅速化等が実現されることがあり得る。 For example, the key phrase extraction unit 2051 performs character format conversion on each line of the claim of the invention document for searching before searching for key phrase candidates for each line of the claim, and converts the character format to can be used for searching. Examples of character format conversion include conversion of half-width characters to full-width characters, and conversion of lower-case alphabetic characters (eg, “a”) to upper-case alphabetic characters (eg, “A”). Such character format conversion simplifies the character string pattern (for example, key word candidate character string pattern) required for searching key word candidates, and speeds up the processing related to key word extraction. etc. may be realized.

クレームの一行において、重要語句であり得ると判別される複数の重要語句の候補が抽出され、その複数の重要語句の候補の文字列の記載範囲が一部重複する場合には、重要語句抽出部2051は、定められた選択基準に基づいてその複数の重要語句の候補のうち1つを選択して重要語句として抽出する。この選択基準は、一例としては、複数の重要語句の候補の文字列のうち、一の重要語句の候補の文字列が他の重要語句の候補の文字列に記載上包含される場合にはその一の重要語句の候補の文字列を除外して、残余の候補の文字列から重要語句を選択するという基準である。例えば、重要語句抽出部2051は、重要語句の抽出のために、比較的複雑な重要語句候補文字列パターンを1つ又は少数用いることとしてもよいし、比較的簡潔な重要語句候補文字列パターンを複数用いることとしてもよい。例えば、重要語句抽出部2051は、重要語句の抽出のために、重要語句候補文字列パターンに複数の文字列が該当していた場合においてその複数の文字列のうちの一の文字列が他の文字列に発明文書の記載上包含されていたときには、その複数の文字列のうちその一の文字列を除外した残余の文字列を選択対象として重要語句を選択して抽出する。 If a plurality of key phrase candidates determined to be possible key phrases are extracted in one line of a claim, and the description ranges of the character strings of the plurality of key phrase candidates partially overlap, the key phrase extraction unit 2051 selects one of the plurality of key phrase candidates based on a defined selection criterion and extracts it as the key phrase. For example, if one key phrase candidate character string among a plurality of key phrase candidate character strings is included in another key phrase candidate character string, This is a criterion of excluding one key phrase candidate character string and selecting an important phrase from the remaining candidate character strings. For example, the key phrase extraction unit 2051 may use one or a few relatively complex key phrase candidate character string patterns for extracting key phrases, or may use relatively simple key phrase candidate character string patterns. A plurality of them may be used. For example, in order to extract an important phrase, the important phrase extraction unit 2051 extracts one of the plurality of character strings when a plurality of character strings correspond to the important phrase candidate character string pattern. When the character string is included in the description of the invention document, the remaining character string excluding the one character string among the plurality of character strings is selected and extracted as a selection target.

重要語句抽出部2051は、例えば、重要語句設定辞書取得部203により取得された重要語句設定辞書に含まれる重要語句と同一の語句が、発明文書のクレームに含まれている場合には、クレーム中のその語句を重要語句の候補として抽出する。重要語句抽出部2051は、例えば、重要語句設定辞書取得部203により取得された非重要語句設定辞書に含まれる語句については、重要語句の候補として抽出しないようにする。 For example, if a claim of an invention document contains the same key phrase as the key phrase included in the key phrase setting dictionary acquired by the key phrase setting dictionary acquisition unit 203, the key phrase extraction unit 2051 extracts , as a candidate for an important phrase. For example, the important phrase extraction unit 2051 does not extract the phrases included in the non-key phrase setting dictionary acquired by the important phrase setting dictionary acquisition unit 203 as candidates for important phrases.

重要語句抽出部2051は、例えば、設定情報の条件情報が示す各文字列パターン情報を参照して、発明文書のクレームにおける語句を重要語句の候補として抽出する。 The key phrase extraction unit 2051, for example, refers to each character string pattern information indicated by the condition information of the setting information, and extracts the phrases in the claims of the invention document as candidates for key phrases.

具体的な一例としては、重要語句抽出部2051は、クレーム中に、条件情報における参照文字列パターン情報が示す参照文字列パターンに該当する文字列に後続して、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句の候補として抽出する。その重要語句候補文字列パターンに該当する文字列と同一の文字列が、重要語句の候補のうちから、重要語句として抽出されることになった場合においては、重要語句抽出部2051は、例えば、クレーム中に、その重要語句として抽出された文字列を語尾に含む文字列で、重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列が存在するときに、その重要語句候補文字列パターンに該当する文字列を、更に重要語句の候補として抽出することとしてもよい。これにより、例えば、参照文字列パターンに該当する文字列が「前記」であったとした場合に、クレーム中の「前記制御装置」の記載から「制御装置」が重要語句として抽出されたときにおいて、更に、その「制御装置」を語尾に有する、クレーム中の「機器制御装置」が更に重要語句の候補として抽出され得る。なお、重要語句抽出部2051は、クレーム中に、条件情報における参照文字列パターン情報が示す参照文字列パターンに該当する文字列に後続して、所定前置文字列が存在し、その所定前置文字列に後続して、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句の候補として抽出することとしてもよい。ここで、所定前置文字列は、例えば、「第一」、「第1の」、「第1、第3~第5の」等といった1つ以上の序数を含んで構成される序数文字列、或いは、「複数の」、「1本の」、「一組の」、「1つ又は複数の」等といった個数を表現した数量文字列、或いは、「所定」、「所定の」、「一の」、「他の」等といった限定文字列等である。序数文字列が複数の序数を含む場合には、序数文字列は、序数間の区切り文字として、「~」、「-」、「,」、読点文字「、」、或いは、品詞が接続詞である文字列等を含む。接続詞は、従来の形態素解析技術を用いて識別してもよいし、接続詞である文字列(「および」、「または」、「及び」等)を列挙した接続詞リストと照合することで識別してもよい。接続詞リストにおいて、例えば、「及び/又は」、「および/または」といった記載を含めてもよい。 As a specific example, the key word extraction unit 2051 extracts key word candidate character strings in the condition information, following the character string corresponding to the reference character string pattern indicated by the reference character string pattern information in the condition information, in the complaint. If there is a character string corresponding to the key phrase candidate character string pattern indicated by the pattern information, the same character string as the character string corresponding to the key phrase candidate character string pattern is extracted as an important phrase candidate. When the same character string as the character string corresponding to the key phrase candidate character string pattern is to be extracted as an important phrase from the key phrase candidates, the important phrase extraction unit 2051, for example, If there is a character string in the claim that includes the character string extracted as the key phrase at the end of the word and corresponds to the key phrase candidate character string pattern indicated by the key phrase candidate character string pattern information, the key phrase A character string corresponding to the candidate character string pattern may be further extracted as an important phrase candidate. As a result, for example, if the character string corresponding to the reference character string pattern is "said", when "control device" is extracted as an important phrase from the description of "said control device" in the claim, Furthermore, the "equipment control device" in the claims that ends with the word "control device" can be further extracted as a candidate for the important phrase. Note that the key phrase extraction unit 2051 detects that a predetermined prefix character string exists following the character string corresponding to the reference character string pattern indicated by the reference character string pattern information in the condition information in the complaint, and that the predetermined prefix character string exists. If there is a character string following the key phrase candidate character string pattern indicated by the key phrase candidate character string pattern information in the condition information, it is the same as the key phrase candidate character string pattern can be extracted as candidates for important phrases. Here, the predetermined prefix character string is an ordinal character string including one or more ordinal numbers such as "first", "first", "first, third to fifth", etc. , or a quantity string expressing the number such as "plurality", "one", "a set", "one or more", etc., or "predetermined", "predetermined", "one It is a limited character string such as "of", "other", and the like. If the ordinal string contains more than one ordinal number, the ordinal string should use ``~'', ``-'', ``,'', comma characters ``,'' as separators between ordinal numbers, or the part of speech as a conjunction. Including character strings, etc. Conjunctions may be identified using conventional morphological analysis techniques or by matching a string of conjunctions (such as "and", "or", "and") against a list of conjunctions. good too. In the conjunctive list, statements such as "and/or", "and/or" may be included.

重要語句抽出部2051は、例えば、クレーム中に、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して、条件情報における特定助詞文字列パターン情報が示す特定助詞文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句の候補として抽出する。なお、重要語句抽出部2051は、例えば、クレーム中に、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して、所定の文字列(例えば、「各々」、「の夫々」等)が存在し、その所定の文字列に後続して、条件情報における特定助詞文字列パターン情報が示す特定助詞文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句の候補として抽出することとしてもよい。 For example, the important phrase extraction unit 2051 extracts the specific particle character string pattern information in the condition information after the character string corresponding to the important phrase candidate character string pattern indicated by the important phrase candidate character string pattern information in the condition information in the complaint. If there is a character string corresponding to the specific particle character string pattern indicated by , the same character string as the character string corresponding to the key phrase candidate character string pattern is extracted as an important phrase candidate. Note that, for example, the important phrase extraction unit 2051 extracts a predetermined character string (for example, "Each", "Each of", etc.) exists, and following the predetermined character string, there is a character string corresponding to the specific particle character string pattern indicated by the specific particle character string pattern information in the condition information , the same character string as the character string corresponding to the key phrase candidate character string pattern may be extracted as the key phrase candidate.

重要語句抽出部2051は、例えば、クレーム中に、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して、条件情報における符号文字列パターン情報が示す符号文字列パターンに該当する文字列(例えば始め丸括弧と終わり丸括弧とに挟まれた符号)が存在する場合においては、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句の候補として抽出する。 The important phrase extraction unit 2051 extracts, for example, a character string corresponding to the important phrase candidate character string pattern indicated by the important phrase candidate character string pattern information in the condition information in the complaint, followed by the code character string pattern information in the condition information. If there is a character string that corresponds to the code string pattern shown (for example, a code between the opening and closing parentheses), the same character string as the key phrase candidate character string pattern is extracted as an important phrase candidate.

重要語句抽出部2051は、クレーム中に、漢字以外の文字又は所定の漢字(例えば「各」)に後続して、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句の候補として抽出してもよい。 The key phrase extraction unit 2051 extracts characters other than Chinese characters or predetermined Chinese characters (for example, “each”) in the complaint, followed by the key phrase candidate character string pattern indicated by the key phrase candidate character string pattern information in the condition information. If there is a character string that matches the key phrase candidate character string pattern, the same character string as the character string corresponding to the key phrase candidate character string pattern may be extracted as an important phrase candidate.

重要語句抽出部2051は、例えば、クレーム中において、行頭、句読点の後、或いは、動詞、助動詞、形容詞、接続詞、副詞又は所定の平仮名の後に、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列が存在する場合においては、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句の候補として抽出することとしてもよい。なお、発明文書中の各行は、複数の文字列から構成され得るところ、その各文字列の品詞(例えば動詞、形容詞、接続詞等に区分される文字列の種別)については、既存の形態素解析技術を用いて、ある程度判別し得る。このため、条件情報の一部(例えば重要語句候補文字列パターン情報)が、品詞を区別した文字列パターンを示すようにしてもよい。品詞を区別した文字列パターンは、例えば、形態素解析技術を用いて先に発明文書中の各語句の形態素解析を実行して、その結果として選別された所定の品詞各々である語句に、品詞別の特定記号列をその語句の直前及び直後の少なくとも一方に付加すること又はその語句を品詞別の特定記号列に置換することを前提として、重要語句の候補の抽出がなされる場合においては、その品詞別の特定記号列を含ませて表現した文字列パターンである。形態素解析を実行するためのプログラムの一例としては、京都大学情報学研究科-日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトで開発された工藤拓氏によるオープンソース形態素解析エンジン「Mecab」が挙げられる。例えば、条件情報において重要語句候補文字列パターン情報が示す1つの重要語句候補文字列パターンに名詞が該当するように定めておいてもよい。なお、発明文書中(例えばクレーム中)に、特定助詞文字列パターン情報が示す特定助詞文字列パターンに該当する文字列が存在するか否かを判別する際に、形態素解析により、その文字列の品詞が助詞であるところのその文字列が存在するか否かの判別を、追加してもよい。 For example, the important phrase extraction unit 2051 extracts the important phrase candidate character string pattern information indicated by the important phrase candidate character string pattern information in the condition information after the beginning of a line, punctuation marks, or after verbs, auxiliary verbs, adjectives, conjunctions, adverbs, or predetermined hiragana in a claim. If there is a character string corresponding to the phrase candidate character string pattern, the same character string as the character string corresponding to the key phrase candidate character string pattern may be extracted as an important phrase candidate. Each line in the invention document can be composed of multiple character strings, and the part of speech of each character string (for example, the type of character string classified into verbs, adjectives, conjunctions, etc.) can be determined using existing morphological analysis techniques. can be used to determine to some extent. For this reason, part of the condition information (for example, important word candidate character string pattern information) may indicate character string patterns that differentiate parts of speech. A character string pattern that distinguishes parts of speech is obtained, for example, by first performing morphological analysis on each word in the invention document using a morphological analysis technology, and as a result, preselected words that are each of the predetermined parts of speech. In the case where candidates for important phrases are extracted on the premise that a specific symbol string is added to at least one of immediately before and after the phrase, or the phrase is replaced with a specific symbol string by part of speech, It is a character string pattern expressed by including a specific symbol string for each part of speech. An example of a program for executing morphological analysis is the open-source morphological analysis engine "Mecab" developed by Taku Kudo in a joint research unit project between Kyoto University Graduate School of Informatics and Nippon Telegraph and Telephone Corporation Communication Science Laboratories. is mentioned. For example, the condition information may be defined such that a noun corresponds to one key phrase candidate character string pattern indicated by the key phrase candidate character string pattern information. When determining whether or not there is a character string corresponding to the specific particle character string pattern indicated by the specific particle character string pattern information in the invention document (for example, in a claim), the morphological analysis of the character string Determining whether the string exists or not where the part of speech is a particle may be added.

重要語句抽出部2051は、例えば、発明文書の明細書中に条件情報に基づいて重要語句として抽出された文字列がある場合において、その文字列と同一の文字列が発明文書のクレーム中に存在するときには、その文字列を、無条件に又は一定条件下で、重要語句の候補として抽出してもよい。この一定条件の例としては、発明文書の明細書から抽出された重要語句の重要度が所定程度以上であること等が挙げられる。具体例としては、重要語句抽出部2051は、例えば、発明文書の明細書中に、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して、条件情報における符号文字列パターン情報が示す符号文字列パターンに該当する文字列が存在する場合において、その重要語句候補文字列パターンに該当する文字列と同一の文字列が、発明文書のクレーム中に存在するときには、その文字列を、重要語句の候補として抽出することとしてもよい。 For example, when there is a character string extracted as a key phrase based on the condition information in the specification of the invention document, the key phrase extraction unit 2051 detects that the same character string as that character string exists in the claim of the invention document. When doing so, the character string may be extracted as an important phrase candidate unconditionally or under certain conditions. An example of this certain condition is that the importance of the key phrases extracted from the specification of the invention document is above a predetermined level. As a specific example, for example, the key phrase extraction unit 2051 follows the character string corresponding to the key phrase candidate character string pattern indicated by the key phrase candidate character string pattern information in the condition information in the specification of the invention document, If there is a character string corresponding to the coded character string pattern indicated by the coded character string pattern information in the condition information, the same character string as the character string corresponding to the key phrase candidate character string pattern is included in the claim of the invention document. If it exists, the character string may be extracted as an important phrase candidate.

重要語句抽出部2051は、例えば、発明文書の明細書中に先行技術文献情報として特許文献が示されている場合にその特許文献のクレーム及び明細書から、条件情報に基づいて重要語句を抽出し、その発明文書のクレーム中に、その特許文献における重要語句と同一の語句があれば、重要語句の候補として抽出することとしてもよい。 For example, when a patent document is indicated as prior art document information in the specification of an invention document, the key phrase extraction unit 2051 extracts key phrases based on the condition information from the claims and specifications of the patent document. , if the claims of the invention document contain the same key words as the key words in the patent document, they may be extracted as key word candidates.

重要語句抽出部2051は、例えば、発明文書の明細書中に「符号の説明」が記載されている場合において、その「符号の説明」で符号に対応付けられて記載された語句がその発明文書のクレーム中に存在するときには、その語句を重要語句の候補として抽出することとしてもよい。重要語句抽出部2051は、例えば、重要語句の候補として抽出されたクレーム中の語句のうち、クレーム中のその語句に所定非後続文字列が後続している場合には、その語句を重要語句として抽出しないこととしてもよい。所定非後続文字列は、例えば、「する」、「し」等である。重要語句抽出部2051は、例えば、重要語句の候補として抽出されたクレーム中の語句のうち、語句の先頭に所定不要語が含まれている場合に、その語句から所定不要語を除去した語句を、重要語句の候補として抽出したものと看做すこととしてもよい。所定不要語は、例えば、「所謂」、「実質」、「各種」等である。 For example, when an "explanation of the code" is described in the specification of the invention document, the key phrase extraction unit 2051 extracts the words and phrases described in association with the code in the "explanation of the code" from the invention document. exists in the claim, the phrase may be extracted as a candidate for the important phrase. For example, if the word in the claim is followed by a predetermined non-following character string among the words in the claim extracted as the candidates for the important word, the key word extracting unit 2051 regards the word as the key word. It is also possible not to extract. The predetermined non-following character string is, for example, "do", "shi", and the like. For example, if a predetermined unnecessary word is included at the head of a claim extracted as an important word candidate, the important phrase extraction unit 2051 removes the predetermined unnecessary word from the phrase. , may be regarded as extracted as candidates for key phrases. Predetermined unnecessary words are, for example, "so-called", "substantially", and "various".

重要語句抽出部2051は、例えば、重要語句の候補として抽出されたクレーム中の文字列が、抽出例外条件に該当する文字列である場合には、その文字列を重要語句として抽出しないこととしてもよい。抽出例外条件は、例えば条件情報の一部として定められ得る。抽出例外条件は、例えば、単独では重要語句とならない文字列(例えば、「複数」、「上」等)、単独でも語尾として含んでも重要語句とならない文字列(例えば、「実際」、「百」等)、単位を示し重要語句とならない文字列(例えば「km」、「cm」、「MB」、「kΩ」等)等を表す条件である。 For example, if a character string in a claim extracted as a candidate for an important phrase is a character string that corresponds to an extraction exception condition, the important phrase extraction unit 2051 may not extract the character string as an important phrase. good. Extraction exception conditions may be defined as part of the condition information, for example. Extraction exception conditions include, for example, character strings that are not important words by themselves (e.g., "plural", "on", etc.), character strings that are not important words even if they are alone or included as endings (e.g., "actual", "hundred"). etc.), character strings that indicate units and are not key phrases (for example, "km", "cm", "MB", "kΩ", etc.).

重要語句抽出部2051は、例えば、発明文書のクレーム中から抽出した重要語句に後続して、始め括弧と、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列と、終わり括弧とがこの順に連続して含まれているときにその重要語句候補文字列パターンに該当する文字列を重要語句の候補として抽出してもよい。その重要語句候補文字列パターンに該当する文字列がコロン「:」で区切られた複数の語句であって、その複数の語句の各々が重要語句候補文字列パターンに該当する場合には、重要語句抽出部2051は、その複数の語句の各々を重要語句の候補として抽出することとしてもよい。 The important phrase extraction unit 2051 extracts, for example, the important phrase extracted from the claim of the invention document, followed by the opening parenthesis and the characters corresponding to the important phrase candidate character string pattern indicated by the important phrase candidate character string pattern information in the condition information. When a string and a closing parenthesis are consecutively included in this order, a character string corresponding to the important phrase candidate character string pattern may be extracted as an important phrase candidate. If the string corresponding to the key phrase candidate character string pattern is multiple words separated by colons ":" and each of the multiple words corresponds to the key phrase candidate character string pattern, the key phrase The extraction unit 2051 may extract each of the plurality of phrases as an important phrase candidate.

重要語句抽出部2051は、例えば、発明文書のクレームの各項において請求対象として記載されている要素(言わば請求対象の要素)を表す語句を、重要語句として抽出する。重要語句抽出部2051は、例えば、発明文書のクレームに、重要語句設定辞書取得部203により取得された重要語句設定辞書に含まれる重要語句と同一の語句に後続して句点文字が存在する場合には、その語句を、請求対象の要素を表す重要語句として抽出する。重要語句抽出部2051は、例えば、発明文書のクレームに、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して句点文字が存在する場合には、その重要語句候補文字列パターンに該当する文字列と同一の文字列を、請求対象の要素を表す重要語句として抽出する。重要語句抽出部2051により抽出された重要語句が、クレームの請求対象の要素を表すか否かは、例えば、分析部205において管理される重要語句管理情報における属性情報の項目の1つとなり得る。 The key phrase extraction unit 2051, for example, extracts, as key phrases, phrases that represent the elements described as the subject of a claim in the claims of the invention document (so to speak, the elements that are the subject of a claim). For example, the important phrase extraction unit 2051 extracts the same phrase as the important phrase included in the important phrase setting dictionary acquired by the important phrase setting dictionary acquisition unit 203 in the claim of the invention document, and if there is a period character following the phrase, extracts the phrase as a key phrase that represents the claimed element. For example, if a claim of an invention document contains a period character following a character string corresponding to an important phrase candidate character string pattern indicated by important phrase candidate character string pattern information in the condition information, the important phrase extraction unit 2051 , the same character string as the character string corresponding to the key word candidate character string pattern is extracted as the key word representing the element to be claimed. Whether or not the key phrase extracted by the key phrase extraction unit 2051 represents an element to be claimed in a claim can be one of the items of attribute information in the key phrase management information managed by the analysis unit 205, for example.

発明文書のクレームにおける請求対象の要素を探索するために用いる重要語句候補文字列パターンは、請求対象以外の要素に係る重要語句の候補を探索するために用いる重要語句候補文字列パターンと同様であってもよいし、一部を異ならせてもよい。一例としては、請求対象の要素を探索するために用いる重要語句候補文字列パターンは、語句の緩い結合を表現するのに用いられることのある平仮名「の」を間に含む所定の文字列と、平仮名「の」を含まない別の所定の文字列との両方が、該当するように定められた文字列パターンであることとして、請求対象以外の要素に係る重要語句の候補を探索するために用いる重要語句候補文字列パターンは、平仮名「の」を間に含む文字列が該当しない文字列パターンであることとしてもよい。 The key word candidate character string pattern used to search for the claimed element in the claim of the invention document is the same as the key word candidate character string pattern used to search for the key word candidate for the non-claimed element. may be different, or some may be different. As an example, the key phrase candidate string pattern used to search for the claimed element includes a predetermined string containing the hiragana character "no", which may be used to express loose combinations of phrases, and Another predetermined character string that does not include hiragana "no" is a character string pattern that is determined to be applicable, and is used to search for candidates for important phrases related to elements other than the subject of the claim The key phrase candidate character string pattern may be a character string pattern that does not include a hiragana character "no".

[3-1-5-1-2.明細書中の重要語句の抽出]
重要語句抽出部2051は、明細書重要語句抽出処理として、例えば、発明文書の明細書中での、設定情報中の重要語句抽出範囲情報に従った重要語句の抽出範囲(例えば「発明を実施するための形態」及び「実施例」)において、重要語句の抽出を行う。重要語句抽出部2051における明細書中の重要語句の抽出については、上述したクレーム中の重要語句の抽出と、一部が異なる他は、概ね同様である。以下、その同様のことについての説明は、適宜省略するが、発明文書の明細書中での重要語句の抽出範囲における重要語句の抽出には、利用可能である限りにおいて、上述したクレーム中の重要語句の抽出と同様の方式を利用してもよい。
[3-1-5-1-2. Extraction of key terms in the specification]
As the specification key phrase extraction process, the key phrase extraction unit 2051 extracts, for example, an extraction range of key phrases according to key phrase extraction range information in the setting information in the specification of the invention document (for example, “Implementing the invention For example” and “Example”), important words are extracted. Extraction of important phrases in the specification by the important phrase extraction unit 2051 is generally the same as extraction of important phrases in the claims described above, except for some differences. Hereinafter, the explanation of the same thing will be omitted as appropriate, but as long as it can be used to extract key words in the extraction range of key words in the specification of the invention document, the key words in the above-mentioned claims A method similar to the extraction of words may be used.

重要語句抽出部2051は、例えば、発明文書の明細書中での重要語句の抽出範囲における行毎に、重要語句の候補を探索し、重要語句の候補を抽出したら、定められた基準に基づいて重要語句であり得るか否かの判別を行って、重要語句であり得ると判別したものを、重要語句として抽出する。 For example, the key phrase extraction unit 2051 searches for key phrase candidates for each line in the key phrase extraction range in the specification of the invention document. It is determined whether or not it can be an important phrase, and those determined to be an important phrase are extracted as important phrases.

なお、重要語句抽出部2051は、例えば、設定情報のコメント特定用情報に基づいてコメント行又はコメントの部分については探索対象範囲から除外して、重要語句の候補の探索を行う。また、重要語句抽出部2051は、例えば、引用記載の範囲については探索対象範囲から除外して、重要語句の候補の探索を行うこととしてもよい。引用記載の範囲は、例えば、引用のための、2つの呼応する別々の文字コードの、引用符又は括弧で、前後を挟まれた範囲であり、一例としては、引用される記載を3つの中点で表現すると、「・・・」、『・・・』、“・・・”等が、挙げられる。 Note that the key phrase extraction unit 2051 searches for key phrase candidates by, for example, excluding comment lines or comment portions from the search target range based on the comment specifying information of the setting information. In addition, the key phrase extraction unit 2051 may search for key phrase candidates, for example, by excluding the quoted range from the search target range. The range of a quoted statement is, for example, the range of two corresponding separate letter codes for citation, which are surrounded by quotation marks or parentheses; When expressed in points, "...", "...", "..." and the like can be mentioned.

重要語句抽出部2051は、例えば、発明文書の明細書中での重要語句の抽出範囲における各行について重要語句の候補を探索する前に、その各行に対して文字形式の変換を施してもよい。 For example, the key phrase extraction unit 2051 may perform character format conversion on each line before searching for key phrase candidates for each line in the key phrase extraction range in the specification of the invention document.

発明文書の明細書中での重要語句の抽出範囲の一行において、重要語句であり得ると判別される複数の重要語句の候補が抽出され、その複数の重要語句の候補の文字列の記載範囲が一部重複する場合には、重要語句抽出部2051は、定められた選択基準に基づいてその複数の重要語句の候補のうち1つを選択して重要語句として抽出する。なお、重要語句抽出部2051は、発明文書の明細書中での重要語句の抽出範囲の各行について、その行における全ての丸括弧内記載部分(つまり始め丸括弧と終わり丸括弧とで挟まれた記載部分)を除去した残りの文字列を連結して構成された丸括弧外記載部分と、各丸括弧内記載部分とのそれぞれを、別個に対象として、重要語句の候補の抽出を行うこととしてもよい。 In one line of the key phrase extraction range in the specification of the invention document, a plurality of key phrase candidates determined to be possible key phrases are extracted, and the description range of the character strings of the plurality of key phrase candidates is If there is a partial overlap, the key phrase extraction unit 2051 selects one of the plurality of key phrase candidates based on a defined selection criterion and extracts it as the key phrase. Note that the important phrase extraction unit 2051 extracts all descriptions in parentheses in each line of the extraction range of important phrases in the specification of the invention document (i.e., between the opening and closing parenthesis Extraction of candidates for important phrases is performed by separately targeting the description part outside the parentheses formed by concatenating the remaining character strings after removing the description part) and the description parts inside the parentheses. good too.

重要語句抽出部2051は、例えば、重要語句設定辞書取得部203により取得された重要語句設定辞書に含まれる重要語句と同一の語句が、発明文書の明細書中での重要語句の抽出範囲に含まれている場合には、明細書中での重要語句の抽出範囲中のその語句を重要語句の候補として抽出する。重要語句抽出部2051は、例えば、重要語句設定辞書取得部203により取得された非重要語句設定辞書に含まれる語句については、重要語句の候補として抽出しないようにする。 The key phrase extraction unit 2051 extracts, for example, the same key phrases as the key phrases included in the key phrase setting dictionary acquired by the key phrase setting dictionary acquisition unit 203 are included in the key phrase extraction range in the specification of the invention document. If it is, the word/phrase in the extraction range of important words/phrases in the specification is extracted as an important word/phrase candidate. The important phrase extraction unit 2051, for example, does not extract the phrases included in the non-key phrase setting dictionary acquired by the important phrase setting dictionary acquisition unit 203 as candidates for important phrases.

重要語句抽出部2051は、例えば、発明文書のクレーム中において重要語句として抽出した語句と同一の語句が、発明文書の明細書中での重要語句の抽出範囲に含まれている場合には、明細書中での重要語句の抽出範囲中のその語句を重要語句の候補として抽出する。 For example, if the same words as those extracted as important words in the claims of the invention document are included in the extraction range of the important words in the specification of the invention document, the key word extraction unit 2051 The word/phrase in the extraction range of the important word/phrase in the book is extracted as a candidate of the important word/phrase.

重要語句抽出部2051は、例えば、設定情報の条件情報が示す各文字列パターン情報を参照して、発明文書の明細書中での重要語句の抽出範囲における語句を重要語句の候補として抽出する。 The key phrase extraction unit 2051, for example, refers to each character string pattern information indicated by the condition information of the setting information, and extracts the key phrases in the key phrase extraction range in the specification of the invention document as key phrase candidates.

具体的な一例としては、重要語句抽出部2051は、例えば、発明文書の明細書中での重要語句の抽出範囲に、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して、符号文字列が存在する場合において、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句の候補として抽出する。符号文字列は、例えば、条件情報における符号文字列パターン情報が示す符号文字列パターンに該当する文字列である。なお、符号文字列パターン情報が、設定情報における非符号基準を反映したものでない場合においては、符号文字列は、符号文字列パターンに該当する文字列であり、非符号基準に基づいて符号でないものと判断されない文字列である。符号文字列は、例えば、発明文書の明細書中に「符号の説明」が記載されている場合においては、その「符号の説明」中における符号と推定される文字列であってもよい。 As a specific example, the key phrase extraction unit 2051 extracts the key phrase candidate string pattern indicated by the key phrase candidate string pattern information in the condition information, for example, in the key phrase extraction range in the specification of the invention document. If there is a coded character string following the relevant character string, the same character string as the character string corresponding to the key phrase candidate character string pattern is extracted as an important phrase candidate. The coded character string is, for example, a character string corresponding to the coded character string pattern indicated by the coded character string pattern information in the condition information. If the coded character string pattern information does not reflect the non-coded criteria in the setting information, the coded character string is a character string that corresponds to the coded character string pattern and is not a code based on the non-coded criteria. It is a character string that is not judged as For example, when the description of the invention document includes an "explanation of the code", the code string may be a character string presumed to be the code in the "explanation of the code".

符号文字列パターン情報が正規表現等で表す符号文字列パターンは、例えば、符号として用いることのできる文字(例えば、英数字及び所定の記号)で構成された文字列が該当するように表現される。符号文字列パターンは、例えば、複数の符号が「~」、「-」、「,」、読点文字「、」等により連結された文字列が該当し得るような文字列パターンであってもよい。非符号基準が符号文字列パターンに内包されていない場合においては、非符号基準は、符号文字列パターンに該当する文字列のうち、例えば一般的に符号として用いられることが稀であり、符号でない可能性が十分にあると推定される文字例を、符号でないと判断されるように定めた情報である。非符号基準で、符号でないと判断される文字列の一例としては、先頭3文字以上が英字の大文字である文字列、先頭1文字以上の数字に所定の単位文字列(例えば「km」、「cm」、「MB」、「kΩ」等)が後続する文字列等が挙げられる。非符号基準は、直前の要素名の語尾との組み合わせで符号でないと判断される文字列を示すものであってもよく、この一例としては、符号の直前の要素名の語尾が「電圧」である場合に先頭1文字以上の数字に「V」、「mV」等の単位文字列が後続して構成される符号、符号の直前の要素名の語尾が「距離」である場合に先頭1文字以上の数字に「m」、「cm」、「km」等の単位文字列が後続して構成される符号等が、挙げられる。非符号基準は、例えば、符号として用いることのできる文字で構成された文字列に後続して、符号に後続することが稀である所定の文字(例えば、「つ」、「年」、「秒」、「回」等)が記載されている場合に、その符号として用いることのできる文字で構成された文字列を、符号でないと判断されるように定めてもよい。 The code string pattern represented by the code string pattern information in a regular expression, for example, is expressed so that a string composed of characters (for example, alphanumeric characters and predetermined symbols) that can be used as a code is applicable. . The code string pattern may be, for example, a character string pattern in which a plurality of codes are connected by "~", "-", ",", comma characters ",", etc. . When the non-code reference is not included in the code string pattern, the non-code reference is a character string that corresponds to the code string pattern, for example, it is rarely used as a code, and is not a code. This is information that defines character examples that are estimated to have a high probability of being judged not to be codes. Examples of character strings that are determined not to be codes based on non-code standards include character strings in which the first three or more characters are uppercase letters, and a predetermined unit character string (e.g., "km", " cm”, “MB”, “kΩ”, etc.). The non-sign criterion may indicate a string that is determined not to be a sign in combination with the ending of the element name immediately preceding the sign. In some cases, a code consisting of one or more numbers followed by a unit character string such as "V" or "mV", and if the element name immediately before the code ends with "distance", the first character Codes formed by following the above numerals with unit character strings such as "m", "cm", and "km" can be used. A non-sign standard is, for example, a character string composed of characters that can be used as a sign, followed by a predetermined character that rarely follows a sign (for example, "tsu", "year", "seconds"). , "times", etc.) is described, a character string composed of characters that can be used as the code may be determined so as not to be the code.

重要語句抽出部2051は、例えば、発明文書の明細書中での重要語句の抽出範囲から、符号文字列が後続して存在することで抽出された重要語句の候補の語句のうちに、同一内容の符号文字列が後続して存在することで抽出された複数の語句であって、語尾が共通で語尾以外に異なる部分を有する複数の語句(例えば「機器制御部」と「第1制御部」)が存在する場合には、その複数の語句は重要語句の候補から除外し、その共通の語尾部分(例えば「制御部」)を、重要語句の候補として新たに抽出することとしてもよい。なお、発明文書の明細書中での重要語句の抽出範囲における、相違する位置から、この同一内容の符号文字列が後続して存在することで、重要語句抽出部2051に重要語句の候補として一旦抽出されてその候補から除外された複数の語句(例えば「機器制御部」と「第1制御部」)は、例えば、分析部205により、注意喚起等のために生成される警告情報において、同一符号が付された異表現の語句群として、指摘され得る。 For example, the key phrase extraction unit 2051 selects, from the key phrase extraction range in the specification of the invention document, among the key phrase candidate words and phrases extracted due to the subsequent existence of the code character string, the same content A plurality of words and phrases extracted due to the subsequent existence of the code character string, and a plurality of words and phrases having a common ending and different parts other than the ending (for example, "equipment control unit" and "first control unit" ) exist, the multiple words may be excluded from the key word candidates, and the common ending part (for example, "control part") may be newly extracted as a key word candidate. It should be noted that the subsequent existence of the code character string with the same content from a different position in the extraction range of the key phrase in the specification of the invention document causes the key phrase extraction unit 2051 to temporarily select the key phrase as a candidate for the key phrase. A plurality of words and phrases extracted and excluded from the candidates (for example, “equipment control unit” and “first control unit”) are, for example, the same in warning information generated by the analysis unit 205 for calling attention. It can be pointed out as a group of coded variant phrases.

重要語句抽出部2051は、例えば、発明文書の明細書中での重要語句の抽出範囲に、符号文字列が後続して存在することで抽出された重要語句に後続して、始め括弧と、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列と、終わり括弧とがこの順に連続して含まれているときにその重要語句候補文字列パターンに該当する文字列を重要語句の候補として抽出してもよい。その重要語句候補文字列パターンに該当する文字列がコロン「:」で区切られた複数の語句である場合には、重要語句抽出部2051は、例えば、その複数の語句の各々を重要語句の候補として抽出してもよい。 The important phrase extraction unit 2051 extracts, for example, an important phrase extracted because a coded character string follows it in the extraction range of the important phrase in the specification of the invention document, followed by opening brackets and conditions A character that corresponds to an important phrase candidate character string pattern when a character string that corresponds to the important phrase candidate character string pattern indicated by key phrase candidate character string pattern information in information and a closing parenthesis are consecutively included in this order. A string may be extracted as an important phrase candidate. If the character string corresponding to the key phrase candidate character string pattern is a plurality of words separated by colons ":", the key phrase extraction unit 2051, for example, extracts each of the plurality of words as an important phrase candidate. can be extracted as

重要語句抽出部2051は、例えば、発明文書のクレーム中において重要語句として抽出された文字列を語尾に含む文字列で、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列が、その発明文書の明細書中での重要語句の抽出範囲に存在する場合に、その重要語句候補文字列パターンに該当する文字列を、重要語句の候補として抽出することとしてもよい。 The important phrase extraction unit 2051 extracts, for example, a character string that includes a character string extracted as an important phrase in a claim of an invention document at the end of a word, and extracts it into the important phrase candidate character string pattern indicated by the important phrase candidate character string pattern information in the condition information. If the corresponding character string exists in the key phrase extraction range in the specification of the invention document, the character string corresponding to the key phrase candidate character string pattern can also be extracted as a key phrase candidate. good.

重要語句抽出部2051は、例えば、発明文書の明細書中での重要語句の抽出範囲に、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して、条件情報における特定助詞文字列パターン情報が示す特定助詞文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句の候補として抽出する。なお、重要語句抽出部2051は、例えば、その明細書中での重要語句の抽出範囲に、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列に後続して、所定の文字列(例えば、「各々」、「の夫々」等)が存在し、その所定の文字列に後続して、条件情報における特定助詞文字列パターン情報が示す特定助詞文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列と同一の文字列を重要語句の候補として抽出することとしてもよい。 For example, the important phrase extraction unit 2051 extracts a character string that corresponds to the important phrase candidate character string pattern indicated by the important phrase candidate character string pattern information in the condition information in the extraction range of the important phrase in the specification of the invention document. If there is a character string corresponding to the specific particle character string pattern indicated by the specific particle character string pattern information in the condition information, the same character string as the character string corresponding to the key phrase candidate character string pattern is selected as the key phrase. Extract as a candidate. Note that, for example, the important phrase extraction unit 2051 extracts a string following the key phrase candidate character string pattern indicated by the important phrase candidate character string pattern information in the condition information in the extraction range of the important phrase in the specification. Then, there is a predetermined character string (for example, “each”, “no each”, etc.), and the predetermined character string is followed by the specific particle character string pattern indicated by the specific particle character string pattern information in the condition information. If a corresponding character string exists, the same character string as the character string corresponding to the key phrase candidate character string pattern may be extracted as an important phrase candidate.

重要語句抽出部2051は、例えば、発明文書の明細書中での重要語句の抽出範囲に、条件情報における重要語句候補文字列パターン情報が示す重要語句候補文字列パターンに該当する文字列が存在する場合に、その重要語句候補文字列パターンに該当する文字列を、重要語句の候補として抽出することとしてもよい。なお、符号文字列又は特定助詞文字列パターンに該当する文字列に先行する等の付加的な条件を満たさずに、単に重要語句候補文字列パターンに該当するだけにより、重要語句として抽出された文字列については、分析部205は、その文字列である重要語句の重要度を、例えば、発明文書におけるその重要語句の記載数等に係る一定条件下で、相対的に低いものと定め得る。 The important phrase extraction unit 2051 detects, for example, that a character string corresponding to the important phrase candidate character string pattern indicated by the important phrase candidate character string pattern information in the condition information exists in the extraction range of the important phrase in the specification of the invention document. In this case, a character string corresponding to the key phrase candidate character string pattern may be extracted as an important phrase candidate. In addition, characters extracted as key phrases simply because they correspond to key phrase candidate character string patterns without satisfying additional conditions such as being preceded by character strings that correspond to coded character strings or specific particle character string patterns As for the string, the analysis unit 205 can determine the importance of the key phrase, which is the character string, to be relatively low under certain conditions related to, for example, the number of descriptions of the key phrase in the invention document.

[3-1-5-1-3.抽出された重要語句についての管理]
分析部205は、重要語句抽出部2051により抽出された各重要語句について、重要語句管理情報を用いて管理する。
[3-1-5-1-3. Management of extracted key phrases]
The analysis unit 205 manages each key phrase extracted by the key phrase extraction unit 2051 using key phrase management information.

図18は、重要語句管理情報の一例を示す。 FIG. 18 shows an example of key phrase management information.

図18の例に示す重要語句管理情報は、重要語句抽出部2051により抽出された各重要語句について、識別情報、重要度、属性情報、翻訳語候補集合、対応翻訳語を対応付けた情報である。以下、図18の例に示す重要語句管理情報の各項目について説明する。 The key phrase management information shown in the example of FIG. 18 is information in which each key phrase extracted by the key phrase extraction unit 2051 is associated with identification information, importance, attribute information, a translation word candidate set, and a corresponding translation word. . Each item of the important phrase management information shown in the example of FIG. 18 will be described below.

重要語句の識別情報は、例えば、内容(つまり文字列)が相違する複数の重要語句各々について相違するように定められた番号等の識別コードである。重要語句の識別情報は、具体的には、例えば、発明文書のクレームから抽出された重要語句と発明文書のクレームからは抽出されなかった重要語句とを区別する識別記号と、同一の識別記号の重要語句についての通番とを含む識別コードである。ここで発明文書のクレームから抽出された重要語句は、発明文書の明細書からも抽出され得るものであり、以下、クレームの重要語句とも称する。また、発明文書のクレームからは抽出されなかった重要語句は、発明文書のクレームからは抽出されなかったが明細書から抽出されたものであり、以下、明細書の重要語句とも称する。分析部205は、相互に内容が異なるクレームの重要語句の数が所定数(例えば500)を超える場合には、重要語句の優先順位に基づいて、クレームの重要語句のうち所定数を超えない分の各重要語句には相互に異なる識別コード(例えば、「A1」~「A500」のいずれか)を定め、所定数を超える分の各重要語句は相互に区別せずにその各重要語句には所定の1つの識別コード(例えば「A999」)を定める。分析部205は、同様に、相互に内容が異なる明細書の重要語句の数が所定数を超える場合には、重要語句の優先順位に基づいて、明細書の重要語句のうち所定数を超えない分の各重要語句には相互に異なる識別コード(例えば「B1」~「B500」)を定め、所定数を超える分の各重要語句は相互に区別せずにその各重要語句には所定の1つの識別コード(例えば「B999」)を定める。重要語句の優先順位は、例えば、重要語句の重要度又は属性情報(例えば初出行番号)に基づいて定められ、重要語句の識別コードには優先順位に従った順の通番が含まれる。分析部205は、重要語句抽出部2051により抽出された重要語句についての識別コードにおける通番部分として、例えば、重要語句の初出行番号の小さい順に定めた通番を採用し得る。 The key phrase identification information is, for example, an identification code such as a number determined to be different for each of a plurality of key phrases having different contents (that is, character strings). More specifically, the key phrase identification information includes, for example, an identification sign that distinguishes key phrases extracted from the claims of the invention document and key phrases that are not extracted from the claims of the invention document, and the same identification sign. It is an identification code including a serial number for important phrases. The key phrases extracted from the claims of the invention document can also be extracted from the specification of the invention document, and are hereinafter also referred to as the key phrases of the claims. Further, important words and phrases that are not extracted from the claims of the invention document are extracted from the specification although they are not extracted from the claims of the invention document, and are hereinafter also referred to as key words and phrases of the specification. If the number of key words and phrases of claims whose content differs from each other exceeds a predetermined number (for example, 500), the analysis unit 205 selects important words and phrases of claims that do not exceed a predetermined number based on the priority of the key words and phrases. A different identification code (for example, one of "A1" to "A500") is defined for each key phrase, and each key phrase exceeding a predetermined number is not distinguished from each other, and each key phrase has One predetermined identification code (for example, "A999") is defined. Similarly, when the number of key words in the description whose contents differ from each other exceeds a predetermined number, the analysis unit 205 determines whether the number of key words in the description does not exceed the predetermined number based on the priority of the key words. A different identification code (for example, "B1" to "B500") is assigned to each of the key phrases, and key phrases exceeding a predetermined number are not distinguished from each other, and each key phrase has a predetermined 1 code. A single identification code (for example, “B999”) is defined. The priority of important phrases is determined, for example, based on the degree of importance or attribute information (for example, first appearance number) of the important phrases, and the identification code of the important phrases includes serial numbers in order according to the priority. The analysis unit 205 can employ, for example, a serial number determined in ascending order of the first appearance number of the important phrase as the serial number part in the identification code for the important phrase extracted by the important phrase extraction unit 2051 .

重要語句の重要度は、分析部205の重要度決定部2055により定められる。 The importance of the key phrase is determined by the importance determination section 2055 of the analysis section 205 .

重要語句の属性情報は、分析部205の属性特定部2056により定められる。 The attribute information of the key phrase is determined by the attribute identification unit 2056 of the analysis unit 205. FIG.

重要語句の翻訳語候補集合は、例えば、重要語句を所定の翻訳先言語に翻訳した語句である対応翻訳語の候補となる語句の集合であり、分析部205の翻訳部2054において定められる。 The translation word candidate set of key words is, for example, a set of words that are candidates for corresponding translation words, which are words in which the key words are translated into a predetermined translation target language, and is determined by the translation unit 2054 of the analysis unit 205 .

重要語句の対応翻訳語は、例えば、重要語句の翻訳語候補集合のうち、発明文書分析システム20のユーザにより選択された語句である。 The corresponding translated word of the key phrase is, for example, a phrase selected by the user of the invention document analysis system 20 from among the candidate translation word set of the key phrase.

重要語句抽出部2051により発明文書から抽出された各重要語句は、発明文書分析システム20において、例えば重要語句管理情報を参照することで、各種処理に利用される。例えば、発明文書分析システム20は、発明文書から抽出された各重要語句に関する情報を含む特許出願関連情報を出力する。分析部205では、出力部208により出力されることとなる特許出願関連情報に含まれる各種情報を、翻訳部2054、要素間関係判別部2058、警告情報生成部2059、クレーム情報生成部205a、明細書情報生成部205b、クレームツリー生成部205c等において生成する。 Each key phrase extracted from the invention document by the key phrase extraction unit 2051 is used in various processes in the invention document analysis system 20 by referring to, for example, the key phrase management information. For example, the invention document analysis system 20 outputs patent application related information including information about each key phrase extracted from the invention document. The analysis unit 205 converts various types of information included in the patent application related information to be output by the output unit 208 into a translation unit 2054, an inter-element relationship determination unit 2058, a warning information generation unit 2059, a claim information generation unit 205a, a specification It is generated by the document information generation unit 205b, the claim tree generation unit 205c, and the like.

[3-1-5-2.属性特定部]
属性特定部2056は、重要語句抽出部2051により発明文書から抽出された各重要語句についての属性を特定する。属性特定部2056は、例えば、各重要語句について特定した属性を反映するように、分析部205が保持する重要語句管理情報の属性情報を更新する。属性特定部2056は、例えば、重要語句についての各種属性を特定することで、重要語句管理情報の属性情報の各種属性に対応する各項目を更新する。分析部205の各部は、例えば、重要語句管理情報の属性情報を参照することで、発明文書から抽出された各重要語句の属性情報を利用し得る。
[3-1-5-2. Attribute identification part]
The attribute identification unit 2056 identifies the attribute of each key phrase extracted from the invention document by the key phrase extraction unit 2051 . The attribute identification unit 2056 updates the attribute information of the key phrase management information held by the analysis unit 205 so as to reflect the attribute specified for each key phrase, for example. The attribute identification unit 2056 updates each item corresponding to the various attributes of the attribute information of the important phrase management information, for example, by identifying various attributes of the important phrase. Each part of the analysis unit 205 can use the attribute information of each key phrase extracted from the invention document, for example, by referring to the attribute information of the key phrase management information.

図19は、重要語句管理情報における重要語句の属性情報の項目の一例を示す。図19に例示する重要語句の属性情報は、「初出行番号」の項目、「初出クレーム番号」の項目、「定義クレーム番号集合及び参照クレーム番号集合」の項目、「クレームの請求対象の要素を表すか否か」の項目、「符号」の項目、「発明文書全体、クレーム部分、明細書部分及び発明実施形態部分での使用数」の項目、「主語としての使用の有無」の項目、「重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係」の項目、「技術用語特有語尾文字列を有するか否か」の項目、「重要語句設定辞書に含まれる語句か否か」の項目、「重要語句の文字数」の項目、及び、「低重要語句か否か及び低重要語尾文字列を含むか否か」の項目を含む。 FIG. 19 shows an example of items of attribute information of important phrases in the important phrase management information. The attribute information of key phrases illustrated in FIG. item of whether or not to express", item of "sign", item of "number of uses in the whole invention document, claim part, specification part and invention embodiment part" item, "whether or not it is used as a subject" item, " Structural inclusive relationship between elements represented by key words and elements represented by other key words" item, item "whether or not there is a technical term-specific ending character string", item "whether the word is included in the key word setting dictionary item "whether or not", item "number of characters in important phrase", and item "whether or not it is a low-key phrase and whether or not it contains a low-key word ending character string".

以下、図19に例示する重要語句の属性情報の各項目について説明する。この属性情報は、発明文書から、重要語句抽出部2051により抽出された重要語句各々について定められており、各項目は、対応する重要語句の属性の1つを示す。属性特定部2056は、各重要語句について、発明文書からのその重要語句に関連する記載部分の検索等の処理を行うことによって、その重要語句の各属性、つまり、その重要語句の属性情報の各項目の内容を、特定する。 Each item of the attribute information of the important phrase illustrated in FIG. 19 will be described below. This attribute information is defined for each key phrase extracted from the invention document by the key phrase extraction unit 2051, and each item indicates one of the attributes of the corresponding key phrase. The attribute specifying unit 2056 performs processing such as retrieving description parts related to the key phrase from the invention document for each key phrase, thereby obtaining each attribute of the key phrase, that is, each of the attribute information of the key phrase. Identifies the content of the item.

重要語句の一属性としての「初出行番号」の項目は、発明文書の各行について記載順に定めた通番のうち、その重要語句が発明文書に記載された最先の行の番号を示す。「初出行番号」の項目は、別の一例としては、その重要語句が発明文書のクレームに記載された最先の行の番号を示し、その重要語句がクレームに記載されていない場合においては、その重要語句が発明文書の明細書に記載された最先の行の番号を示すこととしてもよい。 The item "first appearance line number" as one attribute of the key phrase indicates the number of the first line in which the key phrase is described in the invention document among the serial numbers determined for each line of the invention document in the order of description. As another example, the item "First appearance number" indicates the number of the first line in which the key phrase is stated in the claim of the invention document, and when the key phrase is not stated in the claim, The key phrase may indicate the number of the first line described in the specification of the invention document.

重要語句の一属性としての「初出クレーム番号」の項目は、その重要語句が記載された発明文書のクレームの項のうち最先の項の項番(例えば請求項の番号)を示し、その重要語句が発明文書のクレームに記載されていないものである場合には、例えば、クレームの項番以外の番号(例えば0)を示す。ここでは、重要語句が発明文書のクレームに記載されていないものである場合にその重要語句の一属性としての「初出クレーム番号」が0であるものとして説明を続ける。これにより、「初出クレーム番号」の項目の内容により、その重要語句が、クレームの重要語句か否か(つまりクレームに記載されたものか否か)を識別することができる。クレームの重要語句(つまりクレームに記載された重要語句)は、明細書の重要語句(つまりクレームに記載されていない重要語句)より、比較的重要性が高い語句である可能性がある。また、重要語句が記載されたクレームの最先の項の項番が0以外で相対的に小さい重要語句は、相対的に概念上の上位の事項を示す語句である可能性が多少あり得る。 The item of "first appearance claim number" as an attribute of a key phrase indicates the number of the first claim (for example, the claim number) of the claims of the invention document in which the key phrase is described, If the word is not stated in the claims of the invention document, for example, a number other than the claim number (eg, 0) is indicated. Here, the explanation will be continued assuming that the "first appearance claim number" as one attribute of the key phrase is 0 when the key phrase is not described in the claim of the invention document. As a result, it is possible to identify whether or not the key phrase is the key phrase of the claim (that is, whether or not it is described in the claim) based on the contents of the item "first-appearing claim number". A key phrase of a claim (ie, a key phrase in a claim) may be a phrase of relatively higher importance than a key phrase of a specification (ie, a key phrase that is not in a claim). In addition, there is a slight possibility that a relatively small key word with a relatively small item number other than 0 in the first item of a claim in which the key word is described may be a word that indicates a relatively high-level item in terms of concept.

重要語句の一属性としての「定義クレーム番号集合及び参照クレーム番号集合」の項目は、その重要語句が記載された発明文書のクレームの項の項番を要素とする集合を示す。参照クレーム番号集合は、参照文字列(例えば、条件情報における参照文字列パターン情報が示す参照文字列パターンに該当する文字列)に後続してその重要語句の記載を含むクレームの項の項番を要素とする集合である。定義クレーム番号集合は、参照文字列に後続していないその重要語句の記載を含むクレームの項の項番を要素とする集合である。重要語句についての参照クレーム番号集合の要素数が0であれば、その重要語句は、クレーム中で参照文字列に後続して記載されていない語句である可能性がある。 The item of "definition claim number set and reference claim number set" as one attribute of the key phrase indicates a set whose elements are the claim numbers of the claims of the invention document in which the key phrase is described. The reference claim number set consists of the reference character string (for example, a character string corresponding to the reference character string pattern indicated by the reference character string pattern information in the condition information) followed by the claim number of the claim section containing the description of the key phrase. A set of elements. A defined claim number set is a set whose elements are the paragraph numbers of the claim paragraphs that contain the statement of the key phrase that is not followed by the reference string. If the number of elements in the referenced claim number set for a key phrase is 0, then the key phrase may be a phrase that is not listed following the reference string in the claim.

重要語句の一属性としての「クレームの請求対象の要素を表すか否か」の項目は、その重要語句が表す要素がクレームのいずれか一項における請求対象の要素であるか否かを示す情報である。 The item "whether or not it represents the claimed element of the claim" as one attribute of the key phrase is information indicating whether the element represented by the key phrase is the claimed element in any one of the claims. is.

重要語句の一属性としての「符号」の項目は、発明文書において、その重要語句に符号が付加された記載がある場合にその符号を示す。符号は、複数であってもよい。発明文書においてその重要語句に符号が付加された記載が検出できなかった場合には、符号がないことを示す。「符号」の項目が、一例として文字列で表現されるとすれば、「符号」の項目の内容は、例えば、その重要語句に符号が付加された記載がある場合にはその符号の記載そのものである文字列となり、その重要語句に符号が付加された記載が検出できなかった場合にはヌル(null)文字のみの文字列となる。また、例えば「符号」の項目が、一例として符号の文字列の集合で表現されるとすれば、その重要語句に符号が付加された記載が検出できなかった場合には、「符号」の項目の内容である文字列の集合の要素数は0となり、その重要語句に対応する符号が存在する場合には、「符号」の項目の内容である文字列の集合の要素数は1以上となる。これにより、「符号」の項目の内容により、その重要語句に対応する符号が存在するか否かを識別することができる。発明文書において符号が付加されて記載された重要語句は、符号が付加された記載のない重要語句より、比較的重要性が高い語句である可能性がある。重要語句の一属性としての「符号」の項目は、更に、発明文書の明細書において、その重要語句に符号が付加された記載がある場合にその符号を示し、更に、発明文書の明細書において、その重要語句に符号が付加された記載と符号が付加されていない記載とが混在する場合にその混在の旨を示すこととしてもよい。属性特定部2056は、重要語句抽出部2051により抽出された各重要語句について、発明文書、或いは、発明文書の明細書から、その重要語句が記載されている部分を探索し、その記載されている部分において、重要語句に符号が後続しているか否かを判別することで、その重要語句の一属性としての「符号」の項目の内容を特定し得る。 The item of "code" as one attribute of the key phrase indicates the code when there is a description with a code added to the key phrase in the invention document. Plural codes may be used. If no description with a sign added to the key phrase in the invention document is found, it means that there is no sign. If the item of "sign" is represented by a character string as an example, the content of the item of "sign" is, for example, if there is a description with a sign added to the important phrase, the description of the sign itself , and if a description with a code attached to the important phrase cannot be detected, the character string is made up of only null characters. Also, for example, if the item "sign" is represented by a set of character strings of the sign as an example, if the description with the sign added to the important phrase cannot be detected, the item "sign" The number of elements in the set of character strings that are the contents of is 0, and if there is a code corresponding to the key phrase, the number of elements in the set of character strings that are the contents of the "Code" item is 1 or more . As a result, it is possible to identify whether or not there is a code corresponding to the key phrase based on the content of the item "Code". An important phrase written with a code added in an invention document may be a phrase of relatively higher importance than an unwritten important phrase with a code added. The item of "sign" as an attribute of the key phrase further indicates the sign if there is a description with a sign added to the key phrase in the specification of the invention document, and furthermore, in the specification of the invention document , when the key words are mixed with a description with a code and a description with no code, the mixture may be indicated. For each key phrase extracted by the key phrase extraction unit 2051, the attribute specifying unit 2056 searches the invention document or the specification of the invention document for a portion where the key phrase is described, and By determining whether or not a sign follows an important phrase in a portion, the content of the item of "sign" as one attribute of the important phrase can be specified.

重要語句の一属性としての「発明文書全体、クレーム部分、明細書部分及び発明実施形態部分での使用数」の項目は、発明文書全体におけるその重要語句の記載回数、発明文書のクレームにおけるその重要語句の記載回数、発明文書の明細書におけるその重要語句の記載回数、及び、発明文書の明細書の「発明を実施するための形態」におけるその重要語句の記載回数を示す。属性特定部2056は、各重要語句の記載回数を計数することで、この項目の内容を特定する。相対的に、記載回数の多い重要語句は、重要性が高い可能性がある。 The item "Number of key words used in the entire invention document, the claim part, the specification part, and the invention embodiment part" as an attribute indicates the number of times the key word is described in the entire invention document, The number of times the word is described, the number of times the key word is described in the specification of the invention document, and the number of times the key word is described in the "Mode for Carrying Out the Invention" of the specification of the invention document are shown. The attribute identification unit 2056 identifies the content of this item by counting the number of times each key phrase is described. An important phrase that is relatively frequently described may be of high importance.

重要語句の一属性としての「主語としての使用の有無」の項目は、例えば、発明文書中に、或いは、発明文書の明細書中に、その重要語句が主語として用いられた記載が含まれているか否かを示す。属性特定部2056は、例えば、発明文書中等において、その重要語句が「は」という文字の直前に配置された記載が含まれていることを検出した場合に、その重要語句が主語として用いられた記載が含まれていると判定する。この判定結果が、「主語としての使用の有無」の項目の内容として表される。なお、属性特定部2056は、例えば、その重要語句が、その「は」という文字の直前に配置された記載が含まれており、かつ、その「は」という文字が形態素解析により助詞と判別された場合に限って、その重要語句が主語として用いられた記載が含まれていると判定することとしてもよい。また、属性特定部2056は、例えば、発明文書中等において、その重要語句が、所定の文字列(例えば、「各々」、「の各々」、「夫々」等)を挟んで、その「は」という文字の前に配置された記載が含まれていることを検出した場合にも、その重要語句が主語として用いられた記載が含まれていると判定してもよい。また、ここで示した主語の後に記載される「は」という文字については、所定の助詞(例えば「が」、「も」等)、或いは、所定の連続した助詞(例えば「とは」、「には」、「では」等)等の、主語に相当する語句に後続し得る所定の文字列を、その「は」という文字と同様に扱うこととしてもよい。この場合においては、「は」という文字と同様に扱う主語に相当する語句に後続し得る所定の文字列に先行して、条件情報の重要語句候補文字列パターン情報で示された1つの重要語句候補文字列パターンに該当する文字列が発明文書中で記載されているときには、その重要語句候補文字列パターンに該当する文字列を、重要語句抽出部2051で重要語句の候補として抽出するようにするとよい。「主語としての使用の有無」の項目が主語として使用されていることを示す内容の属性を有する重要語句は、発明文書においてその語句について何らかの説明的な記載が付加された語句であると想定されるので、重要性が相対的に高い可能性が十分にある語句であることを意味し得る。 The item "whether or not it is used as a subject" as an attribute of a key phrase includes, for example, a description in which the key phrase is used as a subject in the invention document or in the specification of the invention document. indicates whether or not For example, when the attribute identification unit 2056 detects that an invention document or the like includes a description in which the key word is placed immediately before the character "ha", the key word is used as the subject. It is determined that the description is included. This determination result is shown as the content of the item "whether or not the word is used as a subject". Note that the attribute specifying section 2056 includes, for example, a description in which the key phrase is placed immediately before the character "ha", and the character "ha" is determined to be a particle by morphological analysis. It may be determined that the description using the key phrase as the subject is included only when the key phrase is used as the subject. For example, the attribute specifying unit 2056 may be configured so that, for example, in an invention document or the like, the key words are separated by a predetermined character string (for example, "each", "each of", "each", etc.). Even when it is detected that a description placed before a character is included, it may be determined that a description using that key phrase as a subject is included. In addition, the character "wa" written after the subject shown here may be a predetermined particle (for example, "ga", "mo", etc.) or a predetermined continuous particle (for example, "towa", " A predetermined character string that can follow a phrase corresponding to a subject, such as "wa", "de", etc., may be treated in the same way as the character "wa". In this case, one important phrase indicated by the important phrase candidate character string pattern information of the condition information precedes the predetermined character string that can follow the phrase corresponding to the subject treated in the same way as the character "wa". When a character string corresponding to the candidate character string pattern is described in the invention document, the character string corresponding to the important phrase candidate character string pattern is extracted as an important phrase candidate by the important phrase extraction unit 2051. good. Important words and phrases that have the content attribute indicating that the item "use as subject" is used as a subject are assumed to be words and phrases to which some kind of descriptive description has been added to the words and phrases in the invention document. Therefore, it can mean that the phrase is likely to have relatively high importance.

重要語句の一属性としての「重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係」の項目は、例えば、発明文書においてその重要語句が表す要素が、他の1つ以上の重要語句各々が表す要素を構成上包含している場合における、その被包含側の要素を表す重要語句の集合、及び、発明文書においてその重要語句が表す要素が、他の1つ以上の重要語句各々が表す要素に構成上包含されている場合における、その包含側の要素を表す重要語句の集合を示す。この各集合の要素数が0であれば、その重要語句が表す要素は、他の1つ以上の重要語句が表す要素と構成上の関係を有さないことを示すことになる。この項目は、発明文書分析システム20のユーザに、重要語句間の関係の把握を容易化させるための情報の出力等に利用可能となる。 The item "structural inclusion relationship between an element represented by a key phrase and an element represented by another key phrase" as an attribute of a key phrase is, for example, an invention document in which the element represented by the key phrase is When the elements represented by each of the above key words are structurally included, a set of key words representing the elements on the included side, and the elements represented by the key words in the invention document are one or more other Shows a set of important words and phrases representing the containing element when they are structurally included in the element represented by each of the important words and phrases. If the number of elements in each set is 0, it indicates that the element represented by the key phrase has no structural relationship with the elements represented by one or more other key phrases. This item can be used for outputting information to facilitate the user of the invention document analysis system 20 to grasp the relationship between key words.

属性特定部2056が特定する重要語句の属性情報の一属性としての項目は、上述したものに限られず、属性情報は、例えば、発明文書の明細書において、その重要語句の直前に「複数の」、「1つ以上の」、「1つの」等といった数を表す文字列が付加された1つ以上の記載が含まれている場合に、その各記載から数を表す文字列を要素とする集合である数集合を示す、「数」に係る項目を一属性として含んでもよい。また、属性情報は、例えば設定情報におけるカテゴリー区分基準情報に即して定められる、重要語句のカテゴリーを示す項目(例えば重要語句が物、方法、プログラム等の複数の種別のいずれに属するかを示す項目)を一属性として含んでもよい。 Items as one attribute of the attribute information of the key phrase specified by the attribute specifying unit 2056 are not limited to those described above. , ``one or more'', ``one'', etc., to which a character string representing a number is added, a set whose elements are character strings representing numbers from each description An item related to "number", which indicates a set of numbers, may be included as one attribute. In addition, the attribute information is, for example, an item indicating the category of key phrases (for example, indicating which of a plurality of types such as product, method, program, etc. the key phrase belongs to), which is determined in accordance with the category division criteria information in the setting information. item) may be included as an attribute.

属性特定部2056は、要素間関係判別部2058に包含関係判別処理を実行させることで、複数の重要語句各々が表す要素の間に存在する構成上の包含関係を、発明文書の各行の記載内容に基づいて、判別させる。なお、物に分類される複数の重要語句が表す要素間に構成上の包含関係が存在し得るのみならず、方法、プログラム、データ等といった物以外に分類される複数の重要語句が表す要素間に構成上の包含関係が存在し得ることとしてもよい。例えば、重要語句が表す方法の要素としての「制御方法」が、重要語句が表す方法の要素としての「第1制御手順」、「第2制御手順」等を構成上包含することがあり得るとしてもよい。 The attribute identification unit 2056 causes the inter-element relation determination unit 2058 to execute inclusion relation determination processing, thereby determining the compositional inclusion relation existing between the elements represented by each of the key words and phrases as described in each line of the invention document. Determine based on. Not only can there be structural inclusion relationships between elements represented by multiple important terms classified as products, may have a compositional containment relationship. For example, the "control method" as an element of the method represented by the key phrase may include "first control procedure", "second control procedure", etc. as elements of the method represented by the key phrase. good too.

そして、属性特定部2056は、要素間関係判別部2058の包含関係判別処理による判別結果に応じて、各重要語句について、その重要語句の一属性としての、被包含側に係る重要語句の集合、及び、包含側に係る重要語句の集合を特定する。 Then, the attribute specifying unit 2056 determines, for each important phrase, a set of important phrases related to the inclusion side as one attribute of the important phrase, Then, a set of important phrases on the including side is specified.

重要語句の一属性としての「技術用語特有語尾文字列を有するか否か」の項目は、その重要語句が、予め定められた、技術用語に特有の語尾を含む技術用語特有語尾文字列を含む文字列であるか否かを示す。属性特定部2056は、その重要語句から、予め定められた技術用語特有文字列を検索する等により、この項目の内容を特定する。技術用語特有語尾文字列は、例えば、設定情報取得部201により取得される設定情報における技術用語特有語尾情報により示され得る。技術用語特有語尾情報によって適切に技術用語特有語尾文字列が定義されていることを前提とすれば、技術用語特有語尾文字列を有する重要語句は、技術面における重要性を有する可能性が十分にある語句であることを意味することになる。 The item "whether or not it has a technical term-specific ending string" as an attribute of the key phrase includes a technical term-specific ending string that includes a predetermined technical term-specific ending. Indicates whether it is a string or not. The attribute identification unit 2056 identifies the content of this item by searching for a predetermined technical term-specific character string from the important phrase. The technical term-specific ending character string can be indicated by technical term-specific ending information in the setting information acquired by the setting information acquiring unit 201, for example. Assuming that technical term-specific endings are properly defined by technical term-specific endings, key phrases with technical term-specific endings are likely to have technical significance. It means to be a phrase.

重要語句の一属性としての「重要語句設定辞書に含まれる語句か否か」の項目は、その重要語句が重要語句設定辞書取得部203により取得された重要語句設定辞書に含まれているか否かを示す。属性特定部2056は、例えば、重要語句設定辞書取得部203により取得された重要語句設定辞書からその重要語句を検索することで、この項目の内容を特定する。発明文書分析システム20における重要語句の抽出の精度は必ずしも高くない可能性があるところ、重要語句設定辞書が例えばユーザにより選択された重要な語句を定義する状態であることを前提とした場合において、重要語句の「重要語句設定辞書に含まれるか否か」の項目の内容が重要語句設定辞書に含まれることを示すときには、その重要語句は、新たに重要語句設定辞書に登録する必要がない語句であり、また、相対的に重要性が高い可能性が十分にある語句であることを意味することになる。 The item "whether or not the key phrase is included in the key phrase setting dictionary" as one attribute of the key phrase indicates whether or not the key phrase is included in the key phrase setting dictionary acquired by the key phrase setting dictionary acquisition unit 203. indicate. The attribute identification unit 2056 identifies the content of this item by searching for the key phrase from the key phrase setting dictionary acquired by the key phrase setting dictionary acquisition unit 203, for example. There is a possibility that the accuracy of extraction of important phrases in the invention document analysis system 20 is not necessarily high. When the content of the item "whether included in the key phrase set dictionary" of the key phrase indicates that it is included in the key phrase set dictionary, the key phrase is a phrase that does not need to be newly registered in the key phrase set dictionary. , and it means that the phrase has a good chance of being relatively important.

重要語句の一属性としての「重要語句の文字数」の項目は、その重要語句の文字数を示す。例えば、仮に、参照文字列に後続しておらず符号が付加されていない語句であって文字数が1字の語句が重要語句として抽出された場合において、その重要語句は、参照文字列に後続しておらず符号が付加されていない文字数が2字以上の重要語句より重要性が低い可能性がある。また、例えば、仮に、参照文字列に後続しておらず符号が付加されていない語句であって文字数が2字の語句が重要語句として抽出された場合において、その重要語句は、参照文字列に後続しておらず符号が付加されていない文字数が3字以上の重要語句より重要性が低い可能性がある。 The item "Number of characters of key phrase" as one attribute of the key phrase indicates the number of characters of the key phrase. For example, if a word or phrase that does not follow the reference character string and is not marked with a sign and has one character is extracted as an important phrase, the important phrase will not follow the reference character string. It may be less important than key phrases with two or more characters that are unsigned and unsigned. Also, for example, if a word or phrase that does not follow the reference character string and is not marked with a sign and has two letters is extracted as an important word or phrase, the important word or phrase is added to the reference character string. It may be less important than key phrases with 3 or more characters that are not followed and have no sign added.

重要語句の一属性としての「低重要語句か否か及び低重要語尾文字列を含むか否か」の項目は、その重要語句が、予め定められた所定の低重要語句(例えば、「形態」、「力」等)と同一の語句であるか否かと、予め定められた所定の低重要語尾文字列を語尾に含む語句であるか否かとを示す。この項目の内容が、その重要語句が、低重要語句と同一の語句であること又は低重要語尾文字列を語尾に含む語句であることを示す場合には、その重要語句の重要度が相対的に低い可能性がある。 The item "whether or not it is a low-key phrase and whether or not it contains a low-key ending character string" as one attribute of a key phrase indicates that the key phrase is a predetermined low-key phrase (for example, "morphology"). , “strength”, etc.), and whether the word includes a predetermined low-importance ending character string at the end of the word. If the content of this item indicates that the important phrase is the same as a low-important phrase or a phrase that includes a low-important ending character string, the importance of the important phrase is relative. is likely to be low.

[3-1-5-3.重要度決定部]
重要度決定部2055は、重要語句抽出部2051により発明文書から抽出された各重要語句についての重要度を決定する。重要度決定部2055は、例えば、発明文書のクレーム部分及び明細書部分から抽出された各重要語句について、属性特定部2056により特定されたその重要語句の属性情報に基づいて、重要度を決定する。重要度決定部2055は、例えば、クレームの請求対象の要素を表す重要語句の重要度を比較的高く決定してもよいし、発明文書において主語としての使用された記載がある重要語句の重要度を比較的高く決定してもよいし、所定の低重要語句と同一か所定の低重要語尾文字列を含む重要語句の重要度を比較的低く決定してもよい。重要度決定部2055は、単に重要語句候補文字列パターンに該当するだけにより抽出された重要語句については、重要度を比較的低く決定してもよい。
[3-1-5-3. Importance determination section]
The importance determining section 2055 determines the importance of each important phrase extracted from the invention document by the important phrase extracting section 2051 . The importance determining unit 2055 determines the importance of each important phrase extracted from the claim part and the specification part of the invention document, for example, based on the attribute information of the important phrase specified by the attribute specifying unit 2056. . The importance determining unit 2055 may, for example, determine a relatively high degree of importance of important words and phrases representing elements of claims, or may set the importance of important words and phrases that are used as subjects in invention documents. may be determined to be relatively high, or the importance of an important phrase that is the same as a predetermined low-important phrase or that includes a predetermined low-important ending character string may be determined to be relatively low. The importance level determination unit 2055 may determine a relatively low level of importance for an important word/phrase that is extracted simply because it corresponds to an important word/phrase candidate character string pattern.

重要度決定部2055は、例えば、各重要語句について決定した重要度を反映するように、分析部205が保持する重要語句管理情報を更新する。 The importance determination unit 2055 updates the important phrase management information held by the analysis unit 205 so as to reflect the importance determined for each important phrase, for example.

以下、重要度決定部2055による各重要語句の重要度の決定の一例として、クレームの重要語句(つまりクレームに記載された重要語句)と、明細書の重要語句(つまりクレームに記載されておらず明細書に記載された重要語句)とを区別して各重要語句の重要度の決定をする例について説明する。ここでは、重要度の値は、大きいほど、重要度が高いことを示すものとして説明する。 Hereinafter, as an example of determining the importance of each key phrase by the importance determining unit 2055, the key phrase of the claim (that is, the important phrase described in the claim) and the important phrase of the specification (that is, not described in the claim) An example of determining the importance of each key phrase by distinguishing it from the key phrase described in the specification will be described. Here, it is assumed that the larger the importance value, the higher the importance.

[3-1-5-3-1.クレームに記載された重要語句の重要度の決定]
発明文書のクレームから重要語句抽出部2051により抽出された各重要語句について、まず、重要度決定部2055は、重要度の初期値として第1所定値(例えば「3」)を設定する。そして、重要度決定部2055は、その各重要語句について、その重要語句の属性情報に基づいて、その重要語句についての設定済みの重要度の値を増減させる。重要度決定部2055が、クレームの重要語句についての重要度の値を増減させる場合に、上限値(例えば5)と下限値(例えば0)とを予め定めておいてもよい。
[3-1-5-3-1. Determining the Importance of Key Phrases in Claims]
For each important phrase extracted by the important phrase extraction unit 2051 from the claim of the invention document, the importance determination unit 2055 first sets a first predetermined value (for example, "3") as an initial value of importance. Then, the importance determining unit 2055 increases or decreases the value of the set importance of each important phrase based on the attribute information of the important phrase. When the importance determining unit 2055 increases or decreases the importance of the important phrase of the claim, an upper limit (eg 5) and a lower limit (eg 0) may be set in advance.

重要度決定部2055は、例えば、重要語句の一属性としての「初出クレーム番号」の項目の内容が、0以外で定数値(例えば5)より小さい場合には、その重要語句についての設定済みの重要度の値を1増加させる。この定数値は、例えば、全クレーム数の半分等といった変数値であってもよい。また、相違する値の複数のその定数値毎に重要度の値を増加させる分量を、例えばその定数値が小さい程大きい分量となるように、異ならせてもよい。 For example, when the content of the item "first-appearance claim number" as one attribute of the important phrase is smaller than a constant value (for example, 5) other than 0, the importance determining unit 2055 Increase the importance value by 1. This constant value may be a variable value, such as, for example, half of the total number of claims. Also, the amount by which the value of importance is increased for each of a plurality of different constant values may be made different, for example, such that the smaller the constant value, the greater the amount.

重要度決定部2055は、例えば、重要語句の一属性としての「定義クレーム番号集合及び参照クレーム番号集合」の項目の内容における参照クレーム番号集合の要素数が1以上である場合には、その重要語句についての設定済みの重要度の値を1増加させる。 For example, when the number of elements of the reference claim number set in the content of the item "definition claim number set and reference claim number set" as one attribute of the important phrase is 1 or more, the importance determination unit 2055 Increment the preset importance value for the phrase by one.

重要度決定部2055は、例えば、重要語句の一属性としての「主語としての使用の有無」の項目の内容が主語としての使用があることを示す場合には、その重要語句についての設定済みの重要度の値を1増加させる。 For example, when the content of the item "whether used as a subject" as one attribute of an important phrase indicates that it is used as a subject, the importance determining unit 2055 Increase the importance value by 1.

重要度決定部2055は、例えば、重要語句の一属性としての「技術用語特有語尾文字列を有するか否か」の項目の内容が技術用語特有語尾文字列を有することを示す場合には、その重要語句についての設定済みの重要度の値を1増加させる。 For example, if the content of the item "whether or not there is a technical term-specific ending string" as one attribute of the important phrase indicates that it has a technical term-specific ending string, the importance determining unit 2055 Increase the preset importance value for key phrases by one.

重要度決定部2055は、例えば、重要語句の一属性としての「重要語句設定辞書に含まれる語句か否か」の項目の内容が重要語句設定辞書に含まれる語句であることを示す場合には、その重要語句についての設定済みの重要度の値を1増加させる。 For example, when the content of the item "whether or not the word is included in the important phrase setting dictionary" as one attribute of the important phrase indicates that the phrase is included in the important phrase setting dictionary, the importance determining unit 2055 , increments the preset importance value for that keyword by one.

なお、重要度決定部2055が、重要語句の属性情報の項目に対応して重要語句の設定済みの重要度の値を増加させる分量については、全て1に統一される必要はなく、項目毎に異なる分量であってもよい。 It should be noted that the amount by which the importance determination unit 2055 increases the value of the set importance of the important phrase corresponding to the item of the attribute information of the important phrase does not need to be unified to 1. Different amounts are possible.

重要度決定部2055が、重要語句の属性情報の項目に対応して重要語句の設定済みの重要度の値を所定の分量だけ減少させることとしてもよい。 The importance determining unit 2055 may decrease the set importance of the important phrase by a predetermined amount corresponding to the item of the attribute information of the important phrase.

重要度決定部2055は、例えば、重要語句の一属性としての「低重要語句か否か及び低重要語尾文字列を含むか否か」の項目の内容が、低重要語句であること又は低重要語尾文字列を含むことを示す場合には、その重要語句についての設定済みの重要度の値を1減少させる。 For example, the importance determining unit 2055 determines whether the content of the item "whether it is a low-important phrase and whether it includes a low-importance ending character string" as one attribute of the important phrase is a low-importance phrase or a low-importance phrase. If it indicates that a word ending character string is included, the preset importance value for the important phrase is decreased by one.

重要度決定部2055が例えば上述したような重要語句の属性情報の幾つかの項目に応じた重要度の更新(例えば増減)を行ったことの最終的な結果としての重要度が、その重要語句の重要度として決定されたことになる。 The importance as a final result of the importance determination unit 2055 updating (for example, increasing or decreasing) the importance according to several items of the attribute information of the important phrase as described above, for example, is the importance of the important phrase. is determined as the importance of

[3-1-5-3-2.クレームに記載されておらず明細書に記載された重要語句の重要度の決定]
発明文書の明細書から重要語句抽出部2051により抽出された各重要語句のうち、クレームに記載されていない重要語句について、まず、重要度決定部2055は、重要度の初期値として第2所定値(例えば「1」)を設定する。第2所定値は、例えば、クレームに記載された重要語句の重要度の初期値としての第1所定値以下の値である。そして、重要度決定部2055は、その各重要語句について、その重要語句の属性情報に基づいて、その重要語句についての設定済みの重要度の値を増減させる。重要度決定部2055が、明細書の重要語句についての重要度の値を増減させる場合に、例えば、クレームの重要語句とは異なり得る、上限値(例えば4)と下限値(例えば0)とを予め定めておいてもよい。
[3-1-5-3-2. Determining the Importance of Key Terms in the Specification Not in Claims]
Of the important phrases extracted by the important phrase extraction unit 2051 from the specification of the invention document, for the important phrases not described in the claims, the importance determination unit 2055 first determines the second predetermined value as the initial value of the importance. (for example, "1"). The second predetermined value is, for example, a value equal to or less than the first predetermined value as the initial value of the degree of importance of the key words in the claims. Then, the importance determining unit 2055 increases or decreases the value of the set importance of each important phrase based on the attribute information of the important phrase. When the importance determining unit 2055 increases or decreases the value of the importance of the key words in the specification, for example, the upper limit (for example, 4) and the lower limit (for example, 0), which can be different from the key words in the claims, are set. It may be determined in advance.

重要度決定部2055は、例えば、重要語句の一属性としての「符号」の項目の内容が、その重要語句に対応する符号が存在することを示す場合には、その重要語句についての設定済みの重要度の値を1増加する。 For example, when the content of the item "code" as one attribute of the important phrase indicates that there is a code corresponding to the important phrase, the importance determination unit 2055 Increase the importance value by 1.

重要度決定部2055は、例えば、重要語句の一属性としての「主語としての使用の有無」の項目の内容が主語としての使用があることを示す場合には、その重要語句についての設定済みの重要度の値を1増加する。 For example, when the content of the item "whether used as a subject" as one attribute of an important phrase indicates that it is used as a subject, the importance determining unit 2055 Increase the importance value by one.

重要度決定部2055は、例えば、重要語句の一属性としての「技術用語特有語尾文字列を有するか否か」の項目の内容が技術用語特有語尾文字列を有することを示す場合には、その重要語句についての設定済みの重要度の値を1増加させる。 For example, if the content of the item "whether or not there is a technical term-specific ending character string" as one attribute of the important phrase indicates that it has a technical term-specific ending character string, the importance determining unit 2055 Increase the preset importance value for key phrases by one.

重要度決定部2055は、例えば、重要語句の一属性としての「重要語句設定辞書に含まれる語句か否か」の項目の内容が重要語句設定辞書に含まれる語句であることを示す場合には、その重要語句についての設定済みの重要度の値を1増加させる。 For example, when the content of the item "whether or not the word is included in the important phrase setting dictionary" as one attribute of the important phrase indicates that the word is included in the important phrase setting dictionary, the importance determining unit 2055 , increments the preset importance value for that keyword by one.

重要度決定部2055は、例えば、重要語句の一属性としての「発明文書全体、クレーム部分、明細書部分及び発明実施形態部分での使用数」の項目の内容としての、例えば、発明文書の明細書の「発明を実施するための形態」におけるその重要語句の記載回数が、所定の値(例えば「2」)より多いことを示す場合には、その重要語句についての設定済みの重要度の値を1増加させる。 For example, the importance determination unit 2055 determines, for example, the description of the invention document as the content of the item "the number of uses in the entire invention document, the claim part, the description part, and the invention embodiment part" as one attribute of the important phrase. If the number of mentions of the key phrase in the "Mode for Carrying out the Invention" of the document indicates that it is more than a predetermined value (e.g., "2"), the set importance value for the key phrase is incremented by 1.

重要度決定部2055は、例えば、重要語句の一属性としての「重要語句の文字数」の項目の内容が、所定の値(例えば「2」)より多いことを示す場合には、その重要語句についての設定済みの重要度の値を1増加させる。 For example, when the content of the item "number of characters in key phrase" as one attribute of the key phrase indicates that it is greater than a predetermined value (for example, "2"), the importance determining unit 2055 increases the value of the configured importance of .

重要度決定部2055は、例えば、重要語句の一属性としての「低重要語句か否か及び低重要語尾文字列を含むか否か」の項目の内容が、低重要語句であること又は低重要語尾文字列を含むことを示す場合には、その重要語句についての設定済みの重要度の値を1減少させる。なお、重要度決定部2055は、例えば、重要語句の一属性としての「低重要語句か否か及び低重要語尾文字列を含むか否か」の項目の内容が、低重要語句であること又は低重要語尾文字列を含むことを示す場合には、その重要語句についての設定済みの重要度の値を「0」へと更新することとしてもよい。 For example, the importance determining unit 2055 determines whether the content of the item “whether it is a low-important phrase and whether it includes a low-importance ending character string” as one attribute of the important phrase is a low-importance phrase or a low-importance phrase. If it indicates that a word ending character string is included, the preset importance value for the important phrase is decreased by one. For example, the importance determining unit 2055 determines whether the content of the item "whether it is a low-key phrase and whether it includes a low-key ending character string" as one attribute of the key phrase is a low-key phrase, or In the case of indicating that a low important ending character string is included, the set importance value of the important phrase may be updated to "0".

重要度決定部2055が例えば上述したような重要語句の属性情報の幾つかの項目に応じた重要度の更新(例えば増減)を行ったことの最終的な結果としての重要度が、その重要語句の重要度として決定されたことになる。 The importance as a final result of the importance determination unit 2055 updating (for example, increasing or decreasing) the importance according to several items of the attribute information of the important phrase as described above, for example, is the importance of the important phrase. is determined as the importance of

[3-1-5-3-3.重要語句について決定した重要度の更新]
重要度決定部2055は、例えば、各重要語句について一旦決定した重要度を、更に更新することで、最終的な決定を行うこととしてもよい。
[3-1-5-3-3. Update the importance determined for key words]
For example, the importance determination unit 2055 may make a final determination by further updating the once-determined importance of each important phrase.

以下、重要度決定部2055による、一旦決定した重要度の更なる更新の一例について説明する。 An example of further updating of once determined importance by the importance determining unit 2055 will be described below.

重要度決定部2055は、各重要語句の重要度を一旦決定した後において、各重要語句が表す各要素の相互間における構成上の包含関係について、包含側の要素に係る重要語句の重要度を、その重要語句が表す要素に包含される全ての被包含側の要素に係る各重要語句についての重要度のうちで最高値の重要度の値と、同一以上の値となるように、更に更新する。なお、要素間の構成上の包含関係は、要素間関係判別部2058の包含関係判別処理により判別される。 After once determining the importance of each key phrase, the importance determining unit 2055 determines the importance of the key phrase related to the inclusive element in relation to the structural inclusion relationship between the elements represented by each key phrase. , is further updated so that it is equal to or greater than the highest importance value among the importance levels for each key phrase related to all included elements contained in the element represented by the key phrase. do. The structural inclusion relationship between elements is determined by the inclusion relationship determination processing of the element relationship determination unit 2058 .

この例においては、例えば、重要度が「4」と一旦決定された重要語句「センサ」が表す要素と、重要度が「2」と一旦決定された重要語句「操作受付部」が表す要素との2つの要素を、構成上包含する要素を表す重要語句「入力部」の重要度が「2」と一旦決定されていた場合において、重要度決定部2055は、重要語句「入力部」の重要度を「2」から「4」へと更新することになる。これにより、構成上の包含関係を有する要素間における被包含側の要素群に係る重要語句のうち重要度が一旦最も高く決定された重要語句の重要度が、最終的には、包含側の要素に係る重要語句の重要度へ伝播されることになる。 In this example, for example, an element represented by the key word "sensor" whose importance is once determined to be "4" and an element represented by the key word "operation reception unit" whose importance is once determined to be "2" When the importance level of the important phrase "input part" representing an element that structurally includes the two elements of is once determined to be "2", the importance level determination unit 2055 The degree will be updated from "2" to "4". As a result, the importance of the important phrase once determined to have the highest importance among the important phrases related to the included element group between the elements having the structural inclusion relationship is finally transferred to the containing element. It will be propagated to the importance of the important phrase related to.

[3-1-5-4.要素間関係判別部]
要素間関係判別部2058は、発明文書から重要語句抽出部2051により抽出された重要語句各々が表す要素間の関係について判別する要素間関係判別処理を行う。要素間関係判別部2058は、重要語句各々が表す要素間の関係の判別結果を示す重要語句関係情報を生成する。要素間関係判別部2058による判別結果を受けて、属性特定部2056が、判別結果に関連する重要語句各々についての属性情報を特定する。
[3-1-5-4. Inter-element relationship determination unit]
The inter-element relation determination unit 2058 performs inter-element relation determination processing for determining the relation between elements represented by each of the key phrases extracted by the key phrase extraction unit 2051 from the invention document. The inter-element relationship determination unit 2058 generates important phrase relationship information indicating the determination result of the relationship between elements represented by each of the important phrases. Upon receiving the determination result by the inter-element relation determination unit 2058, the attribute identification unit 2056 identifies attribute information for each important phrase related to the determination result.

[3-1-5-4-1.構成上の包含関係を有する複数の要素の判別]
要素間関係判別部2058は、発明文書から重要語句抽出部2051により抽出された重要語句各々が表す要素間が構成上の包含関係を有することについて判別する包含関係判別処理を実行する。要素間関係判別部2058による包含関係判別処理の結果に基づいて、属性特定部2056は、重要語句の一属性としての「重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係」の項目の内容を特定する。
[3-1-5-4-1. Discrimination of Multiple Elements Having Compositional Inclusion Relationship]
The inter-element relationship determination unit 2058 executes inclusion relationship determination processing for determining whether or not the elements represented by the key phrases extracted from the invention document by the key phrase extraction unit 2051 have structural inclusion relationships. Based on the result of the inclusion relationship determination processing by the inter-element relationship determination unit 2058, the attribute identification unit 2056 determines “structural inclusion of the element represented by the key phrase and the element represented by another key phrase” as one attribute of the key phrase. Identifies the content of the "Relationships" item.

要素間関係判別部2058による包含関係判別処理は、例えば、発明文書から、一の重要語句が表す要素が他の重要語句が表す要素を包含することを示す所定の包含記載パターンに該当する記載を探索することにより実現される。所定の包含記載パターンは、設定情報取得部201により取得される設定情報に含まれることとしてもよい。 Inclusion relationship determination processing by the inter-element relationship determination unit 2058 includes, for example, a description corresponding to a predetermined inclusion description pattern indicating that an element represented by one key phrase includes an element represented by another key phrase from the invention document. It is realized by searching. The predetermined inclusion description pattern may be included in the setting information acquired by the setting information acquisition unit 201 .

所定の包含記載パターンに該当する記載の例としては、一の重要語句が主語として格助詞「は」に先行している文において、他の重要語句が、包含することを表す所定の包含記載文字列(例えば「を備える」、「を含む」、「を含んでいる」等)の直前に存在するような記載、或いは、他の重要語句が所定の包含記載文字列の直前に存在し、一の重要語句がその所定の包含記載文字列の直後に存在するような記載等が挙げられる。所定の包含記載文字列として、包含することを表すと想定される如何なる文字列を定めてもよい。また、この所定の包含記載パターンに該当する記載の例における、他の重要語句は、複数の重要語句が、並列又は選択を表す接続詞、要素を繋ぐ所定の助詞「と」、読点文字「、」等を挟んで列挙されているものであってもよい。所定の包含記載文字列は、受動態のような表現(例えば、「に備えられる」、「に含まれる」等であってもよく、この表現に対応して更なる所定の包含記載パターンが定められてもよい。 As an example of a description corresponding to a predetermined inclusion description pattern, in a sentence in which one key phrase precedes the case particle "ha" as a subject, another key phrase is a predetermined inclusion description character indicating inclusion A statement such that it immediately precedes a string (e.g., "comprises," "includes," "contains," etc.) or other key terms immediately precedes a given inclusion statement string and is present immediately after the predetermined inclusion description character string. Any string that is assumed to represent inclusion may be defined as the pre-determined inclusion description string. In addition, other key phrases in examples of descriptions corresponding to this predetermined inclusion description pattern are conjunctions in which a plurality of key phrases express parallelism or selection, predetermined particles "to" connecting elements, comma characters "," etc. may be enumerated. The predetermined inclusion description string may be a passive-like expression (e.g., "provided in", "included in", etc., for which a further predetermined inclusion description pattern is defined). may

具体例を挙げると、要素間関係判別部2058は、発明文書中の「センサと操作受付部とを含む入力部」という記載は、所定の包含記載パターンに該当するので、重要語句「入力部」が表す要素が、構成上、重要語句「センサ」が表す要素と重要語句「操作受付部」が表す要素とを包含すると判別する。この判別結果を受けて、属性特定部2056では、重要語句「入力部」の一属性としての「重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係」の項目の被包含側の要素を表す重要語句の集合の要素として、重要語句「センサ」と、重要語句「操作受付部」とを含ませる。 To give a specific example, the inter-element relationship determination unit 2058 determines that the description "input unit including a sensor and an operation reception unit" in the invention document corresponds to a predetermined inclusion description pattern, so that the important phrase "input unit" is determined to include the element represented by the important phrase "sensor" and the element represented by the important phrase "operation reception unit" in terms of structure. In response to this determination result, the attribute specifying unit 2056 determines whether the item "structural inclusion relationship between elements represented by key words and elements represented by other key words" as one attribute of the key words "input part" is included. The important phrase "sensor" and the important phrase "operation reception unit" are included as elements of the set of important phrases representing the elements on the containing side.

また、別の具体例を挙げると、要素間関係判別部2058は、発明文書中の「情報処理装置は、入力部と記憶部と表示情報生成部と表示部を含む」という記載は、所定の包含記載パターンに該当するので、重要語句「情報処理装置」が表す要素が、構成上、重要語句「入力部」が表す要素と、重要語句「記憶部」が表す要素と、重要語句「表示情報生成部」が表す要素と、重要語句「表示部」が表す要素とを包含すると判別する。この判別結果を受けて、属性特定部2056では、例えば、重要語句「入力部」の一属性としての「重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係」の項目の包含側の要素を表す重要語句の集合の要素として、重要語句「情報処理装置」を含ませる。また、属性特定部2056は、例えば、重要語句「情報処理装置」の一属性としての「重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係」の項目の被包含側の要素を表す重要語句の集合の要素として、重要語句「入力部」、重要語句「記憶部」、重要語句「表示情報生成部」及び重要語句「表示部」を含ませる。 Further, to give another specific example, the inter-element relation determination unit 2058 determines that the description in the invention document that "the information processing apparatus includes an input unit, a storage unit, a display information generation unit, and a display unit" Since it corresponds to the inclusion description pattern, the element represented by the important phrase "information processing device" is structurally composed of the element represented by the important phrase "input section", the element represented by the important phrase "storage section", and the important phrase "display information". It is determined that the element represented by the "generation part" and the element represented by the important phrase "display part" are included. In response to this determination result, the attribute specifying unit 2056, for example, selects an item of "structural inclusive relationship between elements represented by key words and elements represented by other key words" as one attribute of the key words "input part". The important phrase "information processing device" is included as an element of the set of important phrases representing the elements on the including side of . For example, the attribute specifying unit 2056 is included on the item of "structural inclusion relationship between an element represented by a key term and an element represented by another key term" as one attribute of the key term "information processing apparatus". As the elements of the set of important phrases representing the elements of , the important phrase "input section", the important phrase "storage section", the important phrase "display information generating section" and the important phrase "display section" are included.

包含関係判別処理において、要素間関係判別部2058は、発明文書の各行において、包含関係を表す所定の包含記載文字列以外に相当する動詞(例えば、「検知する」、「受け付ける」等)の目的語を、所定の包含記載パターンに該当する記載の探索対象範囲から除外してもよい。即ち、要素間関係判別部2058は、発明文書の各行において、行の探索開始部分から所定の包含記載文字列以外に相当する動詞の部分までを除いて、残りの部分から、一の重要語句が表す要素が他の重要語句が表す要素を包含することを示す所定の包含記載パターンに該当する記載(例えば、他の重要語句が所定の包含記載文字列の直前に存在し、一の重要語句がその所定の包含記載文字列の直後に存在するような記載)を探索することで、複数の重要語句が表す要素間の包含関係を判別してもよい。これにより、要素間関係判別部2058は、例えば、発明文書中の「音声を検知するセンサと、ユーザの操作を受け付ける操作受付部とを含む入力部」という記載に基づいて、「音声」、「ユーザ」、「操作」等が重要語句であったとしてもこれらを除外して、重要語句「入力部」が表す要素が、構成上、重要語句「センサ」が表す要素と重要語句「操作受付部」が表す要素とを包含すると判別し得る。 In the inclusion relationship determination process, the inter-element relationship determination unit 2058 determines the purpose of verbs (e.g., "detect", "accept", etc.) other than the predetermined inclusion description character string representing the inclusion relationship in each line of the invention document. Words may be excluded from the search range for statements that fall within a predetermined inclusion statement pattern. That is, in each line of the invention document, the inter-element relation determination unit 2058 removes the search start portion of the line to the verb portion corresponding to the character string other than the predetermined inclusion description character string, and extracts one key phrase from the remaining portion. Description corresponding to a predetermined inclusion description pattern indicating that the represented element includes the element represented by another key phrase (for example, another key phrase exists immediately before a predetermined inclusion description character string, and one key phrase is By searching for a description that exists immediately after the predetermined inclusion description character string, the inclusion relationship between elements represented by multiple important phrases may be determined. As a result, the inter-element relationship determining unit 2058 can, for example, determine the "speech", " Even if "user", "operation", etc. are key phrases, they are excluded. It can be determined that the element represented by " is included.

要素間関係判別部2058は、例えば、発明文書のクレームの記載を対象として行う包含関係判別処理において、クレームの一項の一部分で所定の包含記載文字列に先行して主語が記載されていない場合には、その一部分の前において格助詞「は」に先行した主語が明示されていない限りにおいて、クレームのその一項における請求対象の要素を表す重要語句が主語であると看做して、その主語が表す要素が、所定の包含記載文字列の直前の重要語句が表す要素を包含しているものと判別してもよい。また、要素間関係判別部2058は、例えば、発明文書のクレームの記載を対象として行う包含関係判別処理において、クレームの一項の一部分で所定の包含記載文字列に先行して主語が記載されていない場合において、その一部分の前において格助詞「は」に先行した主語が明示されているときには、その主語が表す要素が、所定の包含記載文字列の直前の重要語句が表す要素を包含しているものと判別してもよい。 For example, the inter-element relationship determination unit 2058, in the inclusion relationship determination processing performed on the description of the claim of the invention document, when the subject is not described prior to the predetermined inclusion description character string in a part of the claim , unless the subject is explicitly stated to be preceded by the case particle "wa" before that portion, the key phrase representing the claimed element in that section of the claim shall be deemed to be the subject, and the It may be determined that the element represented by the subject includes the element represented by the important phrase immediately preceding the predetermined inclusion description character string. Further, the inter-element relationship determination unit 2058 performs, for example, in the inclusion relationship determination processing for the description of the claim of the invention document, if the subject is described in a part of the claim prior to the predetermined inclusion description character string. In the case where there is no such part, if the subject preceding the case particle "wa" is specified before the part, the element represented by the subject includes the element represented by the important phrase immediately before the specified inclusion description string. It can be determined that there is

[3-1-5-4-2.記録媒体とその記録媒体の内容との関係にある複数の要素の判別]
要素間関係判別部2058は、例えば、発明文書から重要語句抽出部2051により抽出された重要語句各々が表す要素間が記録媒体とその記録媒体の内容との関係を有することについて判別する記録関係判別処理を実行し得る。ここで、記録媒体は、記憶媒体と称されるものを含むこととしてもよい。属性特定部2056は、重要語句の属性情報に、例えば、「重要語句が表す要素の記録内容」の項目を追加して、要素間関係判別部2058による記録関係判別処理の結果に基づいて、その項目の内容を特定することとしてもよい。
[3-1-5-4-2. Discrimination of a plurality of elements in relation to the recording medium and the contents of the recording medium]
The inter-element relationship determination unit 2058 performs recording relationship determination for determining whether, for example, the elements represented by the key phrases extracted by the key phrase extraction unit 2051 from the invention document have a relationship between the recording medium and the contents of the recording medium. processing can be performed. Here, the recording medium may include what is called a storage medium. The attribute specifying unit 2056 adds, for example, the item “recorded content of the element represented by the key phrase” to the attribute information of the key phrase, and based on the result of the recording relationship determination processing by the inter-element relationship determination unit 2058, It is also possible to specify the contents of the item.

要素間関係判別部2058による記録関係判別処理は、例えば、発明文書から、一の重要語句が表す要素が他の重要語句が表す要素を記録内容としていることを示す所定の記録記載パターンに該当する記載を探索することにより実現される。所定の記録記載パターンは、設定情報取得部201により取得される設定情報に含まれることとしてもよい。 The record relation discriminating process by the inter-element relation discriminating unit 2058 corresponds to, for example, a predetermined recorded description pattern indicating that an element represented by one key phrase in an invention document has recorded contents of an element represented by another key phrase. It is realized by searching the description. The predetermined record description pattern may be included in the setting information acquired by the setting information acquisition unit 201 .

所定の記録記載パターンに該当する記載の例としては、一の重要語句が主語として格助詞「は」に先行している文において、他の重要語句が所定の記録記載文字列(例えば「を記録する」、「を記憶している」、「を格納している」等)の直前に存在するような記載、或いは、他の重要語句が所定の記録記載文字列の直前に存在し、一の重要語句がその所定の記録記載文字列の直後に存在するような記載等が挙げられる。所定の記録記載文字列として、情報、データ等を記録又は記憶していることを表すと想定される如何なる文字列を定めてもよい。また、この所定の記録記載パターンに該当する記載の例における、他の重要語句は、複数の重要語句が、並列又は選択を表す接続詞、要素を繋ぐ所定の助詞「と」、読点文字「、」等を挟んで列挙されているものであってもよい。所定の記録記載文字列は、受動態のような表現(例えば、「に記録される」、「に格納される」等であってもよく、この表現に対応して更なる所定の記録記載パターンが定められてもよい。 As an example of a description corresponding to a predetermined record description pattern, in a sentence in which one key phrase precedes the case particle "ha" as a subject, another key phrase is a predetermined record description character string (for example, "record ”, “stores”, “stores”, etc.), or other important words and phrases exist immediately before a predetermined record description character string, Examples include a description in which a key phrase exists immediately after the predetermined record description character string. Any character string that is assumed to indicate that information, data, or the like is recorded or stored may be defined as the predetermined record description character string. In addition, other important words and phrases in examples of descriptions corresponding to this predetermined record description pattern are conjunctions in which a plurality of important words and phrases express parallelism or selection, predetermined particles "to" connecting elements, comma characters "," etc. may be enumerated. The predetermined record entry string may be a passive-like expression (e.g., "recorded in", "stored in", etc.) corresponding to which further predetermined record entry pattern is may be defined.

具体例を挙げると、要素間関係判別部2058は、発明文書中の「設定ファイルを記録する記録装置」という記載は、所定の記録記載パターンに該当するので、重要語句「設定ファイル」が表す要素が、重要語句「記録装置」が表す記録媒体の記録内容であるという関係を有すると判別する。この判別結果を受けて、属性特定部2056では、例えば重要語句「記録装置」の一属性としての「重要語句が表す要素の記録内容」の項目の内容として、重要語句「設定ファイル」を含ませる。 To give a specific example, the inter-element relation determination unit 2058 determines that the description "recording device for recording a setting file" in the invention document corresponds to a predetermined recording description pattern, so that the element represented by the important phrase "setting file" is the recorded content of the recording medium represented by the important phrase "recording device". In response to this determination result, the attribute specifying unit 2056 includes, for example, the important phrase "setting file" as the content of the item "recorded content of the element represented by the important phrase" as one attribute of the important phrase "recording device". .

また、別の具体例を挙げると、要素間関係判別部2058は、発明文書中の「メモリは、操作用画像と操作情報と機器制御情報とを記憶している。」という記載は、所定の記録記載パターンに該当するので、重要語句「メモリ」が表す要素が、重要語句「操作用画像」が表す要素と重要語句「操作情報」が表す要素と重要語句「機器制御情報」が表す要素とを記録内容としていると判別する。この判別結果を受けて、属性特定部2056では、例えば、重要語句「メモリ」の一属性としての「重要語句が表す要素の記録内容」の項目の内容として、重要語句「操作用画像」と、重要語句「操作情報」と、重要語句「機器制御情報」とを含ませる。 Further, to give another specific example, the inter-element relation determination unit 2058 determines that the description "the memory stores the operation image, the operation information, and the device control information" in the invention document is a predetermined Since it corresponds to the record description pattern, the element represented by the key phrase "memory" is divided into the element represented by the key word "operation image", the element represented by the key word "operation information", and the element represented by the key word "device control information". is the recorded content. In response to this determination result, the attribute specifying unit 2056, for example, sets the key word "operation image" as the content of the item "recorded content of the element represented by the key word" as one attribute of the key word "memory". The important phrase "operation information" and the important phrase "equipment control information" are included.

記録関係判別処理において、要素間関係判別部2058は、発明文書の各行において、所定の記録記載文字列以外に相当する動詞の目的語を、所定の記録記載パターンに該当する記載の探索対象範囲から除外してもよい。即ち、要素間関係判別部2058は、発明文書の各行において、行の探索開始部分から所定の記録記載文字列以外に相当する動詞の部分までを除いて、残りの部分から、一の重要語句が表す要素が他の重要語句が表す要素を記録内容とすることを示す所定の記録記載パターンに該当する記載(例えば、他の重要語句が所定の記録記載文字列の直前に存在し、一の重要語句がその所定の記録記載文字列の直後に存在するような記載)を探索することで、複数の重要語句各々が表す要素間が記録媒体とその記録媒体の内容との関係を有することについて判別してもよい。 In the record relationship determination process, the inter-element relationship determiner 2058 extracts objects of verbs other than predetermined record description character strings in each line of the invention document from the search target range of descriptions corresponding to the predetermined record description pattern. may be excluded. That is, in each line of the invention document, the inter-element relation determination unit 2058 removes the search start portion of the line to the verb portion corresponding to the character string other than the predetermined record description character string, and extracts one key phrase from the remaining portion. A description corresponding to a predetermined record description pattern indicating that the element represented by another key phrase is the record content (for example, another key phrase exists immediately before a predetermined record description character string, By searching for a description in which a word/phrase exists immediately after the predetermined record description character string, it is determined that the elements represented by each of the plurality of important words/phrases have a relationship between the recording medium and the contents of the recording medium. You may

[3-1-5-4-3.プログラムとその実現内容との関係にある複数の要素の判別]
要素間関係判別部2058は、例えば、発明文書から重要語句抽出部2051により抽出された重要語句各々が表す要素間がプログラムとそのプログラムによる実現内容との関係を有することについて判別するプログラム実現関係判別処理を実行し得る。属性特定部2056は、重要語句の属性情報に、例えば、「重要語句が表す要素の実現内容」の項目を追加して、要素間関係判別部2058によるプログラム実現関係判別処理の結果に基づいて、その項目の内容を特定することとしてもよい。
[3-1-5-4-3. Determination of multiple elements in relationship between program and its implementation]
The inter-element relationship determination unit 2058 performs program realization relationship determination for determining whether, for example, the elements represented by the key phrases extracted from the invention document by the key phrase extraction unit 2051 have a relationship between the program and the implementation content of the program. processing can be performed. The attribute specifying unit 2056 adds, for example, the item "implementation content of the element represented by the key phrase" to the attribute information of the key phrase, and based on the result of the program realization relationship determination processing by the inter-element relationship determination unit 2058, The content of the item may be specified.

要素間関係判別部2058によるプログラム実現関係判別処理は、例えば、発明文書から、実質的にプログラムを示す一の重要語句(例えば、全部又は語尾が「プログラム」、「ルーチン」、「ソフトウェア」等の語句)が表す要素が、方法、処理、機能等を示す他の重要語句(例えば、語尾が「方法」、「処理」、「手段」、「機能」等の語句)が表す要素を実現内容としていることを示す所定のプログラム記載パターンに該当する記載を探索することにより実現される。所定のプログラム記載パターンは、設定情報取得部201により取得される設定情報に含まれることとしてもよい。 The program realization relationship determination processing by the inter-element relationship determination unit 2058 is performed, for example, by extracting from the invention document one important phrase (for example, all or endings such as “program”, “routine”, “software”, etc.) that substantially indicates a program. The elements represented by the elements expressed by other important words (for example, words ending with "method", "process", "means", "function") indicating methods, processes, functions, etc. This is realized by searching for a description corresponding to a predetermined program description pattern indicating that the The predetermined program description pattern may be included in the setting information acquired by the setting information acquisition unit 201 .

所定のプログラム記載パターンに該当する記載の例としては、一の重要語句が主語として格助詞「は」に先行している文において、他の重要語句が所定のプログラム実現記載文字列(例えば「を実現する」、「を実現させるための」、「として機能させる」等)の直前に存在するような記載、或いは、他の重要語句が所定のプログラム実現記載文字列の直前に存在し、一の重要語句がその所定のプログラム実現記載文字列の直後に存在するような記載等が挙げられる。所定のプログラム実現記載文字列として、機能、処理等を実現すること、或いは、機能、処理等を実現するためのものであることを表すと想定される如何なる文字列を定めてもよい。また、この所定のプログラム実現記載パターンに該当する記載の例における、他の重要語句は、複数の重要語句が、並列又は選択を表す接続詞、要素を繋ぐ所定の助詞「と」、読点文字「、」等を挟んで列挙されているものであってもよい。所定のプログラム実現記載文字列は、受動態のような表現(例えば、「により実現される」等)であってもよく、この表現に対応して更なる所定のプログラム実現記載パターンが定められてもよい。 As an example of a description corresponding to a predetermined program description pattern, in a sentence in which one key phrase precedes the case particle "ha" as a subject, another key phrase is a predetermined program implementation description character string (for example, " "to realize", "to realize", "function as", etc.), or other important words and phrases that exist immediately before a given program implementation description character string, Examples include a description in which a key phrase exists immediately after the predetermined program implementation description character string. Any character string that is assumed to indicate that a function, process, etc. is to be realized or that the function, process, etc. is to be realized may be defined as the predetermined program implementation description character string. In addition, other key phrases in examples of descriptions corresponding to this predetermined program implementation description pattern are conjunctions in which a plurality of key phrases express parallelism or selection, predetermined particles connecting elements "to", comma characters ", " etc. may be enumerated. The predetermined program implementation description character string may be a passive expression (for example, "implemented by" etc.), and a further predetermined program implementation description pattern may be defined corresponding to this expression. good.

具体例を挙げると、要素間関係判別部2058は、発明文書中の「文字コード変換機能を実現するための変換プログラム」という記載は、所定のプログラム実現記載パターンに該当するので、重要語句「文字コード変換機能」が表す要素が、重要語句「変換プログラム」が表すプログラムの実現内容であるという関係を有すると判別する。この判別結果を受けて、属性特定部2056では、例えば重要語句「変換プログラム」の一属性としての「重要語句が表す要素の実現内容」の項目の内容として、重要語句「文字コード変換機能」を含ませる。 To give a specific example, the inter-element relation determination unit 2058 determines that the description "conversion program for realizing the character code conversion function" in the invention document corresponds to a predetermined program implementation description pattern, so that the important phrase "character It is determined that the element represented by "code conversion function" has a relation of the implementation contents of the program represented by the important phrase "conversion program". In response to this determination result, the attribute specifying unit 2056 specifies, for example, the key word "character code conversion function" as the content of the item "realization content of the element represented by the key word" as one attribute of the key word "conversion program". include.

また、別の具体例を挙げると、要素間関係判別部2058は、発明文書中の「変換ルーチンは、コンピュータを文字コード変換手段として機能させる。」という記載は、所定のプログラム実現記載パターンに該当するので、重要語句「変換ルーチン」が表す要素が、重要語句「文字コード変換手段」が表す要素を実現内容としていると判別する。この判別結果を受けて、属性特定部2056では、例えば、重要語句「変換ルーチン」の一属性としての「重要語句が表す要素の実現内容」の項目の内容として、重要語句「文字コード変換手段」を含ませる。 Further, to give another specific example, the inter-element relation determination unit 2058 determines that the description "The conversion routine causes the computer to function as character code conversion means" in the invention document corresponds to a predetermined program implementation description pattern. Therefore, it is determined that the element represented by the important phrase "conversion routine" has the element represented by the important phrase "character code conversion means" as the actual content. In response to this determination result, the attribute specifying unit 2056 selects, for example, the key word "character code conversion means" as the content of the item "implementation content of the element represented by the key word" as one attribute of the key word "conversion routine". include.

プログラム実現関係判別処理において、要素間関係判別部2058は、発明文書の各行において、機能、処理等がプログラムにより実現されることを表す所定のプログラム実現記載文字列以外に相当する動詞の目的語を、所定のプログラム実現記載パターンに該当する記載の探索対象範囲から除外してもよい。即ち、要素間関係判別部2058は、発明文書の各行において、行の探索開始部分から所定のプログラム実現記載文字列以外に相当する動詞の部分までを除いて、残りの部分から、一の重要語句が表す要素が他の重要語句が表す要素を実現するためのものであることを示す所定のプログラム実現記載パターンに該当する記載(例えば、他の重要語句が所定のプログラム実現記載文字列の直前に存在し、一の重要語句がその所定のプログラム実現記載文字列の直後に存在するような記載)を探索することで、複数の重要語句各々が表す要素間がプログラムとそのプログラムによる実現内容との関係を有することについて判別してもよい。 In the program realization relationship judging process, the inter-element relation judging section 2058 finds the object of the verb corresponding to each line of the invention document other than the predetermined program realization description character string representing that the function, process, etc. are realized by the program. , may be excluded from the search target range for descriptions corresponding to a predetermined program implementation description pattern. That is, in each line of the invention document, the inter-element relation determination unit 2058 removes the search start portion of the line up to the verb portion corresponding to the character string other than the predetermined program implementation description character string, and extracts one important phrase from the remaining portion. A description corresponding to a predetermined program implementation description pattern indicating that the element represented by is for realizing the element represented by another key phrase (for example, another key phrase immediately before a predetermined program implementation description character string by searching for a description in which one important phrase exists immediately after the specified program implementation description character string), the elements represented by each of the plurality of important phrases are searched for the relationship between the program and the implementation content by the program. A determination may be made about having a relationship.

[3-1-5-4-4.等価関係にある複数の要素の判別]
要素間関係判別部2058は、例えば、発明文書から重要語句抽出部2051により抽出された複数の重要語句が表す要素間に等価関係があることを判別する等価関係判別処理を実行し得る。属性特定部2056は、重要語句の属性情報に、例えば、「重要語句が表す要素と等価関係を有する要素」の項目を追加して、要素間関係判別部2058による等価関係判別処理の結果に基づいて、その項目の内容を特定することとしてもよい。
[3-1-5-4-4. Discrimination of multiple elements in equivalence relationship]
The inter-element relation determination unit 2058 can execute, for example, an equivalence determination process for determining whether there is an equivalence between elements represented by a plurality of key phrases extracted from the invention document by the key phrase extraction unit 2051 . The attribute specifying unit 2056 adds, for example, an item “an element having an equivalence relationship with the element represented by the key phrase” to the attribute information of the key phrase, and based on the result of the equivalence determination processing by the inter-element relationship determination unit 2058 It is also possible to specify the content of the item.

要素間関係判別部2058による等価関係判別処理は、例えば、発明文書から、一の重要語句に後続してその一の重要語句と同じ意味を表すと推定される他の重要語句が記載された所定の等価記載パターンに該当する記載を探索することにより実現される。所定の等価記載パターンは、設定情報取得部201により取得される設定情報に含まれることとしてもよい。 The equivalence determination process by the inter-element relationship determination unit 2058 is performed, for example, by searching for a predetermined key phrase in which another key phrase that is presumed to have the same meaning as the one key phrase following one key phrase from the invention document is described. is realized by searching for a description corresponding to the equivalent description pattern of . The predetermined equivalent description pattern may be included in the setting information acquired by the setting information acquisition unit 201 .

所定の等価記載パターンに該当する記載の例としては、例えば、一の重要語句に後続する格助詞「は」に後続して他の重要語句が記載され、この他の重要語句に、「である。」、「とも称される。」等といった文字列が後続する記載が挙げられる。 As an example of a description corresponding to a predetermined equivalent description pattern, for example, a case particle "wa" following one important phrase is followed by another important phrase, and the other important phrase is "is ".", "It is also called.", etc. followed by a character string.

また、所定の等価記載パターンに該当する記載の別の例としては、一の重要語句の直後に始め丸括弧と他の重要語句と終わり丸括弧とが連続して配置された記載が挙げられる。この例において、例えば、始め丸括弧と終わり丸括弧との間に、他の重要語句として、コロン「:」で区切られた複数の重要語句が含まれていてもよい。具体例を挙げると、要素間関係判別部2058は、発明文書中の「表示装置(ディスプレイ)」という記載は、所定の等価記載パターンに該当するので、重要語句「表示装置」が表す要素が、重要語句「ディスプレイ」が表す要素と等価関係を有すると判別する。また別の具体例を挙げると、要素間関係判別部2058は、発明文書中の「グラフィカルユーザインタフェース(GUI:Graphical User Interface)」という記載は、所定の等価記載パターンに該当するので、重要語句「グラフィカルユーザインタフェース」が表す要素が、重要語句「GUI」及び重要語句「Graphical User Interface」の各々が表す要素と等価関係を有すると判別する。この例における判別結果を受けて、属性特定部2056では、例えば重要語句「グラフィカルユーザインタフェース」の一属性としての「重要語句が表す要素の実現内容」の項目の内容として、重要語句「GUI」及び重要語句「Graphical User Interface」を含ませる。 Another example of a description corresponding to a predetermined equivalent description pattern is a description in which an opening parenthesis, another key phrase, and a closing parenthesis are consecutively arranged immediately after one key phrase. In this example, for example, between the opening parenthesis and the closing parenthesis, multiple key phrases separated by colons ":" may be included as other key phrases. To give a specific example, the inter-element relationship determination unit 2058 determines that the description "display device (display)" in the invention document corresponds to a predetermined equivalent description pattern, so that the element represented by the important phrase "display device" is It is determined that it has an equivalence relationship with the element represented by the key word "display". To give another specific example, the inter-element relationship determination unit 2058 determines that the description "Graphical User Interface (GUI)" in the invention document corresponds to a predetermined equivalent description pattern, so that the important phrase " It is determined that the element represented by "graphical user interface" has an equivalence relation with the elements represented by each of the important phrase "GUI" and the important phrase "Graphical User Interface". In response to the determination result in this example, the attribute specifying unit 2056 selects, for example, the important phrase "GUI" and Include the key phrase "Graphical User Interface".

[3-1-5-4-5.概念上の上下関係にある複数の要素の判別]
要素間関係判別部2058は、例えば、発明文書から重要語句抽出部2051により抽出された複数の重要語句が表す要素間に概念上の上下関係があることを判別する上下概念関係判別処理を実行し得る。属性特定部2056は、重要語句の属性情報に、例えば、「重要語句が表す要素の下位概念的要素」の項目を追加して、要素間関係判別部2058による上下概念関係判別処理の結果に基づいて、その項目の内容を特定することとしてもよい。
[3-1-5-4-5. Discrimination of Multiple Elements in Conceptual Hierarchical Relationship]
The inter-element relation determining unit 2058 executes, for example, hierarchical concept relation determining processing for determining whether there is a conceptual hierarchical relationship between elements represented by a plurality of key phrases extracted from the invention document by the key phrase extracting unit 2051. obtain. The attribute specifying unit 2056 adds, for example, an item “lower-level conceptual element of the element represented by the key phrase” to the attribute information of the key phrase, and based on the result of the upper-lower conceptual relationship determination processing by the inter-element relationship determination unit 2058 It is also possible to specify the content of the item.

要素間関係判別部2058による上下概念関係判別処理は、例えば、発明文書から、一の重要語句に後続してその一の重要語句の下位概念(例えば具体例)を表すと推定される他の重要語句が記載された所定の下位概念記載パターンに該当する記載を探索することにより実現される。所定の下位概念記載パターンは、設定情報取得部201により取得される設定情報に含まれることとしてもよい。 The upper-level concept relationship determination processing by the inter-element relationship determination unit 2058 is performed, for example, from the invention document, after one important phrase, other important terms that are presumed to represent a subordinate concept (for example, a specific example) of that one important phrase. This is achieved by searching for descriptions corresponding to a predetermined subordinate concept description pattern in which words are described. The predetermined lower-level concept description pattern may be included in the setting information acquired by the setting information acquisition unit 201 .

所定の下位概念記載パターンに該当する記載の例としては、例えば、一の重要語句に後続して、「の具体例は」、「の一例は」、「は例えば」、「は具体的には」等といった、例示表現を導く文字列が配置され、その例示表現を導く文字列に後続して他の重要語句が記載され、この他の重要語句に断定を表す「であり、」、「である。」等といった文字列が後続する記載が挙げられる。なお、この例示表現を導く文字列中に読点文字「、」が含まれていてもよい。また、この所定の下位概念記載パターンに該当する記載の例における、他の重要語句は、複数の重要語句が、並列又は選択を表す接続詞、要素を繋ぐ所定の助詞「と」、読点文字「、」等を挟んで列挙されているものであってもよい。 Examples of descriptions corresponding to a predetermined subordinate concept description pattern include, for example, following one important phrase, "a specific example of", "an example of", "for example", "is specifically A character string that leads to an exemplary expression such as ” is arranged, and other important phrases are described after the character string that leads to the exemplary expression, and the other important phrases express affirmation “is”, “is There is a description followed by a character string such as ". Note that the character string leading to this exemplary expression may include comma characters ",". In addition, other key phrases in examples of descriptions corresponding to this predetermined subordinate concept description pattern include conjunctions in which a plurality of key phrases express parallelism or selection, predetermined particles connecting elements "to", comma characters ", " etc. may be enumerated.

また、所定の下位概念記載パターンに該当する記載の別の例としては、一の重要語句の直後に始め丸括弧と「例えば」といった例示を表す文字列と他の重要語句と終わり丸括弧とが連続して配置された記載が挙げられる。「例えば」といった例示を表す文字列は、読点文字「、」を語尾に含んでもよい。 As another example of a description corresponding to a predetermined subordinate concept description pattern, an opening parenthesis, a character string representing an example such as "for example", another key phrase, and a closing parenthesis are immediately after one important phrase. Consecutively arranged descriptions are included. A character string representing an example such as "for example" may include comma characters "," at the end of a word.

具体例を挙げると、要素間関係判別部2058は、発明文書中の「表示装置の一例は液晶ディスプレイである。」という記載は、所定の下位概念記載パターンに該当するので、重要語句「表示装置」が表す要素の下位概念としての要素が、重要語句「液晶ディスプレイ」が表す要素であると判別する。この判別結果を受けて、属性特定部2056では、例えば重要語句「表示装置」の一属性としての「重要語句が表す要素の下位概念的要素」の項目の内容として、重要語句「液晶ディスプレイ」を含ませる。 To give a specific example, the inter-element relation determination unit 2058 determines that the description "an example of a display device is a liquid crystal display" in the invention document corresponds to a predetermined subordinate concept description pattern, so that the important phrase "display device" ” is determined to be the element represented by the important phrase “liquid crystal display”. In response to this determination result, the attribute specifying unit 2056, for example, sets the key phrase "liquid crystal display" as the content of the item "lower conceptual element of the element represented by the key phrase" as one attribute of the key phrase "display device". include.

[3-1-5-4-6.重要語句関係情報の生成]
要素間関係判別部2058は、包含関係判別処理、記録関係判別処理、プログラム実現関係判別処理、等価関係判別処理、或いは、上下概念関係判別処理の結果に基づいて、出力部208により出力されることとなる特許出願関連情報に含まれる重要語句関係情報を生成する。
[3-1-5-4-6. Generating Key Word Related Information]
The inter-element relationship determination unit 2058 is output by the output unit 208 based on the results of the inclusion relationship determination process, the recording relationship determination process, the program realization relationship determination process, the equivalent relationship determination process, or the hierarchical concept relationship determination process. Generate important word relational information included in the patent application related information.

発明文書分析システム20において出力部208が、重要語句関係情報を含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、要素間関係判別部2058は、表示用文書としての特許出願関連情報に含まれる重要語句関係情報を生成する。要素間関係判別部2058が生成する、表示用文書としての特許出願関連情報の重要語句関係情報部分は、例えば、重要語句毎に対応する表示要素を含む。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。要素間関係判別部2058は、例えば、重要語句毎に対応する表示要素には、相互に異なる重要語句毎の表示態様を相違させる等のための表示制御情報を付加し得る。 In the invention document analysis system 20, when the output unit 208 outputs the patent application related information including the key word relationship information as a display document (for example, an HTML document), the inter-element relationship determination unit 2058 outputs to generate key word relationship information included in the patent application related information of The key phrase relationship information portion of the patent application related information as a document for display generated by the inter-element relation determining unit 2058 includes, for example, a display element corresponding to each key phrase. For example, a browser may interpret the presentation document to display each presentation element. The inter-element relation determination unit 2058 can add, for example, display control information for differentiating the display mode for each different key phrase to the display element corresponding to each key phrase.

[3-1-5-4-6-1.包含関係情報の生成]
要素間関係判別部2058は、重要語句関係情報に、例えば、包含関係判別処理の結果に基づく、発明文書から重要語句抽出部2051により抽出された複数の重要語句各々が表す要素間の構成上の包含関係を表現した包含関係情報を含ませる。包含関係情報における要素間の構成上の包含関係の表現は、如何なる方法でなされてもよい。図20は、表示用文書としての特許出願関連情報の重要語句関係情報における包含関係情報部分の表示例を示す。
[3-1-5-4-6-1. Generation of containment relationship information]
The inter-element relationship determination unit 2058 determines, for example, the structural relationship between the elements represented by the multiple key phrases extracted from the invention document by the key phrase extraction unit 2051 based on the results of the inclusion relationship determination processing, based on the key phrase relationship information. Contains containment information that expresses the containment relation. Any method may be used to express the compositional inclusion relationship between elements in the inclusion relationship information. FIG. 20 shows a display example of the inclusion relation information portion in the important word relation information of the patent application related information as a display document.

具体例としては、要素間関係判別部2058は、包含関係情報として、例えば、発明文書のクレームの各項のうち、クレーム引用関係検出部2057により検出された引用関係で結ばれた複数の項で構成されるグループ毎に、そのグループ内のクレームの各項に記載された各重要語句の包含関係に基づいて包含側と被包含側の重要語句間を、線、罫線記号「└」等で結んで形成される木構造(つまり階層構造)を表す記載を、生成する。要素間関係判別部2058は、階層構造で表した1つの重要語句がその階層構造中では1つしか現れないように2つ目以降は省略して、包含関係情報を簡略化してもよい。この場合の一例としては、要素間関係判別部2058は、例えば、階層構造で表した1つの重要語句がその階層構造中で同一階層又は下位階層に再び現れるときにはその再び現れる重要語句より下の階層の表現を省略する。このときに、要素間関係判別部2058は、1つの重要語句の再度の記載を省略したことを表現するための記号「…」等を、その重要語句に付記することとしてもよい。 As a specific example, the inter-element relationship determination unit 2058 uses, as the inclusion relationship information, a plurality of terms connected by the citation relationships detected by the claim citation relationship detection unit 2057 among the respective terms of the claims of the invention document. For each configured group, based on the inclusion relationship of each key phrase stated in each clause of the claim in that group, the key phrases on the including side and the included side are connected with a line, ruled line symbol “└”, etc. Generate a description that represents the tree structure (ie, hierarchical structure) formed by . The inter-element relationship determining unit 2058 may simplify the inclusion relationship information by omitting the second and subsequent important terms so that only one important term appears in the hierarchical structure. As an example of this case, the inter-element relation determining unit 2058 may, for example, when one important phrase represented by a hierarchical structure reappears in the same hierarchy or a lower hierarchy in the hierarchical structure, the hierarchy below the reappearing important phrase The expression of is omitted. At this time, the inter-element relation determination unit 2058 may add a symbol "..." or the like to the important phrase to indicate that the re-statement of one important phrase is omitted.

要素間関係判別部2058は、例えば、複数の重要語句の記載を含む包含関係情報において、発明文書のクレームのいずれかの項における請求対象を表す重要語句を、その重要語句に請求対象を表すために定められた記号(例えば「★」)を付記する等により、その他の重要語句とは識別可能に表現することとしてもよい。このような包含関係情報によれば、クレームで請求対象とされた重要語句と他の重要語句との各々が表す要素間の構成上の包含関係の把握が容易になる。 For example, in the inclusion relationship information containing descriptions of a plurality of key words, the inter-element relation determination unit 2058 determines, for example, a key word that represents the claim object in any claim of the invention document, to represent the claim object in that key word. may be expressed in such a way that it can be distinguished from other key phrases by appending a symbol (for example, "*") defined in . Such inclusion relation information makes it easy to grasp the compositional inclusion relation between the elements represented by the key words and phrases claimed in the claims and other key words.

要素間関係判別部2058は、例えば、引用関係で結ばれた複数の項で構成されるグループ毎に、複数の重要語句を表す階層構造の記載を含む包含関係情報において、あるグループについて記載された各重要語句には、その重要語句がそのグループ内のどの項に記載されているかを示す項番を付記することとしてもよい。 For example, the inter-element relation determination unit 2058 determines whether a certain group is described in the inclusion relation information including description of a hierarchical structure representing a plurality of important terms for each group composed of a plurality of terms linked by a citation relationship. Each key phrase may be appended with a section number indicating which section in the group the key phrase is described.

[3-1-5-4-6-2.記録関係情報の生成]
要素間関係判別部2058は、重要語句関係情報に、例えば、記録関係判別処理の結果に基づく、発明文書から重要語句抽出部2051により抽出された複数の重要語句各々が表す要素間が記録媒体とその記録媒体の内容との関係を有する場合のその関係を表現した記録関係情報を含ませ得る。記録関係情報における要素間の関係の表現は、例えば、記録媒体に係る重要語句とその内容に係る重要語句とを対応付けて表した表現、記録媒体に係る重要語句を上位にしてその記録媒体の内容に係る1つ以上の重要語句を下位にした階層構造で表した表現等、如何なる方法でなされた表現であってもよい。
[3-1-5-4-6-2. Generation of record-related information]
The inter-element relation determination unit 2058 determines, in the key word relationship information, whether the elements represented by each of the multiple key words extracted from the invention document by the key word extraction unit 2051 based on the result of the recording relationship determination process are the recording media. Recording relationship information expressing the relationship, if any, to the content of the recording medium may be included. The expression of the relationship between the elements in the recording-related information is, for example, an expression in which important words and phrases related to the recording medium are associated with important words and phrases related to the content of the recording medium, and an expression in which the important words and phrases related to the recording medium are placed at a higher level. Any expression may be used, such as a hierarchical structure in which one or more important terms related to the content are placed at a lower level.

[3-1-5-4-6-3.プログラム実現関係情報の生成]
要素間関係判別部2058は、重要語句関係情報に、例えば、プログラム実現関係判別処理の結果に基づく、発明文書から重要語句抽出部2051により抽出された複数の重要語句各々が表す要素間がプログラムとそのプログラムによる実現内容との関係を有する場合のその関係を表現したプログラム実現関係情報を含ませ得る。プログラム実現関係情報における要素間の関係の表現は、例えば、プログラムと実現内容とを対応付けて表した表現等、如何なる方法でなされた表現であってもよい。
[3-1-5-4-6-3. Generation of program realization relationship information]
The inter-element relationship determination unit 2058 determines, in the key word relationship information, the relationship between the elements represented by each of the multiple key words extracted from the invention document by the key word extraction unit 2051 based on the results of the program realization relationship determination process. If there is a relationship with the content implemented by the program, program implementation relationship information expressing the relationship can be included. The expression of the relationship between the elements in the program realization relationship information may be any expression, such as an expression in which the program and the realization content are associated with each other.

[3-1-5-4-6-4.等価関係情報の生成]
要素間関係判別部2058は、重要語句関係情報に、例えば、等価関係判別処理の結果に基づく、発明文書から重要語句抽出部2051により抽出された複数の重要語句各々が表す要素間に等価関係がある場合のその関係を表現した等価関係情報を含ませ得る。等価関係情報における要素間の関係の表現は、例えば、等価関係がある要素同士に係る各重要語句を対応付けて表した表現等、如何なる方法でなされた表現であってもよい。
[3-1-5-4-6-4. Generation of equivalence relationship information]
The inter-element relation determination unit 2058 determines, in the key word relation information, whether there is an equivalent relationship between elements represented by each of the multiple key words extracted from the invention document by the key word extraction unit 2051 based on the results of the equivalent relationship determination process. Equivalence relation information that expresses that relation in some cases may be included. The expression of the relationship between the elements in the equivalence relation information may be an expression made by any method, such as an expression in which key terms relating to the elements having an equivalence relation are associated with each other.

[3-1-5-4-6-5.上下概念関係情報の生成]
要素間関係判別部2058は、重要語句関係情報に、例えば、上下概念関係判別処理の結果に基づく、発明文書から重要語句抽出部2051により抽出された複数の重要語句各々が表す要素間に概念上の上下関係がある場合のその関係を表現した上下概念関係情報を含ませ得る。上下概念関係情報における要素間の関係の表現は、例えば、概念上の上下関係がある複数の要素に係る各重要語句を対応付けて表した表現、上位概念に係る重要語句(例えば「弾性体」)を上位にして対応する下位概念に係る1つ以上の重要語句(例えば「ばね」及び「ゴム」)を下位にした階層構造で表した表現等、如何なる方法でなされた表現であってもよい。
[3-1-5-4-6-5. Generation of hierarchical concept relationship information]
The inter-element relation determining unit 2058 uses the important term relation information to determine, for example, conceptually between the elements represented by the multiple key terms extracted from the invention document by the key term extracting unit 2051 based on the result of the hierarchical concept relation determining process. When there is a hierarchical relationship between the two, hierarchical concept relationship information expressing the relationship can be included. The expression of the relationship between elements in the hierarchical concept relation information is, for example, an expression in which key terms related to a plurality of conceptually hierarchical components are associated with each other, key terms related to generic concepts (for example, "elastic body") ) and one or more important words (e.g., "spring" and "rubber") related to the corresponding subordinate concept are expressed in a hierarchical structure, or any other method may be used. .

[3-1-5-5.クレーム引用関係検出部]
クレーム引用関係検出部2057は、発明文書取得部2021により取得された発明文書中のクレームの各項の引用関係を分析する引用関係分析処理を実行し、この引用関係分析処理の結果として生成されるクレーム引用関係情報を、保持する。
[3-1-5-5. Claim Citation Relationship Detection Unit]
The claim citation relationship detection unit 2057 executes a citation relationship analysis process for analyzing the citation relationship of each item of claims in the invention document acquired by the invention document acquisition unit 2021, and generates a citation relationship analysis process as a result of this citation relationship analysis process. Retain claim citation relationship information.

クレーム引用関係検出部2057による引用関係分析処理は、発明文書中のクレームの各項について、その項の見出し記載(例えば始め隅付き括弧と終わり隅付き括弧で挟まれた「請求項」の行の記載)以外の部分の記載内容から、所定の引用先項番記載パターンに該当する記載を探索することにより実現される。所定の引用先項番記載パターンは、設定情報取得部201により取得される設定情報に含まれることとしてもよい。 The citation relation analysis processing by the claim citation relation detection unit 2057 is performed for each claim item in the invention document, for example, the headline description of the item (for example, the line of "Claim" sandwiched between the opening square bracket and the closing square bracket. This is realized by searching for a description corresponding to a predetermined reference item number description pattern from the description contents of the part other than the description). The predetermined quoted item number description pattern may be included in the setting information acquired by the setting information acquisition unit 201 .

所定の引用先項番記載パターンに該当する記載の例としては、例えば、クレームの項を表す「請求項」という文字列に後続して数字を含む引用先項番文字列が配置され、その引用先項番文字列に後続して「記載」という文字列が配置されている記載が挙げられる。クレーム引用関係検出部2057は、引用関係分析処理において所定の引用先項番記載パターンに該当する記載を検出した場合には、例えば、引用先項番文字列中の数字を、引用先項番として抽出する。クレーム引用関係検出部2057は、例えば、検出した所定の引用先項番記載パターンに該当する記載における引用先項番文字列中に複数の数字が、並列又は選択を表す接続詞(例えば「又は」)、又は、区切り文字(例えば、「,」、読点文字「、」等)で区切られて配置されている場合には、その複数の数字各々を、引用先項番として抽出する。また、クレーム引用関係検出部2057は、例えば、検出した所定の引用先項番記載パターンに該当する記載における引用先項番文字列が、第1の数字に後続して範囲表現文字(例えば、「~」等)が配置され、その範囲表現文字に後続して第2の数字が配置された文字列を含んでいる場合には、その第1の数字以上でその第2の数字以下の全ての整数各々を、引用先項番として抽出する。具体的には、クレーム引用関係検出部2057は、クレームのある項における引用記載「請求項1、2、5又は11記載」に基づいて、整数「1」、「2」、「5」、「11」を、引用先項番として抽出し、クレームのある項における引用記載「請求項1~3のいずれか一項に記載」に基づいて、整数「1」、「2」、及び「3」を、引用先項番として抽出する。 As an example of a description corresponding to a predetermined pattern for describing a cited claim number, for example, a character string "claim" representing a claim is followed by a cited claim number character string containing a number, and the citation A description in which a character string “description” is arranged following the preceding item number character string can be mentioned. When the claim citation relationship detection unit 2057 detects a description corresponding to a predetermined citation item number description pattern in the citation relationship analysis process, for example, the number in the citation item number character string is used as the citation item number. Extract. The claim citation relationship detection unit 2057 detects, for example, a conjunction (for example, "or") in which a plurality of numbers in the citation destination item number character string in the description corresponding to the detected predetermined citation destination item number description pattern indicates parallel or selection. , or if they are separated by delimiters (for example, ",", comma ",", etc.), each of the multiple numbers is extracted as the reference item number. In addition, the claim citation relationship detection unit 2057 detects, for example, the citation destination item number character string in the description corresponding to the detected predetermined citation destination item number description pattern, followed by the first number followed by a range expression character (for example, " ", etc.) is placed, and the range expression character is followed by a second number, all characters greater than or equal to the first number and less than or equal to the second number Extract each integer as a referenced item number. Specifically, the claim citation relationship detection unit 2057 detects the integers "1", "2", "5", " 11” is extracted as the cited claim number, and the integers “1”, “2”, and “3” are extracted based on the cited statement “described in any one of claims 1 to 3” in a certain claim. is extracted as the reference item number.

クレーム引用関係検出部2057は、発明文書のクレームの各項について、その項と、引用関係分析処理でその項について抽出した引用先項番の集合とを対応付けた情報を含むクレーム引用関係情報を、更新して保持し得る。 The claim citation relationship detection unit 2057 generates claim citation relationship information including information that associates each clause of a claim of an invention document with a set of citation destination clause numbers extracted for that clause in the citation relationship analysis process. , update and hold.

クレーム引用関係検出部2057は、クレーム情報生成部205a等により発明文書のクレームを修正した内容を表す修正版クレーム情報が生成された場合におけるその修正版クレーム情報のクレームについても、引用関係分析処理を実行し、その結果として生成される修正版クレーム引用関係情報を保持し得る。 The claim citation relationship detection unit 2057 also performs the citation relationship analysis process for the claims of the amended claim information when the amended version claim information representing the content of the amended claim of the invention document is generated by the claim information generation unit 205a or the like. and retain the resulting modified claim citation information.

[3-1-5-6.警告情報生成部]
警告情報生成部2059は、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれる警告情報を生成する警告情報生成処理を実行する。
[3-1-5-6. Warning information generator]
The warning information generation unit 2059 executes warning information generation processing for generating warning information included in the patent application related information output by the output unit 208 of the invention document analysis system 20 .

警告情報生成部2059は、警告情報生成処理を、発明文書取得部2021により取得された発明文書に含まれる不適切な記載を探索し、検出した不適切な記載に関する指摘を表す1つ以上の指摘情報を含めた警告情報を生成することにより実現する。警告情報生成部2059が探索する不適切な記載は、不適切な可能性がある記載であってもよい。図21は、警告情報生成部2059が生成する警告情報の項目、及び、項目に対応する記載事項の一例を示す。 The warning information generation unit 2059 performs warning information generation processing by searching for inappropriate statements contained in the invention document acquired by the invention document acquisition unit 2021, and generating one or more indications representing indications related to the detected inappropriate statements. It is realized by generating warning information including information. The inappropriate description searched by the warning information generation unit 2059 may be a potentially inappropriate description. FIG. 21 shows an example of items of warning information generated by the warning information generation unit 2059 and description items corresponding to the items.

警告情報生成部2059は、警告情報の内容としての指摘情報が1つもない場合には、警告がない旨を示す警告情報を生成する。なお、警告情報生成部2059は、警告情報の内容としての指摘情報が1つもない場合には、警告情報の生成を省略することとしてもよい。 The warning information generation unit 2059 generates warning information indicating that there is no warning when there is no indication information as the content of the warning information. Note that the warning information generation unit 2059 may omit generation of warning information when there is no indication information as the content of the warning information.

[3-1-5-6-1.翻訳用発明文書標準規定に基づく指摘]
警告情報生成部2059による警告情報生成処理は、例えば、発明文書を翻訳用発明文書標準規定取得部204により取得された翻訳用発明文書標準規定に定められた複数の条件を満たすか否かを検査して条件が満たされない場合にその旨を指摘する指摘情報を警告情報に含ませること等により、実現される。
[3-1-5-6-1. Pointing out based on the Standard Provisions for Invention Documents for Translation]
The warning information generation process by the warning information generation unit 2059 is, for example, an examination of whether or not the invention document satisfies a plurality of conditions defined in the invention document standard specifications for translation acquired by the invention document standard specification acquisition unit 204 for translation. This is realized by, for example, including indication information pointing out that fact in the warning information when the condition is not satisfied.

具体例としては、警告情報生成部2059は、翻訳用発明文書標準規定に定められた各条件項目(図14参照)について、その条件項目に対応するパターン情報が示すパターンに該当する、発明文書中の不適切な記載を探索し、その不適切な記載を検出した場合に、例えば、発明文書中のその不適切な記載を検出した位置を示す情報と、その条件項目に対応する条件項目名とを表した指摘情報を警告情報に含ませる。発明文書中の不適切な記載を検出した位置を示す情報は、例えば、発明文書の各行に行順に付与した行番号のうち不適切な記載の行の行番号、発明文書におけるクレームの各項のうち不適切な記載を含む項の項番、発明文書における明細書の各段落のうち不適切な記載を含む段落の段落番号等を含んでもよい。警告情報生成部2059は、例えば、発明文書が翻訳用発明文書標準規定の複数の項目各々に適合しているか否かに係る判定を行うための処理を行うためのプラグインモジュールを利用して、警告情報生成処理を行うこととしてもよい。 As a specific example, the warning information generation unit 2059 generates a warning information in the invention document that corresponds to the pattern indicated by the pattern information corresponding to each condition item (see FIG. 14) defined in the invention document standard rules for translation. When an inappropriate description is searched for and the inappropriate description is detected, for example, information indicating the position where the inappropriate description is detected in the invention document, the conditional item name corresponding to the conditional item, and is included in the warning information. The information indicating the position where the inappropriate description in the invention document is detected is, for example, the line number of the line of inappropriate description among the line numbers given to each line of the invention document in line order, and the line number of each claim in the invention document. Among them, the paragraph number of the paragraph containing the inappropriate description, the paragraph number of the paragraph containing the inappropriate description among the paragraphs of the specification in the invention document, etc. may be included. The warning information generation unit 2059, for example, uses a plug-in module for performing processing for determining whether or not an invention document conforms to each of a plurality of items of the invention document standard specifications for translation, A warning information generation process may be performed.

警告情報生成処理の一例としては、警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書に、明細書の各文には主語が含まれるという条件を、満たしていない記載が含まれていることを検出した場合には、主語がない旨と、その検出した記載の内容とを示す指摘情報を、警告情報に含ませる。具体例としては、警告情報生成部2059は、発明文書取得部2021により取得された発明文書の明細書から、図14で示した「明細書の各文における主語の欠如」の条件項目に係る不適切な記載を抽出するためのパターン情報が示すパターンに該当する文の記載を探索し、そのパターンに該当する文の記載を検出した場合に、指摘情報を警告情報に含ませる。なお、主語がなくても、技術専門家、及び、技術専門家以外の者が、暗黙の主語を想定できる場合等もあり得るが、注意喚起のために、この指摘情報は有用となり得る。 As an example of the warning information generation process, the warning information generation unit 2059 determines that the specification of the invention document acquired by the invention document acquisition unit 2021, for example, satisfies the condition that each sentence of the specification contains a subject. When it is detected that a description that does not exist is included, indication information indicating that there is no subject and the content of the detected description is included in the warning information. As a specific example, the warning information generation unit 2059 extracts from the specification of the invention document acquired by the invention document acquisition unit 2021, the condition item of "absence of subject in each sentence of the specification" shown in FIG. A description of a sentence corresponding to a pattern indicated by pattern information for extracting an appropriate description is searched for, and when a description of a sentence corresponding to the pattern is detected, indication information is included in warning information. Although technical experts and persons other than technical experts may be able to assume an implicit subject even if there is no subject, this indication information can be useful for calling attention.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に、不適切な所定の記載を含まないという条件を、満たしていない記載が含まれていることを検出した場合には、不適切な可能性がある記載が含まれている旨と、その検出した記載の内容とを示す指摘情報を、警告情報に含ませる。具体例としては、警告情報生成部2059は、発明文書取得部2021により取得された発明文書から、翻訳用発明文書標準規定(図14参照)における「除去が望ましいと推定される文字列」の条件項目に係る不適切な記載を抽出するためのパターン情報が示すパターンに該当する文字列(例えば「のみ」、「好ましくは」等)の記載を探索し、そのパターンに該当する文字列の記載を検出した場合に、指摘情報を警告情報に含ませる。例えば、「のみ」、「好ましくは」等の文字列は、必ずしも記載できないものではないが、不注意で記載されることもあり得ることから、注意喚起のために、この指摘情報は有用となり得る。 For example, when the warning information generation unit 2059 detects that the invention document acquired by the invention document acquisition unit 2021 contains descriptions that do not satisfy the condition that inappropriate predetermined descriptions are not included, causes the warning information to include indication information indicating that a potentially inappropriate description is included and the content of the detected description. As a specific example, the warning information generation unit 2059 extracts from the invention document acquired by the invention document acquisition unit 2021 the condition of "a character string presumed to be desirably removed" in the invention document standard specification for translation (see FIG. 14). Search for descriptions of character strings that correspond to the pattern indicated by the pattern information (for example, "only", "preferably", etc.) to extract inappropriate descriptions related to the item, and search for descriptions of character strings that correspond to the pattern When detected, the indication information is included in the warning information. For example, character strings such as "only" and "preferably" are not necessarily things that cannot be written, but they can be written carelessly, so this indication information can be useful for calling attention. .

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に、重要語句抽出部2051により抽出された重要語句には不適切な所定の語句が付加されないという条件を、満たしていない記載が含まれていることを検出した場合には、不適切な所定の語句が付加された重要語句の記載が含まれている旨と、その検出した記載の内容とを示す指摘情報を、警告情報に含ませる。具体例としては、警告情報生成部2059は、発明文書取得部2021により取得された発明文書のクレームから、図14で示した「クレームで重要語句等に付加されない方が望ましい場合がある文字列」の条件項目に係る不適切な記載を抽出するためのパターン情報が示すパターンに該当する文字列(例えば「所望の」、「所定の」等)の記載を探索し、そのパターンに該当する文字列の記載を検出した場合に、指摘情報を警告情報に含ませる。例えば、「所定の」という文字列は、必ずしも問題を生じるとは限らないが、不注意で記載されることもあり得ることから、注意喚起のために、この指摘情報は有用となり得る。 The warning information generation unit 2059 satisfies, for example, the condition that an inappropriate predetermined phrase is not added to the key phrase extracted by the key phrase extraction unit 2051 to the invention document acquired by the invention document acquisition unit 2021. When it is detected that a description that is not included is included, indication information indicating that a description of an important phrase with an inappropriate predetermined phrase is included and the content of the detected description, Include in warning information. As a specific example, the warning information generation unit 2059 extracts from the claim of the invention document acquired by the invention document acquisition unit 2021, "a character string that may be desirable not to be added to the important phrase in the claim" shown in FIG. Search for descriptions of character strings that correspond to the pattern indicated by the pattern information (e.g., “desired”, “predetermined”, etc.) to extract inappropriate descriptions related to the condition items, and character strings that correspond to the pattern is detected, the indication information is included in the warning information. For example, the character string "predetermined" does not necessarily cause a problem, but it can be written carelessly, so this indication information can be useful for calling attention.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に、その発明文書を米国での権利取得のために用いた場合において権利解釈上の不利益を生じる記載を含ませないという条件を、満たしていない記載が含まれていることを検出した場合には、権利解釈上の不利益を生じる記載が含まれている旨と、その検出した記載の内容とを示す指摘情報を、警告情報に含ませる。具体例としては、警告情報生成部2059は、発明文書取得部2021により取得された発明文書から、図14で示した「米国出願で他の表現に変更した方が望ましい場合がある文字列」の条件項目に係る不適切な記載を抽出するためのパターン情報が示すパターンに該当する文字列(例えば「本発明の特徴は」等)の記載を探索し、そのパターンに該当する文字列の記載を検出した場合に、指摘情報を警告情報に含ませる。例えば、「本発明の特徴は」という記載が、発明文書に基づく米国出願に含まれる場合に、請求された主題の特徴について言及している(例えば、クレームの全ての項各々に係る発明の特徴について言及している)等と、解釈され得る可能性があることから、注意喚起のために、この指摘情報は有用となり得る。 For example, the warning information generation unit 2059 does not include a description that causes a disadvantage in interpretation of rights when the invention document acquired by the invention document acquisition unit 2021 is used for acquiring rights in the United States. If it is detected that a description that does not meet the condition that it does not satisfy the condition is included, indication information that indicates that the description that causes disadvantages in terms of right interpretation is included and the content of the detected description is included in the warning information. As a specific example, the warning information generation unit 2059 extracts from the invention document acquired by the invention document acquisition unit 2021 the "character string that may be desirable to be changed to another expression in the US application" shown in FIG. Search for descriptions of character strings that correspond to the pattern indicated by the pattern information for extracting inappropriate descriptions related to condition items (for example, "the characteristics of the present invention"), and search for descriptions of character strings that correspond to the pattern When detected, the indication information is included in the warning information. For example, the phrase "features of the invention," when included in a U.S. application based on an invention document, refers to features of the claimed subject matter (e.g., features of the invention in each of all claims). This indication information can be useful for calling attention, because it can be interpreted as such as referring to

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に、その発明文書を外国(つまり日本国以外の国)での権利取得のために用いた場合において外国で理解され難い語句に翻訳される可能性のある語句を記載しないという条件を、満たしていない記載が含まれていることを検出した場合には、外国で理解され難い可能性がある記載が含まれている旨と、その検出した記載の内容とを示す指摘情報を、警告情報に含ませる。具体例としては、警告情報生成部2059は、発明文書取得部2021により取得された発明文書から、図14で示した「外国で周知でない日本独特用語の使用」の条件項目に係る不適切な記載を抽出するためのパターン情報が示すパターンに該当する文字列(例えば「忘れ物」、「生き甲斐」等)の記載を探索し、そのパターンに該当する文字列の記載を検出した場合に、指摘情報を警告情報に含ませる。「外国で周知でない日本独特用語の使用」の条件項目に係る不適切な記載を抽出するためのパターン情報が示すパターンに、日本国で良い意味を有する記号「○」、日本国で悪い意味を有する記号「×」等の、日本独特の意味を有する記号が、該当するようにしてもよい。 The warning information generation unit 2059, for example, gives the invention document acquired by the invention document acquisition unit 2021 information that is understood in a foreign country (that is, a country other than Japan) when the invention document is used to acquire rights in a foreign country (that is, a country other than Japan). If it is detected that the description does not meet the condition of not including words that may be translated into difficult words, it includes descriptions that may be difficult to understand in foreign countries. The warning information includes indication information indicating the fact and the content of the detected description. As a specific example, the warning information generation unit 2059 detects inappropriate descriptions related to the condition item “use of Japanese terms that are not well known in foreign countries” shown in FIG. Search for descriptions of character strings that correspond to the pattern indicated by the pattern information for extracting Include in warning information. In the pattern indicated by the pattern information for extracting inappropriate descriptions related to the conditional item of "use of terms unique to Japan that are not well known in foreign countries", the symbol "○" that has a good meaning in Japan and the symbol "○" that has a bad meaning in Japan A symbol having a meaning peculiar to Japan, such as the symbol "x", may be applicable.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書に、その発明文書のクレームから検出された、所定程度以上高い重要度の重要語句(例えば重要度の値が1以上である重要語句)は、その発明文書の明細書に記載されているという条件を、満たしていない記載が含まれていることを検出した場合には、重要語句が明細書で説明されていない可能性がある旨と、その重要語句とを示す指摘情報を、警告情報に含ませる。重要語句の重要度は、重要度決定部2055により決定される。所定程度は、例えば、予め固定的に定められていてもよいし、設定情報取得部201により取得される設定情報において定められていてもよい。具体例としては、警告情報生成部2059は、発明文書取得部2021により取得された発明文書から、図14で示した「クレーム中の重要語句のうち重要度が所定程度以上高いものが明細書中に記載されていない」の条件項目に係る不適切な記載を抽出するためのパターン情報が示すパターンに該当する記載を検出した場合(例えば、所定程度以上高い重要度の重要語句が明細書において記載されていないことを検出した場合)に、指摘情報を警告情報に含ませる。 For example, the warning information generating unit 2059 adds important words and phrases having a predetermined degree of importance or more (for example, importance value is 1 or more), if it is detected that it contains a description that does not satisfy the condition that it is described in the specification of the invention document, the key word is explained in the specification. The warning information includes indication information indicating that there is a possibility that there is a possibility that there is a possibility that the information is not available and the important phrase. The importance of the important phrase is determined by the importance determining section 2055 . For example, the predetermined degree may be fixed in advance or may be set in the setting information acquired by the setting information acquisition unit 201 . As a specific example, the warning information generation unit 2059 obtains from the invention document acquired by the invention document acquisition unit 2021, "Among the important words in the claim, the When a description corresponding to the pattern indicated by the pattern information for extracting inappropriate descriptions related to the condition item of "not stated in the When it is detected that it is not done), the indication information is included in the warning information.

発明文書中で不適切な記載が検出された場合において、警告情報生成部2059は、その検出の基礎となった、翻訳用発明文書標準規定に定められた1つの条件項目が、不適切な理由のユーザへの説明等の条件項目説明メッセージを含んでいるときには、指摘情報にその条件項目説明メッセージを含ませてもよい。警告情報生成部2059は、例えば、警告情報に、不適切な記載の検出の基礎として用いられた翻訳用発明文書標準規定のバージョンの情報(例えばバージョン番号)を含ませてもよい。 When an inappropriate description is detected in the invention document, the warning information generation unit 2059 determines that one condition item defined in the invention document standard specification for translation, which is the basis of the detection, is inappropriate. When a condition item explanation message such as an explanation to the user is included, the indication information may include the condition item explanation message. For example, the warning information generation unit 2059 may include in the warning information version information (for example, version number) of the invention document standard specification for translation used as a basis for detecting inappropriate descriptions.

警告情報生成部2059は、例えば、翻訳用発明文書標準規定に定められた複数の条件のうち、設定情報取得部201により取得された設定情報又はユーザによる選択操作によって絞り込まれた1つ以上の条件について、その条件を満たしているか否かの検査の結果に基づいて、発明文書の翻訳用発明文書標準規定への適合性(例えば適合率等)の評価値を定めて、その評価値を示す発明文書評価情報を警告情報に含ませてもよい。 The warning information generation unit 2059 generates, for example, one or more conditions narrowed down by the setting information acquired by the setting information acquisition unit 201 or the selection operation by the user, among a plurality of conditions defined in the standard specification of invention documents for translation. Based on the results of the inspection to determine whether the conditions are met, the evaluation value of the conformity of the invention document to the standard provisions for invention documents for translation (for example, conformance rate, etc.) is determined, and the invention indicating the evaluation value Document evaluation information may be included in the warning information.

警告情報生成部2059による警告情報生成処理は、例えば、発明文書中の不適切な記載の検査を、翻訳用発明文書標準規定に基づいて行う代わりに、又は、翻訳用発明文書標準規定に基づいて行うことに加えて、翻訳用発明文書標準規定とは別個に定められた各種条件に基づいて行ってもよい。この場合に、警告情報生成部2059は、警告情報生成処理において、翻訳用発明文書標準規定とは別個に定められた各種条件を発明文書中の記載が満たすか否かを検査し、その各種条件のうち1つ以上の条件が満たされていないときに、例えばその条件が満たされていない旨を指摘する指摘情報と、発明文書中でその条件が満たされていない記載を検出した位置を示す情報とを、警告情報に含ませ得る。 The warning information generation process by the warning information generating unit 2059 is performed, for example, instead of inspecting inappropriate descriptions in the invention document based on the standard specifications for invention documents for translation, or based on the standard specifications for invention documents for translation. In addition to doing so, it may be done based on various conditions separately defined from the Standard Provisions for Invention Documents for Translation. In this case, in the warning information generation process, the warning information generation unit 2059 checks whether or not the description in the invention document satisfies various conditions defined separately from the invention document standard specifications for translation. When one or more of the conditions are not satisfied, for example, indication information pointing out that the conditions are not satisfied, and information indicating the position where the description in the invention document where the conditions are not satisfied is detected. and may be included in the warning information.

[3-1-5-6-2.翻訳用発明文書標準規定とは別個に定められた各種条件に基づく指摘]
以下、警告情報生成部2059が、警告情報生成処理において、翻訳用発明文書標準規定とは別個に定められた各種条件に基づいて、条件を満たさない発明文書中の記載について指摘する例について説明する。なお、ここで示す各種条件のうちの1つ以上の条件に係る情報を、翻訳用発明文書標準規定の条件項目の方に含ませることとしてもよい。警告情報生成処理において用いられるこの各種条件のうちの1つ以上を満たさない記載を含む発明文書が必ずしも不適切である必要はなく、この各種条件は、その条件を満たさない記載を含む発明文書が、実質的又は形式的に不適切である可能性があることに鑑みて、ユーザに注意を喚起する目的で規定されていてもよい。
[3-1-5-6-2. Pointing out based on various conditions stipulated separately from the Standard Provisions for Invention Documents for Translation]
An example in which the warning information generation unit 2059 points out descriptions in the invention document that do not satisfy the conditions based on various conditions defined separately from the standard rules for invention documents for translation in the warning information generation process will be described below. . Information relating to one or more of the various conditions shown here may be included in the condition items of the standard specification of invention documents for translation. An invention document containing descriptions that do not satisfy one or more of the various conditions used in the warning information generation process does not necessarily have to be inappropriate. , may be substantially or formally inappropriate, and may be defined for the purpose of calling attention to the user.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書中に、各見出し(例えば始め隅付き括弧と終わり隅付き括弧とが付加された記載等)が適正であるという条件を満たしていない記載が含まれていることを検出した場合には、その記載の位置を示す情報と、その条件が満たされていない旨を示す指摘情報とを、警告情報に含ませる。発明文書の明細書における適正な見出しの文字列のリストは、例えば法規等に基づいて予め規定され得るので、警告情報生成部2059は、その文字列のリストを参照することで、発明文書の明細書中における不適切な見出しに係る記載を検出できる。その適切な見出しの文字列のリストは、例えば、「発明の名称」、「技術分野」等の文字列を列挙したものである。なお、一部の見出しの文字列の語尾には通番が付され得るので、警告情報生成部2059は、不適切な見出しに係る記載を検出するために、更に、通番が語尾に付され得る文字列(例えば「特許文献」、「実施例」等)のリストを利用することとしてもよい。 For example, the warning information generation unit 2059 determines whether each heading (for example, a description with an opening square bracket and a closing square bracket added, etc.) is correct in the specification of the invention document acquired by the invention document acquisition unit 2021. When it is detected that a description that does not satisfy the condition that there is a certain condition is included, information indicating the position of the description and indication information indicating that the condition is not satisfied are included in the warning information. . A list of appropriate heading character strings in the specification of the invention document can be defined in advance based on laws and regulations, for example. Descriptions related to inappropriate headings in the book can be detected. The list of appropriate heading character strings is, for example, a list of character strings such as "title of the invention" and "technical field". It should be noted that since serial numbers may be added to the endings of character strings in some headings, the warning information generation unit 2059 further adds characters to which serial numbers may be added to the endings in order to detect descriptions related to inappropriate headings. A list of columns (eg, "Patent Documents", "Examples", etc.) may be used.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書中に、空行を含まないという条件を満たしていない記載が含まれていることを検出した場合には、その記載の位置を示す情報と、その条件が満たされていない旨を示す指摘情報とを、警告情報に含ませる。空行は、例えば改行コードのみを含む行である。例えば、半角又は全角の空白文字以外の文字を含まない行を、空行と看做すこととしてもよい。設定情報に、空行と看做す記載について規定し、警告情報生成部2059は、設定情報取得部201により取得された設定情報の空行と看做す記載についての規定を参照することで、空行を認識することとしてもよい。 For example, when the warning information generation unit 2059 detects that the invention document acquired by the invention document acquisition unit 2021 contains a description that does not satisfy the condition that no blank line is included, the description The warning information includes information indicating the position of and pointing information indicating that the condition is not satisfied. A blank line is, for example, a line containing only a line feed code. For example, a line that does not contain characters other than half-width or full-width blank characters may be regarded as a blank line. By specifying descriptions that are regarded as blank lines in the setting information, and the warning information generation unit 2059 refers to the description regarding descriptions that are regarded as blank lines in the setting information acquired by the setting information acquisition unit 201, Empty lines may be recognized.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書中に、登録商標である文字列を含めないという条件を満たしていない記載が含まれていることを検出した場合には、その記載の位置を示す情報と、その条件が満たされていない旨を示す指摘情報とを、警告情報に含ませる。登録商標の文字列のリストは規定可能なので、警告情報生成部2059は、その登録商標の文字列のリストを参照することで、発明文書中における登録商標である文字列が含まれている記載を検出できる。また、警告情報生成部2059は、インターネット上で複数の登録商標の情報を提供している所定のウェブサイト、データベース等にアクセスして、ネットワークを介して複数の登録商標の文字列を収集することで、登録商標の文字列のリストを生成して、警告情報生成処理に利用してもよい。なお、登録商標である文字列を含めないという条件を満たしていない記載の一例として、登録商標である文字列の記載が挙げられる。また、警告情報生成部2059は、登録商標である文字列の記載のうち、その登録商標である文字列の直後に「(登録商標)」等といった登録商標であることを明示する文字列が含まれていないところの登録商標である文字列の記載のみを、登録商標である文字列を含めないという条件を満たしていない記載として取り扱うこととしてもよい。 For example, when the warning information generation unit 2059 detects that the invention document acquired by the invention document acquisition unit 2021 includes a description that does not satisfy the condition that character strings that are registered trademarks are not included, causes the warning information to include information indicating the position of the description and pointing information indicating that the condition is not satisfied. Since the list of character strings of registered trademarks can be defined, the warning information generation unit 2059 refers to the list of character strings of registered trademarks to identify descriptions that include character strings of registered trademarks in the invention document. detectable. In addition, the warning information generation unit 2059 accesses predetermined websites, databases, etc. that provide information on multiple registered trademarks on the Internet, and collects character strings of multiple registered trademarks via the network. , a list of registered trademark character strings may be generated and used for the warning information generation process. An example of a description that does not satisfy the condition that a character string that is a registered trademark is not included is a description of a character string that is a registered trademark. In addition, the warning information generation unit 2059 includes a character string that clearly indicates a registered trademark such as “(registered trademark)” immediately after the character string that is a registered trademark in the description of the character string that is a registered trademark. Only descriptions of character strings that are registered trademarks that are not included may be treated as descriptions that do not satisfy the condition of not including character strings that are registered trademarks.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書中に、同一の符号の直前には同一の要素名が記載されるという条件を満たしていない記載が含まれていることを検出した場合には、その同一の符号と、その符号が付加された複数の相違する表現の要素名とを示す指摘情報を、警告情報に含ませる。なお、警告情報生成部2059は、例えば、発明文書中において複数の相違する表現の要素名に同一の符号が付されている記載を検出した場合に、その各要素名間に、一の要素名の文字列を他の要素名の文字列が末尾に包含しているか否かを識別可能となるように指摘情報を表現してもよい。具体例としては、発明文書の明細書に「第1機器101と第2機器102とは・・・」という記載が含まれており、更に、「機器102は・・・であり、第3機器101は・・・」という記載が含まれていた場合に、指摘情報は、例えば、「同一符号異表現情報→101:第1機器、第3機器」という情報と、「同一符号異表現情報→102:機器(第2機器)」という情報とを含む。 The warning information generation unit 2059 determines that, for example, the invention document acquired by the invention document acquisition unit 2021 includes a description that does not satisfy the condition that the same element name is described immediately before the same code. When this is detected, the warning information includes pointing information indicating the same code and the element names of a plurality of different expressions to which the code is added. Note that, for example, when the warning information generation unit 2059 detects a description in which a plurality of element names with different expressions are assigned the same reference numerals in the invention document, one element name The indication information may be expressed so that it is possible to identify whether or not the character string of another element name is included at the end of the character string. As a specific example, the description of the invention document includes the statement "The first device 101 and the second device 102 are...", and furthermore, "The device 102 is... 101 is...", the pointing information includes, for example, information such as "same sign different representation information → 101: first device, third device" and "same sign different representation information → 102: device (second device)”.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書中に、符号が定められている要素名は符号を付加して記載されるという条件を満たしていない記載が含まれていることを検出した場合には、その要素名とその符号とを含み、要素名に符号が付加されている記載と符号が付加されていない記載とが混在する旨を指摘する指摘情報を、警告情報に含ませる。具体例としては、発明文書の明細書に「液晶ディスプレイ301」という記載と、「301」が付加されていない「液晶ディスプレイ」という記載との両方が存在した場合に、警告情報生成部2059は、発明文書の明細書に、要素名に符号が付加された記載「液晶ディスプレイ301」と、「液晶ディスプレイ」に符号が付加されていない記載とが混在する旨を指摘する指摘情報を警告情報に含ませる。 For example, the warning information generating unit 2059 generates descriptions that do not satisfy the condition that element names for which codes are defined in the specification of the invention document acquired by the invention document acquisition unit 2021 are written with the codes added. is detected, the element name and its code are included, and it is pointed out that the description with the code added to the element name and the description without the code are mixed. Include information in the warning information. As a specific example, if the description of the invention document includes both the description "liquid crystal display 301" and the description "liquid crystal display" without "301" added, the warning information generation unit 2059 Warning information includes indication information pointing out that the description of the invention document contains a mixture of the description "liquid crystal display 301" with a code added to the element name and the description without a code added to "liquid crystal display". Let

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書中に、図面文書取得部2022で取得された図面文書中で用いられた符号は要素名に付加して記載されるという条件を満たしていない記載が含まれていることを検出した場合には、明細書中で符号が要素名に付加して用いられていない旨を指摘してその符号を示す指摘情報を、警告情報に含ませる。なお、図面文書中の符号は、例えば図面文書が検索可能PDFファイルの内容である場合、又は、図面文書を内容として含むPDFファイルを検索可能PDFファイルへと変換できる場合等において、検索可能PDFファイルから、設定情報の条件情報における符号文字列パターン情報が示す符号パターンに合致する文字列を検索することで、特定できる。 For example, the warning information generation unit 2059 adds the code used in the drawing document acquired by the drawing document acquisition unit 2022 to the element name in the specification of the invention document acquired by the invention document acquisition unit 2021. If it is detected that a description that does not satisfy the condition that it is described is included, indication information indicating the code by pointing out that the code is not used in addition to the element name in the specification is included in the warning information. For example, when the drawing document is the content of the searchable PDF file, or when the PDF file containing the drawing document can be converted into the searchable PDF file, the code in the drawing document is the searchable PDF file. Therefore, it can be specified by searching for a character string that matches the code pattern indicated by the code character string pattern information in the condition information of the setting information.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書中に、図面文書取得部2022で取得された図面文書中で用いられていない符号は要素名に付加して記載されないという条件を満たしていない記載が含まれていることを検出した場合には、図面文書中で用いられていない符号が要素名に付加されている記載が存在する旨と発明文書におけるその記載の位置とを示す指摘情報を、警告情報に含ませる。例えば、図面文書が検索可能PDFファイルの内容である場合、又は、図面文書を内容として含むPDFファイルを検索可能PDFファイルへと変換できる場合等において、警告情報生成部2059は、発明文書中の各要素名に付加された各符号を、例えば検索可能PDFファイルから検索すること等により、図面文書中で用いられていない符号を特定することができる。 For example, the warning information generation unit 2059 adds to the element name a code that is not used in the drawing document acquired by the drawing document acquisition unit 2022 and does not describe it in the invention document acquired by the invention document acquisition unit 2021. If it is detected that a description that does not satisfy the condition of " is included in the warning information. For example, when a drawing document is the content of a searchable PDF file, or when a PDF file containing a drawing document as content can be converted into a searchable PDF file, the warning information generation unit 2059 generates each By searching for each code added to the element name from, for example, a searchable PDF file, it is possible to identify codes that are not used in the drawing document.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書中に、見出し(例えば、「発明の名称」、「技術分野」等)の行以外の行においては一行内の記載の最後に句点文字「。」が配置されるという条件を、満たしていない記載が含まれていることを検出した場合には、句点文字「。」がない旨と発明文書の明細書におけるその行の位置とを示す指摘情報を、警告情報に含ませる。なお、行の内容が、各種の始め括弧(例えば始め山括弧、始め丸括弧等)で始まり、又は、空白文字に続いて各種の始め括弧で始まり、対応する種類の終わり括弧で終わる記載である行を、ここでの見出しの行と同様に取り扱うこととしてもよい。見出しの行以外の行の記載は、必ずしも句点文字「。」で終了する必要はないが、句点文字「。」を付けるべきところに句点文字「。」を付け忘れている場合、或いは、文が途中で途切れている場合等に対する注意喚起のために、この指摘情報は有用となり得る。 For example, the warning information generating unit 2059 removes a line other than a heading (eg, “title of the invention”, “technical field”, etc.) from the specification of the invention document acquired by the invention document acquiring unit 2021. If it detects that a description that does not satisfy the condition that a full stop character "." The warning information includes pointing information indicating the position of the line in the . It should be noted that the content of the line starts with various opening brackets (e.g., opening angle brackets, opening round brackets, etc.), or starts with various opening brackets following a space character, and ends with the corresponding type of closing bracket. The line may be treated in the same way as the heading line here. Lines other than heading lines do not necessarily end with a period character ".", but if you forget to add a period character "." This indication information can be useful for calling attention to the case where it is interrupted on the way.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書のクレームの項毎に、1つ以上の句点文字「。」が記載されるという条件を、満たしていない、クレームの項が含まれていることを検出した場合には、句点文字「。」がない旨と発明文書のクレームにおけるその項の項番とを示す指摘情報を、警告情報に含ませる。 For example, the warning information generation unit 2059 detects claims that do not satisfy the condition that one or more period characters "." When it is detected that a term is included, the warning information includes indication information indicating that there is no period character "." and the item number of the item in the claim of the invention document.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書中に、始め丸括弧と終わり丸括弧とで挟まれた括弧付き記載がある場合にはその括弧付き記載と、その括弧付き記載の直前の文字列の記載との関係が明確である(つまりその括弧付き記載の意義が明確である)という条件を、満たしていない括弧付き記載が含まれていることを検出したときには、括弧付き記載の意義が明確ではない旨と、発明文書の明細書におけるその括弧付き記載の位置とを示す指摘情報を、警告情報に含ませる。具体的には、警告情報生成部2059は、例えば、発明文書の明細書中の空白文字以外の文字列に後続する括弧付き記載を探索し、検出された括弧付き記載が、その意義が明確な記載を表す所定の適正括弧内文字列パターンに該当しない場合に、その括弧付き記載の意義が明確であるという条件が満たされていないと判別する。所定の適正括弧内文字列パターンは、例えば、括弧付き記載が、直前の語句である技術用語に係る英語表記の記載、直前の語句の例示に係る記載、又は、直前の語句の同義語若しくは付加説明の記載である場合に、この所定の適正括弧内文字列パターンに該当するように定められたものである。設定情報に、所定の適正括弧内文字列パターンを示す適正括弧内文字列パターン情報を含ませておくこととし、警告情報生成部2059は、設定情報取得部201により取得された設定情報の適正括弧内文字列パターン情報を参照して、適正括弧内文字列パターンを特定して利用することとしてもよい。所定の適正括弧内文字列パターンに該当する記載の例としては、括弧内に、半角又は全角の、英字、空白文字、スラッシュ「/」、ハイフン「-」、「:」等の英語表現に用いられる文字だけしか含まれない記載が、挙げられる。また、所定の適正括弧内文字列パターンに該当する記載の別の例としては、括弧内が「例えば」、「つまり」、「即ち」、「言わば」、「換言すれば」等の文字列で始まる記載、又は、括弧内が、「以下、・・・と称する」という文字列である記載等が、挙げられる。 For example, if the description of the invention document acquired by the invention document acquisition unit 2021 contains a parenthesized statement sandwiched between an opening parenthesis and a closing parenthesis, the warning information generation unit 2059 removes the parenthesized statement. and the description of the character string immediately preceding the bracketed description (that is, the meaning of the bracketed description is clear). When detected, the warning information includes pointing information indicating that the meaning of the parenthesized description is not clear and the position of the parenthetical description in the specification of the invention document. Specifically, the warning information generation unit 2059 searches for, for example, a bracketed description following a character string other than blank characters in the specification of the invention document, and the detected bracketed description has a clear significance. If it does not correspond to a predetermined proper bracketed character string pattern representing a description, it is determined that the condition that the meaning of the bracketed description is clear is not satisfied. Predetermined proper parenthesized character string patterns are, for example, English notation descriptions related to technical terms whose parenthetical descriptions are the immediately preceding words, descriptions related to examples of the immediately preceding words, or synonyms or additions of the immediately preceding words. If it is a description, it is determined to correspond to this predetermined proper bracketed character string pattern. Appropriate parenthesized character string pattern information indicating a predetermined proper parenthesized character string pattern is included in the setting information. It is also possible to refer to the inner character string pattern information and identify and use the appropriate parenthesized character string pattern. Examples of descriptions corresponding to the predetermined appropriate parenthesized character string pattern include half-width or full-width English expressions such as English letters, blank characters, slashes "/", hyphens "-", and ":". Listings that contain only the letters that appear are listed. Another example of a description corresponding to a predetermined proper parenthesized character string pattern is a character string such as "for example", "in other words", "namely", "so to speak", or "in other words" in parentheses. Examples include a description that begins with a description, or a description that is a character string "hereinafter referred to as . . . " in parentheses.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書中に、同一の意味の語句は一貫して同一の表記で記載するという条件を、満たしていない記載が含まれていることを検出した場合には、同一の意味の語句の表記が不統一である旨と、その検出した不統一の表記に係る各記載内容とを示す指摘情報を、警告情報に含ませる。警告情報生成部2059は、例えば、表記が不統一となる可能性がある各種の語句について、その語句と相違する表記とを対応付けた所定の不統一表記リストを定めておき、その所定の不統一表記リストに基づいて、発明文書の明細書中に、同一の意味の語句が相違する表記で混在していることを探索し得る。設定情報に、所定の不統一表記リストを含ませておくこととし、警告情報生成部2059は、設定情報取得部201により取得された設定情報中の所定の不統一表記リストを参照して、発明文書の明細書中に、同一の意味の語句が相違する表記で混在していることを探索することとしてもよい。所定の不統一表記リストは、例えば、各種の語句についての、同一の意味で同一の発音となる複数の表記を列挙したリストである。所定の不統一表記リストの例としては、例えば、「すなわち」と「即ち」とを対応付け、「もちろん」と「勿論」とを対応付け、「または」と「又は」とを対応付けたようなリストが挙げられる。なお、発明文書において必ずしも同一の意味の語句の表記を統一する必要はないが、例えば発明文書を形式面で整備したい者に対する注意喚起として、この指摘情報が有用となり得る。 The warning information generation unit 2059 detects, for example, the description of the invention document acquired by the invention document acquisition unit 2021 that does not satisfy the condition that words having the same meaning should be consistently described in the same notation. If it is detected, the warning information includes indication information indicating that the notation of words with the same meaning is inconsistent, and the content of descriptions related to the detected inconsistent notation. Let For example, the warning information generating unit 2059 defines a predetermined ununiform spelling list that associates different spellings with various words that may be spelled inconsistently. Based on the uniform notation list, it is possible to search for words having the same meaning mixed with different notations in the specification of the invention document. The setting information includes a predetermined non-uniform notation list, and the warning information generation unit 2059 refers to the predetermined non-uniform notation list in the setting information acquired by the setting information acquisition unit 201, It is also possible to search for words and phrases with the same meaning mixed with different notations in the specification of the document. The predetermined non-uniform spelling list is, for example, a list listing a plurality of spellings with the same meaning and the same pronunciation for various words. Examples of the predetermined inconsistent notation list include: list. Note that it is not necessary to unify the notation of words having the same meaning in the invention document, but this indication information can be useful, for example, as a warning to those who want to organize the invention document in terms of form.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書のクレームのいずれかの項に、複数の項を引用する記載を含ませる場合にはその記載において引用先の各項を択一的に引用するような形式で表現するという条件を、満たしていない記載が含まれていることを検出した場合には、複数の項が択一的に引用されていない旨と、その検出した項の項番と、その引用に係る記載の内容とを示す指摘情報を、警告情報に含ませる。この条件を満たしていない記載の一例は、「請求項1及び2に記載された制御装置」、「請求項1~3記載の制御装置」等のように、「又は」、「いずれか」等の択一的な語句を用いずに複数項を引用した記載である。なお、発明文書のクレームの各項中において、引用先の複数の項を、択一的に引用するような形式で表現しなくてもよい場合もあり得るが、注意喚起として、この指摘情報が有用となり得る。 For example, if any of the claims of the invention document acquired by the invention document acquisition unit 2021 includes a description citing a plurality of clauses, the warning information generation unit 2059 selects each clause of the quote destination in the description. If it detects that it contains a description that does not satisfy the condition that it is expressed in a form in which the The warning information includes pointing information indicating the item number of the detected item and the content of the description related to the reference. An example of a statement that does not satisfy this condition is "or", "either", etc., such as "the control device described in claims 1 and 2", "the control device described in claims 1 to 3", etc. It is a description that quotes multiple items without using alternative words. In addition, in each clause of the claim of the invention document, it may not be necessary to express the multiple clauses of the cited destination in a form of alternative citation. can be useful.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書のクレームのいずれかの項に、参照文字列(例えば、設定情報の条件情報における参照文字列パターン情報が示す参照文字列パターンに該当する文字列)に後続して語句が記載されている場合にその語句と同一の被参照語句が、その項のその参照文字列に先行した部分又は、その項が引用した項内に記載されている必要があるという条件を、満たしていない参照文字列に係る記載が含まれていることを検出した場合においては、先行した被参照語句の記載が存在しない旨と、その検出した項の項番と、その参照文字列に係る記載の内容とを示す指摘情報を、警告情報に含ませる。なお、上述の条件に係る「その項が引用した項」には、その項が引用した項が更に引用した項、その項が引用した項が更に引用した項がまた更に引用した項等といった、引用の1つ以上の連鎖を踏まえた引用先の項が該当する。警告情報生成部2059は、クレームの項が引用した項を判別するために、クレーム引用関係検出部2057が保持するクレーム引用関係情報を参照し得る。なお、例えば、発明文書のクレームのいずれかの項に、参照文字列に後続して語句が記載されている場合であってその語句と同一の被参照語句がその項のその参照文字列に先行した部分に記載されていない場合において、その項が引用した項が複数存在するときには、その引用した複数の各項内に、又は、その引用した複数の項各々からの引用の1つ以上の連鎖を踏まえた引用先の項内に、その被参照語句が記載されていなければ、警告情報生成部2059は、先行した被参照語句の記載が存在しない旨を含む指摘情報を、警告情報に含ませ得る。なお、指摘情報には、先行した被参照語句の記載が存在しなかった、引用の連鎖に係る各項からなる連鎖的な1つ以上のパス(path)としての引用項番の情報を含ませてもよい。具体例としては、請求項1には「センサ」が記載され、いずれも請求項1を引用しない請求項2と請求項3とには「センサ」が記載されておらず、請求項3が請求項2を引用している場合において、請求項1と3とを選択的に引用する請求項4内に、「前記センサ」が記載されているが先行して「センサ」が記載されていないときには、警告情報生成部2059は、例えば、先行した被参照語句の記載が存在しない旨と、その検出した項を示す「4」と、その参照文字列に係る記載の内容である「前記センサ」と、先行した被参照語句の記載が存在しなかった連鎖的なパスとしての引用項番の情報である「2-3-4」とを、指摘情報に含める。 For example, the warning information generation unit 2059 adds a reference character string (for example, a reference character string indicated by the reference character string pattern information in the condition information of the setting information) to any item of the claim of the invention document acquired by the invention document acquisition unit 2021. (character string that corresponds to the column pattern), the referenced word that is the same as that word appears in the section preceding the reference string in the section or in the section quoted by the section If it is detected that a description related to a reference character string that does not satisfy the condition that it must be described in The warning information includes indication information indicating the item number of the item and the content of the description related to the reference character string. In addition, "the paragraph quoted by the paragraph" pertaining to the above conditions includes the paragraph further quoted by the paragraph quoted by the paragraph, the paragraph further quoted by the paragraph quoted by the paragraph, etc. This applies to the referenced section, which builds on one or more chains of citations. The warning information generation unit 2059 can refer to the claim citation relationship information held by the claim citation relationship detection unit 2057 in order to determine the clause cited by the claim clause. In addition, for example, in the case where a word or phrase is stated after a reference character string in any of the claims of the invention document, the referenced word or phrase that is the same as that word or phrase precedes the reference character string in that paragraph. If the paragraph is not stated in the cited part, and there are multiple paragraphs cited by that paragraph, one or more chains of citations within or from each of the cited multiple paragraphs If the referenced term is not described in the quoted section based on the above, the warning information generation unit 2059 causes the warning information to include indication information indicating that there is no description of the preceding referenced term. obtain. In addition, the indication information does not include the information of the cited item number as one or more paths that consist of each item related to the chain of citations for which there was no description of the preceding referenced term. may As a specific example, claim 1 describes a "sensor", and claims 2 and 3, which do not cite claim 1, do not describe a "sensor", and claim 3 When claim 2 is cited and claim 4, which selectively cites claims 1 and 3, states "said sensor" but does not precede it with "sensor" , the warning information generating unit 2059 generates, for example, the fact that there is no description of the preceding referenced phrase, "4" indicating the detected term, and "said sensor", which is the content of the description related to the reference character string. , “2-3-4”, which is the information of the cited item number as a chained path in which there was no description of the preceding referenced phrase, is included in the indicated information.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書のクレームのうち、他の項を引用していない項である独立項について、下位概念を示す語句を用いないという条件を、満たしていない記載(つまり下位概念を示す語句を用いた記載)が含まれていることを検出した場合には、その独立項の項番と、その語句と、下位概念を示す語句が用いられている旨とを示す指摘情報を、警告情報に含ませる。警告情報生成部2059は、例えば、下位概念を示す語句を列挙した所定の下位概念語句リストを用いて、発明文書のクレームの独立項から、下位概念を示す語句を用いた記載を探索する。設定情報に、所定の下位概念語句リストを含ませておくこととし、警告情報生成部2059は、設定情報取得部201により取得された設定情報中の所定の下位概念語句リストを参照して、発明文書のクレームの独立項から、下位概念を示す語句を用いた記載を探索することとしてもよい。なお、所定の下位概念語句リストにおいて、下位概念を示す語句に対応付けてその語句の上位概念を示す語句を含ませてもよい。この場合には、警告情報生成部2059は、発明文書のクレームの独立項に、下位概念を示す語句を用いた記載を検出したときに、指摘情報に、例えば、その下位概念を示す語句の修正候補等として、所定の下位概念語句リストを参照して、その下位概念を示す語句に対応する上位概念を示す語句を含ませてもよい。所定の下位概念語句リストの例として、下位概念の語句「表示」、「送信」、「印刷」等と、上位概念の語句「出力」とを対応付け、下位概念の語句「キーボード」、「マウス」、「タッチパッド」等と、上位概念の語句「入力装置」とを対応付けたようなリストが挙げられる。 For example, the warning information generation unit 2059 sets a condition that a word or phrase indicating a subordinate concept is not used for an independent claim that does not cite another item among the claims of the invention document acquired by the invention document acquisition unit 2021. is detected (i.e., a description using words and phrases indicating a more specific concept), the item number of the independent claim, the word and phrase, and the words and phrases indicating a more specific concept are used. The warning information includes indication information indicating that the For example, the warning information generation unit 2059 searches for descriptions using words and phrases indicating a more specific concept from the independent claims of the claims of the invention document, using a predetermined list of words and phrases indicating a more specific concept. The setting information contains a predetermined lower-level concept word list, and the warning information generation unit 2059 refers to the predetermined lower-level concept word list in the setting information acquired by the setting information acquisition unit 201 to determine the invention. The independent claims of the document may be searched for statements using words indicating a more specific concept. It should be noted that a predetermined lower-level concept word list may include words and phrases representing higher-level concepts of the words in association with the words and phrases representing lower-level concepts. In this case, when the warning information generating unit 2059 detects that the independent claim of the claim of the invention document contains a description using a word or phrase indicating a more specific concept, the warning information generation unit 2059 adds, for example, the modification of the word or phrase indicating the more specific concept to the indication information. As a candidate or the like, a predetermined lower-level concept word list may be referred to, and words/phrases representing higher-level concepts corresponding to the words/phrases representing the lower-level concepts may be included. As an example of a predetermined lower-level concept word list, the lower-level words "display", "send", "print", etc. are associated with the higher-level words "output", and the lower-level words "keyboard", "mouse", etc. are associated with each other. , ``touch pad'', etc., and the broader term ``input device''.

なお、発明文書を対象として発明文書分析システム20の分析部205が分析した場合に、要素間関係判別部2058による上下概念関係判別処理の結果として、発明文書中の複数の重要語句間に存在する概念上の上下関係を示す情報が得られる。従って、1つ又は複数の発明文書各々を対象として発明文書分析システム20により得られた複数の重要語句間についての概念上の上下関係を示す情報に基づいて、下位概念の語句と上位概念の語句とを対応付けた所定の下位概念語句リストの生成又は更新が可能となる。このように発明文書取得部2021による取得された1つ又は複数の発明文書に基づいて生成又は更新された所定の下位概念語句リストを用いて、警告情報生成部2059は、発明文書取得部2021により取得されたある発明文書のクレームの独立項について、下位概念を示す語句を用いた記載が含まれていることの探索を行ってもよい。警告情報生成部2059が、発明文書のクレームの独立項について下位概念を示す語句を用いた記載を探索する対象のその発明文書を、その探索に用いる所定の下位概念語句リストの生成の基礎として用いてもよい。なお、下位概念は相対的なものに過ぎず、発明文書のクレームの独立項において下位概念を示す語句を用いることが必ずしも不適切な訳ではなく、戦略的に下位概念を示す語句が用いられている場合もあり得るが、警告情報生成部2059が、適切に定められた所定下位概念リストを、利用することにより、警告情報における下位概念を示す語句に係る指摘情報が、無用に限定した記載を発明文書のクレームの独立項に含ませないための注意喚起として、有用となる可能性がある。 In addition, when the analysis unit 205 of the invention document analysis system 20 analyzes the invention document as a target, as a result of the hierarchical concept relationship determination processing by the inter-element relationship determination unit 2058, there exists between a plurality of important terms in the invention document. Information indicating conceptual hierarchy is obtained. Therefore, based on the information indicating the conceptual hierarchical relationship between a plurality of important words and phrases obtained by the invention document analysis system 20 for each of one or more invention documents, the words and phrases of the lower concept and the words and phrases of the higher concept are determined. It is possible to generate or update a predetermined lower-level concept phrase list in which . Using the predetermined lower-level concept phrase list generated or updated based on one or more invention documents acquired by the invention document acquisition unit 2021 in this way, the warning information generation unit 2059 causes the invention document acquisition unit 2021 to A search may be performed for the independent claims of the claims of an acquired invention document for inclusion of descriptions using phrases indicating a more specific concept. The warning information generation unit 2059 uses the invention document to be searched for descriptions using words and phrases indicating a narrower concept in the independent claims of the claims of the invention document as a basis for generating a predetermined list of narrower concept words and phrases used for the search. may In addition, a more specific concept is only relative, and it is not necessarily inappropriate to use words and phrases indicating a more specific concept in the independent claims of the invention documents. However, the warning information generation unit 2059 uses an appropriately determined predetermined subordinate concept list so that the pointing information related to the words indicating the subordinate concept in the warning information is limited to an unnecessary description. It may be useful as a reminder to avoid inclusion in an independent claim of an invention document.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書のクレームから重要語句抽出部2051により抽出された重要語句は、重要度を問わず、明細書中に記載されているという条件を、発明文書の明細書の記載が満たしていないことを検出した場合には、その重要語句と、重要語句が明細書に記載されていない旨とを示す指摘情報を、警告情報に含ませることとしてもよい。警告情報生成部2059は、例えば、この条件を、発明文書の明細書の記載が満たしていないことの検出の代わりに、この条件を、発明文書の明細書の「発明を実施するための形態」、及び、「実施例」又は「実施例n」(nは自然数)の内容である記載が満たしていないことを検出することとしてもよい。具体例としては、警告情報生成部2059は、発明文書のクレームから重要語句抽出部2051により抽出された各重要語句について、発明文書の明細書、或いは、明細書の「発明を実施するための形態」、「実施例」等からその重要語句を探索し、その重要語句を検出できなければ、この条件が満たされていないとして、その重要語句等を示す指摘情報を、警告情報に含ませる。 For example, the warning information generation unit 2059 determines that the important phrases extracted by the important phrase extraction unit 2051 from the claim of the invention document acquired by the invention document acquisition unit 2021 are described in the specification regardless of their importance. If it is detected that the description of the specification of the invention document does not satisfy the condition, the warning information includes the key phrase and the indication information indicating that the key phrase is not described in the specification. It is also possible to let For example, instead of detecting that the description of the specification of the invention document does not satisfy this condition, the warning information generation unit 2059 detects that the condition is set to the "mode for carrying out the invention" of the specification of the invention document. , and, it may be detected that the description, which is the content of "Example" or "Example n" (n is a natural number), is not satisfied. As a specific example, the warning information generation unit 2059 extracts each key phrase extracted from the claim of the invention document by the key phrase extraction unit 2051, and extracts the description of the invention document or the "form for carrying out the invention" of the specification. "", "Example", etc., and if the important phrase cannot be detected, it is assumed that this condition is not met, and indication information indicating the important phrase is included in the warning information.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書から重要語句抽出部2051により抽出された複数の重要語句各々が表す要素間が構成上の包含関係を有することが、要素間関係判別部2058により判別された場合において、構成上の包含関係にある要素同士の一方が物の要素であれば他方の要素も物の要素であり、その要素同士の一方が方法の要素であれば他方の要素も方法の要素であるという条件を、その要素同士が満たしていないことを検出したときには、その要素同士を示す各重要語句と、その要素同士が物及び方法の分類において整合しない旨とを示す指摘情報を、警告情報に含ませる。警告情報生成部2059は、ある重要語句が表す要素が方法の要素か否かを、例えば、その重要語句が、所定の方法語尾リストに列挙された語句を語尾として有するか否かにより判別する。所定の方法語尾リストは例えば、「方法」、「ステップ」、「手順」等を列挙したリストである。警告情報生成部2059は、この指摘情報に係る判別の処理においては、例えば、ある重要語句が表す要素が方法の要素でないと判別した場合には、その要素を、物の要素であるとして扱い得る。設定情報に、所定の方法語尾リストを含ませておくこととし、警告情報生成部2059は、設定情報取得部201により取得された設定情報中の所定の方法語尾リストを参照して、重要語句が表す要素が方法の要素か否かを判別することとしてもよい。 For example, the warning information generation unit 2059 determines that the elements represented by each of the multiple important phrases extracted by the important phrase extraction unit 2051 from the invention document acquired by the invention document acquisition unit 2021 have structural inclusion relationships. When determined by the inter-element relationship determining unit 2058, if one of the elements in the inclusion relationship on the structure is an entity element, the other element is also an entity element, and one of the elements is a method element. If it is detected that the elements do not satisfy the condition that the other element is also an element of the method, each key word indicating the elements and the elements are consistent in the classification of products and methods. The warning information includes indication information indicating that it should not be done. The warning information generation unit 2059 determines whether or not an element represented by an important phrase is a method element, for example, by determining whether or not the important phrase has a word or phrase listed in a predetermined method ending list as an ending. The predetermined method ending list is, for example, a list listing "method", "step", "procedure", and the like. In the determination process related to this indication information, the warning information generation unit 2059 can treat the element as an entity element if, for example, it determines that an element represented by a key phrase is not a method element. . The setting information includes a predetermined method ending list, and the warning information generation unit 2059 refers to the predetermined method ending list in the setting information acquired by the setting information acquisition unit 201, It may be determined whether or not the represented element is a method element.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に、日本国の特許出願に使用可能な文字コード以外の文字コードの文字を含まないという条件を、満たしていない記載が含まれていることを検出したときには、その記載における不適切な文字と、その文字が使用可能な文字コードで表されていない旨とを示す指摘情報を、警告情報に含ませる。日本国の特許出願に使用可能な文字コードは、JIS-X0208-1997「情報交換用漢字符号系」準拠のShift_JISコードである。なお、警告情報生成部2059は、その条件を満たしていない記載における不適切な文字に、所定の制御コード(例えばベル制御の「0x07」等)が含まれている場合には、その所定の制御コードを所定の文字(例えば「●」等)に変換することで制御コードによる制御を無効化して、変換後の不適切な文字を指摘情報に含ませてもよい。警告情報生成部2059は、例えば、不適切な文字の文字コードが丸付き数字に相当するものである場合において、丸付き数字が使用できない旨を明示的に指摘情報に含ませてもよい。 For example, the warning information generation unit 2059 does not satisfy the condition that the invention document acquired by the invention document acquisition unit 2021 does not contain characters with character codes other than those that can be used for patent applications in Japan. is detected, the warning information includes pointing information indicating inappropriate characters in the description and indicating that the characters are not represented by usable character codes. The character code that can be used for Japanese patent applications is the Shift_JIS code conforming to JIS-X0208-1997 "Kanji encoding system for information exchange". Note that if the inappropriate characters in the description that does not satisfy the conditions include a predetermined control code (for example, "0x07" for bell control), the warning information generation unit 2059 Control by the control code may be invalidated by converting the code into a predetermined character (such as "●"), and the inappropriate character after conversion may be included in the indication information. For example, when the character code of an inappropriate character corresponds to a circled number, the warning information generation unit 2059 may explicitly include in the indication information that the circled number cannot be used.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書のクレームに、クレームの項の項番は行順に沿って自然数の連続番号であることという条件を、満たしていない記載が含まれていることを検出したときには、その記載におけるクレームの項の項番と、その項の項番が不適切である旨とを示す指摘情報を、警告情報に含ませる。 The warning information generation unit 2059, for example, adds a description that does not satisfy the condition that the item number of the item in the claim of the invention document acquired by the invention document acquisition unit 2021 is a consecutive number of natural numbers along the line order. is included in the warning information, the item number of the claim item in the description and indication information indicating that the item number of the item is inappropriate are included in the warning information.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書のクレームに、クレームの項における引用先の項の項番は引用元の項の項番より小さい番号であるという条件を、満たしていない記載が含まれていることを検出したときには、その記載におけるクレームの引用元の項の項番と、その項の引用先の項の項番が不適切である旨とを示す指摘情報を、警告情報に含ませる。 For example, the warning information generation unit 2059 adds a condition to the claim of the invention document acquired by the invention document acquisition unit 2021 that the item number of the item to be quoted in the item of the claim is smaller than the item number of the item to be quoted. When it is detected that a description that does not satisfy The indication information is included in the warning information.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に、コメント行以外の行の行頭は全角の空白文字又は始め括弧(例えば始め隅付き括弧、始め丸括弧等)の文字であるという条件を、満たしていない行の記載が含まれていることを検出したときには、その行の記載内容と、行頭の文字が不適切な可能性がある旨とを示す指摘情報を、警告情報に含ませる。コメント行は、例えば、設定情報取得部201により取得された設定情報のコメント特定用情報に基づいて特定される。なお、発明文書において必ずしも行頭に全角の空白文字又は始め括弧の文字がある必要はないが、例えば発明文書を形式面で整備したい者に対する注意喚起として、この指摘情報が有用となり得る。また、警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に、コメント行以外の行の行末に句点文字「。」が存在する場合にその行頭は全角の空白文字であるという条件を、満たしていない行の記載が含まれていることを検出したときには、その行の記載内容と、行頭の文字が不適切な可能性がある旨とを示す指摘情報を、警告情報に含ませることとしてもよい。 For example, the warning information generation unit 2059 adds a double-byte blank character or an opening parenthesis (for example, an opening square bracket, an opening round bracket, etc.) to the invention document acquired by the invention document acquisition unit 2021, except for comment lines. When it is detected that a line that does not satisfy the condition of being a character is included, the content of the line and the indication information indicating that the character at the beginning of the line may be inappropriate, Include in warning information. The comment line is specified based on the comment specifying information of the setting information acquired by the setting information acquiring unit 201, for example. Although the invention document does not necessarily have to have full-width spaces or opening brackets at the beginning of the line, this indication information can be useful, for example, as a reminder to those who want to organize the invention document in terms of form. In addition, for example, if the invention document acquired by the invention document acquisition unit 2021 has a period character "." When it detects that a line that does not satisfy the condition that the may be included in

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に、読点文字及び句点文字は連続して記載されないという条件を、満たしていない記載が含まれていることを検出したときには、その記載の内容と、不適切な記載である旨とを示す指摘情報を、警告情報に含ませる。具体例としては、警告情報生成部2059は、発明文書取得部2021により取得された発明文書から、読点文字及び句点文字のいずれかが2つ以上連続している記載を探索し、そのような記載を検出したときに、指摘情報を警告情報に含ませる。具体的な一例として、警告情報生成部2059が、発明文書中に1つの読点文字と1つの句点文字とが連続している記載を検出した場合に、指摘情報を警告情報に含ませる例が、挙げられる。 For example, the warning information generation unit 2059 detects that the invention document acquired by the invention document acquisition unit 2021 includes descriptions that do not satisfy the condition that comma characters and full stop characters are not described consecutively. In some cases, the warning information includes the content of the description and indication information indicating that the description is inappropriate. As a specific example, the warning information generation unit 2059 searches the invention document acquired by the invention document acquisition unit 2021 for descriptions in which two or more comma characters or period characters are consecutive, and searches for such descriptions. is detected, the indication information is included in the warning information. As a specific example, when the warning information generation unit 2059 detects a description in which one comma character and one period character are consecutive in an invention document, an example of including indication information in the warning information is as follows. mentioned.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に要約書が含まれている場合において、要約書の要約の文字数が所定の上限文字数を超えないという条件を、満たしていない要約書の記載が含まれていることを検出したときには、要約の文字数が所定の上限文字数を超える旨を示す指摘情報を、警告情報に含ませる。この所定の上限文字数は、例えば400字である。具体例としては、警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書における要約書の見出し「要約」の後から見出し「選択図」の前までの記載の文字数を計数して、計数した文字数が所定の上限文字数を超えていれば、指摘情報を警告情報に含ませる。 For example, when the invention document acquired by the invention document acquisition unit 2021 includes an abstract, the warning information generation unit 2059 satisfies the condition that the number of characters in the abstract does not exceed a predetermined maximum number of characters. When it is detected that the description in the abstract is included, the warning information includes indication information indicating that the number of characters in the abstract exceeds a predetermined upper limit number of characters. This predetermined upper limit number of characters is, for example, 400 characters. As a specific example, the warning information generation unit 2059 counts the number of characters described after the headline “summary” and before the headline “selection drawing” in the invention document acquired by the invention document acquisition unit 2021, for example. Then, if the counted number of characters exceeds a predetermined upper limit number of characters, the indication information is included in the warning information.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書に複数の段落番号が記載されている場合において、複数の段落番号が、各々4桁のアラビア数字で表現される番号であり、「0001」から始まる連続番号であることという条件を、満たしていない段落番号の記載が含まれていることを検出したときには、その検出した段落番号と、段落番号の記載が不適切である旨とを示す指摘情報を、警告情報に含ませる。具体例としては、警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書において先頭から順に、始め隅付き括弧と終わり隅付き括弧との間に数字が記載されている形式の記載を段落番号として探索し、検出した段落番号が4桁のアラビア数字で表現されていない場合と、複数の段落番号が順に「0001」から始まる連続番号で記載されていない場合とにおいては、指摘情報を警告情報に含ませる。なお、警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書から検出した段落番号の数が9999を超える場合には、複数の段落番号が、各々4桁のアラビア数字で表現される番号であり、「0001」から始まる連続番号であることという条件の代わりに、複数の段落番号が、各々5桁のアラビア数字で表現される番号であり、「00001」から始まる連続番号であることという条件を用いて、その条件を満たしていない段落番号の記載が含まれている記載を検出したときに、指摘情報を警告情報に含ませる。 For example, when the specification of the invention document acquired by the invention document acquisition unit 2021 includes a plurality of paragraph numbers, the warning information generation unit 2059 expresses each of the plurality of paragraph numbers with four-digit Arabic numerals. When it detects that it contains a description of a paragraph number that does not satisfy the condition that it is a serial number starting from "0001", the detected paragraph number and the description of the paragraph number are The warning information includes indication information indicating that it is inappropriate. As a specific example, the warning information generation unit 2059 may, for example, determine that the specification of the invention document acquired by the invention document acquisition unit 2021 has a number written between the opening square bracket and the closing square bracket in order from the beginning. If the detected paragraph number is not represented by 4-digit Arabic numerals, or if multiple paragraph numbers are not listed in sequence starting with "0001" In , the indication information is included in the warning information. Note that, for example, when the number of paragraph numbers detected from the specification of the invention document acquired by the invention document acquisition unit 2021 exceeds 9999, the warning information generation unit 2059 converts each of the multiple paragraph numbers into four-digit numbers. Instead of the condition that the number be represented by Arabic numerals and be a sequential number starting from "0001", each of the paragraph numbers is a number represented by five digits of Arabic numerals, starting with "00001". Using the condition that the number should be a starting sequential number, when a description including a description of a paragraph number that does not satisfy the condition is detected, indication information is included in the warning information.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書において、数式の見出し、化学式の見出し、及び、表の見出しの各々が、クレーム、明細書等といった書類毎に、連続番号を付加した記載であることという条件を、満たしていない見出しの記載が含まれていることを検出したときには、その検出した見出しと、数式、化学式及び表のうち該当の見出しの記載が不適切である旨とを示す指摘情報を、警告情報に含ませる。ここで、数式の見出しは、始め隅付き括弧に後続する「数」の文字と終わり隅付き括弧との間に番号が記載されている形式の記載である。化学式の見出しは、始め隅付き括弧に後続する「化」の文字と終わり隅付き括弧との間に番号が記載されている形式の記載である。また、表の見出しは、始め隅付き括弧に後続する「表」の文字と終わり隅付き括弧との間に番号が記載されている形式の記載である。数式、化学式、表の各々の見出しに含まれる番号は、1つ以上のアラビア数字で構成される番号であってもよいし、そのような番号に、英数字、マイナス記号「-」、ピリオド文字「.」、始め丸括弧、及び、終わり丸括弧の、単体又は組み合わせで表現された枝番が付加された番号であってもよい。複数の数式の見出しが連続番号を付加した記載である一例としては、書類毎に「数1」、「数2」、「数3-1」、「数3-2」等といった順で数式の見出しが含まれている例が挙げられる。具体例としては、警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書、クレーム等といった書類毎において先頭から順に、始め隅付き括弧に後続する「数」と終わり隅付き括弧との間に番号が記載されている形式の記載を数式の見出しとして探索し、書類毎に検出した複数の数式の見出しが、順に、連続番号を付加した記載でない場合には、指摘情報を警告情報に含ませる。 For example, in the invention document acquired by the invention document acquisition unit 2021, the warning information generation unit 2059 is configured such that each of the headings of formulas, chemical formulas, and tables is continuously generated for each document such as a claim, a specification, and the like. When it is detected that the description of a heading that does not satisfy the condition that it is a description with a number added, the description of the detected heading and the corresponding heading among formulas, chemical formulas and tables is inappropriate. The warning information includes pointing information indicating that the Here, the formula heading is a description in the form of a number written between the letter "number" following the opening square bracket and the closing square bracket. A chemical formula heading is a description in the form of numbers placed between the letter "v" following the opening square bracket and the closing square bracket. Also, table headings are written in the form of numbers between the letters "table" following the opening square bracket and the closing square bracket. Numbers included in each heading of mathematical formulas, chemical formulas, and tables may be numbers composed of one or more Arabic numerals, and such numbers may include alphanumeric characters, the minus sign "-", and the period character. It may be a number to which a branch number expressed by single or a combination of ``.'', opening parenthesis, and closing parenthesis is added. As an example where the headings of multiple formulas are written with consecutive numbers, the formulas are listed in the order of "number 1", "number 2", "number 3-1", "number 3-2", etc. for each document. Examples include headings. As a specific example, the warning information generation unit 2059, for example, for each document such as the specification of the invention document acquired by the invention document acquisition unit 2021, such as a claim, sequentially from the beginning, the "number" following the square bracket at the beginning. A description in a format that includes a number between the closing square bracket is searched as a heading of mathematical formulas, and if multiple headings of mathematical formulas detected in each document are not sequentially numbered, Include indication information in warning information.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書において、図面の見出しの記載及び図面に関する記載には、適切な図面番号が付加されているという条件を、満たしていない図面の見出しの記載又は図面に関する記載が含まれていることを検出したときには、その検出した記載と、その記載が不適切である旨とを示す指摘情報を、警告情報に含ませる。ここで、図面の見出しは、始め隅付き括弧に後続する「図」の文字と終わり隅付き括弧との間に図面番号が存在する形式の記載である。図面に関する記載は、「図」の文字と所定の文字列(例えば、「参照」という文字列、助詞の文字列等)との間に図面番号が存在する形式の記載である。この所定の文字列は、例えば、予め固定的に定められていてもよいし、設定情報取得部201により取得される設定情報において定められていてもよい。「図」の文字に後続する適切な図面番号は、1つ以上のアラビア数字で構成される番号か、そのような番号に、英数字、マイナス記号「-」、ピリオド文字「.」、始め丸括弧、及び、終わり丸括弧の、単体又は組み合わせで表現された枝番が付加された番号である。適切な図面番号以外の図面番号は不適切な図面番号と扱う。具体例としては、警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書から、図面の見出しの記載及び図面に関する記載を探索し、検出した図面の見出しの記載又は図面に関する記載が、不適切な図面番号を含む場合には、指摘情報を警告情報に含ませる。 The warning information generation unit 2059 does not satisfy the condition that, for example, in the invention document acquired by the invention document acquisition unit 2021, appropriate drawing numbers are added to descriptions of headings of drawings and descriptions related to drawings. When it is detected that the description of the heading of the drawing or the description relating to the drawing is included, the detected description and indication information indicating that the description is inappropriate are included in the warning information. Here, the drawing headings are in the form of a description in which the drawing number is present between the word "Figure" following the opening square bracket and the closing square bracket. Descriptions relating to drawings are described in a format in which a drawing number is present between the character "figure" and a predetermined character string (for example, a character string "reference", a particle character string, etc.). This predetermined character string may be fixed in advance, or may be set in the setting information acquired by the setting information acquiring unit 201, for example. The appropriate drawing number following the word "figure" is a number consisting of one or more Arabic numerals or such number plus alphanumeric characters, a minus sign "-", a period character "." It is the number of the parenthesis and the closing parenthesis added with the branch number expressed singly or in combination. Drawing numbers other than proper drawing numbers are treated as improper drawing numbers. As a specific example, the warning information generation unit 2059 searches the invention document acquired by the invention document acquisition unit 2021 for the description of the heading of the drawing and the description related to the drawing, and If the description includes an inappropriate drawing number, the warning information includes the indication information.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に、番号「n」が付加された見出し「特許文献n」、「非特許文献n」、或いは、「実施例n」の記載が存在する場合において、これらの見出しには適切な番号が付加されているという条件を、満たしていないこれらの見出しの記載が含まれていることを検出したときには、その検出した見出しの記載と、その見出しの記載における番号が不適切である旨とを示す指摘情報を、警告情報に含ませる。適切な番号は、自然数を表すアラビア数字で記載され、見出し「特許文献n」、「非特許文献n」及び「実施例n」の各々における記載順に、枝番のない連続番号で記載された番号である。具体例としては、警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書から、番号「n」が付加された「特許文献n」、「非特許文献n」、或いは、「実施例n」の記載を探索し、検出した記載が、適切でない番号を含む場合には、指摘情報を警告情報に含ませる。 For example, the warning information generation unit 2059 generates a headline “patent document n”, “non-patent document n”, or “example n” with the number “n” added to the invention document acquired by the invention document acquisition unit 2021. ” exists, and when it is detected that it contains the description of these headings that do not satisfy the condition that these headings are appropriately numbered, the detected headings The warning information includes the description and indication information indicating that the number in the description of the heading is inappropriate. Appropriate numbers are written in Arabic numerals representing natural numbers, and are consecutive numbers without secondary numbers in the order of description in each of the headings "Patent document n", "Non-patent document n" and "Example n" is. As a specific example, the warning information generation unit 2059 extracts, for example, from the invention document acquired by the invention document acquisition unit 2021, "patent document n" or "non-patent document n" to which the number "n" is added, or The description of "Example n" is searched, and if the detected description includes an inappropriate number, the indication information is included in the warning information.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に、その発明文書から重要語句抽出部2051により抽出された重要語句に誤記がないという条件を、満たしていない可能性のある重要語句の記載が含まれていることを検出したときには、その検出した重要語句の記載と、その重要語句に誤記の可能性がある旨とを示す指摘情報を、警告情報に含ませる。具体例としては、警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書から重要語句抽出部2051により抽出された2つの重要語句同士が互いに1文字だけ異なる語句である場合に、その2つの重要語句のいずれかに誤記の可能性があるので、注意喚起等のために、その2つの重要語句と、そのいずれかに誤記の可能性がある旨とを示す指摘情報を警告情報に含ませる。互いに1文字だけ異なる2つの重要語句の一例は、その2つのうち一方の重要語句を構成するいずれかの1文字を削除した場合に、その2つのうち一方の重要語句と、その2つのうち他方の重要語句とが同一となるところの2つの重要語句である。互いに1文字だけ異なる2つの重要語句の別の一例は、その2つのうち一方の重要語句を構成する、先頭からn番目(nは自然数)の1文字を削除して、かつ、その2つのうち他方の重要語句を構成する、先頭からn番目の1文字を削除した場合に、削除後のその一方の重要語句と、削除後のその他方の重要語句とが同一となるところの2つの重要語句である。警告情報生成部2059は、指摘情報に、その2つの重要語句各々の、発明文書中における記載数、発明文書の明細書中における記載数等を含ませることとしてもよい。具体的な一例としては、発明文書に「赤外線センサー」と「赤外線センサ」という2つの重要語句が含まれている場合に、警告情報生成部2059により、指摘情報に、その2つの重要語句のいずれかに誤記の可能性があることが示される例が挙げられる。具体的な別の一例としては、発明文書に「照明制御プログラム記録媒体」と「照明制御プログラム記憶媒体」という2つの重要語句が含まれている場合、或いは、発明文書に「照明制御装置」と「証明制御装置」という2つの重要語句が含まれている場合に、警告情報生成部2059により、指摘情報に、その2つの重要語句のいずれかに誤記の可能性があることが示される例が、挙げられる。ここでは、警告情報生成部2059が、発明文書から抽出された2つの重要語句同士が、互いに1文字だけ異なる2つの重要語句である場合に、誤記の可能性がある旨等を示す指摘情報を警告情報に含ませる例を示した。この例を変形して、警告情報生成部2059が、発明文書から抽出された2つの重要語句同士が、所定の第1文字数(例えば5文字)より大きい文字数の語句同士である場合においては、その重要語句同士が互いに所定の第2文字数(例えば2文字)だけ異なる2つの重要語句であるときに、誤記の可能性がある旨等を示す指摘情報を警告情報に含ませることとしてもよい。 For example, the warning information generation unit 2059 may not satisfy the condition that the invention document acquired by the invention document acquisition unit 2021 does not contain any typographical errors in the key phrases extracted from the invention document by the key phrase extraction unit 2051. When it is detected that a description of a certain key word is included, the warning information includes the description of the detected key word and indication information indicating that there is a possibility that the key word is erroneously written. As a specific example, the warning information generation unit 2059 detects two important phrases extracted by the important phrase extraction unit 2051 from the invention document acquired by the invention document acquisition unit 2021. In addition, since there is a possibility that one of the two important phrases has a typographical error, for the purpose of calling attention, etc., provide indication information indicating the two important phrases and the possibility of a typographical error in one of them. Include in warning information. An example of two key phrases that differ from each other by one letter is that if one of the two key phrases is deleted, one of the two key phrases and the other of the two key phrases are deleted. are two key phrases where the key phrases of are identical. Another example of two key phrases that differ from each other by one letter is to delete one n-th (n is a natural number) letter from the beginning that constitutes one of the two key phrases, and Two important phrases in which, when the n-th character from the beginning of the other important phrase is deleted, the one important phrase after deletion and the other important phrase after deletion are the same. is. The warning information generating unit 2059 may include the number of descriptions of each of the two important terms in the invention document, the number of descriptions in the specification of the invention document, and the like in the indication information. As a specific example, if an invention document contains two key phrases “infrared sensor” and “infrared sensor”, the warning information generation unit 2059 may include any of the two key phrases in the indication information. Here are some examples of possible typos. As another specific example, if the invention document contains two important phrases, "lighting control program recording medium" and "lighting control program storage medium", or if the invention document contains "lighting control device" An example is an example in which, when two important phrases “certification control device” are included, the warning information generation unit 2059 indicates that there is a possibility that one of the two important phrases may be erroneously written in the indication information. , are mentioned. Here, the warning information generation unit 2059 generates indication information indicating the possibility of a typographical error when two important phrases extracted from the invention document are two important phrases that differ from each other by only one character. An example of what is included in the warning information is shown. By modifying this example, the warning information generation unit 2059 determines that when two key words extracted from an invention document are words with a number of characters greater than a predetermined first number of characters (for example, 5 characters), When the important phrases are two important phrases that differ from each other by a predetermined second number of characters (for example, two characters), the warning information may include indication information indicating the possibility of a spelling error.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に、その発明文書から重要語句抽出部2051により抽出された同一概念を表す重要語句の記載が形式的に統一されているという条件を、満たしていない複数の重要語句の記載が含まれていることを検出したときには、その検出した、形式的に統一されていない複数の重要語句の記載と、その重要語句の記載が形式的に不統一である旨とを示す指摘情報を、警告情報に含ませる。この場合に、警告情報生成部2059は、指摘情報に、その記載が形式的に不統一である複数の重要語句各々の発明文書中における記載数、発明文書の明細書中における記載数等を含ませることとしてもよい。具体例としては、警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書から重要語句抽出部2051により抽出された2つの重要語句同士が互いに、半角か全角かが異なるだけで同一の意味を表す文字を1文字以上含んでいる場合に、その2つの重要語句の表記が形式的に不統一であるので、注意喚起等のために、指摘情報を警告情報に含ませる。具体的な一例としては、発明文書に全角文字の「1」を含む「第1センサ」と、半角文字の「1」を含む「第1センサ」という2つの重要語句が含まれている場合に、警告情報生成部2059により、指摘情報に、その2つの重要語句の表記が形式的に不統一であることが示される例が挙げられる。 The warning information generation unit 2059, for example, forms the description of key phrases representing the same concept extracted from the invention document by the key phrase extraction unit 2051 into the invention document acquired by the invention document acquisition unit 2021. When it is detected that multiple important phrases that do not satisfy the condition that the The warning information includes indication information indicating that the information is formally inconsistent. In this case, the warning information generation unit 2059 includes, in the indication information, the number of descriptions in the invention document of each of the plurality of important terms whose descriptions are formally inconsistent, the number of descriptions in the specification of the invention document, and the like. It is also possible to let As a specific example, the warning information generation unit 2059 extracts two important phrases extracted by the important phrase extraction unit 2051 from the invention document acquired by the invention document acquisition unit 2021. When one or more characters representing the same meaning are included in the warning information, the indication information is included in the warning information for the purpose of drawing attention, etc., because the notation of the two key words is formally inconsistent. As a specific example, if the invention document contains two important phrases, "first sensor" containing a full-width character "1" and "first sensor" containing a half-width character "1", , the warning information generation unit 2059 indicates that the notation of the two key words is formally inconsistent in the indication information.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書中において、「符号の説明」の欄で記載された符号と要素名との関係と整合するように、要素名に付加された符号の記載がなされるという条件を、満たしていない記載が含まれていることを検出した場合には、その検出した要素名と符号と、「符号の説明」の欄でのその要素名に対応する符号と、符号が整合しない旨とを示す指摘情報を、警告情報に含ませる。具体例としては、発明文書の明細書に「第1機器102は」という記載が含まれており、更に、「符号の説明」の欄で、「101 第1機器」、「102 第2機器」等の記載が含まれている場合には、警告情報生成部2059により、指摘情報に、明細書中の「第1機器102」の符号が「符号の説明」中の「101」と整合しない旨の情報が、含まれる例が挙げられる。 The warning information generation unit 2059, for example, in the specification of the invention document acquired by the invention document acquisition unit 2021, so as to be consistent with the relationship between the code and the element name described in the "Description of code" column, If it is detected that a description that does not satisfy the condition that the code attached to the element name is described is included, the detected element name and code, and the "description of code" column The warning information includes the code corresponding to the element name of and indication information indicating that the code does not match. As a specific example, the description of the invention document includes the description "the first device 102", and furthermore, in the column of "description of symbols", "101 first device" and "102 second device" , etc., the warning information generation unit 2059 generates a message indicating that the code of "first device 102" in the specification does not match "101" in the "description of code". The information of is included, for example.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に対しての所定の条件に基づく指摘等を示す指摘情報を、警告情報に含ませる場合に、指摘等の理由のユーザへの説明、その指摘の対象となった記載が招く不利益についてのユーザへの説明、又は、その指摘の対象となった記載を適切に修正するための方法のユーザへの説明を示す説明メッセージを含んでもよい。この説明メッセージにおける理由の説明には、例えば指摘の根拠となる、法令の条項、判例等の情報、或いは、指摘に関連する参考資料の情報を、含ませてもよい。この説明メッセージは、例えば、指摘情報の指摘等の基礎となった条件毎に、固定的に定められていてもよいし、設定情報取得部201により取得される設定情報において定められていてもよいし、その条件に応じて予め定められたアルゴリズムに従って警告情報生成部2059によって生成されてもよい。 For example, the warning information generation unit 2059, when including in the warning information, indication information indicating an indication based on a predetermined condition with respect to the invention document acquired by the invention document acquisition unit 2021, indicates the reason for the indication. An explanation to the user, an explanation to the user about the disadvantage caused by the description that is the target of the indication, or an explanation to the user of a method for appropriately correcting the description that is the target of the indication May contain messages. The explanation of the reason in this explanation message may include, for example, information such as legal provisions and judicial precedents that serve as the basis for the indication, or information on reference materials related to the indication. For example, the explanation message may be fixedly defined for each condition that is the basis of pointing out the pointing information, or may be defined in the setting information acquired by the setting information acquisition unit 201. However, it may be generated by the warning information generator 2059 according to a predetermined algorithm according to the conditions.

[3-1-5-6-3.料金に係る指摘等]
警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書のクレームの項数が、発明文書に基づく特許出願を米国、欧州等の所定地域で行った場合において、その所定地域における特許出願等に必要となる料金が比較的急増する境界となる所定の数を超えているときには、その旨を指摘する指摘情報を警告情報に含ませる。この所定の数は、例えば、設定情報取得部201により取得される設定情報で定義されることとしてもよい。警告情報生成部2059は、指摘情報に、その出願先となり得る所定地域を示す情報を含ませてもよい。また、警告情報生成部2059は、複数の所定地域毎に、指摘情報を、警告情報に含ませてもよい。
[3-1-5-6-3. Pointing out fees, etc.]
For example, when the claim number of the invention document acquired by the invention document acquisition unit 2021 is a patent application based on the invention document in a prescribed region such as the United States or Europe, the warning information generation unit 2059 When the fees required for patent applications, etc., in Japan exceed a predetermined number that serves as a boundary for a relatively rapid increase, the warning information includes indication information to that effect. This predetermined number may be defined by setting information acquired by the setting information acquiring unit 201, for example. The warning information generation unit 2059 may include information indicating a predetermined area where the application may be made in the indication information. In addition, the warning information generation unit 2059 may include the indication information in the warning information for each of a plurality of predetermined areas.

また、警告情報生成部2059は、設定情報での指定又は発明文書分析システム20のユーザによる指定に応じて、各所定地域に関連した各種の指摘情報を警告情報に含ませるか否かを決定し、その決定に従って指摘情報の生成を行うこととしてもよい。具体例としては、警告情報生成部2059は、例えば設定情報等で「米国」が指定されていた場合に限って、米国に関連した各種の指摘情報の生成を行って、その生成した指摘情報を警告情報に含ませることとしてもよい。 In addition, the warning information generation unit 2059 determines whether or not to include various indication information related to each predetermined area in the warning information in accordance with the designation in the setting information or the designation by the user of the invention document analysis system 20. , the indication information may be generated according to the determination. As a specific example, the warning information generation unit 2059 generates various indication information related to the United States only when "United States" is specified in the setting information, etc., and sends the generated indication information. It may be included in the warning information.

[3-1-5-6-4.警告情報に含まれる指摘情報に関連する情報]
警告情報生成部2059は、上述した各条件等に基づいて、1つ以上の指摘情報を、出力部208が出力する特許出願関連情報の一部としての警告情報に含ませる場合に、所定の指摘レベルの基準に基づいて、指摘情報毎に、その指摘情報が指摘する内容、その指摘情報の基礎となった条件等に応じて、指摘レベルを判定することとしてもよい。所定の指摘レベルの基準の例としては、例えば、対応する指摘情報が指摘する内容が重要である程、指摘レベルを高くなるように判定するための基準が、挙げられる。所定の指摘レベルの基準の別の例としては、指摘情報の対象となった発明文書と、その発明文書を適切に翻訳した場合に生成されると想定される翻訳結果文書とがその指摘情報に対応した語句の単位で不一致となる可能性が高い程、指摘レベルを高くなるように判定するための基準が、挙げられる。発明文書と翻訳結果文書とが語句の単位で不一致となる可能性が相対的に高い例としては、例えば、発明文書中に誤記があることを指摘する指摘情報の例が、挙げられ、相対的に低い例としては、例えば、発明文書中の要素に付加されるべき符号の記載漏れを指摘する指摘情報の例が、挙げられる。所定の指摘レベルの基準の更に別の例としては、指摘情報の対象となった発明文書の記載が、適切な翻訳を可能にするための文書の品質を大きく低下させる可能性が高い程、指摘レベルを高くなるように判定するための基準が、挙げられる。指摘情報の対象となった発明文書の記載が、適切な翻訳を可能にするための文書の品質を大きく低下させる可能性が高い例としては、例えば、発明文書のクレームの一項における被参照語句(つまり参照文字列に後続する語句)の記載が、その項のその記載に先行する部分又はその項の引用先の項又は引用の連鎖先の項に記載されていないという例が、挙げられる。
[3-1-5-6-4. Information related to the indication information included in the warning information]
The warning information generation unit 2059, based on the above-described conditions and the like, includes one or more pieces of indication information in the warning information as a part of the patent application related information output by the output unit 208. Based on the level criteria, the indication level may be determined for each piece of indication information according to the content pointed out by the indication information, the conditions on which the indication information is based, and the like. Examples of criteria for the predetermined indication level include, for example, criteria for determining that the more important the content pointed out by the corresponding indication information, the higher the indication level. Another example of a predetermined indication level criterion is that the invention document that is the subject of the indication information and the translation result document that is assumed to be generated when the invention document is properly translated are included in the indication information. Criteria for determining such that the higher the possibility of disagreement in units of corresponding words and phrases, the higher the pointing level. An example of a relatively high possibility of a discrepancy in word units between the invention document and the translation result document is, for example, pointing information pointing out that there is a clerical error in the invention document. A low example is, for example, indication information pointing out the omission of a code to be added to an element in an invention document. As yet another example of a predetermined indication level criterion, the more likely the description of the invention document that was the subject of the indication information to materially degrade the quality of the document to allow for proper translation, the more likely the indication will be. Criteria for judging levels to be high include: As an example where the description of the invention document that is the subject of the indicated information is highly likely to significantly degrade the quality of the document to enable appropriate translation, for example, the referenced word in one of the claims of the invention document (i.e., the term following the reference string) is not described in the preceding part of the section, the section to which the section is cited, or the section to which the citation is linked.

警告情報生成部2059は、指摘レベルの判定結果に応じて、指摘情報中に対応する指摘レベルを表してもよいし、警告情報中に、指摘レベルの高い順に、指摘情報を含ませることとしてもよい。警告情報生成部2059は、例えば、指摘事項が、翻訳用発明文書標準規定取得部204により取得された翻訳用発明文書標準規定の条件項目毎に対応した条件に基づいて指摘される場合と、翻訳用発明文書標準規定以外の条件に基づいて指摘される場合とのうちの、一方又は両方の場合において、指摘レベルの判定を行い得る。 The warning information generation unit 2059 may indicate the corresponding indication level in the indication information according to the indication level determination result, or include the indication information in the warning information in descending order of the indication level. good. The warning information generating unit 2059, for example, when the pointed out item is pointed out based on the condition corresponding to each condition item of the invention document standard specification for translation acquired by the acquisition unit 204 of the standard specification for invention document for translation, The indication level can be determined in one or both of cases in which the invention is pointed out based on conditions other than the standard provisions for invention documents.

警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に対しての、指摘する指摘情報の数に基づいて、或いは、その指摘情報の数と指摘情報毎の指摘レベルとに基づいて、予め定めた演算式により評価値を算定して、算定した評価値を含む発明文書評価情報を、警告情報に含ませることとしてもよい。予め定めた演算式は、一例としては、警告情報内の指摘情報各々の指摘レベルの値の総和を評価値とする式である。この場合に、警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書のクレームの記載に対しての、指摘する指摘情報の数に基づいて、或いは、その指摘情報の数と指摘情報毎の指摘レベルとに基づいて、予め定めた演算式により評価値を算定して、算定した、クレームの記載に係る評価値を含む発明文書評価情報を、警告情報に含ませることとしてもよい。また、警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書の明細書の記載に対しての、指摘する指摘情報の数に基づいて、或いは、その指摘情報の数と指摘情報毎の指摘レベルとに基づいて、予め定めた演算式により評価値を算定して、算定した、明細書の記載に係る評価値を含む発明文書評価情報を、警告情報に含ませることとしてもよい。警告情報生成部2059は、例えば、発明文書取得部2021により取得された発明文書に対しての、翻訳用発明文書標準規定の条件項目毎に対応した条件に基づいて指摘する指摘情報の数に基づいて、或いは、その指摘情報の数と指摘情報毎の指摘レベルとに基づいて、例えば翻訳用発明文書標準規定への適合の度合いを表す指標を示すように、予め定めた演算式により、その指標となる評価値を算定して、算定した評価値を含む発明文書評価情報を、警告情報に含ませることとしてもよい。 The warning information generation unit 2059 generates, for example, based on the number of indication information pointed out for the invention document acquired by the invention document acquisition unit 2021, or the number of indication information and the indication level for each indication information. Based on this, an evaluation value may be calculated by a predetermined arithmetic expression, and the invention document evaluation information including the calculated evaluation value may be included in the warning information. The predetermined arithmetic expression is, for example, an expression in which the sum of the indication level values of each item of indication information in the warning information is used as an evaluation value. In this case, the warning information generation unit 2059, for example, based on the number of indication information pointed out in the claim description of the invention document acquired by the invention document acquisition unit 2021, or the number of indication information and the indication level for each indication information, the evaluation value is calculated by a predetermined arithmetic expression, and the invention document evaluation information including the calculated evaluation value related to the statement of the claim is included in the warning information. good too. In addition, the warning information generation unit 2059, for example, for the description of the specification of the invention document acquired by the invention document acquisition unit 2021, based on the number of indication information pointed out, or the number of indication information An evaluation value is calculated by a predetermined arithmetic expression based on the indication level for each indication information, and the invention document evaluation information including the calculated evaluation value related to the description of the specification is included in the warning information. good too. The warning information generation unit 2059, for example, for the invention document acquired by the invention document acquisition unit 2021, based on the number of indication information pointed out based on the conditions corresponding to each condition item of the invention document standard specification for translation Alternatively, based on the number of indication information and the indication level for each indication information, for example, the index is calculated by a predetermined arithmetic expression so as to indicate the degree of conformity to the standard provisions of invention documents for translation. It is also possible to calculate the evaluation value to be the value, and include the invention document evaluation information including the calculated evaluation value in the warning information.

警告情報生成部2059は、例えば、設定情報取得部201が取得した、技術分野別、発明者の所属部門別等といったグループ別に、定義された複数の設定情報のうち、いずれかの設定情報が用いられて定まった条件に基づいて、発明文書取得部2021により取得された発明文書に対して指摘される指摘情報を、警告情報に含ませる場合に、その用いられた設定情報が属するグループを識別する情報を、対応する指摘情報に含ませることとしてもよい。 The warning information generation unit 2059 uses one of the plurality of setting information acquired by the setting information acquisition unit 201, which is defined for each group such as by technical field or by department to which the inventor belongs. When the warning information includes indication information pointed out to the invention document acquired by the invention document acquisition unit 2021 based on the conditions determined and determined, the group to which the used setting information belongs is identified. The information may be included in the corresponding indication information.

警告情報生成部2059は、例えば、全部又は一部の指摘情報に、対応する指摘の対象となった発明文書の記載部分の行の情報(例えば行番号)、その部分のクレームの項番、及び、その部分の明細書における段落番号の少なくとも1つを含ませることとしてもよい。警告情報生成部2059が、警告情報における各指摘情報に、指摘の対象となった発明文書の記載部分の行番号を含ませる場合には、出力部208は、その警告情報を含む特許出願関連情報に、発明文書の各行へ行番号を追加した記載を含ませて、特許出願関連情報を出力することが有用となる。 For example, the warning information generation unit 2059, for all or part of the indication information, includes line information (for example, line number) of the description part of the invention document that is the target of the corresponding indication, the claim number of that part, and , may include at least one of the paragraph numbers in that part of the specification. When the warning information generation unit 2059 includes the line number of the description part of the invention document that is the target of the warning information in each piece of indication information in the warning information, the output unit 208 outputs the patent application related information including the warning information. It is useful to output patent application related information by including a description in which the line number is added to each line of the invention document.

[3-1-5-6-5.表示用文書における警告情報部分の生成]
発明文書分析システム20において出力部208が、警告情報を含む特許出願関連情報を、表示用文書(例えばHTML5に準拠したHTML文書)として出力する場合には、警告情報生成部2059は、表示用文書としての特許出願関連情報に含まれる警告情報を生成する。
[3-1-5-6-5. Generation of Warning Information Part in Document for Display]
When the output unit 208 in the invention document analysis system 20 outputs the patent application-related information including the warning information as a display document (for example, an HTML document conforming to HTML5), the warning information generation unit 2059 outputs the display document Generate warning information included in the patent application related information as.

警告情報生成部2059が生成する、表示用文書としての特許出願関連情報の警告情報部分は、例えば1つ以上の表示要素を含む。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。 The warning information portion of the patent application-related information as a display document generated by the warning information generation unit 2059 includes, for example, one or more display elements. For example, a browser may interpret the presentation document to display each presentation element.

警告情報部分に含まれる1つ以上の表示要素は、例えばいずれかの指摘情報の全部又は一部の内容を表示可能にする。警告情報部分に含まれる表示要素には、リンク属性を有するものが含まれてもよい。警告情報部分に含まれる表示要素には、警告情報生成部2059により、例えば、指摘情報で示された記載(例えば不適切な可能性のある記載)の該当記載箇所へのリンクのため(つまりブラウザへの操作に応じて指摘情報で示された記載の記載箇所へ表示を遷移させるため)のGUI要素としてその表示要素を機能させるための表示制御情報が付加され得る。リンク先となる該当記載箇所は、例えば、表示用文書としての特許出願関連情報に含まれる発明文書の該当部分(例えば該当行)、表示用文書としての特許出願関連情報に含まれるクレーム情報中の該当部分(例えば該当項)、或いは、表示用文書としての特許出願関連情報に含まれる明細書情報中の該当部分(例えば該当段落)等である。表示制御情報は、例えば、表示要素に付加したタグ(例えばHTML5に準拠したHTMLタグ)内に、操作種別(例えば、マウスクリック操作)に対応付けて、該当記載箇所へ表示を遷移させるためのスクリプトの関数等を記述して構成される情報である。表示用文書としての警告情報において、クレーム中の不適切な記載を指摘する1つの指摘情報を表示する表示要素の具体例としては、HTML文書内で警告情報とクレーム情報とが各々各<article>タグと</article>タグとで挟まれて記述されている場合において警告情報の<article>タグ配下に指摘情報の内容を例えば<span>タグと</span>タグとで挟んで記述し、その<span>タグ内に、マウスクリック操作等に応じて起動させるJavaScript(登録商標)における関数の関数名等を記述する例が挙げられる。この関数は、例えば、ブラウザに読み込まれる、HTML文書のHTMLファイル中で指定されたスクリプトファイルに記述され、例えば、クレーム情報の<article>を表示した上で、指摘情報に係るクレーム中の不適切な記載を探索して表示する処理を行うための関数である。警告情報において表示要素での表示内容となり得る指摘情報が、対応する指摘の対象となった発明文書の記載部分の行番号、その部分のクレームの項番、或いは、その部分の明細書における段落番号を含んでいる場合には、警告情報生成部2059は、その表示要素に付加される表示制御情報の生成において、その行番号、クレームの項番、或いは、段落番号を、操作に応じて起動させるスクリプトの関数への引数として利用することとしてもよい。この引数の利用により、関数において、発明文書における不適切であった行の表示、クレーム情報における不適切であったクレームの項の表示、明細書情報における不適切であった段落の表示等の処理を、比較的容易に実現できる。なお、表示用文書としての特許出願関連情報における発明文書、クレーム情報、或いは、明細書情報は、警告情報における指摘情報での指摘に対応した不適切な記載を修正したものであってもよい。 One or more display elements included in the warning information portion enable display of all or part of any indication information, for example. Display elements included in the warning information portion may include those having a link attribute. The warning information generation unit 2059 generates a display element included in the warning information part, for example, for a link to the relevant description part of the description (for example, a potentially inappropriate description) indicated by the indication information (that is, a browser display control information for causing the display element to function as a GUI element for transitioning the display to the description location indicated by the pointing information according to the operation to . For example, the relevant description part to be the link destination is the relevant part (for example, the relevant line) of the invention document included in the patent application related information as the display document, or the claim information included in the patent application related information as the display document. The corresponding part (for example, the relevant section), or the relevant part (for example, the relevant paragraph) in the specification information included in the patent application related information as the display document. For example, the display control information is associated with an operation type (for example, a mouse click operation) in a tag added to a display element (for example, an HTML tag conforming to HTML5), and a script for transitioning the display to the corresponding description location. It is information configured by describing the functions of In warning information as a display document, as a specific example of a display element that displays a piece of indication information pointing out inappropriate descriptions in a claim, warning information and complaint information are each <article> in an HTML document. In the case where it is described sandwiched between the tag and the </article> tag, the content of the indication information is described under the <article> tag of the warning information sandwiched between, for example, the <span> tag and the </span> tag, In the <span> tag, there is an example of describing a function name of a function in JavaScript (registered trademark) to be activated in response to a mouse click operation or the like. For example, this function is written in a script file specified in an HTML file of an HTML document that is read by a browser. This is a function to search for and display a description that is The indicated information that can be displayed in the display element in the warning information is the line number of the description part of the invention document that is the subject of the corresponding indication, the claim number of that part, or the paragraph number of that part of the specification , the warning information generation unit 2059 activates the line number, claim item number, or paragraph number in response to the operation in generating the display control information added to the display element. It may be used as an argument to a script function. By using this argument, the function displays inappropriate lines in the invention document, inappropriate claim sections in the claim information, and inappropriate paragraphs in the specification information. can be realized relatively easily. The invention document, claim information, or specification information in the patent application-related information as the display document may be corrected inappropriate descriptions corresponding to the pointed out information in the warning information.

指摘情報を表示内容としてリンク属性を有する表示要素は、一例としては、指摘情報で指摘した不適切な記載の該当記載箇所を指定したリンク用の<a>タグ(つまりアンカータグ)を表示制御情報として含んでもよい。 A display element having a link attribute with indication information as the display content is, for example, an <a> tag (that is, an anchor tag) for a link that specifies the appropriate description part of the inappropriate description pointed out in the indication information as display control information. may be included as

表示用文書としての特許出願関連情報における警告情報部分で、指摘情報に係る表示要素のリンク先となる該当記載箇所は、例えば、表示用文書としての特許出願関連情報に含まれる修正版クレーム情報中の該当部分(例えば該当項)、或いは、表示用文書としての特許出願関連情報に含まれる修正版明細書情報中の該当部分(例えば該当段落)等であってもよい。表示用文書としての特許出願関連情報における修正版クレーム情報は、発明文書のクレームに相当する内容であって、警告情報における指摘情報での指摘に対応した不適切な記載を修正した内容を含み得る。また、表示用文書としての特許出願関連情報における修正版明細書情報は、発明文書の明細書に相当する内容であって、警告情報における指摘情報での指摘に対応した不適切な記載を修正した内容を含み得る。 In the warning information part of the patent application-related information as a display document, the relevant description part that is the link destination of the display element related to the indication information is, for example, in the modified claim information included in the patent application-related information as a display document , or the relevant part (for example, the relevant paragraph) in the modified specification information included in the patent application-related information as the display document. The corrected claim information in the patent application-related information as a display document is the content corresponding to the claim in the invention document, and may include the corrected content of the inappropriate description corresponding to the indication in the indication information in the warning information. . In addition, the revised specification information in the patent application-related information as a display document has contents equivalent to the specification of the invention document, and the inappropriate description corresponding to the indication in the indication information in the warning information has been corrected. can contain content.

警告情報生成部2059は、表示用文書における警告情報を生成する場合に、警告情報に含ませる1つ以上の各指摘情報について、その指摘情報に対応する指摘レベルを決定し、その指摘情報を表示するための表示要素に、その決定した指摘レベルに応じた表示態様でその指摘情報を表示するための表示制御情報を付加することとしてもよい。一例としては、警告情報生成部2059は、ブラウザにより警告情報の1つ以上の指摘情報が表示される場合に、その各指摘情報に、その指摘情報の指摘レベルが所定閾値を超えるか否かに応じて選択的に「エラー(Error)」又は「警告(Warning)」の文字を付加して表示するように表示制御情報を生成してもよい。また別の一例としては、警告情報生成部2059は、ブラウザにより警告情報の1つ以上の指摘情報が表示された場合に、各指摘情報がその指摘情報の指摘レベルに応じた色で表示されるように表示制御情報を生成してもよい。この色を相違させる具体例としては、警告情報生成部2059は、HTML文書に含ませる指摘情報の前に付加した<span>タグに指摘レベルに応じたクラス名を付加し、HTML文書の一部としてブラウザに読み込まれるようにしたCSSファイルでその指摘レベル毎に応じたクラス名毎に相違するように、クラスの表示属性としての文字色、文字背景色等を定義する例が、挙げられる。 When generating warning information in a display document, the warning information generation unit 2059 determines a warning level corresponding to one or more pieces of warning information to be included in the warning information, and displays the warning information. Display control information for displaying the indication information in a display mode corresponding to the determined indication level may be added to the display element for displaying the indication information. As an example, when one or more pieces of indication information of warning information are displayed by a browser, the warning information generation unit 2059 adds to each piece of indication information whether or not the indication level of the indication information exceeds a predetermined threshold value. The display control information may be generated so as to selectively add and display the characters "Error" or "Warning" accordingly. As another example, the warning information generation unit 2059 displays each piece of indication information in a color corresponding to the indication level of the indication information when one or more pieces of indication information of the warning information are displayed by the browser. The display control information may be generated as follows. As a specific example of using different colors, the warning information generation unit 2059 adds a class name corresponding to the level of indication to the <span> tag added before indication information to be included in the HTML document, and adds a class name corresponding to the indication level to the HTML document. For example, a CSS file that is read by a browser defines a character color, character background color, etc. as display attributes of a class so that it differs for each class name corresponding to each indication level.

警告情報生成部2059は、表示用文書における警告情報を生成する場合に、警告情報に含ませる1つ以上の各指摘情報について、その指摘情報を表示するための表示要素に、操作に応じてその指摘情報で指摘する記載を修正して修正結果を修正版クレーム情報又は修正版明細書情報の一部とする処理を実行するためのGUIとしての機能を持たせる表示制御情報を付加してもよい。具体例としては、警告情報生成部2059は、例えば、発明文書から抽出された2つの重要語句同士が、互いに1文字だけ異なる2つの重要語句である場合に、表示用文書における警告情報に、誤記の可能性がある旨等を示す指摘情報の表示要素を含ませ、その表示要素に、その2つ重要語句のいずれかを選択させて、その選択結果を修正版クレーム情報又は修正版明細書情報に反映させるGUIとしての機能を持たせる表示制御情報を付加してもよい。また別の具体例としては、警告情報生成部2059は、例えば、発明文書から抽出された2つの重要語句同士が、互いに半角か全角かが異なるだけで同一の意味を表す文字を1文字以上含んでいる場合に、表示用文書における警告情報に、表記が不統一である旨等を示す指摘情報の表示要素を含ませ、その表示要素に、その2つ重要語句のいずれかを選択させて、その選択結果を修正版クレーム情報又は修正版明細書情報に反映させるGUIとしての機能を持たせる表示制御情報を付加してもよい。 When generating warning information in a document for display, the warning information generation unit 2059 adds one or more pieces of indication information to be included in the warning information to a display element for displaying the indication information in accordance with an operation. Display control information may be added to provide a GUI function for correcting the description indicated by the indicated information and making the correction result part of the corrected claim information or corrected specification information. . As a specific example, the warning information generation unit 2059 may generate warning information in the display document in the case where two key phrases extracted from the invention document are two key phrases that differ from each other by only one character. include a display element of indication information indicating that there is a possibility of Display control information may be added to have a function as a GUI to be reflected in the . As another specific example, the warning information generation unit 2059 may include two important words extracted from the invention document that include one or more characters that express the same meaning but are different only in half-width or full-width. In this case, the warning information in the display document includes a display element of indication information indicating that the notation is inconsistent, etc., and the display element is made to select one of the two important phrases, Display control information may be added to provide a GUI function for reflecting the selection result in the modified claim information or modified specification information.

[3-1-5-7.クレーム情報生成部]
クレーム情報生成部205aは、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれるクレーム情報を、生成するクレーム情報生成処理を実行する。クレーム情報は、発明文書中のクレームを表す情報である。
[3-1-5-7. Complaint information generator]
The claim information generation unit 205a executes a claim information generation process for generating claim information included in the patent application related information output by the output unit 208 of the invention document analysis system 20. FIG. The claim information is information representing the claims in the invention document.

クレーム情報生成部205aは、発明文書分析システム20の分析対象となる発明文書に、有用なクレームが含まれているが有用な明細書が含まれていない場合等に対処すべく、日本国の特許出願用の文書、或いは、日本国以外への特許出願のための翻訳用和文原稿等の、効率的な作成を支援するために、クレーム情報の他に、特許出願関連情報に含まれる各種情報(例えば、クレームベース明細書情報等)を生成し得る。 The claim information generating unit 205a generates a Japanese Patent In order to support the efficient preparation of application documents, Japanese manuscripts for translation for patent applications outside Japan, etc., in addition to claim information, various information contained in patent application related information ( for example, claim-based specification information, etc.).

クレーム情報生成部205aは、例えば、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれるクレームベース図面情報を、生成するクレームベース図面情報生成処理を実行し得る。クレームベース図面情報は、発明文書中のクレームに基づいて生成され、特許出願用の図面の生成の基礎として利用可能な、図面に関する情報である。 The claim information generation unit 205a can execute a claim-based drawing information generation process for generating claim-based drawing information included in the patent application related information output by the output unit 208 of the invention document analysis system 20, for example. Claim-based drawing information is information about drawings that is generated based on claims in an invention document and that can be used as a basis for generating drawings for patent applications.

クレーム情報生成部205aは、例えば、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれるクレームベース明細書情報を、生成するクレームベース明細書情報生成処理を実行し得る。クレームベース明細書情報は、発明文書中のクレームに基づいて生成され、特許出願用の明細書の生成の基礎として利用可能な、明細書に関する情報である。 The claim information generation unit 205a can execute a claim-based specification information generation process for generating claim-based specification information included in the patent application related information output by the output unit 208 of the invention document analysis system 20, for example. Claim-based specification information is information about a specification that is generated based on claims in an invention document and that can be used as a basis for creating a specification for a patent application.

クレーム情報生成部205aは、例えば、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれるクレームベース要約書情報を、生成するクレームベース要約書情報生成処理を実行し得る。クレームベース要約書情報は、発明文書中のクレームに基づいて生成され、特許出願用の要約書の生成の基礎として利用可能な、要約書に関する情報である。 The claim information generation unit 205a can execute claim-based abstract information generation processing for generating claim-based abstract information included in the patent application related information output by the output unit 208 of the invention document analysis system 20, for example. Claim-based abstract information is information about abstracts that is generated based on claims in an invention document and that can be used as a basis for generating abstracts for patent applications.

クレーム情報生成部205aは、例えば、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれる、発明文書のクレームを修正した修正版クレーム情報を、生成する修正版クレーム情報生成処理を実行し得る。 The claim information generation unit 205a performs a modified claim information generation process for generating, for example, modified claim information in which the claims of the invention document are included in the patent application related information output by the output unit 208 of the invention document analysis system 20. can be executed.

クレーム情報生成部205aは、発明文書取得部2021により取得された発明文書にクレームが含まれない場合には、クレーム情報生成処理、クレームベース図面情報生成処理、クレームベース明細書情報生成処理、クレームベース要約書情報生成処理、及び、修正版クレーム情報生成処理の実行を省略する。 If the invention document acquired by the invention document acquisition unit 2021 does not contain a claim, the complaint information generation unit 205a performs the following processes: complaint information generation processing, claim-based drawing information generation processing, claim-based specification information generation processing, Execution of abstract information generation processing and modified complaint information generation processing is omitted.

[3-1-5-7-1.クレーム情報の生成]
クレーム情報生成部205aは、クレーム情報生成処理を、発明文書取得部2021により取得された発明文書に含まれるクレームを表したクレーム情報を生成することにより実現する。クレーム情報は、発明文書取得部2021により取得された発明文書に含まれるクレームの一部を修正したものであってもよい。この修正の例としては、クレームにベル制御の「0x07」等の所定の制御コード(例えば、「0x00」~「0x1f」の範囲内のコード)が含まれている場合にその所定の制御コードを「●」等といった所定の文字に変換することが、挙げられる。
[3-1-5-7-1. Complaint information generation]
The complaint information generation unit 205a realizes the complaint information generation processing by generating complaint information representing the complaint contained in the invention document acquired by the invention document acquisition unit 2021. FIG. The claim information may be a partial correction of the claim included in the invention document acquired by the invention document acquisition section 2021 . As an example of this modification, if the claim includes a predetermined control code such as "0x07" for bell control (for example, a code within the range of "0x00" to "0x1f"), the predetermined control code is For example, conversion to a predetermined character such as “●” is possible.

発明文書分析システム20において出力部208が、クレーム情報を含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、クレーム情報生成部205aは、表示用文書としての特許出願関連情報に含まれるクレーム情報を生成する。図22は、ブラウザに表示された表示用文書としての特許出願関連情報におけるクレーム情報の一例を示す。なお、図22では、便宜上、クレーム情報の内容は一部省略してある。 When the output unit 208 in the invention document analysis system 20 outputs patent application related information including claim information as a document for display (for example, an HTML document), the claim information generation unit 205a outputs the patent application as a document for display. Generate claim information included in related information. FIG. 22 shows an example of claim information in patent application related information as a display document displayed on the browser. In FIG. 22, the content of the complaint information is partly omitted for the sake of convenience.

クレーム情報生成部205aが生成する、表示用文書としての特許出願関連情報のクレーム情報部分は、例えば、クレームの各項の各行の内容に対応する、1つ以上の表示要素を含み、その各項の各行内に重要語句抽出部2051により抽出された1つ以上の重要語句があればその各重要語句に対応する、1つ以上の表示要素を含み、その各項の各行内に、隅付き括弧で挟まれた「請求項n」(nは自然数)等といった見出し、或いは、コメントが含まれている場合に、その見出し、或いは、コメントに対応する、1つ以上の表示要素を含む。具体例としては、クレーム情報生成部205aは、HTML文書においてクレーム情報を<article>タグと</article>タグとで挟んで記述する場合においてその<article>タグ配下に、クレームの各項の各行について、その行に対応する表示要素を、<span>タグと</span>タグとでその行の内容を挟むことで記述し、その1つの行に対応する表示要素の<span>タグ配下に、その行内の各重要語句について、その重要語句に対応する表示要素を、<span>タグと</span>タグとでその重要語句を挟むことで記述する。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。クレーム情報部分に含まれる各項の各行に対応する表示要素は、例えば、その対応する行の内容を、ブラウザによって表示可能なものにする。 The claim information portion of the patent application-related information as a display document generated by the claim information generation unit 205a includes, for example, one or more display elements corresponding to the content of each line of each claim item. If there are one or more important phrases extracted by the important phrase extraction unit 2051 in each line of , one or more display elements corresponding to each of the important phrases are included, and each line of each item includes square brackets When a headline such as "Claim n" (n is a natural number) or a comment sandwiched between two is included, one or more display elements corresponding to the headline or comment are included. As a specific example, the complaint information generating unit 205a, when writing complaint information sandwiched between <article> and </article> tags in an HTML document, creates each line of each item of the complaint under the <article> tag. , the display element corresponding to the line is described by sandwiching the content of the line between the <span> tag and the </span> tag, and the display element corresponding to the one line <span> tag , for each key phrase in the line, the display element corresponding to the key phrase is described by sandwiching the key phrase between the <span> tag and the </span> tag. For example, a browser may interpret the presentation document to display each presentation element. A display element corresponding to each line of each item included in the claim information portion, for example, makes the content of the corresponding line displayable by a browser.

クレーム情報生成部205aは、表示用文書におけるクレーム情報部分に含まれる見出し、コメント、或いは、重要語句に対応する表示要素に、例えば、その見出し、コメント、或いは、重要語句についての、表示態様の制御(例えば強調表示、色付き表示、表示遷移等)をするための表示制御情報を付加する。 The complaint information generating unit 205a controls the display mode of the headline, comment, or important phrase in display elements corresponding to the heading, comment, or important phrase included in the complaint information portion of the display document. Display control information for (for example, highlight display, color display, display transition, etc.) is added.

重要語句についての強調表示の一例としては、例えば、重要語句を太字で表示する例が、挙げられる。相対的に重要度が高い重要語句についての強調表示の一例としては、例えば、相対的に重要度が高い重要語句を重要度が低い重要語句より大きいフォントサイズのフォントで表示する例が、挙げられる。 An example of highlighting an important phrase is, for example, displaying the important phrase in bold. An example of highlighting an important phrase with a relatively high degree of importance is, for example, displaying an important phrase with a relatively high degree of importance in a larger font size than an important phrase with a lower degree of importance. .

相違する重要語句各々を互いに異なる表示態様(例えば互いに異なる色の色付き表示等)で表示するために、複数の重要語句各々について、その重要語句に付加する表示制御情報を生成する具体例としては、クレーム情報生成部205aは、HTML文書のHTMLファイルに<span>タグと</span>タグとで挟んでその重要語句を表示要素として記述している場合に、その表示要素に係る<span>タグに、その重要語句を他の重要語句と識別するように重要語句管理情報で定められた識別情報(例えば識別記号と通番とを含む識別コード)を、クラス名として付ける例が、挙げられる。この例では、HTML文書のCSSファイルに、重要語句の識別情報であるクラス名毎の<span>タグの内容の表示態様としての色を定めた情報(つまり重要語句に付加される色を示す情報)を含ませておくこと等により、相互に異なる重要語句同士には、相互に異なる色が付加されて、表示されるようになる。具体的な一例を挙げると、クレーム情報における相互に異なる重要語句同士は、例えばborder-leftプロパティにより、ある程度の幅(例えば単位「em」を用いて「1em」で表現される1文字分の幅)を有し相互に異なる色で塗られた左境界線が付加された表示態様で表示される(図22参照)。なお、例えば、左境界線を実線で表現するとよく、そのためには、境界線のスタイルをsolidにする。具体的な一例としては、クレーム中の構成文字列が相違する複数の重要語句の表示要素各々に対応したクラス名をそれぞれ、kwd1、kwd2、kwd3、・・・等と定め、クラス名kwd1のクラスにおいて、border-leftプロパティに「solid 1em #f00;」、colorプロパティに「#666;」、font-weightプロパティに「bold;」を定め、クラス名kwd2のクラスにおいて、border-leftプロパティに「solid 1em #f0c;」、colorプロパティに「#666;」、font-weightプロパティに「bold;」を定め、クラス名kwd3のクラスにおいて、border-leftプロパティに「solid 1em #f66;」、colorプロパティに「#666;」、font-weightプロパティに「bold;」を定める。図22では、1文字分の幅の左境界線における色(つまり表示色)を、パターン模様で表現しており、相違する複数のパターン模様で相違する複数の色を表現している。なお、相違する重要語句同士を各重要語句に付加された左境界線の色を相違させて表現する方法には、重要語句の文字色或いは文字背景色を相違させて表現する方法より、表示領域の背景色が暗い色(例えば黒)か明るい色(例えば白)かに拘わらず重要語句自体の判読性を低下させないという利点がある。また左境界線は、文字ではないので、重要語句を含む記載の表示内容のコピー&ペースト等を行う場合に無視されるため、表示内容をテキストエディタ等へとコピー&ペーストして、重要語句を含む記載等を編集するような場合において、邪魔にならない。なお、図22に例示するように、表示色で塗られた1文字分の幅等の左境界線が付加された表示態様で表示される重要語句は、例えば、左境界線の他のいずれかの境界線(つまり右境界線、上境界線及び下境界線の少なくとも1つ)を付加することとしてもよいが、重要語句の視認性の向上等のために簡潔な表示とすることも有用であり、そのためには、重要語句に右境界線、上境界線及び下境界線が付加されないこととしてもよい。なお、重要語句に、幅がゼロである、いずれかの境界線を付加することは、その境界線を付加しないことと同じである。なお、表示用文書としての特許出願関連情報の一部(例えばクレーム情報及び明細書情報)又は全部の文字を表示するためのフォントとして等幅フォントを優先的に利用することとしてもよく、その上で、重要語句の左境界線の幅を1文字分(例えば1em指定)にすることとしてもよい。これにより、等幅フォントが利用可能であれば、重要語句の左境界線として付加された表示色で塗られた四角形と各文字の幅とが揃うため、各文字、各重要語句等の視認性が向上し得る。 A specific example of generating display control information to be added to each of a plurality of important phrases in order to display different important phrases in different display modes (for example, display with different colors) is as follows: If the HTML file of the HTML document contains a <span> tag and a </span> tag and the important phrase is described as a display element, the complaint information generation unit 205a generates a <span> tag related to the display element. 2, an example of assigning identification information (for example, an identification code including an identification symbol and a serial number) defined in the important phrase management information so as to distinguish the important phrase from other important phrases as a class name. In this example, in the CSS file of the HTML document, information defining the color as the display mode of the content of the <span> tag for each class name, which is the identification information of the important phrase (that is, information indicating the color added to the important phrase ) are included, different important words and phrases are displayed in different colors. To give a specific example, different key phrases in the claim information are separated by a certain width (for example, the width of one character represented by "1 em" using the unit "em") by the border-left property, for example. ) and painted in different colors (see FIG. 22). For example, it is preferable to express the left border line with a solid line. To do so, the style of the border line is set to solid. As a specific example, the class names corresponding to the display elements of a plurality of key phrases having different character strings in a claim are defined as kwd1, kwd2, kwd3, . . . , the border-left property is set to "solid 1em #f00;", the color property is set to "#666;", and the font-weight property is set to "bold;". 1em #f0c;”, “#666;” for the color property, “bold;” for the font-weight property, and in the class with the class name kwd3, “solid 1em #f66;” for the border-left property, "#666;" and "bold;" are set in the font-weight property. In FIG. 22, the color (that is, the display color) of the left boundary line with the width of one character is represented by pattern patterns, and a plurality of different pattern patterns represent a plurality of different colors. It should be noted that the method of expressing different key phrases by using different colors for the left boundary line attached to each key phrase is more effective than the method of expressing key phrases by using different character colors or character background colors. There is an advantage that the readability of the important phrase itself is not degraded regardless of whether the background color of is dark (eg, black) or bright (eg, white). Also, since the left border line is not a character, it will be ignored when you copy and paste the displayed content that includes important phrases. It does not get in the way when editing the description etc. Note that, as illustrated in FIG. 22, important words displayed in a display mode with a left boundary line with a width of one character painted in a display color are, for example, (that is, at least one of the right border, upper border, and lower border) may be added, but it is also useful to make it simple to improve the visibility of important words and phrases. There may be no right, top and bottom borders added to key phrases. Note that adding any zero-width boundary line to a key phrase is the same as not adding that boundary line. In addition, a monospaced font may be preferentially used as a font for displaying some or all characters of patent application-related information (for example, claim information and specification information) as a display document. , the width of the left boundary line of the important phrase may be set to one character (for example, 1 em). As a result, if a monospaced font is available, the width of each character is aligned with the rectangle painted with the display color added as the left border line of the key words, so the visibility of each character, each key word, etc. is improved. can improve.

クレーム情報生成部205aは、各重要語句について、その重要語句の表示要素を構成するタグに付加するクラス名として、その重要語句の初出行番号(例えば発明文書のクレームにおける初出行番号)の小さい順に定めた通番を含む識別コードである識別情報を用いる場合において、CSSファイル内等の、重要語句の表示要素に係るクラス名毎の表示色(例えば表示要素の左境界線の色)を定めた情報では、例えば、クラス名としての識別コード内の識別記号が同一で通番部分が連続する複数のクラスの間では、その通番部分が連続しない複数のクラスの間より、表示色の差異が相対的に十分に大きくなるように、表示色の指定を行うこととしてもよい。この例で、初出行番号の同じ重要語句同士の間では重要語句に対応する通番はいかなる順番に定めてもよい。また、重要語句の表示要素に係るクラス名毎の表示色(例えば表示要素の左境界線の色)を定めた情報の別の例としては、例えば、クラス名としての識別コード内の識別記号が同一で通番部分が第1所定数(例えば100)以下である第1グループの複数の重要語句のうち、2つの重要語句の組各々における各重要語句に付加される表示色の差異の、その全組での最小値が、通番が所定数より大きい第2グループの複数の重要語句と、その第1グループの複数の重要語句とを混合した混合グループの複数の重要語句のうち、2つの重要語句の組各々における各重要語句に付加される表示色の差異の、その全組での最小値より大きくなるように、表示色の指定を行うこととしてもよい。初出行番号の比較的小さい各重要語句(例えば第1グループの100種類の各重要語句)の表示色の差異の最小値は比較的大きくなるので、その各重要語句を、表示色の差異により、比較的迅速に又正しく識別可能となる。この表示色の差異は、例えば、色相成分の差異(例えばマンセル環等の色相環で表したときの位置の差異)、RGB値の各成分(つまり赤成分、緑成分、青成分の各々)の差異等である。これにより、例えば、ブラウザにより表示用文書におけるクレーム情報が表示された場合に、クレームの先頭に近い各項における各重要語句の表示要素は、その近くに記載された相違する重要語句と表示色が十分異なるように表示されることとなり、識別が容易となり得る。また、ブラウザにより表示用文書におけるクレーム情報が表示された場合に、クレームの各項における同じ重要語句は、同じ表示色で表示されることとなるため、同じ重要語句であることの迅速な認識が可能となり得る。重要語句の初出行番号の昇順に定めた通番と、重要語句の表示色との関係を示す単純な一例としては、通番が1から4までの4種類の重要語句の表示色をそれぞれ、色相環での色相0°、90°、180°、270°の色と定め、後続する通番が5から8までの4種類の重要語句の表示色をそれぞれ、色相環での色相10°、100°、190°、280°の色と定め、後続する通番が9から12までの4種類の重要語句の表示色をそれぞれ、色相環での色相20°、110°、200°、290°と定め、後続する通番が13から16までの4種類の重要語句の表示色をそれぞれ、色相環での色相30°、120°、210°、300°と定め、以後同様に32種類の各重要語句の表示色を定める例が挙げられる。この例では、通番が4以下である第1グループの4種類の重要語句のうち、2つの重要語句の組各々における各重要語句に付加される表示色の差異の、その全組での最小値(つまり色相差90°)が、通番が4より大きく8以下の第2グループの4種類の重要語句と、その第1グループの4種類の重要語句とを混合した混合グループの8種類の重要語句のうち、2つの重要語句の組各々における各重要語句に付加される表示色の差異の、その全組での最小値(つまり色相差10°)より大きくなるように、各重要語句に対する表示色の指定がなされている。なお、この例では4種類の重要語句のグループ毎に色相の増分を10°としたが、増分を5°等にするとより多くの種類の重要語句を相違する表示色の付加で表現可能となる。各重要語句についての表示制御情報(例えば重要語句に対応したクラス名毎のクラスについての色に関するプロパティ等の情報)により、通番が一定範囲までの種類の重要語句を相互に相違する表示色の付加で表現し、通番がその一定範囲を超える重要語句を、一律に、同一色の表示色の付加で表現することが可能である。 The claim information generation unit 205a, for each key phrase, assigns the class name to be added to the tag that constitutes the display element of the key phrase in ascending order of the first appearance number of the key phrase (for example, the first appearance number in the claim of the invention document). Information that defines the display color (for example, the color of the left border line of the display element) for each class name related to the display element of important phrases in the CSS file, etc. when using identification information that is an identification code that includes a defined serial number So, for example, between multiple classes with the same identification symbol in the identification code as the class name and consecutive serial number parts, the difference in display color is relatively higher than between multiple classes with discontinuous serial number parts. The display color may be specified so that the size is sufficiently large. In this example, the serial numbers corresponding to the important phrases may be determined in any order among the important phrases having the same first appearance number. Another example of the information that determines the display color for each class name (for example, the color of the left border line of the display element) related to the display element of the important phrase is, for example, the identification symbol in the identification code as the class name. All of the differences in the display colors added to each of the important phrases in each of the sets of two of the plurality of important phrases in the first group that are the same and have a serial number part equal to or less than a first predetermined number (for example, 100). Two important phrases out of a plurality of important phrases of a mixed group in which a plurality of important phrases of a second group having a sequence number larger than a predetermined number and a plurality of important phrases of the first group are mixed. The display color may be specified so that the difference in the display color added to each important phrase in each set is greater than the minimum value for all the sets. Since the minimum value of the difference in the display color of each important phrase with a relatively small first line number (for example, 100 kinds of important phrases in the first group) is relatively large, each of the important phrases can be displayed as It can be identified relatively quickly and correctly. The difference in display color is, for example, a difference in hue component (for example, a difference in position when represented on a hue circle such as the Munsell ring), and each component of RGB values (that is, each of red component, green component, and blue component). differences, etc. As a result, for example, when the claim information in the document for display is displayed by a browser, the display element of each important phrase in each section near the beginning of the claim has a different display color from the different important phrases described nearby. They will appear sufficiently different to facilitate identification. In addition, when the claim information in the display document is displayed by the browser, the same key phrases in each section of the claim are displayed in the same display color, so that it is possible to quickly recognize that they are the same key phrases. can be possible. As a simple example showing the relationship between the serial numbers determined in ascending order of the first appearance number of the important phrases and the display colors of the important phrases, the display colors of the four important phrases with the serial numbers 1 to 4 are shown in the hue circle. are defined as colors with hues of 0°, 90°, 180°, and 270° on the color wheel, and the display colors of the following four important phrases with serial numbers from 5 to 8 are respectively determined by hues of 10°, 100°, and 10° on the color wheel. The colors of 190° and 280° are defined, and the display colors of the following four key phrases with serial numbers from 9 to 12 are defined as hues of 20°, 110°, 200°, and 290° on the color wheel, respectively. The display colors of the four important phrases with serial numbers from 13 to 16 are defined as hues 30°, 120°, 210°, and 300° on the color wheel, respectively. An example is to define In this example, among the four types of key phrases in the first group whose sequence number is 4 or less, the minimum value of the difference in the display color added to each key phrase in each of the sets of two key phrases in all sets (that is, a hue difference of 90°) is a mixture of 4 key phrases of the second group with serial numbers greater than 4 and 8 or less, and 4 key phrases of the first group. display color for each key phrase so that the difference in the display color added to each key phrase in each pair of two key phrases is larger than the minimum value (i.e., hue difference 10°) in all pairs is specified. In this example, the hue increment is set to 10° for each group of four types of important phrases, but if the increment is set to 5° or the like, more types of important phrases can be expressed by adding different display colors. . Display control information for each key phrase (for example, information such as properties related to the color of the class for each class name corresponding to the key phrase) adds different display colors to key phrases with serial numbers up to a certain range. , and it is possible to uniformly express important words and phrases whose serial number exceeds a certain range by adding the same display color.

クレーム情報生成部205aは、クレーム情報中における各重要語句の表示要素に係る<span>タグには、例えばクラス名として、互い内容(つまり文字列)の異なる重要語句を識別する識別コード等を付加することに加えて、id属性を付加する。このid属性は、例えば、特許出願関連情報中の各部分のうちクレーム情報部分であることを識別する識別記号と、重要語句を識別する識別コードと、内容が同一である重要語句内における通番(例えばクレーム情報中に記載された同一内容の複数の重要語句各々について記載順に定められた番号)とを結合した識別子(つまりHTML文書内で1つの表示要素を識別するために定められた識別子)である。 The complaint information generating unit 205a adds, for example, an identification code, etc., as a class name, to identify key phrases having different contents (that is, character strings) to <span> tags associated with display elements of key phrases in the complaint information. In addition to adding an id attribute. This id attribute includes, for example, an identification symbol that identifies the claim information part among the parts in the patent application-related information, an identification code that identifies the important phrase, and a serial number in the important phrase that has the same content ( For example, an identifier (that is, an identifier determined to identify one display element in an HTML document) combined with a number determined in order of description for each of multiple important words and phrases with the same content described in the claim information be.

クレーム情報生成部205aは、別の一例として、複数の重要語句各々が表す要素間に構成上の包含関係がある場合には、その複数の重要語句各々の表示要素には、相互に色相が類似する表示色(例えば表示要素の左境界線の色)を定めた表示制御情報を付加することとしてもよい。これにより、ブラウザにより表示用文書におけるクレーム情報が表示された場合に、構成上の包含関係を有する複数の要素各々を表す重要語句が、ある程度類似する表示色で表示されることとなるため、構成上関連する重要語句同士の迅速な認識が可能となり得る。 As another example, if there is a structural inclusion relationship between elements represented by a plurality of key words, the complaint information generation unit 205a may determine that the display elements of the plurality of key words are similar in hue to each other. It is also possible to add display control information that defines the display color (for example, the color of the left boundary line of the display element) to be displayed. As a result, when the complaint information in the display document is displayed by the browser, the important words and phrases representing each of the plurality of elements having structural inclusion relationships are displayed in similar display colors to some extent. Rapid recognition of related key phrases may be possible.

クレーム情報生成部205aは、重要語句に対応する表示要素に、例えば、ブラウザへの操作に応じて重要語句に関連した表示遷移等(例えば重要語句に係る情報付加表示)を行うためのGUIとしての機能を付加するため(つまりその表示要素を操作対応GUI要素とするため)に、表示制御情報を付加する。 The complaint information generation unit 205a provides a display element corresponding to an important phrase, for example, as a GUI for performing display transitions related to the important phrase (for example, information addition display related to the important phrase) in response to an operation on the browser. Display control information is added in order to add a function (that is, to make the display element an operation-responsive GUI element).

操作に対応するGUIとしての機能を重要語句に付加する表示制御情報を生成する具体例としては、クレーム情報生成部205aは、HTML文書のHTMLファイルに<span>タグと</span>タグとで挟んで重要語句を記述している場合に、その<span>タグ内に、各種操作(例えばonmouseover属性、onclick属性等)と対応付けて、その操作に応じて起動させるJavaScript(登録商標)における関数の関数名等を記述する例が挙げられる。この関数は、例えば、ブラウザに読み込まれる、HTMLファイル中で指定されたスクリプトファイルに記述され得る。 As a specific example of generating display control information for adding GUI functions corresponding to operations to key phrases, the complaint information generating unit 205a generates <span> tags and </span> tags in an HTML file of an HTML document. A function in JavaScript (registered trademark) that is associated with various operations (for example, onmouseover attribute, onclick attribute, etc.) in the <span> tag when an important phrase is described in between, and that is activated according to the operation An example of describing the function name of This function can be written, for example, in a script file specified in an HTML file that is loaded by the browser.

クレーム情報生成部205aにより、生成される表示用文書におけるクレーム情報中の1つの重要語句の表示要素の具体例を挙げると、クレーム情報に重要語句「機器制御部」が複数記載されている場合における5番目の「機器制御部」に対応する表示要素は、例えば、「<span class=”c003” id=”claiminfo-c003-005” onclick=’wordProc(”claiminfo-c003-005”)’ title=”・・・(情報付加表示内容)・・・”>機器制御部</span>」等となる。この例では、重要語句「機器制御部」の識別コードは、「c003」であり、表示要素の<span>タグのid属性の値として、クレーム情報の識別記号「claiminfo」と、重要語句の識別コード「c003」と、記載順の番号「005」とを含んだ文字列が定められている。また、この例では、表示要素に対するマウスクリック操作がなされた場合にid属性の値を引数としてwordProc関数が呼び出されるように定められている。これにより、wordProc関数では、例えば、引数から、その表示要素を特定して、表示要素に係る重要語句の文字列を参照する処理を実現することが可能となり、また、引数の一部から、重要語句の識別コード「c003」、記載順の番号「005」等を抽出して、例えば同一の重要語句の先頭の表示要素のid属性が「claiminfo-c003-001」であることを特定してその先頭の表示要素を表示させる処理を実現することが可能となり、例えば、クレーム情報の全ての重要語句「機器制御部」の表示要素の表示内容を、ユーザに入力された文字列等に置換する処理を実現すること等が可能となる。 A specific example of the display element of one key phrase in the complaint information in the display document generated by the complaint information generation unit 205a is when multiple key phrases “equipment control unit” are described in the complaint information. The display element corresponding to the fifth “equipment control unit” is, for example, “<span class="c003" id="claiminfo-c003-005" onclick='wordProc ("claiminfo-c003-005")' title= "... (display content with additional information)...">equipment control section</span>" and the like. In this example, the identification code of the important phrase "equipment control unit" is "c003", and the value of the id attribute of the <span> tag of the display element is the identification symbol "claiminfo" of the complaint information and the identification of the important phrase. A character string including a code "c003" and a number "005" in order of description is defined. Also, in this example, when a mouse click operation is performed on a display element, the wordProc function is called with the value of the id attribute as an argument. As a result, in the wordProc function, for example, it is possible to specify the display element from the argument and refer to the character string of the important phrase related to the display element. By extracting the identification code "c003" of the phrase and the number "005" in the order of description, for example, the id attribute of the top display element of the same important phrase is specified as "claiminfo-c003-001", and that It is possible to realize the process of displaying the first display element, for example, the process of replacing the display contents of the display elements of all the important phrases "equipment control section" of the complaint information with the character string etc. input by the user. It is possible to realize

クレーム情報生成部205aは、例えば、ブラウザで表示された重要語句の表示要素に対するマウスオーバー操作がなされた場合に起動されるスクリプトの関数が、その重要語句に関連する情報を表示する処理(つまり重要語句に係る情報付加表示)を行うように定めてもよい。その重要語句に関連する情報は、例えば、分析部205に保持されている重要語句管理情報(図18参照)及びその1つの内容である重要語句の属性情報(図19参照)に含まれる全部又は一部の情報である。図23は、ブラウザに表示された特許出願関連情報のクレーム情報における重要語句の表示要素に対するマウスオーバー操作に応じて、表示された重要語句に関連する情報の一例を示す。図23の例では、重要語句「B部」へのマウスオーバー操作により、マウスポインタが指し示す重要語句「B部」に関連する情報として、その重要語句の重要度、その重要語句を定義しているクレームの項の項番、その重要語句を参照しているクレームの項の項番、発明文書中でその重要語句に対応付けられている符号等を、重要語句「B部」の付近に付加的に表示している。 For example, the complaint information generation unit 205a performs processing (that is, important (Additional display of information related to phrases) may be determined to be performed. The information related to the important phrase is, for example, the important phrase management information (see FIG. 18) held in the analysis unit 205 and all or Some information. FIG. 23 shows an example of information related to key words and phrases displayed in response to a mouse-over operation on display elements of key words and phrases in claim information of patent application-related information displayed on the browser. In the example of FIG. 23, the importance of the important phrase and the important phrase are defined as information related to the important phrase "B section" pointed by the mouse pointer by the mouse over operation to the important phrase "B section". The claim number, the claim number referring to the key word, the code associated with the key word in the invention document, etc. are added near the key word "Part B". is displayed in

クレーム情報生成部205aは、例えば、ブラウザで表示された重要語句の表示要素に対するマウスクリック操作がなされた場合に起動されるスクリプトの関数が、その重要語句を変化させる重要語句更新処理、その重要語句の後に符号が記載されておらずその重要語句に対応する符号があるときにその符号を重要語句の後に挿入する符号挿入処理、クレーム情報、明細書情報又は関連する他の発明文書からその重要語句を含む行を列挙する重要語句包含記載列挙処理、クレーム情報、明細書情報等からその重要語句を含む行を検索する処理、インターネット等のネットワーク上の検索サイト(つまりネットワークを介してアクセス可能な検索サイト)等でその重要語句を含むウェブページ、その重要語句の定義、その重要語句の類義語、その重要語句の関連画像等を検索する処理、或いは、インターネット等のネットワーク上の翻訳サイト等でその重要語句を翻訳させる処理等を、行うように定めてもよい。Google(登録商標)の検索サイト等といった、インターネット上の検索サイトには、例えば、URLパラメータを与えることで、検索対象の語句についての定義の検索、その語句に係る関連画像の検索、その語句に係る翻訳語句の検索等が可能となるものがある。アクセス可能なウェブページ等から文字列、画像その他の情報を検索する検索サイトをLAN上のサーバにより実現してもよい。 The complaint information generation unit 205a performs, for example, a script function that is activated when a mouse click operation is performed on a display element of an important phrase displayed on the browser, and performs an important phrase update process that changes the important phrase. A code insertion process that inserts the code after the key word when there is a code corresponding to the key word without the code being described after it, the key word from claim information, specification information or other related invention documents Listing processing of inclusion description of important phrases for enumerating lines containing , processing for searching for lines containing such important phrases from claim information, specification information, etc., search sites on networks such as the Internet (i.e., searches accessible via networks) site), etc., the definition of the important phrase, the synonym of the important phrase, the related image of the important phrase, etc., or the important on the translation site on the network such as the Internet. It may be determined to perform processing such as translating words. Search sites on the Internet such as Google (registered trademark) search sites, for example, provide URL parameters to search for a definition of a term to be searched, to search for related images related to the term, and to search for the term. In some cases, it is possible to search for such translated phrases. A search site for searching for character strings, images, and other information from accessible web pages may be realized by a server on the LAN.

クレーム情報生成部205aは、例えば、ブラウザで表示された重要語句の表示要素に対するマウスクリック操作がなされた場合に起動されるスクリプトの関数が、例えば選択肢のメニューを表示し選択操作に応じて、重要語句更新処理、符号挿入処理、重要語句包含記載列挙処理、クレーム情報、明細書情報等からその重要語句を含む行を検索する処理、インターネット等のネットワーク上の検索サイト等でその重要語句を含むウェブページ等を検索する処理、インターネット等のネットワーク上の翻訳サイト等でその重要語句を翻訳させる処理等を、選択的に実行するように定めてもよい。インターネット等のネットワーク上の検索サイト等でその重要語句を含むウェブページ等を検索する処理を実行する選択肢を含むメニューを表示するためには、クレーム情報生成部205aは、例えば、生成するメニューの表示要素にリンク用の<a>タグ(つまりアンカータグ)を含ませ、<a>タグのhref属性に、マウスクリック操作がなされた重要語句の表示要素のオブジェクトのinnerHTMLプロパティで取得可能なその重要語句の内容である文字列をURLパラメータとして、インターネット等のネットワーク上の検索サイトのURLに後続させた記述を、設定する処理を関数内に含ませる。クレーム情報生成部205aは、その関数において、表示するメニューのために、画像検索、翻訳等の各種機能を提供する検索サイトのURLに後続してその機能に応じたURLパラメータをhref属性に設定した各<a>タグを記述することで、画像検索、翻訳等の各種機能の選択肢を、そのメニューに含ませることが可能となる。 The complaint information generation unit 205a generates a script function that is activated when, for example, a mouse click operation is performed on a display element of an important phrase displayed on the browser, for example, a menu of options is displayed, and an important phrase is displayed according to the selection operation. Word update processing, code insertion processing, key phrase inclusion description listing processing, claim information, specification information, etc., processing to search for lines containing the key phrase, web search sites on networks such as the Internet that include the key phrase A process of searching for a page or the like, or a process of translating the key phrase on a translation site or the like on a network such as the Internet, or the like may be determined to be selectively executed. In order to display a menu that includes options for executing a process of searching for a web page or the like containing the key phrase on a search site or the like on a network such as the Internet, the complaint information generation unit 205a may, for example, display the menu to be generated. An <a> tag (that is, an anchor tag) for linking is included in the element, and the href attribute of the <a> tag is the important phrase that can be acquired by the innerHTML property of the object of the display element of the important phrase clicked with the mouse. The function includes a process of setting a description that follows the URL of a search site on a network such as the Internet by using a character string that is the content of as a URL parameter. In the function, the complaint information generation unit 205a sets the URL parameter corresponding to the function to the href attribute following the URL of the search site that provides various functions such as image search and translation for the menu to be displayed. By describing each <a> tag, it is possible to include options for various functions such as image search and translation in the menu.

クレーム情報生成部205aは、この関数による処理結果(例えば検索結果、翻訳結果等)が、ブラウザで表示されてマウスクリック操作がなされた重要語句の表示要素が隠れない範囲に、表示されるように、この関数を定めておくこととしてもよい。JavaScript(登録商標)の関数内で、明細書情報から1つの重要語句αを含む行を検索する処理の一例としては、予めHTML文書における明細書情報中の、重要語句抽出部2051により抽出された各重要語句の表示要素(例えば<span>タグ)に、特許出願関連情報における明細書情報部分であることを識別する識別記号と、重要語句毎を識別する識別コードと、同一重要語句内における通番とを結合した識別子(つまりHTML文書内で1つの表示要素を識別するために定められた識別子)をid属性として付加しておくことを前提として、明細書情報部分の識別記号に、重要語句αの識別コードを追加して、例えば通番の先頭の番号等を追加して、形成された識別子を、引数としてdocument.getElementByIdメソッドを実行することでその重要語句αの表示要素を特定し、例えば、特定した表示要素におけるscrollIntoViewメソッドを実行することでその特定した表示要素を含む行をブラウザの表示領域内に表示させる例が、挙げられる。なお、重要語句包含記載列挙処理を実現する具体的方法の一例としては、クレーム情報中でその重要語句が記載されている各行の内容を、上述したような識別記号と識別コードと通番とを結合した識別子の通番を変化させることで収集し、同様に明細書情報中でその重要語句が記載されている各行の内容を収集して、それらの各収集結果である各行を列挙して各行中の重要語句を強調して表示する例が挙げられる。重要語句包含記載列挙処理を実現する具体的方法の別の一例としては、重要語句抽出部2051での重要語句の抽出対象となった発明文書に関連する他の発明文書に基づいて、その関連する他の発明文書中でその重要語句が記載されている各行の内容を、重要語句を検索することで収集して、その収集結果である各行を列挙して各行中の重要語句を強調して表示する例が挙げられる。クレーム情報生成部205aは、この場合の表示内容に、その関連する他の発明文書の識別用の情報(例えば発明文書のファイル名、特許出願の出願番号、公報番号、特許番号、発明の名称等)を含ませてもよい。この重要語句抽出部2051での重要語句の抽出対象となった発明文書に関連する他の発明文書は、例えばユーザによる指定(例えば設定情報中での指定)により特定される1つ以上の発明文書であってもよいし、その重要語句の抽出対象となった発明文書における明細書中に見出し「特許文献n」(nは自然数)に後続して先行技術文献情報としての特許文献の特定用情報(例えば公報番号)が示されているときにはその特許文献であってもよい。発明文書分析システム20は、公報番号に基づき、インターネットを介してウェブサイトから特許文献の内容を、取得し得る。また、マウスクリック操作等の操作を受けた表示要素である操作対象GUI要素に係る重要語句について、その重要語句が記載されている各行を検索して列挙して表示する重要語句包含記載列挙処理は、一部変形してもよく、例えば、その重要語句が主語として記載されている文(例えば、重要語句に又はその直後の符号に後続して、格助詞「は」又は格助詞複合「とは」が記載されている文)を検索して検索結果として収集された各文を列挙して表示する処理であることとしてもよい。また、例えば、操作対象となった重要語句に関する記載を列挙する重要語句包含記載列挙処理は、その重要語句を含む行を、クレーム情報、明細書情報又は別の発明文書(つまりクレーム情報等の生成元となった発明文書とは別の発明文書)から、列挙して表示し、その列挙して表示した各行におけるその重要語句については強調表示を行い、表示した行には、その行に対する操作に応じて、クレーム情報、明細書情報又はその別の発明文書におけるその行を含む複数行へのリンク表示のためのGUIとしてその行を機能させるための表示制御情報を付加する処理であることとしてもよい。これにより、ユーザは、操作した重要語句を含むことで列挙された行のうちの1つの行に対して更に操作することで、更に表示されることになるその1つの行に前後するクレーム情報、明細書情報又は別の発明文書における複数行を、容易に確認可能となる。なお、操作対象となった重要語句に関する記載を列挙する重要語句包含記載列挙処理は、例えば、その重要語句を含む行を、クレーム情報及び明細書情報から、列挙して表示し、その列挙して表示した各行におけるその重要語句については強調表示を行い、表示した行には、その行に対する操作に応じて、クレーム情報又は明細書情報におけるその行を含む複数行へのリンク表示のためのGUIとしてその行を機能させるための表示制御情報を付加する処理であることとしてもよい。リンク表示は、表示要素の操作(例えばその表示要素へマウスポインタを位置付けた状態でのマウスクリック操作)に応じてリンク先(例えば現在表示されていない他の情報)へと表示内容を遷移させ得る表示である。なお、表示用文書におけるクレーム情報中の複数の重要語句各々について、クレーム情報及び明細書情報におけるその重要語句の記載行は、予め特定可能であるので、その重要語句に対する操作に応じて重要語句包含記載列挙処理が実行される際に、クレーム情報及び明細書情報におけるその重要語句の記載行を検索するのではなく、予めその検索結果に相当する情報の全部又は一部を生成しておいてその生成された情報を活用することで重要語句包含記載列挙処理の実行速度を迅速化するようにしてもよい。 The complaint information generation unit 205a is arranged so that the results of processing by this function (for example, search results, translation results, etc.) are displayed in a browser so that the display elements of the important phrase clicked with the mouse are not hidden. , this function may be defined. As an example of a process of searching for a line containing one important phrase α from the specification information within a function of JavaScript (registered trademark), In the display element of each key phrase (for example, <span> tag), an identification symbol that identifies the specification information part in the patent application related information, an identification code that identifies each key phrase, and a serial number within the same key phrase (that is, an identifier determined to identify one display element in the HTML document) is added as an id attribute, and the important phrase α is added, for example, the top number of the serial number is added, and the formed identifier is passed as an argument to document. An example of specifying the display element of the important phrase α by executing the getElementById method and, for example, executing the scrollIntoView method of the specified display element to display the line containing the specified display element in the display area of the browser. is mentioned. As an example of a specific method for realizing the key phrase inclusion description enumeration process, the content of each line in which the key phrase is described in the claim information is combined with the above-described identification symbol, identification code, and serial number. Similarly, collect the contents of each line in which the key phrase is described in the specification information by changing the serial number of the identifier that was created, and list each line that is each collection result and An example of emphasizing and displaying an important phrase is given. As another example of a specific method for realizing the important phrase inclusion description listing process, based on other invention documents related to the invention document from which important phrases are extracted by the important phrase extraction unit 2051, The content of each line in which the key phrase is described in other invention documents is collected by searching for the key phrase, and each line that is the collection result is listed and the key phrase in each line is highlighted. Examples include: The claim information generation unit 205a adds information for identifying other related invention documents (for example, the file name of the invention document, the application number of the patent application, the publication number, the patent number, the title of the invention, etc.) to the display content in this case. ) may be included. Other invention documents related to the invention document from which key phrases are to be extracted by the key phrase extraction unit 2051 are, for example, one or more invention documents specified by user designation (for example, designation in setting information). Alternatively, the headline "Patent document n" (n is a natural number) in the specification of the invention document from which the key phrase is to be extracted is followed by information for identifying the patent document as prior art document information. (eg publication number), it may be the patent document. The invention document analysis system 20 can acquire the content of the patent document from the website via the Internet based on the publication number. In addition, for important phrases related to the GUI element to be operated, which is a display element that has received an operation such as a mouse click operation, the important phrase inclusion description enumeration process of searching for and listing and displaying each line in which the important phrase is described is , may be partially modified, for example, a sentence in which the key phrase is described as the subject (for example, following the key phrase or the sign immediately after it, the case particle "ha" or the case particle compound ”), and list and display each sentence collected as a search result. In addition, for example, in the key phrase inclusion description enumeration process of listing the descriptions related to the key phrases to be operated, the lines containing the key phrases are generated as claim information, specification information, or another invention document (that is, claim information, etc.). Inventive documents other than the original invention document) are listed and displayed, and the important words in each listed and displayed line are highlighted. Accordingly, it is also a process of adding display control information for making that line function as a GUI for link display to multiple lines including that line in claim information, specification information, or another invention document. good. With this, the user further operates on one of the rows listed by including the operated important phrase, so that the complaint information before and after the one row to be further displayed, Multiple lines in specification information or another invention document can be easily identified. Note that the key phrase inclusion description enumeration process for listing the descriptions of the key phrases to be operated is, for example, listing and displaying the lines containing the key phrases from the claim information and the specification information, and listing and displaying them. The key phrase in each displayed line is highlighted, and the displayed line is displayed as a GUI for displaying links to multiple lines including that line in the claim information or specification information according to the operation on that line. It may be a process of adding display control information for making the line function. Link display can transition display content to a link destination (for example, other information that is not currently displayed) according to the operation of a display element (for example, a mouse click operation while the mouse pointer is positioned on the display element). display. In addition, for each of the multiple key words in the claim information in the display document, since the description line of the key word in the claim information and the specification information can be specified in advance, it is possible to include the key word in accordance with the operation on the key word. When the description enumeration process is executed, all or part of the information corresponding to the search result is generated in advance, instead of searching for the description line of the important phrase in the claim information and specification information. By utilizing the generated information, the execution speed of the important phrase inclusion description enumeration process may be increased.

図24は、ブラウザに表示された特許出願関連情報のクレーム情報における重要語句の表示要素に対するマウスクリック操作に応じて表示されたポップアップ画面(例えばポップアップにより表示されたウィンドウ等)の一例を示す。図24に例示するポップアップ画面は、重要語句「B部」のマウスクリック操作に応じて表示され、重要語句「B部」についての各種検索を実行させるためのGUI要素である複数のプッシュボタンと、重要語句「B部」についての重要語句包含記載列挙処理の実行結果とを含んでいる。プッシュボタンは、例えば<button>タグにより生成可能であり、<button>タグにおけるonclick属性としてlocationオブジェクトのhrefプロパティに「https://・・・」等と検索サイトのURL、URLパラメータ等を設定することで、ボタン押下操作に対応して検索を実行させることが可能となり得る。図24に例示する、重要語句包含記載列挙処理の実行結果では、発明文書のクレームに記載されておらず明細書の段落「0042」に含まれている重要語句「制御プログラム」及び「マイクロプロセッサ」の各々については、左境界線の付加は行わず、同図中で矩形枠で囲むことで表現した、文字背景色の付加により、強調表示している。発明文書分析システム20の運用方法の一例として、例えば、ユーザ(例えば発明者等又は弁理士)は、重要語句に対応した重要語句包含記載列挙処理の実行結果を参考にして、発明文書分析システム20での将来の活用の必要等に応じて、重要語句設定辞書に、その重要語句とその重要語句を適切に説明する文とを含ませるように、重要語句設定辞書を編集することとしてもよい。 FIG. 24 shows an example of a pop-up screen (for example, a window displayed by pop-up) displayed in response to a mouse click operation on a display element of key phrases in claim information of patent application-related information displayed on the browser. The pop-up screen illustrated in FIG. 24 is displayed in response to a mouse click operation on the key phrase "B section", and includes a plurality of push buttons which are GUI elements for executing various searches for the key phrase "B section", and the execution result of the important phrase inclusion description enumeration process for the important phrase “B part”. The push button can be generated by, for example, the <button> tag, and the href property of the location object is set to "https://..." and the URL of the search site, URL parameters, etc. as the onclick attribute of the <button> tag. By doing so, it may be possible to execute a search in response to a button pressing operation. As a result of executing the key phrase inclusion description enumeration process illustrated in FIG. , is emphasized by adding a character background color, which is expressed by enclosing it in a rectangular frame in the figure, without adding a left boundary line. As an example of an operation method of the invention document analysis system 20, for example, a user (for example, an inventor or a patent attorney) refers to the execution result of the key phrase inclusion description listing process corresponding to the key phrase, and operates the invention document analysis system 20. The important phrase setting dictionary may be edited so as to include the important phrase and sentences appropriately explaining the important phrase according to the need for future utilization in the future.

クレーム情報生成部205aは、例えば一時的に又は常に、ブラウザによる表示画面を複数の表示領域に分割し、クレーム情報の表示領域と、操作に応じて起動される関数による処理結果の表示領域とを並列的に表示してもよい(図17参照)。 For example, the complaint information generation unit 205a temporarily or constantly divides the display screen of the browser into a plurality of display areas, and divides the display area of the complaint information and the display area of the processing result by the function activated according to the operation. They may be displayed in parallel (see FIG. 17).

クレーム情報生成部205aは、発明文書のクレームの各項の各行について、その行の内容から、重要語句抽出部2051により抽出された重要語句のうちのいずれかと、同一内容の文字列を探索することにより、その行における1つ以上の重要語句の表示要素を特定してもよい。例えば、クレームのある項の一行に、「入力データを加工するときに、」という記載のみが含まれている場合に、クレーム情報生成部205aは、重要語句抽出部2051で発明文書のクレーム中から動詞を抽出対象外とする方式で既に抽出されている重要語句「加工」を、その一行から探索して、その「加工」をクレーム情報におけるその一行の内容としての重要語句の表示要素と取り扱うこととしてもよい。また、逆に、その一行から動詞を抽出対象外とする方式で「加工」を抽出できないことから、クレーム情報生成部205aは、その一行の内容としては「加工」を重要語句の表示要素と取り扱わないこととしてもよい。 The claim information generation unit 205a searches each line of each claim item of the invention document for a character string having the same content as one of the key phrases extracted by the key phrase extraction unit 2051 from the content of the line. may identify one or more key phrase display elements in the row. For example, if one line of a claim contains only the statement "when input data is processed," the claim information generation unit 205a causes the important phrase extraction unit 2051 to To search the line for the important word "processing" already extracted by the method of excluding verbs from extraction, and treat the "processing" as a display element of the important word as the content of the line in the claim information. may be Conversely, since "processing" cannot be extracted from that line by excluding verbs from extraction targets, the complaint information generation unit 205a treats "processing" as a display element of the important phrase as the content of that line. It is also possible not to do so.

クレーム情報生成部205aは、例えば、クレーム情報部分に含まれる、隅付き括弧で挟まれた「請求項n」(nは自然数)等といった見出しに対応する表示要素に、例えば、強調表示のために、或いは、ブラウザへの操作に応じて例えば直前又は直後の見出しに対応する表示要素への表示遷移等を行うためのGUIとしての機能を付加するために、表示制御情報を付加し得る。直後の見出しへの表示遷移用のGUIとしての機能をある「請求項n」(nは自然数)という見出しに付加する表示制御情報を生成する具体例としては、クレーム情報生成部205aは、HTML文書のHTMLファイルに<span>タグと</span>タグとで挟んで「請求項n」(nは自然数)という見出しを記述している場合に、その<span>タグ内に、操作(例えばonclick属性等)と対応付けて、その操作に応じて起動させるJavaScript(登録商標)における関数の関数名等を記述する例が挙げられる。この関数は、例えば、HTMLファイル中で指定されたスクリプトファイルに記述され得る。クレーム情報生成部205aは、例えば、クレーム情報の内容から、隅付き括弧で挟まれた「請求項m」(mは自然数nより1大きい数)という見出しの表示要素を探索して表示する処理を実行するように、この関数を定めておくことができる。 The claim information generation unit 205a adds, for example, a Alternatively, display control information may be added in order to add a function as a GUI for performing display transition to display elements corresponding to, for example, immediately preceding or succeeding headlines in response to operations on the browser. As a specific example of generating display control information for adding a function as a GUI for display transition to the next headline to a headline "Claim n" (n is a natural number), the claim information generation unit 205a generates an HTML document. In the HTML file of <span> and </span>, when the heading "claim n" (where n is a natural number) is described between <span> and </span> tags, an operation (for example, onclick attribute, etc.) and describes the function name of a function in JavaScript (registered trademark) to be activated according to the operation. This function can be written, for example, in a script file specified in the HTML file. For example, the complaint information generation unit 205a searches for and displays a display element with a headline "Claim m" (m is a number one greater than a natural number n) enclosed in square brackets from the content of the complaint information. You can define this function to run.

クレーム情報生成部205aは、例えば、クレーム情報部分に含まれる参照文字列(例えば、「前記」、「上記」、「当該」、「その」等)を、例えば<span>タグと</span>タグとで挟む表示要素として、その表示要素に、その参照文字列について強調表示等(例えば、太字での表示、下線付きの表示、赤色等の所定の色での表示等)を行うための表示制御情報を付加してもよい。<span>タグを付加した文字列に係る表示要素の強調表示は、例えば、CSSにおける表示属性としてのtext-decorationプロパティ、font-weightプロパティ、border-leftプロパティ、colorプロパティ、background-colorプロパティ等の値を調整する表示制御情報により実現可能である。例えば、HTMLファイルにおけるクレーム情報中で、参照文字列、コメント、見出し等の各種の表示要素に対して異なるクラス名を定めておき、そのHTMLファイルで指定したCSSファイルにおいて、参照文字列、コメント、見出し等の各種の表示要素に対応する各クラス名のクラス毎に、強調表示のためのプロパティの値を相違させておくことで、参照文字列、コメント、見出し等の各種の表示要素毎に、表示態様を異ならせることが可能となる。 The complaint information generation unit 205a converts the reference character strings (eg, "said", "above", "that", "that", etc.) included in the complaint information part into <span> tags and </span> tags, for example. As a display element sandwiched between tags, a display for highlighting the reference character string (for example, displaying in bold, underlining, displaying in a predetermined color such as red, etc.) Control information may be added. The highlighting of a display element related to a character string to which a <span> tag is added includes, for example, a text-decoration property, a font-weight property, a border-left property, a color property, a background-color property, etc. as display attributes in CSS. It can be realized by display control information that adjusts the value. For example, in the complaint information in the HTML file, different class names are defined for various display elements such as reference strings, comments, headings, etc. In the CSS file specified in the HTML file, reference strings, comments, By differentiating the value of the property for highlighting for each class of each class name corresponding to various display elements such as headings, for each display element such as reference strings, comments, headings, etc. It is possible to vary the display mode.

クレーム情報生成部205aは、例えば、警告情報生成部2059により生成された警告情報における指摘情報で示された不適切な記載が、クレーム情報部分に含まれる場合には、その不適切な記載を、例えば<span>タグと</span>タグとで挟む表示要素として、その表示要素に、その不適切な記載について強調表示等を行うための表示制御情報を付加してもよい。 If, for example, the complaint information portion contains inappropriate description indicated by the indication information in the warning information generated by the warning information generation unit 2059, the complaint information generation unit 205a converts the inappropriate description into For example, as a display element sandwiched between the <span> tag and the </span> tag, display control information for highlighting the inappropriate description may be added to the display element.

発明文書取得部2021により取得された分析部205の分析対象となった発明文書におけるクレームに基づいてクレーム情報を生成するクレーム情報生成部205aは、その発明文書に対応する図面文書(例えばPDFファイル)が図面文書取得部2022により取得可能である場合においては、発明文書に含まれる符号付きの要素名と同一である重要語句がクレーム情報に含まれるときに、その重要語句を、操作に応じて図面文書におけるその符号を含む部分(例えばその符号を含む頁)を表示するためのGUIの機能を有する表示要素とするための表示制御情報を、その重要語句の表示要素に付加することとしてもよい。この表示制御情報は、例えば、操作に応じて符号を引数として起動されるスクリプトの関数の関数名又はその関数自体を定義するものであり、その関数は、例えば、引数の符号を含む、図面文書中の部分を、例えば図面文書が検索可能PDFファイルの内容である場合、又は、図面文書を内容として含むPDFファイルを検索可能PDFファイルへと変換できる場合等において、検索可能PDFファイルからその符号を検索することで、特定するように定められる。クレーム情報生成部205aは、図面文書から符号を検索する関数に、例えば、図面文書のPDFファイルを頁毎に分割する処理、頁毎に分割した各分割後PDFファイルからその符号を検索する処理、検索結果としてその符号を検出できた分割後PDFファイルを画像に変換する処理、変換後の画像を表示する処理等を実行する記述を含ませてもよく、これら各処理では、例えば、Python(登録商標)或いはJavaScript(登録商標)で利用可能なPDFを操作するための、既存の各種ライブラリ(例えばサードパーティにより提供されている「PyPDF2」、「pdfminer」等)を用いてもよい。なお、発明文書分析システム20の機能を実現するために、例えばPython(登録商標)で記述された部分を含む発明文書分析処理プログラムは、ウェブサーバ(例えばブラウザと同一端末装置上のローカルホストのウェブサーバ)として機能し、ブラウザを起動して特許出願関連情報に係るHTML文書をブラウザに提供して表示させることができる。そのPython(登録商標)で記述されたプログラムの部分は、ブラウザに解釈され表示、実行等がなされるHTML文書の一構成要素としてのJavaScript(登録商標)で記述されたスクリプトと連携して、各種処理(例えばPDFファイルについての処理等)を分担することが可能である。例えば、Python(登録商標)のサードパーティにより提供されたライブラリ「Eel」は、Python(登録商標)のプログラム部分と、HTML文書におけるJavaScript(登録商標)で記述されたスクリプト部分との連携を可能にする機能を有している。 A claim information generation unit 205a that generates claim information based on the claims in the invention document that is the analysis target of the analysis unit 205 and that is acquired by the invention document acquisition unit 2021 generates a drawing document (for example, a PDF file) corresponding to the invention document. can be acquired by the drawing document acquisition unit 2022, when the claim information contains an important phrase that is the same as the signed element name included in the invention document, the important phrase is transferred to the drawing according to the operation. Display control information for making a display element having a GUI function for displaying a portion including the code in the document (for example, a page including the code) may be added to the display element of the important phrase. This display control information defines, for example, a function name of a function of a script activated with a code as an argument according to an operation, or the function itself. For example, when the drawing document is the content of the searchable PDF file, or when the PDF file containing the drawing document can be converted to the searchable PDF file, the code is removed from the searchable PDF file. By searching, it is determined to identify. The claim information generation unit 205a has a function for searching a code from a drawing document, for example, a process of dividing a PDF file of the drawing document into pages, a process of searching for the code from each divided PDF file divided for each page, The search result may include descriptions for converting the divided PDF file whose code is detected into an image, displaying the converted image, and the like. Trademark) or various existing libraries (for example, "PyPDF2", "pdfminer", etc. provided by a third party) for manipulating PDF that can be used with JavaScript (registered trademark) may be used. In addition, in order to realize the functions of the invention document analysis system 20, the invention document analysis processing program including the portion written in Python (registered trademark), for example, is installed on a web server (for example, a web server of a local host on the same terminal device as the browser). It functions as a server), activates the browser, and can provide the browser with an HTML document related to patent application related information for display. The part of the program written in Python (registered trademark) cooperates with a script written in JavaScript (registered trademark) as one component of an HTML document that is interpreted, displayed, executed, etc. by a browser, and performs various functions. It is possible to share processing (eg, processing PDF files, etc.). For example, the Python (registered trademark) library "Eel" provided by a third party enables cooperation between the program part of Python (registered trademark) and the script part written in JavaScript (registered trademark) in the HTML document. It has the function to

クレーム情報生成部205aは、例えば、符号に対応する重要語句に対する操作に応じて、図面文書におけるその符号を含む部分を表示するための表示制御情報に係る関数を、ブラウザで表示されて操作がなされたその重要語句の表示要素が隠れない範囲に、図面文書におけるその符号を含む部分を表示するように定めておくこととしてもよい。クレーム情報生成部205aは、例えば、ブラウザによる表示画面を複数の表示領域に分割し、クレーム情報の表示領域と、操作に応じて表示される図面文書の一部分等の表示領域とを並列的に表示してもよい。クレーム情報生成部205aは、例えば、符号に対応する重要語句の表示要素に付加する表示制御情報により、その重要語句に対する操作に応じて起動される関数を、更なる操作に応じて図面文書におけるその符号を含む複数の部分(例えばその符号を含む2以上の頁)を切り替えて表示する処理を実行するように定めてもよいし、図面文書におけるその符号を含む全ての部分を必要に応じて縮小して一括表示する処理を実行するように定めてもよい。クレーム情報生成部205aは、例えば、符号に対応する重要語句に対する操作に応じて、図面文書におけるその符号を含む部分を表示するための表示制御情報に係る関数を、図面文書におけるその符号を含む部分におけるその符号を強調表示(例えば図面文書が検索可能PDFファイルの内容である場合にはその符号にマーカーとしての背景色を付加)するように定めておくこととしてもよい。 For example, the complaint information generation unit 205a displays a function related to display control information for displaying a part including the code in the drawing document in response to an operation on the key word corresponding to the code, and the function is displayed on the browser and operated. Alternatively, it may be decided to display the portion of the drawing document containing the code within the range where the display element of the important phrase is not hidden. For example, the complaint information generation unit 205a divides the display screen of the browser into a plurality of display areas, and displays the complaint information display area and the display area such as a part of the drawing document displayed according to the operation in parallel. You may For example, the complaint information generation unit 205a uses the display control information added to the display element of the key word corresponding to the code to add the function activated in response to the operation on the key word to the corresponding key word in the drawing document in accordance with the further operation. It may be determined to switch and display a plurality of parts containing the code (for example, two or more pages containing the code), or reduce all the parts containing the code in the drawing document as necessary. may be determined to execute the process of batch display. For example, the claim information generating unit 205a, in response to an operation on an important phrase corresponding to a code, generates a function related to display control information for displaying a part of the drawing document that includes the code. It is also possible to set such that the code in the .

なお、表示用文書において、表示要素に、操作に応じて処理を行うためのGUIの機能を実現するための表示制御情報が付加されている場合において、その操作は、表示要素に対するマウスオーバー操作、マウスクリック操作等に限定されることはない。また、例えば、表示要素に対するマウスクリック操作等に応じて起動される関数においては、更なる操作を促すためにメニュー、ポップアップ画面等を表示して、そのメニュー、ポップアップ画面等に示された選択肢に対する選択操作に応じた処理を実行することとしてもよい。 In the document for display, when the display control information for realizing the GUI function for performing processing according to the operation is added to the display element, the operation is a mouse over operation on the display element, It is not limited to a mouse click operation or the like. In addition, for example, in a function that is activated in response to a mouse click operation on a display element, a menu, pop-up screen, etc. is displayed to prompt further operations, and options displayed in the menu, pop-up screen, etc. A process corresponding to the selection operation may be executed.

クレーム情報生成部205aは、例えばHTML文書である表示用文書における各情報部分(例えばクレーム情報、修正版クレーム情報等)の各行末の、全角又は半角の空白文字、タブ、改行(line feed)、リターン(return)、改頁(form feed)、或いは、垂直タブの各文字コードを除去し、行末の改行を改行用のHTMLタグ<br>で表すこととしてもよい。 The complaint information generation unit 205a generates full-width or half-width blank characters, tabs, line feeds, line feeds, and so on at the end of each line of each information part (for example, complaint information, corrected version complaint information, etc.) in a display document that is an HTML document, for example. Each character code of return, form feed, or vertical tab may be removed, and the line feed at the end of the line may be represented by the HTML tag <br> for line feed.

[3-1-5-7-2.クレームベース図面情報の生成]
クレーム情報生成部205aは、クレームベース図面情報生成処理を、発明文書取得部2021により取得された発明文書に含まれるクレームに基づいて、クレームベース図面情報を生成することにより実現する。クレームベース図面情報は、各図面の図面番号と、各図面に記載されるべき重要語句、重要語句間の関連性、重要語句に符号が対応する場合には符号等とを示す情報である。クレームベース図面情報は、そのまま特許出願用の図面として利用できる程度に完成した内容である必要はない。クレーム情報生成部205aは、クレームベース図面情報における各図面についての図面番号と対応付けて、その図面の図面種別を示す図面種別情報を生成し得る。図面種別は、例えば、構成図、フローチャート、記録媒体の記録内容を表す図、プログラムで実現される手段、機能等を表す図等である。
[3-1-5-7-2. Generating claim-based drawing information]
The claim information generation unit 205a realizes the claim-based drawing information generation process by generating claim-based drawing information based on the claims included in the invention document acquired by the invention document acquisition unit 2021. FIG. The claim-based drawing information is information indicating the drawing number of each drawing, the key phrases to be described in each drawing, the relationship between the key phrases, and the code when the key phrase corresponds to the code. Claim-based drawing information does not need to be complete enough to be used as drawings for patent application. The complaint information generation unit 205a can generate drawing type information indicating the drawing type of each drawing in association with the drawing number of each drawing in the complaint base drawing information. The drawing type includes, for example, a block diagram, a flow chart, a diagram representing the content recorded in a recording medium, and a diagram representing means, functions, etc. implemented by a program.

クレーム情報生成部205aは、発明文書取得部2021により取得された発明文書に明細書が含まれている場合には、既に図面の情報(例えば図面文書)が生成されている可能性が十分にあると想定されることから、クレームベース図面情報生成処理の実行を省略することとしてもよい。 If the invention document acquired by the invention document acquisition unit 2021 includes a specification, the claim information generation unit 205a has a good possibility that drawing information (for example, drawing document) has already been generated. Therefore, the execution of the claim-based drawing information generation process may be omitted.

[3-1-5-7-2-1.符号の決定]
クレーム情報生成部205aは、クレームベース図面情報の生成を行う場合には、発明文書取得部2021により取得された発明文書のクレームから重要語句抽出部2051により抽出された各重要語句のうち、符号を決定すべき所定の条件を満たす重要語句に、その重要語句が表す要素に対応させるべき符号を決定する符号決定処理を実行する。
[3-1-5-7-2-1. Determination of sign]
When generating claim-based drawing information, the claim information generation unit 205a extracts the symbols from the key words and phrases extracted by the key word extraction unit 2051 from the claims of the invention document acquired by the invention document acquisition unit 2021. A code determination process for determining a code to correspond to an element represented by an important phrase that satisfies a predetermined condition to be determined is executed.

クレーム情報生成部205aは、符号決定処理により符号を決定した重要語句と、その符号とを対応付けて、クレームベース図面情報を作成することになる。クレーム情報生成部205aは、発明文書取得部2021により取得された発明文書に明細書が含まれている場合には、符号決定処理を省略することとしてもよい。 The complaint information generation unit 205a creates complaint-based drawing information by associating the important words and phrases whose symbols are determined by the symbol determination process with the symbols. If the invention document acquired by the invention document acquisition unit 2021 includes a specification, the claim information generation unit 205a may omit the code determination process.

発明文書のクレームから重要語句抽出部2051により抽出された各重要語句のうち、符号決定処理で符号の決定対象となる重要語句に係る所定の条件は、例えば、重要語句が表す要素のカテゴリー種別(例えば、プログラム、データ類、物及び方法のいずれかに分類されるカテゴリー種別)に関する条件である。例えば、プログラム又はデータ類のカテゴリー種別に分類される重要語句は、符号の決定対象となる所定の条件を満たさず、クレーム情報生成部205aは、その重要語句に対応する符号の決定を行わない。プログラム又はデータ類のカテゴリー種別に分類される重要語句は、その重要語句自体で、通常は理解可能だからである。重要語句が、プログラム、データ類、或いは、方法のうちのいずれのカテゴリー種別であるかについては、例えば、その重要語句が、予めカテゴリー別に定めた文字列を語尾に含むか否かによって特定でき、そのいずれにも該当しない重要語句は、物のカテゴリー種別であると特定できる。 Among the important phrases extracted by the important phrase extraction unit 2051 from the claim of the invention document, the predetermined condition related to the important phrases whose signs are to be determined in the sign determination process is, for example, the category type of the element represented by the important phrases ( For example, it is a condition related to a category type that is classified into one of programs, data, products, and methods). For example, an important phrase classified into a program or data category does not satisfy a predetermined condition for code determination, and the complaint information generation unit 205a does not determine a code corresponding to the important phrase. This is because key words that are classified into the category type of program or data can usually be understood by themselves. The category type of an important phrase among programs, data types, or methods can be specified, for example, by whether or not the important phrase includes a character string predetermined for each category at the end of the word. Keywords that do not correspond to any of these can be identified as category types of things.

例えば、方法又は物のカテゴリー種別と特定された複数の重要語句が表す要素同士が構成上の包含関係を有する場合にその複数の重要語句は、符号の決定対象となる所定の条件を満たし、クレーム情報生成部205aは、その複数の重要語句各々に対応する符号の決定を行う。その複数の重要語句各々が表す要素を示す構成図により、通常はその各要素を理解可能となる。なお、構成図において、各要素に符号が付されることは有用である。複数の重要語句が表す要素同士が構成上の包含関係を有するか否かは、属性特定部2056により特定された、各重要語句の一属性としての「重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係」を参照することにより実現可能である。 For example, when elements represented by multiple key phrases specified as the category type of a method or product have structural inclusion relationships, the multiple key phrases satisfy a predetermined condition to be subject to sign determination, and the claim The information generation unit 205a determines a code corresponding to each of the plurality of important phrases. A block diagram showing the elements represented by each of the multiple key phrases usually makes it possible to understand each element. In addition, it is useful to give each element a reference numeral in the configuration diagram. Whether or not the elements represented by a plurality of key words have a compositional inclusion relationship is determined by the attribute of each key word specified by the attribute specifying unit 2056, "the element represented by the key word and another key word." This can be achieved by referring to the "compositional containment relationship with the represented element".

クレーム情報生成部205aは、符号の決定対象となる所定の条件を満たす各重要語句が表す要素の構成上の包含関係に基づいて、符号を決定する。 The complaint information generation unit 205a determines a code based on the structural inclusion relationship of the elements represented by the key words that satisfy a predetermined condition for determining the code.

具体的な一例としては、他のいずれかの重要語句が表す要素を構成上包含した要素であって他のいずれかの重要語句が表す要素に構成上包含されていない要素を、表す第1の重要語句について、符号として利用可能な文字である符号文字で表現される符号を決定する。そして、クレーム情報生成部205aは、第1の重要語句が表す要素が第2の重要語句が表す要素を構成上包含している場合に第1の重要語句に対する符号の末尾に符号文字を追加したものを第2の重要語句に対する符号として決定する。この例においては、クレーム情報生成部205aは、第1の重要語句に対応する符号を例えば「10」と決定した場合に、第2の重要語句に対応する符号を例えば「101」と決定する。 As a specific example, the first For important words and phrases, codes represented by code characters, which are characters that can be used as codes, are determined. Then, the complaint information generation unit 205a adds a code character to the end of the code for the first important phrase when the element represented by the first important phrase includes the element represented by the second important phrase. is determined as the code for the second key phrase. In this example, when the complaint information generation unit 205a determines the code corresponding to the first key phrase as "10", for example, it determines the code corresponding to the second key phrase as "101", for example.

具体的な別の一例としては、他のいずれかの重要語句が表す要素を構成上包含した要素であって他のいずれかの重要語句が表す要素に構成上包含されていない要素を、表す第1の重要語句について、アラビア数字の文字列で示される符号を仮決定する。そして、クレーム情報生成部205aは、第1の重要語句が表す要素がn個(nは自然数)の重要語句各々が表す要素を構成上包含している場合に、第1の重要語句に対して仮決定した符号の末尾に、n個を表すために必要なk桁(kは自然数)の桁数分のゼロ「0」を付加してその符号を最終決定する。つまり、クレーム情報生成部205aは、重要語句に対して符号を決定する符号決定処理で、他の重要語句が表す要素を構成上包含する要素を表すその重要語句に対して符号を決定する場合においては、その重要語句が表す要素が構成上包含する、他の重要語句が表す要素の数(例えばn個)に応じてその符号を決定し得る。クレーム情報生成部205aは、そのn個の重要語句各々に対する符号として、第1の重要語句に対して仮決定した符号に、k桁のアラビア数字で表した1~nに相当する文字列を付加してなる符号を決定する。この例においては、クレーム情報生成部205aは、第1の重要語句に対応する符号を例えば「1」と仮決定し、第1の重要語句が表す要素が例えば15個の重要語句各々が表す要素を構成上包含している場合に、第1の重要語句に対応して仮決定した符号「1」に、その15個を表すために必要な2桁の桁数分の「0」を付加して、第1の重要語句に対応する符号「100」を最終決定する。続いて、クレーム情報生成部205aは、第1の重要語句により表される要素が包含する15個の要素を表す15個の重要語句に対応して「101」~「115」の各符号を決定する。上述の例における、他のいずれかの重要語句が表す要素を構成上包含した要素であって他のいずれかの重要語句が表す要素に構成上包含されていない要素を、表す第1の重要語句に該当する重要語句は、複数存在してもよい。 As another specific example, an element that is structurally included in the element represented by any other key phrase and is not structurally included in the element represented by any other key phrase A code represented by a string of Arabic numerals is tentatively determined for one keyword. Then, if the element represented by the first key phrase includes elements represented by each of n (n is a natural number) key phrases, the complaint information generation unit 205a generates the following for the first key phrase: The code is finally determined by adding k digits (k is a natural number) of zeros (0) to the end of the tentatively determined code. In other words, in the code determination process for determining the sign for the important phrase, the complaint information generation unit 205a determines the sign for the important phrase that represents an element that structurally includes the element represented by another important phrase. can determine its sign according to the number of elements represented by other key words (for example, n) that the element represented by the key word structurally includes. The claim information generation unit 205a adds a character string corresponding to 1 to n represented by k-digit Arabic numerals to the code provisionally determined for the first key phrase as the code for each of the n key phrases. determine the sign of In this example, the complaint information generation unit 205a provisionally determines the code corresponding to the first key phrase to be, for example, "1", and the element represented by the first key phrase is the element represented by each of the 15 key phrases, for example. is included in the configuration, the code "1" provisionally determined corresponding to the first important phrase is added with "0" for the number of two digits necessary to represent the 15 to finally determine the code "100" corresponding to the first key phrase. Subsequently, the complaint information generation unit 205a determines each code of "101" to "115" corresponding to the 15 key phrases representing the 15 elements included in the element represented by the first key phrase. do. In the above example, the first key phrase that represents an element that is structurally included in the element represented by any other key phrase and is not structurally included in the element represented by any other key phrase There may be a plurality of key phrases corresponding to .

クレーム情報生成部205aは、発明文書取得部2021により取得された発明文書に明細書が含まれている場合にも、符号決定処理を実行することとしてもよい。クレーム情報生成部205aは、符号の決定対象となる所定の条件を満たす重要語句について、既に符号が対応している場合には、その対応している符号を用いることで符号の決定を行う。クレーム情報生成部205aは、例えば、重要語句に既に符号が対応している場合における符号の決定については、発明文書の明細書の「符号の説明」の欄に記載された符号を、発明文書のその他の部分に記載された符号よりも優先的に採用して、符号の決定を行うこととしてもよい。なお、発明文書の明細書の「符号の説明」の欄において、同一の重要語句に複数の符号が対応付けて記載されている場合には、クレーム情報生成部205aは、先頭に記載された符号、或いは、例えば自然順(natural ordering)等のソートにより最先となる符号の1つを選択的に採用して、符号の決定を行うこととしてもよい。なお、発明文書分析システム20は、例えば、Python(登録商標)のソートのための標準ライブラリ「sort」、或いは、自然順ソートのための、サードパーティにより提供されたライブラリである「natsort」等を利用して、ソートを実行することとしてもよい。重要語句に既に符号が対応しているか否かは、属性特定部2056により特定された重要語句の一属性としての「符号」に基づいて判別可能である。クレーム情報生成部205aは、符号の決定対象となる所定の条件を満たす重要語句のいずれか1つ以上について、既に符号が対応しており、その所定の条件を満たす重要語句の1つ以上については、未だ符号が対応していない場合においては、クレーム情報生成部205aは、未だ符号が対応していない重要語句に対応して符号を決定するときには、その符号が既に対応している符号と重複しないようにするため、或いは、その符号が自動決定された符号であることを識別可能にするために、その符号の一部分(例えば末尾等)に予め定められた一文字列(例えば「auto」、「at」等)を付加することとしてもよい。 The claim information generation unit 205a may execute the code determination process even when the invention document acquired by the invention document acquisition unit 2021 includes a specification. The complaint information generation unit 205a determines the sign by using the corresponding sign when the sign already corresponds to the key phrase that satisfies the predetermined condition for which the sign is to be determined. For example, when determining a code when a code already corresponds to an important term, the claim information generation unit 205a converts the code described in the "description of code" column of the specification of the invention document into the code of the invention document. The code may be determined by preferentially adopting it over the codes described in other parts. In addition, in the column of "explanation of the code" of the specification of the invention document, when a plurality of codes are written in association with the same important phrase, the claim information generation unit 205a Alternatively, the code may be determined by selectively adopting one of the first codes by sorting such as natural ordering. Note that the invention document analysis system 20 uses, for example, a standard library “sort” for sorting in Python (registered trademark), or a library “natsort” provided by a third party for sorting in natural order. It may be used to perform sorting. Whether or not a sign already corresponds to the key phrase can be determined based on “sign” as one attribute of the key phrase specified by the attribute specifying unit 2056 . The complaint information generation unit 205a determines that one or more of the important words and phrases that satisfy the predetermined conditions to be determined as the codes already correspond to the signs, and that one or more of the important words and phrases that satisfy the predetermined conditions are , when the code does not correspond yet, the complaint information generation unit 205a, when determining the code corresponding to the important phrase for which the code does not correspond yet, does not overlap with the code already corresponding. or to make it identifiable that the code is an automatically determined code, a predetermined character string (eg, "auto", "at ” etc.) may be added.

[3-1-5-7-2-2.図面内容の決定]
クレーム情報生成部205aは、クレームベース図面情報生成処理として、図面内容の決定を行う。
[3-1-5-7-2-2. Determination of drawing content]
The complaint information generation unit 205a determines the drawing content as the complaint-based drawing information generation process.

具体的には、クレーム情報生成部205aは、クレームベース図面情報生成処理として、例えば、発明文書取得部2021により取得された発明文書のクレームから重要語句抽出部2051により抽出された複数の重要語句が表す要素間に構成上の包含関係がある場合に、包含関係に基づいて構成図を生成する。構成上の包含関係がある要素各々を表す重要語句は、要素間関係判別部2058の判別結果に基づいて属性特定部2056が特定した属性の「重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係」の項目により判別可能である。 Specifically, as the claim-based drawing information generation process, the claim information generation unit 205a extracts a plurality of key words extracted by the key word extraction unit 2051 from the claim of the invention document acquired by the invention document acquisition unit 2021, for example. If there is a compositional inclusion relationship between the represented elements, a configuration diagram is generated based on the inclusion relationship. Key phrases representing each of the elements having a structural inclusion relationship are determined by the attribute specified by the attribute identification unit 2056 based on the determination result of the inter-element relationship determination unit 2058, which is the “element represented by the key term and the element represented by the other key term. It can be determined by the item of “structural inclusion relationship with”.

構成図は、例えば、被包含側の要素を表す重要語句を囲み、その重要語句に対応する符号を引出線で結んだ枠線(例えば矩形枠)の外側に、包含側の要素を表す重要語句を配置してその包含側の重要語句とその被包含側の要素に係る枠線とを取り囲み、その包含側の重要語句に対応する符号(例えば符号決定処理において決定された符号)を引出線で結んだ枠線とを描いた図である。構成図に含まれる重要語句に対応する符号が決定されないものである場合には符号及び引出線は省略される。包含関係が入れ子構造である場合には、複数の重要語句に係る枠線が入れ子状になる。構成図は、例えば、上述の枠線及び引出線を省略して、相対的に適切な位置に配置された複数の文字列で構成される未完成の図面であってもよい。
クレーム情報生成部205aは、上述の構成図を、特許出願関連情報に含まれ、表示用文書において表示されるべきクレームベース図面情報における図面として生成し得る。
In the configuration diagram, for example, key phrases representing the elements on the included side are enclosed, and key phrases representing the elements on the included side are displayed outside a frame (for example, a rectangular frame) formed by connecting codes corresponding to the key phrases with lead lines. to enclose the key phrase on the containing side and the frame line related to the element on the included side, and the code corresponding to the key phrase on the containing side (for example, the code determined in the code determination process) is drawn with a leader line It is a figure which drew the frame line which connected. If the code corresponding to the important phrase contained in the configuration diagram is not decided, the code and the leader line are omitted. If the inclusion relationship is a nested structure, the borders of multiple key phrases are nested. The configuration diagram may be, for example, an incomplete drawing composed of a plurality of character strings arranged at relatively appropriate positions, omitting the above-described frame lines and leader lines.
The claim information generation unit 205a can generate the above configuration diagram as a drawing in the claim-based drawing information that is included in the patent application related information and should be displayed in the display document.

物に係る各要素を表す重要語句a、重要語句b、重要語句c、重要語句d及び重要語句eを用いて、構成図の一具体例を挙げると、重要語句aが表す要素が、重要語句b、重要語句c及び重要語句dの各々が表す要素を並列的に含み、重要語句dが表す要素が、重要語句eが表す要素を含む場合には、図面中に、重要語句aを枠内に記載した矩形枠の中に、重要語句aを囲まないようにして重要語句b、重要語句c及び重要語句dの各々を枠内に記載した各矩形枠が、互いに囲み合わないように並列して配置され、重要語句dを枠内に記載した矩形枠の中に、重要語句dを囲まないようにして重要語句eを枠内に記載した矩形枠が、配置され、それぞれの矩形枠には、枠内に記載された重要語句に対応して定められた符号があるときにはその符号が、その矩形枠と結んだ引出線で繋がれて記載される。 Using key phrases a, b, c, c, d, and e that represent each element related to an object, a specific example of a configuration diagram shows that the element represented by the key phrase a is the key phrase If the elements represented by b, key phrase c and key phrase d are included in parallel, and the element represented by key phrase d includes the element indicated by key phrase e, the key phrase a is shown in the drawing in the frame In the rectangular frame described in (1), each rectangular frame in which the key phrase b, the key phrase c, and the key phrase d are written without enclosing the key phrase a are arranged side by side so as not to enclose each other. A rectangular frame with key phrase d written inside a rectangular frame with key phrase d written inside a rectangular frame with key phrase e written inside the frame without surrounding key phrase d is arranged, and in each rectangular frame , When there is a code determined corresponding to the important phrase described in the frame, the code is described by being connected with the rectangular frame by a leader line.

なお、重要語句の一属性としての「初出行番号」が、発明文書のクレームに記載された最先の行の番号を表すように定められている場合においては、構成図中で並列的に配置される要素各々は、その要素を表す重要語句の一属性としての「初出行番号」の小さい順に、図面の上方から下方へ順に並べて記載されることとしてもよい。これにより、例えばクレームの項が、構成要件列挙型で記載されている場合に、クレーム情報生成部205aが、その列挙順に対応した構成図を生成することとなるので、生成された構成図の把握が容易となり得る。 If the "first line number" as an attribute of key phrases is defined to represent the number of the first line described in the claim of the invention document, it is arranged in parallel in the configuration diagram. Each element may be listed from top to bottom of the drawing in ascending order of "first appearance line number" as one attribute of the important phrase representing the element. As a result, for example, when the claim section is described in the enumeration type of the constituent elements, the claim information generation unit 205a generates a configuration diagram corresponding to the enumeration order, so that the generated configuration diagram can be grasped. can be easier.

発明文書における方法に係るクレームの各項が、理解の容易化を狙って、構成要件列挙型で、かつ、動作順に構成要素を並べて、記載されていることを前提とする場合等においては、クレーム中で方法に係る複数の重要語句が表す要素間に包含関係があるときに、クレーム情報生成部205aは、構成図の代わりにフローチャートを生成することとしてもよい。具体例としては、重要語句「機器制御方法」が重要語句「センシング手順」と重要語句「動作パターン決定手順」と重要語句「機器動作制御手順」とを包含する包含関係がある場合であって、重要語句の属性としての「初出行番号」が小さい順に、「センシング手順」、「動作パターン決定手順」、「機器動作制御手順」となっている場合には、図面中に、「機器制御処理」に文字列「開始」を加えて枠内に記載した角丸四角形枠を記載し、その角丸四角形枠の下方に「センシング手順」を枠内に記載した矩形枠を配置して、その下方に「動作パターン決定手順」を枠内に記載した矩形枠を配置して、その下方に「機器動作制御手順」を枠内に記載した矩形枠を配置して、その下方に「動作制御処理」に文字列「終了」を枠内に記載した角丸四角形枠を配置し、各枠間を上方から下方へと線分で接続することでフローチャートが描かれる。 In cases such as when it is assumed that each item of a claim relating to a method in an invention document is described in the form of enumerating constituent elements and arranging the constituent elements in order of operation for the purpose of facilitating understanding, When there is an inclusion relationship among the elements represented by a plurality of key phrases related to the method, the claim information generation unit 205a may generate a flow chart instead of the configuration diagram. As a specific example, when there is an inclusion relationship in which the key phrase "apparatus control method" includes the key phrase "sensing procedure", the key phrase "operation pattern determination procedure", and the key phrase "apparatus operation control procedure", If the "first appearance number" as the attribute of the important phrase is "sensing procedure", "operation pattern determination procedure", and "equipment operation control procedure" in ascending order, "equipment control processing" is shown in the drawing. Add the character string "start" to and write a rounded rectangular frame in the frame. Place a rectangular frame in which the "operation pattern determination procedure" is described, place a rectangular frame in which the "equipment operation control procedure" is described in the frame below it, and place the "operation control process" below it. A flow chart is drawn by arranging rounded rectangular frames with the character string "END" written in the frames and connecting the frames from top to bottom with line segments.

クレーム情報生成部205aは、クレームベース図面情報生成処理として、例えば、発明文書取得部2021により取得された発明文書のクレームから重要語句抽出部2051により抽出された複数の重要語句が表す要素間に、記録媒体とその記録媒体の内容との関係がある場合に、その関係に基づいて記録媒体の記録内容を表す図を生成する。記録媒体とその記録媒体の内容との関係にある要素各々を表す重要語句は、要素間関係判別部2058の判別結果に基づいて属性特定部2056が特定した属性の「重要語句が表す要素の記録内容」の項目により判別可能である。クレーム情報生成部205aは、発明文書のクレームから重要語句抽出部2051により抽出された複数の重要語句が表す要素間に、記録媒体とその記録媒体の内容との関係がある場合であっても、記録媒体の内容が1つのプログラムに分類される要素だけであるときには、構成図の生成を省略し得る。 In the claim-based drawing information generation process, the claim information generation unit 205a, for example, extracts from the claim of the invention document acquired by the invention document acquisition unit 2021, between the elements represented by the key words and phrases extracted by the key phrase extraction unit 2051, When there is a relationship between the recording medium and the contents of the recording medium, a diagram representing the recording contents of the recording medium is generated based on the relationship. The key words and phrases representing each element in relation to the recording medium and the content of the recording medium are identified by the attribute specified by the attribute specifying unit 2056 based on the determination result of the inter-element relation determining unit 2058, which is the “recording of the elements represented by the key words and phrases”. It can be determined by the item of "Contents". Even if there is a relationship between the recording medium and the contents of the recording medium between the elements represented by the multiple key phrases extracted by the key phrase extraction unit 2051 from the claim of the invention document, the complaint information generation unit 205a When the contents of the recording medium are only elements classified into one program, generation of the configuration diagram can be omitted.

記録媒体の記録内容を表す図は、例えば、記録媒体の要素を表す重要語句を囲み、その重要語句に対応する符号を引出線で結んだ枠線(例えば矩形枠)の内側に、記録媒体の要素の記録内容に該当するデータ、情報等を表す1つ以上の重要語句各々を最小の枠線(例えば角丸四角形枠)で囲んだものを描いた図である。なお、記録媒体の記録内容を表す図は、上述の枠線及び引出線を省略した、未完成の図面であってもよい。 A diagram representing the contents recorded on a recording medium is, for example, a frame (for example, a rectangular frame) that encloses important terms representing elements of the recording medium and connects the symbols corresponding to the key terms with lead lines. FIG. 2 is a diagram showing one or more key phrases representing data, information, etc., corresponding to the recorded contents of an element, each surrounded by a minimum frame line (for example, a rectangular frame with rounded corners). It should be noted that the drawing showing the content recorded on the recording medium may be an incomplete drawing in which the above-described frame lines and leader lines are omitted.

クレーム情報生成部205aは、クレームベース図面情報生成処理として、例えば、発明文書取得部2021により取得された発明文書のクレームから重要語句抽出部2051により抽出された複数の重要語句が表す要素間に、プログラムとその実現内容との関係がある場合に、その関係に基づいてプログラムで実現される手段、機能等を表す図を生成する。プログラムとその実現内容との関係にある要素各々を表す重要語句は、要素間関係判別部2058の判別結果に基づいて属性特定部2056が特定した属性の「重要語句が表す要素の実現内容」の項目により判別可能である。 In the claim-based drawing information generation process, the claim information generation unit 205a, for example, extracts from the claims of the invention document acquired by the invention document acquisition unit 2021, between the elements represented by the key words and phrases extracted by the key phrase extraction unit 2051, When there is a relationship between a program and its implementation contents, a diagram representing means, functions, etc. implemented by the program is generated based on the relationship. An important phrase representing each element having a relationship between the program and its implementation content is the attribute "realization content of the element represented by the important phrase" specified by the attribute specifying unit 2056 based on the determination result of the inter-element relationship determination unit 2058. It can be determined by the item.

[3-1-5-7-2-3.図面番号の決定]
クレーム情報生成部205aは、クレームベース図面情報生成処理として、決定した図面内容毎についての図面番号を決定する。
[3-1-5-7-2-3. Determination of drawing number]
The complaint information generation unit 205a determines a drawing number for each determined drawing content as the complaint-based drawing information generation process.

具体例としては、クレーム情報生成部205aは、決定した構成図等の図面毎に、図面内容として含まれる要素を表す重要語句のうち、属性としての「初出クレーム番号」が最小の重要語句におけるその「初出クレーム番号」をその図面の「初出クレーム番号」として特定する。そして、クレーム情報生成部205aは、各図面の図面番号を、各図面について特定した「初出クレーム番号」の小さい順に、1を先頭とする連続番号となるように決定する。複数の図面の「初出クレーム番号」が同一である場合には、クレーム情報生成部205aは、例えば、予め定められた図面優先順序に基づいて、その同一の「初出クレーム番号」の複数の図面間の順を定めて、図面番号を決定する。予め定められた図面優先順序の一例としては、物に係る構成図、データに係る構成図、記録媒体の記録内容を表す図、方法に係る構成図、プログラムで実現される手段、機能等を表す図の順が、挙げられる。 As a specific example, the complaint information generation unit 205a generates the key phrase of the key phrase with the smallest “first appearance claim number” as an attribute among the key phrases representing the elements included as the content of the drawing for each drawing such as the determined configuration drawing. Identify the "first appearance claim number" as the "first appearance claim number" of the drawing. Then, the claim information generation unit 205a determines the drawing number of each drawing so that the drawing numbers are consecutive numbers starting with 1 in ascending order of the "first appearance claim number" specified for each drawing. When a plurality of drawings have the same “first-appearing claim number”, the claim information generation unit 205a, for example, based on a predetermined drawing priority order, and determine the drawing number. An example of the predetermined drawing priority order is a configuration diagram related to an object, a configuration diagram related to data, a diagram representing the contents of recording on a recording medium, a configuration diagram related to a method, a means realized by a program, a function, etc. The order of the figures is listed.

[3-1-5-7-2-4.表示用文書におけるクレームベース図面情報部分の生成]
発明文書分析システム20において出力部208が、クレームベース図面情報を含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、クレーム情報生成部205aは、表示用文書としての特許出願関連情報に含まれるクレームベース図面情報を生成する。
[3-1-5-7-2-4. Generation of claim-based drawing information part in display document]
When the output unit 208 in the invention document analysis system 20 outputs the patent application-related information including the claim-based drawing information as a display document (for example, an HTML document), the claim information generation unit 205a outputs the display document as Generate claim-based drawing information included in patent application related information.

クレーム情報生成部205aが生成する、表示用文書としての特許出願関連情報のクレームベース図面情報部分は、例えば、各図面の図面番号と、各図面に記載されるべき重要語句、重要語句間の関連性、重要語句に符号が対応する場合には符号等とに対応する1つ以上の表示要素を含む。具体例としては、クレーム情報生成部205aは、HTML文書においてクレームベース図面情報を<article>タグと</article>タグとで挟んで記述する場合において、その<article>タグ配下に、図面番号が小さい順に各図面について、その図面の図面番号を示す表示要素を<span>タグと</span>タグとでその図面番号を挟むことで記述し、更に、その図面に対応する各表示要素を記述し、符号については、例えば、各符号を識別するためのクラス名等を含ませた<span>タグと</span>タグとで挟んで記述する。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。クレーム情報生成部205aは、クレームベース図面情報部分に含まれる図面番号、符号、或いは、重要語句に対応する表示要素に、例えば、その表示要素の表示態様の制御(例えば強調表示、色付き表示等)をするための表示制御情報を付加し得る。 The claim-based drawing information portion of the patent application-related information as a document for display generated by the claim information generation unit 205a includes, for example, the drawing number of each drawing, important phrases to be described in each drawing, and the relationship between the important phrases. If a code corresponds to a key phrase, one or more display elements corresponding to the code, etc. are included. As a specific example, the claim information generation unit 205a writes claim-based drawing information sandwiched between <article> and </article> tags in an HTML document. For each drawing in ascending order, a display element indicating the drawing number of the drawing is described by sandwiching the drawing number between the <span> tag and the </span> tag, and each display element corresponding to the drawing is described. On the other hand, a code is described by sandwiching it between <span> and </span> tags that include, for example, a class name for identifying each code. For example, a browser may interpret the presentation document to display each presentation element. The complaint information generating unit 205a controls the display mode of the display elements (e.g., highlighted display, colored display, etc.) for the display elements corresponding to the drawing numbers, codes, or key words included in the complaint base drawing information portion. may add display control information for

クレーム情報生成部205aは、例えば、表示用文書としての特許出願関連情報におけるクレームベース図面情報を、HTML5に準拠したHTML文書として生成する場合に、HTMLファイルに所定のid属性を付加した<canvas>タグを含めて、関数等で、そのid属性の値を指定したgetElementByIdメソッドでcanvasオブジェクトを取得し、canvasオブジェクトのgetContextメソッドで描画コンテキストを取得して、描画コンテキストのfillTextメソッド、strokeRectメソッド、quadraticCurveToメソッド等により、文字列、矩形枠、引出線等を描画する処理を定義しておくことで、構成図の描画を実現し得る。 For example, when the claim-based drawing information in the patent application-related information as a document for display is generated as an HTML document conforming to HTML5, the claim information generation unit 205a creates <canvas> in which a predetermined id attribute is added to the HTML file. Get the canvas object with the getElementById method that specifies the value of the id attribute with a function, etc., including the tag, get the drawing context with the getContext method of the canvas object, and use the fillText method, strokeRect method, and quadraticCurveTo method of the drawing context By defining processing for drawing character strings, rectangular frames, leader lines, etc., drawing of a configuration diagram can be realized.

[3-1-5-7-3.クレームベース明細書情報の生成]
クレーム情報生成部205aは、クレームベース明細書情報生成処理を、発明文書取得部2021により取得された発明文書に含まれるクレームに基づいて、クレームベース明細書情報を生成することにより実現する。クレームベース明細書情報は、未完成の明細書の内容を表し、そのまま特許出願用の明細書として利用できる程度に完成した内容である必要はない。クレームベース明細書情報は、発明文書における明細書が未完成である場合等において、適切な明細書を効率的に作成するために利用される可能性がある。
[3-1-5-7-3. Generate claim-based statement information]
The claim information generation unit 205a realizes the claim-based specification information generation process by generating claim-based specification information based on the claims included in the invention document acquired by the invention document acquisition unit 2021. FIG. The claim-based specification information represents the content of an incomplete specification, and does not need to be complete enough to be used as a specification for a patent application. The claim-based specification information may be used to efficiently create an appropriate specification when the specification in the invention document is incomplete.

クレームベース明細書情報は、例えば、日本国の特許出願の明細書と同様の見出し(例えば、「発明の名称」、「発明が解決しようとする課題」、「発明を実施するための形態」等)を含み、その各見出しに後続した記載内容を含む。 The claim-based specification information includes, for example, headings similar to those of Japanese patent application specifications (e.g., "Title of the Invention," "Problems to be Solved by the Invention," "Method for Carrying Out the Invention," etc.). ), including the content that follows each heading.

クレーム情報生成部205aは、発明文書取得部2021により取得された発明文書に含まれるクレームから重要語句抽出部2051により抽出された重要語句を用いて、発明文書のクレームにおける各項(例えば各請求項)のうち全ての請求対象起点項を抽出する。請求対象起点項は、他の項を引用していない項、或いは、他の項を引用しているが引用先の項とは請求対象が異なる項である。 The claim information generation unit 205a extracts each claim in the claims of the invention document (for example, each claim ), all claimable origin terms are extracted. A claim that originates from a claim is a claim that does not quote other claims, or a claim that quotes other claims but whose subject matter is different from that of the claim to which it is referred.

クレーム情報生成部205aは、抽出した各請求対象起点項について、その請求対象起点項の請求対象を表す重要語句を特定する。重要語句抽出部2051により抽出された重要語句には、属性特定部2056により、一属性として「クレームの請求対象の要素を表すか否か」が特定されているので、クレーム情報生成部205aは、この属性等を参照して、請求対象起点項の請求対象を表す重要語句を特定する。クレーム情報生成部205aは、その特定した全ての請求対象の重要語句の集合の要素として、同一の複数の重要語句が存在する場合にはその複数の重要語句のうち1つの重要語句以外を除去する。そして、クレーム情報生成部205aは、残る請求対象の重要語句の集合(つまり相互に異なる請求対象の重要語句の集合)から、クレームベース明細書情報の「発明の名称」の欄に記載する内容としての発明名称文字列を決定する。発明名称文字列は、例えば、相互に異なる請求対象の重要語句の集合の要素としての重要語句が1つしか存在しない場合は、その1つの重要語句の文字列である。発明名称文字列は、例えば、相互に異なる請求対象の重要語句の集合の要素としての重要語句が複数存在する場合は、その各重要語句を所定の順に列挙して予め定められた所定の形式で配置した文字列である。この列挙に係る所定の順の一例としては、相互に異なる請求対象の重要語句の集合における各重要語句のうち、その重要語句の属性として属性特定部2056により特定されている初出クレーム番号の、自然数のうち、小さい順が、挙げられる。この列挙に係る所定の順の一例によれば、クレームでの記載順に適合して請求対象の重要語句が列挙された発明名称文字列が定まることになる。配置に係る所定の形式の一例としては、最後以外の重要語句間を読点文字「、」で接続し、最後の重要語句間を「及び」で接続する形式が、挙げられる。具体例として、初出クレーム番号順に並べた、相互に異なる請求対象の重要語句の集合における重要語句が、「照明制御装置」と「照明制御方法」と「照明制御プログラム」とであった場合には、クレームベース明細書情報において「発明の名称」に後続されるべき、所定の形式で配置した発明名称文字列は、例えば、「照明制御装置、照明制御方法及び照明制御プログラム」となる。 The claim information generation unit 205a identifies, for each of the extracted claim object originating claims, key words and phrases representing the claim object of the claim object originating claim. In the important phrase extracted by the important phrase extraction unit 2051, the attribute specifying unit 2056 specifies "whether or not the element for which the claim is claimed" is specified as one attribute, so the complaint information generation unit 205a By referring to this attribute or the like, key phrases representing the claimable object of the claimable object originating claim are specified. If there are a plurality of the same key phrases as elements of the set of all the specified key phrases to be claimed, the complaint information generation unit 205a removes all the key phrases other than one of the plurality of key phrases. . Then, the claim information generating unit 205a selects the set of important phrases to be claimed (that is, the set of important phrases to be claimed that are different from each other) to be described in the "title of the invention" column of the claim-based specification information as determines the invention name string of For example, if there is only one key phrase as an element of a set of key phrases of different claim objects, the invention title character string is the character string of that one key phrase. For example, when there are a plurality of key phrases as elements of a set of key phrases to be claimed that are different from each other, the invention name character string is written in a predetermined format by listing each of the key phrases in a predetermined order. It is the placed string. As an example of a predetermined order related to this enumeration, among key words in a set of key words to be claimed that are different from each other, the first-appearing claim number specified by the attribute specifying unit 2056 as an attribute of the key words, natural number Among them, the smallest order can be mentioned. According to an example of this predetermined order of listing, an invention name character string in which important words and phrases to be claimed are listed in accordance with the order of description in claims is determined. An example of a predetermined layout format is a format in which important words and phrases other than the last are connected with comma characters "," and the last important words and phrases are connected with "and". As a specific example, if the key words in the set of key words to be claimed that are different from each other and arranged in the order of the first claim number are "lighting control device," "lighting control method," and "lighting control program." In the claim-based specification information, the invention title character string arranged in a predetermined format to be followed by the "title of the invention" is, for example, "lighting control device, lighting control method and lighting control program".

クレーム情報生成部205aは、例えば、各請求対象起点項についての請求対象を表す重要語句に基づいて定めた、相互に異なる請求対象の重要語句の集合を用いて、クレームベース明細書情報の「発明が解決しようとする課題」の欄の記載内容を決定する。クレーム情報生成部205aは、相互に異なる請求対象の重要語句の集合における各重要語句と、その各重要語句に対応して特定した所定の文字列とを利用して、予め定められた所定の形式で連結した1つ又は複数の文を生成し、その生成された文を「発明が解決しようとする課題」の見出しに後続する記載内容として決定する。この所定の文字列の内容は、例えば、設定情報取得部201により取得された設定情報に含まれる未完成メッセージ情報により示される、記載支援用未完成メッセージである。なお、クレーム情報生成部205aは、相互に異なる請求対象の重要語句の集合における各重要語句が表す要素が、例えば、物、方法、プログラム、プログラム記録媒体、データ構造、データ記録媒体等といったカテゴリーのいずれに属するかに応じて、そのカテゴリー毎に予め定められた、所定の文字列を、特定してもよいし、一律に、所定の文字列を、特定してもよい。具体例として、相互に異なる請求対象の重要語句の集合における重要語句が、「照明制御装置」と「照明制御方法」と「照明制御プログラム」とである場合において、クレーム情報生成部205aは、クレームベース明細書情報の「発明が解決しようとする課題」に後続する記載内容を、例えば、「従来の技術は、■{理由等}、■{課題/効果:~の低減/~の向上等}に必ずしも有用とは限らない。本開示は、■{課題/効果:~の低減/~の向上等}に有用となり得る照明制御装置を提供する。また、本開示は、その照明制御装置に関連する照明制御方法及び照明制御プログラムを提供する。」とする。ここで、未完成の明細書に係るクレームベース明細書情報の内容におけるソリッドブロック及び始め波括弧「■{」と、終わり波括弧「}」とで、文字列を挟んだ形式例により示した部分である未完成記載部分は、記載支援用未完成メッセージにおいて、特許出願用の明細書として活用するためには、未完成の部分であり、つまり適宜編集されるべき部分であることを示す。 The claim information generation unit 205a uses, for example, a set of key phrases of the claim object that are different from each other, which are determined based on the key phrases that represent the claim object of each claim object originating claim, to generate the "invention Decide what to write in the “Problem to be solved by the company” column. The claim information generation unit 205a uses each important phrase in the set of important phrases to be claimed that is different from each other and a predetermined character string specified corresponding to each of the important phrases to generate a predetermined format. to generate one or more sentences connected by , and determine the generated sentences as description contents following the heading "Problems to be Solved by the Invention". The content of this predetermined character string is, for example, an incomplete message for description support indicated by incomplete message information included in the setting information acquired by the setting information acquisition unit 201 . Note that the claim information generation unit 205a determines that the elements represented by the key words in the sets of key words to be claimed that are different from each other are classified into categories such as products, methods, programs, program recording media, data structures, data recording media, and the like. Depending on which category it belongs to, a predetermined character string predetermined for each category may be specified, or a predetermined character string may be specified uniformly. As a specific example, in a case where the important words and phrases in the set of important words and phrases to be claimed that are different from each other are "lighting control device", "lighting control method", and "lighting control program", the claim information generation unit 205a For example, the contents of the description following the "problem to be solved by the invention" of the base specification information, such as "Prior art: ■ {reason etc.}, ■ {problem/effect: reduction of ~/improvement of ~ etc.} The present disclosure provides a lighting control device that can be useful for {problems/effects: reduction of ~/improvement of ~, etc.} Also, the present disclosure relates to the lighting control device provide a lighting control method and a lighting control program for Here, in the contents of the claim-based specification information related to the incomplete specification, the part shown as a format example in which the character string is sandwiched between the solid block and the opening curly bracket "■{" and the closing curly bracket "}" The incomplete description part of the description support incomplete message indicates that it is an incomplete part in order to utilize it as a patent application specification, that is, a part that should be edited as appropriate.

クレーム情報生成部205aは、例えば、各請求対象起点項についての請求対象を表す重要語句に基づいて定めた請求対象の重要語句の集合を用いて、クレームベース明細書情報の「課題を解決するための手段」の欄の記載内容を決定する。クレーム情報生成部205aは、各請求対象起点項の項番と、請求対象の各重要語句と、その各重要語句に対応して特定した所定の文字列との少なくとも1つを利用して、予め定められた所定の形式で連結した1つ又は複数の文を生成し、その生成された文を「課題を解決するための手段」の見出しに後続する記載内容として決定する。この所定の文字列の内容は、例えば、設定情報取得部201により取得された設定情報に含まれる未完成メッセージ情報により示される、記載支援用未完成メッセージである。なお、クレーム情報生成部205aは、請求対象の重要語句の集合における各重要語句が表す要素が、例えば、物、方法、プログラム、プログラム記録媒体、データ構造、データ記録媒体等といったカテゴリーのいずれに属するかに応じて、そのカテゴリー毎に予め定められた、所定の文字列を、特定してもよいし、一律に、所定の文字列を、特定してもよい。具体例として、相互に異なる請求対象の重要語句の集合における重要語句が、「照明制御装置」と「照明制御方法」と「照明制御プログラム」とである場合において、クレーム情報生成部205aは、明細書の「課題を解決するための手段」に後続する記載内容を、例えば、「本開示における照明制御装置は、■請求項1。また、本開示における照明制御方法は、■請求項2。また、本開示における照明制御プログラムは、■請求項3。」とする。この記載内容は複数の行に分割されてもよい。この記載内容において「■請求項n」というソリッドブロックを付加した請求項nの形式例で示した部分は、請求項n(nは自然数)の記載内容に、又はその記載内容に予め定められた所定の変換処理(例えば、改行の削除、句点文字の削除等を行う変換処理)を施した内容に、置換可能である部分であることを示す。なお、クレーム情報生成部205aは、この記載内容中の「■請求項n」の部分を、請求項nの記載内容に、又はその記載内容に予め定められた所定の変換処理を施した内容に、置換しておくこととしてもよい。 The claim information generation unit 205a uses, for example, a set of key phrases of the claim object determined based on the key phrases representing the claim object of each claim object originating claim, to generate the "to solve the problem" of the claim-based specification information. Determine the content of the column “Means of The claim information generation unit 205a uses at least one of the item number of each claimable originating term, each key phrase of the claimable target, and a predetermined character string specified corresponding to each key phrase to generate a One or more sentences linked in a prescribed format are generated, and the generated sentences are determined as description contents following the heading "Means for Solving the Problem". The content of this predetermined character string is, for example, an incomplete message for description support indicated by incomplete message information included in the setting information acquired by the setting information acquisition unit 201 . The claim information generation unit 205a determines that the element represented by each key word in the set of key words to be claimed belongs to any category such as a product, a method, a program, a program recording medium, a data structure, a data recording medium, etc. Depending on the category, a predetermined character string that is predetermined for each category may be specified, or a predetermined character string may be specified uniformly. As a specific example, in a case where the important words and phrases in the set of important words and phrases to be claimed that are different from each other are "lighting control device", "lighting control method", and "lighting control program", the claim information generating unit 205a For example, the description following "Means for Solving the Problems" in the book is changed to "The lighting control device in the present disclosure is (ii) claim 1. Also, the lighting control method in the present disclosure is (ii) claim 2. , the lighting control program in the present disclosure is defined as (3). This description may be split into multiple lines. In the content of this description, the part indicated by the example of the form of claim n to which a solid block "■ claim n" is added is in the content of claim n (n is a natural number) or is predetermined in the content of the description. It indicates that it is a part that can be replaced in the content that has been subjected to a predetermined conversion process (for example, a conversion process that deletes line feeds, period characters, etc.). Note that the claim information generation unit 205a converts the portion of "■ claim n" in the description content to the description content of claim n or to the content obtained by subjecting the description content to predetermined conversion processing. , may be substituted.

クレーム情報生成部205aは、例えば、クレームベース図面情報生成処理において生成したクレームベース図面情報等に基づいて、クレームベース明細書情報の「図面の簡単な説明」の欄の記載内容を決定し得る。具体例として、まず、クレーム情報生成部205aは、クレームベース図面情報及び図面種別情報に基づいて、各図について、その図の図面種別に対応して主要な重要語句を特定する。例えば、図面種別が構成図又はフローチャートである図面においては、最も多くの要素を構成上包含する要素を表す重要語句が、その図面の主要な重要語句になる。また、図面種別が、記録媒体の記録内容を表す図である図面においては、記録媒体である要素を表す重要語句が、その図面の主要な重要語句になる。また、図面種別が、プログラムで実現される手段、機能等を表す図である図面においては、プログラムである要素を表す重要語句が、その図面の主要な重要語句になる。そして、クレーム情報生成部205aは、各図について、図面番号と、特定した主要な重要語句と、図面種別とを含む、予め定められた形式の文字列を特定することで、クレームベース明細書情報の「図面の簡単な説明」の欄の記載内容を決定する。一例としては、図面番号が1の図面の主要な重要語句が「制御システム」であり、図面種別が構成図である場合には、クレーム情報生成部205aは、「図面の簡単な説明」の欄の一行の記載内容を、始め隅付き括弧と終わり隅付き括弧とで挟んで記載される「図1」に、「図1は制御システムの構成の一例を示す構成図である。」という文が後続する文字列とする。 The complaint information generation unit 205a can determine the description contents of the "brief description of the drawing" column of the complaint-based specification information based on the complaint-based drawing information generated in the complaint-based drawing information generation process, for example. As a specific example, first, the complaint information generation unit 205a identifies the main key phrases for each drawing corresponding to the drawing type of the drawing based on the complaint base drawing information and the drawing type information. For example, in a drawing whose drawing type is a configuration diagram or a flow chart, key phrases representing elements that structurally include the most elements become main key phrases of the drawing. In addition, in a drawing whose drawing type is a drawing representing the content recorded on a recording medium, key words representing the elements that are the recording medium are the main key words of the drawing. In addition, in a drawing whose drawing type is a diagram representing means, functions, etc. realized by a program, key words representing elements that are programs become the main key words of the drawing. Then, the claim information generation unit 205a identifies a character string in a predetermined format that includes the drawing number, the identified key phrase, and the drawing type for each drawing, thereby generating claim-based specification information. Decide on the contents of the column “Brief description of the drawing” in As an example, if the main key phrase of the drawing with drawing number 1 is "control system" and the drawing type is a configuration diagram, the claim information generation unit 205a creates a "brief description of the drawing" column. In "Fig. 1" where the contents of one line are sandwiched between the opening square bracket and the closing square bracket, the sentence "Fig. 1 is a configuration diagram showing an example of the configuration of the control system." Let the following string.

クレーム情報生成部205aは、例えば、発明文書のクレームの各項についての項番と、その項の請求対象を表す重要語句と、所定の文字列に基づいて、クレームベース明細書情報の「発明を実施するための形態」の欄の記載内容(つまり「発明を実施するための形態」の見出しに後続する記載内容)の一部を決定し得る。この所定の文字列の内容は、例えば、設定情報取得部201により取得された設定情報に含まれる未完成メッセージ情報により示される、記載支援用未完成メッセージである。なお、クレーム情報生成部205aは、発明文書のクレームの各項の請求対象の重要語句が表す要素が、例えば、物、方法、プログラム、プログラム記録媒体、構造化されたデータ、データ記録媒体等といったカテゴリーのいずれに属するかに応じて、そのカテゴリー毎に、所定の文字列(例えばプログラムについてはコンピュータ等へのインストールに言及する文字列等)を、特定してもよいし、一律に、所定の文字列を、特定してもよい。具体例として、発明文書のクレームの請求項1~4の請求対象の重要語句が、順に、「照明制御装置」、「照明制御装置」、「照明制御方法」、「照明制御プログラム」であり、請求項2が請求項1を引用している場合において、クレーム情報生成部205aは、「発明を実施するための形態」の欄の一部(例えば先頭部分等)に記載する内容として、例えば、「本開示における照明制御装置は、■請求項1。これにより、■{理由等}、■{効果:~できる/~し得る/~の可能性が高まり得る/~に有用であり得る等}。ここで、■請求項2としてもよい。これにより、■{理由等}、■{効果:~できる/~し得る/~の可能性が高まり得る/~に有用であり得る等}。また、本開示における照明制御方法は、■請求項3。これにより、■{効果}。また、本開示における照明制御プログラムは、■請求項4。この照明制御プログラムをマイクロプロセッサ(Microprocessor)を備える機器等にインストールすることで、その機器等は、■{プログラム実現内容等:照明制御方法、照明制御機能等}を実現し得る。従って、この照明制御プログラムにより、■{効果}が実現され得る。なお、上述した照明制御装置及びこれに関連する技術は、機器、装置、集積回路、システム、方法、コンピュータプログラム、コンピュータで読み取り可能な記録媒体等の全体又は一部としての各種態様で具現化され得る。」を決定する。この記載内容は、複数の行に分割されてもよい。この記載内容において「■請求項n」というソリッドブロックを付加した請求項nの形式例で示した部分は、請求項n(nは自然数)の記載内容に、又は、その記載内容に対して予め定められた所定の変換処理(例えば、改行の削除、句点文字の削除、クレームの項を引用する引用記載部分の削除等を行う変換処理)を施した内容に、置換可能である部分であることを示す。なお、クレーム情報生成部205aは、この記載内容中の「■請求項n」の部分を、請求項nの記載内容に、又は、その記載内容に対して上述した所定の変換処理を施した内容に、置換しておくこととしてもよい。クレーム情報生成部205aは、この置換した後の記載内容における重要語句抽出部2051により抽出された重要語句のうち、符号決定処理により対応する符号が決定されている重要語句の直後に、対応する符号を挿入することとしてもよい。上述した所定の変換処理の具体的な一例としては、請求項5の内容が「請求項1記載の照明制御装置を搭載した自動車の・・・」という記載を含む場合において、その記載を「上述した照明制御装置を搭載した自動車の・・・」等と、引用先の請求項の記載内容が上述されていることを前提として「請求項」を用いない表現に、変換する例が挙げられる。 The claim information generation unit 205a generates the claim-based specification information based on, for example, the item number of each item of the claim of the invention document, key phrases representing the object of the claim of the item, and a predetermined character string. A portion of the description in the "Detailed Description" column (that is, the description following the "Detailed Description" heading) may be determined. The content of this predetermined character string is, for example, an incomplete message for description support indicated by incomplete message information included in the setting information acquired by the setting information acquisition unit 201 . Note that the claim information generation unit 205a determines that the element represented by the key words of the claim object of each claim of the invention document is, for example, a product, a method, a program, a program recording medium, structured data, a data recording medium, or the like. Depending on which category it belongs to, for each category, a predetermined character string (for example, for programs, a character string referring to installation on a computer, etc.) may be specified, or a predetermined character string may be specified uniformly. A string may be specified. As a specific example, the important terms of claims 1 to 4 of the claims of the invention document are, in order, "lighting control device", "lighting control device", "lighting control method", and "lighting control program", In the case where claim 2 cites claim 1, the claim information generation unit 205a writes, for example, the following as the content to be described in a part of the column of "mode for carrying out the invention" (for example, the beginning part, etc.): “The lighting control device in the present disclosure includes: (1) Claim 1. This provides (2) {reasons, etc.}, (2) {effects: it can be done / can be done / the possibility of ~ can be increased / it can be useful for ~ etc.} Here, (1) claim 2. Thereby, (2) {reasons, etc.}, (2) {effects: can be done / can be done / the possibility of ~ can be increased / can be useful for ~ etc.}. , the lighting control method in the present disclosure includes: (1) Claim 3. Thereby, (2) {effect} Further, the lighting control program in the present disclosure includes (2) Claim 4. A device equipped with a microprocessor for executing this lighting control program , etc., the device etc. can implement {program implementation contents, etc.: lighting control method, lighting control function, etc.}.Therefore, this lighting control program can implement {effect}. The lighting control device and related technology described above may be embodied in various aspects as a whole or a part of equipment, devices, integrated circuits, systems, methods, computer programs, computer-readable recording media, etc. get.” This description may be divided into multiple lines. In the content of this description, the part indicated by the example of the format of claim n with the addition of a solid block "■ claim n" is included in the content of claim n (n is a natural number) or in advance for the content of the description. A part that can be replaced with the content that has been subjected to prescribed conversion processing (for example, conversion processing that deletes line breaks, deletes period characters, deletes quoted descriptions that cite claim paragraphs, etc.) indicate. Note that the claim information generation unit 205a converts the portion of "■ claim n" in the description content to the description content of claim n or to the content obtained by performing the above-described predetermined conversion processing on the description content. , may be replaced with Of the key words extracted by the key word extracting part 2051 in the description content after replacement, the complaint information generation unit 205a adds the corresponding code immediately after the key word whose corresponding code is determined by the code determination process. may be inserted. As a specific example of the predetermined conversion process described above, when the contents of claim 5 include the description "of a vehicle equipped with the lighting control device according to claim 1...", the description is changed to "the above-described An example of conversion to an expression that does not use "claims" is given, on the premise that the descriptions of the cited claims are described above.

クレーム情報生成部205aは、例えば、クレームベース図面情報生成処理において生成したクレームベース図面情報及び図面種別情報、並びに、所定の文字列に基づいて、クレームベース明細書情報の「発明を実施するための形態」の欄の記載内容の一部を決定し得る。この所定の文字列の内容は、例えば、設定情報取得部201により取得された設定情報に含まれる未完成メッセージ情報により示される、記載支援用未完成メッセージである。具体例として、クレーム情報生成部205aは、「発明を実施するための形態」の欄の一部に、順次記載するために、クレームベース図面情報及び図面種別に基づいて、図面番号が小さい順に各図面に関連した次の記載を行う。即ち、クレーム情報生成部205aは、「発明を実施するための形態」の欄の一部に、図面番号が小さい順に各図面について、その図面の図面番号と図面種別とを含む文を記載し、その文に続いてその図面に含まれる要素間の関係に基づいてその各要素について、その要素を表す重要語句と、その重要語句を説明するために必要である場合においては他の重要語句と、その重要語句を説明するための記載支援用未完成メッセージとを含む文を記載する。なお、重要語句設定辞書取得部203により取得された重要語句設定辞書において、重要語句と対応付けてその重要語句を説明する文が含まれている場合には、クレーム情報生成部205aは、クレームベース明細書情報の「発明を実施するための形態」の欄において、その重要語句を説明するための記載支援用未完成メッセージの代わりに、又は、記載支援用未完成メッセージに付加して、その重要語句設定辞書におけるその重要語句に対応する、その重要語句を説明する文を記載してもよい。重要語句を説明するために必要である、他の重要語句、及び、重要語句を説明するための記載支援用未完成メッセージは、例えば、「重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係」、「重要語句が表す要素の記録内容」、重要語句が表す要素の実現内容」等といった重要語句の属性、及び、重要語句に応じて定められ得る。クレーム情報生成部205aは、例えば、発明文書のクレームから重要語句抽出部2051により抽出された複数の重要語句各々についての、その重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係、その重要語句が表す要素の記録内容、又は、その重要語句が表す要素の実現内容に基づいて定められた、その重要語句を説明するための記載支援用未完成メッセージに基づいて、クレームベース明細書情報における「発明を実施するための形態」の見出しに後続する記載内容の一部を決定し得る。クレーム情報生成部205aは、例えば、発明文書のクレームから重要語句抽出部2051により抽出された複数の重要語句各々について、その重要語句が表す要素が、他の重要語句が表す要素を構成上包含するか、又は、他の重要語句が表す要素に構成上包含されるときには、その重要語句、及び、その他の重要語句の、構成上の包含関係に基づいて、その重要語句に対して符号を決定する符号決定処理を行い得る。クレーム情報生成部205aは、クレームベース明細書情報における「発明を実施するための形態」の見出しに後続する記載内容の少なくとも一部に含まれる重要語句のうち、符号決定処理において重要語句に対して符号が決定されている重要語句については、その重要語句の直後にその符号を挿入する。具体的な一例として、クレームベース図面情報において「図1」が主要な重要語句「制御システム」の「構成図」であり、「制御システム」が「人感センサ」と「制御内容決定装置」と「照明制御信号送信装置」とを構成上包含しており、「制御システム」に対応する符号が「10」、「人感センサ」に対応する符号が「11」、「制御内容決定装置」に対応する符号が「12」、「照明制御信号送信装置」に対応する符号が「13」と決定されている場合においては、クレーム情報生成部205aは、クレームベース明細書情報における「発明を実施するための形態」の欄の一部に、「図1は、制御システム10の構成の一例を示す構成図である。制御システム10は、■{制御システム10の説明(機能/作用/動作原理/属性/形状/サイズ/材質/態様/入出力/生成関連情報等)}。制御システム10は、人感センサ11と、制御内容決定装置12と、照明制御信号送信装置13とを含む。人感センサ11は、■{人感センサ11の説明}。制御内容決定装置12は、■{制御内容決定装置12の説明}。照明制御信号送信装置13は、■{照明制御信号送信装置13の説明}。」という文字列を記載する。クレーム情報生成部205aは、例えば、クレームベース明細書情報における「発明を実施するための形態」の欄の一部に「図1」に関連する記載をした後に、その記載に後続するように、図2に関連する記載をする。なお、クレームベース図面情報が示す複数の図面に同一の要素が含まれる場合もあるので、クレーム情報生成部205aは、冗長な記載を防止すべく、クレームベース明細書情報における「発明を実施するための形態」の欄において、同一内容の文を、重複的に複数記載しないこととしてもよい。クレーム情報生成部205aは、例えば、発明文書取得部2021が取得した発明文書のクレームから重要語句抽出部2051が抽出した全ての重要語句のうち、クレームベース明細書情報における「発明を実施するための形態」の欄で上述の各図面に関連した説明等に用いられていない重要語句がある場合には、その説明等に用いられていない重要語句を説明するための記載支援用未完成メッセージを含む文を、「発明を実施するための形態」の欄に追記し得る。これにより、クレームベース明細書情報における「発明を実施するための形態」の欄に、発明文書のクレームに記載された全ての重要語句の説明が網羅され得る。
なお、クレーム情報生成部205aの変形例としては、クレーム情報生成部205aは、例えば、クレームベース図面情報及び図面種別情報を用いずに、発明文書のクレーム中に表されていた重要語句間の包含関係に基づいてその重要語句間の包含関係を示す文章をクレームベース明細書情報における「発明を実施するための形態」の見出しに後続する記載内容の一部として決定してもよい。また、クレーム情報生成部205aの別の例としては、クレーム情報生成部205aは、発明文書のクレームから重要語句抽出部2051により抽出された複数の重要語句各々についての、その重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係、その重要語句が表す要素の記録内容、又は、その重要語句が表す要素の実現内容に基づいて定められた、その重要語句を説明するための記載支援用未完成メッセージ等に基づいて、クレームベース明細書情報における「発明を実施するための形態」の見出しに後続する記載内容の一部を決定してもよい。例えば、クレームから抽出された重要語句「制御システム」が、重要語句「人感センサ」と重要語句「制御内容決定装置」と重要語句「照明制御信号送信装置」とを構成上包含している場合に、この例に係るクレーム情報生成部205aは、「発明を実施するための形態」の見出しに後続する記載内容の一部として、「制御システムは、例えば、人感センサと制御内容決定装置と照明制御信号送信装置とを含むものであってもよいし、例えば人感センサと制御内容決定装置と照明制御信号送信装置とのいずれかを含まないものであってもよい■{独立請求項に鑑みた必須要素か否かの判断、この実施形態例に盛り込むべき要素か否かの判断等に基づきこの文を適宜修正等して下さい)}。」等といった、包含の許容を表すが必ずしも包含関係を示している訳ではない、適宜修正されて利用されるための記載支援用未完成メッセージ付きの文字列を記載することとしてもよい。また、この文字列における各重要語句について、その重要語句の直後に、対応する符号を付記してもよい。これにより、発明者等又は弁理士は、クレームベース明細書情報を基にして、将来的な独立請求項の変更等に対応可能な実施形態例を含む明細書の作成を容易に行うことができる可能性がある。
The claim information generation unit 205a, for example, based on the claim-based drawing information and drawing type information generated in the claim-based drawing information generation process, and a predetermined character string, the claim-based specification information "In order to carry out the invention may determine part of the description in the "Mode" column. The content of this predetermined character string is, for example, an incomplete message for description support indicated by incomplete message information included in the setting information acquired by the setting information acquisition unit 201 . As a specific example, the claim information generation unit 205a generates each drawing number in ascending order based on the claim-based drawing information and the drawing type in order to write sequentially in a part of the "Mode for Carrying Out the Invention" column. The following statements are made in connection with the drawings. That is, the claim information generation unit 205a writes a sentence including the drawing number and the drawing type for each drawing in ascending order of the drawing number in a part of the "Mode for Carrying Out the Invention" column, following that sentence, for each element based on the relationship between the elements contained in the drawing, key words representing that element and other key words as necessary to describe the key words; Write a sentence including an incomplete message for description support for explaining the important phrase. Note that if the key phrase setting dictionary acquired by the key phrase setting dictionary acquisition unit 203 includes a sentence explaining the key phrase in association with the key phrase, the complaint information generation unit 205a In the column of "Mode for Carrying Out the Invention" of the specification information, instead of or in addition to the incomplete message for description support to explain the A sentence explaining the important phrase corresponding to the important phrase in the phrase setting dictionary may be described. Other important phrases necessary to explain the important phrases and the incomplete message for description support for explaining the important phrases are, for example, "an element represented by the Attributes of key phrases such as "structural inclusion relationship of the key phrase", "recorded content of the element indicated by the key phrase", and "realization content of the element indicated by the key phrase", etc., and the key phrase. For example, for each of a plurality of important phrases extracted by the important phrase extraction unit 2051 from the claims of the invention document, the claim information generation unit 205a is configured to determine the elements represented by the important phrases and the elements represented by the other important phrases. Based on the inclusion relationship, the recorded content of the element represented by the key phrase, or the implementation of the element represented by the key phrase, the claim is based on the incomplete writing support message to explain the key phrase. It may determine the portion of the description that follows the "Detailed Description" heading in the base specification information. The claim information generation unit 205a, for example, for each of a plurality of key phrases extracted by the key phrase extraction unit 2051 from the claim of the invention document, the element represented by the key phrase includes the element represented by the other key phrase. Or, when it is structurally included in an element represented by another key phrase, a code is determined for that key phrase based on the structural inclusion relationship of the key phrase and other key phrases. A sign determination process may be performed. The claim information generation unit 205a selects important words and phrases in the code determination process from among the important words and phrases included in at least part of the description content following the heading of "Mode for Carrying out the Invention" in the claim-based specification information. For important phrases whose codes have been determined, the codes are inserted immediately after the important phrases. As a specific example, in the claim-based drawing information, "Fig. 1" is a "configuration diagram" of the main important phrase "control system", and the "control system" is a "human sensor" and a "control content determination device". "Lighting control signal transmitter" is included in the configuration, the code corresponding to "control system" is "10", the code corresponding to "human sensor" is "11", and the "control content determination device" When the corresponding code is determined to be "12" and the code corresponding to "lighting control signal transmitting device" is determined to be "13", the complaint information generating unit 205a determines that "implementing the invention" in the complaint-based specification information In a part of the column of "Form for the purpose", "Fig. 1 is a configuration diagram showing an example of the configuration of the control system 10. The control system 10 includes: {Description of the control system 10 (function / operation / principle of operation / attribute/shape/size/material/mode/input/output/generation-related information, etc.)} The control system 10 includes a human sensor 11, a control content determination device 12, and a lighting control signal transmitter 13. The sensor 11 includes: {description of the human sensor 11} The control content determination device 12: {description of the control content determination device 12} The lighting control signal transmission device 13: {description of the lighting control signal transmission device 13} }." is described. The claim information generation unit 205a, for example, after writing a description related to "Fig. 1" in part of the "Mode for Carrying Out the Invention" column in the claim-based specification information, so as to follow the description, A description related to FIG. 2 is provided. In addition, since the same elements may be included in a plurality of drawings indicated by the claim-based drawing information, the claim information generation unit 205a may prevent redundant descriptions by adding the phrase "In order to carry out the invention" in the claim-based specification information. In the column of "Form of", sentences with the same content may not be described redundantly. For example, the claim information generation unit 205a extracts all the important phrases extracted by the important phrase extraction unit 2051 from the claims of the invention document acquired by the invention document acquisition unit 2021, in the claim-based specification information, "In order to carry out the invention If there are important words and phrases that are not used in the explanations, etc. related to the above drawings in the "Form" column, include an incomplete message for description support to explain the important words and phrases that are not used in the explanations, etc. The text may be added to the "Description of the Invention" column. As a result, the description of all important terms in the claims of the invention document can be covered in the "Modes for Carrying Out the Invention" column in the claim-based specification information.
As a modified example of the claim information generation unit 205a, the claim information generation unit 205a can, for example, not use the claim-based drawing information and the drawing type information, and can perform inclusion between important words and phrases expressed in the claims of the invention document. Based on the relationship, a sentence indicating the inclusion relationship between the important terms may be determined as part of the description content following the heading of "Mode for Carrying Out the Invention" in the claim-based specification information. Further, as another example of the complaint information generation unit 205a, the complaint information generation unit 205a extracts each of a plurality of key phrases extracted by the key phrase extraction unit 2051 from the claims of the invention document. To explain the key phrase, determined based on the compositional inclusion relationship with the element indicated by the other key phrase, the recorded content of the element indicated by the key phrase, or the actual content of the element indicated by the key phrase Part of the description content following the heading of "Mode for Carrying Out the Invention" in the claim-based specification information may be determined based on the incomplete message for description support in . For example, if the key phrase "control system" extracted from the claim includes the key phrase "human sensor", the key phrase "control content determination device", and the key phrase "lighting control signal transmitter" in terms of configuration. In addition, the complaint information generation unit 205a according to this example writes, as part of the description contents following the heading "Mode for Carrying Out the Invention", "The control system includes, for example, a human sensor and a control content determination device. The lighting control signal transmitting device may be included, or, for example, any one of the motion sensor, the control content determining device, and the lighting control signal transmitting device may not be included. Please correct this sentence as appropriate based on the determination of whether or not it is an essential element in view of the consideration and whether or not it is an element that should be included in this embodiment)}. It is also possible to describe a character string with an incomplete message for description support, which does not indicate a relationship and is used after being modified as appropriate. Also, for each key phrase in this character string, a corresponding code may be added immediately after the key phrase. As a result, inventors, etc. or patent attorneys can easily prepare specifications including examples of embodiments that can respond to future changes in independent claims based on claim-based specification information. there is a possibility.

クレーム情報生成部205aは、クレームベース明細書情報に、例えば、設定情報取得部201により取得された設定情報における定型文情報に従って、定型文を含ませ得る。また、クレーム情報生成部205aは、クレームベース明細書情報において、例えば、各行毎等に、段落番号を挿入し得る。 The complaint information generation unit 205a can include a fixed phrase in the complaint-based specification information according to the fixed phrase information in the setting information acquired by the setting information acquisition unit 201, for example. Also, the complaint information generation unit 205a can insert a paragraph number, for example, into each line in the complaint-based specification information.

発明文書分析システム20において出力部208が、クレームベース明細書情報を含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、クレーム情報生成部205aは、表示用文書としての特許出願関連情報に含まれるクレームベース明細書情報を生成する。図25は、ブラウザに表示された表示用文書としての特許出願関連情報におけるクレームベース明細書情報の一例を示す。図25は、図22に例示したクレーム情報に対応して生成されたクレームベース明細書情報の例である。図25では、便宜上、クレームベース明細書情報の一部を省略している。例えば、図25に例示したクレームベース明細書情報中のソリッドブロック及び始め波括弧「■{」と終わり波括弧「}」と文字列を挟んだ形式の記載支援用未完成メッセージ(例えば、重要語句「A部」に係る「■{A部11の説明}」という記載支援用未完成メッセージ)の表示要素は操作対応GUI要素とされ、マウスクリック操作等に応じて、発明文書取得部2021が取得した発明文書に関連する別の発明文書から、記載支援用未完成メッセージに係る重要語句を含む各行の記載を列挙する重要語句包含記載列挙処理が、実行されるように表示制御情報が付加されていることとしてもよい。この別の発明文書は、例えばユーザによる指定(例えば設定情報中での指定)により特定される1つ以上の発明文書である。この記載支援用未完成メッセージに係る重要語句包含記載列挙処理の実行用の操作対応GUI要素により、ユーザ(例えば発明者等又は弁理士)にとって、記載支援用未完成メッセージを、既存の発明文書を活用した適切な内容の文へ修正することが、容易となる可能性がある。例えば、重要語句「A部」に係る「■{A部11の説明}」という記載支援用未完成メッセージに係る重要語句包含記載列挙処理では、例えば、重要語句「A部」に、格助詞「は」又は格助詞複合「とは」が後続された記載を、その発明文書に関連する別の発明文書における検索対象としてもよい。これにより、重要語句包含記載列挙処理により、重要語句「A部」を主語として説明した文を含む行が列挙され得る。 When the output unit 208 in the invention document analysis system 20 outputs the patent application-related information including the claim-based specification information as a display document (for example, an HTML document), the claim information generation unit 205a outputs to generate claim-based specification information included in the patent application-related information of FIG. 25 shows an example of claim-based specification information in patent application related information as a display document displayed on the browser. FIG. 25 is an example of claim-based specification information generated corresponding to the claim information illustrated in FIG. In FIG. 25, part of the claim-based specification information is omitted for convenience. For example, a solid block in the claim-based specification information illustrated in FIG. The display element of the description support incomplete message "{Description of A part 11}" related to "A part") is an operation-responsive GUI element, and is acquired by the invention document acquisition unit 2021 in response to a mouse click operation, etc. The display control information is added so that the important phrase inclusion description enumeration process for listing the descriptions of each line including the important phrases related to the incomplete message for description support is executed from another invention document related to the created invention document. It can be assumed that there is This separate invention document is, for example, one or more invention documents specified by a user's designation (eg, designation in setting information). With the operation-responsive GUI element for executing the important phrase inclusion description enumeration process related to this incomplete description support message, the user (for example, an inventor or a patent attorney) can use the incomplete description support message as an existing invention document. It may become easier to revise the sentences to appropriate content that is utilized. For example, in the important phrase inclusion description enumeration process related to the incomplete message for description support " {explanation of A part 11 }" related to the important phrase "A part", for example, the important phrase "A part" includes the case particle " A description followed by "wa" or a case particle compound "towa" may be searched for in another invention document related to the invention document. As a result, by the key phrase inclusion description enumeration process, lines including sentences describing the key phrase "part A" as the subject can be listed.

クレーム情報生成部205aが生成する、表示用文書としての特許出願関連情報のクレームベース明細書情報部分は、例えば、上述したクレームベース明細書情報生成処理で生成した未完成の明細書に係るクレームベース明細書情報における各行の内容に対応する、1つ以上の表示要素を含み、その各項の各行内に重要語句抽出部2051により抽出された1つ以上の重要語句があればその各重要語句に対応する、1つ以上の表示要素を含む。具体例としては、クレーム情報生成部205aは、HTML文書においてクレームベース明細書情報を<article>タグと</article>タグとで挟んで記述する場合においてその<article>タグ配下に、クレームベース明細書情報生成処理で生成した、未完成の明細書に係るクレームベース明細書情報の各行について、その行に対応する表示要素を、<span>タグと</span>タグとでその行の内容を挟むことで記述し、その1つの行に対応する表示要素の<span>タグ配下に、その行内の各重要語句について、その重要語句に対応する表示要素を、<span>タグと</span>タグとでその重要語句を挟むことで記述する。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。クレームベース明細書情報部分に含まれる各行に対応する各表示要素は、例えば、その対応する行の内容を表示可能にする。 The claim base specification information part of the patent application-related information as a display document generated by the claim information generation unit 205a is, for example, the claim base specification related to the incomplete specification generated by the above-described claim base specification information generation process. Contains one or more display elements corresponding to the content of each line in the specification information, and if there are one or more important phrases extracted by the important phrase extraction unit 2051 in each line of each section, each important phrase Contains one or more corresponding display elements. As a specific example, the complaint information generation unit 205a creates a claim-based specification under the <article> tag when describing the complaint-based specification information sandwiched between <article> and </article> tags in an HTML document. For each line of the claim-based specification information related to the incomplete specification generated in the document information generation process, the display element corresponding to the line is displayed with the <span> tag and the </span> tag. <span> tag and <span> tag of the display element corresponding to one line, for each important phrase in that line, the display element corresponding to the important phrase is added with <span> tag and </span> Describe by sandwiching the important phrase with a tag. For example, a browser may interpret the presentation document to display each presentation element. Each display element corresponding to each line included in the claim-based specification information portion enables, for example, the contents of the corresponding line to be displayed.

クレーム情報生成部205aは、表示用文書におけるクレームベース明細書情報部分に含まれる見出し、重要語句、記載支援用未完成メッセージ、或いは、符号に対応する表示要素に、例えば、その表示要素についての表示態様の制御(例えば強調表示、色付き表示、表示遷移等)をするための表示制御情報を付加する。この表示制御情報については、例えば、上述した、表示用文書におけるクレーム情報中の表示要素に付加された表示制御情報と同様の方式で実現し得る。従って、表示用文書におけるクレームベース明細書情報部分に記載された重要語句の表示要素は、例えば、操作に応じて、表示用文書におけるクレーム情報中でのその重要語句を含む記載部分を表示するための操作対応GUI要素として機能し得る。クレーム情報生成部205aは、例えば、表示用文書におけるクレームベース明細書情報に含まれる重要語句の表示要素に、その表示要素の表示態様を制御するための表示制御情報を付加し、その表示制御情報は、その重要語句のその表示要素を、その表示要素の操作に応じて、表示用文書におけるクレーム情報中のその重要語句を含む記載部分を表示(例えばリンク表示)するためのGUIとして機能させるためのものである。ユーザ(例えば発明者等又は弁理士)は、ブラウザでクレームベース明細書情報を表示させることで、効率的に適切な明細書の作成が可能となり得る。また、ユーザは、作成した明細書を、クレームベース明細書情報の作成の基礎となった発明文書等に含ませて、クレーム及び明細書を含む発明文書を作成し得る。そして、ユーザは、クレーム及び明細書を含む発明文書を、再び、発明文書分析システム20により分析させることができ、発明文書の明細書の分析結果として出力される警告情報、明細書情報等を含む特許出願関連情報を、利用できるようになる。 The complaint information generation unit 205a creates display elements corresponding to headings, important phrases, description support incomplete messages, or codes included in the complaint-based specification information portion of the document for display, for example, to display the display elements. Add display control information for controlling aspects (for example, highlighting, colored display, display transition, etc.). This display control information can be realized, for example, in the same manner as the display control information added to the display elements in the complaint information in the display document. Therefore, the display element of the important phrase described in the claim-based specification information part in the display document is, for example, to display the description part containing the important phrase in the claim information in the display document according to the operation can function as a GUI element corresponding to the operation of For example, the complaint information generation unit 205a adds display control information for controlling the display mode of the display element to the display element of the important phrase included in the complaint-based specification information in the document for display, and generates the display control information. makes the display element of the key phrase function as a GUI for displaying (for example, linking) the description part containing the key phrase in the claim information in the document for display in response to the operation of the display element belongs to. A user (for example, an inventor or a patent attorney) can efficiently create an appropriate specification by displaying claim-based specification information on a browser. In addition, the user can create an invention document including claims and a specification by including the created specification in the invention document or the like that is the basis for creating the claim-based specification information. Then, the user can cause the invention document including the claims and the specification to be analyzed again by the invention document analysis system 20, including warning information, specification information, etc. output as analysis results of the specification of the invention document. Patent application related information will be made available.

以下、表示用文書におけるクレームベース明細書情報部分に含まれる符号に対応する表示要素に付加される表示制御情報の例について説明する。 An example of the display control information added to the display element corresponding to the code included in the claim-based specification information portion of the document for display will be described below.

クレーム情報生成部205aは、クレームベース明細書情報に符号が含まれる場合に、その符号を、操作に応じて表示用文書におけるクレームベース図面情報におけるその符号と同一の符号を含む部分を表示するためのGUIの機能を有する表示要素とするための表示制御情報を、その符号の表示要素に付加することとしてもよい。この表示制御情報は、例えば、操作に応じて符号を引数として起動されるスクリプトの関数の関数名又はその関数自体を定義するものであり、その関数は、例えば、引数の符号を含む、クレームベース図面情報中の部分を、その符号を検索することで、特定するように定められる。クレーム情報生成部205aは、例えば、クレームベース明細書情報中の符号に対する操作に応じて、クレームベース図面情報におけるその符号と同一の符号を含む部分を表示するための表示制御情報に係る関数を、ブラウザで表示されて操作がなされたその符号の表示要素が隠れない範囲に、クレームベース図面情報におけるその符号と同一の符号を含む部分を表示するように定めておくこととしてもよい。クレーム情報生成部205aは、例えば、ブラウザによる表示画面を複数の表示領域に分割し、クレームベース明細書情報の表示領域と、クレームベース明細書情報中の符号に係る操作に応じて表示されるクレームベース図面情報の一部分等の表示領域とを並列的に表示してもよい。クレーム情報生成部205aは、例えば、符号に対する表示要素に付加する表示制御情報により、その符号に対する操作に応じて起動される関数を、更なる操作に応じてクレームベース図面情報におけるその符号と同一の符号を含む複数の部分(例えばその符号を含む2以上の図面)を切り替えて表示する処理を実行するように定めてもよいし、クレームベース図面情報におけるその符号と同一の符号を含む全ての部分を必要に応じて縮小して一括表示する処理を実行するように定めてもよい。クレーム情報生成部205aは、例えば、クレームベース明細書情報中の符号に対する操作に応じて、クレームベース図面情報におけるその符号と同一の符号を含む部分を表示するための表示制御情報に係る関数を、クレームベース図面情報におけるその符号と同一の符号を強調表示するように定めておくこととしてもよい。 When a code is included in the claim-based specification information, the claim information generation unit 205a displays the code in accordance with the operation to display the part containing the same code as that in the claim-based drawing information in the document for display. The display control information for making the display element having the GUI function of the code may be added to the display element of the code. This display control information defines, for example, the function name of the function of the script that is activated with the code as an argument according to the operation, or the function itself. A part in the drawing information is determined to be identified by searching for its code. The claim information generation unit 205a, for example, in response to an operation on the code in the claim-based specification information, generates a function related to display control information for displaying a portion containing the same code as that code in the claim-based drawing information, It may be determined to display a portion containing the same code as the code in the claim-based drawing information within a range where the display element of the code displayed and operated by the browser is not hidden. For example, the complaint information generation unit 205a divides the display screen of the browser into a plurality of display areas, and the display area of the complaint-based specification information and the complaint displayed according to the operation related to the code in the complaint-based specification information. A display area such as a part of the base drawing information may be displayed in parallel. For example, the complaint information generation unit 205a uses the display control information added to the display element for the code to create a function that is activated in response to the operation of the code to the same code as that in the complaint-based drawing information in response to further operation. It may be determined to execute a process of switching and displaying multiple parts containing a code (for example, two or more drawings containing the code), or all parts containing the same code as the code in the claim-based drawing information may be defined so as to perform a process of reducing and collectively displaying the data as necessary. The claim information generation unit 205a, for example, in response to an operation on the code in the claim-based specification information, generates a function related to display control information for displaying a portion containing the same code as that code in the claim-based drawing information, It may be determined to highlight the same code as that code in the claim-based drawing information.

以下、表示用文書におけるクレームベース明細書情報部分に含まれる記載支援用未完成メッセージに対応する表示要素に付加される表示制御情報の例について説明する。 An example of the display control information added to the display element corresponding to the description support incomplete message included in the claim-based specification information portion of the display document will be described below.

クレーム情報生成部205aは、クレームベース明細書情報に記載支援用未完成メッセージが含まれる場合に、その記載支援用未完成メッセージの内容を、操作に応じて変更するためのGUIの機能を有する表示要素(つまり操作対応GUI要素)とするための表示制御情報を、その記載支援用未完成メッセージの表示要素(例えば<span>タグ等を記載支援用未完成メッセージに付加して構成される表示要素)に付加することとしてもよい。表示制御情報の付加は、例えば記載支援用未完成メッセージに付加された<span>タグ内に操作を示す情報及び操作で起動される関数を示す情報を記載すること等で実現される。この表示制御情報は、記載支援用未完成メッセージに重要語句が含まれる場合に操作に応じて上述の重要語句包含記載列挙処理を実行するスクリプトを起動するための情報であり、或いは、以下に例示する処理等を、実行するスクリプトを起動するための情報である。この表示制御情報は、例えば、操作に応じて記載支援用未完成メッセージを引数として起動されるスクリプトの関数の関数名又はその関数自体を定義するものであり、その関数は、例えば、引数の記載支援用未完成メッセージを既定値とする入力フィールドを表示し、入力フィールドに対する編集操作を反映して、編集操作結果の文字列を、元の記載支援用未完成メッセージの代わりに表示要素の表示内容とするように定められる。また、クレーム情報生成部205aは、例えば、クレームベース明細書情報に含ませた「X装置1は、」という主語に続く記載支援用未完成メッセージが、例えば、「■{X装置1の説明(機能/作用/動作原理/属性/形状/サイズ/材質/態様/入出力/生成関連情報等)}」である場合、つまり、「機能/作用/動作原理/属性/形状/サイズ/材質/態様/入出力/生成関連情報」といった選択肢を列挙したメッセージである場合に、その記載支援用未完成メッセージを選択肢の選択操作を可能とするためのGUIの機能を有する表示要素とするための表示制御情報を、その記載支援用未完成メッセージの表示要素に付加することとしてもよい。そして、クレーム情報生成部205aは、表示制御情報に係るスクリプトの関数を、表示されている記載支援用未完成メッセージの選択肢の選択操作がなされた場合に、その記載支援用未完成メッセージの内容を、選択操作された選択肢に適した別の予め定められた記載支援用未完成メッセージ(例えば機能、作用、動作、原理、属性、形状、サイズ、材質、態様、入出力、或いは、生成関連情報といった選択肢毎にその説明を行うために適した未完成の例文のうち、選択肢に対応する1つの例文を含む記載支援用未完成メッセージ)へと変更するように、定めておくこととしてもよい。例えば、この例の選択肢を含む記載支援用未完成メッセージのGUIに対して、「入出力」が選択操作された場合には、その選択肢を含む記載支援用未完成メッセージは、「入出力」に適した例えば「■{(どこ)から(何)が入力され、X装置1はその入力を受けてX装置1の処理結果としての(何)を(どこ)へ出力する}」といった記載支援用未完成メッセージへと変更される。 The claim information generation unit 205a displays a display having a GUI function for changing the content of the incomplete description support message in accordance with an operation when the claim base specification information includes an incomplete message for support in description. A display element configured by adding display control information for an element (that is, an operation-responsive GUI element) to a display element (for example, a <span> tag or the like of an incomplete description support message) to the incomplete description support message. ) may be added to The addition of the display control information is realized, for example, by describing information indicating the operation and information indicating the function activated by the operation in the <span> tag added to the incomplete message for description support. This display control information is information for activating a script that executes the above-mentioned important phrase inclusion description listing process according to an operation when an important phrase is included in an incomplete message for description support, or information for exemplifying below. This is information for activating the script that executes the processing to be executed. This display control information defines, for example, the function name of the script function or the function itself that is activated with the description support incomplete message as an argument according to the operation. Displays an input field with an unfinished support message as the default value, reflects the editing operation on the input field, and replaces the text of the editing operation result with the display content of the display element instead of the original unfinished message for writing support. is defined as In addition, the complaint information generation unit 205a, for example, the incomplete message for description support following the subject "X device 1" included in the complaint-based specification information is, for example, " {description of X device 1 ( function/action/operation principle/attribute/shape/size/material/mode/input/output/generation related information, etc.)}, that is, "function/action/operation principle/attribute/shape/size/material/mode /input/output/generation related information”, display control for making the incomplete message for description support into a display element having a GUI function for enabling the selection operation of the options. Information may be added to the display elements of the incomplete writing aid message. Then, the complaint information generation unit 205a uses the function of the script related to the display control information to generate the content of the incomplete description support message when the selection operation of the displayed incomplete message for description support is performed. , another predetermined description support incomplete message suitable for the selected option (for example, function, action, operation, principle, attribute, shape, size, material, mode, input/output, or generation-related information It may be determined to change to an incomplete message for description support including one example sentence corresponding to the option among the incomplete example sentences suitable for explaining the option for each option. For example, when "input/output" is selected for the GUI of the incomplete description support message including the options in this example, the incomplete description support message including the option is changed to "input/output". Suitable for description support, for example, "■ {(what) is input from (where), X machine 1 receives the input and outputs (what) to (where) as the processing result of X machine 1}" Changed to incomplete message.

[3-1-5-7-4.クレームベース要約書情報の生成]
クレーム情報生成部205aは、クレームベース要約書情報生成処理を、発明文書取得部2021により取得された発明文書に含まれるクレームに基づいて、クレームベース要約書情報を生成することにより実現する。クレームベース要約書情報は、未完成の要約書の内容を表す。クレームベース要約書情報は、そのまま特許出願用の要約書として利用できる程度に完成した内容である必要はない。
[3-1-5-7-4. Generating claim-based abstract information]
The complaint information generation unit 205a realizes the complaint-based abstract information generation processing by generating complaint-based abstract information based on the claims included in the invention document acquired by the invention document acquisition unit 2021. FIG. The claim-based abstract information represents the content of the incomplete abstract. The claim-based abstract information need not be complete enough to be used as an abstract for patent application.

クレームベース要約書情報は、例えば、日本国の特許出願の要約書と同様の見出し(例えば「要約」、「選択図」等)を含み、その各見出しに後続した記載内容を含む。 The claim-based abstract information includes, for example, headings similar to those of Japanese patent application abstracts (eg, "abstract", "selection drawing", etc.), and includes descriptions following each heading.

クレーム情報生成部205aは、発明文書取得部2021により取得された発明文書に含まれるクレームの最初の項(例えば請求項1)の内容と、予め定められた所定の文字列とに基づいて、「要約」の欄の記載内容を決定する。この所定の文字列の内容は、例えば、設定情報取得部201により取得された設定情報に含まれる未完成メッセージ情報により示される、記載支援用未完成メッセージである。具体例としては、クレーム情報生成部205aは、未完成の要約書に係るクレームベース要約書情報における「要約」の欄に、「課題」の見出しに後続して、例えば「■{技術的課題/効果:~の低減/~の向上等}に有用な制御システムを提供する。」等といった、要約書の課題のための記載支援用未完成メッセージと、クレームの最初の項の請求の対象である重要語句とを含む文を記載し、「解決手段」の見出しに後続して、発明文書に含まれるクレームの最初の項の内容に、改行削除処理、請求の対象を主語とする処理等の変換処理を施した結果を記載して、その記載のおける各重要語句の直後に、その重要語句に対応する符号(例えば重要語句の一属性としての「符号」の内容)を挿入する。これにより、「解決手段」の見出しに後続する記載内容は、例えば、「制御システム10は、人感センサ11と、制御内容決定装置12と、照明制御信号送信装置13とを含む。」となる。クレーム情報生成部205aは、例えば、「要約」の欄の文字数が所定の上限(例えば400)を超える場合に、その旨を示すメッセージを、クレームベース要約書情報中に含ませてもよい。 The claim information generation unit 205a generates " Decide what to include in the “Summary” column. The content of this predetermined character string is, for example, an incomplete message for description support indicated by incomplete message information included in the setting information acquired by the setting information acquisition unit 201 . As a specific example, the claim information generation unit 205a adds, for example, "{technical problem/ Effect: provides a control system useful in reducing/improving etc.”, etc. Write a sentence containing important words and phrases, and after the heading of "Solution", convert to the contents of the first paragraph of the claim included in the invention document, such as line feed deletion processing and processing to make the object of the claim the subject. The result of the processing is described, and the code corresponding to the key word (for example, the content of "code" as one attribute of the key word) is inserted immediately after each key word in the description. As a result, the content following the heading of "Solution" is, for example, "The control system 10 includes a motion sensor 11, a control content determination device 12, and a lighting control signal transmission device 13." . For example, when the number of characters in the "summary" field exceeds a predetermined upper limit (eg, 400), the complaint information generation unit 205a may include a message to that effect in the complaint-based abstract information.

クレーム情報生成部205aは、クレームベース要約書情報における「選択図」の欄には、例えば、通常の発明文書においてはクレームの1つの請求対象に関連する特徴的事項を表す図の図面番号を1と定める可能性が比較的高いとの推定等に基づいて、「図1」を記載する。なお、発明文書で用いる図の順により何らかの効果を狙う場合等もあり、発明文書においてクレームの1つの請求対象に関連する図の図面番号を、必ずしも1とする必要はない。 The claim information generation unit 205a sets the drawing number of a drawing representing characteristic matters related to one claim subject of a claim in a typical invention document to the column of "selected drawing" in the claim-based abstract information. "Figure 1" is described based on the presumption that there is a relatively high possibility of determining In some cases, the order of the figures used in the invention document may be used to achieve some effect, and the drawing number of the figure related to one claim object in the invention document does not necessarily have to be 1.

別の例としては、クレーム情報生成部205aは、例えば、クレームベース要約書情報における「選択図」の欄には、文字「図」に後続して、クレームの最初の項に含まれる、重要語句抽出部2051により抽出された重要語句が表す要素を最も多く含む図面の図面番号を記載する。 As another example, the claim information generation unit 205a may include important words and phrases included in the first paragraph of the claim following the characters "drawing" in the column "selected drawing" in the claim-based abstract information. The drawing number of the drawing containing the most elements represented by the key words extracted by the extraction unit 2051 is described.

クレーム情報生成部205aは、クレームベース要約書情報生成処理により生成するクレームベース要約書情報に、日本国の特許出願の未完成の要約書とは別に、米国出願用の日本語版の要約書(つまり要約書の翻訳用和文原稿)に相当する記載内容を含ませることとしてもよい。クレーム情報生成部205aは、米国出願用の日本語版の要約書に相当する記載内容として、例えば、発明文書に含まれるクレームの最初の項の内容に、改行削除処理、請求の対象を主語とする処理等の変換処理を施した結果を用いる。クレーム情報生成部205aは、例えば、米国出願用の日本語版の要約書に相当する記載内容を、翻訳部2054に機械翻訳させた結果の単語数が、所定の上限(例えば150語)を超える場合に、文字数の削減が望ましい旨等を示すメッセージを、クレームベース要約書情報中に含ませてもよい。 The claim information generation unit 205a adds the Japanese abstract for the US application ( In other words, it is possible to include description contents corresponding to the Japanese manuscript for translation of the abstract. The claim information generating unit 205a adds, for example, the content of the first paragraph of the claim included in the invention document to the description content corresponding to the Japanese version of the abstract for the US application, the line feed deletion processing, and the object of the claim as the subject. The result of conversion processing such as conversion processing is used. The claim information generation unit 205a, for example, causes the translation unit 2054 to machine-translate the content corresponding to the Japanese version of the abstract for the US application, and the number of words resulting from the machine translation exceeds a predetermined upper limit (for example, 150 words). In some cases, a message indicating that it is desirable to reduce the number of characters may be included in the claim-based abstract information.

クレーム情報生成部205aは、クレームベース要約書情報生成処理により生成するクレームベース要約書情報に、日本国の特許出願の未完成の要約書とは別に、日本語の国際出願の未完成の要約書に相当する記載内容を含ませることとしてもよい。クレーム情報生成部205aは、日本語の国際出願の未完成の要約書に相当する記載内容として、例えば、発明文書に含まれるクレームの最初の項の内容に、改行削除処理、請求の対象を主語とする処理等の変換処理を施した結果を含ませて、各重要語句の直後に、その重要語句に対応する符号(例えば重要語句の一属性としての「符号」の内容、或いは、符号決定処理により決定した符号)を始め丸括弧及び終わり丸括弧で挟んで挿入する。 The claim information generation unit 205a adds the incomplete abstract of the Japanese international application to the claim-based abstract information generated by the claim-based abstract information generation process, in addition to the incomplete abstract of the Japanese patent application. It is also possible to include description contents corresponding to The claim information generation unit 205a, for example, deletes line feeds from the content of the first paragraph of the claim included in the invention document, and deletes the subject of the claim as the description content corresponding to the incomplete abstract of the Japanese international application. Immediately after each key phrase, the result of conversion processing such as the processing of ) is inserted between the opening and closing parentheses.

発明文書分析システム20において出力部208が、クレームベース要約書情報を含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、クレーム情報生成部205aは、表示用文書としての特許出願関連情報に含まれるクレームベース要約書情報を生成する。 When the output unit 208 in the invention document analysis system 20 outputs the patent application-related information including the claim-based abstract information as a display document (for example, an HTML document), the claim information generation unit 205a outputs generates claim-based abstract information included in the patent application related information of

クレーム情報生成部205aが生成する、表示用文書としての特許出願関連情報のクレームベース要約書情報部分は、例えば、上述したクレームベース要約書情報生成処理で生成したクレームベース要約書情報の各行の内容に対応する、1つ以上の表示要素を含み、その各行内に重要語句抽出部2051により抽出された1つ以上の重要語句があればその各重要語句に対応する、1つ以上の表示要素を含む。具体例としては、クレーム情報生成部205aは、HTML文書においてクレームベース要約書情報を<article>タグと</article>タグとで挟んで記述する場合においてその<article>タグ配下に、クレームベース要約書情報生成処理で生成した、クレームベース要約書情報の内容となる各行について、その行に対応する表示要素を、<span>タグと</span>タグとでその行の内容を挟むことで記述し、その1つの行に対応する表示要素の<span>タグ配下に、その行内の各重要語句について、その重要語句に対応する表示要素を、<span>タグと</span>タグとでその重要語句を挟むことで記述する。クレームベース要約書情報の各行のうち、その行の内容に、見出し、記載支援用未完成メッセージ、又は、符号が含まれる場合に、その行の表示要素は、その見出し、記載支援用未完成メッセージ、又は、符号に対応する表示要素を、含み得る。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。クレームベース要約書情報部分に含まれる各行に対応する各表示要素は、例えば、その対応する行の内容を表示可能にする。 The claim-based abstract information portion of the patent application-related information as a display document generated by the claim information generation unit 205a is, for example, the contents of each line of the claim-based abstract information generated in the above-described claim-based abstract information generating process. If there are one or more key phrases extracted by the key phrase extraction unit 2051 in each row, one or more display elements corresponding to each of the key phrases are displayed. include. As a specific example, the complaint information generating unit 205a creates a complaint-based abstract under the <article> tag when describing the complaint-based abstract information sandwiched between <article> and </article> tags in an HTML document. For each line that is the content of the claim-based abstract information generated in the document information generation process, the display element corresponding to that line is described by sandwiching the content of that line between the <span> tag and the </span> tag. Then, under the <span> tag of the display element corresponding to one line, for each key phrase in that line, the display element corresponding to the key phrase is displayed with the <span> tag and the </span> tag. Write with important words in between. Of each line of claim-based abstract information, if the content of that line includes a heading, an incomplete message to support description, or a code, the display elements of that line are the heading and the incomplete message to support description , or a display element corresponding to the code. For example, a browser may interpret the presentation document to display each presentation element. Each display element corresponding to each line included in the claim-based abstract information portion, for example, enables the contents of the corresponding line to be displayed.

クレーム情報生成部205aは、表示用文書におけるクレームベース要約書情報部分に含まれる見出し、重要語句、記載支援用未完成メッセージ、或いは、符号に対応する表示要素に、例えば、その表示要素についての表示態様の制御(例えば強調表示、色付き表示等)をするための表示制御情報を付加する。 The complaint information generation unit 205a creates display elements corresponding to headings, key phrases, description support incomplete messages, or codes included in the complaint-based abstract information portion of the display document. Display control information for controlling the mode (for example, highlighting, coloring, etc.) is added.

[3-1-5-7-5.修正版クレーム情報の生成]
クレーム情報生成部205aは、修正版クレーム情報生成処理を、発明文書取得部2021により取得された発明文書に含まれるクレームを修正した修正版クレーム情報を生成することにより実現する。修正版クレーム情報は、クレーム情報生成処理によって生成されるクレーム情報の一部を修正したものである。ユーザは、例えば、修正版クレーム情報の内容を、発明文書のクレームとして用いて、その発明文書を、再び発明文書分析システム20で分析させることにより、新たに発明文書評価情報を含む警告情報等で構成される特許出願関連情報を得ることが可能となる。
[3-1-5-7-5. Generation of Modified Complaint Information]
The complaint information generation unit 205a realizes the modified complaint information generation processing by generating modified complaint information obtained by modifying the claims included in the invention document acquired by the invention document acquisition unit 2021. FIG. The modified complaint information is obtained by partially modifying the complaint information generated by the complaint information generating process. The user can, for example, use the content of the modified version claim information as a claim of an invention document, and cause the invention document to be analyzed again by the invention document analysis system 20, thereby generating new warning information including invention document evaluation information. It becomes possible to obtain the configured patent application related information.

[3-1-5-7-5-1.不適切な記載についての修正及び不要な記載の削除]
クレーム情報生成部205aは、発明文書取得部2021により取得された発明文書のクレーム中の記載が、警告情報生成部2059で指摘情報を生成する対象となるような場合において、予め修正方法が定められているときには、その修正方法に従って、その記載を修正することで、修正版クレーム情報を生成する。以下、クレームの記載の修正による修正版クレーム情報の生成の具体例を説明する。
[3-1-5-7-5-1. Correction of inappropriate descriptions and deletion of unnecessary descriptions]
The claim information generation unit 205a has a correction method determined in advance when the description in the claim of the invention document acquired by the invention document acquisition unit 2021 is the object for which the warning information generation unit 2059 generates indication information. If so, the modified version of the claim information is generated by modifying the description according to the modification method. A specific example of generating modified claim information by correcting the description of a claim will be described below.

クレーム情報生成部205aは、例えば、発明文書取得部2021により取得された発明文書のクレーム中の記載が、翻訳用発明文書標準規定取得部204により取得された翻訳用発明文書標準規定(図14参照)において修正情報が付加されている条件項目のパターン情報が示すパターンに該当する場合に、その修正情報に基づいて、クレーム中の記載を修正することで、修正したクレームを表す修正版クレーム情報を生成する。 For example, the claim information generation unit 205a converts the description in the claim of the invention document acquired by the invention document acquisition unit 2021 into the invention document standard specification for translation acquired by the invention document standard specification acquisition unit 204 for translation (see FIG. 14). ), if it corresponds to the pattern indicated by the pattern information of the conditional item to which the modification information is added, by modifying the description in the claim based on the modification information, the modified claim information representing the modified claim Generate.

クレーム情報生成部205aは、例えば、発明文書取得部2021により取得された発明文書のクレームの各項の番号(例えば各項先頭行の「請求項n」という見出しの「n」の部分に記載されたアラビア数字の文字列が表す番号)が行順に沿って連続番号となっていない場合には、行順に沿って1から始まる連続番号となるように、クレームの各項の番号を修正し、更に、いずれかのクレームの項中に他の項を引用した他項引用記載部分があれば、修正後の各項の番号に呼応するように、他項引用記載部分における引用先項番を修正することで、修正版クレーム情報を生成する。 The claim information generation unit 205a, for example, obtains the number of each claim of the claim of the invention document acquired by the invention document acquisition unit 2021 (for example, the "n" part of the headline "Claim n" in the first line of each claim). If the number represented by the string of Arabic numerals) is not consecutively numbered along the line order, correct the number of each claim so that it is consecutively numbered starting from 1 along the line order, and further , if there is a reference to other paragraphs that refer to other paragraphs in any claim section, modify the reference number in the reference to other paragraphs so that it corresponds to the number of each paragraph after modification. By doing so, the modified complaint information is generated.

クレーム情報生成部205aは、例えば、発明文書取得部2021により取得された発明文書のクレームの各項の番号(例えば各項先頭行の「請求項n」という見出しの「n」の部分に記載された文字列が表す番号)に半角文字と全角文字とが混在している場合には、その一方の種類の文字(例えば全角文字)となるようにクレームの各項の番号を修正し、更に、いずれかのクレームの項中に他の項を引用した他項引用記載部分における引用先項番がその一方の種類の文字でないような記載が含まれている場合には、他項引用記載部分における引用先項番をその一方の種類の文字(例えば全角文字)に修正することで、修正版クレーム情報を生成する。 The claim information generation unit 205a, for example, obtains the number of each claim of the claim of the invention document acquired by the invention document acquisition unit 2021 (for example, the "n" part of the headline "Claim n" in the first line of each claim). If half-width characters and full-width characters are mixed in the number represented by the character string), correct the number of each item of the claim so that it is one of the types of characters (for example, full-width characters), and further, If any claim section contains a statement that refers to another paragraph in which the referenced paragraph number in the reference to another paragraph is not one of the types of characters, By modifying the reference item number to one of the types of characters (for example, double-byte characters), the modified claim information is generated.

クレーム情報生成部205aは、例えば、発明文書取得部2021により取得された発明文書のクレームに、隅付き括弧内に記載された「数n」といった見出しで表される数式の記載が含まれる場合において、その数式の番号が行順に沿って、枝番を考慮した上でも連続番号となっていないときには、行順に沿って連続番号となるように修正することで、修正版クレーム情報を生成する。クレーム情報生成部205aは、この数式の番号の修正と同様に、例えば、化学式、或いは、表の修正を行い得る。 For example, when the claims of the invention document acquired by the invention document acquisition unit 2021 include a description of a mathematical formula represented by a heading such as "number n" written in square brackets, the claim information generation unit 205a , when the numbers of the mathematical expressions are not continuous even after considering branch numbers along the order of lines, corrected claim information is generated by correcting them so that they are continuous numbers along the order of lines. The claim information generation unit 205a can, for example, correct chemical formulas or tables in the same way as correcting the numerical formulas.

クレーム情報生成部205aは、例えば、発明文書取得部2021により取得された発明文書のクレームに、設定情報取得部201により取得された設定情報のコメント特定用情報に基づいて特定できるコメント行又はコメントが含まれている場合に、そのコメント行又はコメントを削除することで、修正版クレーム情報を生成する。なお、修正版クレーム情報においてクレーム中のコメント行又はコメントを削除する機能を実行するか抑止するかについては、設定情報取得部201により取得される設定情報中等で、指定可能にしてもよい。 For example, the complaint information generation unit 205a determines that the complaint of the invention document acquired by the invention document acquisition unit 2021 has a comment line or comment that can be specified based on the comment specification information of the setting information acquired by the setting information acquisition unit 201. Generate modified claim information by deleting the comment line or comments, if any. Whether to execute or suppress the function of deleting the comment line or comment in the complaint in the modified complaint information may be specified in the setting information acquired by the setting information acquiring unit 201.

クレーム情報生成部205aは、例えば、発明文書取得部2021により取得された発明文書のクレームに、読点文字「、」が連続する記載か、句点文字「。」が連続する記載かが含まれている場合に、その読点文字「、」を1つにし、又は、その句点文字「。」を1つにするように修正することで、修正版クレーム情報を生成する。 For example, the claim information generation unit 205a determines whether the claim of the invention document acquired by the invention document acquisition unit 2021 includes a description of continuous comma characters "," or a description of continuous period characters "." In this case, the corrected claim information is generated by correcting the comma characters "," to one or the period characters "." to one.

クレーム情報生成部205aは、例えば、発明文書取得部2021により取得された発明文書のクレームの行末に全角若しくは半角の空白文字又はタブが含まれている場合には、その空白文字又はタブを削除することで、修正版クレーム情報を生成する。また、クレーム情報生成部205aは、クレームの行末の改行コードを、予め定められた行末用の所定のコードでなかった場合にその行末用の所定のコードに修正することで、修正版クレーム情報を生成することとしてもよい。この行末用の所定のコードは、例えば、0x0dと0x0aとをこの順に並べて構成されるコード等である。行末用の所定のコードは、設定情報取得部201により取得される設定情報等で指定可能としてもよい。クレーム情報生成部205aは、例えば、改行コードの、行末用の所定のコードへの修正を、特許出願関連情報が、表示用文書としてではなく、例えばテキストファイル等として出力される場合に限って、実行することとしてもよい。 For example, if a full-width or half-width blank character or tab is included at the end of the line of the claim of the invention document acquired by the invention document acquisition unit 2021, the complaint information generation unit 205a deletes the blank character or tab. By doing so, the modified complaint information is generated. If the line feed code at the end of the line of the complaint is not the predetermined code for the end of the line, the complaint information generation unit 205a corrects it to the predetermined code for the end of the line, thereby generating the modified version of the complaint information. may be generated. This predetermined code for the end of line is, for example, a code configured by arranging 0x0d and 0x0a in this order. The predetermined code for the end of line may be designated by setting information or the like acquired by the setting information acquisition unit 201 . The claim information generation unit 205a, for example, corrects the line feed code to a predetermined code for the end of the line, only when the patent application related information is output as a text file, etc., instead of as a document for display. It may be executed.

クレーム情報生成部205aは、例えば、発明文書取得部2021により取得された発明文書のクレームに半角文字が含まれている場合には、その半角文字を、対応する全角文字に変更することで、修正版クレーム情報を生成する。この場合に、クレーム情報生成部205aは、発明文書のクレームにおいて始め丸括弧と終わり丸括弧とで挟まれた英字の半角文字が含まれているときには、全角文字への変更を行わないこととしてもよい。また、クレーム情報生成部205aは、発明文書のクレームの各項の番号が全て半角文字で統一されている場合においては、その各項の番号の全角文字への変更を行わないこととしてもよい。発明文書のクレームに半角文字が含まれている場合に全角文字に変更する対象となる半角文字の種類(例えば英字、片仮名文字、記号等)、文字コード範囲等を、設定情報取得部201により取得される設定情報等で指定可能として、その指定に従ってクレーム情報生成部205aは、修正版クレーム情報の生成のためのクレーム中の半角文字の全角文字への変更を行うこととしてもよい。また、逆に、発明文書のクレームに全角文字が含まれている場合に半角文字に変更する対象となる全角文字の種類、文字コード範囲等を、設定情報取得部201により取得される設定情報等で指定可能として、その指定に従ってクレーム情報生成部205aは、修正版クレーム情報の生成のためのクレーム中の全角文字の半角文字への変更を行うこととしてもよい。 For example, if the claim of the invention document acquired by the invention document acquisition unit 2021 contains half-width characters, the complaint information generation unit 205a changes the half-width characters to the corresponding full-width characters to correct the claims. Generate edition claim information. In this case, the claim information generation unit 205a does not change to full-width characters when the claims of the invention document include half-width alphabetic characters sandwiched between opening and closing parentheses. good. In addition, when the number of each item of claims in the invention document is all unified with single-byte characters, the claim information generation unit 205a may not change the number of each item to full-width characters. If half-width characters are included in the claim of the invention document, the type of half-width characters to be changed to full-width characters (for example, alphabetic characters, katakana characters, symbols, etc.), the character code range, etc. are obtained by the setting information acquisition unit 201. According to the specification, the complaint information generation unit 205a may change half-width characters in the complaint to full-width characters for generating modified complaint information. Conversely, if the claim of the invention document contains full-width characters, the type of full-width characters to be changed to half-width characters, the character code range, etc., are set in the setting information acquired by the setting information acquisition unit 201. , and according to the specification, the complaint information generation unit 205a may change full-width characters in the complaint to half-width characters for generating modified complaint information.

クレーム情報生成部205aは、例えば、発明文書取得部2021により取得された発明文書のクレームの各行の行頭に1つ以上の半角の空白文字が含まれている場合に、その1つ以上の半角の空白文字を1つの全角の空白文字に変更することで、修正版クレーム情報を生成する。 For example, if one or more single-byte blank characters are included at the beginning of each line of the claim of the invention document acquired by the invention document acquisition unit 2021, the complaint information generation unit 205a By changing the blank character to one double-byte blank character, the modified complaint information is generated.

クレーム情報生成部205aは、例えば、発明文書取得部2021により取得された発明文書のクレームの各行の行頭以外の部分に2つ以上の半角の空白文字が連続して含まれている場合に、その2つ以上の半角の空白文字を1つの半角の空白文字に変更することで、修正版クレーム情報を生成する。これは、例えば、英単語間に誤って複数の空白文字を挟んだ記載を修正するために有用となる。例えば、各文末等に意図的に複数の空白を入れた英文等を、発明文書におけるクレーム中に表記する必要があるような場合を想定して、この修正を行わないことを設定情報等でユーザが選択可能とし、設定情報に従ってこの修正の抑止がなされ得るようにしてもよい。 For example, if two or more single-byte blank characters are consecutively included in a portion other than the beginning of each line of a claim of an invention document acquired by the invention document acquisition unit 2021, the complaint information generation unit 205a By changing two or more single-byte blank characters to one single-byte blank character, modified complaint information is generated. This can be useful, for example, to correct a description that mistakenly puts multiple spaces between English words. For example, assuming that it is necessary to write English sentences intentionally with multiple spaces at the end of each sentence, etc., in the claims of the invention document, the user is instructed not to make this correction by setting information, etc. can be selected, and this modification can be inhibited according to the setting information.

[3-1-5-7-5-2.指定された形式に適合させる修正]
設定情報取得部201が取得した設定情報に、修正版クレーム情報におけるクレームの形式に関して指定する情報が含まれる場合には、クレーム情報生成部205aは、発明文書のクレームをその指定に従った形式となるように修正することで、修正版クレーム情報を生成する。
[3-1-5-7-5-2. Modifications to conform to the specified format]
If the setting information acquired by the setting information acquiring unit 201 includes information specifying the format of the complaint in the modified version of the complaint information, the complaint information generating unit 205a converts the claim of the invention document into the specified format. By correcting it so that it becomes, the corrected version claim information is generated.

設定情報に含まれる、修正版クレーム情報におけるクレームの形式に関して指定する情報の一例としては、クレーム中の語句に対して対応する符号がある場合にその符号をその語句に付加するか否かについて指定した情報が挙げられる。語句に対して対応する符号がある場合とは、その語句に対して符号決定処理により決定された符号がある場合、発明文書取得部2021により取得された発明文書(例えばクレーム、明細書等)においてその語句に対して符号が付加された記載がある場合、発明文書の明細書の「符号の説明」の欄においてその語句に対応する符号の記載がある場合等である。 An example of the information that is included in the setting information and specifies the format of the complaint in the modified complaint information is whether or not to add the code to the word in the complaint when there is a code corresponding to the word. information When there is a code corresponding to a word or phrase, when there is a code determined by the code determination process for the word or phrase, in the invention document (e.g., claim, specification, etc.) acquired by the invention document acquisition unit 2021 For example, if there is a description with a code added to the word or phrase, or if there is a description of the code corresponding to the word or phrase in the column of "Description of Code" in the specification of the invention document.

設定情報取得部201が取得した設定情報に、クレーム中の語句に対して対応する符号がある場合においてその符号をその語句に付加することを指定した情報が含まれるときには、クレーム情報生成部205aは、発明文書のクレーム中の、重要語句抽出部2051により抽出された重要語句のうち、対応する符号がある重要語句に符号が付加されていない記載部分について、その重要語句の記載部分の直後に始め丸括弧と終わり丸括弧とで挟んだその符号の記載を挿入することで、修正版クレーム情報を生成する。なお、重要語句に対応する符号が複数存在する場合には、クレーム情報生成部205aは、例えば、複数の符号に対する自然順等のソートにより最先となる符号の1つを選択して、その選択した1つの符号を、重要語句の後への挿入に用いることとしてもよい。また、設定情報取得部201が取得した設定情報に、クレーム中の語句に対して対応する符号がある場合においてその符号をその語句に付加しないことを指定した情報が含まれるときには、クレーム情報生成部205aは、クレーム中の、重要語句抽出部2051により抽出された重要語句のうち、対応する符号がある重要語句に符号が付加されている記載部分について、その記載部分における符号に係る記載(例えば、始め丸括弧と終わり丸括弧とで挟んだ符号の記載)を削除することで、修正版クレーム情報を生成する。 When the setting information acquired by the setting information acquisition unit 201 includes information designating that a code corresponding to a word or phrase in a complaint is added to the word or phrase, the complaint information generation unit 205a , of the important phrases extracted by the important phrase extraction unit 2051 in the claim of the invention document, for the description part where the important phrase with the corresponding code is not given a code, immediately after the description part of the important phrase Generate modified claim information by inserting the code description between the parenthesis and the closing parenthesis. Note that if there are a plurality of codes corresponding to the important phrase, the complaint information generation unit 205a selects one of the first codes by sorting the plurality of codes in natural order or the like, and selects the first code. A single code may be used for insertion after key phrases. If the setting information acquired by the setting information acquisition unit 201 includes information designating not to add the code to the word in the complaint when there is a code corresponding to the word in the complaint, the complaint information generation unit 205a is a description related to the code (for example, The description of the code sandwiched between the opening and closing parentheses) is deleted to generate the modified claim information.

設定情報取得部201が取得した設定情報に、修正版クレーム情報におけるクレームの形式に関して指定する情報として、例えば、クレームの各項において、請求対象の記載又は引用先の項の指定から請求対象までの記載に、先行する記載部分が、「と」、「と、」及び省略のいずれかの第1部分と、改行及び省略のいずれかの第2部分と、「を含む」、「を備える」、「を備えることを特徴とする」、「を含むことを特徴とする」のいずれかの第3部分と、改行及び省略のいずれかの第4部分とが、この順に連なって構成される場合において、第1部分~第4部分の各々を指定した文字列又は省略に変更することを指定する情報が含まれるときには、クレーム情報生成部205aは、発明文書のクレームをその指定に従った形式となるように修正することで、修正版クレーム情報を生成する。 In the setting information acquired by the setting information acquisition unit 201, as information specifying the format of the complaint in the modified version of the complaint information, for example, in each item of the claim, the description of the object of the claim or the specification of the cited paragraph to the object of the claim. a statement where the preceding statement portion "includes", "comprises" a first portion of any of "and", "and" and abbreviations and a second portion of any of line breaks and abbreviations; When the third part of either "characterized by" or "characterized by including" and the fourth part of either line break or omission are connected in this order , 1st to 4th parts, the claim information generation unit 205a converts the claim of the invention document into a format that conforms to the specification. By modifying as follows, the modified claim information is generated.

[3-1-5-7-5-3.クレームの項の追加]
クレーム情報生成部205aは、例えば、発明文書取得部2021により取得された発明文書のクレームに、構成要件列挙型で物のカテゴリーに属する請求対象を記載した独立項が存在し、方法のカテゴリーに属する請求対象を記載した項が存在しない場合に、物のカテゴリーに属する請求対象を記載したその独立項に対して、予め定められた、文字列の変換処理を行うことで、その独立項とある程度同様の内容を表すような、方法のカテゴリーに属する請求対象を記載した項を生成し、生成した項を発明文書のクレームの最終項の後に追加することで、修正版クレーム情報を生成する。なお、クレーム情報生成部205aは、発明文書のクレームの項が独立項か否かを、例えば、クレーム引用関係検出部2057が保持するクレーム引用関係情報に基づいて判別可能である。クレーム情報生成部205aは、発明文書のクレームの項の記載が構成要件列挙型であるか否かを如何なる方式で判別してもよい。クレーム情報生成部205aは、例えば、発明文書のクレームの項のいずれかの行の行末に、「と」又は「と、」という文字列が存在する場合に、その項の記載が構成要件列挙型であると推定的に判別し得る。
[3-1-5-7-5-3. Addition of claim section]
For example, the claim information generation unit 205a determines that the claim of the invention document acquired by the invention document acquisition unit 2021 has an independent claim that describes a claim subject that belongs to the product category in the constituent feature enumeration type, and that the claim belongs to the method category. If there is no claim that describes the subject of a claim, the independent claim that describes the subject of the claim that belongs to the product category is processed to be similar to the independent claim to some extent by performing a predetermined character string conversion process. The amended version of the claim information is generated by generating a claim that describes the claimed subject matter belonging to the category of method, and adding the generated claim after the last claim of the invention document. The claim information generation unit 205a can determine whether or not the claim section of the invention document is an independent claim based on the claim citation relation information held by the claim citation relation detection unit 2057, for example. The claim information generation unit 205a may use any method to determine whether or not the statement in the claim section of the invention document is of the constituent element enumeration type. For example, if there is a character string "to" or "to," at the end of any line of a claim section of an invention document, the claim information generation unit 205a determines that the description of that section is a constituent feature enumeration type. can be presumptively determined to be

クレーム情報生成部205aは、例えば、発明文書取得部2021により取得された発明文書のクレームに、構成要件列挙型で方法のカテゴリーに属する請求対象を記載した独立項が存在し、プログラムのカテゴリー又はプログラム記録媒体のカテゴリーに属する請求対象を記載した項が存在しない場合に、方法のカテゴリーに属する請求対象を記載したその独立項に対して、予め定められた、文字列の変換処理を行うことで、或いは、その独立項を引用した項の生成処理を行うことで、その独立項とある程度同様の内容を表すような、プログラムのカテゴリーに属する請求対象を記載した項、又は、プログラム記録媒体のカテゴリーに属する請求対象を記載した項を生成し、生成した項を発明文書のクレームの最終項の後に追加することで、修正版クレーム情報を生成する。 For example, the claim information generation unit 205a determines that the claim of the invention document acquired by the invention document acquisition unit 2021 has an independent claim that describes a claim subject belonging to the category of method in the enumeration type of constituent features, and the category of program or program When there is no claim describing the claimed subject matter belonging to the recording medium category, by performing a predetermined character string conversion process on the independent claim describing the claimed subject matter belonging to the method category, Alternatively, by performing the process of generating a claim citing the independent claim, a claim that describes a claimed subject belonging to the program category or the program recording medium category that expresses the same content to some extent as the independent claim. A modified version of the claim information is generated by generating a clause that describes the claimed subject matter to which it belongs and adding the generated clause after the last clause of the claim in the invention document.

設定情報取得部201が取得する設定情報に、修正版クレーム情報に、上述した方法のカテゴリー、プログラムのカテゴリー及びプログラム記録媒体のカテゴリーのいずれかに属する請求対象を記載したクレームの項の追加をするか否かについて指定する情報を含ませることとし、クレーム情報生成部205aは、その指定に応じて、修正版クレーム情報へのクレームの項の追加の、実行又は抑止を行うこととしてもよい。 To the setting information acquired by the setting information acquisition unit 201, add a claim item describing a claim object belonging to any of the above-described method category, program category, and program recording medium category to the modified version claim information. In accordance with the specification, the complaint information generation unit 205a may execute or suppress the addition of the complaint section to the modified complaint information.

クレーム情報生成部205aは、修正版クレーム情報へのクレームの項の追加を行う場合に、例えば、クレーム引用関係検出部2057に、クレーム情報におけるクレームの各項間の引用関係を表すこととなるクレーム引用関係情報に加えて、修正版クレーム情報におけるクレームの各項間の引用関係を表す修正版クレーム引用関係情報を、生成させ、保持させる。 When adding a claim section to the modified version of the claim information, the claim information generating section 205a causes the claim citation relationship detection section 2057, for example, to generate claims representing the citation relationships between claims in the claim information. In addition to the citation relationship information, modified claim citation relationship information representing citation relationships between claims in the revised claim information is generated and held.

[3-1-5-7-5-4.出願先となり得る各地域に対応したクレームの追加]
クレーム情報生成部205aは、上述した修正版クレーム情報生成処理を行って、発明文書に含まれるクレームを上述した不適切な記載についての修正及び不要な記載の削除、指定された形式に適合させる修正、クレームの項の追加等によって修正済みのクレームを表す修正版クレーム情報を生成した後において、その修正したクレームの記載に基づいて、出願先となり得る各地域(例えば米国、欧州等)に対応したクレームを生成して、生成した各クレームを、その修正版クレーム情報に、更に含ませてもよい。
[3-1-5-7-5-4. Addition of claims corresponding to each region where the application can be filed]
The claim information generation unit 205a performs the modified version claim information generation process described above, corrects the above-described inappropriate statements, deletes unnecessary statements, and corrects the claims included in the invention document to conform to the specified format. , After generating amended claim information representing amended claims by adding a claim section, etc., based on the description of the amended claims, corresponding to each possible destination region (e.g., the United States, Europe, etc.) Claims may be generated and each generated claim may be further included in the modified claim information.

クレーム情報生成部205aは、例えば、設定情報取得部201が取得する設定情報に、出願先として予定する地域に向けて修正版クレーム情報を生成するときに用いられる修正方法を定義した修正情報を含む場合に、その修正情報に従って修正したクレームを、修正版クレーム情報に追加することとしてもよい。 The claim information generation unit 205a includes, for example, in the setting information acquired by the setting information acquisition unit 201, correction information that defines a correction method to be used when generating corrected version claim information for the region planned as the filing destination. In this case, the claims modified according to the modification information may be added to the modified version of the claim information.

また、例えば、設定情報取得部201が取得する設定情報に、クレームを生成すべき出願先となり得る地域を指定する情報を含ませることとして、クレーム情報生成部205aは、その指定された地域に対応したクレームを生成して、修正版クレーム情報に追加することとしてもよい。この追加されたクレームは、出願先への特許出願のための翻訳用和文原稿におけるクレームとして、活用可能なものとなり得る。また、例えば、設定情報取得部201が取得する設定情報に、クレームを生成すべき出願先となり得る地域に出願するために有用となるクレームの修正内容を指定する情報を含ませることとして、クレーム情報生成部205aは、その指定されたクレームの修正内容に対応したクレームを生成して、修正版クレーム情報に追加することとしてもよい。クレームの修正内容を指定する情報の例としては、クレームにおいて複数項を引用した1つの項を、その複数項のうちの1つだけを引用した1つの項に変更することを指定する情報、クレームにおいて複数項を引用した1つの項を、各々がその複数項のうちの相互に異なる1つだけを引用する、その複数と同数の項に変更することを指定する情報、クレームにおいて複数項を引用した1つの項の引用先のいずれかの項が複数の項を引用している場合にその1つの項をその複数項のうちの1つだけを引用した1つの項に変更することを指定する情報等が、挙げられる。これらの設定情報の指定に対応して、クレーム情報生成部205aが、修正版クレーム情報に追加するクレームの各項(つまりクレームセット)に対して、クレーム情報生成部205aは、設定情報での指定に呼応した見出しを付加してもよい。修正版クレーム情報に追加するクレームセットに対する見出しの一例としては、「米国向けクレーム」、「欧州向けクレーム」、「複数従属解消クレーム」、「多重複数従属解消クレーム」等が、挙げられる。 Further, for example, the setting information acquired by the setting information acquisition unit 201 may include information specifying a possible application area where a complaint should be generated, so that the complaint information generation unit 205a can correspond to the specified area. A modified claim may be generated and added to the revised claim information. This added claim can be used as a claim in the Japanese manuscript for translation for the patent application to the applicant. Further, for example, the setting information acquired by the setting information acquisition unit 201 may include information specifying the contents of modification of the claims that will be useful for filing an application in a potential filing destination area where claims should be generated. The generation unit 205a may generate a complaint corresponding to the content of modification of the specified complaint and add it to the revised complaint information. Examples of information designating the content of claim amendments include information designating that a single term citing multiple terms in a claim should be changed to a single term citing only one of the multiple terms; information designating that a term citing multiple terms in a claim shall be changed to an equal number of terms, each citing only a different one of the multiple terms, citing multiple terms in a claim specify that if any of the terms to which the single term cited in the above quotes multiple terms, that single term should be changed to a single term citing only one of the multiple terms. information and the like. In response to the specification of these setting information, the complaint information generation unit 205a specifies the items of complaints (that is, the complaint set) to be added to the modified complaint information by the configuration information. A corresponding heading may be added. Examples of headings for claim sets to be added to the modified claim information include "Claim for the United States," "Claim for Europe," "Multiple Dependency Resolving Claims," and "Multiple Multiple Dependency Resolving Claims."

以下、クレーム情報生成部205aによる、出願先となり得る各地域に対応したクレームの生成の具体例について、説明する。 A specific example of how the claim information generating unit 205a generates a claim corresponding to each potential application destination region will be described below.

設定情報取得部201により取得された設定情報が、出願先となり得る地域として米国を指定する情報を含む場合、或いは、クレームにおいて複数項を引用した1つの項を、その複数項のうちの1つだけを引用した1つの項に変更することを指定する情報を含む場合において、クレーム情報生成部205aは、例えば、修正済みのクレームを表す修正版クレーム情報(つまり上述した修正について施した状態のクレーム情報)中のクレームに、複数項を引用した1つの項があるときには、その項を、その複数項のうちの項番の最も小さい1つだけを引用した項に変更した、クレームの各項を、更に、元の修正済みのクレームを表す修正版クレーム情報に追加する。また、設定情報取得部201により取得された設定情報が、出願先となり得る地域として米国を指定する情報を含む場合に、クレーム情報生成部205aは、クレームの項数が所定数(例えば20)を超えない範囲で、クレームにおける複数項を引用した1つの項を、例えば、その複数項のうちの項番の最も小さい1つだけを引用した項と、その複数項のうちの項番の次に小さい1つだけを引用した項との2つの項に変更したクレームの各項を、更に、元の修正済みのクレームを表す修正版クレーム情報に追加することとしてもよい。なお、米国の特許出願で、クレームにおいて複数項を引用した項の記載は必ずしも不適切ではないが、このような変更が有用な場合もあり得る。 If the setting information acquired by the setting information acquisition unit 201 includes information designating the United States as a potential filing destination, or if one term citing multiple terms in a claim is replaced with one of the multiple terms If the claim information generating unit 205a includes information designating that it should be changed to a single term quoting only the above, the claim information generation unit 205a may generate, for example, amended version claim information representing a corrected claim (that is, a claim in a state in which the above-mentioned amendments have been made). information) contains a paragraph that recites more than one paragraph, each paragraph of the claim with that paragraph changed to a paragraph that cites only the one with the lowest paragraph number of the plurality of paragraphs. , and also add to the amended claim information representing the original amended claim. Further, when the setting information acquired by the setting information acquiring unit 201 includes information designating the United States as a possible filing destination, the complaint information generating unit 205a determines that the number of claims has a predetermined number (for example, 20). to the extent that it does not exceed a single paragraph citing multiple paragraphs in a claim, e.g. Each paragraph of the claim that has been changed to two paragraphs, one with only a minor citation, may also be added to the amended claim information representing the original amended claim. It should be noted that, in US patent applications, it is not necessarily inappropriate to refer to multiple terms in a claim, but such changes may be useful in some cases.

設定情報取得部201により取得された設定情報が、クレームにおいて複数項を引用した1つの項の引用先のいずれかの項が複数の項を引用しているときにその1つの項をその複数項のうちの1つだけを引用した1つの項に変更することを指定する情報を、含む場合において、クレーム情報生成部205aは、例えば、修正済みのクレームを表す修正版クレーム情報中のクレームに、複数項を引用した1つの項の引用先のいずれかの項が複数の項を引用しているときにその1つの項を、その複数項のうちの項番が最小の項を引用する項に変更し、その項番が最小の項が複数の項を引用しているときには更に、その項番が最小の項を、引用している複数の項のうち項番が最小の項を引用する項に変更して、変更後のクレームの各項を、更に、元の修正済みのクレームを表す修正版クレーム情報に追加する。 In the setting information acquired by the setting information acquiring unit 201, when any of the quoted clauses of one clause that quotes multiple clauses in a claim, that one clause is referred to as the plurality of clauses. When the claim information generating unit 205a includes information specifying to change to one term quoting only one of the If any of the clauses citing a single clause citing multiple clauses cites multiple clauses, that one clause is assigned to the clause that cites the clause with the lowest number among the multiple clauses. If the term with the lowest number refers to more than one term, the term with the lowest number refers to the term with the lowest number. to add each modified claim section to the amended claim information that also represents the original amended claim.

設定情報取得部201により取得された設定情報が、出願先となり得る地域として米国を指定する情報を含む場合において、クレーム情報生成部205aは、例えば、修正済みのクレームを表す修正版クレーム情報中のクレームに、プログラムのカテゴリーに属する請求対象を記載した項が含まれ、その項のプログラムの記載と相関性が所定基準より高いプログラムの記載を含むプログラム記録媒体のカテゴリーに属する請求対象を記載した項が別途含まれているときには、そのプログラムのカテゴリーに属する請求対象を記載した項を削除した後のクレームの各項を、更に、元の修正済みのクレームを表す修正版クレーム情報に追加する。 When the setting information acquired by the setting information acquisition unit 201 includes information designating the United States as a potential filing destination, the claim information generation unit 205a generates, for example, A claim that includes a claim that describes a claimed subject belonging to the category of program, and a claim that describes a claimed subject that belongs to the category of program recording media that includes a description of a program whose correlation with the description of the program in that clause is higher than a predetermined standard. is included separately, each paragraph of the claim after deleting the paragraph describing the claimed subject matter belonging to that category of program is also added to the amended claim information representing the original amended claim.

設定情報取得部201により取得された設定情報が、出願先となり得る地域として米国を指定する情報を含む場合において、クレーム情報生成部205aは、例えば、修正済みのクレームを表す修正版クレーム情報中のクレームに、プログラムのカテゴリーに属する請求対象を記載した項が含まれ、その項のプログラムの記載と相関性が所定基準より高いプログラムの記載を含むプログラム記録媒体のカテゴリーに属する請求対象を記載した項が別途含まれていないときには、そのプログラムのカテゴリーに属する請求対象を記載した項の内容に、予め定められた所定の文字列の変換処理を施すことで、その項を、そのプログラムのカテゴリーに属する請求対象を非一時的に記録した記録媒体を、請求対象とする項に変更し、変更後のクレームの各項を、更に、元の修正済みのクレームを表す修正版クレーム情報に追加する。 When the setting information acquired by the setting information acquisition unit 201 includes information designating the United States as a potential filing destination, the claim information generation unit 205a generates, for example, A claim that includes a claim that describes a claimed subject belonging to the category of program, and a claim that describes a claimed subject that belongs to the category of program recording media that includes a description of a program whose correlation with the description of the program in that clause is higher than a predetermined standard. is not included separately, the content of the clause describing the claimable object belonging to the category of the program is converted into a category of the program by performing a predetermined character string conversion process. The recording medium that non-temporarily recorded the claimed object is changed to the claimed object claim, and each claim after the change is further added to the modified claim information representing the original corrected claim.

設定情報取得部201により取得された設定情報が、出願先となり得る地域として欧州を指定する情報を含む場合に、クレーム情報生成部205aは、例えば、修正済みのクレームを表す修正版クレーム情報中のクレームにおける重要語句抽出部2051により抽出された重要語句のうち、対応する符号がある重要語句に符号が付加されていない記載部分について、その重要語句の記載部分の直後に始め丸括弧と終わり丸括弧とで挟んだその符号の記載を挿入し、挿入後のクレームの各項を、更に、元の修正済みのクレームを表す修正版クレーム情報に追加する。重要語句に対応する符号は、例えば、符号決定処理により決定された符号、発明文書取得部2021により取得された発明文書(例えばクレーム、明細書等)においてその重要語句に対して符号が付加された記載があるところのその符号、或いは、発明文書の明細書の「符号の説明」の欄においてその重要語句に対応する符号の記載があるところのその符号である。なお、重要語句に対応する符号が複数存在する場合には、クレーム情報生成部205aは、例えば、複数の符号に対する自然順等のソートにより最先となる符号の1つを選択して、その選択した1つの符号を、重要語句の後への挿入に用いることとしてもよい。 When the setting information acquired by the setting information acquiring unit 201 includes information designating Europe as a possible filing destination, the claim information generating unit 205a generates, for example, Of the important phrases extracted by the important phrase extraction unit 2051 in the claims, for the description part where the key phrase with the corresponding code is not assigned the code, the opening and closing parenthesis are added immediately after the description part of the important phrase. and insert each section of the inserted claim in addition to the amended claim information representing the original amended claim. The code corresponding to the key phrase is, for example, the code determined by the code determination process, or the code added to the key phrase in the invention document (eg, claim, specification, etc.) acquired by the invention document acquisition unit 2021. It is the code where there is a description, or the code where there is a description of the code corresponding to the important term in the column of "description of code" in the specification of the invention document. Note that if there are a plurality of codes corresponding to the important phrase, the complaint information generation unit 205a selects one of the first codes by sorting the plurality of codes in natural order or the like, and selects the first code. A single code may be used for insertion after key phrases.

クレーム情報生成部205aは、修正版クレーム情報への、出願先となり得る各地域等に対応したクレームの各項(つまりクレームセット)の追加を行う場合に、例えば、クレーム引用関係検出部2057に、クレーム情報におけるクレームの各項間の引用関係を表すこととなるクレーム引用関係情報に加えて、修正版クレーム情報におけるクレームセット毎についての、クレームの各項間の引用関係を表す修正版クレーム引用関係情報を、生成させ、保持させる。 When the claim information generation unit 205a adds each claim item (that is, claim set) corresponding to each region where the application can be filed to the modified claim information, for example, the claim citation relationship detection unit 2057 In addition to the claim citation relationship information that represents the citation relationship between each claim section in the claim information, the modified claim citation relationship that represents the citation relationship between each claim section for each claim set in the modified claim information Generate and retain information.

[3-1-5-7-5-5.表示用文書における修正版クレーム情報部分の生成]
発明文書分析システム20において出力部208が、修正版クレーム情報を含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、クレーム情報生成部205aは、表示用文書としての特許出願関連情報に含まれる修正版クレーム情報を生成する。
[3-1-5-7-5-5. Generating Modified Claim Information Portion in Display Document]
When the output unit 208 in the invention document analysis system 20 outputs the patent application-related information including the modified claim information as a display document (for example, an HTML document), the claim information generation unit 205a outputs the display document as Generate modified claim information included in patent application related information.

クレーム情報生成部205aが生成する、表示用文書としての特許出願関連情報の修正版クレーム情報部分は、例えば、修正版クレーム情報における修正したクレームの各項の各行の内容に対応する、1つ以上の表示要素を含み、その各項の各行内に重要語句抽出部2051により抽出された1つ以上の重要語句があればその各重要語句に対応する、1つ以上の表示要素を含み、その各項の各行内に、「請求項n」(nは自然数)等といった見出しが含まれている場合に、その見出しに対応する、1つ以上の表示要素を含む。具体例としては、クレーム情報生成部205aは、HTML文書において修正版クレーム情報を<article>タグと</article>タグとで挟んで記述する場合においてその<article>タグ配下に、修正版クレーム情報としての修正済みのクレームの各項の各行について、その行に対応する表示要素を、<span>タグと</span>タグとでその行の内容を挟むことで記述し、その1つの行に対応する表示要素の<span>タグ配下に、その行内の各重要語句について、その重要語句に対応する表示要素を、<span>タグと</span>タグとでその重要語句を挟むことで記述する。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。修正版クレーム情報部分に含まれる各項の各行に対応する各表示要素は、例えば、その対応する行の内容を表示可能にする。 The amended claim information portion of the patent application related information as a display document generated by the claim information generation unit 205a corresponds to, for example, the content of each line of each item of the amended claim in the amended claim information. If there are one or more important phrases extracted by the important phrase extraction unit 2051 in each line of each item, one or more display elements corresponding to each of the important phrases, If a heading such as "Claim n" (where n is a natural number) is included in each line of a paragraph, one or more display elements corresponding to the heading are included. As a specific example, the complaint information generation unit 205a, when describing the corrected complaint information sandwiched between <article> tag and </article> tag in the HTML document, creates the corrected complaint information under the <article> tag. For each line of each paragraph of the amended claim as, the display element corresponding to that line is described by sandwiching the contents of that line between the <span> and </span> tags, and in that one line Under the <span> tag of the corresponding display element, for each key phrase in the line, the display element corresponding to the key phrase is described by sandwiching the key phrase between the <span> tag and the </span> tag. do. For example, a browser may interpret the presentation document to display each presentation element. Each display element corresponding to each line of each section included in the modified claim information portion, for example, enables the contents of the corresponding line to be displayed.

クレーム情報生成部205aにより、生成される表示用文書における修正版クレーム情報中の1つの重要語句の表示要素の具体例を挙げると、修正版クレーム情報に重要語句「機器制御部」が複数記載されている場合における4番目の「機器制御部」に対応する表示要素は、例えば、「<span class=”c003” id=”revclaiminfo-c003-004” onclick=’wordProc(”revclaiminfo-c003-004”)’ title=”・・・(情報付加表示内容)・・・”>機器制御部</span>」等となる。この例では、重要語句「機器制御部」の識別コードは、「c003」であり、表示要素の<span>タグのid属性の値として、修正版クレーム情報の識別記号「revclaiminfo」と、重要語句の識別コード「c003」と、記載順の番号「004」とを含んだ文字列が定められている。また、この例では、表示要素に対するマウスクリック操作がなされた場合にid属性の値を引数としてwordProc関数が呼び出されるように定められている。これにより、wordProc関数では、例えば、引数から、その表示要素を特定して、表示要素に係る重要語句の文字列を参照する処理を実現することが可能となり、また、引数の一部から、重要語句の識別コード「c003」、記載順の番号「004」等を抽出して、例えば同一の重要語句の先頭の表示要素のid属性が「revclaiminfo-c003-001」であることを特定してその先頭の表示要素を表示させる処理を実現することが可能となり、例えば、修正版クレーム情報の全ての重要語句「機器制御部」の表示要素の表示内容を、ユーザに入力された文字列等に置換する処理を実現すること等が可能となる。 To give a specific example of a display element of one key phrase in the modified complaint information in the display document generated by the complaint information generation unit 205a, a plurality of key phrases “equipment control unit” are described in the modified complaint information. The display element corresponding to the fourth "equipment control unit" in the case where the . In this example, the identification code of the key word "equipment control unit" is "c003", and the value of the id attribute of the <span> tag of the display element is the identification code "revclaiminfo" of the modified claim information and the key word A character string including the identification code "c003" and the number "004" in order of description is defined. Also, in this example, when a mouse click operation is performed on a display element, the wordProc function is called with the value of the id attribute as an argument. As a result, in the wordProc function, for example, it is possible to specify the display element from the argument and refer to the character string of the important phrase related to the display element. By extracting the identification code "c003" of the phrase, the number "004" in the order of description, etc., for example, the id attribute of the leading display element of the same important phrase is specified as "revclaiminfo-c003-001". It is possible to display the first display element. For example, replace the display contents of the display elements of all the important phrases "equipment control unit" in the modified complaint information with the character strings entered by the user. It is possible to realize a process for

表示用文書における修正版クレーム情報部分の各表示要素は、ブラウザにより表示された場合に、例えば、その表示された内容(例えば複数行の内容)を、ユーザがコピー&ペースト等によって、文書作成編集機能を有するアプリケーションプログラム(例えばテキストエディタ等)等に取り込ませて、特許出願用のクレーム、又は、特許出願用のクレームの翻訳用和文原稿として活用可能なように、構成される。ユーザは、例えば、文書作成編集機能を有するアプリケーションプログラムに対する操作により、取り込ませた修正版クレーム情報部分の一部又は全部の内容を、自由に編集したり、ファイルに出力したりすることができる。また、コピー&ペースト、編集、出力等の操作を介して、ユーザは、修正版クレーム情報部分の一部又は全部の内容、或いは、その編集結果を、特許出願用アプリケーションプログラム(例えばインターネット出願ソフト)に取り込ませることができる。また、ユーザは、修正版クレーム情報の編集結果等を含む発明文書を、発明文書分析システム20の発明文書取得部2021に取得させ、再び分析させることで、分析結果としての警告情報等を含む特許出願関連情報を利用することができる。 When each display element of the modified claim information portion in the display document is displayed by a browser, for example, the displayed content (for example, content of multiple lines) can be copied and pasted by the user to create and edit the document. It is constructed so that it can be taken into an application program (for example, a text editor, etc.) having a function, and utilized as a claim for a patent application or a Japanese manuscript for translation of the claim for a patent application. For example, the user can freely edit part or all of the content of the imported modified claim information portion or output it to a file by operating an application program having a document creation/editing function. In addition, through operations such as copy & paste, editing, output, etc., the user can transfer the content of part or all of the modified claim information portion, or the edited result, to an application program for patent application (for example, Internet application software). can be incorporated into In addition, the user causes the invention document acquisition unit 2021 of the invention document analysis system 20 to acquire the invention document including the edited version of the claim information, etc., and causes the invention document acquisition unit 2021 of the invention document analysis system 20 to analyze it again. Application related information is available.

クレーム情報生成部205aは、表示用文書における修正版クレーム情報部分に含まれる見出し、或いは、重要語句に対応する表示要素に、例えば、その見出し、或いは、重要語句についての、表示態様の制御(例えば強調表示、色付き表示、表示遷移等)をするための表示制御情報を付加する。表示制御情報については、例えば、表示用文書としての特許出願関連情報におけるクレーム情報部分の表示要素に付加された表示制御情報と同様である。 The complaint information generation unit 205a controls the display mode of the headline or the key phrase (for example, Add display control information for highlighting, colored display, display transition, etc.). The display control information is, for example, the same as the display control information added to the display element of the claim information portion in the patent application related information as the document for display.

クレーム情報生成部205aは、表示用文書における修正版クレーム情報部分に含まれる、発明文書のクレームから修正した記載部分を表示要素として、その表示要素について、下線を付加する等で強調した表示態様で表示するように、その表示要素に、例えば表示属性としてのtext-decorationプロパティ、border-bottomプロパティ等を調整する表示制御情報を付加することとしてもよい。表示用文書における修正版クレーム情報中で、発明文書のクレームから削除することで修正した記載部分については、文字列を挟まない<span></span>タグで構成した表示要素において表示属性のborderプロパティ等を調整して他と異なる幅の境界線を表示する等のようにした表示制御情報を付加することとしてもよい。修正版クレーム情報における、発明文書のクレームから修正した記載部分は、必ずしも適切な修正が施されているとは限らないので、その修正した記載部分を強調した表示態様で表示されるようにすることにより、ユーザは、警告情報及びクレーム情報を参考にして、修正版クレーム情報における修正が適切か否かを確認した上で、修正版クレーム情報の内容を活用することが、比較的容易となる。 The claim information generation unit 205a uses the description portion corrected from the claim of the invention document, which is included in the corrected claim information portion of the display document, as a display element, and emphasizes the display element by adding an underline or the like. Display control information for adjusting text-decoration property, border-bottom property, etc. as display attributes may be added to the display element so as to display it. In the modified version of the claim information in the display document, for the description part corrected by deleting from the claim of the invention document, the display attribute border in the display element composed of <span></span> tags without character strings It is also possible to add display control information such as displaying a boundary line with a width different from others by adjusting properties. In the amended version of the claim information, the description part that is amended from the claim of the invention document is not always properly amended, so the amended description part should be displayed in a display mode that emphasizes it. Therefore, it becomes relatively easy for the user to refer to the warning information and the complaint information, confirm whether or not the correction in the revised complaint information is appropriate, and then utilize the contents of the revised complaint information.

[3-1-5-8.明細書情報生成部]
明細書情報生成部205bは、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれる明細書情報を、生成する明細書情報生成処理を実行する。明細書情報は、発明文書中の明細書に関する情報である。
[3-1-5-8. Statement information generation unit]
The description information generation unit 205b executes description information generation processing for generating description information included in the patent application related information output by the output unit 208 of the invention document analysis system 20. FIG. The specification information is information relating to the specification in the invention document.

明細書情報生成部205bは、例えば、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれる明細書見出しリストを、生成する明細書見出しリスト生成処理を実行し得る。明細書見出しリストは、発明文書中の明細書における各種の見出しを列挙したリストである。 The description information generation unit 205b can execute a description heading list generation process for generating a description heading list included in the patent application related information output by the output unit 208 of the invention document analysis system 20, for example. The description heading list is a list listing various headings in the description of the invention document.

明細書情報生成部205bは、例えば、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれる、発明文書の明細書を修正した修正版明細書情報を、生成する修正版明細書情報生成処理を実行し得る。 The description information generating unit 205b generates, for example, revised specification information obtained by modifying the specification of the invention document, which is included in the patent application related information output by the output unit 208 of the invention document analysis system 20. book information generation processing can be executed.

明細書情報生成部205bは、発明文書取得部2021により取得された発明文書に明細書が含まれない場合には、明細書情報生成処理、明細書見出しリスト生成処理、及び、修正版明細書情報生成処理の実行を省略する。 If the invention document acquired by the invention document acquisition unit 2021 does not include a specification, the specification information generation unit 205b performs specification information generation processing, specification heading list generation processing, and modified version specification information. Omit execution of generation processing.

明細書情報生成部205bは、例えば、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれる符号リストを生成する符号リスト生成処理を実行し得る。 The specification information generation unit 205b can execute, for example, a code list generation process for generating a code list included in the patent application related information output by the output unit 208 of the invention document analysis system 20. FIG.

[3-1-5-8-1.明細書情報の生成]
明細書情報生成部205bは、明細書情報生成処理を、発明文書取得部2021により取得された発明文書に含まれる明細書を表した明細書情報を生成することにより実現する。明細書情報は、発明文書取得部2021により取得された発明文書に含まれる明細書の一部を修正したものであってもよい。この修正の例としては、明細書にベル制御の「0x07」等の所定の制御コードが含まれている場合にその所定の制御コードを「●」等といった所定の文字に変換することが挙げられる。
[3-1-5-8-1. Generate statement information]
The specification information generation unit 205b realizes the specification information generation process by generating specification information representing the specification included in the invention document acquired by the invention document acquisition unit 2021. FIG. The specification information may be a part of the specification included in the invention document acquired by the invention document acquisition unit 2021, which is corrected. As an example of this modification, if the specification contains a predetermined control code such as "0x07" for bell control, the predetermined control code is converted to a predetermined character such as "●". .

発明文書分析システム20において出力部208が、明細書情報を含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、明細書情報生成部205bは、表示用文書としての特許出願関連情報に含まれる明細書情報を生成する。 When the output unit 208 in the invention document analysis system 20 outputs the patent application-related information including the specification information as a display document (for example, an HTML document), the specification information generation unit 205b outputs the Generate specification information included in patent application related information.

明細書情報生成部205bが生成する、表示用文書としての特許出願関連情報の明細書情報部分は、例えば、明細書の各行の内容に対応する、1つ以上の表示要素を含み、その各行内に重要語句抽出部2051により抽出された1つ以上の重要語句があればその各重要語句に対応する、1つ以上の表示要素を含み、その各行内に、「発明の名称」、「発明を実施するための形態」、各段落番号等といった見出し(例えば、始め隅付き括弧と終わり隅付き括弧とが付加された記載等)、或いは、コメントが含まれている場合に、その見出し、或いは、コメントに対応する、1つ以上の表示要素を含む。具体例としては、明細書情報生成部205bは、HTML文書において明細書情報を<article>タグと</article>タグとで挟んで記述する場合においてその<article>タグ配下に、明細書の各行について、その行に対応する表示要素を、<span>タグと</span>タグとでその行の内容を挟むことで記述し、その1つの行に対応する表示要素の<span>タグ配下に、その行内の各重要語句について、その重要語句に対応する表示要素を、<span>タグと</span>タグとでその重要語句を挟むことで記述し、その行内の重要語句に付加された符号について、その符号に対応する表示要素を、<span>タグと</span>タグとでその符号を挟むことで記述する。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。明細書情報部分に含まれる各行に対応する各表示要素は、例えば、その対応する行の内容を表示可能にする。 The description information part of the patent application-related information as a display document generated by the description information generation unit 205b includes, for example, one or more display elements corresponding to the contents of each line of the description, and in each line If there is one or more key words extracted by the key word extraction unit 2051, one or more display elements corresponding to each of the key words and phrases are included, and each line contains "Title of the invention", "Invention "Mode for Carrying Out", headings such as each paragraph number (for example, descriptions with opening and closing brackets added), or if comments are included, the headings, or Contains one or more display elements that correspond to comments. As a specific example, the description information generation unit 205b, when description information is sandwiched between an <article> tag and a </article> tag in an HTML document, creates each line of the description under the <article> tag. , the display element corresponding to the line is described by sandwiching the content of the line between the <span> tag and the </span> tag, and the display element corresponding to the one line <span> tag , for each key phrase in the line, the display element corresponding to the key phrase is described by sandwiching the key phrase between the <span> tag and the </span> tag, and added to the key phrase in the line For a code, a display element corresponding to the code is described by sandwiching the code between <span> and </span> tags. For example, a browser may interpret the presentation document to display each presentation element. Each display element corresponding to each line included in the description information portion enables display of the contents of the corresponding line, for example.

明細書情報生成部205bは、表示用文書における明細書情報部分に含まれる見出し、コメント、重要語句、図面番号記載(例えば「図1」、「図2」等)、或いは、符号に、対応する表示要素に、例えば、その見出し、コメント、重要語句、図面番号記載、或いは、符号についての、表示態様の制御(例えば強調表示、色付き表示、表示遷移等)をするための表示制御情報を付加する。明細書情報生成部205bは、例えば、明細書情報部分に含まれる重要語句及び符号のうち、設定情報取得部201により取得された設定情報中の重要語句抽出範囲情報に従った重要語句の抽出範囲(例えば「発明を実施するための形態」及び「実施例」)内に記載されている重要語句及び符号に限って、表示制御情報を付加することとしてもよい。 The description information generation unit 205b corresponds to headings, comments, key phrases, drawing number descriptions (for example, "Fig. 1", "Fig. 2", etc.) or codes included in the description information portion of the display document. Display control information for controlling the display mode (e.g., highlighted display, colored display, display transition, etc.) of, for example, headings, comments, key phrases, drawing number descriptions, or symbols is added to display elements. . For example, the description information generation unit 205b extracts the key phrase extraction range according to the key phrase extraction range information in the setting information acquired by the setting information acquisition unit 201, out of the key phrases and codes included in the specification information part. The display control information may be added only to important phrases and codes described in (for example, "Mode for Carrying out the Invention" and "Example").

相違する重要語句各々を互いに異なる表示態様(例えば互いに異なる色の色付き表示等)で表示するために、ある重要語句に付加する表示制御情報を生成する具体例としては、明細書情報生成部205bは、HTML文書のHTMLファイルに<span>タグと</span>タグとで挟んでその重要語句を記述している場合に、その<span>タグに、その重要語句を他の重要語句と識別するように定められた識別情報としてクラス名を付ける例が挙げられる。明細書情報生成部205bは、重要語句の識別情報としてのクラス名を、例えば、その重要語句が発明文書のクレームに記載されているか否かについても区別可能なように定める。なお、明細書情報生成部205bは、重要語句が発明文書のクレームに記載されているか否かを、属性特定部2056により特定された、その重要語句の一属性としての「初出クレーム番号」の値が0以外であるか否かにより判別可能である。各重要語句のクラス名の具体的な一例を挙げると、クレームに記載されている、互いに異なる複数の重要語句のクラス名が、それぞれ「c001」、「c002」、「c003」、・・・等であり、クレームに記載されていない、互いに異なる複数の重要語句のクラス名が、それぞれ「s001」、「s002」、「s003」、・・・等である。このような例においては、HTML文書のCSSファイルに、重要語句の識別情報として用いられるクラス名毎の<span>タグの内容の表示態様としての色を定めた情報(つまり重要語句に付加される色を示す情報)を含ませておくこと等により、明細書情報部分において、例えば、クレームにも記載されている相互に異なる重要語句同士は、クレーム情報部分において重要語句毎に付加された色と同一の色で表示され、クレームに記載されていない相互に異なる重要語句同士は、クレームにも記載されている重要語句とは異なる色を付加された態様によって互いに異なる色で表示される。具体的な一例を挙げると、明細書情報における、クレームにも記載されている相互に異なる重要語句同士は、クレーム情報での表示態様と同様に、例えばborder-leftプロパティにより、ある程度の幅を有し相互に異なる色(つまり表示色)で塗られた左境界線が付加された表示態様で表示され、クレームには記載されていない相互に異なる重要語句同士は、例えば、background-colorプロパティにより、相互に異なる文字背景色が付加された表示態様で表示されるようになる。これにより、ブラウザで表示された場合に、表示用文書における明細書情報中の重要語句が、クレームで記載されている重要語句であるか否かの把握が容易となる。なお、例えば、クレームに記載されている重要語句に、ある程度幅のある左境界線を付加して強調表示するような場合において、明細書情報生成部205bは、明細書情報における、クレームには記載されていない相互に異なる重要語句同士については、例えば、ある程度幅のある左境界線を付加せずに、background-colorプロパティにより、クレームに記載されている重要語句の文字背景色とは異なる、同一の文字背景色が付加された表示態様で表示されるように、表示制御情報等を定めることとしてもよい。これにより、明細書情報において、クレームに記載されていない重要語句に対して、クレームに記載されている重要語句が、左境界線を有することにより、十分に強調され得る。即ち、明細書情報における、複数の重要語句各々について、その重要語句が、クレーム情報における相互に異なる文字列で構成される複数の重要語句のうちのいずれか1つの重要語句と同一であれば、明細書情報におけるその重要語句に係る表示制御情報は、その重要語句を、クレーム情報におけるその前述の1つの重要語句の表示態様に係る左境界線の表示色と同一の表示色で所定幅を有する左境界線が付加された表示態様で表示するように制御し、明細書情報におけるその重要語句が、クレーム情報におけるその前述の複数の重要語句のいずれとも相違すれば、明細書情報におけるその重要語句に係る表示制御情報は、その重要語句を、左境界線が付加されていない表示態様で表示するように制御するためのものであることとしてもよい。図26は、ブラウザに表示された表示用文書としての特許出願関連情報における明細書情報の一例を示す。図26の例では、表示用文書における明細書情報の各行中の重要語句のうち、クレームに記載されている重要語句については、同図中でパターン模様で表現された、色付きの左境界線が、付加され、クレームに記載されていない重要語句については、左境界線が付加されずに、同図中で、矩形枠で表現された、同一の文字背景色が、付加されている。 As a specific example of generating display control information to be added to a key phrase in order to display different key phrases in different display modes (for example, display in different colors), the description information generation unit 205b , when the important phrase is described between <span> and </span> tags in the HTML file of the HTML document, the <span> tag distinguishes the important phrase from other important phrases. An example of assigning a class name as the identification information defined as follows is given. The description information generation unit 205b defines the class name as the identification information of the key phrase so that it is possible to distinguish whether or not the key phrase is described in the claim of the invention document, for example. Note that the description information generation unit 205b determines whether or not the key phrase is described in the claim of the invention document by determining whether the value of the "first-appearance claim number" as one attribute of the key phrase specified by the attribute specifying unit 2056 is is other than zero. To give a specific example of the class name of each key phrase, the class names of a plurality of different key phrases described in the claims are respectively "c001", "c002", "c003", etc. , and the class names of a plurality of different important terms that are not described in the claims are respectively "s001", "s002", "s003", and so on. In such an example, the CSS file of the HTML document contains information (that is, the By including information indicating color) in the specification information part, for example, mutually different key words that are also described in the claims can be compared with the colors added to each key word in the claim information part. Different key words and phrases that are displayed in the same color and are not stated in the claims are displayed in different colors according to the manner in which colors different from those of the key words and phrases that are also stated in the claims are added. To give a specific example, in the specification information, mutually different important terms that are also described in the claims have a certain amount of width, for example, due to the border-left property, similar to the display mode in the claim information. However, mutually different key words that are displayed in a display mode with a left border painted in a mutually different color (that is, a display color) and are not described in the claims are separated from each other by, for example, the background-color property, The characters are displayed in a display mode in which mutually different character background colors are added. As a result, when displayed on a browser, it becomes easy to grasp whether or not the important phrases in the specification information in the document for display are the important phrases described in the claims. It should be noted that, for example, in the case of highlighting an important phrase described in a claim by adding a left boundary line with a certain width, the description information generation unit 205b generates the description in the claim in the description information. For mutually different key phrases that are not specified, for example, without adding a somewhat wide left border, the background-color property allows the character background color of the key phrases in the claims to be different from the character background color of the same The display control information or the like may be determined so that the display is displayed in a display mode in which the character background color of is added. This allows the claimed key phrases to be sufficiently emphasized by having a left border line relative to the non-claimed key phrases in the specification information. That is, for each of the multiple key phrases in the specification information, if the key phrase is the same as any one of the multiple key phrases composed of mutually different character strings in the claim information, The display control information related to the important phrase in the specification information has the same display color as the display color of the left boundary line related to the display mode of the above-mentioned one important phrase in the claim information and has a predetermined width. Control to display in a display mode with a left border added, and if the key phrase in the specification information is different from any of the aforementioned multiple key phrases in the claim information, the key phrase in the specification information The display control information relating to may be for controlling the important phrase to be displayed in a display mode in which the left boundary line is not added. FIG. 26 shows an example of specification information in patent application related information as a display document displayed on the browser. In the example of FIG. 26, of the important words and phrases in each line of the specification information in the display document, the important words and phrases described in the claims are indicated by a colored left border line represented by a pattern in the figure. , but not claimed, the same character background color represented by a rectangular frame in the figure is added without adding a left border line.

明細書情報生成部205bは、重要語句に対応する表示要素に、例えば、ブラウザへの操作に応じて重要語句に関連した表示遷移等を行うためのGUIとしての機能を付加するために、表示制御情報を付加し得る。明細書情報生成部205bは、例えば、クレーム情報生成部205aと同様の方式で、操作に対応するGUIとしての機能を重要語句に付加する(つまり重要語句の表示要素を操作対応GUI要素とする)ための表示制御情報の生成を行い得る。 The description information generating unit 205b performs display control in order to add, for example, a function as a GUI for performing display transitions related to important phrases in response to operations on the browser, to the display elements corresponding to the important phrases. Information can be added. The description information generation unit 205b adds, for example, a GUI function corresponding to an operation to key phrases in a manner similar to that of the complaint information generation unit 205a (that is, the display elements of the key phrases are treated as GUI elements corresponding to operations). can generate display control information for

明細書情報生成部205bにより、生成される表示用文書における明細書情報中の1つの重要語句の表示要素の具体例を挙げると、明細書情報にクレームの重要語句「機器制御部」が複数記載されている場合における11番目の「機器制御部」に対応する表示要素は、例えば、「<span class=”c003” id=”specinfo-c003-011” onclick=’wordProc(”specinfo-c003-011”)’ title=”・・・(情報付加表示内容)・・・”>機器制御部</span>」等となる。この例では、重要語句「機器制御部」の識別コードは、「c003」であり、表示要素の<span>タグのid属性の値として、明細書情報の識別記号「specinfo」と、重要語句の識別コード「c003」と、記載順の番号「011」とを含んだ文字列が定められている。また、この例では、表示要素に対するマウスクリック操作がなされた場合にid属性の値を引数としてwordProc関数が呼び出されるように定められている。これにより、wordProc関数では、例えば、引数から、その表示要素を特定して、表示要素に係る重要語句の文字列を参照する処理を実現することが可能となり、また、引数の一部から、重要語句の識別コード「c003」、記載順の番号「011」等を抽出して、例えば同一の重要語句の先頭の表示要素のid属性が「specinfo-c003-001」であることを特定してその先頭の表示要素を表示させる処理を実現することが可能となり、例えば、クレーム情報、修正版クレーム情報、明細書情報等の全ての重要語句「機器制御部」の表示要素の表示内容を、ユーザに入力された文字列等に置換する処理を実現すること等が可能となる。 To give a specific example of a display element of one key phrase in the specification information in the display document generated by the specification information generation unit 205b, a plurality of key phrases of the claim “equipment control unit” are described in the specification information. The display element corresponding to the 11th "equipment control unit" in the case where the ")' title="... (contents of display with additional information)...">equipment control section</span>" and the like. In this example, the identification code of the important phrase "equipment control unit" is "c003", and the value of the id attribute of the <span> tag of the display element is the identification symbol "specinfo" of the specification information and the important phrase A character string including an identification code "c003" and a number "011" in order of description is defined. Also, in this example, when a mouse click operation is performed on a display element, the wordProc function is called with the value of the id attribute as an argument. As a result, in the wordProc function, for example, it is possible to specify the display element from the argument and refer to the character string of the important phrase related to the display element. By extracting the identification code "c003" of the phrase, the number "011" in order of description, etc., for example, the id attribute of the leading display element of the same important phrase is specified as "specinfo-c003-001". It is possible to realize the processing of displaying the first display element, for example, the display contents of the display elements of all the important phrases "equipment control unit" such as claim information, corrected version claim information, specification information, etc. can be displayed to the user. It is possible to realize a process of replacing with an input character string or the like.

明細書情報生成部205bは、例えば、明細書情報部分に含まれる「発明を実施するための形態」、各段落番号等といった見出しに対応する表示要素に、例えば、強調表示のために、或いは、ブラウザへの操作に応じて例えば直前又は直後の見出しに対応する表示要素への表示遷移等を行うためのGUIとしての機能を付加するために、表示制御情報を付加し得る。明細書情報生成部205bは、例えば、クレーム情報生成部205aと同様の方式で、操作に対応するGUIとしての機能を見出しに付加する表示制御情報の生成を行う。 The description information generating unit 205b, for example, displays the display elements corresponding to the headings such as "Mode for Carrying Out the Invention" and each paragraph number contained in the description information part for highlighting, or Display control information can be added in order to add a function as a GUI for performing display transition to a display element corresponding to, for example, an immediately preceding or succeeding headline in response to an operation on the browser. The description information generation unit 205b generates display control information for adding a GUI function corresponding to an operation to a headline, for example, in the same manner as the complaint information generation unit 205a.

明細書情報生成部205bは、例えば、警告情報生成部2059により生成された警告情報における指摘情報で示された不適切な記載が、明細書情報部分に含まれる場合には、その不適切な記載を、例えば<span>タグと</span>タグとで挟む表示要素として、その表示要素に、その不適切な記載について強調表示等を行うための表示制御情報を付加してもよい。<span>タグを付加した文字列に係る表示要素の強調表示は、例えば、CSSにおけるtext-decorationプロパティ、font-weightプロパティ、borderプロパティ、colorプロパティ、background-colorプロパティ等の値を調整する表示制御情報により実現可能である。 If, for example, the description information portion includes inappropriate description indicated by the warning information generated by the warning information generation unit 2059, the description information generation unit 205b removes the inappropriate description. may be sandwiched between, for example, <span> and </span> tags, and display control information for highlighting the inappropriate description may be added to the display element. The highlighting of the display element related to the character string with the <span> tag is, for example, display control that adjusts the values of the text-decoration property, font-weight property, border property, color property, background-color property, etc. in CSS It is feasible with information.

発明文書取得部2021により取得された分析部205の分析対象となった発明文書における明細書に基づいて明細書情報を生成する明細書情報生成部205bは、その発明文書に対応する図面文書(例えばPDFファイル)が図面文書取得部2022により取得可能である場合においては、発明文書に含まれる符号付きの要素名と同一である重要語句が明細書情報に含まれるときに、その重要語句を、操作に応じて図面文書におけるその符号を含む部分(例えばその符号を含む頁)を表示するためのGUIの機能を有する表示要素とするための表示制御情報を、その重要語句の表示要素に付加することとしてもよい。また、明細書情報生成部205bは、明細書情報に含まれる符号を、操作に応じて図面文書におけるその符号を含む部分(例えばその符号を含む頁)を表示するためのGUIの機能を有する表示要素とするための表示制御情報を、その明細書情報における符号の表示要素に付加することとしてもよい。この表示制御情報は、例えば、操作に応じて符号を引数として起動されるスクリプトの関数の関数名又はその関数自体を定義するものであり、その関数は、例えば、引数の符号を含む、図面文書中の部分を、例えば図面文書が検索可能PDFファイルの内容である場合、又は、図面文書を内容として含むPDFファイルを検索可能PDFファイルへと変換できる場合等において、検索可能PDFファイルからその符号を検索することで、特定するように定められる。明細書情報生成部205bは、例えば、符号に対する操作に応じて、図面文書におけるその符号を含む部分を表示するための表示制御情報に係る関数を、ブラウザで表示されて操作がなされたその符号の表示要素が隠れない範囲に、図面文書におけるその符号を含む部分を表示するように定めておくこととしてもよい。明細書情報生成部205bは、例えば、ブラウザによる表示画面を複数の表示領域に分割し、明細書情報の表示領域と、操作に応じて表示される図面文書の一部分等の表示領域とを並列的に表示してもよい。明細書情報生成部205bは、例えば、符号の表示要素に付加する表示制御情報により、その符号に対する操作に応じて起動される関数を、更なる操作に応じて図面文書におけるその符号を含む複数の部分(例えばその符号を含む2以上の頁)を切り替えて表示する処理を実行するように定めてもよいし、図面文書におけるその符号を含む全ての部分を必要に応じて縮小して一括表示する処理を実行するように定めてもよい。明細書情報生成部205bは、例えば、符号に対する操作に応じて、図面文書におけるその符号を含む部分を表示するための表示制御情報に係る関数を、図面文書におけるその符号を含む部分におけるその符号を強調表示するように定めておくこととしてもよい。図27は、ブラウザに表示された特許出願関連情報の明細書情報における重要語句に付加された符号の表示要素に対するマウスクリック操作に応じて表示されたポップアップ画面の一例を示す。図27に例示するポップアップ画面は、明細書情報中で重要語句「B部」に後続する符号「12」に対するマウスクリック操作がなされた場合に表示され、符号「12」が含まれる図面「図1」を内容とし、図面「図1」中の符号「12」が強調表示されている。 A description information generation unit 205b that generates description information based on the description of the invention document that is the analysis target of the analysis unit 205 acquired by the invention document acquisition unit 2021 generates a drawing document (for example, PDF file) can be acquired by the drawing document acquisition unit 2022, when the description information includes key words that are the same as the signed element names included in the invention document, the key words are manipulated. Add display control information to the display element of the important phrase to make it a display element having a GUI function for displaying the part containing the code in the drawing document (for example, the page containing the code) according to the may be In addition, the description information generation unit 205b also provides a display having a GUI function for displaying a code included in the description information and a portion of the drawing document containing the code (for example, a page containing the code) in response to an operation. The display control information for the element may be added to the display element of the code in the specification information. This display control information defines, for example, a function name of a function of a script activated with a code as an argument according to an operation, or the function itself. For example, when the drawing document is the content of the searchable PDF file, or when the PDF file containing the drawing document can be converted to the searchable PDF file, the code is removed from the searchable PDF file. By searching, it is determined to identify. For example, the description information generation unit 205b, in response to an operation on a code, generates a function related to display control information for displaying a portion including the code in the drawing document, and generates a function of the code displayed and operated on the browser. It may be determined to display the part including the code in the drawing document in a range where the display element is not hidden. For example, the description information generation unit 205b divides the display screen of the browser into a plurality of display areas, and displays the description information display area and the display area such as a part of the drawing document displayed according to the operation in parallel. may be displayed in For example, the description information generation unit 205b uses the display control information added to the display element of the code to generate a function that is activated in response to an operation on the code, and generates a plurality of functions including the code in the drawing document in response to further operations. It may be determined to switch and display a part (for example, two or more pages containing the code), or all the parts containing the code in the drawing document are reduced as necessary and displayed collectively. It may be determined to execute processing. For example, the description information generation unit 205b, in response to an operation on the code, generates a function related to display control information for displaying the part containing the code in the drawing document, and generates the code in the part containing the code in the drawing document. It may be determined to be highlighted. FIG. 27 shows an example of a pop-up screen displayed in response to a mouse click operation on display elements of symbols added to important terms in specification information of patent application related information displayed on the browser. The pop-up screen illustrated in FIG. 27 is displayed when a mouse click operation is performed on the code "12" following the important phrase "B part" in the specification information, and the drawing "FIG. 1" containing the code "12" is displayed. , and the symbol "12" in the drawing "FIG. 1" is highlighted.

明細書情報生成部205bにより、生成される表示用文書における明細書情報中の1つの符号の表示要素の具体例を挙げると、明細書情報に符号「123」が複数記載されている場合における3番目の「123」に対応する表示要素は、例えば、「<span class=”sign” id=”specinfo-sign123-003” onclick=’refSignProc(”specinfo-sign123-003”)’>123</span>」等となる。この例では、明細書情報における3番目の符号「123」の表示要素の<span>タグのクラス名として「sign」が定められており、id属性の値として、明細書情報の識別記号「specinfo」と、符号の識別情報「sign123」と、記載順の番号「003」とを含んだ文字列が定められている。また、この例では、表示要素に対するマウスクリック操作がなされた場合にid属性の値を引数としてrefSignProc関数が呼び出されるように定められている。これにより、refSignProc関数では、例えば、引数から、その表示要素を特定して、表示要素に係る符号の文字列を参照する処理を実現することが可能となり、また、引数に基づいて、例えば、明細書情報等における全ての符号「123」の表示要素の表示内容を、ユーザに入力された新たな符号を表す文字列等に置換し、符号「123」を属性情報の「符号」の内容として含む重要語句についてのその属性情報の「符号」の内容を、新たな符号に置換する処理を実現すること等が可能となる。 A specific example of the display element of one code in the specification information in the display document generated by the specification information generation unit 205b is 3 The display element corresponding to the th "123" is, for example, "<span class="sign" id="specinfo-sign123-003" onclick='refSignProc ("specinfo-sign123-003")'>123</span >”, etc. In this example, "sign" is defined as the class name of the <span> tag of the display element with the third code "123" in the specification information, and the specification information identification symbol "specinfo" is specified as the value of the id attribute. , code identification information “sign123”, and a number “003” in order of description. Also, in this example, it is determined that the refSignProc function is called with the value of the id attribute as an argument when a mouse click operation is performed on the display element. As a result, in the refSignProc function, for example, it is possible to specify the display element from the argument and refer to the character string of the code related to the display element. Replace the display contents of all display elements of the code "123" in the book information, etc. with a character string representing the new code entered by the user, and include the code "123" as the content of the "code" of the attribute information It is possible to realize a process of replacing the content of the "code" of the attribute information of the key phrase with a new code.

明細書情報生成部205bは、例えば、表示用文書としての明細書情報部分に「図面の簡単な説明」の欄が含まれる場合に、その欄の始め隅付き括弧と終わり隅付き括弧とで挟まれた図面番号に係る記載部分を、1つの表示要素として、その表示要素に、その図面番号に対する操作(例えばマウスクリック操作等)に応じて、明細書情報におけるその図面番号の図面についての記載を含む各行を検索して検索結果の各行を列挙等して表示するためのGUIとしての機能を持たせるために、表示制御情報を付加することとしてもよい。また、明細書情報生成部205bは、例えば、表示用文書としての明細書情報部分において「図n」(nは自然数)を含む図面番号記載が含まれる場合に、その図面番号記載を、1つの表示要素として、その表示要素に、その図面番号に対する操作(例えばマウスクリック操作等)に応じて、明細書情報におけるその図面番号と同一の図面番号を示す図面番号記載を含む各行を検索して検索結果の各行を列挙等して表示するためのGUIとしての機能を持たせるために、表示制御情報を付加することとしてもよい。また、明細書情報生成部205bは、例えば、表示用文書としての明細書情報部分において図面番号記載が含まれる場合に、その図面番号記載を、1つの表示要素として、その表示要素に、操作(例えばマウスクリック操作等)に応じて、明細書情報における図面番号記載を含む各行を、図面番号に拘わらず、検索して検索結果の各行を列挙等して表示するためのGUIとしての機能を持たせるために、表示制御情報を付加することとしてもよい。 For example, when the specification information portion as a document for display includes a column of "Brief description of the drawing", the specification information generation unit 205b inserts the column between the opening corner bracket and the closing corner bracket of the column. The description part related to the drawn drawing number is treated as one display element, and the description about the drawing with that drawing number in the specification information is displayed on that display element in response to the operation on the drawing number (for example, mouse click operation, etc.) Display control information may be added in order to provide a function as a GUI for retrieving each line containing the search result and displaying each line of the search result in a enumerated manner. Further, for example, when the specification information portion as a document for display includes drawing number description including "figure n" (n is a natural number), the description information generation unit 205b converts the drawing number description into one As a display element, according to the operation (for example, mouse click operation) on the drawing number, each line containing the drawing number description indicating the same drawing number as the drawing number in the specification information is searched and searched. Display control information may be added to provide a GUI function for listing and displaying each line of the result. Further, for example, when the description of the drawing number is included in the description information portion as the document for display, the description information generation unit 205b treats the description of the drawing number as one display element, and performs the operation ( For example, according to mouse click operation, etc.), each line containing drawing number description in the specification information is searched regardless of the drawing number, and each line of the search result is listed and displayed. Display control information may be added in order to

明細書情報生成部205bは、例えば、表示用文書としての明細書情報部分に「■請求項n」等といった、請求項n(nは自然数)の記載内容に、又は、その記載内容に対して予め定められた所定の変換処理(例えば、改行の削除、句点文字の削除、クレームの項を引用する引用記載部分の削除等を行う変換処理)を施した内容に、置換可能である部分であることを示す記載が含まれている場合には、この記載内容中の「■請求項n」の部分を1つの表示要素として、その表示要素に、操作(例えばマウスクリック操作)に応じてその表示要素の内容を、請求項nの記載内容に、又は、その記載内容に対して上述した所定の変換処理を施した内容に、置換して表示するためのGUIとしての機能を持たせるために、表示制御情報を付加することとしてもよい。 The description information generation unit 205b, for example, in the description information part as a document for display, such as "■ claim n", to the description content of claim n (n is a natural number), or to the description content It is a part that can be replaced with the content that has been subjected to predetermined conversion processing (for example, deletion of line feeds, deletion of period characters, deletion of quoted descriptions that cite claims, etc.). If there is a statement indicating that the In order to have a function as a GUI for replacing and displaying the content of the element with the description content of claim n or with the content obtained by performing the above-described predetermined conversion processing on the description content, Display control information may be added.

明細書情報生成部205bは、例えば、HTML文書である表示用文書における各情報部分(例えば明細書情報、修正版明細書情報等)の各行末の、全角又は半角の空白文字、タブ、改行、リターン、改頁、或いは、垂直タブの各文字コードを除去し、行末の改行を改行用のHTMLタグ<br>で表すこととしてもよい。 The description information generation unit 205b generates, for example, full-width or half-width blank characters, tabs, line feeds, and The return, page feed, or vertical tab character codes may be removed, and the line feed at the end of the line may be represented by the line feed HTML tag <br>.

[3-1-5-8-2.明細書見出しリストの生成]
明細書情報生成部205bは、明細書見出しリスト生成処理を、発明文書取得部2021により取得された発明文書に含まれる明細書に基づいて、明細書見出しリストを生成することにより実現する。明細書見出しリストは、発明文書の明細書における、見出しの記載を含む行を、発明文書の明細書における記載順に、全て列挙したリストである。
[3-1-5-8-2. Generate statement heading list]
The description information generation unit 205b implements the description headline list generation processing by generating a description headline list based on the description included in the invention document acquired by the invention document acquisition unit 2021. FIG. The description headline list is a list in which all the lines including the description of the headline in the description of the invention document are listed in the order of description in the description of the invention document.

明細書情報生成部205bは、例えば、始め隅付き括弧と終わり隅付き括弧とで挟まれた記載を含む行を、見出しの記載を含む行として扱う。明細書情報生成部205bは更に、行頭の位置に、又は、行頭の1つ以上の空白文字に後続した位置に、予め定められた1種類以上の括弧(例えば丸括弧、角括弧、山括弧等)のいずれかに係る始め括弧と終わり括弧とで挟まれた記載を含む行を、無条件で、又は、行末に句点文字「。」がないことを条件として、見出しの記載を含む行と看做すこととしてもよい。これにより、例えば、(実施の形態1)、(実施の形態2)、[1-1.X装置の構成]、[1-2.効果等]等の各種の見出しが、明細書見出しリストに列挙されることとなり、出力された特許出願関連情報における明細書見出しリストを閲覧するユーザは、各種の見出し内に記述した番号及び文字列が適切であるか否か等を比較的容易に確認し得る。 The description information generation unit 205b treats, for example, a line including a description sandwiched between an opening square bracket and an ending square bracket as a line including a heading description. The description information generation unit 205b further inserts one or more types of predetermined brackets (eg, round brackets, square brackets, angle brackets, etc.) at the beginning of the line or at the position following one or more blank characters at the beginning of the line. ) is regarded as a line containing a description of a heading, either unconditionally or on the condition that there is no period character "." at the end of the line. It is also possible to do so. Accordingly, for example, (Embodiment 1), (Embodiment 2), [1-1. Configuration of X device], [1-2. Effect, etc.] are listed in the description heading list, and a user who browses the description heading list in the output patent application related information can read the numbers and character strings described in the various headings It is possible to relatively easily confirm whether or not is appropriate.

明細書情報生成部205bは、例えば、明細書見出しリストに列挙する行のうち、段落番号を表す見出しの記載を含む行については、その段落番号の段落範囲内において、重要語句抽出部2051により抽出された重要語句がある場合に、その重要語句の全てをその行に追記することとしてもよい。この場合に、明細書情報生成部205bは、追記する重要語句が重複しないように同一の重要語句については1つだけ追記することとしてもよい。また、この場合に、明細書情報生成部205bは、その段落範囲内における重要語句のうち、発明文書のクレームに記載されている重要語句だけを、追記することとしてもよい。また、明細書情報生成部205bは、追記する重要語句が複数ある場合には、その重要語句を、重要度決定部2055により決定された重要度の順に追記してもよいし、その段落範囲内に多く記載されている重要語句ほど、その重要語句を前方に配置されるように追記してもよいし、発明文書のクレームに記載されている重要語句をクレームに記載されていない重要語句よりも前方に配置されるように追記してもよい。また、明細書情報生成部205bは、明細書見出しリストに列挙する行には、段落番号を表す見出しの記載を含む行を含めないこととしてもよい。例えば、設定情報取得部201により取得される設定情報に、段落番号を明細書見出しリストに列挙するか否かが定義されることとした場合には、明細書情報生成部205bは、その設定情報に従って、明細書見出しリストに列挙する行に段落番号を含む行を含めるか否かを決めて、明細書見出しリスト生成処理を実行することとしてもよい。また、明細書情報生成部205bは、明細書見出しリストに列挙する行には、見出しではないが、図面番号記載(例えば「図1」、「図2」等)の含まれる行における図面番号記載以外を除去した内容の行(例えば図面番号記載が複数であればカンマ等の区切り文字で区切った図面番号記載を並べた行)を、見出しの行に混ぜて、発明文書の明細書での出現順に列挙してもよい。例えば、設定情報取得部201により取得される設定情報に、図面番号記載を明細書見出しリストに列挙するか否かが定義されることとした場合には、明細書情報生成部205bは、その設定情報に従って、明細書見出しリストに列挙する行に図面番号記載を含めるか否かを決めて、明細書見出しリスト生成処理を実行することとしてもよい。 The description information generation unit 205b extracts, for example, the important phrase extraction unit 2051 within the paragraph range of the paragraph number for the line including the description of the heading representing the paragraph number among the lines listed in the description heading list. If there is an important phrase that has been written, all of the important phrase may be added to that line. In this case, the description information generation unit 205b may additionally add only one of the same important phrase so that the additional important phrases do not overlap. Also, in this case, the description information generation unit 205b may additionally add only the important words and phrases described in the claim of the invention document among the important words and phrases within the paragraph range. Further, when there are a plurality of important phrases to be added, the description information generation unit 205b may add the important phrases in the order of importance determined by the importance determination unit 2055, or add the important phrases within the paragraph range. The more important words and phrases described in the document, the more important words and phrases may be added so that the more important words and phrases are placed in front, and the more important words and phrases described in the claims of the invention document may be added than the important words and phrases not described in the claims. It may be added so that it is positioned forward. Further, the description information generation unit 205b may exclude lines including descriptions of headings representing paragraph numbers from the lines listed in the description heading list. For example, if the setting information acquired by the setting information acquiring unit 201 defines whether or not paragraph numbers are listed in the specification heading list, the specification information generating unit 205b acquires the setting information Accordingly, it may be determined whether or not to include a line including a paragraph number in the lines listed in the description heading list, and the description heading list generating process may be executed. In addition, the description information generation unit 205b creates drawing number descriptions in lines that are not headings but include drawing number descriptions (eg, "Fig. 1", "Fig. 2", etc.) in the lines listed in the description heading list Lines with contents other than those removed (for example, if there are multiple drawing number descriptions, a line in which the drawing number descriptions are separated by commas or other delimiters) are mixed with the heading line to appear in the specification of the invention document. You can list them in order. For example, if the setting information acquired by the setting information acquisition unit 201 defines whether or not the description of the drawing number is listed in the specification heading list, the specification information generation unit 205b According to the information, it may be determined whether or not to include the drawing number description in the lines listed in the description heading list, and the description heading list generation processing may be executed.

明細書見出しリストは、例えば、発明文書における明細書の各種見出しの記載様式、各図面番号記載等が適正であるか否かの確認、段落毎の重要語句の確認、明細書の概要の俯瞰等に有用となり得る。 The description heading list is used, for example, to check whether the description format of various headings in the invention document, the description of each drawing number, etc., is correct, to check the important words and phrases for each paragraph, and to overview the outline of the description. can be useful for

明細書情報生成部205bは、例えば、始め隅付き括弧と終わり隅付き括弧とで挟まれた記載を含む行のうちその記載が段落番号である行を、見出しの記載を含む行ではないと看做すこととしてもよい。また、明細書情報生成部205bは、明細書見出しリストに、見出しの記載を含む行と、記載順に織り交ぜて、発明文書の明細書における見出しの記載を含まない各行についての先頭から所定の文字数(例えば30文字)までの文字列以外を削除した後におけるその各行を、含ませることとしてもよい。 For example, the description information generation unit 205b regards a line whose description is a paragraph number among lines including a description sandwiched between an opening bracket and an ending bracket as not a line including a heading description. It is also possible to do so. In addition, the description information generation unit 205b interweaves lines including descriptions of headings in the description heading list in order of description, and adds a predetermined number of characters from the beginning of each line that does not include descriptions of headings in the specification of the invention document. Each line may be included after removing all but the string (eg, up to 30 characters).

発明文書分析システム20において出力部208が、明細書見出しリストを含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、明細書情報生成部205bは、表示用文書としての特許出願関連情報に含まれる明細書見出しリストを生成する。 When the output unit 208 in the invention document analysis system 20 outputs the patent application related information including the specification heading list as a display document (for example, an HTML document), the specification information generation unit 205b outputs generates a list of specification headings included in the patent application related information of

明細書情報生成部205bが生成する、表示用文書としての特許出願関連情報の明細書見出しリスト部分は、例えば、明細書見出しリストの各行の内容に対応する、1つ以上の表示要素を含み、その各行内に見出し(例えば、始め隅付き括弧と終わり隅付き括弧とが付加された記載等)が含まれている場合に、その見出しに対応する、1つ以上の表示要素を含む。具体例としては、明細書情報生成部205bは、HTML文書において明細書見出しリストを<article>タグと</article>タグとで挟んで記述する場合においてその<article>タグ配下に、明細書見出しリストの各行について、その行に対応する表示要素を、<span>タグと</span>タグとでその行の内容を挟むことで記述し、その1つの行に対応する表示要素の<span>タグ配下に、その行内の見出しについて、その見出しに対応する表示要素を、<span>タグと</span>タグとでその見出しを挟むことで記述する。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。明細書見出しリスト部分に含まれる各行に対応する各表示要素は、例えば、その対応する行の内容を表示可能にする。 The description heading list portion of the patent application-related information as a display document generated by the description information generation unit 205b includes, for example, one or more display elements corresponding to the contents of each line of the description heading list, If a heading is included in each line (eg, a description with an opening and closing bracket), one or more display elements corresponding to the heading are included. As a specific example, the description information generation unit 205b creates a description heading list under the <article> tag when describing a description heading list sandwiched between <article> and </article> tags in an HTML document. For each line of the list, the display element corresponding to that line is described by sandwiching the contents of that line between the <span> tag and the </span> tag. Under the tag, a display element corresponding to the heading in the line is described by sandwiching the heading between the <span> tag and the </span> tag. For example, a browser may interpret the presentation document to display each presentation element. Each display element corresponding to each line included in the description heading list portion enables, for example, the contents of the corresponding line to be displayed.

明細書情報生成部205bは、表示用文書における明細書見出しリスト部分に含まれる見出しに対応する表示要素に、例えば、その見出しについての、表示態様の制御(例えば強調表示、色付き表示、表示遷移等)をするための表示制御情報を付加する。明細書情報生成部205bは、見出しに対応する表示要素に、例えば、ブラウザへの操作に応じて、その見出しに対応した明細書情報の部分(つまり、明細書情報における、その見出しが記載されていた発明文書の明細書の行を表す部分)への表示遷移等を行うためのGUIとしての機能を付加するために、表示制御情報を付加し得る。 The description information generation unit 205b controls the display mode (e.g., highlighted display, colored display, display transition, etc.) of the display elements corresponding to the headings included in the description heading list portion of the display document. ) is added. The description information generating unit 205b generates a portion of the description information corresponding to the heading (that is, the heading in the description information) in the display element corresponding to the heading, for example, according to the operation of the browser. Display control information can be added in order to add a function as a GUI for performing display transition to the portion representing the line of the specification of the invention document).

図28及び図29は、ブラウザに表示された表示用文書としての特許出願関連情報における明細書見出しリストの一例を示す。図28は、段落番号を明細書見出しリストに列挙しない例を示している。図29は、段落番号を明細書見出しリストに列挙し、図面番号記載を各見出しと混在させて出現順に明細書見出しリストに列挙し、明細書見出しリストにおける段落番号を示す各行には明細書情報においてその段落番号の段落に含まれる重要語句を列挙した例を示している。 28 and 29 show an example of a specification heading list in patent application related information as a display document displayed on the browser. FIG. 28 shows an example in which paragraph numbers are not listed in the specification heading list. FIG. 29 lists paragraph numbers in the description heading list, lists drawing numbers mixed with each heading in the description heading list in order of appearance, and describes information in each line indicating the paragraph number in the description heading list. shows an example of listing the key phrases contained in the paragraph of that paragraph number.

明細書情報生成部205bは、表示用文書における明細書見出しリスト部分に重要語句が含まれる場合においては、重要語句に対応する表示要素を定めて、その表示要素に、強調表示のため、或いは、操作に対応するGUIとしての機能を重要語句に付加するための、表示制御情報を付加し得る。 When the description headline list portion of the document for display includes key phrases, the description information generation unit 205b determines display elements corresponding to the key phrases, and uses the display elements for highlighting or Display control information can be added for adding a GUI function corresponding to an operation to the important phrase.

[3-1-5-8-3.修正版明細書情報の生成]
明細書情報生成部205bは、修正版明細書情報生成処理を、発明文書取得部2021により取得された発明文書に含まれる明細書を修正した修正版明細書情報を生成することにより実現する。修正版明細書情報は、明細書情報生成処理によって生成される明細書情報の一部を修正したものである。明細書情報生成部205bによる修正版明細書情報生成処理では、クレーム情報生成部205aによる修正版クレーム情報生成処理におけるクレームへの修正内容のうち、発明文書の明細書に適用可能なものに係る修正(例えば、数式、化学式等の番号が連続番号でない場合の修正等)を、同様に実行し得る。ユーザは、例えば、修正版明細書情報の内容を、発明文書の明細書として用いて、その発明文書を、再び発明文書分析システム20で分析させることにより、新たに発明文書評価情報を含む警告情報等で構成される特許出願関連情報を得ることが可能となる。
[3-1-5-8-3. Generate modified description information]
The specification information generation unit 205b realizes the modified specification information generation processing by generating modified specification information obtained by modifying the specification included in the invention document acquired by the invention document acquisition unit 2021. FIG. The revised specification information is part of the specification information generated by the specification information generation process. In the modified specification information generation processing by the description information generation unit 205b, among the modifications to the claims in the modification version complaint information generation processing by the claim information generation unit 205a, corrections that are applicable to the specification of the invention document are performed. (eg, corrections where numbers in mathematical formulas, chemical formulas, etc. are not consecutive numbers, etc.) may be performed as well. The user, for example, uses the content of the revised specification information as the specification of the invention document, and causes the invention document to be analyzed again by the invention document analysis system 20, thereby newly creating warning information including invention document evaluation information. It is possible to obtain patent application related information composed of

[3-1-5-8-3-1.不適切な記載についての修正及び不要な記載の削除]
明細書情報生成部205bは、発明文書取得部2021により取得された発明文書の明細書中の記載が、警告情報生成部2059で指摘情報を生成する対象となるような場合において、予め修正方法が定められているときには、その修正方法に従って、その記載を修正することで、修正版明細書情報を生成する。以下、明細書の記載の修正による修正版明細書情報の生成の具体例を説明する。
[3-1-5-8-3-1. Correction of inappropriate descriptions and deletion of unnecessary descriptions]
The description information generation unit 205b determines in advance the correction method in the case where the description in the specification of the invention document acquired by the invention document acquisition unit 2021 is the object for which the warning information generation unit 2059 generates indication information. When defined, the modified specification information is generated by modifying the description according to the modification method. A specific example of generation of revised specification information by correcting the description of the specification will be described below.

明細書情報生成部205bは、例えば、発明文書取得部2021により取得された発明文書の明細書中の記載が、翻訳用発明文書標準規定取得部204により取得された翻訳用発明文書標準規定(図14参照)において修正情報が付加されている条件項目のパターン情報が示すパターンに該当する場合に、その修正情報に基づいて、明細書中の記載を修正することで、修正した明細書を表す修正版明細書情報を生成こととしてもよい。具体例としては、明細書情報生成部205bは、例えば、発明文書の明細書に、翻訳用発明文書標準規定取得部204により取得された翻訳用発明文書標準規定における「米国出願で他の表現に変更した方が望ましい場合がある文字列」という条件項目名の条件項目におけるパターン情報で示されるパターンに該当する「本発明の特徴は」等の記載があるときには、その記載を、その条件項目における修正情報に従って「本開示における一実施態様例の特徴は」等に修正して、修正後の明細書を表す修正版明細書情報を生成する。また、例えば、明細書情報生成部205bは、翻訳用発明文書標準規定における「米国出願で他の表現に変更した方が望ましい場合がある文字列」に係る条件項目に該当する例として、発明文書の明細書中に「図2の(1)は、・・・を表した図であり、図2の(2)は、・・・」といった、1つの図面内に分離された複数の図が存在する可能性を示す記載があるときには、その記載を、その条件項目で定められた修正情報に従って、例えば、「図2Aは、・・・を表した図であり、図2Bは、・・・」等と修正して、修正後の明細書を表す修正版明細書情報を生成する。明細書情報生成部205bは、例えば、発明文書取得部2021により取得された発明文書の明細書中の記載が、翻訳用発明文書標準規定(図14参照)において「除去が望ましいと推定される文字列」の条件項目に係る不適切な記載を抽出するためのパターン情報が示すパターンに該当する文字列(例えば「のみ」、「好ましくは」等)の記載を探索し、そのパターンに該当する文字列の記載を検出した場合に、その文字列を除去することで、修正版明細書情報を生成する。なお、翻訳用発明文書標準規定の内容は、図14に例示する内容に限定されることはなく、例えば、明細書情報生成部205bは、「好ましくは、・・・するとよい。」という記載が該当するように定めたパターン情報を含む条件項目を定めた翻訳用発明文書標準規定のその条件項目の修正情報に従うことで、例えば、発明文書の明細書の記載における「好ましくは、・・・するとよい。」という記載を、「例えば、・・・してもよい。」という記載に変更して、修正版明細書情報を生成することとしてもよい。 For example, the description information generation unit 205b converts the description in the specification of the invention document acquired by the invention document acquisition unit 2021 into the standard specification for translation of the invention document acquired by the invention document standard specification for translation acquisition unit 204 (Fig. 14), when the pattern information of the condition item to which the correction information is added corresponds to the pattern indicated, the description in the specification is corrected based on the correction information, thereby representing the corrected specification Version specification information may be generated. As a specific example, the description information generating unit 205b adds, for example, to the description of the invention document, "Other expressions in the US application" in the standard specification for invention documents for translation acquired by the standard specification for invention documents for translation acquisition unit 204 If there is a description such as "What are the characteristics of the present invention" that corresponds to the pattern indicated by the pattern information in the condition item with the condition item name "character string that may be desirable to be changed", such description should be included in the condition item. According to the correction information, the modified specification information representing the corrected specification is generated by modifying the description such as "the feature of the embodiment example in the present disclosure". Further, for example, the specification information generation unit 205b generates invention document In the specification, there are multiple figures separated in one drawing, such as "(1) in FIG. 2 is a diagram showing ... and (2) in FIG. 2 is ..." When there is a description indicating the possibility of existence, the description is changed according to the correction information defined in the condition item, for example, "Fig. 2A is a diagram showing . . . ” etc. to generate the revised specification information representing the revised specification. For example, the description information generation unit 205b determines whether the description in the description of the invention document acquired by the invention document acquisition unit 2021 is "characters presumed to be Search for descriptions of character strings that correspond to the pattern indicated by the pattern information (e.g., "only", "preferably", etc.) to extract inappropriate descriptions related to the condition items in the "column", and characters that correspond to the pattern When the description of the column is detected, the modified specification information is generated by removing the character string. Note that the content of the standard specification of invention documents for translation is not limited to the content illustrated in FIG. By following the modification information of the conditional items of the Standard Provisions for Invention Documents for Translation, which defines the conditional items including the pattern information defined as applicable, for example, "preferably, if... may be changed to "for example, you may..." to generate the revised specification information.

明細書情報生成部205bは、例えば、発明文書取得部2021により取得された発明文書の明細書の段落番号が行順に沿って連続番号となっていない場合には、行順に沿って4桁の連続番号となるように、或いは、全段落番号数が4桁では足りない場合には5桁の連続番号となるように、明細書の段落番号を修正することで、修正版明細書情報を生成する。明細書情報生成部205bは、例えば、発明文書取得部2021により取得された発明文書の明細書の段落番号に半角文字と全角文字とが混在している場合には、その一方の種類の文字(例えば全角文字)となるように明細書の段落番号を修正することで、修正版明細書情報を生成する。 For example, when the paragraph numbers of the specification of the invention document acquired by the invention document acquisition unit 2021 are not consecutive numbers along the order of lines, the description information generation unit 205b converts the numbers into consecutive four-digit numbers along the order of lines. Generate revised specification information by correcting the paragraph number of the specification so that it becomes a number, or if the number of all paragraph numbers is not enough with 4 digits, it becomes a 5-digit consecutive number. . For example, when half-width characters and full-width characters are mixed in the paragraph numbers of the description of the invention document acquired by the invention document acquisition section 2021, the description information generation unit 205b selects one of the types of characters ( By correcting the paragraph number of the specification so that it becomes double-byte characters, for example, the revised specification information is generated.

明細書情報生成部205bは、例えば、発明文書取得部2021により取得された発明文書の明細書に段落番号が含まれていない場合において、予め定められた適切な位置と、予め定められた、段落番号の付加間隔の基準となる所定行数毎に段落番号を連続番号となるように付加して、修正版明細書情報を生成することとしてもよい。明細書情報生成部205bは、この段落番号の付加を、例えば、設定情報取得部201により取得された設定情報において、段落番号の付加を指定する情報が含まれている場合に限って行うこととしてもよい。段落番号の付加を指定する情報は、例えば、上述の段落番号の付加間隔の基準となる所定行数の指定を含んでもよい。また、明細書情報生成部205bは、例えば、設定情報取得部201により取得された設定情報において、段落番号の削除を指定する情報が含まれている場合に、発明文書の明細書中の段落番号の記載を削除することで、修正版明細書情報を生成することとしてもよい。 For example, when the description of the invention document acquired by the invention document acquisition unit 2021 does not include paragraph numbers, the description information generation unit 205b generates appropriate predetermined positions and predetermined paragraph numbers. The revised specification information may be generated by continuously adding paragraph numbers to each of a predetermined number of lines, which is a reference for adding numbers. The description information generation unit 205b adds the paragraph number only when, for example, the setting information acquired by the setting information acquisition unit 201 includes information designating the addition of the paragraph number. good too. The information designating addition of paragraph numbers may include, for example, designation of a predetermined number of lines that serves as a reference for adding the above-mentioned paragraph numbers. For example, if the setting information acquired by the setting information acquiring unit 201 includes information specifying deletion of the paragraph number, the description information generation unit 205b By deleting the description of, the modified specification information may be generated.

明細書情報生成部205bは、例えば、発明文書取得部2021により取得された発明文書の明細書に「図面の簡単な説明」の欄が記載されている場合において、その欄の図面番号が行順に沿って、枝番を考慮した上でも連続番号となっていないときには、行順に沿って連続番号となるように図面番号を修正することで、修正版明細書情報を生成する。明細書情報生成部205bは、「図面の簡単な説明」の欄の図面番号を修正した場合に、明細書のその他の欄における図面番号の記載部分(例えば「図」で始まり枝番を含む図面番号に使用可能な文字が1つ以上連続した文字列の部分等)を、その「図面の簡単な説明」の欄の図面番号の修正と呼応するように、文字列の置換処理によって修正して、修正版明細書情報を生成することとしてもよい。これにより、例えば、明細書における図面番号を変更したいユーザは、発明文書分析システム20の発明文書取得部2021に取得させる発明文書中の明細書の「図面の簡単な説明」の欄における各図面番号に対応した各行の並び順を修正しておくだけで、明細書の全ての図面番号の記載が修正された修正版明細書情報を得ることができる。 For example, when the specification of the invention document acquired by the invention document acquisition unit 2021 includes a column of "brief description of the drawing", the description information generation unit 205b arranges the drawing numbers in that column in line order. Accordingly, if the drawing numbers are not continuous even after considering the branch numbers, the revised specification information is generated by correcting the drawing numbers so that they are continuous in line order. If the drawing number in the "Brief description of the drawing" column is corrected, the description information generation unit 205b will change the description of the drawing number in other columns of the specification (for example, the drawing part of a character string in which one or more characters that can be used for a number are consecutive) is corrected by replacing the character string so as to correspond to the correction of the drawing number in the "Brief description of the drawing" column. , to generate modified specification information. As a result, for example, a user who wants to change the drawing number in the specification can enter each drawing number in the "brief description of the drawing" column of the specification in the invention document to be acquired by the invention document acquisition unit 2021 of the invention document analysis system 20. Only by correcting the arrangement order of each line corresponding to , it is possible to obtain the corrected specification information in which the descriptions of all the drawing numbers in the specification are corrected.

明細書情報生成部205bは、例えば、発明文書取得部2021により取得された発明文書の明細書に「図面の簡単な説明」の欄が記載されていない場合において、明細書において「図n」(nは自然数)を含む図面番号の記載が、図面番号の初出行の順において、枝番を考慮した上でも連続番号となっていないときには、その図面番号の記載について初出行の順に沿って連続番号となるように図面番号を修正し、図面番号順に図面番号の記載行の内容又は記載支援用未完成メッセージを列挙した内容を含むように「図面の簡単な説明」の欄を適切な位置に追記することで、修正版明細書情報を生成することとしてもよい。明細書情報生成部205bは、例えば、発明文書取得部2021により取得された発明文書の明細書の図面番号の記載部分における図面番号に半角文字と全角文字とが混在している場合には、その一方の種類の文字(例えば全角文字)となるようにその図面番号を修正することで、修正版明細書情報を生成する。 For example, when the specification of the invention document acquired by the invention document acquisition unit 2021 does not include the column of "brief description of the drawing", the specification information generation unit 205b adds "figure n" ( n is a natural number), if the drawing numbers are not consecutively numbered in the order of the first appearance of the drawing numbers, even after considering branch numbers, the drawing numbers should be consecutively numbered in the order of the first appearance. , and add the "Brief description of the drawing" column to the appropriate position so that it includes the contents of the description line of the drawing number in the order of the drawing number or the contents listing the incomplete messages for description support By doing so, the modified specification information may be generated. For example, when half-width characters and full-width characters are mixed in the drawing number in the drawing number description portion of the specification of the invention document acquired by the invention document acquisition section 2021, the description information generation unit 205b By correcting the drawing number so that it becomes one type of characters (for example, double-byte characters), the corrected specification information is generated.

明細書情報生成部205bは、例えば、発明文書取得部2021により取得された発明文書の明細書に半角文字が含まれている場合には、その半角文字を、対応する全角文字に変更することで、修正版明細書情報を生成することとしてもよい。この場合に、明細書情報生成部205bは、発明文書の明細書において、「非特許文献」の欄に英字の半角文字が含まれているとき、及び、始め丸括弧と終わり丸括弧とで挟まれた英字の半角文字が含まれているときには、その英字の半角文字の全角文字への変更を行わないこととしてもよい。また、明細書情報生成部205bは、発明文書の明細書の段落番号又は図面番号が全て半角文字で統一されている場合においては、その番号の全角文字への変更を行わないこととしてもよい。発明文書の明細書に半角文字が含まれている場合に全角文字に変更する対象となる半角文字の種類(例えば英字、片仮名文字、記号等)、文字コード範囲等を、設定情報取得部201により取得される設定情報等で指定可能として、その指定に従って明細書情報生成部205bは、修正版明細書情報の生成のための明細書中の半角文字の全角文字への変更を行うこととしてもよい。また、逆に、発明文書の明細書に全角文字が含まれている場合に半角文字に変更する対象となる全角文字の種類、文字コード範囲等を、設定情報取得部201により取得される設定情報等で指定可能として、その指定に従って明細書情報生成部205bは、修正版明細書情報の生成のための明細書中の全角文字の半角文字への変更を行うこととしてもよい。 For example, when the description of the invention document acquired by the invention document acquisition unit 2021 includes half-width characters, the description information generation unit 205b changes the half-width characters to the corresponding full-width characters. , to generate modified specification information. In this case, the description information generating unit 205b generates the description of the invention document when the "Non-Patent Literature" column contains English half-width characters, When a half-width alphabetic character is included, the half-width alphabetic character may not be changed to a full-width character. Further, when the paragraph numbers or drawing numbers of the specification of the invention document are all unified with half-width characters, the description information generation unit 205b may not change the numbers to full-width characters. When half-width characters are included in the specification of the invention document, the type of half-width characters to be changed to full-width characters (for example, alphabetic characters, katakana characters, symbols, etc.), character code range, etc. are obtained by the setting information acquisition unit 201. The specification information generation unit 205b may change half-width characters to full-width characters in the specification for generating modified version description information according to the specification, which can be specified by acquired setting information, etc. . Conversely, if the description of the invention document contains full-width characters, the type of full-width characters to be changed to half-width characters, the character code range, etc. are set in the setting information acquired by the setting information acquisition unit 201. etc., and the specification information generating unit 205b may change full-width characters to half-width characters in the specification for generating revised specification information according to the specification.

明細書情報生成部205bは、例えば、発明文書取得部2021により取得された発明文書の明細書に「■請求項n」等といった、請求項n(nは自然数)の記載内容に、又は、その記載内容に対して予め定められた所定の変換処理(例えば、改行の削除、句点文字の削除、クレームの項を引用する引用記載部分の削除等を行う変換処理)を施した内容に、置換可能である部分であることを示す記載が含まれている場合には、この記載内容中の「■請求項n」の部分を、請求項nの記載内容に、又は、その記載内容に対して上述した所定の変換処理を施した内容に、置換することで、修正版明細書情報を生成することとしてもよい。明細書情報生成部205bは、この置換を、例えば、設定情報取得部201により取得された設定情報において、請求項への置換可能部分の記載の、請求項の内容を表した記載への置換を指定する情報が含まれている場合に限って行うこととしてもよい。明細書情報生成部205bは、この置換した後の記載内容における重要語句抽出部2051により抽出された重要語句のうち、発明文書においてその重要語句に対して符号が付加された記載があるところの重要語句、或いは、発明文書の明細書の「符号の説明」の欄において重要語句に対応する符号の記載があるところの重要語句については、その重要語句の直後にその重要語句に対応する符号を挿入することとしてもよい。なお、重要語句に対応する符号が複数存在する場合には、明細書情報生成部205bは、例えば、その複数の符号を読点等で区切って列挙したものを、重要語句の後への挿入に用いることとしてもよいし、その複数の符号に対する自然順等のソートにより最先となる符号の1つを選択して、その選択した1つの符号を、重要語句の後への挿入に用いることとしてもよい。 The description information generation unit 205b adds, for example, to the description of the invention document acquired by the invention document acquisition unit 2021, the description content of claim n (n is a natural number), such as "■ claim n", or its Can be replaced with content that has been subjected to predetermined conversion processing (e.g., deletion of line feeds, deletion of period characters, and deletion of quoted descriptions that cite claim paragraphs) If there is a description that indicates that the part is The revised specification information may be generated by replacing the content with the content that has been subjected to a predetermined conversion process. The description information generation unit 205b performs this replacement, for example, by replacing the description of the replaceable part in the claim with the description representing the content of the claim in the setting information acquired by the setting information acquisition unit 201. This may be done only when the specified information is included. The description information generating unit 205b extracts important words and phrases extracted by the important word and phrase extraction unit 2051 from the description content after replacement, where there is a description with a code added to the important words and phrases in the invention document. For words and phrases, or key words and phrases where the code corresponding to the key words and phrases is described in the column of "Description of Codes" in the specification of the invention document, insert the code corresponding to the key words and phrases immediately after the key words and phrases. It is also possible to If there are a plurality of codes corresponding to the key phrase, the description information generating unit 205b uses, for example, a list of the plurality of codes separated by commas for insertion after the key phrase. Alternatively, one of the first codes may be selected by sorting the plurality of codes in natural order, etc., and the selected one code may be used for insertion after the important phrase. good.

明細書情報生成部205bは、例えば、発明文書取得部2021により取得された発明文書の明細書に、クレームの項の内容と実質的に同一な内容の記載部分(つまり所謂クレームコピーの部分)が含まれている場合に、その部分の直前、又は、直後等に、そのクレームの項の項番nを、「■(クレームn)」等といった、予め定められた形式で含めた文字列によるコメントを挿入することとしてもよい。明細書情報生成部205bは、このコメントの挿入を、例えば、設定情報取得部201により取得された設定情報において、クレームコピー部分への項番に係るコメントの挿入を指定する情報が含まれている場合に限って行うこととしてもよい。なお、設定情報に含まれ得るクレームコピー部分への項番に係るコメントの挿入を指定する情報は、挿入されるべきコメントの形式を指定する情報を含むこととしてもよい。 For example, the description information generation unit 205b detects that the description of the invention document acquired by the invention document acquisition unit 2021 includes a description portion (that is, a so-called claim copy portion) that is substantially the same as the content of the claim section. If it is included, a comment with a character string that includes the item number n of the claim item in a predetermined format such as "■ (claim n)" immediately before or after that part may be inserted. The specification information generation unit 205b inserts the comment, for example, in the setting information acquired by the setting information acquisition unit 201, which includes information designating insertion of a comment related to the item number in the complaint copy part. It may be done only in certain cases. The information specifying the insertion of a comment related to the item number into the complaint copy portion that can be included in the setting information may include information specifying the format of the comment to be inserted.

[3-1-5-8-3-2.表示用文書における修正版明細書情報部分の生成]
発明文書分析システム20において出力部208が、修正版明細書情報を含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、明細書情報生成部205bは、表示用文書としての特許出願関連情報に含まれる修正版明細書情報を生成する。
[3-1-5-8-3-2. Generation of Modified Description Information Part in Document for Display]
When the output unit 208 in the invention document analysis system 20 outputs the patent application-related information including the revised specification information as a display document (for example, an HTML document), the specification information generation unit 205b outputs the display document Generate the modified specification information included in the patent application related information as.

明細書情報生成部205bが生成する、表示用文書としての特許出願関連情報の修正版明細書情報部分は、例えば、修正版明細書情報における修正した明細書の各行の内容に対応する、1つ以上の表示要素を含み、その各行内に重要語句抽出部2051により抽出された1つ以上の重要語句があればその各重要語句に対応する、1つ以上の表示要素を含み、その各行内に、「発明の名称」、「発明を実施するための形態」等といった見出しが含まれている場合にその見出しに対応する、1つ以上の表示要素を含み、その各行内に1つ以上の符号が含まれている場合にその各符号に対応する1つ以上の表示要素を含む。具体例としては、明細書情報生成部205bは、HTML文書において修正版明細書情報を<article>タグと</article>タグとで挟んで記述する場合においてその<article>タグ配下に、修正版明細書情報としての修正済みの明細書の各行について、その行に対応する表示要素を、<span>タグと</span>タグとでその行の内容を挟むことで記述し、その1つの行に対応する表示要素の<span>タグ配下に、その行内の各重要語句について、その重要語句に対応する表示要素を、<span>タグと</span>タグとでその重要語句を挟むことで記述し、その行内の見出しについて、その見出しに対応する表示要素を、<span>タグと</span>タグとでその見出しを挟むことで記述し、その行内の符号について、その符号に対応する表示要素を、<span>タグと</span>タグとでその符号を挟むことで記述する。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。修正版明細書情報部分に含まれる各行に対応する各表示要素は、例えば、その対応する行の内容を表示可能にする。 The corrected version specification information part of the patent application related information as a display document generated by the specification information generation unit 205b is, for example, one If there are one or more important phrases extracted by the important phrase extraction unit 2051 in each row, one or more display elements corresponding to each of the important phrases are included, and each row includes one or more display elements. , "Title of the Invention", "Detailed Description", etc., and one or more display elements corresponding to the headings, if any, and one or more symbols within each line. contains one or more display elements that correspond to each symbol when . As a specific example, the description information generation unit 205b, when describing the revised description information sandwiched between <article> tag and </article> tag in the HTML document, writes the revised version under the <article> tag. For each line of the revised specification as specification information, the display element corresponding to that line is described by sandwiching the contents of that line between the <span> tag and the </span> tag. Under the <span> tag of the display element corresponding to, for each key phrase in the line, the display element corresponding to the key phrase is sandwiched between the <span> tag and the </span> tag. For the heading in the line, the display element corresponding to the heading is described by sandwiching the heading between the <span> tag and the </span> tag, and the code in the line corresponds to the code A display element is described by sandwiching the code between the <span> tag and the </span> tag. For example, a browser may interpret the presentation document to display each presentation element. Each display element corresponding to each line included in the revised specification information portion enables, for example, the contents of the corresponding line to be displayed.

明細書情報生成部205bにより、生成される表示用文書における修正版明細書情報中の1つの重要語句の表示要素の具体例を挙げると、修正版明細書情報にクレームの重要語句「機器制御部」が複数記載されている場合における9番目の「機器制御部」に対応する表示要素は、例えば、「<span class=”c003” id=”revspecinfo-c003-009” onclick=’wordProc(”revspecinfo-c003-009”)’ title=”・・・(情報付加表示内容)・・・”>機器制御部</span>」等となる。この例では、重要語句「機器制御部」の識別コードは、「c003」であり、表示要素の<span>タグのid属性の値として、修正版明細書情報の識別記号「revspecinfo」と、重要語句の識別コード「c003」と、記載順の番号「009」とを含んだ文字列が定められている。また、この例では、表示要素に対するマウスクリック操作がなされた場合にid属性の値を引数としてwordProc関数が呼び出されるように定められている。これにより、wordProc関数では、例えば、引数から、その表示要素を特定して、表示要素に係る重要語句の文字列を参照する処理を実現することが可能となり、また、引数の一部から、重要語句の識別コード「c003」、記載順の番号「009」等を抽出して、例えば同一の重要語句の先頭の表示要素のid属性が「revspecinfo-c003-001」であることを特定してその先頭の表示要素を表示させる処理を実現することが可能となり、例えば、クレーム情報、修正版クレーム情報、明細書情報、修正版明細書情報等の全ての重要語句「機器制御部」の表示要素の表示内容を、ユーザに入力された文字列等に置換する処理を実現すること等が可能となる。 To give a specific example of a display element of one key phrase in the revised specification information in the display document generated by the specification information generation unit 205b, the key phrase of the claim in the revised specification information, “equipment control unit ” is described, the display element corresponding to the ninth “device control unit” is, for example, “<span class="c003" id="revspecinfo-c003-009" onclick='wordProc("revspecinfo -c003-009")' title="... (display content with additional information)...">equipment control unit</span>" and the like. In this example, the identification code of the important phrase "equipment control unit" is "c003", and the value of the id attribute of the <span> tag of the display element is the identification symbol "revspecinfo" of the revised specification information and the important A character string including a phrase identification code “c003” and a number “009” in order of description is defined. Also, in this example, the wordProc function is called with the value of the id attribute as an argument when a mouse click operation is performed on the display element. As a result, in the wordProc function, for example, it is possible to specify the display element from the argument and refer to the character string of the important phrase related to the display element. By extracting the identification code "c003" of the phrase, the number "009" in the order of description, etc., for example, the id attribute of the top display element of the same important phrase is specified as "revspecinfo-c003-001". It is possible to realize the processing to display the first display element, for example, display elements of all important words "equipment control unit" such as claim information, modified claim information, specification information, modified specification information, etc. It is possible to realize a process of replacing the displayed content with a character string or the like input by the user.

表示用文書における修正版明細書情報部分の各表示要素は、ブラウザにより表示された場合に、その表示された内容を、ユーザがコピー&ペースト等によって、文書作成編集機能を有するアプリケーションプログラム(例えばテキストエディタ等)等に取り込ませて、特許出願用の明細書、又は、特許出願用の明細書の翻訳用和文原稿として活用可能なように、構成される。ユーザは、例えば、文書作成編集機能を有するアプリケーションプログラムに対する操作により、取り込ませた修正版明細書情報部分の一部又は全部の内容を、自由に編集したり、ファイルに出力したりすることができる。また、コピー&ペースト、編集、出力等の操作を介して、ユーザは、修正版明細書情報部分の一部又は全部の内容、或いは、その編集結果を、特許出願用アプリケーションプログラムに取り込ませることができる。また、ユーザは、修正版明細書情報の編集結果等を含む発明文書を、発明文書分析システム20の発明文書取得部2021に取得させ、再び分析させることで、分析結果としての警告情報等を含む特許出願関連情報を利用することができる。 When each display element of the modified specification information part in the display document is displayed by the browser, the user copies and pastes the displayed contents to an application program (for example, text Editor, etc.), etc., and can be used as a specification for patent application or a Japanese manuscript for translation of the specification for patent application. The user can, for example, freely edit a part or all of the imported modified specification information part or output it to a file by operating an application program having document creation and editing functions. . In addition, through operations such as copy & paste, editing, output, etc., the user can import the content of part or all of the modified specification information portion, or the edited result thereof, into the patent application application program. can. In addition, the user causes the invention document acquisition unit 2021 of the invention document analysis system 20 to acquire the invention document including the edited result of the modified specification information, etc., and causes the invention document acquisition unit 2021 of the invention document analysis system 20 to analyze it again, thereby including the warning information etc. as the analysis result. Patent application related information is available.

明細書情報生成部205bは、表示用文書における修正版明細書情報部分に含まれる見出し、符号、或いは、重要語句に対応する表示要素に、例えば、その見出し、符号、或いは、重要語句についての、表示態様の制御(例えば強調表示、色付き表示、表示遷移等)をするための表示制御情報を付加する。表示制御情報については、例えば、表示用文書としての特許出願関連情報における明細書情報部分の表示要素に付加された表示制御情報と同様である。 The description information generation unit 205b adds, for example, Display control information for controlling the display mode (for example, highlighting, colored display, display transition, etc.) is added. The display control information is, for example, the same as the display control information added to the display element of the specification information portion in the patent application related information as the document for display.

明細書情報生成部205bは、表示用文書における修正版明細書情報部分に含まれる、発明文書の明細書から修正した記載部分を表示要素として、その表示要素について、下線を付加する等で強調した表示態様で表示するように、その表示要素に、例えば表示属性としてのtext-decorationプロパティ、border-bottomプロパティ等を調整する表示制御情報を付加することとしてもよい。表示用文書における修正版明細書情報中で、発明文書の明細書から削除することで修正した記載部分については、文字列を挟まない<span></span>タグで構成した表示要素において表示属性のborderプロパティ等を調整して他と異なる幅の境界線を表示する等のようにした表示制御情報を付加することとしてもよい。修正版明細書情報における、発明文書の明細書から修正した記載部分は、必ずしも適切な修正が施されているとは限らないので、その修正した記載部分を強調した表示態様で表示されるようにすることにより、ユーザは、警告情報及び明細書情報を参考にして、修正版明細書情報における修正が適切か否かを確認した上で、修正版明細書情報の内容を活用することが、比較的容易となる。 The description information generation unit 205b emphasizes the description part corrected from the description of the invention document, which is included in the modified version description information part of the display document, as a display element by adding an underline or the like to the display element. Display control information for adjusting text-decoration property, border-bottom property, etc. as display attributes may be added to the display element so as to display in the display mode. In the modified specification information in the display document, the description part that has been corrected by deleting it from the specification of the invention document is displayed at the display element composed of <span></span> tags without character strings. It is also possible to add display control information such as displaying a border with a width different from others by adjusting the border property or the like. In the revised specification information, since the description part that is revised from the description of the invention document is not necessarily appropriately revised, the revised description part should be displayed in a display mode that emphasizes it. By doing so, the user can refer to the warning information and the description information to confirm whether or not the correction in the revised description information is appropriate, and then utilize the contents of the revised description information. easier.

[3-1-5-8-4.符号リストの生成]
明細書情報生成部205bは、符号リスト生成処理を、発明文書取得部2021により取得された発明文書に含まれる明細書等に基づいて、符号リストを生成することにより実現する。
[3-1-5-8-4. Code list generation]
The specification information generation unit 205b realizes the code list generation processing by generating a code list based on the specification etc. included in the invention document acquired by the invention document acquisition unit 2021. FIG.

符号リストは、発明文書の明細書から重要語句抽出部2051により抽出された重要語句が表す要素名に後続して記載された符号を列挙して、符号と対応する重要語句とを関連付けて表したリストである。明細書情報生成部205bは、符号リストを、例えば、日本国の特許出願用の明細書の「符号の説明」の欄に記載可能な形式で生成する。明細書情報生成部205bは、符号リストとして、例えば、一行には1つの重要語句と、その重要語句に対応する1つ以上の符号とを、例えば、1つ以上の符号、重要語句の順に、空白文字を挟んで記載する。明細書情報生成部205bは、符号リストの一行において1つの重要語句に対応する複数の符号を記載する場合には、例えば、その複数の符号を、読点文字「、」、カンマ等の区切り文字によって区切って、自然順等のソートの結果に従った順で並べて、記載し得る。符号リストにおける区切り文字は、設定情報取得部201により取得される設定情報で設定可能としてもよい。明細書情報生成部205bは、例えば、符号リストの各行を、その行における最先の符号についての、自然順等のソートの結果に従った行順で、並べる。 The code list lists the codes that follow the element name represented by the key phrase extracted by the key phrase extraction unit 2051 from the specification of the invention document, and associates the code with the corresponding key phrase. is a list. The description information generation unit 205b generates the code list in a format that can be described in the "description of code" column of the specification for Japanese patent applications, for example. As a code list, the description information generation unit 205b creates, for example, one key phrase and one or more codes corresponding to the key phrase in one line. Enter with a blank character. When describing a plurality of codes corresponding to one key phrase in one line of the code list, the description information generating unit 205b separates the plurality of codes with delimiters such as punctuation characters "," and commas. They can be described by separating them and arranging them in order according to the result of sorting such as natural order. The delimiter in the code list may be set by setting information acquired by the setting information acquisition unit 201 . For example, the description information generation unit 205b arranges each line of the code list in line order according to the result of sorting, such as natural order, for the first code in the line.

明細書情報生成部205bは、例えば、重要語句抽出部2051により抽出された重要語句に符号が付加された記載が、発明文書の明細書中に存在しない場合において、その重要語句に符号が付加された記載が、発明文書のクレーム中に存在するときには、そのクレーム中でその重要語句に付加された符号をその重要語句に関連付けて、符号リストに含ませ得る。 For example, when a description in which a sign is added to the key phrase extracted by the key phrase extraction unit 2051 does not exist in the specification of the invention document, the description information generation unit 205b adds the sign to the key phrase. When such a statement is present in a claim of an invention document, the code appended to that key word in that claim may be included in the code list in association with that key word.

明細書情報生成部205bは、例えば、重要語句抽出部2051により抽出された重要語句に符号が付加された記載が、発明文書中に存在しない場合において、その重要語句が表す要素が他の要素を構成上包含するか、他の要素に構成上包含されるときには、その重要語句について、クレーム情報生成部205aによる符号決定処理で決定された符号を、その重要語句に関連付けて、符号リストに含ませ得る。 For example, when a description in which a code is added to the key phrase extracted by the key phrase extraction unit 2051 does not exist in the invention document, the description information generation unit 205b determines that the element represented by the key phrase is another element. When it is structurally included or structurally included in another element, for that key phrase, the code determined by the code determination processing by the claim information generation unit 205a is associated with the key phrase and included in the code list. obtain.

明細書情報生成部205bは、例えば、符号リストにおいて符号に関連付けられる各重要語句について、その重要語句の一属性として属性特定部2056で特定された「初出クレーム番号」を参照することで、その重要語句が発明文書のクレームに記載された重要語句であるか否かを識別可能に表現するように符号リストを生成することとしてもよい。 For example, the description information generating unit 205b refers to the “first-appearance claim number” specified by the attribute specifying unit 2056 as one attribute of each key phrase associated with the code in the code list, thereby identifying the key phrase. The code list may be generated to identifiably express whether or not a phrase is a claimed key phrase of the invention document.

明細書情報生成部205bは、例えば、符号リストにおいて符号に関連付けられる各重要語句について、その重要語句の対応翻訳語又は翻訳語候補集合を付記することとしてもよい。 For example, the description information generating unit 205b may add a corresponding translation word or a translation word candidate set to each key word/phrase associated with the code in the code list.

発明文書分析システム20において出力部208が、符号リストを含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、明細書情報生成部205bは、表示用文書としての特許出願関連情報に含まれる符号リストを生成する。 When the output unit 208 in the invention document analysis system 20 outputs the patent application related information including the code list as a document for display (for example, an HTML document), the description information generation unit 205b outputs the patent as a document for display. Generate a code list that is included in the application related information.

明細書情報生成部205bが生成する、表示用文書としての特許出願関連情報の符号リスト部分は、例えば、符号リストの各行の内容に対応する、1つ以上の表示要素を含み、その各行内における各符号及び重要語句の各々に対応する、1つ以上の表示要素を含む。具体例としては、明細書情報生成部205bは、HTML文書において符号リストを<article>タグと</article>タグとで挟んで記述する場合においてその<article>タグ配下に、符号リストの各行について、その行に対応する表示要素を、<span>タグと</span>タグとでその行の内容を挟むことで記述し、その1つの行に対応する表示要素の<span>タグ配下に、その行内の各符号或いは重要語句について、その符号或いは重要語句に対応する表示要素を、<span>タグと</span>タグとでその符号或いは重要語句を挟むことで記述する。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。符号リスト部分に含まれる各行に対応する各表示要素は、例えば、その対応する行の内容を表示可能にする。図30の一部は、ブラウザに表示された表示用文書としての特許出願関連情報における符号リストの一例を示す。なお、図30には、後述する図面符号リストの一例が含まれている。 The code list part of the patent application-related information as a display document generated by the specification information generation unit 205b includes, for example, one or more display elements corresponding to the contents of each line of the code list, and in each line It includes one or more display elements corresponding to each symbol and key phrase. As a specific example, when describing a code list sandwiched between <article> and </article> tags in an HTML document, the description information generation unit 205b adds an , the display element corresponding to the line is described by sandwiching the content of the line between the <span> tag and the </span> tag, and under the <span> tag of the display element corresponding to one line, For each code or key phrase in the line, a display element corresponding to the code or key phrase is described by sandwiching the code or key phrase between <span> and </span> tags. For example, a browser may interpret the presentation document to display each presentation element. Each display element corresponding to each row included in the code list portion, for example, enables the contents of its corresponding row to be displayed. Part of FIG. 30 shows an example of a code list in patent application related information as a display document displayed on the browser. Note that FIG. 30 includes an example of a drawing code list, which will be described later.

明細書情報生成部205bは、表示用文書における符号リスト部分に含まれる各符号或いは重要語句に対応する表示要素に、例えば、その符号或いは重要語句についての、表示態様の制御(例えば強調表示、色付き表示、表示遷移等)をするための表示制御情報を付加する。 The description information generation unit 205b controls the display mode (e.g., highlighting, coloring, etc.) of the code or key phrase in the display element corresponding to each code or key phrase included in the code list portion of the document for display. display, display transition, etc.) is added.

明細書情報生成部205bは、例えば、表示用文書における符号リスト部分の重要語句に対応する表示要素に付加する表示制御情報を、表示用文書における明細書情報部分の重要語句に対応する表示要素に付加する表示制御情報と同様に生成し得る。 For example, the description information generating unit 205b adds the display control information to be added to the display elements corresponding to the important terms in the code list portion of the display document to the display elements corresponding to the key terms in the description information portion of the display document. It can be generated in the same manner as the additional display control information.

明細書情報生成部205bは、例えば、表示用文書における符号リスト部分の符号に対応する表示要素に、その表示要素の操作(例えばマウスクリック操作)に応じて、クレーム情報又は修正版クレーム情報におけるその符号を含む各行と、明細書情報又は修正版明細書情報におけるその符号を含む各行との記載内容を表示するGUIとしての機能を持たせるための表示制御情報を付加し得る。 For example, the description information generating unit 205b generates the display element corresponding to the code in the code list portion of the document for display, in response to the operation (for example, mouse click operation) of the display element, in the complaint information or the modified version of the complaint information. It is possible to add display control information for providing a function as a GUI for displaying each line containing a code and the contents of each line containing that code in the specification information or modified specification information.

明細書情報生成部205bにより、生成される表示用文書における符号リスト中の符号の表示要素の具体例を挙げると、符号リストに記載されている符号「123」の表示要素は、例えば、「<span class=”sign” id=”signlist-sign123” onclick=’refSignProc(”signlist-sign123”)’>123</span>」等となる。この例では、符号リストにおける符号「123」の表示要素の<span>タグのクラス名として「sign」が定められており、id属性の値として、符号リストの識別記号「signlist」と、符号の識別情報「sign123」とを含んだ文字列が定められている。また、この例では、表示要素に対するマウスクリック操作がなされた場合にid属性の値を引数としてrefSignProc関数が呼び出されるように定められている。これにより、refSignProc関数では、例えば、引数から、その表示要素を特定して、表示要素に係る符号の文字列を参照する処理を実現することが可能となり、また、引数に基づいて、例えば、符号リスト、明細書情報等における全ての符号「123」の表示要素の表示内容を、ユーザに入力された新たな符号を表す文字列等に置換し、符号「123」を属性情報の「符号」の内容として含む重要語句についてのその属性情報の「符号」の内容を、新たな符号に置換する処理を実現すること等が可能となる。 Specific examples of the display elements of the codes in the code list in the display document generated by the specification information generation unit 205b include the display element of the code "123" described in the code list, for example, "< span class=”sign” id=”signlist-sign123” onclick='refSignProc(“signlist-sign123”)'>123</span>” and so on. In this example, "sign" is defined as the class name of the <span> tag of the display element of the code "123" in the code list, and the value of the id attribute is the identification symbol "signlist" of the code list and the A character string including identification information "sign123" is defined. Also, in this example, it is determined that the refSignProc function is called with the value of the id attribute as an argument when a mouse click operation is performed on the display element. As a result, in the refSignProc function, for example, it is possible to specify the display element from the argument and refer to the character string of the code related to the display element. Replace the display contents of all display elements with the code "123" in the list, description information, etc. with a character string representing the new code entered by the user, and replace the code "123" with the "code" It is possible to implement a process of replacing the content of the "code" of the attribute information of the important phrase included as the content with a new code.

明細書情報生成部205bは、例えば、発明文書に基づいて生成された表示用文書における符号リスト部分の符号に対応する表示要素に、その表示要素の操作に応じて、その発明文書に関連する、図面文書取得部2022により取得された図面文書における、その符号が表された部分を表示するGUIとしての機能を持たせるための表示制御情報を付加し得る。明細書情報生成部205bは、例えば、符号の表示要素に付加された表示制御情報を、GUIによりその符号が操作された場合に、図面文書におけるその符号が表された部分を強調表示するように、生成してもよい。図31は、ブラウザに表示された特許出願関連情報の符号リスト(図30参照)における符号の表示要素に対するマウスクリック操作に応じて表示されたポップアップ画面の一例を示す。図31に例示するポップアップ画面は、符号リスト中で重要語句「処理部」に後続する符号「30a」に対するマウスクリック操作がなされた場合に表示され、符号「30a」が含まれる図面「図5」を内容とし、図面「図5」中の符号「30a」が強調表示されている。 For example, the description information generating unit 205b generates display elements corresponding to the codes in the code list portion of the display document generated based on the invention document, depending on the operation of the display element. Display control information can be added to provide a function as a GUI for displaying the part of the drawing document acquired by the drawing document acquisition unit 2022 where the code is indicated. The description information generation unit 205b, for example, converts the display control information added to the display element of the code so that when the code is operated by the GUI, the part where the code is expressed in the drawing document is highlighted. , may be generated. FIG. 31 shows an example of a pop-up screen displayed in response to a mouse click operation on a code display element in the code list of patent application related information (see FIG. 30) displayed on the browser. The pop-up screen illustrated in FIG. 31 is displayed when a mouse click operation is performed on the code "30a" following the key word "processing unit" in the code list, and the drawing "FIG. 5" including the code "30a" is displayed. and the symbol "30a" in the drawing "FIG. 5" is highlighted.

[3-1-5-9.クレームツリー生成部]
クレームツリー生成部205cは、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれ得るクレームツリーを生成するクレームツリー生成処理を実行する。クレームツリーは、特許出願関連情報中のクレーム情報において表されるクレームの各項の引用関係を木構造の形式で表現した情報である。
[3-1-5-9. Claim tree generator]
The claim tree generation unit 205c executes claim tree generation processing for generating a claim tree that can be included in the patent application related information output by the output unit 208 of the invention document analysis system 20. FIG. The claim tree is information expressing the citation relationship of each item of claims represented in the claim information in the patent application related information in the form of a tree structure.

クレームツリー生成部205cは、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれ得る修正版クレームツリーを生成する修正版クレームツリー生成処理を実行し得る。修正版クレームツリーは、特許出願関連情報中の修正版クレーム情報において表されるクレームの各項の引用関係を木構造の形式で表現した情報である。 The claim tree generation unit 205 c can execute a modified claim tree generation process for generating a modified claim tree that can be included in the patent application related information output by the output unit 208 of the invention document analysis system 20 . The modified claim tree is information that expresses the citation relationship of each item of claims represented in the modified claim information in the patent application related information in the form of a tree structure.

クレームツリー生成部205cは、発明文書取得部2021により取得された発明文書にクレームが含まれない場合には、クレームツリー生成処理、及び、修正版クレームツリー生成処理の実行を省略する。 If the invention document acquired by the invention document acquisition unit 2021 does not include any claims, the claim tree generation unit 205c omits the execution of the claim tree generation process and the modified claim tree generation process.

[3-1-5-9-1.クレームツリーの生成]
クレームツリー生成部205cは、クレームツリー生成処理を、クレーム引用関係検出部2057が保持するクレーム引用関係情報を参照して、クレーム情報におけるクレーム各項の引用関係を表現したクレームツリーを生成することにより実現する。
[3-1-5-9-1. Generate Claim Tree]
The claim tree generation unit 205c performs the claim tree generation process by referring to the claim citation relation information held by the claim citation relation detection unit 2057 and generating a claim tree expressing the citation relation of each item of the claim in the claim information. Realize.

クレームツリー生成部205cは、クレーム情報におけるクレームの各項について、項番が小さい順に、行を改めて、その項が、どの項番の項を引用しているかを示す情報を、記号、項番等によって表記することで、クレームツリーを生成する。 The claim tree generation unit 205c replaces each line of each claim in the claim information in ascending order of the claim number, and adds information indicating which claim number the claim refers to, such as a symbol, claim number, or the like. Generate a claim tree by notating by .

クレームツリー生成部205cは、例えば、クレーム情報におけるクレームの各項のうち、請求対象起点項(つまり、他の項を引用していない項、或いは、他の項を引用しているが引用先の項とは請求対象が異なる項)の項番を記載する、クレームツリーにおける行に、その請求対象起点項における請求対象を表す語句を付記する、或いは、請求対象起点項の項番を記載する行の直上に一行を挿入してその挿入した一行にその請求対象起点項における請求対象を表す語句を記載する。 The claim tree generation unit 205c, for example, among the claims in the claim information, the claim target starting point (that is, the claim that does not quote other claims, or the claim destination that (a claim whose subject matter is different from that of the claim), a line in the claim tree that indicates the subject matter of the claim that originates the claim, or a line that describes the number of the claim that originates the subject matter of the claim. Insert a line immediately above and enter a phrase representing the claimed subject matter in the claim originating from the claimed subject matter in the inserted line.

クレームツリー生成部205cは、例えば、発明文書のクレームを表すクレーム情報におけるクレームの各項のうち、その項の直前行がコメント行である場合には、そのコメント行の内容を、クレームツリーにおけるその項の項番を記載する行に、付記する。また、クレームツリー生成部205cは、例えば、発明文書のクレームを表すクレーム情報におけるクレームの各項のうち、その項の直前行がコメント行でない場合において、その項の見出し(例えば隅付き括弧で挟まれた「請求項n」(nは自然数)の記載)と同一の行に、始め丸括弧と終わり丸括弧とで挟む等の所定の形式で、コメントが記載されているときには、そのコメントの内容を、クレームツリーにおけるその項の項番を記載する行に、付記する。クレームツリー生成部205cは、コメント行及びコメントを、例えば、設定情報取得部201により取得された設定情報におけるコメント特定用情報に基づいて特定し得る。 For example, if the line immediately preceding the item in each item of the claim in the claim information representing the claim of the invention document is a comment line, the claim tree generating unit 205c converts the content of the comment line into the corresponding item in the claim tree. Append to the line that describes the item number of the item. In addition, for example, when the line immediately preceding the item is not a comment line among the items of the item in the claim information representing the claim of the invention document, the claim tree generating unit 205c generates the header of the item (for example, a comment line between square brackets). If a comment is written on the same line as the "claim n" (where n is a natural number), in a predetermined format, such as between opening and closing parentheses, the contents of the comment to the line in the claim tree that lists the item number for that item. The claim tree generation unit 205c can identify the comment line and the comment based on the comment identification information in the setting information acquired by the setting information acquisition unit 201, for example.

クレームツリー生成部205cは、例えば、発明文書のクレームを表すクレーム情報におけるクレームの各項のうち、その項の直前行がコメント行でなく、その行の見出しと同一の行にコメントが記載されていない場合に、発明文書のクレームのその項に記載されて重要語句抽出部2051により抽出された1つ以上の重要語句が存在するときには、その1つ以上の各重要語句の少なくとも1つを、クレームツリーにおけるその項の項番を記載する行に、付記する。この場合の一例として、クレームツリー生成部205cは、その項に記載されて重要語句抽出部2051により抽出された重要語句のうち、クレームのその項に先行する他のいずれの項にも記載されていない重要語句を、優先的に選択して、クレームツリーにおけるその項の項番を記載する行に、付記してもよい。また、この場合にその項に記載されて重要語句抽出部2051により抽出された重要語句が複数存在するときにおける一例として、クレームツリー生成部205cは、その項に記載された複数の重要語句各々が表す要素間が構成上の包含関係を有するならば、重要語句間の関係を表すような記載(例えば、被包含側に係る重要語句を包含側に係る重要語句に後続した括弧内に記載)を、クレームツリーにおけるその項の項番を記載する行に、付記してもよい。 For example, the claim tree generation unit 205c determines whether, among the claims in the claim information representing the claims of the invention document, the line immediately preceding the claim is not a comment line, and the comment is written in the same line as the heading of the line. If there is one or more key phrases described in that section of the claim of the invention document and extracted by the key phrase extraction unit 2051, at least one of each of the one or more key phrases is included in the claim. Append to the line that describes the item number of that item in the tree. As an example of this case, the claim tree generation unit 205c determines whether any of the important phrases described in the paragraph and extracted by the important phrase extraction unit 2051 are written in any of the other paragraphs preceding that paragraph of the claim. A key phrase that does not have a claim may be preferentially selected and appended to the line in the claim tree that describes that section's section number. Further, in this case, as an example of when there are a plurality of important phrases described in the section and extracted by the important phrase extraction unit 2051, the claim tree generation unit 205c determines that each of the plurality of important phrases described in the section is If the represented elements have a compositional inclusion relationship, write a description that expresses the relationship between key phrases (for example, write key phrases related to the included side in parentheses following key phrases related to the containing side) , may be added to the line that lists the item number of that item in the claim tree.

[3-1-5-9-2.修正版クレームツリーの生成]
クレームツリー生成部205cは、修正版クレームツリー生成処理を、クレーム引用関係検出部2057が保持する修正版クレーム引用関係情報を参照して、修正版クレーム情報におけるクレーム各項の引用関係を表現した修正版クレームツリーを生成することにより実現する。なお、クレームツリー生成部205cは、修正版クレーム情報が複数のクレームセット各々におけるクレーム各項の引用関係を示す場合には、修正版クレームツリー生成処理を、修正版クレーム情報のクレームセット毎に、そのクレームセットにおけるクレーム各項の引用関係を表現した修正版クレームツリーを生成することにより、実現する。
[3-1-5-9-2. Generate Modified Claim Tree]
The claim tree generation unit 205c refers to the modified claim citation relationship information held by the claim citation relationship detection unit 2057, and performs the modified claim tree generation process by referring to the modified claim citation relationship information to generate a modification that expresses the citation relationship of each item of the claims in the modified claim information. This is achieved by generating a version claim tree. When the modified claim information indicates the citation relationship of each claim item in each of a plurality of claim sets, the claim tree generation unit 205c performs the modified claim tree generation process for each claim set of the modified claim information as follows: This is achieved by generating a modified claim tree that expresses the citation relationship of each claim clause in the claim set.

クレームツリー生成部205cにおける修正版クレーム情報のクレームの各項の引用関係を示す修正版クレームツリーの生成の方法は、上述したクレーム情報のクレームの各項の引用関係を示すクレームツリーの生成の方法と同様である。 The method of generating a modified claim tree indicating the citation relationship of each item of the claims in the modified claim information in the claim tree generation unit 205c is the above-described method of generating a claim tree indicating the citation relationship of each item of the claims of the claim information. is similar to

[3-1-5-9-3.構成クレームツリー及び修正版構成クレームツリーの生成]
クレームツリー生成部205cは、発明文書取得部2021により取得された発明文書にクレームが含まれる場合において、発明文書分析システム20が出力部208により出力する特許出願関連情報に含まれるクレーム情報に係るクレームツリー、及び、修正版クレーム情報に係る修正版クレームツリーと看做すものとして、或いは、特許出願関連情報に更に追加するものとして、クレーム情報に係る構成クレームツリー、及び、修正版クレーム情報に係る修正版構成クレームツリーを生成することとしてもよい。
[3-1-5-9-3. Generating Configuration Claim Trees and Modified Configuration Claim Trees]
When the invention document acquired by the invention document acquisition unit 2021 includes a claim, the claim tree generation unit 205c generates a claim related to the claim information included in the patent application related information output by the output unit 208 of the invention document analysis system 20. Tree and modified claim tree for modified claim information, or as a further addition to patent application related information, a constituent claim tree for claim information and modified claim information A modified configuration claim tree may be generated.

クレームツリー生成部205cは、例えば、クレーム引用関係検出部2057が保持するクレーム引用関係情報を参照して、クレーム情報におけるクレーム各項の引用関係を表現した構成クレームツリーを生成する。 The claim tree generating unit 205c, for example, refers to the claim citation relation information held by the claim citation relation detection unit 2057, and generates a constituent claim tree representing the citation relation of each item of the claim in the claim information.

クレームツリー生成部205cは、クレーム情報におけるクレームの各項について、項番が小さい順に、行を改めて、その項が、どの項番の項を引用しているかを示す情報を、引用関係の表現用の記号(例えば「└」)、項番等によって表記し、更にその項に記載されて重要語句抽出部2051により抽出された1つ以上の重要語句が存在するときには、その各重要語句を、構成クレームツリーにおけるその項の項番を記載する行に、付記することで、構成クレームツリーを生成する。この場合に、その項に記載されて重要語句抽出部2051により抽出された重要語句が複数存在するときには、クレームツリー生成部205cは、その項に記載された複数の重要語句各々が表す要素間が構成上の包含関係を有するならば、重要語句間の関係を表すような記載(例えば、被包含側に係る重要語句を包含側に係る重要語句に後続した括弧内に記載)を、構成クレームツリーにおけるその項の項番を記載する行に、付記する。 The claim tree generation unit 205c rearranges the lines in ascending order of the item number for each item of the claim in the claim information, and generates information indicating which item number the item is citing as an expression for the citation relationship. symbol (for example, "└"), item number, etc., and when there are one or more key words written in the item and extracted by the key word extracting unit 2051, each key word is composed A configuration claim tree is generated by appending to the line that describes the item number of that item in the claim tree. In this case, when there are a plurality of important phrases described in the section and extracted by the important phrase extraction unit 2051, the claim tree generation unit 205c determines that the elements represented by the plurality of important phrases described in the section are separated from each other. If there is a compositional inclusion relationship, a description that expresses the relationship between key terms (for example, a key term related to the included side is described in parentheses following the key term related to the containing side) should be included in the constituent claim tree. Add a note to the line that describes the item number of that item in .

クレームツリー生成部205cは、例えば、クレーム引用関係検出部2057が保持する修正版クレーム引用関係情報を参照して、修正版クレーム情報におけるクレーム各項の引用関係を表現した修正版構成クレームツリーを生成する。 The claim tree generating unit 205c, for example, refers to the modified claim citation relationship information held by the claim citation relationship detection unit 2057, and generates a modified configuration claim tree that expresses the citation relationship of each item in the modified claim information. do.

クレームツリー生成部205cは、修正版クレーム情報におけるクレームの各項について、項番が小さい順に、行を改めて、その項が、どの項番の項を引用しているかを示す情報を、引用関係の表現用の記号、項番等によって表記し、更にその項に記載されて重要語句抽出部2051により抽出された1つ以上の重要語句が存在するときには、その各重要語句を、修正版構成クレームツリーにおけるその項の項番を記載する行に、付記することで、修正版構成クレームツリーを生成する。この場合に、その項に記載されて重要語句抽出部2051により抽出された重要語句が複数存在するときには、クレームツリー生成部205cは、その項に記載された複数の重要語句各々が表す要素間が構成上の包含関係を有するならば、重要語句間の関係を表すような記載(例えば、被包含側に係る重要語句を包含側に係る重要語句に後続した括弧内に記載)を、修正版構成クレームツリーにおけるその項の項番を記載する行に、付記する。 The claim tree generating unit 205c rearranges the lines in ascending order of the item number for each item of the claims in the modified version of the claim information, and generates information indicating which item number the item is citing. If there is one or more important phrases written in the section and extracted by the important phrase extraction unit 2051, each of the important phrases is added to the modified configuration claim tree. By adding a note to the line that describes the item number of that item in , a modified configuration claim tree is generated. In this case, when there are a plurality of important phrases described in the section and extracted by the important phrase extraction unit 2051, the claim tree generation unit 205c determines that the elements represented by the plurality of important phrases described in the section are separated from each other. If there is a compositional inclusion relationship, a description that expresses the relationship between important phrases (for example, a key phrase related to the included side is described in parentheses following the important phrase related to the containing side) is added to the modified configuration Append to the line that describes the item number of that item in the claim tree.

[3-1-5-9-4.表示用文書における各種クレームツリー部分の生成]
発明文書分析システム20において出力部208が、クレームツリー、修正版クレームツリー、構成クレームツリー、及び、修正版構成クレームツリーといった各種クレームツリーの少なくとも1つを含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、クレームツリー生成部205cは、表示用文書としての特許出願関連情報に含まれる各種クレームツリーを生成する。
[3-1-5-9-4. Generating Various Claim Tree Parts in Documents for Display]
In the invention document analysis system 20, the output unit 208 outputs patent application-related information including at least one of various claim trees such as a claim tree, a modified claim tree, a configuration claim tree, and a modified configuration claim tree to a display document ( For example, when outputting as an HTML document), the claim tree generation unit 205c generates various claim trees included in the patent application related information as a document for display.

クレームツリー生成部205cが生成する、表示用文書としての特許出願関連情報の各種クレームツリー部分は、例えば、各種クレームツリー(例えば構成クレームツリー)における各行の内容に対応する、1つ以上の表示要素を含み、その各行内に、項番があればその各項番に対応する1つ以上の表示要素を含み、引用関係の表現用の記号があればその各記号に対応する1つ以上の表示要素を含み、重要語句抽出部2051により抽出された1つ以上の重要語句があればその各重要語句に対応する1つ以上の表示要素を含む。具体例としては、クレームツリー生成部205cは、HTML文書において各種クレームツリー(例えば構成クレームツリー)を<article>タグと</article>タグとで挟んで記述する場合においてその<article>タグ配下に、その各種クレームツリー(例えば構成クレームツリー)における各行について、その行に対応する表示要素を、<span>タグと</span>タグとでその行の内容を挟むことで記述し、その1つの行に対応する表示要素の<span>タグ配下に、その行内の項番、引用関係の表現用の各記号、或いは、各重要語句について、対応する表示要素を、<span>タグと</span>タグとでその項番、引用関係の表現用の記号、或いは、重要語句を挟むことで記述する。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。各種クレームツリーの各々の部分に含まれる各行に対応する各表示要素は、例えば、その対応する行の内容を表示可能にする。 Various claim tree portions of the patent application related information as a display document generated by the claim tree generating unit 205c are, for example, one or more display elements corresponding to the contents of each line in various claim trees (e.g., constituent claim trees). , and in each line, if there is a section number, one or more display elements corresponding to each section number, and if there are symbols for expressing citation relationships, one or more displays corresponding to each symbol If there are one or more important phrases extracted by the important phrase extraction unit 2051, one or more display elements corresponding to each of the important phrases are included. As a specific example, the claim tree generation unit 205c creates a , for each line in its various claim trees (for example, constituent claim trees), the display element corresponding to that line is described by sandwiching the content of that line between <span> and </span> tags, and one Under the <span> tag of the display element corresponding to the line, the display element corresponding to the item number in the line, each symbol for expressing the citation relationship, or each important phrase is added with the <span> tag and </span. It is described by inserting the item number, a symbol for expressing the citation relationship, or an important phrase between the > tag. For example, a browser may interpret the presentation document to display each presentation element. Each display element corresponding to each line included in each portion of the various claim trees, for example, enables the contents of that corresponding line to be displayed.

クレームツリー生成部205cは、表示用文書における各種クレームツリー部分に含まれる項番、引用関係の表現用の記号、或いは、重要語句に対応する表示要素に、例えば、その項番、引用関係の表現用の記号、或いは、重要語句についての、表示態様の制御(例えば強調表示、色付き表示、表示遷移等)をするための表示制御情報を付加する。表示用文書における各種クレームツリー部分の重要語句に対応する表示要素に付加される表示制御情報については、例えば、表示用文書におけるクレーム情報部分の重要語句についての表示要素に付加された表示制御情報と同様である。 The claim tree generating unit 205c adds, for example, the item number and the expression of the citation relationship to the display elements corresponding to the item numbers, the symbols for expressing the citation relationships, or the key phrases included in the various claim tree portions in the document for display. Display control information for controlling the display mode (for example, highlighted display, colored display, display transition, etc.) is added for the symbol for , or for important phrases. The display control information added to the display elements corresponding to the important words and phrases of the various claim tree parts in the document for display is, for example, the display control information added to the display elements for the important words and phrases of the claim information part of the document for display. It is the same.

クレームツリー生成部205cは、例えば、表示用文書におけるクレームツリー部分、或いは、構成クレームツリー部分の項番についての表示要素に、その表示要素の操作に応じて、表示用文書におけるクレーム情報のその項番の項の記載部分を表示するためのGUIとしての機能をその表示要素に持たせるための表示制御情報を付加する。クレームツリー生成部205cは、例えば、表示用文書における修正版クレームツリー部分、或いは、修正版構成クレームツリー部分の項番についての表示要素に、その表示要素の操作に応じて、表示用文書における修正版クレーム情報のその項番の項の記載部分を表示するためのGUIとしての機能をその表示要素に持たせるための表示制御情報を付加する。 For example, the claim tree generation unit 205c generates a display element for the item number of the claim tree portion or the component claim tree portion in the document for display, in accordance with the operation of the display element. Display control information is added so that the display element has a function as a GUI for displaying the description part of the numbered item. For example, the claim tree generation unit 205c creates a modified claim tree portion in the display document or a display element for the item number of the modified claim tree portion in the display document according to the operation of the display element. Display control information is added so that the display element has a function as a GUI for displaying the description portion of the item number of the version claim information.

クレームツリー生成部205cは、例えば、表示用文書におけるクレームツリー部分、或いは、構成クレームツリー部分の、引用関係の表現用の記号(例えば「└」)についての表示要素に、その表示要素の操作(例えばマウスクリック操作)に応じて、その記号で表されていた引用関係を切断する引用関係切断処理を実行するためのGUIとしての機能をその表示要素に持たせるための表示制御情報を、付加する。その引用関係の表現用の記号についての表示要素に対する操作に応じて実行される引用関係切断処理は、例えば、その引用関係の切断のために表示用文書における修正版クレーム情報の内容を更新する処理と、その更新後の修正版クレーム情報の内容と整合するように修正版クレームツリー部分、或いは、修正版構成クレームツリー部分の内容を更新する処理と、その表示要素としての引用関係の表現用の記号を、引用関係が切断されたことを表現するために予め定められた記号(例えば「×」)に変更して、その表示要素を再表示する処理とを含む。この引用関係の切断のために表示用文書における修正版クレーム情報の内容を更新する処理では、例えば、修正版クレーム情報の該当の項における引用先の項番を含む引用記載から引用先の項番に関する記載を削除した場合に、修正版クレーム情報が表すクレームのいずれかの項において、その項における被参照語句(つまり参照文字列に後続する語句)の記載が、その項のその記載に先行する部分又はその項の引用先の項又は引用の連鎖先の項に記載されていないという不適切な状態が生じないときに限って、その引用先の項番に関する記載の削除を実行し、そのような不適切な状態が生じるのであれば、その旨を表示して引用関係切断処理の実行を抑止して、表示用文書としての特許出願関連情報を、引用関係切断処理の実行前の状態に戻す。この引用関係切断処理において、引用先の項番(例えば2)を含む引用記載(例えば「請求項1~3のいずれか一項」)から引用先の項番に関する記載を削除した場合に上述の不適切な状態が生じるか否かは、クレーム引用関係検出部2057が保持するクレーム引用関係情報を参照して警告情報生成部2059が行う被参照語句の検出処理(つまり、クレームの項についての、参照文字列に後続して記載されている語句と同一の被参照語句が、その項のその参照文字列に先行した部分又は、その項が引用した項内に記載されている必要があるという条件を、満たしていない参照文字列に係る記載が含まれていることを検出する処理)と、同様の方法で、判別可能である。 For example, the claim tree generation unit 205c applies an operation ( (for example, a mouse click operation), the display control information is added so that the display element has a function as a GUI for executing a citation relationship disconnection process that disconnects the citation relationship represented by the symbol. . The citation relation disconnection process executed in response to the operation on the display element for the symbol for expressing the citation relation is, for example, the process of updating the content of the modified claim information in the display document for the citation relation disconnection. and updating the content of the modified claim tree portion or the modified configuration claim tree portion so as to match the content of the modified claim information after the update, and the processing for expressing the citation relationship as the display element. a process of changing the symbol to a predetermined symbol (for example, "x") to express that the citation relationship has been cut, and redisplaying the display element. In the process of updating the content of the amended claim information in the display document for severing the citation relationship, for example, from the citation including the citing paragraph number in the corresponding section of the amended claim information, the citing paragraph number In any section of the claim represented by the amended claim information, if the statement of Deletion of the reference to the referenced paragraph number is carried out only when it does not create an inappropriate situation of not being described in the paragraph to which the section or the paragraph references or the paragraph to which the reference is chained. If an inappropriate state occurs, a message to that effect is displayed to suppress the execution of the citation relationship severing process, and the patent application-related information as a document for display is returned to the state before the citation relationship severance process was executed. . In this citation relationship disconnection process, if the description related to the cited item number is deleted from the cited description (eg, "any one of claims 1 to 3") containing the cited item number (eg, 2), the above-mentioned Whether or not an inappropriate state occurs depends on the reference word/phrase detection processing performed by the warning information generation unit 2059 by referring to the claim citation relationship information held by the claim citation relationship detection unit 2057 (that is, The condition that the same referenced term as the term following the reference string must be stated in the part of the section preceding the reference string or in the section to which the section is cited. can be determined by the same method as the processing for detecting that a description related to a reference character string that does not satisfy is included).

図32は、ブラウザに表示された表示用文書としての特許出願関連情報における構成クレームツリーの一例を示す。また、図33は、ブラウザに表示された特許出願関連情報の構成クレームツリーにおける引用関係の表現用の記号の表示要素に対するマウスクリック操作に応じてその表示要素が、引用関係が切断されたことを表現するものに、変化した例を示す。図33の例では、図32に示した引用関係の表現用の2つの記号「└」を順次、マウスクリック操作をした後の状態を示し、図32における引用関係の表現用の2つの記号「└」が、図33では引用関係が切断したことを表現する記号「×」に変化している。図32に例示する構成クレームツリーでは、クレームの第4項が、第1項~第3項の各々を引用していることを示していたが、図33に例示する2回のマウスクリック操作後の構成クレームツリーでは、クレームの第4項が、第1項のみを引用していることを示している。図33に例示する状態では、マウスクリック操作に対応した引用関係切断処理により、クレームの第4項は、第2項及び第3項を引用しないように修正されて修正版クレーム情報が更新されていることになる。 FIG. 32 shows an example of a configuration claim tree in patent application related information as a display document displayed on a browser. In addition, FIG. 33 shows that, in response to a mouse click operation on display elements of symbols for expressing citation relations in the claim tree constituting the patent application-related information displayed on the browser, the display elements indicate that the citation relations have been cut. Show a modified example in what you represent. The example of FIG. 33 shows the state after the two symbols "└" for expressing the citation relation shown in FIG. └” is changed to a symbol “×” that expresses that the citation relationship has been cut in FIG. The configuration claim tree illustrated in FIG. 32 indicated that the fourth term of the claim cited each of the first to third terms, but after two mouse click operations illustrated in FIG. constituent claim tree shows that claim 4 refers only to claim 1. In the state exemplified in FIG. 33, by the citation relation disconnection processing corresponding to the mouse click operation, the fourth term of the claim is corrected so as not to cite the second and third terms, and the revised claim information is updated. There will be

[3-1-5-10.分類部]
分類部2053は、実施形態1で示した分類部1053を一部変形したものであり、ここで特に示さない点については、分類部1053と同様である。
[3-1-5-10. Classification Department]
The classification unit 2053 is a partial modification of the classification unit 1053 shown in the first embodiment, and is the same as the classification unit 1053 except for points not specifically shown here.

分類部2053は、発明文書取得部2021により取得された複数の発明文書各々についてグループ分類を行う。 The classification unit 2053 performs group classification for each of the plurality of invention documents acquired by the invention document acquisition unit 2021 .

分類部2053は、例えば、発明文書取得部2021により取得された複数の発明文書各々について、重要語句抽出部2051により抽出された複数の重要語句である重要語句群を用いて、その各々抽出された重要語句群間の相関性に基づいて、その複数の発明文書各々が複数のグループのうちいずれに属するかを特定するためのグループ分類を行う。分類部2053は、複数の発明文書各々から抽出された重要語句群の各重要語句について、その重要語句に対応して重要度決定部2055により決定された重要度の高さに対応した重み付けを行った上で、重要語句群間の相関性についての算定を行い得る。分類部2053は、例えば、複数の発明文書各々から抽出された重要語句群の各重要語句について、その重要語句に対応して重要度決定部2055により決定された重要度が予め定められた所定値より低いところの重要語句は無視して、重要語句群間の相関性についての算定を行うこととしてもよい。分類部2053は、重要語句群間の相関性を評価するために、両重要語句群に共通する同一の重要語句の数を計数するアルゴリズム、類義語辞書を利用して両重要語句群における同一又は類似する重要語句の数を計数するアルゴリズム、重要語句群各々に対して、ある程度十分な数(例えば数千、数万等)の重要語句として用いられると想定される文字列各々を要素として、例えばその要素の文字列が重要語句として存在する場合にその重要語句の重要度に対応して定めた0より大きく1以下の要素値と、重要語句として存在しない場合に0という要素値とを定めたベクトルデータを定義して、そのベクトルデータ間の相関係数を算定する各種アルゴリズム等の、如何なるアルゴリズムを用いてもよい。また、分類部2053は、各発明文書の重要語句群について、クラスタリング(clustering)手法に係る各種アルゴリズムのいずれかを利用して、グループ分類を行うこととしてもよい。分類部2053は、ある程度十分な数(例えば数千、数万等)の重要語句として用いられると想定される文字列各々として、例えば、ある程度十分な数(例えば数十、数百等)の発明文書を発明文書分析システム20の発明文書取得部2021で取得させて、各発明文書から重要語句抽出部2051で抽出された重要語句を重複なく統合した、重要語句の集合の各要素を、利用することができる。 For example, for each of the plurality of invention documents acquired by the invention document acquisition unit 2021, the classification unit 2053 uses the key phrase group, which is a plurality of key phrases extracted by the key phrase extraction unit 2051. Based on the correlation between key phrase groups, group classification is performed to specify which of the plurality of groups each of the plurality of invention documents belongs to. The classification unit 2053 weights each key phrase of the key phrase group extracted from each of the plurality of invention documents according to the degree of importance determined by the importance determination unit 2055 corresponding to the key phrase. Then, a calculation can be made of the correlation between key phrase groups. The classification unit 2053 classifies, for example, each key phrase of the key phrase group extracted from each of the plurality of invention documents into a predetermined value for the importance determined by the importance determination unit 2055 corresponding to the key phrase. Lower key phrases may be ignored and the correlation between key phrase groups may be calculated. In order to evaluate the correlation between the important phrase groups, the classification unit 2053 uses an algorithm for counting the number of the same important phrases common to both important phrase groups and a synonym dictionary to identify the same or similar in both important phrase groups. Algorithm for counting the number of important phrases, each of the character strings assumed to be used as important phrases in a sufficient number (for example, thousands, tens of thousands, etc.) for each of the important phrase groups A vector that defines an element value greater than 0 and 1 or less that corresponds to the importance of the key phrase when the element character string exists as a key phrase, and an element value of 0 if it does not exist as the key phrase. Any algorithm may be used, such as algorithms that define data and calculate correlation coefficients between the vector data. Further, the classification unit 2053 may classify the important phrases of each invention document into groups using any one of various algorithms related to clustering techniques. The classification unit 2053 classifies, for example, a somewhat sufficient number (for example, several tens, hundreds, etc.) of inventions as character strings that are assumed to be used as key phrases in a somewhat sufficient number (for example, several thousands, tens of thousands, etc.). Documents are acquired by the invention document acquisition unit 2021 of the invention document analysis system 20, and the key phrases extracted from each invention document by the key phrase extraction unit 2051 are integrated without duplication, and each element of the set of key phrases is used. be able to.

分類部2053は、各発明文書のグループ分類の1つとして、各発明文書が複数の技術分野のうちいずれに属するかを特定するための技術分野の分類を行う技術分野特定部20531を含む。分類部2053は、グループの種類の1つとしての技術分野に限らず、各種のグループ分類を行い得る。例えば、分類部2053は、ユーザの指定等に応じて、発明文書を、発明者の所属部門別のグループに分類することとしてもよい。グループの分類の単位、方法等は、発明文書分析システム20の運用単位(例えば発明文書、対訳辞書情報、或いは、発明文書分析システム20が出力する情報を、相互に伝達し合うユーザ各々が利用する各発明文書分析システム20)において統一されていることが有用となり得る。 The classification unit 2053 includes a technical field identification unit 20531 that classifies the technical field for identifying to which of a plurality of technical fields each invention document belongs as one of the group classifications of each invention document. The classification unit 2053 can perform various group classifications, not limited to technical fields as one type of group. For example, the classification unit 2053 may classify the invention documents into groups according to the departments to which the inventors belong, according to the user's designation or the like. The group classification unit, method, etc. are used by each user who mutually communicates the invention document analysis system 20 operation unit (for example, invention document, bilingual dictionary information, or information output by the invention document analysis system 20). It can be useful to be unified in each invention document analysis system 20).

技術分野特定部20531は、実施形態1で示した技術分野特定部10531を一部変形したものであり、ここで特に示さない点については技術分野特定部10531と同様である。 The technical field specifying unit 20531 is a partial modification of the technical field specifying unit 10531 shown in the first embodiment, and is the same as the technical field specifying unit 10531 in terms of points not particularly shown here.

技術分野特定部20531は、複数の技術分野各々について、その技術分野に関することが知られている1つ以上の発明文書各々を発明文書取得部2021で過去に取得して重要語句抽出部2051により重要語句群を過去に抽出した結果を利用することで、複数の技術分野のうち、発明文書取得部2021で取得された、技術分野が特定されていない発明文書から、重要語句抽出部2051により抽出された重要語句群との相関性が予め定められた程度以上であるところのいずれかの技術分野を、その技術分野が特定されていない発明文書に対応する技術分野として特定する。技術分野特定部20531は、複数の発明文書各々から抽出された重要語句群の各重要語句について、その重要語句に対応して重要度決定部2055により決定された重要度の高さに対応した重み付けを行った上で、重要語句群間の相関性についての算定を行い得る。これにより、相対的に高い重み付けが行われた重要語句間について算定された相関性の要素は相対的に高く評価され、相対的に低い重み付けが行われた重要語句間について算定された相関性の要素は相対的に低く評価される。従って、例えば、発明文書Aにおける重要度が比較的高い重要語句群と、発明文書Bにおける重要度が比較的高い重要語句群とが、概ね同一であった場合における両発明文書の相関性は、比較的高いものと評価され、例えば、発明文書Aにおける重要度が比較的高い重要語句群と、発明文書Bにおける重要度が比較的高い重要語句群とが、全く相違し、かつ、発明文書Aにおける重要度が比較的低い重要語句群と、発明文書Bにおける重要度が比較的低い重要語句群とが、概ね同一であった場合における両発明文書の相関性は比較的低いものと評価される。技術分野特定部20531は、例えば、複数の発明文書各々から抽出された重要語句群の各重要語句について、その重要語句に対応して重要度決定部2055により決定された重要度が予め定められた所定値より低いところの重要語句は無視して、重要語句群間の相関性についての算定を行うこととしてもよい。技術分野は、例えばIPCで表現される。技術分野特定部20531は、技術分野として、IPCのどの階層までの分類を用いてもよく、例えばセクションだけ、或いは、セクション及びクラスだけ等を用いて1つの技術分野として取り扱うこととしてもよい。また、技術分野特定部20531は、技術分野を、IPCのセクション、クラス、サブクラス、メイングループ及びサブグループの全てを用いて表現することとしてもよい。例えば、技術分野をIPCのセクションだけで区別することとした場合に、技術分野特定部20531は、特許公報等を用いて、IPCのセクション毎にそのセクションに属する複数の発明文書を取得し、その各発明文書を発明文書分析システム20に取得させて重要語句抽出部2051により抽出された、セクションに対応した重要語句群を得ることができる。例えば、この過去に得られたセクション毎の重要語句群を利用することで、技術分野特定部20531は、発明文書取得部2021で取得された、技術分野としてのセクションが特定されていない発明文書から重要語句抽出部2051により抽出された重要語句群との相関性が予め定められた程度以上であると評価されたところのセクションを、その発明文書の技術分野として特定することができる。 For each of a plurality of technical fields, the technical field identification unit 20531 acquires one or more invention documents known to be related to the technical field by the invention document acquisition unit 2021 in the past, and extracts important words by the important phrase extraction unit 2051 By using the result of extracting the word group in the past, the important word/phrase extracting unit 2051 extracts from the invention document for which the technical field is not specified and which is acquired by the invention document acquiring unit 2021 among a plurality of technical fields. Any technical field whose correlation with the group of important words and phrases obtained is greater than or equal to a predetermined degree is specified as a technical field corresponding to the invention document whose technical field is not specified. The technical field identification unit 20531 weights each key phrase of the key phrase group extracted from each of the plurality of invention documents according to the degree of importance determined by the importance determination unit 2055 corresponding to the key phrase. , the correlation between key phrase groups can be calculated. As a result, elements of correlation calculated between key phrases with relatively high weighting are evaluated relatively high, and correlation factors calculated between key phrases with relatively low weighting are evaluated relatively high. Elements are rated relatively low. Therefore, for example, when a group of key phrases with a relatively high degree of importance in invention document A and a group of key phrases with a relatively high degree of importance in invention document B are substantially the same, the correlation between the two invention documents is For example, the group of key words and phrases evaluated as relatively high and having relatively high importance in invention document A and the group of key words and phrases having relatively high importance in invention document B are completely different, and invention document A If the group of key phrases with relatively low importance in the invention document B and the group of key phrases with relatively low importance in invention document B are generally the same, the correlation between the two invention documents is evaluated as relatively low. . For example, the technical field specifying unit 20531 determines in advance the importance determined by the importance determination unit 2055 corresponding to each key phrase of the key phrase group extracted from each of the plurality of invention documents. Important words below a predetermined value may be ignored, and the correlation between important word groups may be calculated. A technical field is represented by IPC, for example. The technical field specifying unit 20531 may use classification up to any level of the IPC as the technical field, and may handle it as one technical field using, for example, only sections or only sections and classes. Also, the technical field identification unit 20531 may express the technical field using all of the IPC sections, classes, subclasses, main groups and subgroups. For example, if the technical field is to be distinguished only by the section of the IPC, the technical field identification unit 20531 acquires a plurality of invention documents belonging to each section of the IPC using patent gazettes, etc., and Each invention document is acquired by the invention document analysis system 20, and the important phrase group corresponding to the section extracted by the important phrase extraction unit 2051 can be obtained. For example, by using the group of key phrases for each section obtained in the past, the technical field specifying unit 20531 extracts from the invention documents for which the section as the technical field is not specified, which is acquired by the invention document acquiring unit 2021. A section that is evaluated to have a correlation with a group of key phrases extracted by the key phrase extraction unit 2051 that is equal to or greater than a predetermined level can be specified as the technical field of the invention document.

技術分野特定部20531は、例えば、技術分野特定用学習モデルを用いて予め定められた演算処理を行うことで、発明文書から抽出した重要語句群に基づいて、発明文書が属する技術分野を特定することとしてもよい。また、技術分野特定部20531は、例えば、複数の技術分野各々についての1つ又は複数の既存の専門用語辞書の項目群(つまり見出し語群)に相当するデータと、発明文書から抽出した重要語句群とを照合して、一致する語句の数を計数して評価することで、発明文書が属する技術分野を特定することとしてもよい。 The technical field identification unit 20531 identifies the technical field to which the invention document belongs based on the group of key words extracted from the invention document, for example, by performing predetermined arithmetic processing using the learning model for technical field identification. You can do it. In addition, the technical field identification unit 20531, for example, includes data corresponding to one or more existing technical term dictionary item groups (that is, headword groups) for each of a plurality of technical fields, and key words and phrases extracted from invention documents. The technical field to which the invention document belongs may be identified by comparing the groups and counting and evaluating the number of matching words.

発明文書取得部2021で取得した発明文書に対応して技術分野特定部20531により特定された技術分野(例えばIPC)を示す情報である技術分野情報は、例えば、発明文書分析システム20が出力する特許出願関連情報に含まれる。 The technical field information, which is information indicating the technical field (for example, IPC) identified by the technical field identifying unit 20531 corresponding to the invention document obtained by the invention document obtaining unit 2021, is, for example, the patent Included in application related information.

また、分類部2053により発明文書が属すると特定されたグループ、又は、技術分野特定部20531により発明文書に対応して特定された技術分野は、例えば、翻訳部2054において、翻訳に利用するために、グループ毎又は技術分野毎の対訳辞書情報等の各種情報を、選択するために利用され得る。また、技術分野特定部20531による技術分野の分類を含む、分類部2053によるグループ分類は、機械学習部207においてグループ毎の翻訳用学習モデルを生成するために利用され得る。 In addition, the group identified by the classification unit 2053 to which the invention document belongs, or the technical field identified corresponding to the invention document by the technical field identification unit 20531, is used for translation by the translation unit 2054, for example. , bilingual dictionary information for each group or for each technical field. Also, the group classification by the classification unit 2053, including the technical field classification by the technical field identification unit 20531, can be used by the machine learning unit 207 to generate a translation learning model for each group.

[3-1-5-11.翻訳部]
翻訳部2054は、クレーム情報生成部205aにより生成されたクレーム情報及び修正版クレーム情報、並びに、明細書情報生成部205bにより生成された明細書情報及び修正版明細書情報を、入力として、翻訳用学習モデルを利用した、翻訳のために予め定められた演算処理により、そのクレーム情報及び修正版クレーム情報に表されるクレームの各項の内容、及び、明細書情報及び修正版明細書情報に表される明細書の内容についての機械翻訳を実行する。発明文書取得部2021が取得した発明文書の内容次第で、クレーム情報、修正版クレーム情報、明細書情報、及び、修正版明細書情報のうちのいずれかは生成されない場合がある。このため、翻訳部2054は、クレーム情報、修正版クレーム情報、明細書情報、及び、修正版明細書情報のうち、生成されているものに限って、入力として、機械翻訳の実行を行う。
[3-1-5-11. Translation Department]
The translation unit 2054 receives the complaint information and the modified version of the complaint information generated by the complaint information generating unit 205a and the description information and the modified version of the description information generated by the description information generating unit 205b as input, The content of each claim represented in the claim information and the modified version of the claim information, and the description information and the revised version of the description information, are calculated by calculation processing predetermined for translation using the learning model. Perform machine translation of the content of the specification to be submitted. Depending on the content of the invention document acquired by the invention document acquisition unit 2021, any one of the claim information, the modified claim information, the specification information, and the revised specification information may not be generated. For this reason, the translation unit 2054 executes machine translation by using only the generated information among the claim information, the modified claim information, the specification information, and the modified specification information as input.

翻訳用学習モデルは、発明文書と、その発明文書に基づいて翻訳者等によって翻訳された結果としての翻訳結果文書との複数組を教師データとした機械学習により生成された、機械翻訳のための学習モデルである。ここでは、一例として、翻訳用学習モデルは、日本語の発明文書を英語の文書に機械翻訳するために用いられる学習モデルであることとして説明するが、日本語の発明文書を、英語の代わりに中国語その他の言語の文書に、機械翻訳するために用いられる学習モデルであってもよい。 The learning model for translation is a model for machine translation that is generated by machine learning using multiple pairs of invention documents and translation result documents as the result of translation by translators etc. based on the invention documents as training data. Learning model. Here, as an example, the learning model for translation is explained as a learning model used for machine-translating a Japanese invention document into an English document. It may be a learning model used for machine translation into Chinese or other language documents.

複数のグループ毎或いは技術分野毎に、翻訳用学習モデルが存在する場合において、翻訳部2054は、例えば、発明文書取得部2021で取得された発明文書が属するグループ或いは技術分野を分類部2053或いは技術分野特定部20531により特定し、その発明文書が属するグループ或いは技術分野に対応する翻訳用学習モデルを選択的に利用することで、その発明文書に基づいて生成された、クレーム情報及び修正版クレーム情報に表されるクレーム、及び、明細書情報及び修正版明細書情報に表される明細書の全部又は一部の機械翻訳を実行することとしてもよい。翻訳用学習モデルが重要語句翻訳用学習モデルを内包しているような場合における機械翻訳は、文章の翻訳に際して文章中の各語句を重要語句翻訳用学習モデルを用いた演算処理により対応する翻訳語句に置き換えて、その結果に対して翻訳用学習モデルを用いた演算処理(例えば翻訳語句に対する単数形と複数形とのいずれかの選択等といった翻訳対象言語の文法に従った演算を含む演算処理)を行うことにより、翻訳対象言語の文章を生成することで実現される。なお、あるグループ毎或いはある技術分野用の翻訳用学習モデルは、そのグループ或いはその技術分野用の重要語句翻訳用学習モデルを内包していてもよい。 When there is a learning model for translation for each of a plurality of groups or technical fields, the translation unit 2054, for example, classifies the group or technical field to which the invention document acquired by the invention document acquisition unit 2021 belongs to the classification unit 2053 or the technical field. Claim information and modified claim information generated based on the invention document by selectively using the learning model for translation corresponding to the group or technical field to which the invention document belongs, specified by the field specifying unit 20531 It is also possible to perform machine translation of all or part of the claims represented in , and all or part of the specification represented in the specification information and the modified specification information. Machine translation in the case where the learning model for translation includes a learning model for translation of important phrases is to translate each word in the sentence by arithmetic processing using the learning model for translation of important phrases. , and arithmetic processing using the learning model for translation on the result (for example, arithmetic processing including arithmetic processing according to the grammar of the language to be translated, such as selecting either singular or plural for the translated phrase) This is realized by generating sentences in the language to be translated by performing A learning model for translating for each group or for a certain technical field may include a learning model for translating important phrases for that group or for that technical field.

翻訳部2054は、例えば、設定情報取得部201により取得された設定情報における翻訳補助情報の特定用情報に基づいて翻訳補助情報を取得して利用し得る。 The translation unit 2054 can acquire and use the translation assistance information based on the information for specifying the translation assistance information in the setting information acquired by the setting information acquisition unit 201, for example.

翻訳部2054は、例えば、発明文書取得部2021により取得された発明文書にある程度関連する他の発明文書に対応する翻訳補助情報を取得して、その翻訳補助情報を、発明文書取得部2021により取得された発明文書に係るクレーム情報、修正版クレーム情報、明細書情報、或いは、修正版明細書情報の機械翻訳に利用することとしてもよい。発明文書同士の関連の程度は、例えば、その各発明文書から重要語句抽出部2051により抽出された各重要語句を示す重要語句群情報に基づいて、重要語句群情報の表す重要語句群同士の相関性、重要語句群同士における同一の重要語句の割合の高さ、重要語句群から特定した発明文書が属する技術分野間の関連性等に基づいて、判定可能である。 For example, the translation unit 2054 acquires translation assistance information corresponding to other invention documents that are somewhat related to the invention document acquired by the invention document acquisition unit 2021, and acquires the translation assistance information by the invention document acquisition unit 2021. It may also be used for machine translation of claim information, modified version claim information, specification information, or modified version specification information related to an invention document that has been created. The degree of relationship between invention documents is determined, for example, based on the key phrase group information indicating each key phrase extracted from each invention document by the key phrase extraction unit 2051, and the correlation between the key phrase groups represented by the key phrase group information. The determination can be made on the basis of gender, the percentage of the same key phrases in the key phrase groups, the relevance between the technical fields to which the invention documents specified from the key phrase groups belong, and the like.

翻訳部2054は、例えば、実施形態1で示した発明文書分析システム10により過去に生成された翻訳補助情報、発明文書分析システム20により過去に生成された翻訳補助情報、或いは、これらの翻訳補助情報がシステムの運用形態に応じて収集して統合された結果としての翻訳補助情報のうちのいずれかを、取得して、取得した翻訳補助情報を、発明文書取得部2021により取得された発明文書に係るクレーム情報、修正版クレーム情報、明細書情報、或いは、修正版明細書情報の機械翻訳に利用することとしてもよい。翻訳部2054は、例えば、翻訳補助情報を、設定情報取得部201により取得された設定情報における翻訳補助情報の特定用情報に基づいて、取得し得る。 The translation unit 2054, for example, translates the translation assistance information generated in the past by the invention document analysis system 10 shown in the first embodiment, the translation assistance information generated in the past by the invention document analysis system 20, or these translation assistance information. Acquire any of the translation assistance information as a result of collecting and integrating according to the operation mode of the system, and apply the acquired translation assistance information to the invention document acquired by the invention document acquisition unit 2021 It may be used for machine translation of the claim information, modified claim information, specification information, or modified specification information. The translation unit 2054 can acquire the translation assistance information based on the identification information of the translation assistance information in the setting information acquired by the setting information acquisition unit 201, for example.

翻訳部2054は、重要語句についての翻訳用の重要語句翻訳用学習モデルを利用した、重要語句の翻訳のために予め定められた演算処理により、上述したクレーム情報及び修正版クレーム情報に表されるクレーム、及び、明細書情報及び修正版明細書情報に表される明細書の全部又は一部に含まれる重要語句(つまり重要語句抽出部2051により抽出された重要語句)の機械翻訳を実行することとしてもよい。この機械翻訳の結果により、重要語句についての対応翻訳語が決定され得る。また、翻訳部2054は、上述した翻訳補助情報を取得して、その翻訳補助情報を用いることで、或いは、重要語句設定辞書取得部203により取得された1つ以上の重要語句に対して対応翻訳語を対応付けた重要語句設定辞書を用いることで、クレーム情報及び修正版クレーム情報に表されるクレーム、及び、明細書情報及び修正版明細書情報に表される明細書の全部又は一部に含まれる重要語句についての対応翻訳語を決定することとしてもよい。翻訳部2054は、重要語句についての対応翻訳語を決定した場合に、決定した対応翻訳語を反映するように、分析部205が保持する重要語句管理情報を更新する。翻訳補助情報は、グループ或いは技術分野毎に分類されていてもよく、翻訳部2054は、発明文書取得部2021により取得された発明文書が属するグループ或いは技術分野に対応する翻訳補助情報を選択的に用いて、重要語句についての対応翻訳語の決定、機械翻訳等を実行することとしてもよい。 The translation unit 2054 is represented in the above-described complaint information and modified complaint information by arithmetic processing predetermined for translation of key phrases using an important phrase translation learning model for translation of key phrases. Execution of machine translation of claims and important phrases (that is, important phrases extracted by the important phrase extraction unit 2051) included in all or part of the specification represented in the specification information and the revised specification information may be Based on the result of this machine translation, a corresponding translated word for the key phrase can be determined. In addition, the translation unit 2054 acquires the above-described translation assistance information and uses the translation assistance information, or translates one or more important phrases acquired by the important phrase setting dictionary acquisition unit 203 into corresponding translations. By using a key phrase setting dictionary that associates words, all or part of the claims represented by the claim information and the modified version of the claim information, and the specification represented by the specification information and the modified version of the specification information It is also possible to determine a corresponding translation word for the included key words. When the translation unit 2054 determines the corresponding translation word for the important phrase, the translation unit 2054 updates the important phrase management information held by the analysis unit 205 so as to reflect the determined corresponding translation word. The translation assistance information may be classified by group or technical field, and the translation unit 2054 selectively selects the translation assistance information corresponding to the group or technical field to which the invention document acquired by the invention document acquisition unit 2021 belongs. may be used to determine corresponding translation words for key words, perform machine translation, and the like.

翻訳部2054は、例えば、クレームツリー生成部205cにより生成された構成クレームツリー及び修正版構成クレームツリーに、その各ツリーに含まれる重要語句を、重要語句翻訳用学習モデルを用いた演算処理による機械翻訳の結果に、或いは、翻訳補助情報に基づく対応翻訳語に、置換したものである置換後クレームツリーを、包含させることとしてもよい。 The translation unit 2054, for example, converts key phrases included in each tree into the constituent claim tree and the modified constituent claim tree generated by the claim tree generating unit 205c, and converts the key phrases included in each tree into machine processing using a learning model for key phrase translation. The post-replacement claim tree that has been replaced may be included in the translation result or in the corresponding translated word based on the translation assistance information.

翻訳部2054は、上述したクレーム情報及び修正版クレーム情報に表されるクレーム、及び、明細書情報及び修正版明細書情報に表される明細書の全部又は一部について、その全部又は一部に含まれる各重要語句を機械翻訳結果に置き換えたものを入力として、翻訳用学習モデルを用いた機械翻訳を実行することとしてもよい。 The translation unit 2054 translates all or part of the claims represented by the above-described claim information and modified version claim information, and all or part of the specification represented by the description information and revised version description information It is also possible to execute machine translation using a learning model for translation by using a result obtained by replacing each included key word with a machine translation result as an input.

また、翻訳部2054は、例えば、上述したクレーム情報及び修正版クレーム情報に表されるクレーム、及び、明細書情報及び修正版明細書情報に表される明細書の全部又は一部について、その全部又は一部に含まれる各重要語句を機械翻訳結果に置き換えたものを所定の機械翻訳プログラムに対する入力とし、この所定の機械翻訳プログラムにより出力される翻訳結果を取得することによって、機械翻訳を実行することとしてもよい。この所定の機械翻訳プログラムでは、各重要語句に対する機械翻訳結果を含むクレーム情報及び修正版クレーム情報に表されるクレーム、及び、明細書情報及び修正版明細書情報に表される明細書の全部又は一部に係る各文についての機械翻訳においては、各重要語句に対しる機械翻訳結果を、各文の内容等に応じて複数形又は単数形のうち適切な形式に変更して、機械翻訳を行うような翻訳アルゴリズムを用い得る。所定の機械翻訳プログラムは、例えば、既存の機械翻訳技術を用いて入力された日本語の文章に対する翻訳結果としての文章を出力するプログラムであり、発明文書分析システム20の内部に存在しても、外部に存在してもよい。例えば、所定の機械翻訳プログラムは、発明文書分析システム20を構成する端末装置とインターネット等のネットワークを通じて通信可能な、例えば翻訳用API等を提供しているサーバ装置(つまりコンピュータ)上で動作し、翻訳部2054は、所定の機械翻訳プログラムに入力する情報を暗号化してそのサーバ装置に送信し、そのサーバ装置では所定の機械翻訳プログラムの出力する情報を暗号化して端末装置に送信し、翻訳部2054は、所定の機械翻訳プログラムの出力する情報を受信して復号することとしてもよい。この暗号化及び復号では、如何なる暗号方式が用いられてもよい。 Further, the translation unit 2054, for example, translates all or part of the claims represented by the above-described claim information and modified version claim information, and all or part of the specification represented by the description information and revised version description information. Alternatively, machine translation is performed by replacing each key phrase contained in a part with a machine translation result as an input to a predetermined machine translation program and obtaining the translation result output by this predetermined machine translation program. You can do it. In this predetermined machine translation program, all or In the machine translation of each sentence related to a part, the machine translation result for each key phrase is changed to the appropriate plural form or singular form according to the content of each sentence, and machine translation is performed. Any translation algorithm can be used. The predetermined machine translation program is, for example, a program that outputs sentences as translation results for Japanese sentences input using existing machine translation technology. May exist outside. For example, a predetermined machine translation program operates on a server device (that is, a computer) that can communicate with a terminal device that constitutes the invention document analysis system 20 through a network such as the Internet and that provides, for example, an API for translation, etc. The translation unit 2054 encrypts information to be input to a predetermined machine translation program and transmits it to the server device, and the server device encrypts information output from the predetermined machine translation program and transmits it to the terminal device. 2054 may receive and decode information output by a predetermined machine translation program. Any encryption method may be used in this encryption and decryption.

翻訳部2054が機械翻訳に用いる翻訳用学習モデル及び重要語句翻訳用学習モデルは、如何なる方法で生成されたものであってもよい。翻訳部2054が機械翻訳に用いる翻訳用学習モデル及び重要語句翻訳用学習モデルは、例えば、過去に機械学習部207により生成されたもの、或いは、過去に他の発明文書分析システム20による出力部208から出力されたものであってもよい。 The learning model for translation and the learning model for important phrase translation that the translation unit 2054 uses for machine translation may be generated by any method. The learning model for translation and the learning model for important phrase translation used by the translation unit 2054 for machine translation are, for example, those generated by the machine learning unit 207 in the past, or the output unit 208 by another invention document analysis system 20 in the past. It may be output from

[3-1-5-11-1.各種翻訳情報の生成]
翻訳部2054による、クレーム情報に表されるクレームについての機械翻訳の結果は、例えば、クレーム翻訳情報として、発明文書分析システム20が出力する特許出願関連情報に含まれ得る。クレーム翻訳情報は、例えば、クレーム情報の各行を包含し、その包含したクレーム情報の行毎或いはクレームの項毎について、その行或いはクレームの項の内容の直後に、その行或いはクレームの項の内容に対応する機械翻訳の結果を表す一行或いはクレームの一項を挿入したものであってもよい。クレーム翻訳情報における、そのクレーム情報の行或いは項の内容に対応する機械翻訳の結果を表す一行或いは一項の内容は、一行又は複数行からなる翻訳行であり、その翻訳行は、そのクレーム情報の行或いは項の全体を翻訳先言語で表した完全翻訳行であってもよいし、そのクレーム情報の行或いは項に含まれる翻訳可能な重要語句だけを対応翻訳語で表して、翻訳可能な重要語句以外の部分は日本語の記載のまま残した、部分翻訳行であってもよい。なお、クレーム情報の重要語句を含む行或いは項の全体を翻訳先言語で表した完全翻訳行において、その重要語句に対応する翻訳先言語で表した語句は対応翻訳語と扱うことができる。従って、クレーム翻訳情報は、クレーム情報の内容に含まれる重要語句をその重要語句に対応する対応翻訳語に置換した結果を表す情報とも言える。翻訳部2054は、クレーム翻訳情報に完全翻訳行を含ませる場合には、更に、その完全翻訳行の直前又は直後に、その完全翻訳行の翻訳対象行に対応する部分翻訳行を挿入することとしてもよい。翻訳部2054は、クレーム翻訳情報に、クレーム情報の各行を混在させるか、混在させずに翻訳行(つまり完全翻訳行又は部分翻訳行)だけにするかを、設定情報取得部201が取得した設定情報における指定に基づいて決定して、その決定に従ってクレーム翻訳情報を生成することとしてもよい。なお、クレーム翻訳情報が、クレーム情報の各行を包含する場合において、発明文書分析システム20は、そのクレーム翻訳情報を、クレーム情報と取り扱うこととして、特許出願関連情報に含ませることとしてもよい。
[3-1-5-11-1. Generation of various translation information]
The results of machine translation of the claims represented in the claim information by the translation unit 2054 can be included in the patent application related information output by the invention document analysis system 20 as claim translation information, for example. The claim translation information includes, for example, each line of the claim information, and for each line of the included claim information or each claim term, the content of that line or claim term is immediately followed by the content of that line or claim term. It may be a line representing the result of machine translation corresponding to , or a paragraph of the claim. In the claim translation information, the content of one line or section representing the result of machine translation corresponding to the content of the line or section of the claim information is a translation line consisting of one or more lines, and the translation line is the claim information. It may be a complete translation line that expresses the entire line or paragraph of the claim information in the target language, or only the translatable important phrases contained in the line or paragraph of the claim information are expressed in the corresponding translation language and translatable The part other than the important words may be a partially translated line in which the Japanese description is left as it is. In a line containing a key word of the claim information or a complete translation line representing the entire paragraph in the target language, the word corresponding to the key word in the target language can be treated as a corresponding translated word. Therefore, the complaint translation information can also be said to be information representing the result of replacing key words and phrases included in the contents of the complaint information with corresponding translation words corresponding to the key words and phrases. When including a complete translation line in the claim translation information, the translation unit 2054 further inserts a partially translated line corresponding to the line to be translated of the complete translation line immediately before or after the complete translation line. good too. The translation unit 2054 sets the setting acquired by the setting information acquisition unit 201 as to whether each line of the complaint information is mixed in the complaint translation information or only the translated line (that is, the completely translated line or the partially translated line) is mixed with the complaint translation information. A decision may be made based on the specification in the information and the claim translation information may be generated according to the decision. When the claim translation information includes each line of the claim information, the invention document analysis system 20 may treat the claim translation information as claim information and include it in the patent application related information.

翻訳部2054による、修正版クレーム情報に表されるクレームについての機械翻訳の結果は、例えば、修正版クレーム翻訳情報として、発明文書分析システム20が出力する特許出願関連情報に含まれ得る。修正版クレーム翻訳情報は、例えば、修正版クレーム情報の各行を包含し、その包含した修正版クレーム情報の行毎について、その行の直後に、その行に対応する機械翻訳の結果を表す一行を挿入したものであってもよい。修正版クレーム翻訳情報における、その修正版クレーム情報の行に対応する機械翻訳の結果を表す一行は、その修正版クレーム情報の行の全体を翻訳先言語で表した完全翻訳行であってもよいし、その修正版クレーム情報の行に含まれる翻訳可能な重要語句だけを対応翻訳語で表して、翻訳可能な重要語句以外の部分は日本語の記載のまま残した、部分翻訳行であってもよい。翻訳部2054は、修正版クレーム翻訳情報に完全翻訳行を含ませる場合には、更に、その完全翻訳行の直前又は直後に、その完全翻訳行の翻訳対象行に対応する部分翻訳行を挿入することとしてもよい。翻訳部2054は、修正版クレーム翻訳情報に、修正版クレーム情報の各行を混在させるか、混在させずに完全翻訳行又は部分翻訳行だけにするかを、設定情報取得部201が取得した設定情報における指定に基づいて決定して、その決定に従って修正版クレーム翻訳情報を生成することとしてもよい。なお、修正版クレーム翻訳情報が、修正版クレーム情報の各行を包含する場合において、発明文書分析システム20は、その修正版クレーム翻訳情報を、修正版クレーム情報と取り扱うこととして特許出願関連情報に含ませることとしてもよい。 The results of machine translation of the claims represented in the modified claim information by the translation unit 2054 can be included in the patent application related information output by the invention document analysis system 20 as modified claim translation information, for example. The modified claim translation information includes, for example, each line of the modified claim information, and for each line of the included modified claim information, a line indicating the result of machine translation corresponding to that line is added immediately after that line. It may be inserted. In the modified claim translation information, one line representing the result of machine translation corresponding to the line of the modified claim information may be a complete translation line representing the entire line of the modified claim information in the target language. However, only the translatable key words and phrases contained in the lines of the modified claim information are expressed in the corresponding translated words, and the parts other than the translatable key words and phrases are left as they are in Japanese. good too. When a complete translation line is included in the modified claim translation information, the translation unit 2054 further inserts a partially translated line corresponding to the line to be translated of the complete translation line immediately before or after the complete translation line. You can do it. The translation unit 2054 selects whether each line of the corrected complaint information is mixed in the corrected complaint translation information, or only the completely translated line or the partially translated line without mixing is set in the setting information acquired by the setting information acquisition unit 201. may be determined based on the specification in , and the modified claim translation information may be generated in accordance with the determination. When the modified claim translation information includes each line of the modified claim information, the invention document analysis system 20 treats the modified claim translation information as the modified claim information and includes it in the patent application related information. It is also possible to let

翻訳部2054による、明細書情報に表される明細書についての機械翻訳の結果は、例えば、明細書翻訳情報として、発明文書分析システム20が出力する特許出願関連情報に含まれ得る。明細書翻訳情報は、例えば、明細書情報の各行を包含し、その包含した明細書情報の行毎について、その行の直後に、その行に対応する機械翻訳の結果を表す一行を挿入したものであってもよい。明細書翻訳情報における、その明細書情報の行に対応する機械翻訳の結果を表す一行は、翻訳行であり、その翻訳行は、その明細書情報の行の全体を翻訳先言語で表した完全翻訳行であってもよいし、その明細書情報の行に含まれる翻訳可能な重要語句だけを対応翻訳語で表して、翻訳可能な重要語句以外の部分は日本語の記載のまま残した、部分翻訳行であってもよい。なお、明細書情報の重要語句を含む行の全体を翻訳先言語で表した完全翻訳行において、その重要語句に対応する翻訳先言語で表した語句は対応翻訳語と扱うことができる。従って、明細書翻訳情報は、明細書情報の内容に含まれる重要語句をその重要語句に対応する対応翻訳語に置換した結果を表す情報とも言える。翻訳部2054は、明細書翻訳情報に完全翻訳行を含ませる場合には、更に、その完全翻訳行の直前又は直後に、その完全翻訳行の翻訳対象行に対応する部分翻訳行を挿入することとしてもよい。翻訳部2054は、明細書翻訳情報に、明細書情報の各行を混在させるか、混在させずに翻訳行(つまり完全翻訳行又は部分翻訳行)だけにするかを、設定情報取得部201が取得した設定情報における指定に基づいて決定して、その決定に従って明細書翻訳情報を生成することとしてもよい。なお、明細書翻訳情報が、明細書情報の各行を包含する場合において、発明文書分析システム20は、その明細書翻訳情報を、明細書情報と取り扱うこととして特許出願関連情報に含ませることとしてもよい。 The result of machine translation of the specification represented in the specification information by the translation unit 2054 can be included in the patent application related information output by the invention document analysis system 20 as specification translation information, for example. Description translation information includes, for example, each line of description information, and for each line of the included description information, a line representing the result of machine translation corresponding to that line is inserted immediately after that line. may be In the description translation information, one line representing the result of machine translation corresponding to the line of the description information is a translation line, and the translation line is a complete translation of the entire line of the description information in the target language. It may be a translation line, or only the translatable key phrases contained in the line of the specification information are expressed in the corresponding translated words, and the parts other than the translatable key phrases are left as they are in Japanese. It may be a partially translated line. In the complete translation line that represents the entire line containing the key phrase of the specification information in the translation destination language, the phrase in the translation target language corresponding to the key phrase can be treated as the corresponding translated word. Therefore, the specification translation information can also be said to be information representing the result of replacing the key words included in the contents of the specification information with corresponding translated words corresponding to the key words. When including a fully translated line in the specification translation information, the translation unit 2054 further inserts a partially translated line corresponding to the line to be translated of the fully translated line immediately before or after the fully translated line. may be The setting information acquisition unit 201 acquires whether each line of the specification information is mixed in the specification translation information or only the translation line (that is, the completely translated line or the partially translated line) is used without mixing. It is also possible to determine based on the specification in the set information, and generate the specification translation information according to the determination. In addition, when the specification translation information includes each line of the specification information, the invention document analysis system 20 treats the specification translation information as specification information and includes it in the patent application related information. good.

翻訳部2054による、修正版明細書情報に表される明細書についての機械翻訳の結果は、例えば、修正版明細書翻訳情報として、発明文書分析システム20が出力する特許出願関連情報に含まれ得る。修正版明細書翻訳情報は、例えば、修正版明細書情報の各行を包含し、その包含した修正版明細書情報の行毎について、その行の直後に、その行に対応する機械翻訳の結果を表す一行を挿入したものであってもよい。修正版明細書翻訳情報における、その修正版明細書情報の行に対応する機械翻訳の結果を表す一行は、その修正版明細書情報の行の全体を翻訳先言語で表した完全翻訳行であってもよいし、その修正版明細書情報の行に含まれる翻訳可能な重要語句だけを対応翻訳語で表して、翻訳可能な重要語句以外の部分は日本語の記載のまま残した、部分翻訳行であってもよい。翻訳部2054は、修正版明細書翻訳情報に完全翻訳行を含ませる場合には、更に、その完全翻訳行の直前又は直後に、その完全翻訳行の翻訳対象行に対応する部分翻訳行を挿入することとしてもよい。翻訳部2054は、修正版明細書翻訳情報に、修正版明細書情報の各行を混在させるか、混在させずに完全翻訳行又は部分翻訳行だけにするかを、設定情報取得部201が取得した設定情報における指定に基づいて決定して、その決定に従って修正版明細書翻訳情報を生成することとしてもよい。なお、修正版明細書翻訳情報が、修正版明細書情報の各行を包含する場合において、発明文書分析システム20は、その修正版明細書翻訳情報を、修正版明細書情報と取り扱うこととして特許出願関連情報に含ませることとしてもよい。 The result of machine translation of the specification represented in the revised specification information by the translation unit 2054 can be included in the patent application-related information output by the invention document analysis system 20, for example, as the revised specification translation information. . The modified specification translation information includes, for example, each line of the modified specification information, and for each line of the included modified specification information, immediately after that line, the machine translation result corresponding to that line It is also possible to insert a line representing In the modified specification translation information, one line representing the result of machine translation corresponding to the row of the modified specification information is a complete translation line representing the entire line of the modified specification information in the target language. Alternatively, it is a partial translation in which only the translatable key phrases contained in the lines of the modified specification information are expressed in the corresponding translated words, and the parts other than the translatable key phrases are left as they are in Japanese. can be a line. When including a complete translation line in the revised specification translation information, the translation unit 2054 further inserts a partially translated line corresponding to the line to be translated of the complete translation line immediately before or after the complete translation line. It is also possible to The setting information acquisition unit 201 acquires whether the translation unit 2054 mixes each line of the revised specification information in the revised specification translation information, or only the completely translated line or the partially translated line without mixing each line. It may be determined based on the specification in the setting information, and the revised specification translation information may be generated according to the determination. When the revised specification translation information includes each line of the revised specification information, the invention document analysis system 20 handles the revised specification translation information as the revised specification information. It may be included in the related information.

翻訳部2054は、例えば、部分翻訳行の生成において、翻訳対象行における重要語句に対応する対応翻訳語が特定できない場合には、翻訳対象行の重要語句を、その重要語句についての翻訳語候補集合に置換したものを、部分翻訳行として生成する。 For example, in generating a partially translated line, if a corresponding translated word corresponding to an important word in the line to be translated cannot be identified, the translation unit 2054 converts the important word in the line to be translated into a translation word candidate set for that important word. , is generated as a partial translation line.

翻訳部2054は、翻訳先の言語が英語である場合には、例えば、生成するクレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、或いは、修正版明細書翻訳情報における部分翻訳行中又は完全翻訳行中の符号を、半角文字で表現可能であれば半角文字にして、その符号の前後に半角の空白文字を挿入して記載し得る。 When the translation destination language is English, for example, the translation unit 2054 generates claim translation information, corrected version claim translation information, description translation information, or partial translation line or Codes in the complete translation line can be written in half-width characters if they can be expressed in half-width characters, and half-width spaces are inserted before and after the codes.

翻訳部2054は、翻訳先の言語が英語である場合において、例えば、生成するクレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、或いは、修正版明細書翻訳情報における部分翻訳行又は完全翻訳行の翻訳対象となった行の行頭に空白文字があるときには、部分翻訳行又は完全翻訳行では、その空白文字を、予め定められた所定数の半角の空白文字へと置換して行頭に含むように記載し得る。この部分翻訳行又は完全翻訳行の行頭に記載され得る半角の空白文字の個数としての所定数は、例えば、設定情報取得部201により取得される設定情報により定められることとしてもよい。 When the translation destination language is English, for example, the translation unit 2054 generates claim translation information, modified version claim translation information, description translation information, or partially translated lines or complete translations in the revised version description translation information. When there is a blank character at the beginning of the line to be translated, the blank character is replaced with a predetermined number of single-byte blank characters and included at the beginning of the line in the partially translated line or the completely translated line. can be written as The predetermined number as the number of half-width blank characters that can be written at the beginning of the partially translated line or the fully translated line may be determined by the setting information acquired by the setting information acquiring unit 201, for example.

例えば、設定情報取得部201により取得される設定情報により、翻訳先の言語が英語である場合にその英語での翻訳文の形式(文末に挿入する半角の空白文字の数等)について設定されるようにしてもよく、翻訳部2054は、その設定情報で設定された形式に従って、明細書翻訳情報、修正版明細書翻訳情報等における各翻訳文を生成するようにしてもよい。 For example, the setting information acquired by the setting information acquisition unit 201 sets the format of the translated sentence in English (the number of half-width spaces to be inserted at the end of the sentence, etc.) when the language to be translated is English. Alternatively, the translation unit 2054 may generate each translation in the specification translation information, the revised version specification translation information, etc. according to the format set by the setting information.

翻訳部2054は、例えば、生成するクレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、或いは、修正版明細書翻訳情報における部分翻訳行又は完全翻訳行の翻訳対象となった行に見出し(例えば隅付き始め括弧で始まり隅付き終わり括弧で終わる記載部分)が記載されていた場合には、予め定められた見出しの対訳表に従って、その見出しを翻訳することで、見出しの翻訳結果を含ませた部分翻訳行又は完全翻訳行を生成することとしてもよい。予め定められた見出しの対訳表(つまり複数の日本語の見出し各々に、予め定められた、見出しの翻訳結果を対応付けた表)は、例えば、設定情報取得部201により取得される設定情報により定められることとしてもよい。例えば翻訳先の言語が英語である場合において、見出しの対訳表の一例としては、日本語の各見出し(例えば「発明の名称」、「発明を実施するための形態」等)について、日本語の見出しと、三極特許庁の合意内容に準拠した国際出願用の見出しの英文とを対応付けたものが、挙げられる。 For example, the translation unit 2054 adds a heading ( For example, a description part that starts with an opening corner bracket and ends with an end bracket with a corner) is described, the translation result of the heading is included by translating the heading according to a predetermined bilingual table of headings. Alternatively, a partially translated line or a fully translated line may be generated. A predetermined bilingual table of headlines (that is, a table in which each of a plurality of Japanese headlines is associated with a predetermined translation result of the headline) is obtained by, for example, setting information acquired by the setting information acquisition unit 201. It may be defined. For example, when the language to be translated is English, as an example of a bilingual table of headings, for each Japanese heading (e.g., "Title of the Invention", "Mode for Carrying out the Invention", etc.), the Japanese A correspondence between the headings and the English text of the headings for international applications conforming to the agreements of the Trilateral Offices may be mentioned.

翻訳部2054は、翻訳語候補集合特定部20541を含む。翻訳語候補集合特定部20541は、実施形態1で示した翻訳語候補集合特定部1052を一部変形したものであり、ここで特に示さない点については、翻訳語候補集合特定部1052と同様である。 Translation unit 2054 includes translation word candidate set identification unit 20541 . The translation word candidate set identification unit 20541 is a partial modification of the translation word candidate set identification unit 1052 shown in the first embodiment, and is the same as the translation word candidate set identification unit 1052 except for the points not shown here. be.

翻訳語候補集合特定部20541は、例えば設定情報の対訳辞書情報の特定用情報に基づいて、対訳辞書情報を取得して、保持し得る。翻訳語候補集合特定部20541は、例えば予め対訳辞書情報を保持していてもよい。 The translation word candidate set specifying unit 20541 can acquire and hold the bilingual dictionary information based on the bilingual dictionary information specifying information of the setting information, for example. The translation word candidate set identification unit 20541 may hold bilingual dictionary information in advance, for example.

翻訳語候補集合特定部20541は、発明文書取得部2021により取得された発明文書から重要語句抽出部2051により抽出された重要語句各々について、対訳辞書情報を用いて、その重要語句についての対応翻訳語の候補の集合である翻訳語候補集合を特定する。翻訳語候補集合特定部20541は、各重要語句について、その重要語句に対応する翻訳語候補集合の要素数を、可能な限り1以上にするように、各種処理を行い得るが、結果的に、その重要語句に対応する翻訳語候補集合の要素数が0となる場合は生じ得る。この各種処理の例としては、翻訳語候補集合の要素が見つからないその重要語句が複合語であれば複数の語句に分解して対訳辞書情報から得た対訳を合成する処理、翻訳語候補集合の要素が見つからないその重要語句の語幹に所定の限定語句(例えば序数、各種数詞、限定文字列「所定の」等)が含まれている場合にその日本語の所定の限定語句とその重要語句の語幹以外の部分について対訳辞書情報から得た対訳とを合成する処理、翻訳語候補集合の要素が見つからないその重要語句の語尾に所定の語尾文字列(例えば「部」、「手段」等)が含まれている場合にその重要語句の語尾以外の部分について対訳辞書情報から得た対訳と、その日本語の所定の語尾文字列、又は、所定の語尾文字列に対応する対訳辞書情報から得た対訳とを、合成する処理等が、挙げられる。この所定の語尾文字列は、設定情報取得部201により取得された設定情報に含まれる技術用語特有語尾情報により示される1つ以上の各技術用語特有語尾文字列であってもよい。 The translation word candidate set identification unit 20541 uses the bilingual dictionary information for each of the key words extracted by the key word extraction unit 2051 from the invention documents acquired by the invention document acquisition unit 2021 to identify corresponding translated words for the key words. A translation word candidate set, which is a set of candidates for . The translation word candidate set identification unit 20541 can perform various processes for each key phrase so that the number of elements in the translation word candidate set corresponding to the key phrase is 1 or more as much as possible. It is possible that the number of elements in the translation word candidate set corresponding to the important phrase is zero. Examples of these various types of processing include processing for synthesizing bilingual translations obtained from bilingual dictionary information by decomposing a compound word into a plurality of key phrases for which no element of the candidate translation set is found; If the stem of the important phrase for which no element is found contains a prescribed limiting phrase (e.g. ordinal number, various numerals, limited character string "predetermined", etc.), the Japanese prescribed limiting phrase and its important phrase A process of synthesizing bilingual translations obtained from bilingual dictionary information for parts other than the stem, and a predetermined ending character string (e.g., "part", "means", etc.) If it is included, the bilingual dictionary information for the portion other than the ending of the important phrase, and the predetermined Japanese ending character string, or the bilingual dictionary information corresponding to the predetermined ending character string A process of synthesizing a parallel translation and the like can be mentioned. This predetermined ending string may be one or more technical term-specific ending strings indicated by the technical term-specific ending information included in the setting information acquired by the setting information acquisition unit 201 .

翻訳語候補集合特定部20541が特定する重要語句についての翻訳語候補集合の要素は、一部に日本語の語句を含むものであってもよい。翻訳語候補集合特定部20541は、各重要語句について、その重要語句に対応する翻訳語候補集合に、翻訳補助情報においてその重要語句に対応付けられた対応翻訳語を、既存の要素と重複しない限り新たな要素として追加することとしてもよい。翻訳語候補集合特定部20541は、各重要語句について、重要語句翻訳用学習モデルを用いた予め定められた演算処理を実行してその演算結果に基づいて、その重要語句に対応する翻訳語候補集合の特定又は修正(例えばその演算処理により生成された機械翻訳結果の追加等)をすることとしてもよい。また、翻訳語候補集合特定部20541は、各重要語句について、重要語句の抽出対象となった発明文書からその重要語句を含む各行を抽出して、その各行を、所定の機械翻訳プログラムに対する入力とし、この所定の機械翻訳プログラムにより出力される翻訳結果のうちその重要語句が翻訳された部分に該当する1つ又は複数の対訳を取得し、その各対訳をその重要語句に対応する翻訳語候補集合の要素として追加することとしてもよい。 The elements of the translation word candidate set for the important phrase specified by the translation word candidate set specifying unit 20541 may partially include Japanese words. For each key phrase, the translation word candidate set identification unit 20541 adds the corresponding translation word associated with the key phrase in the translation assistance information to the translation word candidate set corresponding to the key phrase, unless it overlaps with an existing element. It may be added as a new element. The translation word candidate set identification unit 20541 executes predetermined arithmetic processing using the key phrase translation learning model for each key phrase, and based on the calculation result, a translation word candidate set corresponding to the key phrase. may be specified or modified (for example, addition of machine translation results generated by the arithmetic processing). In addition, for each key word, the translation word candidate set identification unit 20541 extracts each line containing the key word from the invention document from which the key word is to be extracted, and inputs each line to a predetermined machine translation program. , of the translation results output by this predetermined machine translation program, obtain one or more parallel translations corresponding to the portion where the key phrase is translated, and convert each of the parallel translations into a set of translation word candidates corresponding to the key phrase. It may be added as an element of

翻訳語候補集合特定部20541は、重要語句についての翻訳語候補集合を特定、修正等した場合に、その翻訳語候補集合を反映するように、分析部205が保持する重要語句管理情報を更新する。 The translation word candidate set identification unit 20541 updates the important phrase management information held by the analysis unit 205 so as to reflect the translation word candidate set when the translation word candidate set for the important phrase is identified or corrected. .

翻訳先の言語が英語である場合において翻訳語候補集合特定部20541が、対訳辞書情報等に基づいて重要語句について特定する翻訳語候補集合の例としては、重要語句「ねじ回し」についての翻訳語候補集合「screwdriver」、重要語句「処理部」についての翻訳語候補集合「processor、handler」、「判定」と「部」とに分解可能な重要語句「判定部」についての翻訳語候補集合「judgement部、decision部、adjudication部」、重要語句「変化量」についての翻訳語候補集合「variation、amount of change」、「所定」と「基準」とに分解可能な重要語句「所定基準」についての翻訳語候補集合「所定standard、所定basis、所定criterion」、「支援」と「処理」とに分解可能な重要語句「支援処理」についての翻訳語候補集合「support処理、backing処理、aid処理」、重要語句「文字」についての翻訳語候補集合「letter、character、writing」等が挙げられる。 An example of a translation word candidate set that the translation word candidate set identifying unit 20541 identifies an important word based on bilingual dictionary information when the target language is English is the translation word for the important word "screwdriver". Candidate set "screwdriver", translation word candidate set "processor, handler" for important phrase "processing part", translation word candidate set "judgment" for important phrase "judgement part" that can be decomposed into "judgment" and "part" A set of candidate translation words for the important phrase "variation, amount of change", and a translation for the important phrase "predetermined criteria" that can be decomposed into "predetermined" and "standard" A word candidate set "predetermined standard, predetermined basis, predetermined criterion", a translation word candidate set "support processing, backing processing, aid processing" for the important phrase "support processing" that can be decomposed into "support" and "processing", important Examples include a translation word candidate set "letter, character, writing" for the word "letter".

翻訳語候補集合特定部20541は、例えば、分類部2053により発明文書が属すると特定されたグループ、又は、技術分野特定部20531により発明文書に対応して特定された技術分野を、グループ別又は技術分野別の複数の対訳辞書情報のうちから、翻訳語候補集合を特定するための対訳辞書情報を、選択するために利用する。この複数の対訳辞書情報各々においては、例えば、その対訳辞書情報に対応するグループ又は技術分野における発明文書中の重要語句に対応する語句として選択される可能性が高いと推定される順(つまり対応翻訳語としての妥当性の高い順)に、重要語句に対応する1つ以上の対訳の語句を順序付けておき、翻訳語候補集合特定部20541は、選択した対訳辞書情報における語句の順序と合わせるように、翻訳語候補集合の要素の並び順を定めることとしてもよい。翻訳語候補集合の要素の並び順は、翻訳語候補集合が特許出願関連情報の一部として出力(例えば表示)される場合に、その並び順に並べて出力(例えば表示)され得る。グループ別又は技術分野別の複数の対訳辞書情報各々は、その対訳辞書情報の検索効率を向上させるために、そのグループ又は技術分野において使用頻度の高い重要語句ほど迅速に検索されるように構成されるようにしてもよい。 The translation word candidate set identification unit 20541, for example, classifies the group identified by the classification unit 2053 as belonging to the invention document or the technical field identified corresponding to the invention document by the technical field identification unit 20531 by group or by technology. Bilingual dictionary information for specifying a translation word candidate set is used to select from among a plurality of field-specific bilingual dictionary information. In each of the plurality of bilingual dictionary information, for example, the order (that is, correspondence One or more bilingual words/phrases corresponding to the important words/phrases are ordered in descending order of validity as translation words, and the translation word candidate set identification unit 20541 matches the order of the words/phrases in the selected bilingual dictionary information. Alternatively, the arrangement order of the elements of the translation word candidate set may be determined. When the translation word candidate set is output (eg, displayed) as part of the patent application-related information, the arrangement order of the elements of the translation word candidate set can be arranged and output (eg, displayed) in that order. Each of the plurality of bilingual dictionary information by group or by technical field is configured so that the more frequently used important words and phrases in the group or technical field are searched, the more quickly, in order to improve the search efficiency of the bilingual dictionary information. You may do so.

翻訳先の言語を英語とした場合における技術分野別の複数の対訳辞書情報の例としては、例えば、コンピュータ技術の分野に対応する対訳辞書情報における重要語句「移植」についての翻訳語候補集合の要素では「porting」の妥当性が比較的高く、医療機器の分野に対応する対訳辞書情報における重要語句「移植」についての翻訳語候補集合の要素では「transplant」の妥当性が比較的高い例、化学の分野に対応する対訳辞書情報における重要語句「分子」についての翻訳語候補集合の要素では「molecule」の妥当性が比較的高く、測定技術、コンピュータ技術等の分野に対応する対訳辞書情報における重要語句「分子」についての翻訳語候補集合の要素では「numerator」の妥当性が比較的高い例等が、挙げられる。 An example of a plurality of pieces of bilingual dictionary information for each technical field when the target language is English is an element of a translation word candidate set for the important word "transplant" in the bilingual dictionary information corresponding to the field of computer technology. , the validity of "porting" is relatively high, and the validity of "transplant" is relatively high in the element of the translation word candidate set for the important word "transplant" in the bilingual dictionary information corresponding to the field of medical equipment. Among the elements of the translation word candidate set for the important word "molecule" in the bilingual dictionary information corresponding to the fields of Among the elements of the translation word candidate set for the phrase "molecule", there is an example in which "numerator" is relatively highly appropriate.

翻訳先の言語を英語とした場合における、発明者の所属部門別というグループ別の複数の対訳辞書情報の一例としては、例えば部門毎における発明文書に係る翻訳方針(例えば翻訳表現についての規則)の相違等により、第1の部門に対応する対訳辞書情報における重要語句「分析工程」及び「制御工程」のそれぞれについての翻訳語候補集合の要素では、それぞれ「analysis process」、「control process」の妥当性を最高に定めてあり、第2の部門に対応する対訳辞書情報における重要語句「分析工程」及び「制御工程」のそれぞれについての翻訳語候補集合の要素では、それぞれ「analyzing step」、「controlling step」の妥当性を最高に定めてあり、第3の部門に対応する対訳辞書情報における重要語句「分析工程」及び「制御工程」のそれぞれについての翻訳語候補集合の要素では、それぞれ「analyzing」、「controlling」の妥当性を最高に定めてある例が、挙げられる。 An example of a plurality of bilingual dictionary information for each group of the inventor's department when the target language is English is, for example, the translation policy (e.g., rules for translation expressions) related to the invention document for each department. Due to differences, etc., the elements of the translation word candidate set for each of the important words "analysis process" and "control process" in the bilingual dictionary information corresponding to the first department are not valid for "analysis process" and "control process", respectively. The elements of the translation word candidate set for each of the key phrases “analyzing step” and “controlling step” in the bilingual dictionary information corresponding to the second category are “analyzing step” and “controlling The validity of "step" is determined to be the highest, and the elements of the translation word candidate set for each of the important words "analyzing process" and "control process" in the bilingual dictionary information corresponding to the third category are "analyzing" , an example that best defines the validity of "controlling" is given.

[3-1-5-11-2.表示用文書における各種翻訳情報部分の生成]
発明文書分析システム20において出力部208が、クレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、及び、修正版明細書翻訳情報といった各種翻訳情報の少なくとも1つを含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、翻訳部2054は、表示用文書としての特許出願関連情報に含まれるクレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、或いは、修正版明細書翻訳情報を生成する。
[3-1-5-11-2. Generating Various Translation Information Parts in Documents for Display]
In the invention document analysis system 20, the output unit 208 outputs patent application related information including at least one of various translation information such as claim translation information, modified claim translation information, specification translation information, and modified specification translation information, When outputting as a display document (for example, an HTML document), the translation unit 2054 converts the claim translation information, modified claim translation information, specification translation information, or correction Generate version specification translation information.

翻訳部2054が生成する、表示用文書としての特許出願関連情報のクレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、或いは、修正版明細書翻訳情報の部分は、例えば、そのクレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、或いは、修正版明細書翻訳情報における各行の内容に対応する、1つ以上の表示要素を含み、その各行内に、重要語句抽出部2051により抽出された1つ以上の重要語句があればその各重要語句に対応する1つ以上の表示要素を含み、その各行内に、1つ以上の重要語句が翻訳された機械翻訳結果があればその各機械翻訳結果に対応する1つ以上の表示要素を含む。具体例としては、翻訳部2054は、HTML文書において、クレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、或いは、修正版明細書翻訳情報を<article>タグと</article>タグとで挟んで記述する場合においてその<article>タグ配下に、そのクレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、或いは、修正版明細書翻訳情報における各行について、その行に対応する表示要素を、<span>タグと</span>タグとでその行の内容を挟むことで記述し、その1つの行に対応する表示要素の<span>タグ配下に、その行内の重要語句、或いは、重要語句が翻訳された機械翻訳結果について、対応する表示要素を、<span>タグと</span>タグとでその重要語句、或いは、機械翻訳結果を挟むことで記述する。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。表示用文書における各種翻訳情報部分に含まれる各行に対応する各表示要素は、例えば、その対応する行の内容を表示可能にする。 Claim translation information, modified claim translation information, specification translation information, or modified specification translation information of patent application-related information as a document for display generated by the translation unit 2054 is, for example, the claim translation information , containing one or more display elements corresponding to the content of each line in the modified version of the claim translation information, the specification translation information, or the modified version of the specification translation information. If there is one or more key phrases, one or more display elements corresponding to each key phrase are included, and if there are machine translation results in which one or more key phrases are translated in each line, each machine Contains one or more display elements corresponding to translation results. As a specific example, the translation unit 2054 translates the complaint translation information, the modified version of the complaint translation information, the specification translation information, or the modified version of the specification translation information into the <article> tag and the </article> tag in the HTML document. In the case of sandwiching, under the <article> tag, for each line in the claim translation information, the modified version of the claim translation information, the specification translation information, or the modified version of the specification translation information, the display element corresponding to that line is displayed. , <span> tag and </span> tag to describe the content of the line, and under the <span> tag of the display element corresponding to the line, an important phrase in the line or an important Regarding the machine-translated result of translated words, the corresponding display element is described by sandwiching the important word or the machine-translated result between the <span> tag and the </span> tag. For example, a browser may interpret the presentation document to display each presentation element. Each display element corresponding to each line included in various translation information portions in the display document makes it possible, for example, to display the contents of the corresponding line.

翻訳部2054は、表示用文書における各種翻訳情報部分に含まれる重要語句、或いは、重要語句が翻訳された機械翻訳結果に対応する表示要素に、例えば、その重要語句、或いは、機械翻訳結果についての、表示態様の制御(例えば強調表示、色付き表示、表示遷移等)をするための表示制御情報を付加する。表示用文書における各種翻訳情報部分の重要語句、或いは、重要語句が翻訳された機械翻訳結果に対応する表示要素に付加される表示制御情報については、例えば、表示用文書における明細書情報部分の重要語句についての表示要素に付加された表示制御情報と同様である。 The translation unit 2054 adds key words and phrases included in various translation information portions in the document for display, or display elements corresponding to the machine translation results into which the key words and phrases have been translated. , display control information for controlling the display mode (for example, highlighted display, colored display, display transition, etc.) is added. For display control information added to display elements corresponding to important words and phrases of various translation information parts in a document for display, or to display elements corresponding to machine translation results in which the important words and phrases are translated, It is similar to the display control information added to display elements for words.

翻訳部2054は、例えば、表示用文書における各種翻訳情報部分の、重要語句を構成する文字列が互いに相違する複数の重要語句各々を、互いに異なる表示態様(例えば互いに異なる色を付加した態様)で表示するように、各重要語句に対応する表示要素に付加する表示制御情報を定め得る。また、翻訳部2054は、例えば、表示用文書における各種翻訳情報部分の、重要語句の表示要素の表示態様と、その重要語句を翻訳した機械翻訳結果の表示要素の表示態様とにおける少なくとも一部(例えば、重要語句又は機械翻訳結果に付加され、ある程度の幅を有する左境界線を塗る色)を同一となるように、その各表示要素に付加する表示制御情報を定め得る。翻訳部2054は、具体例を挙げると、クレーム翻訳情報及び明細書翻訳情報における重要語句を機械翻訳対象とした機械翻訳の結果の表示要素に付加する情報として、その重要語句が、クレーム情報における重要語句を構成する文字列が互いに相違する複数の重要語句各々と同一の重要語句である場合においては、その機械翻訳の結果の表示態様の少なくとも一部がクレーム情報及び明細書情報におけるその重要語句の表示態様の少なくとも一部と同一となるように(例えば重要語句の機械翻訳の結果に付加された表示色がその重要語句に付加された表示色と同一となるように)、その機械翻訳の結果の表示態様を制御するための表示制御情報を定める。例えば、クレーム情報における重要語句に係る表示制御情報が、その重要語句を、所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであるところの重要語句を機械翻訳対象とする、クレーム翻訳情報及び明細書翻訳情報におけるその重要語句についての機械翻訳の結果に係る表示制御情報は、その機械翻訳の結果を、その重要語句の表示態様に係る左境界線の表示色と同一の表示色でその所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものである。これにより、表示用文書としての各種翻訳情報部分において、一行毎或いはクレームの一項毎に、機械翻訳対象と機械翻訳結果とが交互に記載されているような場合等において、ブラウザにより表示された各種翻訳情報部分における重要語句と、その重要語句が翻訳された機械翻訳結果との対応関係を、ユーザが比較的容易に把握できるようになる。 For example, the translation unit 2054 translates each of a plurality of important phrases having different character strings constituting the important phrases of various translation information portions in the document for display in mutually different display modes (for example, modes in which mutually different colors are added). As displayed, display control information may be defined to be attached to the display element corresponding to each key phrase. In addition, the translation unit 2054, for example, of the various translation information parts in the document for display, at least a part ( For example, the display control information to be added to each display element can be determined so that the color of the left boundary line that is added to the important phrase or machine translation result and has a certain width) is the same. To give a specific example, the translation unit 2054, as information to be added to the display element of the result of the machine translation for which the important words and phrases in the claim translation information and the specification translation information are the object of machine translation, adds the important words and phrases to the important words and phrases in the claim information. In the case where a character string constituting a phrase is the same key phrase as each of multiple key phrases that are different from each other, at least part of the display mode of the result of the machine translation is that of the key phrase in the claim information and specification information. The result of machine translation so as to be the same as at least part of the display mode (for example, the display color added to the result of machine translation of the key phrase is the same as the display color added to the key phrase) Define display control information for controlling the display mode of For example, if the display control information related to the key phrase in the claim information is for controlling the key phrase to be displayed in a display mode in which a left border line having a predetermined width is added, The display control information related to the result of machine translation of the key phrase in the claim translation information and the description translation information to be translated is the display of the left border line related to the display mode of the key phrase. This is for controlling to display in a display mode in which a left boundary line having the same display color as the color and having a predetermined width is added. As a result, in the various translation information parts as the display document, in the case where the machine translation target and the machine translation result are alternately described for each line or each claim, The user can relatively easily comprehend the correspondence relationship between the key phrases in various translation information portions and the machine translation result in which the key phrases are translated.

翻訳部2054は、表示用文書における各種翻訳情報部分の重要語句の表示要素に付加する、操作に応じたGUIとしての機能に係る表示制御情報を、例えば、明細書情報生成部205bが表示用文書における明細書情報部分の重要語句の表示要素に付加する、操作に応じたGUIとしての機能に係る表示制御情報と同様に定め得る。また、翻訳部2054は、表示用文書における各種翻訳情報部分の、重要語句が翻訳された機械翻訳結果の表示要素に付加する、操作に応じたGUIとしての機能に係る表示制御情報を、例えば、その重要語句の表示要素に付加する、操作に応じたGUIとしての機能に係る表示制御情報と同様に定め得る。 The translation unit 2054 adds display control information related to the function as a GUI according to the operation to be added to the display elements of key words in various translation information parts in the display document. It can be determined in the same manner as the display control information related to the function as a GUI according to the operation, which is added to the display element of the important phrase of the specification information part in . In addition, the translation unit 2054 adds display control information related to a function as a GUI according to an operation to be added to the display element of the machine translation result in which the important phrase is translated in various translation information parts in the document for display, for example, It can be defined in the same manner as the display control information related to the function as a GUI according to the operation, which is added to the display element of the important phrase.

翻訳部2054は、表示用文書における各種翻訳情報部分の、重要語句が翻訳された機械翻訳結果の表示要素に、例えば、その表示要素の操作に応じてその重要語句を表示するGUIとしての機能を持たせるための表示制御情報を付加してもよい。 The translation unit 2054 has a function as a GUI for displaying the key words in response to the operation of the display element, for example, on the display element of the machine translation result in which the key word is translated in the various translation information parts in the document for display. Display control information may be added.

翻訳部2054は、表示用文書における各種翻訳情報部分の、重要語句が翻訳された機械翻訳結果の表示要素に、例えば、その表示要素の操作に応じて、その重要語句に対する、その機械翻訳結果とは異なる翻訳語候補集合を表示するGUIとしての機能を持たせるための、翻訳語候補情報を含む表示制御情報を付加してもよい。重要語句に対する翻訳語候補集合は、翻訳語候補集合特定部20541により特定される。この翻訳語候補集合を表示するGUIとしての機能は、翻訳語候補集合の各要素を選択肢とする選択メニューを表示するものであってもよいし、更に、翻訳語候補集合の各要素に妥当性を付記して表示するものであってもよいし、妥当性の高い順に各要素を並べて表示するものであってもよい。翻訳部2054は、その表示要素に係るGUIに対する操作の結果として表示された、重要語句に対する翻訳語候補集合から1つの要素の選択操作がなされた場合に、機械翻訳結果の表示要素の内容をその選択操作により選択された要素に変更するようにその表示要素に付加する表示制御情報を定めてもよい。翻訳部2054は、この機械翻訳結果の変更を、例えば、翻訳先言語が英語である場合においては変更対象の機械翻訳結果が単数形か複数形かに応じて、選択された要素を、同じ、単数形か複数形かの形式に変換し、変換後の要素への変更により実現し得る。翻訳部2054は、更に、その表示制御情報を、重要語句に対する翻訳語候補集合から1つの要素の選択操作がなされた場合に、表示用文書における各種翻訳情報部分中の、その重要語句の機械翻訳結果と同一の全ての機械翻訳結果の各表示要素の内容を、その選択操作により選択された要素に一括して変更するように、定めてもよい。また、翻訳部2054は、その表示要素に係るGUIに対する操作の結果として表示された、重要語句に対する翻訳語候補集合から1つの要素の選択操作がなされた場合に、その重要語句とその選択された1つの要素との組を、重要語句翻訳用学習モデルを生成するための機械学習用の教師データとして機械学習部207に伝達するように、その表示要素に付加する表示制御情報を定めてもよい。図34は、ブラウザに表示された表示用文書としての特許出願関連情報におけるクレーム翻訳情報の一例を示す。図34の例では、クレームの項毎にクレームの内容とその内容に対応する部分翻訳行とを交互に表示している。図35は、ブラウザに表示された特許出願関連情報のクレーム翻訳情報の部分翻訳行における重要語句に対応する翻訳語句(例えば機械翻訳結果)の表示要素に対するマウスクリック操作に応じて表示された翻訳語候補集合の要素についての選択メニューの一例を示す。図35に例示した選択メニューから1つの要素が選択されると、例えば、各部分翻訳行におけるその重要語句に対するその翻訳語句はその選択された要素に置き換えられて表示される。 The translation unit 2054 displays the machine-translated results of the key words of the various translation information parts in the document for display on the display elements of the machine-translated results of the translated key words, for example, in response to the operation of the display elements. may add display control information including translation word candidate information in order to have a GUI function for displaying different sets of translation word candidates. A translation word candidate set identification unit 20541 identifies a translation word candidate set for an important phrase. The GUI function for displaying the translation word candidate set may display a selection menu with options for each element of the translation word candidate set. may be added, or the elements may be arranged and displayed in descending order of validity. When the translation unit 2054 selects one element from the translation word candidate set for the key phrase displayed as a result of the operation on the GUI related to the display element, the translation unit 2054 translates the content of the display element of the machine translation result into the selected element. Display control information to be added to the display element may be determined so as to change to the element selected by the selection operation. The translation unit 2054 changes the machine translation result, for example, when the translation target language is English, depending on whether the machine translation result to be changed is singular or plural, the selected element is the same, This can be accomplished by converting to singular or plural forms and making changes to the elements after conversion. The translation unit 2054 further converts the display control information into machine-translation of the key phrase in various translation information parts in the display document when an operation is performed to select one element from the translation word candidate set for the key phrase. It may be determined that the contents of each display element of all the machine translation results that are the same as the result are collectively changed to the element selected by the selection operation. In addition, when the translation unit 2054 selects one element from the translation word candidate set for the key phrase displayed as a result of the operation on the GUI related to the display element, the translation unit 2054 The display control information to be added to the display element may be determined so that the combination with one element is transmitted to the machine learning unit 207 as teacher data for machine learning for generating a learning model for important phrase translation. . FIG. 34 shows an example of claim translation information in patent application related information as a display document displayed on the browser. In the example of FIG. 34, the content of the claim and the partial translation line corresponding to the content are alternately displayed for each item of the claim. FIG. 35 shows translated words displayed in response to a mouse click operation on display elements of translated words (for example, machine translation results) corresponding to important words in partial translation lines of claim translation information of patent application-related information displayed on the browser. An example of a selection menu for elements of the candidate set is shown. When one element is selected from the selection menu illustrated in FIG. 35, for example, the selected element replaces the translation word for the important word in each partial translation line and is displayed.

翻訳部2054は、例えば、表示用文書としての各種翻訳情報部分において、一行毎或いはクレームの一項毎に、機械翻訳対象と機械翻訳結果とを交互に記載しているような場合において、機械翻訳対象の行の表示要素の表示態様と、機械翻訳結果の行(例えば部分翻訳行又は完全翻訳行)の表示要素の表示態様とにおける少なくとも一部(例えば、文字背景色)を相違させるように、その各表示要素に付加する表示制御情報を定め得る。例えば、クレーム翻訳情報及び明細書翻訳情報には、クレーム翻訳情報及び明細書翻訳情報における機械翻訳対象の少なくとも一部分の表示要素の表示態様と、その機械翻訳対象に対応する機械翻訳の結果の少なくとも一部分の表示要素の表示態様とが、少なくとも一部で相違(例えば、文字背景色、文字色、文字装飾、フォントサイズ、フォントスタイル、及び、フォントウェイトのうちの少なくとも1つにおいて相違)するように制御するために、その各表示要素に表示制御情報が付加される。 The translation unit 2054, for example, in various translation information portions as a document for display, in the case where the machine translation target and the machine translation result are alternately described for each line or each item of the claim, the machine translation At least part (eg, character background color) in the display mode of the display element of the target line and the display mode of the display element of the machine translation result line (eg, partial translation line or complete translation line) is different, Display control information to be attached to each of the display elements may be defined. For example, the claim translation information and the description translation information include the display mode of at least a part of the display element of the machine translation target in the claim translation information and the description translation information, and at least a part of the machine translation result corresponding to the machine translation target Control so that the display mode of the display element is at least partially different (for example, at least one of the character background color, character color, character decoration, font size, font style, and font weight) To do so, display control information is added to each display element.

翻訳部2054は、例えば、表示用文書としての各種翻訳情報部分における部分翻訳行の表示要素に、操作に応じてその行を、インターネット等のネットワークによりアクセス可能な翻訳サイト(例えば所定の機械翻訳プログラムを実行するサーバ装置)で翻訳させるためのGUIとしての機能を持たせる表示制御情報を付加することとしてもよい。 For example, the translation unit 2054, in response to an operation, translates the line into a display element of a partially translated line in various translation information portions as a document for display by a translation site (for example, a predetermined machine translation program) accessible via a network such as the Internet. It is also possible to add display control information that has a function as a GUI for translation by a server device that executes the above.

[3-1-5-11-3.重要語句リストの生成]
翻訳部2054は、発明文書取得部2021により取得された発明文書から重要語句抽出部2051により抽出された各重要語句について、その重要語句と、その重要語句に対して翻訳語候補集合特定部20541により特定された翻訳語候補集合(つまりその重要語句に対応する翻訳語候補情報が表す内容)とを対応付けて構成される重要語句リストを生成する重要語句リスト生成処理を実行する。翻訳部2054により生成される重要語句リストは、例えば、発明文書分析システム20が出力する特許出願関連情報に含まれる。
[3-1-5-11-3. Generate important phrase list]
The translation unit 2054 extracts each key phrase extracted by the key phrase extraction unit 2051 from the invention document acquired by the invention document acquisition unit 2021, and the translation word candidate set identification unit 20541 An important phrase list generation process is executed to generate an important phrase list configured by associating the identified translation word candidate set (that is, the content represented by the translation word candidate information corresponding to the important phrase). The important phrase list generated by the translation unit 2054 is included in the patent application related information output by the invention document analysis system 20, for example.

翻訳部2054は、重要語句リストを、例えば、重要語句毎に行を改めて、各行に、1つの重要語句とその重要語句に対応する翻訳語候補集合とを記載したリストとして生成する。翻訳部2054は、例えば、重要語句設定辞書取得部203により取得された重要語句設定辞書において対応翻訳語が対応付けられている重要語句については、その重要語句を記載した行に、翻訳語候補集合の代わりに対応翻訳語を記載してもよい。また、翻訳部2054は、例えば、重要語句設定辞書取得部203により取得された重要語句設定辞書において対応翻訳語が対応付けられている重要語句については、その重要語句を記載した行に、対応翻訳語と翻訳語候補集合とを識別可能な表現で記載してもよい。翻訳部2054は、重要語句リストに列挙される対象となる重要語句を、その重要語句に対して重要度決定部2055により決定された重要度が、予め定められた程度より高いものに限定することとしてもよい。 The translation unit 2054 generates an important phrase list as a list in which, for example, one important phrase and a set of translation word candidates corresponding to the important phrase are described in each line, with new lines for each important phrase. For example, the translation unit 2054 adds a translation word candidate set to the line describing the key phrase for the key phrase associated with the corresponding translation word in the key phrase setting dictionary acquired by the key phrase setting dictionary acquisition unit 203. You may describe a corresponding translation word instead of . In addition, for example, for an important phrase associated with a corresponding translated word in the important phrase setting dictionary acquired by the important phrase setting dictionary acquisition unit 203, the translation unit 2054 adds the corresponding translation to the line describing the important phrase. A word and a translation word candidate set may be described in an identifiable expression. The translation unit 2054 limits the important phrases to be listed in the important phrase list to those for which the degree of importance determined by the importance determination unit 2055 is higher than a predetermined degree. may be

翻訳部2054は、例えば、重要語句リストの各行において、その行の重要語句と対応付けて記載される翻訳語候補集合の要素数が0である場合には、その行には翻訳語候補集合を記載しない。翻訳部2054は、例えば、重要語句リストの各行において、その行の重要語句と対応付けて記載される翻訳語候補集合の要素数が2以上である場合には、その翻訳語候補集合の要素毎に、重要語句の翻訳語句として妥当な度合いの評価値を表す妥当性の値を付記することとしてもよいし、翻訳語候補集合の要素を妥当性の高い順に並べて記載してもよい。この妥当性の値は、例えば、発明文書分析システム20が過去に出力した複数の翻訳補助情報(つまり重要語句と、翻訳語候補集合からユーザに選択された対応翻訳語とを対応付けた情報)を収集統合して生成されたデータ(例えば、翻訳補助情報から生成された、重要語句の機械翻訳用の機械学習による重要語句翻訳用学習モデル)に基づく、予め定められた演算処理により、算定可能である。翻訳部2054は、例えば、複数の翻訳補助情報を収集統合して生成されたデータに基づいて、1つの重要語句についての翻訳語候補集合の各要素のうち、その重要語句の対応翻訳語として、相対的に多くのユーザに選択された要素に、相対的に高い値の妥当性を対応付けることとしてもよい。 For example, if the number of elements of the translation word candidate set described in association with the key phrase in each line of the key word list is 0, the translation unit 2054 assigns the translation word candidate set to that line. Do not list. For example, when the number of elements of the translation word candidate set described in correspondence with the key phrase of each line of the key phrase list is two or more, the translation unit 2054 translates each element of the translation word candidate set may be appended with a validity value representing the evaluation value of the degree of validity as a translation of the key phrase, or the elements of the translation word candidate set may be listed in descending order of validity. This validity value is, for example, a plurality of pieces of translation assistance information output in the past by the invention document analysis system 20 (that is, information in which important words and phrases are associated with corresponding translation words selected by the user from the translation word candidate set). can be calculated by predetermined arithmetic processing based on data generated by collecting and integrating (for example, a learning model for machine translation of important phrases by machine learning generated from translation auxiliary information) is. For example, based on data generated by collecting and integrating a plurality of pieces of translation auxiliary information, the translation unit 2054 selects, among the elements of the set of translation word candidates for one key phrase, as a corresponding translation word for that key phrase: An element selected by a relatively large number of users may be associated with a relatively high value of relevance.

翻訳部2054は、例えば、重要語句毎に行を改めて生成される重要語句リストの各行において、その行に記載された重要語句に対して重要度決定部2055により決定された重要度が、予め定められた程度より低い場合にはその行に、その重要語句の有用性に疑問がある旨を示す所定の表記(例えば記号「?」)を付加的に記載することとしてもよい。翻訳部2054は、重要語句リストの各行において、その行に記載された重要語句がクレームに記載された重要語句であるか否か、及び、その重要語句が明細書の「発明を実施するための形態」に記載されているか否かを、識別可能にするための表記を付加することとしてもよい。この例の重要語句リストは、例えば、クレームに記載されている重要語句に関連して、如何なる重要語句が明細書の「発明を実施するための形態」に記載されているかの把握を可能にし、また、クレームには現在記載されていないが、追記、補正、出願分割、優先権主張出願等により将来的にクレームに記載される可能性がある重要語句の推定を可能にし得る。なお、重要語句がクレームに記載されているか否かは、分析部205が保持する重要語句管理情報における属性情報のうち、属性特定部2056により特定された重要語句の一属性としての「初出クレーム番号」の項目の内容等により特定可能であり、重要語句が「発明を実施するための形態」に記載されているか否かは、重要語句の一属性としての「発明文書全体、クレーム部分、明細書部分及び発明実施形態部分での使用数」の項目の内容により特定可能である。 For example, the translation unit 2054 predetermines the degree of importance determined by the importance determination unit 2055 for the important phrases described in each line of the important phrase list that is generated for each important phrase. If the level is lower than the specified level, a predetermined notation (for example, the symbol "?") indicating that the usefulness of the important phrase is doubtful may additionally be described in that line. In each line of the key phrase list, the translation unit 2054 determines whether or not the key phrase described in the line is the key phrase described in the claim, and whether or not the key phrase is the key phrase in the specification. A notation may be added to make it identifiable whether or not it is described in the form. This example key phrase list allows, for example, to understand which key phrases are described in the "Detailed Description" of the specification in relation to the key phrases described in the claims, In addition, it may be possible to presume key terms that are not currently stated in the claims but may be stated in the claims in the future due to postscripts, amendments, division of applications, applications claiming priority, and the like. It should be noted that whether or not the key phrase is described in the complaint is determined by the "first appearance claim number" as one attribute of the key phrase specified by the attribute specifying unit 2056 among the attribute information in the key phrase management information held by the analysis unit 205. ”, and whether or not the key phrase is described in the “Mode for Carrying Out the Invention” depends on one attribute of the key phrase, namely, “whole invention document, claim part, specification It can be identified by the content of the item "number of uses in parts and invention embodiment parts".

翻訳部2054は、重要語句リストの各行において、その行に記載された重要語句に対応する符号が存在する場合にはその行に、その重要語句に対応する1つ以上の符号を付記することとしてもよく、例えば、更に、発明文書の明細書においてその重要語句に符号が付加されて記載されている部分とその重要語句に符号が付加されずに記載されている部分とが混在するときには、符号なし記載が存在する旨を示す表記を、その行に付加することとしてもよい。なお、重要語句に対応する符号、或いは、発明文書の明細書における重要語句についての符号付き記載と符号なし記載との混在は、分析部205が保持する重要語句管理情報における属性情報のうち、属性特定部2056により特定された重要語句の一属性としての「符号」の項目の内容により特定可能である。 In each line of the important phrase list, if there is a code corresponding to the important phrase described in that line, the translation unit 2054 adds one or more codes corresponding to the important phrase to that line. For example, when the description of the invention document includes a part in which the key words and phrases are given a code and a part in which the key words and phrases are not given a code, the code A notation indicating that there is no description may be added to the line. It should be noted that the code corresponding to the key phrase, or the mixture of signed and unsigned description of the key phrase in the specification of the invention document is attribute It can be specified by the contents of the item of “sign” as one attribute of the important phrase specified by the specifying unit 2056 .

要素間関係判別部2058により判別されることで、分析部205が保持する重要語句管理情報における属性情報に「重要語句が表す要素の下位概念的要素」の項目が含まれる場合において、翻訳部2054は、その項目の内容を参照することで、重要語句リストの各行において、その行に記載された重要語句に対応する下位概念要素が存在するときにはその行に、その重要語句に対応する1つ以上の下位概念要素を付記することとしてもよい。 As a result of determination by the inter-element relation determination unit 2058, when the attribute information in the key phrase management information held by the analysis unit 205 includes the item "lower-level conceptual element of the element represented by the key phrase", the translation unit 2054 By referring to the contents of the item, in each line of the key phrase list, if there is a subordinate concept element corresponding to the key phrase described in that row, one or more It is also possible to add a subordinate concept element of

翻訳部2054は、重要語句リストの各行において、その行に記載された重要語句について属性特定部2056により特定された属性情報のおける1つ以上の一属性としての項目の内容を、付記することとしてもよい。翻訳部2054は、例えば、重要語句リストにおける各重要語句について、その重要語句についての一属性としての「数」に係る項目の内容を付記し得る。翻訳部2054は、重要語句リストの各行において、その行に記載された重要語句について重要度決定部2055により決定された重要度を付記することとしてもよい。 The translation unit 2054 adds, in each row of the important phrase list, the content of the item as one or more attributes in the attribute information specified by the attribute specifying unit 2056 for the important phrase described in that row. good too. For example, the translation unit 2054 can add the content of the item related to "number" as one attribute of each key phrase in the key phrase list. The translation unit 2054 may add the importance determined by the importance determining unit 2055 to each line of the important phrase list for the important phrase described in that line.

翻訳部2054が重要語句リストにおいて各重要語句について付記する各種情報は、翻訳者等による、重要語句に対応する対応翻訳語の選択、決定等に有用となり得る。 Various types of information added by the translation unit 2054 to each important phrase in the important phrase list can be useful for a translator or the like to select or determine a corresponding translated word corresponding to the important phrase.

翻訳部2054は、例えば、重要語句リストの各行を、所定の順序で並べる。翻訳部2054は、例えば、重要語句リストの各行を、各行に記載された重要語句が表す要素が属するカテゴリー(例えば、方法、物、プログラム等)別に連続するように区分した上で、所定の順序で並べることとしてもよい。所定の順序の具体例としては、各行に記載された重要語句について重要度決定部2055により決定された重要度の高い順に並べる例、各行に記載された重要語句について文字コード順等でソートした結果に従って並べる例、各行に記載された重要語句の発明文書における使用数又は発明文書のクレームにおける使用数が多い順に並べる例が挙げられ、これらの例に示す並べ方を予め定められた優先順に従って併用してもよい。翻訳部2054は、例えば、重要語句リストの各行を互いに異なる順序で並べた、複数の重要語句リストを、特許出願関連情報に含まれるものとして、生成してもよい。 The translation unit 2054, for example, arranges each line of the important phrase list in a predetermined order. The translation unit 2054, for example, divides each line of the important phrase list so that the elements represented by the important phrases described in each row belong to categories (for example, methods, products, programs, etc.), and then sorts them in a predetermined order. It is also possible to arrange by . Specific examples of the predetermined order include an example in which the important words and phrases described in each line are arranged in descending order of importance determined by the importance determining unit 2055, and a result of sorting the important words and phrases described in each line in the order of character codes, etc. Examples of arranging according to the order of priority, and examples of arranging in descending order of the number of uses in the invention document or the number of uses in the claims of the invention document of the important terms described in each line, and the arrangement shown in these examples can be used in combination according to a predetermined order of priority. may The translation unit 2054 may generate, for example, a plurality of important word lists in which the lines of the important word list are arranged in different orders as those included in the patent application related information.

翻訳部2054は、出力部208により特許出願関連情報に含まれるものとしての重要語句リストの先頭行として、設定情報取得部201により取得された設定情報における重要語句設定辞書の特定用情報で定められた所定の見出し(例えば、「重要語句リスト」等)を挿入することとしてもよい。これにより、発明文書分析システム20から出力された特許出願関連情報の重要語句リストについてユーザが編集した結果を、発明文書に含ませて、再び発明文書分析システム20によりその発明文書を分析させることができる。この場合に発明文書分析システム20では、ユーザによる編集後の重要語句リストが重要語句設定辞書として扱われるので、発明文書からの重要語句の抽出精度が向上する可能性があり、その編集後の重要語句リストを踏まえて重要語句の対応翻訳語の決定がなされるので発明文書の機械翻訳の精度が向上する可能性がある。 The translation unit 2054 uses the information for specifying the key phrase setting dictionary in the setting information acquired by the setting information acquisition unit 201 as the top line of the key phrase list included in the patent application related information by the output unit 208. It is also possible to insert a predetermined heading (for example, "list of important phrases"). As a result, it is possible to include in the invention document the result of the user's editing of the key phrase list of the patent application related information output from the invention document analysis system 20, and to cause the invention document analysis system 20 to analyze the invention document again. can. In this case, in the invention document analysis system 20, the list of important words and phrases edited by the user is treated as an important word setting dictionary. Since the translation words corresponding to the important words are determined based on the word list, the accuracy of the machine translation of the invention document may be improved.

[3-1-5-11-4.表示用文書における重要語句リスト部分の生成]
発明文書分析システム20において出力部208が、重要語句リストを含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、翻訳部2054は、表示用文書としての特許出願関連情報に含まれる重要語句リストを生成する。
[3-1-5-11-4. Generating Important Phrase List Part in Document for Display]
When the output unit 208 in the invention document analysis system 20 outputs the patent application-related information including the key word list as a display document (for example, an HTML document), the translation unit 2054 outputs the patent application-related information as the display document. Generate a list of key phrases contained in information.

翻訳部2054が生成する、表示用文書としての特許出願関連情報の重要語句リストの部分は、例えば、重要語句リストにおける各行の内容に対応する、1つ以上の表示要素を含み、その各行内に、重要語句抽出部2051により抽出された重要語句があればその重要語句に対応する表示要素を含み、その各行内に、その重要語句に対応する翻訳語候補集合があれば翻訳語候補集合に対応する表示要素を含み、その各行内に、その重要語句に対応する対応翻訳語があれば対応翻訳語に対応する表示要素を含む。具体例としては、翻訳部2054は、HTML文書において、重要語句リストを<article>タグと</article>タグとで挟んで記述する場合においてその<article>タグ配下に、その重要語句リストの各行について、その行に対応する表示要素を、<span>タグと</span>タグとでその行の内容を挟むことで記述し、その1つの行に対応する表示要素の<span>タグ配下に、その行内の重要語句、翻訳語候補集合、或いは、対応翻訳語について、対応する表示要素を、<span>タグと</span>タグとでその重要語句、翻訳語候補集合、或いは、対応翻訳語を挟むことで記述する。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。表示用文書における重要語句リスト部分に含まれる各行に対応する各表示要素は、例えば、その対応する行の内容を表示可能にする。 The important phrase list portion of the patent application-related information as a display document generated by the translation unit 2054 includes, for example, one or more display elements corresponding to the contents of each line in the important phrase list, and in each line , if there is an important phrase extracted by the important phrase extraction unit 2051, it includes a display element corresponding to that important phrase, and if each line contains a translation word candidate set corresponding to that important phrase, it corresponds to the translation word candidate set. If there is a corresponding translated word corresponding to the important phrase in each line, a display element corresponding to the corresponding translated word is included. As a specific example, the translation unit 2054, when describing an important phrase list sandwiched between <article> and </article> tags in an HTML document, translates each line of the important phrase list under the <article> tag. , the display element corresponding to the line is described by sandwiching the content of the line between the <span> tag and the </span> tag, and the display element corresponding to the one line is described under the <span> tag , the important phrase, the candidate translation word set, or the corresponding translation word in the line, the corresponding display element is displayed by the <span> tag and the </span> tag, the important phrase, the translation word candidate set, or the corresponding translation Described by inserting words. For example, a browser may interpret the presentation document to display each presentation element. Each display element corresponding to each line included in the important phrase list portion of the document for display enables, for example, the contents of the corresponding line to be displayed.

翻訳部2054が生成する特許出願関連情報の重要語句リストの行の内容として、重要語句について、その重要語句の重要度、明細書の「発明を実施するための形態」内での記載数、符号、符号が付加されていない記載と符号が付加された記載との混在の有無等の情報を付記する場合等に、その重要語句についての翻訳語候補集合、対応翻訳語についての情報を次の行に記載してもよい。翻訳部2054は1つの重要語句について複数行を用いてその重要語句についての情報を表してもよい。 As the content of the line of the important phrase list of the patent application related information generated by the translation unit 2054, for the important phrase, the importance of the important phrase, the number of descriptions in the "mode for carrying out the invention" of the specification, the code , when adding information such as whether or not there is a mixture of descriptions without symbols and descriptions with symbols, etc., the set of translation word candidates for the key phrase and information on the corresponding translation word should be added to the next line. may be written in Translator 2054 may use multiple lines for a key phrase to represent information about the key phrase.

翻訳部2054は、表示用文書における重要語句リストに含まれる重要語句、翻訳語候補集合、或いは、対応翻訳語に対応する表示要素に、例えば、その重要語句、翻訳語候補集合、或いは、対応翻訳語についての、表示態様の制御(例えば強調表示、色付き表示、表示遷移等)をするための表示制御情報を付加する。表示用文書における重要語句リスト部分の重要語句に対応する表示要素に付加される表示制御情報については、例えば、表示用文書における明細書情報部分の重要語句についての表示要素に付加された表示制御情報と同様である。 The translation unit 2054 adds, for example, the important phrase, the candidate translation word set, or the corresponding translation to the display element corresponding to the important phrase, the candidate translation word set, or the corresponding translation word included in the important phrase list in the document for display. Display control information for controlling the display mode of words (for example, highlighting, colored display, display transition, etc.) is added. The display control information added to the display elements corresponding to the important phrases in the important phrase list portion of the document for display is, for example, the display control information added to the display elements for the important phrases of the specification information portion of the document for display. is similar to

翻訳部2054により、生成される表示用文書における重要語句リストに含まれる重要語句の表示要素の具体例を挙げると、重要語句リストにおけるクレームの重要語句「機器制御部」に対応する表示要素は、例えば、「<span class=”c003” id=”keywordlist-c003” onclick=’wordProc(”keywordlist-c003”)’ title=”・・・(情報付加表示内容)・・・”>機器制御部</span>」等となる。この例では、重要語句「機器制御部」の識別コードは、「c003」であり、表示要素の<span>タグのid属性の値として、重要語句リストの識別記号「keywordlist」と、重要語句の識別コード「c003」とを含んだ文字列が定められている。また、この例では、表示要素に対するマウスクリック操作がなされた場合にid属性の値を引数としてwordProc関数が呼び出されるように定められている。これにより、wordProc関数では、例えば、引数から、その表示要素を特定して、表示要素に係る重要語句の文字列を参照する処理を実現することが可能となり、また、引数の一部から、重要語句の識別コード「c003」を抽出して、例えば、クレーム情報、修正版クレーム情報、明細書情報、修正版明細書情報等の全ての重要語句「機器制御部」の表示要素の表示内容を、ユーザに入力された文字列等に置換する処理を実現すること等が可能となる。 Specific examples of the display elements of key phrases included in the key phrase list in the document for display generated by the translation unit 2054 include the following display elements: For example, "<span class="c003" id="keywordlist-c003" onclick='wordProc ("keywordlist-c003")' title="... (display content with additional information)...">Device control unit < /span>”. In this example, the identification code of the key word “equipment control unit” is “c003”, and the value of the id attribute of the <span> tag of the display element is the key word list identification symbol “keywordlist” and the key word list A character string including an identification code "c003" is defined. Also, in this example, when a mouse click operation is performed on a display element, the wordProc function is called with the value of the id attribute as an argument. As a result, in the wordProc function, for example, it is possible to specify the display element from the argument and refer to the character string of the important phrase related to the display element. By extracting the identification code "c003" of the phrase, for example, the display contents of the display elements of all the important phrases "equipment control unit" such as claim information, modified claim information, specification information, and modified specification information, etc. It is possible to realize a process of replacing with a character string or the like input by the user.

翻訳部2054は、例えば、表示用文書における重要語句リストに含まれる、複数の要素を含む翻訳語候補集合に対応する表示要素に、翻訳語候補集合の各要素を選択可能に表示して選択された要素に対応した翻訳語候補集合選択処理を実行するGUIとしての機能を持たせるための表示制御情報を付加する。この表示制御情報は、例えば、ユーザによる翻訳語候補集合に対する選択操作に応じて、選択された翻訳語候補集合の要素と、翻訳語候補集合に係る重要語句とを引数として起動されるスクリプトの関数の関数名又はその関数自体を定義するものであり、その関数は、例えば、引数の要素と重要語句とを対応付けて、重要語句設定辞書取得部203により取得された重要語句設定辞書(例えば、重要語句を列挙して重要語句に対応翻訳語を付記可能なファイル等)に反映する処理等を含む翻訳語候補集合選択処理を実行するための関数である。翻訳語候補集合の要素と重要語句とを対応付けて重要語句設定辞書に反映する処理は、例えば、その重要語句が、重要語句設定辞書に既に含まれている場合には、重要語句設定辞書のその重要語句に係る情報について上書きするか否かをユーザに選択させる処理を含み得る。また、その関数により実行される翻訳語候補集合選択処理は、その関数の引数である要素と重要語句との組を、重要語句翻訳用学習モデルを生成するための機械学習用の教師データとして、機械学習部207に伝達する処理を、含んでもよい。 For example, the translation unit 2054 selectably displays each element of the candidate translation word set on the display element corresponding to the translation word candidate set including a plurality of elements included in the key phrase list in the display document. Display control information is added to provide a function as a GUI for executing translation word candidate set selection processing corresponding to the selected element. This display control information is, for example, a function of a script that is activated with the elements of the selected translation word candidate set and important phrases related to the translation word candidate set as arguments in response to the user's selection operation on the translation word candidate set. or the function itself, and the function associates, for example, the elements of the argument with key words, and retrieves the key word setting dictionary acquired by the key word setting dictionary acquisition unit 203 (for example, This is a function for executing translation word candidate set selection processing including processing for listing key words and reflecting them in a file or the like in which translation words corresponding to key words can be added. The process of associating the elements of the translation word candidate set with key words and reflecting them in the key word setting dictionary is, for example, when the key word is already included in the key word setting dictionary. It may include processing for allowing the user to select whether or not to overwrite the information related to the important phrase. In addition, the translation word candidate set selection process executed by the function uses pairs of elements and key phrases that are arguments of the function as teacher data for machine learning for generating a learning model for key phrase translation, A process of transmitting to the machine learning unit 207 may be included.

図36は、ブラウザに表示された表示用文書としての特許出願関連情報における重要語句リストの一例を示す。図37は、ブラウザに表示された特許出願関連情報の重要語句リストにおける翻訳語候補集合をその1つの要素を選択するマウスクリック操作に応じて対応翻訳語に変更した一例を示す。図37に示す例は、図36に例示した重要語句「処理部」に対応する翻訳語候補集合の要素「processor」と要素「handler」とのうち要素「processor」が選択操作されたことにより重要語句「処理部」に対応する対応翻訳語として「processor」が決定された状態を示している。例えば、ユーザは、設定情報における重要語句設定辞書の特定用情報で発明文書中の<重要語句リスト>を重要語句設定情報として利用することを設定している場合においては、図37に例示するような重要語句リストを、発明文書ファイルへとコピー&ペーストすることで、発明文書ファイルに重要語句リストを含ませて、その発明文書ファイルをテキストエディタ等により編集することができ、その編集後の重要語句リストを含む発明文書ファイルを、発明文書分析システム20で再び分析させることが可能となる。 FIG. 36 shows an example of an important phrase list in patent application related information as a display document displayed on the browser. FIG. 37 shows an example in which a translation word candidate set in the important word list of the patent application related information displayed on the browser is changed to the corresponding translation word in response to a mouse click operation for selecting one element. In the example shown in FIG. 37, the element "processor" is selected from among the elements "processor" and "handler" of the translation word candidate set corresponding to the important phrase "processing section" illustrated in FIG. It shows a state in which "processor" has been determined as a corresponding translated word corresponding to the word "processing unit". For example, when the user has set that the <list of important phrases> in the invention document is used as the important phrase setting information in the important phrase setting dictionary identification information in the setting information, as shown in FIG. By copying and pasting the important phrase list to the invention document file, the invention document file can include the important phrase list, and the invention document file can be edited with a text editor or the like. The invention document file containing the word list can be analyzed again by the invention document analysis system 20 .

図38は、ブラウザに表示された表示用文書としての特許出願関連情報における重要語句リストの別の一例を示す。図38の例では、重要語句リストの各行の内容として、重要語句と、その重要語句についての重要度と、その重要語句の明細書の「発明を実施するための形態」内での記載数と、その重要語句に対応する符号があればその符号と、その重要語句についての符号が付加されていない記載と符号が付加された記載との混在の有無を記号「●」の有無で表す情報と、その重要語句についての翻訳語候補集合とを記載した例を示している。この例では、重要度は、「Level」という文字を付した、0~5の6段階の値で、表現されており、対訳辞書情報から検索できなかった重要語句についての翻訳語候補集合は省略されており、各行は、重要語句の文字順に(つまり文字コードの昇順のソートにより)、並べられている。図38の例における重要語句「制御用プログラム」は、重要語句「制御プログラム」の誤記である可能性があり、このような誤記の可能性は、例えば警告情報でも指摘され得るが、重要語句リストの全体又は一部に文字順に重要語句を並べる形式のリストを含ませることにより、このような誤記の可能性がある記載を確認し易くなり得る。 FIG. 38 shows another example of an important phrase list in patent application related information as a display document displayed on the browser. In the example of FIG. 38, the contents of each line of the key word list include key words, the importance of the key words, and the number of descriptions of the key words in the "Mode for Carrying Out the Invention" of the specification. , if there is a code corresponding to the key phrase, the code, and information indicating whether or not there is a mixture of descriptions without a code and description with a code for the key phrase by the presence or absence of the symbol "●" , and a translation word candidate set for the important phrase. In this example, the degree of importance is represented by a value of 6 levels from 0 to 5 with the character "Level" attached. Each line is arranged in alphabetical order of the important phrases (that is, sorted in ascending order of character codes). The important phrase "control program" in the example of FIG. 38 may be a typographical error of the important phrase "control program." Including a list of important terms in alphabetical order in whole or in part of the .

翻訳部2054は、例えば、表示用文書における重要語句リストに含まれる、重要語句に対応する表示要素に、操作に応じてその重要語句についての非重要語句化処理を実行するGUIとしての機能を持たせるための表示制御情報を付加してもよい。この表示制御情報は、例えば、ユーザによる重要語句に対する操作に応じて、その重要語句を引数として起動されるスクリプトの関数の関数名又はその関数自体を定義するものであり、その関数は、例えば、引数の重要語句を、非重要語句化することを選択可能にするメニューを表示し、ユーザにより非重要語句化することが選択された場合に、その重要語句を、重要語句設定辞書取得部203により取得された重要語句設定辞書から削除して、非重要語句設定辞書に追加する非重要語句化処理を実行するための関数であり、更に、その関数は、発明文書分析システム20の分析部205に、発明文書取得部2021により取得されている発明文書の再分析を実行させるための処理を含んでもよい。 The translation unit 2054 has, for example, a GUI function for executing non-important phrase conversion processing for important phrases in response to an operation on display elements corresponding to important phrases included in a list of important phrases in a document for display. Display control information may be added. This display control information defines, for example, the function name of the script function or the function itself that is activated with the important phrase as an argument in response to the user's operation on the important phrase. A menu is displayed that allows the user to select non-important phrases for the important phrases in the argument. It is a function for executing non-important phrase conversion processing to delete from the acquired key phrase setting dictionary and add to the non-key phrase setting dictionary. , a process for re-analyzing the invention document acquired by the invention document acquisition unit 2021 may be included.

[3-1-5-11-5.図面符号リストの生成]
翻訳部2054は、例えば、図面文書取得部2022により取得された図面文書の内容、発明文書取得部2021により取得された発明文書から重要語句抽出部2051により抽出された各重要語句についての属性情報における「符号」の項目等に基づいて、図面符号リストを生成する図面符号リスト生成処理を実行する。翻訳部2054により生成される図面符号リストは、例えば、発明文書分析システム20が出力する特許出願関連情報に含まれる。
[3-1-5-11-5. Generation of drawing code list]
The translation unit 2054 extracts, for example, the content of the drawing document acquired by the drawing document acquisition unit 2022 and the attribute information of each key phrase extracted by the key phrase extraction unit 2051 from the invention document acquired by the invention document acquisition unit 2021. A drawing code list generation process for generating a drawing code list is executed based on the items such as "code". The drawing code list generated by the translation unit 2054 is included in the patent application related information output by the invention document analysis system 20, for example.

翻訳部2054は、図面符号リスト生成処理として、図面文書取得部2022により例えば検索可能PDFファイル等から取得された図面文書における各図面について、図面番号順に、例えば、その図面番号と、その図面で使用されている各符号と、その各符号に対応する重要語句と、その重要語句について対応する対応翻訳語又は翻訳語候補集合とを列挙した図面符号リストを生成する。図面符号リストにおける各図面についての各符号は、予め定められた順序(例えば自然順等のソート結果に従った順序)で記載される。具体的な一例としての図面符号リストの1行目は、「図1:1 生体情報処理システム biological information processing system、10 生体センサ biometric sensor、20 記録部 storage unit、30 処理部 processing unit、・・・」であり、2行目は、「図2:S101 センシングステップ sensing step、S102 記録ステップ storing step、S103 処理ステップ processing step、・・・」である。 As drawing code list generation processing, the translation unit 2054 performs drawing code list generation processing for each drawing in the drawing document acquired by the drawing document acquisition unit 2022 from, for example, a searchable PDF file, in the order of the drawing number. A drawing code list is generated that lists each code that is used, key phrases corresponding to each code, and a corresponding translation word or translation word candidate set corresponding to the key phrase. Each code for each drawing in the drawing code list is described in a predetermined order (for example, an order according to sorting results such as natural order). As a specific example, the first line of the drawing code list is "Figure 1: 1 biological information processing system, 10 biological sensor biometric sensor, 20 recording unit storage unit, 30 processing unit processing unit, ... , and the second line is "Fig. 2: S101 sensing step, S102 recording step, storing step, S103 processing step, ...".

翻訳部2054は、図面符号リストに、図面文書における各図面について、符号に対応する重要語句以外のその図面に記載されている文字列と、その文字列を、翻訳用学習モデル等を用いて機械翻訳した結果とを、付記することとしてもよい。これにより、図面符号リストは、図面の翻訳(つまり図面の中の説明の翻訳)に有用な情報となり得る。 For each drawing in the drawing document, the translation unit 2054 stores in the drawing code list the character strings described in the drawing other than the important words and phrases corresponding to the code, and the character strings using a learning model for translation or the like. The result of translation may also be added. As a result, the drawing code list can be useful information for translating drawings (that is, translating explanations in the drawings).

[3-1-5-11-6.表示用文書における図面符号リスト部分の生成]
発明文書分析システム20において出力部208が、図面符号リストを含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、翻訳部2054は、表示用文書としての特許出願関連情報に含まれる図面符号リストを生成する。
[3-1-5-11-6. Generation of drawing code list part in display document]
When the output unit 208 in the invention document analysis system 20 outputs the patent application related information including the drawing code list as a display document (for example, an HTML document), the translation unit 2054 outputs the patent application related information as the display document. Generate a drawing code list included in the information.

翻訳部2054が生成する、表示用文書としての特許出願関連情報の図面符号リストの部分は、例えば、図面符号リストにおける各行の内容に対応する、1つ以上の表示要素を含み、その各行内に、図面番号があればその図面番号に対応する表示要素を含み、その各行内に、重要語句抽出部2051により抽出された重要語句があればその重要語句に対応する表示要素を含み、その各行内に、その重要語句に対応する対応翻訳語又は翻訳語候補集合があれば対応翻訳語又は翻訳語候補集合に対応する表示要素を含み、その各行内に、符号があればその符号に対応する表示要素を含む。具体例としては、翻訳部2054は、HTML文書において、図面符号リストを<article>タグと</article>タグとで挟んで記述する場合においてその<article>タグ配下に、その図面符号リストの各行について、その行に対応する表示要素を、<span>タグと</span>タグとでその行の内容を挟むことで記述し、その1つの行に対応する表示要素の<span>タグ配下に、その行内の図面番号、重要語句、対応翻訳語、翻訳語候補集合、或いは、符号について、対応する表示要素を、<span>タグと</span>タグとでその図面番号、重要語句、対応翻訳語、翻訳語候補集合、或いは、符号を挟むことで記述する。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。表示用文書における図面符号リスト部分に含まれる各行に対応する各表示要素は、例えば、その対応する行の内容を表示可能にする。図30の一部は、ブラウザに表示された表示用文書としての特許出願関連情報における図面符号リストの一例を示す。 The part of the drawing code list of the patent application related information as a display document generated by the translation unit 2054 includes, for example, one or more display elements corresponding to the contents of each line in the drawing code list, and in each line , if there is a drawing number, it contains a display element corresponding to that drawing number, if there is an important phrase extracted by the important phrase extraction unit 2051 in each line, it contains a display element corresponding to that important phrase, and in each line contains a display element corresponding to the corresponding translation word or translation word candidate set if there is a corresponding translation word or translation word candidate set corresponding to the important phrase, and if there is a code in each line, a display corresponding to the code contains elements. As a specific example, when a drawing code list is described sandwiched between <article> and </article> tags in an HTML document, the translation unit 2054 adds each line of the drawing code list under the <article> tag. , the display element corresponding to the line is described by sandwiching the content of the line between the <span> tag and the </span> tag, and the display element corresponding to the one line <span> tag , the drawing number, important phrase, corresponding translation word, translation word candidate set, or code in that line, the corresponding display element is displayed with the <span> tag and </span> tag. A translation word, a translation word candidate set, or a description with a code in between. For example, a browser may interpret the presentation document to display each presentation element. Each display element corresponding to each line included in the drawing code list portion of the display document allows, for example, the contents of the corresponding line to be displayed. Part of FIG. 30 shows an example of a drawing code list in patent application related information as a display document displayed on the browser.

翻訳部2054は、表示用文書における図面符号リストに含まれる図面番号、重要語句、対応翻訳語、翻訳語候補集合、或いは、符号に対応する表示要素に、例えば、その図面番号、重要語句、対応翻訳語、翻訳語候補集合、或いは、符号についての、表示態様の制御(例えば強調表示、色付き表示、表示遷移等)をするための表示制御情報を付加する。表示用文書における図面符号リスト部分の重要語句又は符号に対応する表示要素に付加される表示制御情報については、例えば、表示用文書における符号リスト部分の重要語句又は符号についての表示要素に付加された表示制御情報と同様である。表示用文書における図面符号リスト部分の図面番号に対応する表示要素に付加される表示制御情報については、例えば、表示用文書における明細書情報部分の図面番号の記載についての表示要素に付加された表示制御情報と同様である。また、表示用文書における図面符号リスト部分の対応翻訳語又は翻訳語候補集合に対応する表示要素に付加される表示制御情報については、例えば、表示用文書における各種翻訳情報部分の対応翻訳語又は翻訳語候補集合についての表示要素に付加された表示制御情報と同様である。 The translation unit 2054 translates the drawing numbers, key words, corresponding translation words, translation word candidate sets, or display elements corresponding to the codes included in the drawing code list in the document for display into, for example, the drawing numbers, key words, correspondence Display control information for controlling the display mode (for example, highlighted display, colored display, display transition, etc.) of a translation word, a translation word candidate set, or a code is added. For the display control information added to the display elements corresponding to the key phrases or codes in the drawing code list portion of the document for display, for example, This is the same as display control information. For the display control information added to the display element corresponding to the drawing number in the drawing code list part of the display document, for example, the display added to the display element for the description of the drawing number in the specification information part of the display document Similar to control information. The display control information added to the display element corresponding to the corresponding translation word or translation word candidate set of the drawing code list part in the display document is, for example, the corresponding translation word or translation of various translation information parts in the display document It is similar to the display control information added to display elements for word candidate sets.

[3-1-5-11-7.重要語句関係翻訳情報の生成]
翻訳部2054は、例えば、要素間関係判別部2058により生成された重要語句関係情報に基づいて、その重要語句関係情報における重要語句を、その重要語句について対応する対応翻訳語又は翻訳語候補集合に置換した重要語句関係翻訳情報を生成する。翻訳部2054は、例えば、重要語句関係翻訳情報における対応翻訳語又は翻訳語候補集合に、対応する重要語句を付記してもよい。翻訳部2054により生成される重要語句関係翻訳情報は、例えば、発明文書分析システム20が出力する特許出願関連情報に含まれる。
[3-1-5-11-7. Generating important word-related translation information]
For example, based on the important phrase relation information generated by the inter-element relation determination unit 2058, the translation unit 2054 converts the important phrases in the important phrase relation information into corresponding translation words or a translation word candidate set corresponding to the important phrases. Generate the replaced key phrase related translation information. The translation unit 2054 may, for example, add a corresponding key word to the corresponding translation word or translation word candidate set in the key word related translation information. The key word related translation information generated by the translation unit 2054 is included in the patent application related information output by the invention document analysis system 20, for example.

翻訳部2054が生成する重要語句関係翻訳情報は、要素間関係判別部2058により生成された包含関係情報における重要語句を対応翻訳語又は翻訳語候補集合に置換した包含関係翻訳情報を含む。翻訳部2054が生成する重要語句関係翻訳情報は、例えば、要素間関係判別部2058により生成された記録関係情報における重要語句を対応翻訳語又は翻訳語候補集合に置換した記録関係翻訳情報を含み得る。翻訳部2054が生成する重要語句関係翻訳情報は、例えば、要素間関係判別部2058により生成されたプログラム実現関係情報における重要語句を対応翻訳語又は翻訳語候補集合に置換したプログラム実現関係翻訳情報を含み得る。翻訳部2054が生成する重要語句関係翻訳情報は、例えば、要素間関係判別部2058により生成された等価関係情報における重要語句を対応翻訳語又は翻訳語候補集合に置換した等価関係翻訳情報を含み得る。翻訳部2054が生成する重要語句関係翻訳情報は、例えば、要素間関係判別部2058により生成された上下概念関係情報における重要語句を対応翻訳語又は翻訳語候補集合に置換した上下概念関係翻訳情報を含み得る。 The important word relation translation information generated by the translation unit 2054 includes inclusion relation translation information obtained by replacing the key words in the inclusion relation information generated by the inter-element relation determination unit 2058 with corresponding translation words or a translation word candidate set. The important phrase relational translation information generated by the translation unit 2054 can include, for example, record relation translation information obtained by replacing the key phrases in the record relation information generated by the inter-element relation determination unit 2058 with corresponding translation words or translation word candidate sets. . The important phrase relation translation information generated by the translation unit 2054 is, for example, the program realization relation translation information obtained by replacing the important phrases in the program realization relation information generated by the inter-element relation determination unit 2058 with corresponding translation words or translation word candidate sets. can contain. The important phrase relationship translation information generated by the translation unit 2054 can include, for example, equivalent relationship translation information obtained by replacing the important phrases in the equivalence relationship information generated by the inter-element relationship determination unit 2058 with corresponding translation words or translation word candidate sets. . The important phrase relationship translation information generated by the translation unit 2054 is, for example, the hierarchical concept relationship translation information in which the important phrases in the hierarchical concept relationship information generated by the inter-element relationship determination unit 2058 are replaced with corresponding translation words or translation word candidate sets. can contain.

発明文書分析システム20において出力部208が、重要語句関係翻訳情報を含む特許出願関連情報を、表示用文書(例えばHTML文書)として出力する場合には、翻訳部2054は、表示用文書としての特許出願関連情報に含まれる重要語句関係翻訳情報を生成する。翻訳部2054が生成する、表示用文書としての特許出願関連情報の重要語句関係翻訳情報部分は、例えば、重要語句についての対応翻訳語又は翻訳語候補集合毎に対応する表示要素を含む。例えば、ブラウザによって、表示用文書が解釈されて、各表示要素が表示され得る。翻訳部2054は、例えば、重要語句についての対応翻訳語又は翻訳語候補集合毎に対応する表示要素には、表示態様の制御等を行うための表示制御情報を付加し得る。 When the output unit 208 in the invention document analysis system 20 outputs the patent application-related information including the key word related translation information as a display document (for example, an HTML document), the translation unit 2054 outputs the patent as a display document. Generate key word related translation information included in the application related information. The key word-related translation information portion of the patent application-related information as a document for display generated by the translation unit 2054 includes, for example, display elements corresponding to corresponding translation words or sets of translation word candidates for key words. For example, a browser may interpret the presentation document to display each presentation element. For example, the translation unit 2054 can add display control information for controlling the display mode, etc., to display elements corresponding to corresponding translation words or translation word candidate sets for important phrases.

[3-1-5-12.集計情報の生成]
分析部205は、例えば、発明文書取得部2021により取得された発明文書に基づいて算定された値を表す集計情報を生成し得る。分析部205により生成される集計情報は、出力部208により出力される特許出願関連情報に含まれ得る。
[3-1-5-12. Generate Aggregate Information]
The analysis unit 205 can generate aggregate information representing values calculated based on the invention documents acquired by the invention document acquisition unit 2021, for example. The aggregated information generated by the analysis unit 205 can be included in the patent application related information output by the output unit 208 .

分析部205は、例えば、発明文書取得部2021により取得された発明文書におけるクレームの項数、独立項の項数、各項毎の文字数等の計数結果を、各々識別可能に表現して、集計情報に含める。 The analysis unit 205 expresses, for example, the number of claims in the invention document acquired by the invention document acquisition unit 2021, the number of independent claims, the number of characters in each term, and the like, in an identifiable manner, and aggregates them. Include in information.

分析部205は、例えば、発明文書取得部2021により取得された発明文書の明細書についての行数、文の数、段落数、全文字数、1文当たりの平均文字数等の計数結果を、各々識別可能に表現して、集計情報に含める。 For example, the analysis unit 205 identifies count results such as the number of lines, the number of sentences, the number of paragraphs, the total number of characters, the average number of characters per sentence, etc. of the specification of the invention document acquired by the invention document acquisition unit 2021. Expressed as possible and included in aggregate information.

分析部205は、例えば、クレーム翻訳情報又は修正版クレーム翻訳情報における全ての完全翻訳行の語句(word)の数の総和、明細書翻訳情報又は修正版明細書翻訳情報における全ての完全翻訳行の語句の数の総和、明細書翻訳情報又は修正版明細書翻訳情報における全て完全翻訳行の1文当たりの平均語句数等の計数結果を、各々識別可能に表現して、集計情報に含める。 Analysis unit 205, for example, the sum of the number of words in all the complete translation lines in the claim translation information or the modified version of the claim translation information, Count results such as the sum of the number of words, the average number of words per sentence of all completely translated lines in the translation information of the specification or the translation information of the revised specification are identifiably expressed and included in the total information.

分析部205は、例えば、発明文書取得部2021により取得された発明文書におけるクレームから重要語句抽出部2051により抽出された重要語句各々についての、その発明文書の明細書の「発明を実施するための形態」の欄におけるその重要語句の記載数の計数結果を、集計情報に含める。 The analysis unit 205, for example, for each key phrase extracted by the key phrase extraction unit 2051 from the claims in the invention document acquired by the invention document acquisition unit 2021, the specification of the invention document " The results of counting the number of entries of the key phrase in the "Form" column are included in the aggregated information.

分析部205は、例えば、ユーザによる指定又は設定情報取得部201により取得された設定情報における指定等に基づいて発明文書取得部2021により取得された複数の発明文書全体における、上述した各種情報(例えばクレームの項数、明細書についての1文当たりの平均文字数等)の平均値の算定結果を、集計情報に含める。 For example, the analysis unit 205 analyzes the above-described various information (for example, The number of claims, the average number of characters per sentence in the specification, etc.) are included in the aggregated information.

分析部205は、例えば、ユーザによる指定又は設定情報取得部201により取得された設定情報における指定等に基づいて発明文書取得部2021により取得された複数の発明文書間の、各発明文書から重要語句抽出部2051により抽出された各重要語句群に基づいて算定した相関性の評価値(例えば相関係数の算定結果)を、集計情報に含める。分析部205は、例えば、この相関性の評価値の算定において、重要語句群における各重要語句について重要度決定部2055により決定された重要度による重み付けを行って評価値を算定することとしてもよい。 For example, the analysis unit 205 extracts key phrases from each invention document among a plurality of invention documents acquired by the invention document acquisition unit 2021 based on the specification by the user or the specification in the setting information acquired by the setting information acquisition unit 201. The correlation evaluation value (for example, the calculation result of the correlation coefficient) calculated based on each important word/phrase group extracted by the extraction unit 2051 is included in the total information. For example, in calculating the correlation evaluation value, the analysis unit 205 may calculate the evaluation value by weighting each key phrase in the key phrase group based on the degree of importance determined by the importance determination unit 2055. .

分析部205は、例えば、発明文書取得部2021により取得された発明文書から重要語句抽出部2051により抽出された各重要語句のうち、選択操作等によって対応翻訳語が決定されている重要語句について、その対応翻訳語と、その発明文書と同一分類のグループに属する別の複数の発明文書においてその重要語句に対応して選択操作等で決定された各対応翻訳語とその決定の割合とを示す、対応翻訳語句比較情報を、集計情報に含めることとしてもよい。 For example, the analysis unit 205 extracts key phrases extracted by the key phrase extraction unit 2051 from the invention documents acquired by the invention document acquisition unit 2021, and for key phrases for which corresponding translated words have been determined by a selection operation or the like, Indicate the corresponding translation word, each corresponding translation word determined by selection operation etc. corresponding to the important word in a plurality of different invention documents belonging to the same classification group as the invention document, and the ratio of the determination, Corresponding translation word/phrase comparison information may be included in total information.

[3-1-5-13.料金情報の生成]
分析部205は、例えば、発明文書取得部2021により取得された発明文書について、日本国への特許出願を行う場合に必要となる各種費用を算定して、算定結果を示す料金情報を生成し得る。分析部205により生成される料金情報は、出力部208により出力される特許出願関連情報に含まれ得る。
[3-1-5-13. Generate charge information]
For example, the analysis unit 205 can calculate various costs required to file a patent application in Japan for the invention document acquired by the invention document acquisition unit 2021, and generate fee information indicating the calculation result. . The fee information generated by the analysis unit 205 can be included in the patent application related information output by the output unit 208 .

分析部205は、例えば、特許出願料を、料金情報に含める。分析部205は、例えば、出願審査請求料を、発明文書のクレームにおける項数に応じて算定して、料金情報に含める。分析部205は、例えば、発明文書のクレームを修正して表した修正版クレーム情報中のクレームにおける項数に応じて算定した、修正版クレーム情報を出願に用いた場合の出願審査請求料を、料金情報に付記してもよい。分析部205は、例えば、各期間における特許料を、発明文書のクレームにおける項数に応じて算定して、料金情報に含める。分析部205は、例えば、発明文書のクレームを修正して表した修正版クレーム情報中のクレームにおける項数に応じて算定した、修正版クレーム情報を出願に用いた場合の、各期間における特許料を、料金情報に付記してもよい。 The analysis unit 205 includes, for example, the patent application fee in the fee information. The analysis unit 205, for example, calculates the examination request fee according to the number of claims in the invention document and includes it in the fee information. The analysis unit 205 calculates, for example, according to the number of claims in the claims in the amended claim information representing the amended claims of the invention document, the application examination request fee when the amended claim information is used in the application, It may be added to the charge information. For example, the analysis unit 205 calculates the patent fee for each period according to the number of terms in the claims of the invention document and includes it in the fee information. For example, the analysis unit 205 calculates the patent fee for each period when the modified claim information is used in the application, which is calculated according to the number of terms in the claims in the modified claim information that represents the claims of the invention document by modifying. may be added to the charge information.

分析部205は、例えば、発明文書取得部2021により取得された発明文書について、発明文書に基づくクレームの項数、独立項の項数その他の各種集計結果等を用いて、米国その他の地域への特許出願を行う場合に必要となる各種費用を算定して、その算定結果を、日本国への特許出願を行う場合に係る各種費用と識別可能に表現して、料金情報に付加してもよい。 For example, the analysis unit 205 analyzes the invention document acquired by the invention document acquisition unit 2021 by using the number of claims based on the invention document, the number of independent claims, and various other aggregated results, etc., to the United States and other regions. It is possible to calculate the various costs required for filing a patent application, express the calculation results in a way that they can be identified from the various costs related to filing a patent application in Japan, and add them to the fee information. .

[3-1-6.機械学習部]
機械学習部207は、実施形態1で示した機械学習部107を一部変形したものであり、ここで特に示さない点については、機械学習部107と同様である。
[3-1-6. Machine Learning Department]
The machine learning unit 207 is a partial modification of the machine learning unit 107 shown in the first embodiment, and is the same as the machine learning unit 107 except for points not specifically shown here.

機械学習部207は、複数の発明文書各々に対する分析部205による分析結果を利用して、機械学習により、発明文書の処理に関わる学習モデルを生成して、学習モデルを保持して管理する。この機械学習は、例えば、一般的な機械学習アルゴリズムを用い、一定の相関関係を有する、発明文書、又は、発明文書の文と、これに対応する翻訳結果文書、又は、翻訳結果文書における文との組を教師データとした演算処理により実現され、或いは、重要語句と、これに対応する対応翻訳語との組を教師データとした演算処理により実現され、或いは、発明文書から抽出された重要語句群と、発明文書が属する技術分野との組を教師データとした演算処理により実現される。 The machine learning unit 207 uses the analysis results of the analysis unit 205 for each of a plurality of invention documents to generate learning models related to the processing of invention documents by machine learning, and holds and manages the learning models. This machine learning, for example, uses a general machine learning algorithm, and has a certain correlation with the invention document or the sentence of the invention document and the corresponding translation result document or the sentence in the translation result document or realized by arithmetic processing using a set of important phrases and their corresponding translated words as teaching data, or important phrases extracted from invention documents. This is realized by arithmetic processing using pairs of groups and technical fields to which invention documents belong as teacher data.

機械学習部207が生成する学習モデルは、例えば、発明文書の機械翻訳のための翻訳用学習モデル、発明文書から重要語句抽出部2051により抽出される重要語句の機械翻訳のための重要語句翻訳用学習モデル、或いは、発明文書の属する技術分野を特定するための技術分野特定用学習モデルである。機械学習部207が生成する学習モデルは、例えば演算等の処理に利用可能なデータ群であり、例えばデータベースにおけるデータ群等として実装され得る。 The learning model generated by the machine learning unit 207 includes, for example, a translation learning model for machine translation of invention documents, and a key phrase translation model for machine translation of key phrases extracted from invention documents by the key phrase extraction unit 2051. It is a learning model, or a learning model for specifying a technical field for specifying the technical field to which an invention document belongs. The learning model generated by the machine learning unit 207 is, for example, a data group that can be used for processing such as calculation, and can be implemented, for example, as a data group in a database.

機械学習部207は、機械学習の学習モデル生成等の処理に、例えば、Python(登録商標)の機械学習用の各種ライブラリ(例えばサードパーティにより提供されているscikit-learnライブラリ等)を利用する。 The machine learning unit 207 uses, for example, various Python (registered trademark) machine learning libraries (eg, a scikit-learn library provided by a third party) for processing such as machine learning learning model generation.

機械学習部207は、文書評価部2071と、教師データ蓄積部2072と、学習モデル管理部2073とを含む。 Machine learning unit 207 includes document evaluation unit 2071 , teacher data storage unit 2072 , and learning model management unit 2073 .

[3-1-6-1.翻訳用学習モデルの生成]
以下、機械学習部207が生成する翻訳用学習モデルに着目して、機械学習部207及び関連する各部について説明する。
[3-1-6-1. Generation of learning model for translation]
Focusing on the learning model for translation generated by the machine learning unit 207, the machine learning unit 207 and related units will be described below.

文書評価部2071は、発明文書取得部2021により取得された発明文書について、分析部205による分析結果として生成される発明文書評価情報に基づいて、評価する。文書評価部2071は、例えば、発明文書に対して警告情報生成部2059が生成した発明文書評価情報が含む評価値が0から1までの数値で表されるとした場合においては、その評価値が予め定めた閾値(例えば0.8)を超えるか否かにより、その発明文書が翻訳用学習モデルの生成に利用できる程度に適正か否かを評価することで、翻訳用学習モデルの生成に利用できる発明文書を選出する。不適切な発明文書は、正確な翻訳を妨げる可能性があり、結果的に、翻訳によりその発明文書の内容とは多少異なる内容の翻訳結果文書が生成される可能性があり、教師データとしての利用に適さない可能性がある。このため、機械学習部207では、文書評価部2071により、選出された発明文書(つまり適正と評価された発明文書)を、翻訳用学習モデルの生成のための機械学習用の教師データの一部として利用する。 The document evaluation unit 2071 evaluates the invention document acquired by the invention document acquisition unit 2021 based on invention document evaluation information generated as an analysis result by the analysis unit 205 . For example, if the evaluation value included in the invention document evaluation information generated by the warning information generation unit 2059 for the invention document is represented by a numerical value from 0 to 1, the document evaluation unit 2071 Use for generating a learning model for translation by evaluating whether or not the invention document is appropriate enough to be used for generating a learning model for translation based on whether or not it exceeds a predetermined threshold value (for example, 0.8). Select invention documents that can be Inappropriate invention documents may hinder accurate translation, and as a result, the translation may generate a translation result document with content slightly different from the content of the invention document. May not be suitable for use. Therefore, in the machine learning unit 207, the document evaluation unit 2071 converts the selected invention documents (in other words, invention documents evaluated as appropriate) into part of the teacher data for machine learning for generating the learning model for translation. Use as

教師データ蓄積部2072は、文書評価部2071により、翻訳用学習モデルの生成に利用できる程度に適正と評価された発明文書と、例えばその発明文書に呼応する翻訳結果文書を与えるシステム運用等を前提として、翻訳結果文書取得部2023により取得された、その発明文書に呼応すると想定される翻訳結果文書との組を、翻訳用学習モデルの生成のための機械学習用の教師データとして、記録媒体等に蓄積して、保持する。例えば、適正と評価された発明文書と、その発明文書に基づいて翻訳者により生成された翻訳結果文書とを、各々、発明文書取得部2021、翻訳結果文書取得部2023に、取得させると、教師データ蓄積部2072は、その発明文書と翻訳結果文書との組を教師データとして蓄積する。また、翻訳先の言語を英語とした場合において、例えば、日本語で記載された国際出願の国際公開公報を発明文書取得部2021に発明文書として取得させ、その発明文書が文書評価部2071により適正と評価されたときに、その国際出願を米国等の英語を用いる指定国の国内段階に移行するために英語に翻訳した翻訳結果文書に相当する内容が掲載された、その指定国の官庁等により公開された文書を翻訳結果文書取得部2023に取得させることで、教師データ蓄積部2072は、その発明文書と翻訳結果文書との組を教師データとして蓄積する。 The teacher data accumulation unit 2072 is based on the assumption that the document evaluation unit 2071 provides the invention document evaluated as appropriate enough to be used for generating a learning model for translation and, for example, the translation result document corresponding to the invention document. , the combination of the translation result document that is assumed to correspond to the invention document acquired by the translation result document acquisition unit 2023 is used as teacher data for machine learning for generating a learning model for translation, and is stored in a recording medium, etc. stored in and retained. For example, if an invention document evaluated as appropriate and a translation result document generated by a translator based on the invention document are acquired by the invention document acquisition unit 2021 and the translation result document acquisition unit 2023, respectively, the teacher The data accumulation unit 2072 accumulates the combination of the invention document and the translation result document as teacher data. In addition, when the translation destination language is English, for example, the invention document acquisition unit 2021 acquires the international publication of the international application written in Japanese as the invention document, and the document evaluation unit 2071 determines that the invention document is correct. by the office of the designated country, etc., in which the content equivalent to the translation result document translated into English in order to enter the national phase of the designated country that uses English, such as the United States, when it is evaluated as By causing the translation result document acquisition unit 2023 to acquire the published document, the training data accumulation unit 2072 accumulates a combination of the invention document and the translation result document as training data.

不適正な発明文書の翻訳においては、翻訳者が発明文書の不適正な記載内容を修正して翻訳する可能性があり、また、翻訳者が、発明文書中の不適切な記載で表された部分の内容を理解できずに、誤って翻訳する可能性がある。従って、不適正な発明文書と、その発明文書の翻訳により生成された翻訳結果文書とは、言語が異なる他に、内容が相違する関係にある可能性がある。これに対して、文書評価部2071により適正と評価された発明文書と、その翻訳結果である翻訳結果文書とは、言語が異なる他は、内容が同一である関係にある可能性が比較的高く、その発明文書と翻訳結果文書との組は、機械学習のための教師データに適している可能性が比較的高い。 In the translation of an inappropriate invention document, there is a possibility that the translator will correct the inappropriate description content of the invention document and translate it, and the translator may There is a possibility that the content of the part cannot be understood and translated incorrectly. Therefore, there is a possibility that an inappropriate invention document and a translation result document generated by translating the invention document have different contents in addition to different languages. On the other hand, there is a relatively high possibility that the invention document evaluated as appropriate by the document evaluation unit 2071 and the translation result document, which is the translation result thereof, have the same content except for the language. , the combination of the invention document and the translation result document is relatively likely to be suitable for training data for machine learning.

発明文書分析システム20の利用が繰り返されることで、複数(例えば数百、数千等)の発明文書及び翻訳結果文書が取得されるようになり、教師データ蓄積部2072により、複数の教師データが記録媒体等に蓄積され得る。なお、教師データ蓄積部2072が、教師データを蓄積している記録媒体等に、他の幾つかの発明文書分析システム20において蓄積されている教師データを収集して追加的に格納するような運用も可能である。また、機械学習用の教師データとしての発明文書と翻訳結果文書との組は、文単位であってもよい。つまり、教師データ蓄積部2072は、発明文書の各文について、その文と、その文に呼応する翻訳結果文書の文との組を、機械学習用の教師データとして蓄積してもよい。発明文書における1文は、例えば、改行、句点文字「。」等により、区切ることができ、英語の翻訳結果文書における1文は、例えば、改行、ピリオド「.」等により、区切ることができる。 By repeatedly using the invention document analysis system 20, a plurality (for example, hundreds, thousands, etc.) of invention documents and translation result documents are acquired, and the teacher data storage unit 2072 stores a plurality of teacher data. It can be stored in a recording medium or the like. Note that the training data accumulation unit 2072 collects and additionally stores training data accumulated in several other invention document analysis systems 20 in a recording medium or the like storing training data. is also possible. Also, a set of an invention document and a translation result document as teacher data for machine learning may be in units of sentences. In other words, the teacher data storage unit 2072 may store, as teacher data for machine learning, a set of each sentence of the invention document and a corresponding sentence of the translation result document. A sentence in the invention document can be separated by, for example, a line feed, a period character ".", etc., and a sentence in the English translation result document can be separated by, for example, a line feed, a period ".", or the like.

教師データ蓄積部2072は、例えば、各教師データとしての一組の発明文書と翻訳結果文書との各々に、重要語句抽出部2051で抽出されたいずれかの重要語句に対応する符号が記載されている場合には、その符号を除去し、除去後の発明文書と翻訳結果文書との組を機械学習用の教師データとして、記録媒体等に蓄積することとしてもよい。これにより、翻訳段階での符号の記載漏れが生じる場合、或いは、発明文書で符号の記載漏れに対して翻訳段階で符号を追記することが生じる場合に、翻訳用学習モデルを生成するための機械学習に悪影響を及ぼさないようにすることが可能となり得る。 The training data accumulation unit 2072 stores, for example, a code corresponding to one of the important phrases extracted by the important phrase extraction unit 2051 in each set of invention document and translation result document as training data. If there is, the code may be removed, and the combination of the invention document and the translation result document after removal may be stored in a recording medium or the like as teacher data for machine learning. As a result, a machine for generating a learning model for translation when omission of description of a code occurs at the translation stage, or when a code is added at the translation stage to an omission of description of a code in an invention document. It may be possible to avoid adversely affecting learning.

機械学習部207は、教師データ蓄積部2072に蓄積された、翻訳用学習モデルの生成のための機械学習用の複数の教師データを用いた機械学習により、発明文書の機械翻訳のための翻訳用学習モデルを生成する。機械学習部207により生成された翻訳用学習モデルは、発明文書の文に基づいて翻訳結果としての文を予測するために利用可能であり、例えば、翻訳部2054における機械翻訳等に利用され得る。 The machine learning unit 207 performs machine learning using a plurality of teacher data for machine learning for generating a learning model for translation, which are accumulated in the teacher data accumulation unit 2072. Generate a learning model. The learning model for translation generated by the machine learning unit 207 can be used to predict a sentence as a translation result based on the sentence of the invention document, and can be used for machine translation in the translation unit 2054, for example.

教師データ蓄積部2072は、教師データとして蓄積する発明文書と翻訳結果文書との組を、発明文書のクレームと翻訳結果文書のクレームとの組と、発明文書の明細書と翻訳結果文書の明細書との組とに区別してもよい。この場合には、機械学習部207は、教師データ蓄積部2072に蓄積された複数のクレームに係る教師データを用いた機械学習により、発明文書のクレームの翻訳用の翻訳用学習モデルを生成し、教師データ蓄積部2072に蓄積された複数の明細書に係る教師データを用いた機械学習により、発明文書の明細書の翻訳用の翻訳用学習モデルを生成し得る。機械学習部207が、教師データを用いた機械学習により翻訳用学習モデルを生成する時期はいつであってもよい。機械学習部207は、例えば、教師データ蓄積部2072における教師データを蓄積する記録媒体の記録領域の内容としての教師データに変動がある度に、各教師データを用いた機械学習により、翻訳用学習モデルを生成することとしてもよいし、一定周期で、その記録領域の内容としての教師データの変動を確認してその変動が確認された場合に、各教師データを用いた機械学習により、翻訳用学習モデルを生成することとしてもよい。 The teacher data storage unit 2072 stores pairs of invention documents and translation result documents stored as teacher data as pairs of claims of the invention documents and translation result documents, and specifications of the invention documents and translation result documents. You may distinguish between a set of In this case, the machine learning unit 207 generates a translation learning model for translating the claims of the invention document by machine learning using training data related to a plurality of claims accumulated in the training data accumulation unit 2072, A translation learning model for translating the specification of an invention document can be generated by machine learning using teacher data relating to a plurality of specifications accumulated in the teacher data accumulation unit 2072 . The machine learning unit 207 may generate a learning model for translation by machine learning using teacher data at any time. The machine learning unit 207, for example, every time there is a change in the teacher data as the content of the recording area of the recording medium storing the teacher data in the teacher data storage unit 2072, the machine learning unit 207 performs translation learning by machine learning using each teacher data. It is also possible to generate a model, or to check the variation of the teacher data as the content of the recording area at a certain period, and when the variation is confirmed, machine learning using each teacher data is used for translation. A learning model may be generated.

教師データ蓄積部2072は、発明文書のクレームと翻訳結果文書のクレームとの組の代わりに、その発明文書についてクレーム情報生成部205aにより生成されたクレーム情報と、翻訳結果文書のクレームとの組を、教師データとして蓄積することとしてもよいし、その発明文書についてクレーム情報生成部205aにより生成された修正版クレーム情報と、翻訳結果文書のクレームとの組を、教師データとして蓄積することとしてもよい。教師データ蓄積部2072は、クレームの各項の数及び各項の引用関係等の予め定めた共通性判定基準に基づいて、クレーム情報と修正版クレーム情報とのうち、翻訳結果文書のクレームとの共通性の高い方を選択して、選択した方と、翻訳結果文書のクレームとの組を、教師データとして蓄積することとしてもよい。また、教師データ蓄積部2072は、クレーム情報と修正版クレーム情報とに、既に生成済みの翻訳用学習モデルを用いた機械翻訳を施し、その機械翻訳結果と翻訳結果文書のクレームとの差異が小さい方の機械翻訳の基礎となった、クレーム情報と修正版クレーム情報とのうちの一方と、翻訳結果文書のクレームとの組を、教師データとして蓄積することとしてもよい。 The teacher data storage unit 2072 stores a set of the complaint information generated by the complaint information generation unit 205a for the invention document and the complaint of the translation result document instead of the set of the complaint of the invention document and the complaint of the translation result document. , may be stored as training data, or a set of the modified complaint information generated by the complaint information generation unit 205a for the invention document and the complaint of the translation result document may be stored as training data. . The teacher data accumulation unit 2072 selects the complaint information and the modified version complaint information based on the number of each clause of the complaint and the predetermined commonality determination criteria such as the citation relationship of each clause, and compares the complaint with the complaint of the translation result document. It is also possible to select the one with the highest commonality, and accumulate a set of the selected one and the complaint of the translation result document as training data. In addition, the teacher data storage unit 2072 performs machine translation on the complaint information and the corrected version complaint information using a translation learning model that has already been generated, and the difference between the result of the machine translation and the complaint in the translation result document is small. A set of one of the complaint information and the modified version complaint information, which is the basis of the machine translation of the first machine translation, and the complaint of the translation result document may be stored as teacher data.

教師データ蓄積部2072は、教師データとして蓄積する発明文書の明細書と翻訳結果文書の明細書との組の代わりに、その発明文書について明細書情報生成部205bにより生成された明細書情報と、翻訳結果文書の明細書との組を、教師データとして蓄積することとしてもよいし、その発明文書について明細書情報生成部205bにより生成された修正版明細書情報と、翻訳結果文書の明細書との組を、教師データとして蓄積することとしてもよい。教師データ蓄積部2072は、明細書の全行数、段落番号等の予め定めた共通性判定基準に基づいて、明細書情報と修正版明細書情報とのうち、翻訳結果文書の明細書との共通性の高い方を選択して、選択した方と、翻訳結果文書の明細書との組を、教師データとして蓄積することとしてもよい。また、教師データ蓄積部2072は、明細書情報と修正版明細書情報とに、既に生成済みの翻訳用学習モデルを用いた機械翻訳を施し、その機械翻訳結果と翻訳結果文書の明細書との差異が小さい方の機械翻訳の基礎となった、明細書情報と修正版明細書情報とのうちの一方と、翻訳結果文書の明細書との組を、教師データとして蓄積することとしてもよい。 The teaching data storage unit 2072 stores the specification information generated by the specification information generation unit 205b for the invention document, instead of the set of the specification of the invention document and the specification of the translation result document to be stored as training data, A combination of the translation result document and the specification may be stored as training data, or the modified specification information generated by the specification information generation unit 205b for the invention document and the translation result document specification may be stored. may be stored as teacher data. The teacher data accumulation unit 2072 selects the translation result document from the specification information and the revised specification information based on predetermined commonality determination criteria such as the total number of lines and paragraph numbers in the specification. It is also possible to select the one with the highest degree of commonality, and accumulate a set of the selected one and the specification of the translation result document as teacher data. In addition, the training data accumulation unit 2072 performs machine translation using the translation learning model that has already been generated on the specification information and the corrected version specification information, and the result of the machine translation and the specification of the translation result document. A set of one of the specification information and the corrected version specification information, which is the basis of the machine translation with the smaller difference, and the specification of the translation result document may be stored as teacher data.

学習モデル管理部2073は、機械学習部207により生成された翻訳用学習モデルを記録媒体等に保持して管理する。学習モデル管理部2073は、機械学習部207により、クレームの翻訳用の翻訳用学習モデルと明細書の翻訳用の翻訳用学習モデルとが区別されて生成された場合には、各々を区別して記録媒体等に保持して管理する。学習モデル管理部2073は、機械学習部207により翻訳用学習モデルが生成される毎に、既に保持している翻訳用学習モデルを、生成された翻訳用学習モデルで上書き更新することとしてもよいし、各々の生成日時と対応付けて、最新の翻訳用学習モデルを含む、複数の生成された翻訳用学習モデル(例えば新しい順に予め定められた数の翻訳用学習モデル)を保持することとしてもよい。学習モデル管理部2073は、例えば、翻訳用学習モデルをデータベースに登録して管理してもよい。学習モデル管理部2073が保持する翻訳用学習モデルは出力部208により出力され得る。 The learning model management unit 2073 stores and manages the learning model for translation generated by the machine learning unit 207 in a recording medium or the like. When the machine learning unit 207 generates a translation learning model for claim translation and a translation learning model for translation of the specification separately, the learning model management unit 2073 records them separately. Store and manage on media, etc. Each time the machine learning unit 207 generates a translation learning model, the learning model management unit 2073 may overwrite and update the already held translation learning model with the generated translation learning model. , A plurality of generated translation learning models (for example, a predetermined number of translation learning models in order of newest), including the latest translation learning model, may be held in association with each generation date and time. . The learning model management unit 2073 may manage, for example, a translation learning model by registering it in a database. The learning model for translation held by the learning model management unit 2073 can be output by the output unit 208 .

[3-1-6-2.重要語句翻訳用学習モデルの生成]
以下、機械学習部207が生成する重要語句翻訳用学習モデルに着目して、機械学習部207及び関連する各部について説明する。
[3-1-6-2. Generation of learning model for key phrase translation]
The machine learning unit 207 and related units will be described below, focusing on the important phrase translation learning model generated by the machine learning unit 207 .

教師データ蓄積部2072は、重要語句設定辞書取得部203により取得された重要語句設定辞書(例えば発明文書の一部、その他のファイル等)における、対応翻訳語が付記された重要語句とその対応翻訳語との組を、重要語句翻訳用学習モデルの生成のための機械学習用の教師データとして、記録媒体等に蓄積して、保持する。教師データ蓄積部2072は、例えば、設定情報取得部201により取得された設定情報における翻訳補助情報の特定用情報に基づいて、翻訳補助情報を取得し、翻訳補助情報における重要語句と対応翻訳語との組を、重要語句翻訳用学習モデルの生成のための機械学習用の教師データとして、記録媒体等に蓄積して、保持してもよい。 The training data storage unit 2072 stores key words and phrases to which corresponding translated words are added and their corresponding translations in the key word setting dictionary acquired by the key word setting dictionary acquisition unit 203 (for example, a part of an invention document, other files, etc.). Pairs with words are accumulated and held in a recording medium or the like as teacher data for machine learning for generating a learning model for important phrase translation. The teacher data accumulation unit 2072 acquires the translation assistance information based on the identification information of the translation assistance information in the setting information acquired by the setting information acquisition unit 201, for example. may be accumulated and held in a recording medium or the like as teacher data for machine learning for generating a learning model for important phrase translation.

ところで、発明文書分析システム20では、発明文書取得部2021により取得された発明文書から重要語句抽出部2051により抽出された重要語句に対して翻訳語候補集合特定部20541により特定された翻訳語候補集合を表示要素として含む表示用文書が生成され、その表示要素はブラウザ等で表示される。翻訳部2054により、その表示要素に、操作に応じて翻訳語候補集合の要素を選択するGUI機能を実行するための表示制御情報が付加されており、ユーザにより、重要語句についての翻訳語候補集合から1つの要素の選択操作がなされ得る。これに対応して、教師データ蓄積部2072は、例えば、文書評価部2071により選出された発明文書(つまり適正と評価された発明文書)に基づいて表示用文書が生成されて翻訳語候補集合に係るGUI要素が表示された結果として、重要語句と、その重要語句についての翻訳語候補集合から選択操作された1つの要素との組を、重要語句翻訳用学習モデルの生成のための機械学習用の教師データとして、記録媒体等に蓄積して、保持し得る。なお、教師データ蓄積部2072は、例えば、文書評価部2071による評価に依らず、発明文書に基づいて表示用文書が生成されて翻訳語候補集合に係るGUI要素が表示された結果として、重要語句と、その重要語句についての翻訳語候補集合から選択操作された1つの要素との組を、重要語句翻訳用学習モデルの生成のための機械学習用の教師データとして、記録媒体等に蓄積して、保持することとしてもよい。文書評価部2071により適正と評価された発明文書は適切に理解される可能性が比較的高いことが想定されるので、適切と評価された発明文書における重要語句についての翻訳語候補集合からの選択操作に係る選択は、妥当性の比較的高い選択である可能性があり、その選択結果を教師データとして活用することは、より適切に重要語句翻訳用学習モデルを生成するために有用となり得る。 By the way, in the invention document analysis system 20, the translation word candidate set identified by the translation word candidate set identification section 20541 for the key phrase extracted by the key phrase extraction section 2051 from the invention document acquired by the invention document acquisition section 2021. is generated as a display element, and the display element is displayed by a browser or the like. Display control information for executing a GUI function for selecting an element of a translation word candidate set is added to the display elements by the translation unit 2054, and the user can select a translation word candidate set for an important phrase. A selection operation can be made of one element from . In response to this, the teacher data storage unit 2072 generates a document for display based on the invention document selected by the document evaluation unit 2071 (that is, the invention document evaluated as appropriate) and stores it in the translation word candidate set. As a result of displaying such GUI elements, a set of an important phrase and one element selected and operated from the translation word candidate set for the important phrase is used for machine learning for generating a learning model for translation of the important phrase. can be stored and held in a recording medium or the like as teaching data. Note that the training data accumulation unit 2072, for example, generates a display document based on the invention document without relying on the evaluation by the document evaluation unit 2071, and displays key phrases as a result of displaying the GUI elements related to the translation word candidate set. and one element selected from the translation word candidate set for that key word is stored in a recording medium or the like as teacher data for machine learning for generating a learning model for key word translation. , may be held. Since it is assumed that an invention document evaluated as appropriate by the document evaluation unit 2071 is likely to be properly understood, the important words in the invention document evaluated as appropriate are selected from the translation word candidate set. The selection related to the operation may be a selection with relatively high validity, and using the selection result as teacher data can be useful for generating a learning model for important phrase translation more appropriately.

また、教師データ蓄積部2072は、例えば、文書評価部2071により適正と評価された発明文書から重要語句抽出部2051により抽出された各重要語句について、その重要語句と、その発明文書に基づいて翻訳者により生成されて翻訳結果文書取得部2023により取得された翻訳結果文書から抽出したその重要語句に対応する翻訳語句との組を、重要語句翻訳用学習モデルの生成のための機械学習用の教師データとして、記録媒体等に蓄積して、保持し得る。教師データ蓄積部2072は、発明文書における重要語句に対応する、翻訳結果文書における翻訳語句の抽出を、例えば、既存の構文解析技術に基づいて行う。翻訳語句の言語が英語である場合の具体例として、発明文書における、ある行の、2つの重要語句をA及びBの各々で表した文が「AはBを・・・する。」であり、この文がSVO(つまり主語、動詞、目的語)の文型に翻訳されると推定でき、翻訳結果文書における対応する位置の行の、翻訳語句をS、V及びOで表した文が「SVO.」である場合に、重要語句Aに翻訳語句Sが対応し、重要語句Bに翻訳語句Oが対応すると推定する例が、挙げられる。このような推定結果に基づいて、教師データ蓄積部2072は、重要語句に対応する、翻訳結果文書における翻訳語句の抽出を実行し得る。また、教師データ蓄積部2072は、発明文書における符号が後続して記載されている重要語句に対応する、翻訳結果文書における翻訳語句の抽出を、翻訳結果文書中でその符号が半角文字で表されて後続している語句を探索することで、実行してもよい。 Further, the teacher data storage unit 2072 translates each key phrase extracted by the key phrase extraction unit 2051 from the invention document evaluated as appropriate by the document evaluation unit 2071 based on the key phrase and the invention document. A machine learning teacher for generating a learning model for translation of important words and phrases is a set of translation words and phrases corresponding to the important words and phrases extracted from the translation result document generated by the person and acquired by the translation result document acquisition unit 2023. As data, it can be stored and held in a recording medium or the like. The teacher data storage unit 2072 extracts translation words in the translation result document corresponding to important words in the invention document, based on, for example, existing parsing techniques. As a specific example of a case where the language of the translated phrase is English, in a certain line of the invention document, a sentence in which two important phrases are represented by A and B, respectively, is "A does B." , it can be assumed that this sentence will be translated into SVO (that is, subject, verb, object) sentence pattern, and the sentence in the corresponding position line in the translation result document, in which the translation words are represented by S, V, and O, is "SVO .”, it is assumed that the key word A corresponds to the translated word S and the key word B corresponds to the translated word O. Based on such an estimation result, the teacher data storage unit 2072 can extract translation words in the translation result document that correspond to important words. In addition, the training data storage unit 2072 extracts translation words in the translation result document corresponding to the important words followed by the code in the invention document. It may also be done by searching for the phrase followed by .

発明文書分析システム20の利用が繰り返されることで、教師データ蓄積部2072により、複数(例えば数千、数万等)の重要語句と対応翻訳語との組が教師データとして記録媒体等に蓄積され得る。なお、教師データ蓄積部2072が、教師データを蓄積している記録媒体等に、他の幾つかの発明文書分析システム20において蓄積されている教師データを収集して追加的に格納するような運用も可能である。 By repeating the use of the invention document analysis system 20, the teacher data storage unit 2072 accumulates a plurality (for example, thousands, tens of thousands, etc.) of sets of important words and corresponding translated words as teacher data in a recording medium or the like. obtain. Note that the training data accumulation unit 2072 collects and additionally stores training data accumulated in several other invention document analysis systems 20 in a recording medium or the like storing training data. is also possible.

教師データ蓄積部2072は、例えば、発明文書から重要語句抽出部2051により抽出された重要語句を含む、重要語句翻訳用学習モデルの生成のための機械学習用の教師データを、その発明文書が、分類部2053により分類されたグループ、或いは、技術分野特定部20531により属すると特定された技術分野と対応付けて、記録媒体に蓄積することとしてもよい。これにより、教師データ蓄積部2072は、例えば、グループ又は技術分野毎に、重要語句翻訳用学習モデルの生成のための機械学習用の各教師データを、記録媒体に蓄積し得る。 The training data storage unit 2072, for example, stores training data for machine learning for generating a learning model for translation of key phrases, including key phrases extracted from the invention document by the key phrase extraction unit 2051. The group classified by the classification unit 2053 or the technical field identified by the technical field identification unit 20531 may be associated with each other and stored in the recording medium. Thereby, the teacher data storage unit 2072 can store each teacher data for machine learning for generating a learning model for key phrase translation in a recording medium, for example, for each group or technical field.

機械学習部207は、教師データ蓄積部2072に蓄積された、重要語句翻訳用学習モデルの生成のための機械学習用の複数の教師データを用いた機械学習により、重要語句の機械翻訳のための重要語句翻訳用学習モデルを生成する。教師データ蓄積部2072により、重要語句翻訳用学習モデルの生成のための機械学習用の複数の教師データがグループ又は技術分野毎に記録媒体等に蓄積されている場合においては、機械学習部207は、教師データ蓄積部2072に蓄積された、グループ又は技術分野毎の重要語句翻訳用学習モデルの生成のための機械学習用の複数の教師データを用いた機械学習により、グループ又は技術分野毎に、重要語句の機械翻訳のための重要語句翻訳用学習モデルを生成する。 The machine learning unit 207 performs machine learning using a plurality of teacher data for machine learning for generating a learning model for important phrase translation, accumulated in the teacher data storage unit 2072, for machine translation of important phrases. Generate a learning model for key phrase translation. When the training data storage unit 2072 stores a plurality of training data for machine learning for generating a learning model for translation of important phrases in a recording medium or the like for each group or technical field, the machine learning unit 207 , for each group or technical field, by machine learning using a plurality of teacher data for machine learning for generating a learning model for important phrase translation for each group or technical field, accumulated in the teacher data accumulation unit 2072, Generate a learning model for key phrase translation for machine translation of key phrases.

機械学習部207により生成された重要語句翻訳用学習モデルは、発明文書の重要語句に基づいてその重要語句に対応する翻訳結果の語句を予測するために利用可能であり、例えば、翻訳部2054において、重要語句の機械翻訳により対応翻訳語を決定するため等に利用され得る。機械学習部207が、教師データを用いた機械学習により重要語句翻訳用学習モデルを生成する時期はいつであってもよい。機械学習部207は、例えば、教師データ蓄積部2072における教師データを蓄積する記録媒体の記録領域の内容としての、重要語句翻訳用学習モデルの生成のための機械学習用の教師データに、変動がある度に、各教師データを用いた機械学習により、重要語句翻訳用学習モデルを生成することとしてもよいし、一定周期で、その記録領域の内容としての重要語句翻訳用学習モデルの生成のための機械学習用の教師データの変動を確認して、その変動が確認された場合に、各教師データを用いた機械学習により、重要語句翻訳用学習モデルを生成することとしてもよい。また、機械学習部207は、重要語句翻訳用学習モデル(例えば各種の重要語句についてその重要語句と重要語句翻訳用学習モデルに基づいて機械翻訳された結果との複数の組)を、翻訳用学習モデルの生成のための機械学習用の教師データとして用いて、翻訳用学習モデルを生成してもよい。なお、機械学習部207は、重要語句翻訳用学習モデルを内包させた翻訳用学習モデルを生成してもよい。 The key phrase translation learning model generated by the machine learning unit 207 can be used to predict the translation result phrase corresponding to the key phrase of the invention document based on the key phrase. , to determine corresponding translations by machine translation of key words. The machine learning unit 207 may generate a learning model for important phrase translation by machine learning using teacher data at any time. The machine learning unit 207 detects, for example, when there is a change in the teacher data for machine learning for generating a learning model for translation of important phrases, which is the contents of the recording area of the recording medium storing the teacher data in the teacher data storage unit 2072. Each time, by machine learning using each teacher data, it is possible to generate a learning model for important phrase translation, or at a fixed cycle, to generate a learning model for important phrase translation as the contents of the recording area. It is also possible to check the variation of the training data for machine learning and, if the variation is confirmed, generate a learning model for important phrase translation by machine learning using each training data. In addition, the machine learning unit 207 prepares a learning model for translation of key phrases (for example, a plurality of sets of key phrases of various key phrases and the result of machine translation based on the learning model for translation of key phrases) for translation learning. A learning model for translation may be generated by using it as teacher data for machine learning for model generation. Note that the machine learning unit 207 may generate a learning model for translation that includes the learning model for translation of important phrases.

学習モデル管理部2073は、機械学習部207により生成された重要語句翻訳用学習モデルを記録媒体等に保持して管理する。学習モデル管理部2073は、機械学習部207により、重要語句翻訳用学習モデルがグループ又は技術分野毎に区別されて生成された場合には、グループ又は技術分野を区別して重要語句翻訳用学習モデルを記録媒体等に保持して管理する。学習モデル管理部2073は、機械学習部207により重要語句翻訳用学習モデルが生成される毎に、既に保持している重要語句翻訳用学習モデルを、生成された重要語句翻訳用学習モデルで上書き更新することとしてもよいし、各々の生成日時と対応付けて、最新の重要語句翻訳用学習モデルを含む、複数の生成された重要語句翻訳用学習モデル(例えば新しい順に予め定められた数の重要語句翻訳用学習モデル)を保持することとしてもよい。学習モデル管理部2073は、例えば、重要語句翻訳用学習モデルをデータベースに登録して管理してもよい。学習モデル管理部2073が保持する重要語句翻訳用学習モデルは出力部208により出力され得る。 The learning model management unit 2073 stores and manages the key phrase translation learning model generated by the machine learning unit 207 in a recording medium or the like. When the machine learning unit 207 generates learning models for translating key phrases by classifying them by group or technical field, the learning model management unit 2073 separates the learning models for translating key words by group or technical field. Store and manage in a recording medium, etc. Every time the machine learning unit 207 generates a learning model for translating important phrases, the learning model management unit 2073 overwrites and updates the already held learning model for translating important phrases with the generated learning model for translating important phrases. Alternatively, a plurality of generated learning models for translating important phrases, including the latest learning model for translating important phrases (for example, a predetermined number of important phrases in order of newest learning model for translation). The learning model management unit 2073 may, for example, register and manage important phrase translation learning models in a database. The important phrase translation learning model held by the learning model management unit 2073 can be output by the output unit 208 .

[3-1-6-3.技術分野特定用学習モデルの生成]
以下、機械学習部207が生成する技術分野特定用学習モデルに着目して、機械学習部207及び関連する各部について説明する。
[3-1-6-3. Generation of learning model for technical field identification]
The machine learning unit 207 and related units will be described below with a focus on the technical field identification learning model generated by the machine learning unit 207 .

同じ技術分野における発明について記載した複数の発明文書同士において共通して同一の重要語句が記載される可能性は、相違する技術分野における発明について記載した複数の発明文書同士において共通して同一の重要語句が記載される可能性よりも高い。機械学習部207は、技術分野と発明文書中の重要語句群との相関性に基づく機械学習を行う。技術分野特定用学習モデルを用いて予め定められた演算処理により、発明文書から抽出された重要語句群に基づいて、その発明文書が属する技術分野の特定が可能となる。この特定される技術分野は、IPCで表現されても、Fターム分類体系によるFタームで表現されてもよいし、また、IPCのどの階層までの分類(例えばセクション及びクラスだけの分類等)を用いて表現されてもよい。 The possibility that the same key words are commonly stated in multiple invention documents that describe inventions in the same technical field does not mean that the same key words are commonly stated in multiple invention documents that describe inventions in different technical fields. Higher than the likelihood that the phrase will be listed. The machine learning unit 207 performs machine learning based on the correlation between the technical field and the important phrase group in the invention document. It is possible to identify the technical field to which the invention document belongs, based on the group of important words extracted from the invention document, by predetermined arithmetic processing using the technical field identification learning model. This specified technical field may be expressed by IPC or by F-term according to the F-term classification system, and classification up to any hierarchy of IPC (for example, classification of only sections and classes, etc.) may be expressed using

教師データ蓄積部2072は、発明文書取得部2021により取得された発明文書がIPC、Fターム等の技術分野情報を含む場合に、その発明文書から重要語句抽出部2051により抽出された各重要語句の集合である重要語句群と、その発明文書に記載されたIPC、Fターム等の技術分野情報との組を、技術分野特定用学習モデルの生成のための機械学習用の教師データとして、記録媒体等に蓄積して、保持する。発明文書がIPC等の技術分野情報を含む場合の例としては、発明文書が願書(例えば、「国際特許分類」欄を含む日本国の特許出願の願書の記載内容)を含む場合、発明文書が特許公報である場合、或いは、発明文書の明細書の先行技術文献に係る「特許文献」の欄に公報番号(例えば特許出願の出願公開に係る公開番号)が記載されておりその公報番号に基づく、インターネット等を介する特許公報検索の結果としてIPC等を取得可能な場合等が、挙げられる。 When the invention document acquired by the invention document acquisition unit 2021 contains technical field information such as IPC and F-term, the training data accumulation unit 2072 extracts each key phrase extracted from the invention document by the key phrase extraction unit 2051. A set of a set of important words and phrases and technical field information such as IPCs and F-terms described in the invention document is used as training data for machine learning for generating a learning model for identifying a technical field, as a recording medium. etc., and hold it. As an example of the case where the invention document includes technical field information such as IPC, if the invention document includes an application form (for example, the contents of the application form of a Japanese patent application including the "International Patent Classification" column), the invention document If it is a patent publication, or the publication number (for example, the publication number related to the publication of the patent application) is described in the "patent document" column of the prior art document in the specification of the invention document, and it is based on that publication number , and cases where the IPC or the like can be obtained as a result of searching for patent publications via the Internet or the like.

教師データ蓄積部2072に蓄積された、技術分野特定用学習モデルの生成のための機械学習用の教師データにおける、発明文書から抽出された重要語句群は、各重要語句に重要度決定部2055により決定された重要度を付加したデータ群であってもよい。発明文書から抽出された重要語句群の具体的な一例は、ある程度十分な所定数(例えば数千、数万等)の予め定められた文字列各々を要素として、例えばその要素の文字列が発明文書に重要語句として存在する場合には0より大きく1以下の値で表した重要度である要素値、重要語句として存在しない場合に0という要素値を定めた、順序付きの所定数の要素値を含むベクトルデータである。 Important words and phrases extracted from invention documents in the teacher data for machine learning for generating a learning model for technical field identification accumulated in the teacher data accumulation unit 2072 are added to each important word by the importance determination unit 2055 It may be a data group to which the determined importance is added. A specific example of a group of key phrases extracted from an invention document is that each of a predetermined number (for example, several thousands, tens of thousands, etc.) of predetermined character strings are elements, and the character strings of the elements are, for example, invention documents. Predetermined number of element values with an order, with an element value representing importance expressed by a value greater than 0 and less than or equal to 1 when it exists as an important phrase in a document, and an element value of 0 when it does not exist as an important phrase is vector data containing

機械学習部207は、教師データ蓄積部2072に蓄積された、技術分野特定用学習モデルの生成のための機械学習用の複数の教師データを用いた機械学習により、重要語句群から技術分野を特定するための重要語句翻訳用学習モデルを生成する。 The machine learning unit 207 identifies a technical field from a group of important words and phrases by machine learning using a plurality of teacher data for machine learning for generating a learning model for identifying a technical field, which is accumulated in the teacher data accumulation unit 2072. Generate a learning model for important phrase translation for

教師データ蓄積部2072に蓄積された、技術分野特定用学習モデルの生成のための機械学習用の教師データにおける重要語句群が、各重要語句に重要度を付加したデータである場合には、機械学習部207は、例えば、教師データ蓄積部2072に蓄積された、技術分野特定用学習モデルの生成のための機械学習用の複数の教師データに基づいて、各重要語句に、対応する重要度での重み付けを行ったデータと、技術分野との複数組各々を教師データとした機械学習を行うことで、重要語句翻訳用学習モデルを生成する。 When the important phrase group in the training data for machine learning for generating the learning model for technical field identification accumulated in the training data accumulation unit 2072 is data in which the importance is added to each important phrase, the machine The learning unit 207, for example, based on a plurality of teacher data for machine learning for generating a learning model for specifying a technical field, accumulated in the teacher data accumulation unit 2072, for each important phrase, with the corresponding importance A learning model for important phrase translation is generated by performing machine learning using each of the weighted data and multiple sets of technical fields as training data.

機械学習部207により生成された技術分野特定用学習モデルは、発明文書から抽出された重要語句群から、技術分野を予測するために利用可能であり、例えば、技術分野特定部20531において、発明文書に係る重要語句群から、技術分野を特定するため等に利用され得る。機械学習部207が、教師データを用いた機械学習により技術分野特定用学習モデルを生成する時期はいつであってもよい。機械学習部207は、例えば、教師データ蓄積部2072における教師データを蓄積する記録媒体の記録領域の内容としての、技術分野特定用学習モデルの生成のための機械学習用の教師データに、変動がある度に、各教師データを用いた機械学習により、技術分野特定用学習モデルを生成することとしてもよいし、一定周期で、その記録領域の内容としての技術分野特定用学習モデルの生成のための機械学習用の教師データの変動を確認して、その変動が確認された場合に、各教師データを用いた機械学習により、技術分野特定用学習モデルを生成することとしてもよい。 The technical field identification learning model generated by the machine learning unit 207 can be used to predict the technical field from the group of key words extracted from the invention document. It can be used, for example, to identify a technical field from a group of key phrases related to. The machine learning unit 207 may generate the technical field identifying learning model by machine learning using the teacher data at any time. The machine learning unit 207 detects, for example, when there is a change in the teacher data for machine learning for generating the learning model for specifying the technical field, which is the content of the recording area of the recording medium storing the teacher data in the teacher data storage unit 2072. Each time, a learning model for specifying a technical field may be generated by machine learning using each teacher data, or for the purpose of generating a learning model for specifying a technical field as the contents of the recording area at a fixed cycle. It is also possible to check the variation of the teacher data for machine learning and, if the variation is confirmed, generate the learning model for technical field identification by machine learning using each teacher data.

学習モデル管理部2073は、機械学習部207により生成された技術分野特定用学習モデルを記録媒体等に保持して管理する。学習モデル管理部2073は、機械学習部207により技術分野特定用学習モデルが生成される毎に、既に保持している技術分野特定用学習モデルを、生成された技術分野特定用学習モデルで上書き更新することとしてもよいし、各々の生成日時と対応付けて、最新の技術分野特定用学習モデルを含む、複数の生成された技術分野特定用学習モデル(例えば新しい順に予め定められた数の技術分野特定用学習モデル)を保持することとしてもよい。学習モデル管理部2073は、例えば、技術分野特定用学習モデルをデータベースに登録して管理してもよい。学習モデル管理部2073が保持する技術分野特定用学習モデルは出力部208により出力され得る。 The learning model management unit 2073 stores and manages the technical field identification learning model generated by the machine learning unit 207 in a recording medium or the like. The learning model management unit 2073 overwrites and updates the already held learning model for specifying the technical field with the generated learning model for specifying the technical field each time the learning model for specifying the technical field is generated by the machine learning unit 207. Alternatively, a plurality of generated learning models for identifying technical fields, including the latest learning model for identifying technical fields, in association with each generation date and time (for example, a predetermined number of technical fields in order of newest identification learning model). The learning model management unit 2073 may manage, for example, the learning model for specifying the technical field by registering it in a database. The learning model for technical field identification held by the learning model management unit 2073 can be output by the output unit 208 .

[3-1-7.出力部]
出力部208は、実施形態1で示した出力部108を一部変形したものであり、ここで特に示さない点については、出力部108と同様である。
[3-1-7. Output part]
The output unit 208 is a partial modification of the output unit 108 shown in the first embodiment, and is the same as the output unit 108 except for points not particularly shown here.

出力部208は、発明文書取得部2021により取得された発明文書についての分析部205による分析結果に基づいて生成された情報を出力する。出力部208は、例えば、発明文書取得部2021により取得された発明文書から重要語句抽出部2051により抽出された複数の重要語句各々に基づいて生成された情報を出力する。出力部208は、分析部205により生成された各種分析結果(重要語句、符号等に関する各種情報)に対して予め定められた演算処理を行った結果を出力する処理を実行するプラグインモジュールを利用して、出力を行ってもよい。出力部208は、例えば、プラグインモジュールに対して、分析部205により生成された各種分析結果を、プラグインモジュールにおいて利用可能にするAPI、プラグインモジュールが生成した情報を、出力部208が出力する特許出願関連情報の一部に追加するためのAPI等を、提供することとしてもよい。 The output unit 208 outputs information generated based on the analysis result of the analysis unit 205 for the invention document acquired by the invention document acquisition unit 2021 . The output unit 208 outputs, for example, information generated based on each of the multiple key phrases extracted by the key phrase extraction unit 2051 from the invention document acquired by the invention document acquisition unit 2021 . The output unit 208 uses a plug-in module that executes processing for outputting the result of performing predetermined arithmetic processing on the various analysis results (various information on important terms, symbols, etc.) generated by the analysis unit 205. and output. The output unit 208 outputs, for example, an API that makes various analysis results generated by the analysis unit 205 available to the plug-in module, and information generated by the plug-in module. It is also possible to provide an API or the like for adding to part of the patent application-related information to be submitted.

出力部208は、学習モデル出力部2081と、特許出願関連情報出力部2082と、表示用文書生成部2083と、表示用文書を表示するブラウザとしての機能を有する表示部2084とを含む。 The output unit 208 includes a learning model output unit 2081, a patent application related information output unit 2082, a display document generation unit 2083, and a display unit 2084 having a function as a browser for displaying display documents.

[3-1-7-1.学習モデル出力部]
学習モデル出力部2081は、学習モデル管理部2073により保持及び管理されている各種学習モデルを出力する。
[3-1-7-1. Learning model output unit]
The learning model output unit 2081 outputs various learning models held and managed by the learning model management unit 2073 .

学習モデル出力部2081は、例えば、送信先を指定したユーザの指示に応じて、翻訳用学習モデル、重要語句翻訳用学習モデル、或いは、技術分野特定用学習モデルを、発明文書分析システム20の外部の、指定された送信先に送信することで、出力し得る。学習モデル出力部2081は、例えば、学習モデル出力ファイルを指定したユーザの指示に応じて、翻訳用学習モデル、重要語句翻訳用学習モデル、或いは、技術分野特定用学習モデルを、指定された学習モデル出力ファイルの内容として出力し得る。 For example, the learning model output unit 2081 outputs a learning model for translation, a learning model for key phrase translation, or a learning model for technical field identification to the outside of the invention document analysis system 20 in response to an instruction from a user who has specified a destination. can be output by sending it to the specified destination. For example, the learning model output unit 2081 outputs a learning model for translation, a learning model for translation of important phrases, or a learning model for specifying a technical field in response to an instruction from a user who has specified a learning model output file, and outputs the specified learning model. It can be output as the contents of the output file.

学習モデル出力部2081により出力された翻訳用学習モデル、又は、重要語句翻訳用学習モデルは、例えば、別の発明文書分析システム20、又は、発明文書の翻訳用の機械翻訳システム若しくは機械翻訳用のプログラム、又は、一般的な機械翻訳システム等において利用され得る。学習モデル出力部2081により出力された技術分野特定用学習モデルは、例えば、別の発明文書分析システム20、又は、発明文書から技術分野を特定するためのシステム等において利用され得る。 The learning model for translation output by the learning model output unit 2081 or the learning model for important phrase translation is, for example, another invention document analysis system 20, or a machine translation system for translation of invention documents or machine translation It can be used in a program, a general machine translation system, or the like. The learning model for technical field identification output by the learning model output unit 2081 can be used, for example, in another invention document analysis system 20 or a system for identifying the technical field from invention documents.

学習モデル出力部2081は、例えば、教師データ蓄積部2072に蓄積されている、各種学習モデルの生成の基礎となる機械学習用の教師データを出力することとしてもよい。発明文書分析システム20の学習モデル出力部2081により出力された教師データは、他の発明文書分析システム20の教師データ蓄積部2072に格納するために利用されてもよいし、他のシステムにおいて機械学習の実行のために利用されてもよい。 The learning model output unit 2081 may, for example, output teacher data for machine learning, which is accumulated in the teacher data accumulation unit 2072 and serves as a basis for generating various learning models. The teacher data output by the learning model output unit 2081 of the invention document analysis system 20 may be used for storage in the teacher data storage unit 2072 of another invention document analysis system 20, or may be used for machine learning in other systems. may be used for the execution of

[3-1-7-2.特許出願関連情報出力部]
特許出願関連情報出力部2082は、発明文書取得部2021により取得された発明文書についての分析部205による分析結果に基づいて生成された特許出願関連情報(図15参照)を出力する。
[3-1-7-2. Patent application related information output unit]
The patent application related information output unit 2082 outputs patent application related information (see FIG. 15) generated based on the analysis result of the analysis unit 205 for the invention document acquired by the invention document acquisition unit 2021 .

特許出願関連情報出力部2082は、例えば、特許出願関連情報に、発明文書取得部2021により取得され分析部205の分析対象となった発明文書の各行へ行番号を追加した情報を含ませる。この発明文書の各行へ行番号を追加した情報における行番号は、警告情報における指摘情報に指摘の対象となった発明文書の記載部分の行番号が含まれる場合に、警告情報の指摘と発明文書の記載部分との対応を把握可能にするために有用である。特許出願関連情報出力部2082は、例えば、発明文書の各行へ行番号を追加した情報に、所定の制御コード(例えば、「0x00」~「0x1f」の範囲内のコード)が含まれている場合にはその所定の制御コードを「●」等といった所定の文字に変換することとしてもよい。 For example, the patent application related information output unit 2082 includes information obtained by adding a line number to each line of the invention document acquired by the invention document acquisition unit 2021 and analyzed by the analysis unit 205 in the patent application related information. The line number in the information in which the line number is added to each line of the invention document is the same as the indication of the warning information and the invention document when the indication information in the warning information includes the line number of the description part of the invention document that was the subject of indication. It is useful for making it possible to grasp the correspondence with the description part. The patent application related information output unit 2082, for example, when the information obtained by adding the line number to each line of the invention document includes a predetermined control code (for example, a code within the range of "0x00" to "0x1f") Alternatively, the predetermined control code may be converted into a predetermined character such as "●".

特許出願関連情報出力部2082は、例えば、特許出願関連情報に、発明文書評価情報を含む警告情報を含ませる。 The patent application related information output unit 2082 includes, for example, warning information including invention document evaluation information in the patent application related information.

特許出願関連情報出力部2082は、例えば、特許出願関連情報に、重要語句リスト、重要語句関係情報、及び、重要語句関係翻訳情報を含ませる。特許出願関連情報出力部2082は、例えば、重要語句関係情報に、包含関係情報、記録関係情報、プログラム実現関係情報、等価関係情報、及び、上下概念関係情報を含ませ得る。特許出願関連情報出力部2082は、例えば、重要語句関係翻訳情報に、包含関係翻訳情報、記録関係翻訳情報、プログラム実現関係翻訳情報、等価関係翻訳情報、及び、上下概念関係翻訳情報を含ませ得る。 For example, the patent application related information output unit 2082 causes the patent application related information to include an important phrase list, important phrase related information, and important phrase related translation information. The patent application related information output unit 2082 can include, for example, inclusion relationship information, recording relationship information, program implementation relationship information, equivalence relationship information, and hierarchical concept relationship information in the important term relationship information. The patent application related information output unit 2082 can include, for example, inclusive relationship translation information, recording relationship translation information, program realization relationship translation information, equivalent relationship translation information, and hierarchical concept relationship translation information in the key phrase relationship translation information. .

特許出願関連情報出力部2082は、例えば、特許出願関連情報に、クレーム情報、クレーム翻訳情報、修正版クレーム情報、修正版クレーム翻訳情報、クレームベース図面情報、クレームベース明細書情報、及び、クレームベース要約書情報を含ませ得る。 For example, the patent application related information output unit 2082 includes, as the patent application related information, claim information, claim translation information, modified claim information, modified claim translation information, claim base drawing information, claim base specification information, and claim base Abstract information may be included.

特許出願関連情報出力部2082は、例えば、特許出願関連情報に、クレームツリー、修正版クレームツリー、構成クレームツリー、及び、修正版構成クレームツリーを含ませ得る。 The patent application related information output unit 2082 can include, for example, a claim tree, a modified claim tree, a configuration claim tree, and a modified configuration claim tree in the patent application related information.

特許出願関連情報出力部2082は、例えば、特許出願関連情報に、明細書情報、明細書翻訳情報、修正版明細書情報、修正版明細書翻訳情報、及び、明細書見出しリストを含ませ得る。 The patent application related information output unit 2082 can include, for example, specification information, specification translation information, revised specification information, revised specification translation information, and a specification heading list in the patent application related information.

特許出願関連情報出力部2082は、例えば、特許出願関連情報に、符号リスト、図面符号リスト、技術分野情報、料金情報、及び、集計情報を含ませ得る。 The patent application related information output unit 2082 can include, for example, a code list, a drawing code list, technical field information, fee information, and total information in the patent application related information.

特許出願関連情報出力部2082は、特許出願関連情報を、例えば、出力ファイルの内容として出力する。出力ファイルは、記録媒体等に記録され得る。出力ファイルは、例えば、Microsoft(登録商標)のWord等の文書作成編集機能を有する各種アプリケーションプログラムに主として用いられる形式のファイルであっても、テキストファイルであっても、XMLファイルであっても、PDFファイルであってもよい。また、出力ファイルは、1つ又は複数のファイルで構成される表示用文書(例えばHTML文書)であってもよい。また、特許出願関連情報出力部2082は、特許出願関連情報を、互いに異なる形式の複数の出力ファイル(例えば、テキストファイルとHTML文書)として出力してもよい。表示用文書は、マークアップ言語で記述された文書を含み得る。表示用文書は、ブラウザ等で解釈されその内容が表示されるHTML文書であってもよいし、表示用アプリケーションプログラムにより解釈されその内容が表示されるXML文書(例えば1つのXMLファイル、或いは、XMLファイルとそのXMLファイルから参照される1つ以上のファイルの集合)であってもよいし、既存の変換用アプリケーションプログラムによりHTML文書に変換可能なXML文書であってもよい。 The patent application related information output unit 2082 outputs the patent application related information, for example, as the content of the output file. The output file can be recorded on a recording medium or the like. The output file may be, for example, a file in a format mainly used for various application programs having a document creation and editing function such as Microsoft (registered trademark) Word, a text file, or an XML file. It may be a PDF file. Also, the output file may be a display document (for example, an HTML document) composed of one or more files. In addition, the patent application related information output unit 2082 may output the patent application related information as a plurality of output files in different formats (for example, text file and HTML document). Documents for display may include documents written in a markup language. The display document may be an HTML document whose contents are interpreted by a browser or the like and displayed, or an XML document whose contents are interpreted and displayed by a display application program (for example, one XML file or an XML document). A file and a set of one or more files referenced from the XML file), or an XML document that can be converted into an HTML document by an existing conversion application program.

特許出願関連情報出力部2082は、例えば、設定情報取得部201により取得された設定情報における、出力ファイルの格納先の特定用情報を参照して、ファイルシステムにおける所定フォルダーを特定することで、その所定フォルダー内に、特許出願関連情報を含む出力ファイルを格納し得る。 The patent application related information output unit 2082, for example, refers to the information for specifying the storage location of the output file in the setting information acquired by the setting information acquisition unit 201, and specifies a predetermined folder in the file system. An output file containing patent application related information may be stored in a predetermined folder.

特許出願関連情報出力部2082は、特許出願関連情報を表示用文書(例えばHTML文書)として生成する場合には、分析部205において生成された、表示用文書としての特許出願関連情報における各部分(例えば、重要語句リスト部分、クレーム情報部分、明細書情報部分等)の内容を、表示用文書生成部2083に伝達し、表示用文書としての特許出願関連情報の出力を表示用文書生成部2083に委ねる。表示用文書生成部2083により生成された表示用文書としての特許出願関連情報は、ブラウザとしての機能を有する表示部2084により、表示されることで出力され得る。 When the patent application-related information is generated as a display document (for example, an HTML document), the patent application-related information output unit 2082 outputs each part ( For example, important phrase list part, claim information part, specification information part, etc.) is transmitted to the display document generation unit 2083, and the output of the patent application related information as the display document is sent to the display document generation unit 2083. entrust The patent application related information as a display document generated by the display document generation unit 2083 can be output by being displayed by the display unit 2084 having a function as a browser.

表示用文書生成部2083により生成された表示用文書としての特許出願関連情報は、例えばHTML文書としてのファイル群(例えばHTMLファイル、CSSファイル、スクリプトファイル等)として、記録媒体等に記録されることで出力され得る。出力されたHTML文書は、発明文書分析システム20の表示部2084で解釈され表示されてもよいし、発明文書分析システム20の外部のブラウザにより解釈され表示されてもよい。 The patent application-related information as a display document generated by the display document generation unit 2083 is recorded in a recording medium or the like as a file group (for example, an HTML file, a CSS file, a script file, etc.) as an HTML document, for example. can be output with The output HTML document may be interpreted and displayed by the display unit 2084 of the invention document analysis system 20 or may be interpreted and displayed by a browser external to the invention document analysis system 20 .

発明文書分析システム20が図8に示すような構成である場合においては、例えば、表示用文書生成部2083により生成されたHTML文書としての特許出願関連情報は、発明文書分析システム20を構成する1台の端末装置におけるOS配下でブラウザ機能を実現するためのアプリケーションプログラムにより、解釈され、表示されることになる。この場合に、表示用文書生成部2083が出力したHTML文書のHTMLファイルであるローカルファイルを、ブラウザ機能を実現するためのアプリケーションプログラムが読み込むことで、HTML文書を解釈し、表示してもよい。また、表示用文書生成部2083は、ローカルホストの予め定めた、ウェブサーバとして使用するポートで、HTML文書を提供することとし、ブラウザ機能を実現するためのアプリケーションプログラムがそのローカルホストのそのポートにHTTP(Hypertext Transfer Protocol)通信でアクセスして、HTML文書を、取得し、解釈し、表示することとしてもよい。 In the case where the invention document analysis system 20 has the configuration shown in FIG. It is interpreted and displayed by an application program for realizing a browser function under the OS of the terminal device. In this case, the local file, which is the HTML file of the HTML document output by the display document generation unit 2083, may be read by an application program for realizing the browser function, and the HTML document may be interpreted and displayed. The display document generation unit 2083 provides the HTML document at a predetermined port of the local host used as a web server, and the application program for realizing the browser function is transmitted to that port of the local host. An HTML document may be acquired, interpreted, and displayed by accessing via HTTP (Hypertext Transfer Protocol) communication.

発明文書分析システム20が図10に示すような構成である場合においては、例えば、サーバ装置に実装される表示用文書生成部2083により生成されたHTML文書としての特許出願関連情報は、そのサーバ装置と通信可能な端末装置におけるブラウザにより、取得され、解釈され、表示されることになる。 In the case where the invention document analysis system 20 has a configuration as shown in FIG. acquired, interpreted, and displayed by a browser in a terminal device capable of communicating with the

なお、特許出願関連情報出力部2082による、特許出願関連情報の出力は、出力ファイルとしての出力に限られず、発明文書分析システム20を構成する装置に着脱自在な、メモリカード等の記録媒体への特許出願関連情報の書き出し、発明文書分析システム20の外部の記録媒体への特許出願関連情報の書き出し、特許出願関連情報を示す信号の送信、表示装置での特許出願関連情報の表示、特許出願関連情報の印刷、音声合成技術を用いた特許出願関連情報を表す音声の出力、その他の特許出願関連情報を表す物理現象を起こすこと等であってもよい。例えば、発明文書分析システム20の機能を実現する発明文書分析処理プログラムの全部又は一部が、Microsoft(登録商標)のWindows(登録商標)のコマンドプロンプト上で実行される場合において、特許出願関連情報は、例えば、コマンドプロンプトウィンドウ中への表示等という方法で、出力されてもよい。 The output of the patent application-related information by the patent application-related information output unit 2082 is not limited to the output as an output file. Writing patent application-related information, writing patent application-related information to a recording medium external to the invention document analysis system 20, transmitting a signal indicating patent application-related information, displaying patent application-related information on a display device, patent application-related It may be printing information, outputting voice representing patent application related information using voice synthesis technology, causing other physical phenomena representing patent application related information, and the like. For example, when all or part of the invention document analysis processing program that realizes the functions of the invention document analysis system 20 is executed on a Microsoft (registered trademark) Windows (registered trademark) command prompt, patent application related information may be output, for example, by display in a command prompt window.

表示用文書生成部2083に生成される表示用文書の一例としてのHTML文書は、HTMLファイルを含み、例えば、更に、HTMLファイル内での指定に対応したCSSファイルを含んでもよいし、更に、HTMLファイル内での指定に対応したスクリプトファイルを含んでもよい。表示用文書生成部2083が、特許出願関連情報に係る表示用文書の一例としてのHTML文書を生成する場合に、発明文書分析システム20の分析対象となる各発明文書に応じて、表示用文書生成部2083により生成されるHTML文書を構成するHTMLファイルの内容は変化し得るが、例えば、HTML文書を構成するCSSファイル及びスクリプトファイルの内容は、発明文書間の相違に依らずに、不変であり得る。 An HTML document, which is an example of a display document generated by the display document generation unit 2083, includes an HTML file. It may also contain a script file corresponding to the specifications in the file. When the display document generation unit 2083 generates an HTML document as an example of a display document related to patent application related information, the display document generation unit 2083 generates a display document according to each invention document to be analyzed by the invention document analysis system 20. Although the contents of the HTML files that make up the HTML document generated by the unit 2083 can change, for example, the contents of the CSS file and script file that make up the HTML document are unchanged regardless of differences between invention documents. obtain.

表示用文書生成部2083は、例えば、分析部205により生成された表示用文書としての特許出願関連情報の各部分(図15参照)を含むHTMLファイルと、HTMLファイルにおける表示要素の表示態様の制御のためのCSSファイルと、JavaScript(登録商標)により記述された関数等を含むスクリプトファイルとを生成する。表示用文書生成部2083は、例えば、<body>タグ配下に、表示用文書(この例ではHTML文書)としての特許出願関連情報の複数の部分(例えば、発明文書、警告情報、重要語句リスト、クレーム情報、明細書情報等)を、各々<article>タグと</article>タグとで挟む記述として含むHTMLファイルにおけるその<body>タグ配下に、<nav>タグと</nav>タグとで挟んでメニューを記述する。このメニューは、例えば、各<article>タグ配下の内容の表題、名称等を表すメニュー項目(例えば、「発明文書」、「警告情報」、「重要語句リスト」、「クレーム情報」、「明細書情報」等)の表示要素を複数列挙したリストであり、各<article>タグ配下の内容のうち、ユーザにより選択されたメニュー項目に対応する<article>タグ配下の内容を表示できるように、各メニュー項目の表示要素に、例えば各<article>タグ配下の内容を非表示状態と表示状態との間で切り替えるための関数を定義した表示制御情報を付加して構成されたものである。図17に例示する表示画面では、<nav>タグと</nav>タグとで挟んで記述されたメニューがメニュー欄に表示され、メニューに応じて選択された<article>タグ配下の内容が、メニュー選択に応じた特許出願関連情報の項目の内容表示欄に表示される。メニューには、設定情報取得部201により取得された設定情報を表示し編集可能とする設定情報表示用文書(例えば設定情報表示用文書としてのHTMLファイル)へリンクするメニュー項目を含ませてもよい。 The display document generation unit 2083 controls, for example, an HTML file containing each part of the patent application related information (see FIG. 15) as a display document generated by the analysis unit 205, and a display mode of display elements in the HTML file. and a script file including functions written in JavaScript (registered trademark). The display document generation unit 2083, for example, under the <body> tag, a plurality of parts of the patent application related information (for example, invention document, warning information, important phrase list, claim information, specification information, etc.) are included as descriptions sandwiched between <article> and </article> tags. Write the menu in between. This menu includes, for example, menu items representing titles, names, etc. of contents under each <article> tag (for example, "invention document", "warning information", "important phrase list", "claim information", "description information", etc.), and among the contents under each <article> tag, the contents under the <article> tag corresponding to the menu item selected by the user can be displayed. Display control information defining a function for switching the content under each <article> tag between a non-display state and a display state is added to display elements of menu items. On the display screen illustrated in FIG. 17, a menu described between <nav> and </nav> tags is displayed in the menu column, and the content under the <article> tag selected according to the menu is It is displayed in the content display column of the item of the patent application related information corresponding to the menu selection. The menu may include a menu item that links to a setting information display document (for example, an HTML file as a setting information display document) that displays and edits the setting information acquired by the setting information acquisition unit 201. .

表示用文書生成部2083は、例えば、HTML文書における特許出願関連情報の複数の部分各々に対応する<article>タグ配下の内容の表示属性の既定値として、例えばCSSファイル等で、背景色が白色、文字色が黒色等というように、背景色、文字色等を定義しておいてもよく、例えばスクリプトファイル等で、HTML文書が表示された際における所定のユーザ操作(例えば所定の操作対応GUI要素へのマウスクリック操作等)に応じて背景色を白色から黒色へ、文字色を黒色から白色へ等というように、背景色、文字色等を変更する関数等を定義しておいてもよい。このように、表示用文書において、暗い背景色(例えば黒色)に対して明るい文字色(例えば白色)、或いは、明るい背景色に対して暗い文字色を用いることは、表示内容の視認性を向上させ得る。また、発明文書分析システム20における表示装置の周囲の環境の明暗等に応じてユーザが、暗い背景色と明るい文字色との組と、明るい背景色と暗い文字色との組とを切り替えられることは、表示内容の視認性の向上に有用となり得る。 For example, the display document generation unit 2083 sets the default value of the display attribute of the content under the <article> tag corresponding to each of the plurality of parts of the patent application related information in the HTML document, for example, with a CSS file, etc., with a white background color. The background color, character color, etc. may be defined such that the character color is black, and the like. It is also possible to define functions that change the background color, text color, etc., such as changing the background color from white to black and the text color from black to white according to the mouse click operation on the element, etc. . Thus, in a document for display, using a bright character color (for example, white) against a dark background color (for example, black) or using a dark character color for a bright background color improves the visibility of the display content. can let In addition, the user can switch between a combination of a dark background color and a bright character color and a combination of a bright background color and a dark character color according to the brightness of the environment around the display device in the invention document analysis system 20. can be useful for improving the visibility of displayed content.

表示部2084、或いは、その他のHTML文書を解釈して表示するブラウザにおいては、例えば、<article>タグ配下の内容の既定値としての背景色、文字色等より、<article>タグ配下の重要語句等といった個々の表示要素に対して定義された背景色、文字色等が優先的に適用され得る。 In the display unit 2084 or other browsers that interpret and display HTML documents, for example, important phrases under the <article> tag are selected from the background color, character color, etc. as default values of the contents under the <article> tag. Background colors, character colors, and the like defined for individual display elements, such as , can be preferentially applied.

表示用文書生成部2083は、複数の<article>タグ配下の内容を並べて表示するように表示用文書を生成してもよい。表示用文書における各<article>タグ配下の内容は、ブラウザで表示用文書が解釈されて表示される際に、スクリプトファイルに記述された関数の処理等により、表示状態にしたり、非表示状態にしたりすることができる他に、透明度、表示サイズ、表示位置等を指定して表示することができる。表示用文書生成部2083は、表示用文書がブラウザで解釈されて表示される際において、例えば、各種<article>タグ配下の、重要語句についての操作対応GUI要素としての表示要素の操作により、インターネット等のネットワーク上の検索サイト等でその重要語句を含むウェブページ等を検索する処理、或いは、インターネット等のネットワーク上の翻訳サイト等でその重要語句を翻訳させる処理等を、スクリプトファイルに記述された関数等により行う場合には、その関数等により、その検索サイト、翻訳サイト等に係る画面を、表示用文書の表示用のものとは、別の表示領域(例えば図17に例示する表示画面中の「操作対応GUI要素の事項の表示欄」)、別のウィンドウ、又は、別のタブとして表示するように制御するように、表示用文書を生成することとしてもよい。 The display document generation unit 2083 may generate a display document so as to display the contents under a plurality of <article> tags side by side. The content under each <article> tag in the display document is displayed or hidden by processing the function described in the script file when the display document is interpreted and displayed by the browser. In addition to being able to specify transparency, display size, display position, etc., it is possible to display. When the display document is interpreted and displayed by the browser, the display document generation unit 2083 generates an Internet The script file describes the process of searching for web pages containing the important words on a search site on the network such as, or the process of translating the important words on a translation site on the network such as the Internet In the case of using a function or the like, the screen related to the search site, the translation site, etc. is displayed in a different display area (for example, in the display screen shown in FIG. 17) from the screen for displaying the display document. (“Item Display Field for Operation Corresponding GUI Elements”), a separate window, or a separate tab.

表示用文書生成部2083は、例えば、特許出願関連情報に係る表示用文書に、表示要素を操作に応じて発明文書の再分析を実行するGUI要素とするための表示制御情報を付加したその表示要素を含ませることとしてもよい。これにより、設定情報取得部201により取得される設定情報、重要語句設定辞書取得部203により取得される重要語句設定辞書等が更新された場合等に対応して、発明文書を再び分析させることが容易となり得る。 For example, the display document generation unit 2083 adds display control information to the display document related to the patent application related information to make the display element a GUI element for re-analyzing the invention document according to the operation. element may be included. As a result, when the setting information acquired by the setting information acquiring unit 201 and the key phrase setting dictionary acquired by the key phrase setting dictionary acquiring unit 203 are updated, the invention document can be analyzed again. can be easier.

本実施形態では、一例として、HTML5に準拠したHTML文書としての特許出願関連情報の各部分(例えばクレーム情報、明細書情報、クレームツリー、重要語句リスト等)を、各々別の<article>タグ配下に記述する例を挙げて各種の説明を行ったが、特許出願関連情報の各部分の記述に利用されるタグは<article>タグに限定されることはなく、その他のタグ(例えば<section>タグ等)であってもよい。また、表示用文書生成部2083が生成する特許出願関連情報に係るHTML文書は、必ずしもHTML5に準拠していなくてもよい。 In this embodiment, as an example, each part of the patent application-related information (for example, claim information, specification information, claim tree, important phrase list, etc.) as an HTML document conforming to HTML5 is placed under a separate <article> tag. , but the tags used to describe each part of the patent application-related information are not limited to the <article> tag, and other tags (e.g., <section> tags, etc.). Further, the HTML document related to the patent application related information generated by the display document generation unit 2083 does not necessarily have to conform to HTML5.

表示用文書生成部2083は、分析部205において生成された、表示用文書としての特許出願関連情報の各部分に、HTMLファイルで使用できないコードがある場合には、コード変換して、HTMLファイルを生成する。このコード変換は、例えば、表示用文書生成部2083が、一例としてPython(登録商標)言語で記述されたプログラムを実行するコンピュータにより実現される場合には、Python(登録商標)の標準ライブラリの関数xml.sax.saxutils.escapeを利用して実装可能である。既存の幾つかのブラウザアプリで、表示用文書としての特許出願関連情報が表示された場合に表示内容の複数行のコピー&ペーストが適切に実行されるようにする等のために、表示用文書生成部2083は、例えば、分析部205において生成された、表示用文書としての特許出願関連情報の各部分に、半角の空白文字が含まれるときには、その半角の空白文字を所定コード「&nbsp;」に置換することとしてもよいし、例えば、分析部205において生成された、表示用文書としての特許出願関連情報の各部分の行末に、<br>タグが付加されていないときに<br>タグを付加することとしてもよい。 The display document generation unit 2083 converts the codes that cannot be used in the HTML file in each part of the patent application related information as the display document generated by the analysis unit 205, and converts the code into an HTML file. Generate. For example, if the display document generation unit 2083 is implemented by a computer that executes a program written in the Python (registered trademark) language, this code conversion can be performed by a function of the Python (registered trademark) standard library. xml. sax. saxutils. It can be implemented using escape. In some existing browser applications, when patent application-related information is displayed as a display document, in order to properly execute multi-line copy and paste of the display content, the display document For example, when each part of the patent application-related information as a document for display generated by the analysis unit 205 contains a half-width blank character, the generation unit 2083 replaces the half-width blank character with a predetermined code “&nbsp;”. For example, when the <br> tag is not added to the end of each part of the patent application related information as a display document generated in the analysis unit 205, the <br> tag may be added.

表示用文書生成部2083が、生成した表示用文書を出力する具体的な一例としては、表示用文書生成部2083は、例えば、所定フォルダー内に、発明文書の分析日時を示す情報を含ませたサブフォルダー名を定めたサブフォルダーを作成し、そのサブフォルダーに、表示用文書としてのHTML文書の主要部分としての、特許出願関連情報を含むHTMLファイルを格納する。この所定フォルダーは、例えば、設定情報取得部201により取得された設定情報における、出力ファイルの格納先の特定用情報で示されるフォルダーであってもよいし、発明文書分析システム20のユーザが定めたフォルダーであってもよいし、発明文書分析システム20を構成するマイクロプロセッサを備える端末装置等における、発明文書分析処理プログラムがインストールされたフォルダー等であってもよい。また、発明文書の分析日時を示す情報を含ませたサブフォルダー名には、例えば、更に、発明文書取得部2021によりその発明文書がファイルから取得された場合には、そのファイルのファイル名を、含ませることとしてもよいし、発明文書取得部2021によりその発明文書がクリップボードから取得された場合には、クリップボードを示す語句を、含ませることとしてもよい。表示用文書生成部2083は、更に、その所定フォルダー内の1つのサブフォルダーを、共通リソースの格納先として定めて、そのHTML文書における一部分としての、特許出願関連情報に関する表示要素に付加される表示制御情報に対応して機能するリソースである、表示態様の制御のためのCSSファイル、及び、スクリプトファイルを、その共通リソースの格納先のサブフォルダーに、未格納である場合に限り、格納する。この例によれば、発明文書分析システム20において、所定フォルダー内の各サブフォルダーをサブフォルダー名によりソートして、例えば、発明文書の分析結果に基づく特許出願関連情報を含むHTMLファイルを格納するサブフォルダー名を、最新のものから順に、並べて表示すること等が可能となる。例えば、各サブフォルダー内のHTMLファイルは、それぞれ異なる内容の発明文書の分析結果としての特許出願関連情報と含むものとなり得るが、その各HTMLファイルは、共通リソースの格納先の1つのサブフォルダーにおけるCSSファイル、及び、スクリプトファイルと組をなしてHTML文書を構成する。なお、表示部2084は、上述の所定フォルダー内の各サブフォルダーを列挙したリストを表示して、1つのサブフォルダーに対する選択操作に応じて、その選択操作に係るサブフォルダー内のHTMLファイルを含んで構成されるHTML文書をブラウザによる解釈及び表示の対象とするようなGUI画面を表示することとしてもよく、そのGUI画面内には、ユーザ操作に応じて、いずれかのサブフォルダーをその配下の内容を含めて削除する処理を行うための操作対応GUI要素を表示することとしてもよい。このGUI画面の表示をHTMLファイル等のHTML文書により実現することとしてもよく、1つのサブフォルダーに対する選択操作に応じて対応するHTMLファイルへ表示内容を遷移させるハイパーリンクを行うこととしてもよい。なお、このような表示用文書生成部2083、表示部2084等の動作は、上述の発明文書分析処理プログラムがマイクロプロセッサを備える端末装置等にインストールされて実行されることにより、実現される発明文書分析処理の一部を構成することとしてもよい。 As a specific example of outputting the generated display document by the display document generation unit 2083, for example, the display document generation unit 2083 includes information indicating the analysis date and time of the invention document in a predetermined folder. A subfolder with a defined subfolder name is created, and an HTML file containing patent application related information is stored in the subfolder as the main part of the HTML document as the document for display. This predetermined folder may be, for example, the folder indicated by the information for specifying the storage destination of the output file in the setting information acquired by the setting information acquisition unit 201, or the folder specified by the user of the invention document analysis system 20. It may be a folder, or a folder or the like in which an invention document analysis processing program is installed in a terminal device or the like having a microprocessor that constitutes the invention document analysis system 20 . For example, when the invention document is obtained from a file by the invention document obtaining unit 2021, the subfolder name containing the information indicating the analysis date and time of the invention document includes the file name of the file, Alternatively, when the invention document is acquired from the clipboard by the invention document acquisition unit 2021, a phrase indicating the clipboard may be included. The display document generation unit 2083 further determines one subfolder in the predetermined folder as the storage destination of the common resource, and displays the display added to the display element related to the patent application related information as a part of the HTML document. A CSS file for controlling the display mode and a script file, which are resources that function in response to the control information, are stored in the subfolder of the common resource storage destination only if they are not yet stored. According to this example, in the invention document analysis system 20, each subfolder in a predetermined folder is sorted by subfolder name, and, for example, a subfolder storing an HTML file containing patent application related information based on the analysis result of the invention document is stored. It is possible to arrange and display the folder names in order from the newest. For example, the HTML files in each subfolder may include patent application-related information as an analysis result of the invention document with different content, but each HTML file is stored in one subfolder where the common resource is stored. A CSS file and a script file are combined to form an HTML document. Note that the display unit 2084 displays a list listing each subfolder in the above-mentioned predetermined folder, and in response to a selection operation for one subfolder, includes the HTML files in the subfolder related to the selection operation. It is also possible to display a GUI screen in which the configured HTML document is the target of interpretation and display by the browser, and in the GUI screen, any subfolder can be displayed according to the user's operation. It is also possible to display an operation corresponding GUI element for performing a process of deleting including . The display of this GUI screen may be realized by an HTML document such as an HTML file, or a hyperlink may be provided to transition the display contents to the corresponding HTML file in accordance with the selection operation for one subfolder. The operations of the display document generation unit 2083, the display unit 2084, etc. are realized by installing and executing the above invention document analysis processing program in a terminal device equipped with a microprocessor. It is good also as comprising a part of analysis processing.

図39は、表示部2084により表示されるGUI画面としての表示画面の一例を示す図である。図39に例示する表示画面では、分析対象の発明文書を、発明文書ファイルの選択により、又は、クリップボードから、取得するためのGUI要素が表示されている。発明文書ファイルの選択は、例えば、HTMLの<input>タグにおけるtype属性でfileを指定することにより、実現可能である。図39に例示する表示画面では、分析済み発明文書リストとして、特許出願関連情報を含むHTMLファイルを格納するサブフォルダー名(例えば発明文書の分析日時と分析対象となった発明文書のファイル名又は文字列「clipboard」とを合成した名称)を列挙し、各サブフォルダー名の左に、そのサブフォルダーの削除のための関数を起動するためのプッシュボタンを表示している。例えば、この表示画面に表示されたサブフォルダー名に対してマウスクリック操作がなされると、リンクに係る表示遷移が起こり、そのサブフォルダーに格納された、HTML文書としての特許出願関連情報を含むHTMLファイルに基づく表示内容(図17参照)が表示されることになる。所定フォルダー内の1つのサブフォルダーに格納されたHTML文書としての特許出願関連情報におけるクレーム情報、明細書情報等における重要語句の表示要素が操作対応GUI要素である場合において、ブラウザ等により表示されたその操作対応GUI要素への操作に応じて実行され得る、上述の重要語句包含記載列挙処理は、例えば、その所定フォルダー内の、その1つのサブフォルダーとは別の各サブフォルダー内の、HTML文書としての特許出願関連情報におけるクレーム情報及び明細書情報から、その重要語句が記載されている各行の内容を、重要語句を検索することで収集して、その収集結果である各行を列挙して各行中の重要語句を強調して表示する処理であってもよい。これにより、ユーザは、特許出願関連情報中の重要語句について、発明文書分析システム20に過去に分析させた発明文書に基づいて既に生成されている1つ以上の特許出願関連情報におけるクレーム情報及び明細書情報に含まれる、その重要語句を記載した各行を参照することが可能になる。サブフォルダーの削除のための関数は、例えば、JavaScript(登録商標)で記述され、例えば、ローカルホスト上で動作するPython(登録商標)で記述されたサブフォルダーの削除処理の関数を呼び出す。 FIG. 39 is a diagram showing an example of a display screen as a GUI screen displayed by the display unit 2084. As shown in FIG. The display screen illustrated in FIG. 39 displays GUI elements for acquiring the invention document to be analyzed by selecting the invention document file or from the clipboard. The selection of the invention document file can be realized, for example, by designating file with the type attribute in the HTML <input> tag. On the display screen illustrated in FIG. 39, as an analyzed invention document list, a subfolder name (for example, the analysis date and time of the invention document and the file name or character column "clipboard") and, to the left of each subfolder name, displays a push button to invoke a function for deleting that subfolder. For example, when a mouse click operation is performed on a subfolder name displayed on this display screen, a display transition related to a link occurs, and an HTML file containing patent application-related information as an HTML document stored in the subfolder is displayed. The display contents based on the file (see FIG. 17) are displayed. When display elements of important words in claim information, specification information, etc. in patent application-related information as HTML documents stored in one subfolder within a predetermined folder are GUI elements for operation, displayed by a browser, etc. The important phrase inclusion description enumeration process described above, which can be executed in response to an operation on the operation-responsive GUI element, can be performed, for example, in each subfolder other than the one subfolder in the predetermined folder. From the claim information and specification information in the patent application related information as , collect the contents of each line in which the key words are described by searching for the key words, list each line that is the collection result, and list each line It may be a process of emphasizing and displaying an important phrase in the text. As a result, the user can obtain claim information and specifications in one or more pieces of patent application-related information that have already been generated based on invention documents that have been analyzed by the invention document analysis system 20 in the past, for important terms in the patent application-related information. It becomes possible to refer to each line describing the important phrase included in the document information. The subfolder deletion function is written in, for example, JavaScript (registered trademark), and calls a subfolder deletion processing function written in, for example, Python (registered trademark) operating on the local host.

別の具体的な一例としては、表示用文書生成部2083は、例えば、設定情報における、出力ファイルの格納先の特定用情報で示される所定フォルダー内に、発明文書の分析日時を示す情報を含ませたサブフォルダー名を定めたサブフォルダーを作成し、そのサブフォルダー内に、特許出願関連情報に係る表示用文書としてのHTML文書を構成するHTMLファイル、CSSファイル、及び、スクリプトファイルを格納する。この例によれば、そのサブフォルダーの内容を可搬性のある記録媒体に記録して移送すること、或いは、そのサブフォルダーの内容を、例えば圧縮等して、送信することにより、移送先又は送信先のブラウザ機能を有する各種端末(例えば、デスクトップPC、ノートPC、スマートフォン)等においても、その表示用文書としての特許出願関連情報を閲覧し活用し得る。 As another specific example, the display document generation unit 2083 includes information indicating the analysis date and time of the invention document in the predetermined folder indicated by the information for specifying the storage destination of the output file in the setting information. A subfolder with a given subfolder name is created, and an HTML file, a CSS file, and a script file, which constitute an HTML document as a display document related to patent application related information, are stored in the subfolder. According to this example, the content of the subfolder is recorded on a portable recording medium and transferred, or the content of the subfolder is compressed, for example, and sent, so that the transfer destination or transmission Various terminals (for example, desktop PCs, notebook PCs, smartphones, etc.) having the aforementioned browser function can view and utilize patent application-related information as documents for display.

発明者等又は弁理士は、発明文書分析システム20から発明文書の分析結果に基づいて出力された特許出願関連情報が適切ではないと判断した場合においては、発明文書取得部2021により取得される発明文書、設定情報取得部201により取得される設定情報、重要語句設定辞書取得部203により取得される重要語句設定辞書等を修正して、発明文書分析システム20に発明文書を再分析させることで特許出願関連情報を、より適切な内容となるように更新させることができる。発明者等又は弁理士から、例えば、適切な内容となるように更新された表示用文書としての特許出願関連情報の提供を受けた翻訳者は、その適切な特許出願関連情報等に基づいて、翻訳作業を、適正に又は効率的に、行うことが可能となり得る。また、発明文書分析システム20を利用可能な翻訳者は、発明者等又は弁理士から、例えば、発明文書、設定情報、重要語句設定辞書等の提供を受けた場合に、発明文書分析システム20により特許出願関連情報を得ることができ、その特許出願関連情報等に基づいて、翻訳作業を、適正に又は効率的に、行うことが可能となり得る。 If the inventor or patent attorney determines that the patent application-related information output from the invention document analysis system 20 based on the analysis result of the invention document is not appropriate, the invention acquired by the invention document acquisition unit 2021 By correcting the document, the setting information acquired by the setting information acquisition unit 201, the key phrase setting dictionary acquired by the key phrase setting dictionary acquisition unit 203, and the like, and causing the invention document analysis system 20 to re-analyze the invention document, the patent Application-related information can be updated to have more appropriate content. A translator who has been provided with patent application-related information, for example, as a display document updated to have appropriate content from an inventor or patent attorney, may, based on the appropriate patent application-related information, etc. It may be possible to perform the translation work properly or efficiently. In addition, a translator who can use the invention document analysis system 20 can use the invention document analysis system 20 to The patent application related information can be obtained, and based on the patent application related information and the like, translation work can be performed properly or efficiently.

表示用文書生成部2083は、発明文書の各行へ行番号を追加した情報を含む特許出願関連情報を表示用文書として生成する場合に、例えば、発明文書の各行に対応する各表示要素について、その行が警告情報での指摘の対象となった行であるか否かに応じてその行の表示態様(例えば行の文字列の文字色)を相違させて表示するように定めた表示制御情報を付加することとしてもよい。また、この代わりに、表示用文書生成部2083は、発明文書の各行へ行番号を追加した情報を含む特許出願関連情報を表示用文書として生成する場合に、例えば、発明文書の各行における行番号を1つの表示要素とし、各行番号に対応する表示要素に、警告情報での指摘の対象となった行の行番号と、警告情報での指摘の対象となっていない行の行番号とでは表示態様(例えば行番号の文字色)を相違させて表示するように定めた表示制御情報を付加することとしてもよい。また、表示用文書生成部2083は、発明文書の各行へ行番号を追加した情報を含む特許出願関連情報を表示用文書として生成する場合に、例えば、発明文書の各行に、警告情報での指摘の対象となった不適切な記載が含まれるときには、各行中のその不適切な記載に1つの表示要素を対応付けて、その不適切な記載の文字列をその他の文字列と表示態様を相違させて表示(例えば不適切な記載の文字列の文字色を赤色等にして強調表示)するように定めた表示制御情報を付加することとしてもよい。 When the display document generation unit 2083 generates, as a display document, patent application-related information including information in which line numbers are added to each line of the invention document, for example, each display element corresponding to each line of the invention document is Display control information that determines whether the line is displayed in a different manner (for example, the character color of the character string of the line) depending on whether or not the line is the line pointed out by the warning information. It may be added. Alternatively, when the display document generating unit 2083 generates, as a display document, patent application related information including information in which line numbers are added to each line of the invention document, for example, the line number in each line of the invention document is one display element, and the line number of the line pointed out by the warning information and the line number of the line not pointed out by the warning information are displayed in the display element corresponding to each line number. It is also possible to add display control information that is determined to display with different modes (for example, character colors of line numbers). In addition, when the display document generation unit 2083 generates, as a display document, patent application related information including information in which line numbers are added to each line of the invention document, for example, each line of the invention document is indicated by warning information. When the inappropriate description that is the target of the above is included, one display element is associated with the inappropriate description in each line, and the character string of the inappropriate description is displayed differently from the other character strings. It is also possible to add display control information that is determined to be displayed by changing the character string to be displayed (for example, character strings with inappropriate descriptions are highlighted in red).

表示部2084は、表示用文書生成部2083により生成された表示用文書としての特許出願関連情報を表示する。表示部2084は、例えば、HTML5に準拠してHTML文書を解釈し、HTMLファイルで定められた表示要素を、CSSファイル等に従って表示するブラウザである。表示部2084は、表示用文書生成部2083が、特許出願関連情報に係る表示用文書をHTML5に準拠しないHTML文書(つまりその他のHTML5以外の規格に準拠したHTML文書)として生成する場合には、表示部2084は、表示用文書生成部2083が生成するHTML文書を解釈し表示できるような規格に対応したブラウザとしての機能を有する。なお、表示用文書としての特許出願関連情報における、ブラウザにより表示された表示内容の全部又は一部は、ユーザの操作により、選択可能であってコピー&ペースト又はカット&ペーストの対象となり得るので、そのペーストにより、発明文書分析システム20を構成する端末装置上で実行されている、あるアプリケーションプログラムが使用している文書等の内容として包含させることができる。また、特許出願関連情報に係るGUI要素に対するユーザ操作に応じて実行される処理の実行結果として、ブラウザにより表示される内容が変化した場合において変化後の表示内容の全部又は一部も、ユーザの操作により、選択可能であってコピー&ペースト等の対象となり得る。 The display unit 2084 displays the patent application related information as a display document generated by the display document generation unit 2083 . The display unit 2084 is, for example, a browser that interprets an HTML document based on HTML5 and displays display elements defined by the HTML file according to a CSS file or the like. When the display document generation unit 2083 generates the display document related to the patent application related information as an HTML document not conforming to HTML5 (that is, an HTML document conforming to other standards other than HTML5), The display unit 2084 has a function as a browser conforming to a standard that can interpret and display the HTML document generated by the display document generation unit 2083 . In addition, all or part of the display contents displayed by the browser in the patent application related information as the display document can be selected by the user's operation and can be copied and pasted or cut and pasted. By pasting, it is possible to include the content of a document or the like used by a certain application program running on the terminal device that constitutes the invention document analysis system 20 . In addition, when the content displayed by the browser changes as a result of the execution of the processing executed in response to the user operation on the GUI element related to the patent application related information, all or part of the display content after the change may also be changed by the user. Depending on the operation, it can be selected and can be the target of copy and paste.

表示部2084は、表示用文書を解釈して表示するブラウザとしての機能を有する他に、例えば、表示用文書以外のファイル(例えばテキストファイル)として出力された特許出願関連情報を表示する機能を有してもよく、更に、従来の文書作成編集機能を有するアプリケーションプログラム(例えばテキストエディタ等)のように、その表示された特許出願関連情報をユーザの操作に応じて編集して出力する機能を有していてもよい。表示部2084は、特許出願関連情報をユーザの操作に応じて編集して出力する機能を実行する場合において、ユーザの入力を支援するために、特許出願関連情報における重要語句リストに含まれる複数の重要語句を所定の順序(例えば重要度順)で列挙して表示したポップアップ画面等からユーザに選択された1つの重要語句をカーソル位置に入力する機能を提供することとしてもよい。 The display unit 2084 has a function as a browser that interprets and displays a document for display, and also has a function for displaying patent application-related information output as a file (for example, a text file) other than a document for display. Furthermore, it has a function of editing and outputting the displayed patent application-related information according to the user's operation, like a conventional application program (for example, a text editor) having a document creation and editing function. You may have When executing a function of editing and outputting patent application-related information in accordance with a user's operation, the display unit 2084 displays a plurality of key phrases included in the important word list in the patent application-related information in order to assist the user's input. It is also possible to provide a function of inputting one important phrase selected by the user from a pop-up screen or the like displaying important phrases listed in a predetermined order (for example, in order of importance) at the cursor position.

表示部2084は、操作受付部20841を含む。操作受付部20841は、例えば、HTMLファイルで定められた表示要素に付加された表示制御情報が、その表示要素を操作対応GUI要素とするものである場合(つまり操作に応じて処理を起動するGUIとしての機能を表示要素に持たせるものである場合)に、ユーザによる操作を受け付けて、表示制御情報で定められた関数等を実行する。 Display unit 2084 includes operation reception unit 20841 . For example, if the display control information added to the display element defined in the HTML file indicates that the display element is an operation-responsive GUI element (that is, a GUI element that activates processing according to an operation) function is given to the display element), the user's operation is accepted and the function or the like determined by the display control information is executed.

具体例としては、操作受付部20841は、例えば、表示用文書としての特許出願関連情報における重要語句リスト部分で重要語句に付加された翻訳語候補集合に係る表示要素から、翻訳語候補集合のうちの1つの要素の選択操作を受け付けて、その要素を引数として予め定められた関数を起動して、重要語句についての対応翻訳語を決定する処理を実行する。操作受付部20841により、重要語句についての翻訳語候補集合からのユーザの選択操作の受け付けにより、選択された要素は、例えば、その重要語句と組を成して、重要語句翻訳用学習モデルの生成のための機械学習用の教師データとして、教師データ蓄積部2072に蓄積され得る。また、出力部208は、1つ以上の各重要語句について、その重要語句と、操作受付部20841によりその重要語句についての翻訳語候補集合からのユーザの選択に応じて決定された対応翻訳語との組を、含む翻訳補助情報を生成して出力し得る。 As a specific example, the operation receiving unit 20841, for example, from the display element related to the translation word candidate set added to the key words in the key word list part of the patent application related information as the display document, out of the translation word candidate set receives a selection operation of one element of , activates a predetermined function with that element as an argument, and executes a process of determining a corresponding translated word for an important phrase. The operation reception unit 20841 receives the user's selection operation from the translation word candidate set for the key phrase, and the selected element is paired with the key phrase, for example, to generate a learning model for translation of the key phrase. can be stored in the teacher data storage unit 2072 as teacher data for machine learning for . In addition, for each of the one or more key words, the output unit 208 outputs the key word and the corresponding translation word determined by the operation reception unit 20841 according to the user's selection from the translation word candidate set for the key word. may generate and output translation assistance information containing a set of .

また、操作受付部20841は、例えば、表示用文書としての特許出願関連情報における重要語句リスト部分で、重要語句に対応する表示要素についての操作を受け付けて、操作に応じて、その重要語句を引数として予め定められた関数を起動してその重要語句についての非重要語句化処理を実行する。非重要語句化処理では、その重要語句が発明文書において記載された文の一部(例えば、読点文字及び句点文字で区切られた部分)を、その重要語句と対応付けて、非重要語句設定辞書に含ませることとしてもよい。発明文書分析システム20では、この非重要語句化処理で更新される重要語句設定辞書と非重要語句設定辞書との内容から、入力となる文の一部又は語句について、その文の一部又は語句が重要語句を含むか否か、及び、重要語句を含むならばその重要語句を、予測するための重要語句抽出用学習モデルを生成する機械学習のための教師データを生成して、機械学習部207により重要語句抽出用学習モデルを生成させることとしてもよいし、学習モデル出力部2081により重要語句抽出用学習モデルを出力させることとしてもよい。この重要語句抽出用学習モデルは、例えば、重要語句抽出部2051において、発明文書から重要語句を抽出するために用いられ得る。 Further, the operation reception unit 20841 receives an operation on a display element corresponding to an important phrase in, for example, an important phrase list portion in the patent application related information as a document for display, and uses the important phrase as an argument according to the operation. A predetermined function is activated as , and non-important phrase conversion processing is executed for the important phrase. In the non-important phrase conversion process, a part of the sentence in which the important phrase is described in the invention document (for example, the part delimited by comma characters and full stop characters) is associated with the important phrase, and a non-important phrase setting dictionary is created. may be included in In the invention document analysis system 20, from the contents of the important phrase setting dictionary and the non-important phrase setting dictionary updated by this non-key phrase processing, a part of the sentence or phrase to be input is converted into a part of the sentence or phrase generates teacher data for machine learning to generate a learning model for extracting important phrases for predicting whether or not contains important phrases, and if so, the important phrases, the machine learning unit 207 may generate a learning model for extracting important phrases, or the learning model output unit 2081 may produce a learning model for extracting important phrases. This important phrase extraction learning model can be used, for example, in the important phrase extraction unit 2051 to extract important phrases from invention documents.

[3-1-7-3.設定情報表示用文書の表示]
表示用文書生成部2083は、例えば、設定情報取得部201により取得された設定情報のうちの全部又は一部の情報について表示するためのHTML文書等である設定情報表示用文書を生成することとしてもよい。設定情報表示用文書においては、例えば、設定情報に含まれる各種情報が表示要素として含まれ、その各種情報のうち一部の情報についての表示要素には、その表示要素を操作対応GUI要素とするための表示制御情報が付加され得る。表示用文書生成部2083は、設定情報表示用文書に、設定情報中の翻訳用発明文書標準規定の特定用情報に基づいて翻訳用発明文書標準規定取得部204により取得された翻訳用発明文書標準規定における各条件項目の全部又は一部の内容を表示要素として含ませることとしてもよく、その表示要素には、その表示要素を操作対応GUI要素とするための表示制御情報が付加され得る。
[3-1-7-3. Display setting information display document]
For example, the display document generation unit 2083 generates a setting information display document such as an HTML document for displaying all or part of the setting information acquired by the setting information acquisition unit 201. good too. In the setting information display document, for example, various types of information included in the setting information are included as display elements, and the display elements for some of the various types of information are used as operation-responsive GUI elements. display control information may be added. The display document generation unit 2083 adds the invention document standard for translation acquired by the invention document standard specification for translation acquisition unit 204 to the setting information display document based on the specifying information of the invention document standard specification for translation in the setting information. All or part of the content of each condition item in the regulation may be included as a display element, and display control information for making the display element an operation-responsive GUI element may be added to the display element.

表示用文書生成部2083により生成される設定情報表示用文書で操作対応GUI要素となる表示要素の一例としては、出願先として予定する地域に向けて修正版クレーム情報を生成する場合に用いられる修正方法を定義した修正情報が挙げられる。この修正情報の操作対応GUI要素の具体例としては、複数の修正方法各々にチェックボックスを付加して表示し、チェックボックスが操作によりチェックされた修正方法を、この修正情報の内容として選択するように設定情報を更新する例が、挙げられる。この複数の修正方法の例としては、「クレームの請求対象がプログラムである項が存在する場合にその項をプログラム記録媒体である項に変更する」、「クレームにおいて複数項を引用した1つの項の引用先のいずれかの項が複数の項を引用している場合にその1つの項をその複数項のうちの1つだけを引用した1つの項に変更する」、「クレームにおいて複数項を引用した1つの項を、その複数項のうちの1つだけを引用した1つの項に変更する」、「クレームにおいて複数項を引用した1つの項を、各々がその複数項のうちの相互に異なる1つだけを引用する、その複数と同数の項に変更する」、「明細書中に重要語句が表す要素に対応する符号が記載されている場合にクレーム中でその重要語句に符号を付記する」等が、挙げられる。設定情報表示用文書は、ブラウザにより、解釈され、表示され得る。 An example of a display element that is an operation-responsive GUI element in the setting information display document generated by the display document generation unit 2083 is a modification used when generating a modified version of claim information for a region planned as a filing destination. Modification information that defines the method is included. As a specific example of the operation-responsive GUI element of this correction information, a check box is added to each of a plurality of correction methods and displayed, and the correction method whose check box is checked by operation is selected as the content of this correction information. An example of updating configuration information to Examples of this multiple amendment method include: ``If there is a claim that claims a program, change that claim to a claim that is a program recording medium,'' If any of the paragraphs to which a claim refers to multiple terms, change that one term to a single term that refers to only one of the multiple terms”, “Multiple terms in a claim change a quoted term to a term that quotes only one of those terms,” “change a term that quotes multiple terms in a claim to each other Cite only one that is different, change to the same number of terms as the plurality of them", "In the case where a reference sign corresponding to the element represented by the key phrase is described in the specification, add the reference sign to the key phrase in the claim and the like. The setting information display document can be interpreted and displayed by a browser.

表示部2084は、例えば、設定情報表示用文書を表示し得る。表示部2084により設定情報表示用文書の表示要素が表示された状態では、操作対応GUI要素により、例えば、設定情報に含まれる各種情報(例えば条件情報)の内容をユーザが編集可能となり、例えば、翻訳用発明文書標準規定における各条件項目のうち、発明文書評価情報の生成の基礎としての評価に利用する条件項目を絞り込むために、ユーザが条件項目を選択可能となり得る。ユーザによる編集、選択等の操作を操作受付部20841が受け付けて、操作対象の表示項目と操作とに応じて予め定められた処理を実行する。この処理として、例えば、設定情報の内容(例えば参照文字列パターン情報、特定助詞文字列パターン情報、出願先として予定する地域に向けて修正版クレーム情報を生成する場合に用いられる修正方法を定義した修正情報等)の更新(例えば設定情報を内容とする設定情報ファイルの更新)、警告情報の生成に用いられる発明文書の不適切な記載の条件の更新、発明文書評価情報の生成に用いられる翻訳用発明文書標準規定における条件項目の絞り込み等が実行され得る。 The display unit 2084 can display, for example, a setting information display document. In a state where the display elements of the setting information display document are displayed by the display unit 2084, for example, the user can edit the contents of various information (for example, condition information) included in the setting information by the operation corresponding GUI elements. In order to narrow down the condition items to be used for the evaluation as the basis for generating the invention document evaluation information, the user can select the condition items among the condition items in the invention document standard specifications for translation. The operation accepting unit 20841 accepts operations such as editing and selection by the user, and executes predetermined processing according to the display item to be operated and the operation. As this process, for example, the contents of the setting information (for example, reference character string pattern information, specific particle character string pattern information, and the modification method used when generating modified claim information for the region planned as the application destination are defined. correction information, etc.) (for example, updating a setting information file containing setting information), updating inappropriate description conditions of invention documents used to generate warning information, and translations used to generate invention document evaluation information It is possible to narrow down the condition items in the invention document standard specifications for use, and the like.

[3-1-7-4.重要語句群情報の出力]
出力部208は、例えば、発明文書取得部2021により取得された発明文書から重要語句抽出部2051により抽出された複数の重要語句を列挙した重要語句群情報を、出力し得る。
[3-1-7-4. Output of important phrase group information]
The output unit 208 can output, for example, important phrase group information listing a plurality of important phrases extracted by the important phrase extraction unit 2051 from the invention document acquired by the invention document acquisition unit 2021 .

出力部208は、重要語句群情報における各重要語句に、分析部205が保持する重要語句管理情報を参照することで、重要度決定部2055により決定された重要度を付加してもよいし、属性特定部2056により特定された属性情報を付加してもよい。出力部208は、重要語句抽出部2051により抽出された重要語句のうち、重要語句についての重要度が予め定められた値を超える重要語句だけに関する情報を、重要語句群情報に含ませることとしてもよい。 The output unit 208 may add the importance determined by the importance determining unit 2055 to each important phrase in the important phrase group information by referring to the important phrase management information held by the analysis unit 205, Attribute information specified by the attribute specifying unit 2056 may be added. The output unit 208 may include in the important phrase group information information about only the important phrases whose importance exceeds a predetermined value among the important phrases extracted by the important phrase extraction unit 2051. good.

出力部208は、重要語句群情報における各重要語句について、その重要語句に対応して翻訳部2054で決定された対応翻訳語、或いは、その重要語句に対応して翻訳語候補集合特定部20541で特定された翻訳語候補集合の要素のうち操作受付部20841により選択された要素を、付加してもよい。 For each key phrase in the key phrase group information, the output unit 208 outputs the corresponding translation word determined by the translation unit 2054 corresponding to the key phrase, or An element selected by the operation reception unit 20841 from among the elements of the identified translation word candidate set may be added.

発明文書に基づいて出力された重要語句群情報は、例えば、複数の発明文書の分類、発明文書間の相関性の判断、重要語句設定辞書の生成、翻訳補助情報の生成等に利用可能である。 Important phrase group information output based on invention documents can be used, for example, to classify multiple invention documents, determine correlations between invention documents, generate important phrase setting dictionaries, and generate translation assistance information. .

[3-2.実施形態2に係る発明文書分析処理例]
上述した構成を備える発明文書分析システム20が実行する発明文書分析処理の一例について説明する。
[3-2. Invention document analysis processing example according to the second embodiment]
An example of invention document analysis processing executed by the invention document analysis system 20 having the above configuration will be described.

図40は、発明文書分析処理の一例を示すフローチャートである。 FIG. 40 is a flowchart showing an example of invention document analysis processing.

発明文書分析システム20は、発明文書分析処理として、例えば、図40に示すように、設定情報の取得処理(ステップS11)と、重要語句設定辞書の取得(ステップS12)と、翻訳用発明文書標準規定の取得(ステップS13)と、発明文書の取得(ステップS14)と、図面文書の取得(ステップS15)と、クレームに係る引用関係分析処理(ステップS16)と、重要語句抽出処理(ステップS17)と、要素間関係判別処理(ステップS18)と、各重要語句の属性情報の特定(ステップS19)と、各重要語句の重要度の決定処理(ステップS20)と、翻訳語候補集合の特定処理(ステップS21)と、技術分野の特定処理(ステップS22)と、重要語句の表示色の決定処理(ステップS23)と、警告情報生成処理(ステップS24)と、クレーム情報等生成処理(ステップS25)と、クレームツリー等生成処理(ステップS26)と、明細書情報等生成処理(ステップS27)と、各種翻訳情報の生成処理(ステップS28)と、重要語句リスト等生成処理(ステップS29)と、特許出願関連情報の生成処理(ステップS30)と、表示用文書の生成処理(ステップS31)と、特許出願関連情報の出力処理(ステップS32)とを実行する。なお、図40の例は、一例にすぎず、発明文書分析システム20は、発明文書分析処理として、図40に示す一部のステップを省略又は変更した処理を実行してもよいし、図40に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図40に示す複数のステップの実行順序を変更して実行してもよいし、図40に示す複数のステップの全部又は一部を並列に実行してもよい。 As the invention document analysis process, the invention document analysis system 20 performs, for example, acquisition of setting information (step S11), acquisition of key phrase setting dictionary (step S12), and invention document standard for translation, as shown in FIG. Acquisition of regulations (step S13), acquisition of invention documents (step S14), acquisition of drawing documents (step S15), citation relationship analysis processing for claims (step S16), and important phrase extraction processing (step S17) , element relation determination processing (step S18), identification of attribute information of each key phrase (step S19), importance determination processing of each key phrase (step S20), and translation word candidate set identification processing ( step S21), technical field identification processing (step S22), key phrase display color determination processing (step S23), warning information generation processing (step S24), complaint information generation processing (step S25). , claim tree generation processing (step S26), specification information generation processing (step S27), various translation information generation processing (step S28), important phrase list generation processing (step S29), and patent application Related information generation processing (step S30), display document generation processing (step S31), and patent application related information output processing (step S32) are executed. The example of FIG. 40 is merely an example, and the invention document analysis system 20 may execute the invention document analysis process by omitting or changing some of the steps shown in FIG. 40 may be executed by adding some processing steps to the plurality of steps shown in FIG. 40, the execution order of the plurality of steps shown in FIG. may be performed in parallel.

以下、図40に示す各処理について、随時図面を参照して、説明する。 Hereinafter, each process shown in FIG. 40 will be described with reference to the drawings as needed.

設定情報の取得処理(ステップS11)では、設定情報取得部201が設定情報を取得する。 In the setting information acquisition process (step S11), the setting information acquisition unit 201 acquires setting information.

重要語句設定辞書の取得(ステップS12)では、重要語句設定辞書取得部203が、例えば設定情報に基づいて、重要語句設定辞書を取得する。 In acquisition of the important phrase setting dictionary (step S12), the important phrase setting dictionary acquisition unit 203 acquires the important phrase setting dictionary based on the setting information, for example.

翻訳用発明文書標準規定の取得(ステップS13)では、翻訳用発明文書標準規定取得部204が、例えば設定情報に基づいて、翻訳用発明文書標準規定を取得する。 In the acquisition of the invention document standard specification for translation (step S13), the invention document standard specification acquisition unit 204 for translation acquires the invention document standard specification for translation based on the setting information, for example.

発明文書の取得(ステップS14)では、発明文書取得部2021が、発明文書分析システム20のユーザの指定等に従って、発明文書分析システム20の分析部205の分析対象となる発明文書を取得する。 In the acquisition of the invention document (step S14), the invention document acquisition unit 2021 acquires the invention document to be analyzed by the analysis unit 205 of the invention document analysis system 20 according to the specification of the user of the invention document analysis system 20 or the like.

図面文書の取得(ステップS15)では、図面文書取得部2022が、例えばユーザの指定等に従って、発明文書取得部2021で取得された発明文書に対応する図面を含む図面文書を取得する。 In the drawing document acquisition (step S15), the drawing document acquisition unit 2022 acquires the drawing document including the drawings corresponding to the invention document acquired by the invention document acquisition unit 2021, for example, according to the user's designation.

クレームに係る引用関係分析処理(ステップS16)では、クレーム引用関係検出部2057が、ステップS14で取得された発明文書のクレームの各項間の引用関係を分析する引用関係分析処理を実行する。 In the claim citation relationship analysis process (step S16), the claim citation relationship detection unit 2057 executes a citation relationship analysis process for analyzing the citation relationships between the claims of the invention document acquired in step S14.

図41は、引用関係分析処理(ステップS16)の一例を示すフローチャートである。クレーム引用関係検出部2057は、引用関係分析処理として、例えば、発明文書中のクレームの各項について、所定の引用先項番記載パターンに該当する先行項番記載部分を探索し、先行項番記載部分があれば抽出し(ステップS161)、抽出した先行項番記載部分から1つ以上の項番を特定する(ステップS162)。そして、クレーム引用関係検出部2057は、引用関係分析処理として、クレームの各項毎に、その項とステップS162で特定した項番の集合とを対応付けた情報を含むクレーム引用関係情報を、更新して保持することで、クレーム引用関係情報の保存管理を行う(ステップS163)。 FIG. 41 is a flow chart showing an example of the citation relationship analysis process (step S16). As a citation relationship analysis process, the claim citation relationship detection unit 2057 searches for a preceding item number description portion corresponding to a predetermined citation destination item number description pattern for each claim item in an invention document, and finds the preceding item number description. If there is a part, it is extracted (step S161), and one or more item numbers are specified from the extracted preceding item number description part (step S162). Then, as the citation relation analysis process, the claim citation relation detection unit 2057 updates, for each claim term, claim citation relation information including information that associates that term with the set of item numbers specified in step S162. By saving and holding the claim citation relationship information, storage management of the claim citation relationship information is performed (step S163).

重要語句抽出処理(ステップS17)では、重要語句抽出部2051が、ステップS11で取得された設定情報に基づいて、ステップS14で取得された発明文書のクレームから重要語句を抽出するクレーム重要語句抽出処理と、その発明文書の明細書から重要語句を抽出する明細書重要語句抽出処理とを実行する。 In the important phrase extraction process (step S17), the important phrase extraction unit 2051 extracts important phrases from the claims of the invention document acquired in step S14 based on the setting information acquired in step S11. and a specification key phrase extraction process for extracting key phrases from the specification of the invention document.

図42は、クレーム重要語句抽出処理の一例を示すフローチャートである。クレーム重要語句抽出処理として、重要語句抽出部2051は、例えば、発明文書のクレームから、ステップS12で取得された重要語句設定辞書に含まれる重要語句と同一の重要語句を抽出し(ステップS1711)、クレームの請求対象を重要語句として抽出し(ステップS1712)、クレーム中の符号文字列パターンに該当する文字列(つまり符号)の直前の重要語句候補文字列パターンに該当する文字列を重要語句として抽出し(ステップS1713)、クレーム中の参照文字列パターンに該当する文字列に後続する重要語句候補文字列パターンに該当する文字列を重要語句として抽出し(ステップS1714)、クレーム中の重要語句候補文字列パターンに該当する文字列(つまり重要語句の候補)のうち一定条件を満たすもの(例えば複数の重要語句の候補の記載範囲が記載上の包含関係を有する場合における包含側と被包含側とのうち包含側)を重要語句として抽出する(ステップS1715)。なお、図42の例は、一例にすぎず、重要語句抽出部2051は、クレーム重要語句抽出処理として、図42に示す一部のステップを省略又は変更した処理を実行してもよいし、図42に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図42に示す複数のステップの実行順序を変更して実行してもよいし、図42に示す複数のステップの全部又は一部を並列に実行してもよい。 FIG. 42 is a flow chart showing an example of an important complaint phrase extraction process. As the claim key phrase extraction process, the key phrase extraction unit 2051 extracts, for example, from the claims of the invention document, the same key phrases as the key phrases included in the key phrase setting dictionary acquired in step S12 (step S1711), The object of the claim is extracted as an important phrase (step S1712), and the character string corresponding to the important phrase candidate character string pattern immediately before the character string (that is, code) corresponding to the code character string pattern in the claim is extracted as an important phrase. (step S1713), the character string corresponding to the key phrase candidate character string pattern subsequent to the character string corresponding to the reference character string pattern in the complaint is extracted as an important phrase (step S1714), and the key phrase candidate characters in the complaint are extracted. Of the character strings (that is, key phrase candidates) that correspond to the column pattern, those that satisfy a certain condition (for example, when the description range of multiple key phrase candidates has a description inclusion relationship, Among them, the inclusion side) is extracted as an important phrase (step S1715). Note that the example of FIG. 42 is merely an example, and the important phrase extraction unit 2051 may execute processing in which some steps shown in FIG. 42 are omitted or modified as the complaint important phrase extraction processing. 42 may be executed by adding some processing steps to the plurality of steps shown in FIG. 42, the execution order of the plurality of steps shown in FIG. All or part of multiple steps may be performed in parallel.

図43は、明細書重要語句抽出処理の一例を示すフローチャートである。明細書重要語句抽出処理として、重要語句抽出部2051は、例えば、発明文書の明細書から、ステップS12で取得された重要語句設定辞書に含まれる重要語句と同一の重要語句を抽出し(ステップS1721)、明細書中にクレーム重要語句抽出処理により抽出された重要語句があればその重要語句を抽出し(ステップS1722)、明細書中の符号文字列パターンに該当する文字列(つまり符号)の直前の重要語句候補文字列パターンに該当する文字列を重要語句として抽出し(ステップS1723)、明細書中の特定助詞文字列パターンに該当する文字列(つまり所定の助詞)の直前の重要語句候補文字列パターンに該当する文字列を重要語句として抽出し(ステップS1724)、明細書中の重要語句候補文字列パターンに該当する文字列(つまり重要語句の候補)のうち一定条件を満たすもの(例えば複数の重要語句の候補のうちクレーム重要語句抽出処理で抽出された重要語句を語尾に含むもの)を重要語句として抽出する(ステップS1725)。なお、図43の例は、一例にすぎず、重要語句抽出部2051は、明細書重要語句抽出処理として、図43に示す一部のステップを省略又は変更した処理を実行してもよいし、図43に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図43に示す複数のステップの実行順序を変更して実行してもよいし、図43に示す複数のステップの全部又は一部を並列に実行してもよい。 FIG. 43 is a flow chart showing an example of a specification key phrase extraction process. As the specification key phrase extraction process, for example, the key phrase extraction unit 2051 extracts the same key phrases as the key phrases included in the key phrase setting dictionary acquired in step S12 from the specification of the invention document (step S1721). ), if there is an important phrase extracted by the claim important phrase extraction process in the specification, extract the important phrase (step S1722), is extracted as an important phrase (step S1723). A character string corresponding to the string pattern is extracted as an important phrase (step S1724). Among the candidates for key phrases in (1725), those that include the key phrases extracted in the claim key phrase extraction process at the end of words) are extracted as key phrases (step S1725). Note that the example in FIG. 43 is merely an example, and the important phrase extraction unit 2051 may execute a process in which some of the steps shown in FIG. Some processing steps may be added to the plurality of steps shown in FIG. 43 and executed, or the execution order of the plurality of steps shown in FIG. All or some of the steps shown may be performed in parallel.

要素間関係判別処理(ステップS18)では、要素間関係判別部2058が、重要語句抽出処理(ステップS17)で抽出された複数の重要語句各々が表す要素間の関係を判別する。 In the inter-element relationship determination process (step S18), the inter-element relationship determination unit 2058 determines the relationship between elements represented by each of the multiple key words extracted in the key word extraction process (step S17).

図44は、要素間関係判別処理(ステップS18)の一例を示すフローチャートである。要素間関係判別処理(ステップS18)として、要素間関係判別部2058は、例えば、重要語句抽出処理(ステップS17)で抽出された複数の重要語句が表す要素間の構成上の包含関係について判別する包含関係判別処理を実行し(ステップS181)、複数の重要語句各々が表す要素間が記録媒体とその記録媒体の内容との関係を有することについて判別する記録関係判別処理を実行し(ステップS182)、複数の重要語句各々が表す要素間がプログラムとそのプログラムによる実現内容との関係を有することについて判別するプログラム実現関係判別処理を実行し(ステップS183)、複数の重要語句が表す要素間に等価関係があることを判別する等価関係判別処理を実行し(ステップS184)、複数の重要語句が表す要素間に概念上の上下関係があることを判別する上下概念関係判別処理を実行する(ステップS185)。そして、要素間関係判別部2058は、包含関係判別処理の結果を示す包含関係情報と、記録関係判別処理の結果を示す記録関係情報と、プログラム実現関係判別処理の結果を示すプログラム実現関係情報と、等価関係判別処理の結果を示す等価関係情報と、上下概念関係判別処理の結果を示す上下概念関係情報とを含む重要語句関係情報を生成する(ステップS186)。なお、図44の例は、一例にすぎず、要素間関係判別部2058は、要素間関係判別処理として、図44に示す一部のステップを省略又は変更した処理を実行してもよいし、図44に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図44に示す複数のステップの実行順序を変更して実行してもよいし、図44に示す複数のステップの全部又は一部を並列に実行してもよい。 FIG. 44 is a flow chart showing an example of the inter-element relationship determination process (step S18). As the inter-element relationship determination processing (step S18), the inter-element relationship determination unit 2058 determines, for example, the structural inclusion relationship between the elements represented by the multiple key phrases extracted in the key phrase extraction processing (step S17). Execute inclusion relation determination processing (step S181), and execute recording relation determination processing for determining whether or not the elements represented by each of the plurality of key words have a relationship between the recording medium and the contents of the recording medium (step S182). , a program realization relationship determination process for determining whether the elements represented by each of the key phrases have a relationship between the program and the content realized by the program (step S183), Equivalent relationship determination processing for determining that there is a relationship is executed (step S184), and hierarchical conceptual relationship determination processing is performed for determining that there is a conceptual hierarchical relationship between elements represented by a plurality of important terms (step S185). ). Then, the inter-element relationship determination unit 2058 determines the inclusion relationship information indicating the result of the inclusion relationship determination process, the recording relationship information indicating the result of the recording relationship determination process, and the program realization relationship information indicating the result of the program realization relationship determination process. , important phrase relationship information including equivalent relationship information indicating the result of the equivalent relationship determination process and hierarchical concept relationship information indicating the result of the hierarchical concept relationship determination process (step S186). The example of FIG. 44 is merely an example, and the inter-element relationship determination unit 2058 may execute processing in which some steps shown in FIG. 44 are omitted or modified as the inter-element relationship determination processing. Some processing steps may be added to the plurality of steps shown in FIG. 44 and executed, or the execution order of the plurality of steps shown in FIG. All or some of the steps shown may be performed in parallel.

各重要語句の属性情報の特定(ステップS19)では、属性特定部2056が、重要語句抽出処理(ステップS17)で抽出された各重要語句について、要素間関係判別処理(ステップS18)の結果等を用いて、重要語句の属性情報(図19参照)を特定する。 In specifying the attribute information of each key phrase (step S19), the attribute specifying unit 2056 determines the results of the inter-element relationship determination processing (step S18) for each key phrase extracted in the key phrase extraction processing (step S17). is used to identify the attribute information of the key phrase (see FIG. 19).

各重要語句の重要度の決定処理(ステップS20)では、重要度決定部2055が、重要語句抽出処理(ステップS17)で抽出された各重要語句について、重要度の決定を行う。 In the process of determining the importance of each important phrase (step S20), the importance determining unit 2055 determines the importance of each of the important phrases extracted in the important phrase extraction process (step S17).

図45は、各重要語句の重要度の決定処理(ステップS20)の一例を示すフローチャートである。各重要語句の重要度の決定処理(ステップS20)として、重要度決定部2055は、例えば、重要語句抽出処理(ステップS17)で抽出された各重要語句についてステップS19で属性特定部2056により特定された属性情報に基づいてその重要語句の重要度を決定し(ステップS201)、更に、構成上の包含関係を有する要素同士を表す重要語句間では包含する側が包含される側と同一以上の重要度となるように、重要度を再決定する(ステップS202)。なお、図45の例は、一例にすぎず、重要度決定部2055は、各重要語句の重要度の決定処理として、図45に示す一部のステップを省略又は変更した処理を実行してもよいし、図45に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図45に示す複数のステップの実行順序を変更して実行してもよいし、図45に示す複数のステップの全部又は一部を並列に実行してもよい。 FIG. 45 is a flow chart showing an example of the process of determining the importance of each key phrase (step S20). As the process of determining the importance of each important phrase (step S20), the importance determining unit 2055 performs, for example, the attribute identifying unit 2056 in step S19 for each important phrase extracted in the important phrase extraction process (step S17). Based on the attribute information obtained, the importance of the important phrase is determined (step S201). The importance is re-determined so that (step S202). Note that the example of FIG. 45 is merely an example, and the importance determining unit 2055 may execute processing with some of the steps shown in FIG. Alternatively, some processing steps may be added to the plurality of steps shown in FIG. 45 and executed, the execution order of the plurality of steps shown in FIG. 45 may be changed and executed, All or part of the steps shown in FIG. 45 may be performed in parallel.

翻訳語候補集合の特定処理(ステップS21)では、翻訳語候補集合特定部20541が、重要語句抽出処理(ステップS17)で抽出された各重要語句について、対訳辞書情報を用いて、その重要語句についての対応翻訳語の候補の集合である翻訳語候補集合を特定する。翻訳語候補集合の特定処理(ステップS21)では、翻訳語候補集合特定部20541は、各重要語句について、例えば、その重要語句を入力とした、重要語句翻訳用学習モデルを用いた演算処理により、生成された機械翻訳結果を、その重要語句についての翻訳語候補集合に追加し得る。 In the translation word candidate set identification processing (step S21), the translation word candidate set identification unit 20541 uses the bilingual dictionary information to identify each key phrase extracted in the key phrase extraction processing (step S17). A translation word candidate set, which is a set of corresponding translation word candidates, is identified. In the translation word candidate set identification process (step S21), the translation word candidate set identification unit 20541, for example, uses the key phrase as an input and uses the key phrase translation learning model to perform arithmetic processing for each key phrase. The generated machine translation result can be added to the translation word candidate set for the key phrase.

技術分野の特定処理(ステップS22)では、技術分野特定部20531が、ステップS14で取得された発明文書から重要語句抽出処理(ステップS17)で抽出された重要語句の集合である重要語句群に基づいて、その発明文書の技術分野を特定する。技術分野特定部20531は、技術分野の特定処理(ステップS22)において、技術分野との対応が知られている複数の発明文書各々における技術分野とその発明文書から過去に重要語句抽出処理で抽出された重要語句群との関係を用いることで、技術分野が知られていない発明文書の技術分野を特定する。技術分野特定部20531は、技術分野の特定処理(ステップS22)において、例えば、技術分野特定用学習モデルを用いて予め定められた演算処理を行うことで、発明文書から抽出した重要語句群に基づいて、その発明文書が属する技術分野を特定し得る。 In the technical field identification process (step S22), the technical field identification unit 20531 extracts from the invention document acquired in step S14 in the important phrase extraction process (step S17) based on the important phrase group, which is a set of important phrases. to identify the technical field of the invention document. In the technical field identification process (step S22), the technical field identification unit 20531 identifies technical fields in each of a plurality of invention documents whose correspondence with the technical field is known, and extracts key phrases extracted from the invention documents in the past by the key phrase extraction process. Identify the technical field of the invention document whose technical field is unknown by using the relationship with the group of important words and phrases. In the technical field identification process (step S22), the technical field identification unit 20531 performs predetermined arithmetic processing using, for example, the learning model for technical field identification, based on the key phrase group extracted from the invention document. can identify the technical field to which the invention document belongs.

重要語句の表示色の決定処理(ステップS23)では、例えば、分析部205が、重要語句抽出処理(ステップS17)で抽出された重要語句を、表示用文書としての特許出願関連情報の一部となる各種情報に表示要素として含ませ、その表示要素に付加する表示制御情報に、その重要語句の初出行番号に基づいて、小さい順となるように定めた通番を含む識別コードを含ませ、分析部205或いは表示用文書生成部2083は、その識別コードの通番部分が相対的に近い表示要素同士の表示態様としての表示色が、相対的に大きな差異を有するように、その表示制御情報を定める。ここで、例えば、クレームを表すクレーム情報における重要語句を構成する文字列が互いに相違する複数の重要語句についての、その重要語句の識別コードに含まれる通番は、例えば、その重要語句と同一の文字列で構成された重要語句がそのクレームに記載されていた最先の位置(例えばその重要語句の初出行番号)の昇順に定められたものである。この例において、クレーム情報における重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る表示制御情報は、その複数の重要語句各々について、重要語句毎の識別情報における識別コードに係る通番が連続する重要語句同士の表示色の差異(例えば色相成分の差異、RGB値の各成分の差異等)を、その通番が連続しない重要語句同士の表示色の差異より大きくするように、各重要語句に付加する表示色を制御するためのものとしてもよい。例えばその通番が1の重要語句の表示制御情報によりその重要語句に付加される表示色(例えばその重要語句に付加される有幅の左境界線の色等)のRGB値(ここではRGB各成分0~255(0xff)の256段階の値を持ち得る例で説明する。)が、赤「255」(0xff)、緑「0」、青「0」であり、その通番が2の重要語句の表示制御情報によりその重要語句に付加される表示色のRGB値が赤0、緑「255」(0xff)、青「0」であり、その通番が3の重要語句の表示制御情報によりその重要語句に付加される表示色のRGB値が赤「0」、緑「0」、青「255」(0xff)であり、その通番が4の重要語句の表示制御情報によりその重要語句に付加される表示色のRGB値が赤「153」(0x99)、緑「0」、青「0」であり、その通番が5の重要語句の表示制御情報によりその重要語句に付加される表示色のRGB値が赤「0」、緑「153」(0x99」、青「0」であるとすれば、通番が所定数(この例では3)以下である第1グループの複数の重要語句のうち、2つの重要語句の組各々における各重要語句に付加される表示色の差異の、その全組での最小値は、通番が所定数より大きい第2グループの複数の重要語句とその第1グループの複数の重要語句とを混合した混合グループの複数の重要語句のうち、2つの重要語句の組各々における各重要語句に付加される表示色の差異の、その全組での最小値より大きい。例えば、簡易的にRGB値が直交3軸の各成分であるとして、2つの重要語句各々に付加される表示色のRGB値間の距離を求める等により表示色の差異は算定され得る。このように各重要語句に付加される表示色の差異に係る制御を行う、重要語句の表示制御情報により、表示用文書としての特許出願関連情報におけるクレーム情報中の各重要語句が表示された場合に、クレーム情報を閲覧した翻訳者等にとって、クレーム情報中の各重要語句の迅速な識別が可能となり得る。上述のような重要語句の識別情報に係る通番(つまり重要語句の初出行番号)に基づく表示色の調整は、クレーム情報の先頭に近い比較的重要な部分(例えばクレームの項番が比較的小さい項の記載部分)においての重要語句間の識別性を向上させるために有用である。
別の例として、例えば、通番が1から216以下の第1所定数(例えば200)までの第1グループの重要語句に付加される表示色は、RGB値の各成分の値として「0」、「51」(0x33)、「102」(0x66)、「153」(0x99)、「204」(0xcc)、及び、「255」(0xff)のいずれかを用いて相互に異なるものとなるように定められ、通番が第1所定数(例えば200)より大きく第2所定数(例えば300)までの第2グループの重要語句に付加される表示色は、RGB値の各成分の値として「34」(0x22)、「85」(0x55)、「136」(0x88)、「187」(0xbb)、及び、「238」(0xee)のいずれかを用いて相互に異なるものとなるように定められ、通番が第2所定数う(例えば300)より大きく第3所定数(例えば400)までの第3グループの重要語句に付加される表示色は、RGB値の各成分の値として「17」(0x11)、「68」(0x44)、「119」(0x77)、「170」(0xaa)、及び、「221」(0xdd)のいずれかを用いて相互に異なるものとなるように定められることとしてもよい。この例でも、通番が第1所定数(この例では200)以下である第1グループの複数の重要語句のうち、2つの重要語句の組各々における各重要語句に付加される表示色の差異の、その全組での最小値は、通番が所定数より大きい第2グループ、或いは、第2グループ及び第3グループの複数の重要語句と、その第1グループの複数の重要語句とを混合した混合グループの複数の重要語句のうち、2つの重要語句の組各々における各重要語句に付加される表示色の差異の、その全組での最小値より大きい。各重要語句の表示色の差異の最小値が大きいグループでは、その各重要語句を、表示色の差異により、比較的迅速に又正しく識別可能となる。この例では、表示用文書としての特許出願関連情報におけるクレーム情報中の各重要語句が表示された場合に、クレーム情報を閲覧した翻訳者等にとって、クレーム情報中の比較的先頭に近い部分に記載されている第1グループの各重要語句を相互に比較的迅速又は正しく識別可能となる。
表示用文書としての特許出願関連情報における各種の表示要素に付加される表示制御情報は、表示要素の表示色を変更して表示要素を強調する他、表示要素の内容の文字列の太字化、文字サイズの変更等で表示要素を強調するものであってもよいし、表示要素の内容に対して情報を付加する情報付加表示を行うもの(例えば重要語句に対する重要度、属性情報等の付加を行うもの)であってもよいし、表示要素を操作に応じて情報付加表示を行うためのGUI要素とするものであってもよいし、表示要素を操作に応じて表示要素の内容に基づく検索、翻訳等の処理を行うためのGUI要素とするものであってもよいし、表示要素を操作に応じて表示要素の内容に関連する情報を表示するように表示遷移を行うためのGUI要素とするものであってもよい。
In the key phrase display color determination process (step S23), for example, the analysis unit 205 extracts the key phrases extracted in the key phrase extraction process (step S17) as part of the patent application-related information as a document for display. The information is included as a display element in various information, and the display control information added to the display element includes an identification code including a serial number determined in ascending order based on the first appearance number of the important phrase, and analyzed The unit 205 or the display document generation unit 2083 determines the display control information so that the display colors as the display modes of the display elements whose serial numbers of the identification codes are relatively close have a relatively large difference. . Here, for example, for a plurality of important phrases in which the character strings constituting the important phrases in the claim information representing the claim are different from each other, the serial number included in the identification code of the important phrases is, for example, the same characters as the important phrases. The key phrases in columns are arranged in ascending order of the earliest position (eg, the first appearance line number of the key phrase) in the claim. In this example, the display control information for each of a plurality of key phrases in which the character strings constituting the key phrase in the complaint information are different from each other is a serial number associated with the identification code in the identification information for each key phrase for each of the plurality of key phrases. key phrases with consecutive numbers (for example, differences in hue components, differences in RGB value components, etc.) should be larger than the difference in display colors between key phrases with non-consecutive serial numbers. It may be for controlling the display color added to the phrase. For example, the RGB values (here, each RGB component 0 to 255 (0xff), which can have 256 levels of values. The RGB values of the display colors added to the important phrase by the display control information are red 0, green "255" (0xff), and blue "0", and the important phrase is displayed by the display control information of the important phrase whose sequence number is 3. The RGB value of the display color added to is red "0", green "0", blue "255" (0xff), and the display added to the important phrase by the display control information of the important phrase whose serial number is 4 The RGB values of the color are red "153" (0x99), green "0", and blue "0". Assuming that red is "0", green is "153" (0x99), and blue is "0", two of the important phrases in the first group whose serial number is equal to or less than a predetermined number (3 in this example) The minimum value of the difference in the display color added to each important phrase in each set of phrases in all sets is the number of important phrases in the second group and the important phrases in the first group whose sequence number is greater than a predetermined number. The difference in the display color added to each key phrase in each of two key phrase sets among multiple key phrases in a mixed group in which words and phrases are mixed is greater than the minimum value in all sets. Assuming that the RGB values are the respective components of the three orthogonal axes, the difference in the display colors can be calculated by finding the distance between the RGB values of the display colors added to each of the two important phrases. View the claim information when each key phrase in the claim information in the patent application related information as a display document is displayed by the display control information of the important phrase, which controls the difference in the display color added to the For translators, etc. who have done so, it is possible to quickly identify each key phrase in the claim information.Adjustment of the display color based on the serial number related to the identification information of the key phrase (that is, the first appearance number of the key phrase) as described above , is useful for improving the distinguishability between important words and phrases in relatively important parts near the beginning of claim information (for example, description parts of claims with relatively small item numbers).
As another example, for example, the display color added to the important phrases of the first group with a serial number from 1 to a first predetermined number (for example, 200) of 216 or less is "0" as the value of each component of the RGB value, to differ from each other using any of '51' (0x33), '102' (0x66), '153' (0x99), '204' (0xcc), and '255' (0xff) The display color that is determined and added to the important phrases of the second group whose sequence number is greater than the first predetermined number (for example, 200) and up to the second predetermined number (for example, 300) is "34" as the value of each component of the RGB values. (0x22), "85" (0x55), "136" (0x88), "187" (0xbb), and "238" (0xee) are defined to be mutually different, The display color added to the important phrases of the third group whose serial number is greater than the second predetermined number (for example, 300) and up to the third predetermined number (for example, 400) is "17" (0x11 ), ``68'' (0x44), ``119'' (0x77), ``170'' (0xaa), and ``221'' (0xdd). good. In this example as well, among the plurality of key phrases in the first group whose sequence number is equal to or less than the first predetermined number (200 in this example), the difference in the display color added to each key phrase in each of the two key phrase pairs is , the minimum value in all pairs is a mixture of the second group, or a mixture of a plurality of important phrases of the second and third groups with a serial number larger than a predetermined number, and a plurality of important phrases of the first group. The difference in the display color added to each key word in each of the two key word sets of the multiple key words in the group is greater than the minimum value for the entire set. In the group in which the minimum value of the difference in the display color of each important phrase is large, each of the important phrases can be identified relatively quickly and correctly due to the difference in display color. In this example, when each key phrase in the claim information in the patent application-related information as a display document is displayed, it appears relatively near the beginning of the claim information for translators who browse the claim information. Each of the key phrases of the first group of phrases being identified can be relatively quickly or correctly identified from each other.
The display control information added to various display elements in the patent application related information as a display document changes the display color of the display element to emphasize the display element, makes the character string of the content of the display element bold, Display elements may be emphasized by changing the character size, etc., or information addition display that adds information to the contents of the display elements (for example, adding the importance of important words and phrases, attribute information, etc.) may be performed), the display element may be a GUI element for performing information addition display according to the operation, or the display element may be a search based on the contents of the display element according to the operation , a GUI element for performing processing such as translation, etc., or a GUI element for performing display transition so as to display information related to the content of the display element according to the operation of the display element. It may be something to do.

警告情報生成処理(ステップS24)では、警告情報生成部2059が、ステップS11で取得された設定情報、ステップS13で取得された翻訳用発明文書標準規定等に基づいて、ステップS14で取得された発明文書における不適切な記載を指摘する指摘情報を含む警告情報を生成する。 In the warning information generation process (step S24), the warning information generation unit 2059 generates the invention acquired in step S14 based on the setting information acquired in step S11, the invention document standard specification for translation acquired in step S13, and the like. Generate warning information including indication information pointing out inappropriate descriptions in the document.

図46は、警告情報生成処理(ステップS24)の一例を示すフローチャートである。警告情報生成処理(ステップS24)として、警告情報生成部2059は、例えば、発明文書の記載が「翻訳用発明文書標準規定」に適合していなければ指摘する指摘情報を警告情報に含ませ(ステップS241)、クレーム引用関係情報を参照し、発明文書のクレーム中の参照記載に対応する先行語句が不存在であればその旨を指摘する指摘情報を警告情報に含ませ(ステップS242)、発明文書のクレーム、明細書等の各見出し、図面番号、段落番号等の記載様式の不備があればその旨を指摘する指摘情報を警告情報に含ませ(ステップS243)、発明文書の文の不備、符号に関する不備、表記の不統一、及び、誤記の可能性のいずれか1つ以上が存在すればその旨を指摘する指摘情報を警告情報に含ませ(ステップS244)、表示用文書における警告情報中の各指摘情報に係る表示要素に、指摘対象となった発明文書の行、指摘に関連するクレーム情報の項、或いは、明細書情報の段落への表示遷移用のGUI要素として機能するための表示制御情報を付加し(ステップS245)、発明文書評価情報を生成して警告情報に追加する(ステップS246)。なお、図46の例は、一例にすぎず、警告情報生成部2059は、警告情報生成処理として、図46に示す一部のステップを省略又は変更した処理を実行してもよいし、図46に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図46に示す複数のステップの実行順序を変更して実行してもよいし、図46に示す複数のステップの全部又は一部を並列に実行してもよい。 FIG. 46 is a flow chart showing an example of the warning information generation process (step S24). As the warning information generation process (step S24), the warning information generation unit 2059 causes the warning information to include, for example, indication information pointing out if the description of the invention document does not comply with the "invention document standard specification for translation" (step S24). S241), referring to the claim citation relationship information, and if there is no precedent word corresponding to the reference description in the claim of the invention document, the warning information includes pointing information indicating that fact (step S242), and the invention document If there is any deficiencies in the description format of claims, specifications, etc., drawing numbers, paragraph numbers, etc., the warning information includes pointing information pointing out that fact (step S243), and deficiencies in the text of the invention document, code If there is any one or more of inadequacies related to, inconsistency in notation, and the possibility of clerical errors, the warning information includes indication information pointing out that fact (step S244), and the warning information in the display document Display control for functioning as a GUI element for display transition to the line of the invention document that is the object of indication, the claim information section related to the indication, or the paragraph of specification information for the display element related to each indication information Information is added (step S245), invention document evaluation information is generated, and added to the warning information (step S246). Note that the example of FIG. 46 is merely an example, and the warning information generation unit 2059 may execute processing in which some of the steps shown in FIG. 46 are omitted or modified as the warning information generation processing. 46 may be executed by adding some processing steps to the plurality of steps shown in FIG. 46, the execution order of the plurality of steps shown in FIG. may be performed in parallel.

クレーム情報等生成処理(ステップS25)では、クレーム情報生成部205aが、ステップS14で取得された発明文書のクレームに基づいて、特許出願関連情報に含まれるべきクレーム情報等を生成する。 In the claim information generating process (step S25), the claim information generation unit 205a generates claim information and the like to be included in the patent application related information based on the claims of the invention document acquired in step S14.

図47は、クレーム情報等生成処理(ステップS25)の一例を示すフローチャートである。クレーム情報等生成処理(ステップS25)として、クレーム情報生成部205aは、例えば、クレーム情報生成処理を実行し(ステップS251)、符号決定処理を実行し(ステップS252)、クレームベース図面情報生成処理を実行し(ステップS253)、クレームベース明細書情報生成処理を実行し(ステップS254)、クレームベース要約書情報生成処理を実行し(ステップS255)、修正版クレーム情報生成処理を実行する(ステップS256)。 FIG. 47 is a flow chart showing an example of the complaint information generation process (step S25). As the complaint information etc. generation process (step S25), the complaint information generation unit 205a executes, for example, a complaint information generation process (step S251), a sign determination process (step S252), and a complaint base drawing information generation process. execution (step S253), execution of claim-based specification information generation processing (step S254), execution of claim-based abstract information generation processing (step S255), and execution of modified version claim information generation processing (step S256) .

図48は、クレーム情報生成処理(ステップS251)の一例を示すフローチャートである。クレーム情報生成処理(ステップS251)として、クレーム情報生成部205aは、例えば、ステップS14で取得された発明文書中のクレームに基づいてクレームを表すクレーム情報を生成し(ステップS2511)、表示用文書としての特許出願関連情報におけるクレーム情報中の各重要語句の表示要素に対して、基本的に重要語句毎に異なる表示色を付加し、操作に応じて重要語句に関連する情報付加表示を行うためのGUI機能を持たせ、別の操作に応じて重要語句についての検索、翻訳等の処理を実行するためのGUI機能を持たせる等のために、表示制御情報を付加し(ステップS2512)、クレーム情報中の各項の見出しの表示要素に対して、強調表示、次の見出し等への表示遷移の操作対応GUI機能を持たせる等のために、表示制御情報を付加し(ステップS2513)、クレーム情報中の参照文字列の表示要素に対して、強調表示等のために、表示制御情報を付加し(ステップS2514)、クレーム情報中のコメントの表示要素に対して、強調表示等のために、表示制御情報を付加し(ステップS2515)、クレーム情報中で、警告情報の指摘対象となった部分の表示要素に対して、強調表示等のために、表示制御情報を付加する(ステップS2516)。 FIG. 48 is a flow chart showing an example of the complaint information generation process (step S251). As the complaint information generation process (step S251), the complaint information generation unit 205a generates complaint information representing the complaint based on the complaint in the invention document acquired in step S14 (step S2511), and generates the complaint information as a document for display. For the display elements of each key phrase in the claim information in the patent application related information, basically different display colors are added for each key phrase, and information related to the key phrase is added and displayed according to the operation. Display control information is added (step S2512) in order to provide a GUI function and to provide a GUI function for executing processing such as retrieval and translation of key words in response to another operation (step S2512). Display control information is added to the display elements of the headings in each section in order to have a GUI function corresponding to operations such as highlighting and display transition to the next heading (step S2513). Display control information is added for highlighting, etc., to the display element of the reference character string in the complaint information (step S2514), and display is performed for highlighting, etc., to the display element of the comment in the complaint information. Control information is added (step S2515), and display control information is added for highlighting or the like to the display element of the portion pointed out by the warning information in the complaint information (step S2516).

図49は、符号決定処理(ステップS252)の一例を示すフローチャートである。符号決定処理(ステップS252)として、クレーム情報生成部205aは、例えば、ステップS14で取得された発明文書中のクレームから重要語句抽出処理(ステップS17)により抽出された各重要語句のうち、その重要語句が表す要素のカテゴリー種別が物及び方法のいずれかであれば符号決定対象として選定し(ステップS2521)、符号決定対象として選定した重要語句が、発明文書における「符号の説明」で符号と対応していればその符号を最優先で採用し(ステップS2522)、符号決定対象として選定した重要語句が、発明文書における明細書で符号が付されている場合にはその符号を、最優先の次に優先して採用し(ステップS2523)、符号決定対象として選定した各重要語句について、重要語句が表す要素の構成上の包含関係に基づいて、包含側の重要語句の符号の文字列と被包含側の重要語句の符号の文字列とが、文字列間に包含関係を有する等といった予め定められた関係となるように、符号を決定する(ステップS2524)。 FIG. 49 is a flow chart showing an example of the code determination process (step S252). As the code determination process (step S252), the complaint information generation unit 205a selects the important words and phrases extracted from the claims in the invention document acquired in step S14 by the important word and phrase extraction process (step S17). If the category type of the element represented by the word is either product or method, it is selected as a code determination target (step S2521), and the important word selected as a code determination target corresponds to the code in the "description of code" in the invention document. If so, the code is adopted with the highest priority (step S2522), and if the important phrase selected as the object of code determination is given a code in the specification of the invention document, the code is given the highest priority. (step S2523), and for each important phrase selected as a sign determination target, based on the structural inclusion relationship of the elements represented by the important phrase, the character string of the sign of the important phrase on the including side and the included The code is determined so that it has a predetermined relationship such as an inclusion relationship between the character strings with the character string of the key phrase code on the side (step S2524).

図50は、クレームベース図面情報生成処理(ステップS253)の一例を示すフローチャートである。クレームベース図面情報生成処理(ステップS253)として、クレーム情報生成部205aは、例えば、ステップS14で取得された発明文書中のクレームから重要語句抽出処理(ステップS17)により抽出された重要語句が表す請求対象が他の重要語句が表す要素を包含している場合にその各重要語句を囲む矩形枠が包含関係に従って配置された構成図を生成し(ステップS2531)、クレームの重要語句が表す記録媒体に係る要素が他の重要語句が表す要素を記録している場合にその記録媒体の記録内容を列挙する図を生成し(ステップS2532)、クレームの重要語句が表すプログラムに係る要素が他の重要語句が表す要素の機能、処理等を実現する場合にその実現される機能等に係る要素の集合を示す図を生成し(ステップS2533)、符号決定処理(ステップS252)により符号が決定されている重要語句については、図中の重要語句に係る描画内容(例えば矩形枠)から引出線で結んだ符号を付加し(ステップS2534)、各図について各図中の重要語句の最小の初出クレーム番号の小さい順に図面番号を決定し(ステップS2535)、クレームベース図面情報における各符号の表示要素に対応して符号検索による表示制御(例えば符号を表示するように表示遷移を行って符号を強調表示する制御)を可能にするための表示制御情報を付加する(ステップS2536)。 FIG. 50 is a flow chart showing an example of the claim-based drawing information generation process (step S253). As the claim-based drawing information generation process (step S253), the claim information generation unit 205a, for example, extracts the claims expressed by the important words and phrases extracted from the claims in the invention document acquired in step S14 by the important word and phrase extraction process (step S17). If the target includes elements represented by other key words, a configuration diagram is generated in which rectangular frames surrounding each key word are arranged according to the inclusion relationship (step S2531), and is recorded on the recording medium represented by the key words of the claim. If the relevant element records an element represented by another key phrase, a diagram listing the recording contents of the recording medium is generated (step S2532), and the element related to the program represented by the key phrase of the claim is When realizing the function, processing, etc. of the element represented by , a diagram showing a set of elements related to the function to be realized is generated (step S2533), and the important element whose code is determined by the code determination process (step S252) As for the words, a code connected by a leader line is added from the drawing contents (for example, a rectangular frame) related to the important words in the figure (step S2534). A drawing number is determined in order (step S2535), and display control is performed by code search corresponding to the display element of each code in the claim-based drawing information (for example, control to highlight the code by performing display transition so as to display the code). is added (step S2536).

図51は、クレームベース明細書情報生成処理(ステップS254)の一例を示すフローチャートである。クレームベース明細書情報生成処理(ステップS254)として、クレーム情報生成部205aは、例えば、ステップS14で取得された発明文書中のクレームの各請求対象起点項の請求対象に基づいて、「発明の名称」、「発明が解決しようとする課題」及び「課題を解決するための手段」の内容を生成し(ステップS2541)、クレームベース図面情報生成処理(ステップS253)で生成されたクレームベース図面情報に基づいて「図面の簡単な説明」の内容を生成し(ステップS2542)、クレームの各項毎に、その内容と対応する効果の記載支援用未完成メッセージとを含ませた「発明を実施するための形態」の内容を生成し(ステップS2543)、ステップS186で生成された重要語句関係情報と、クレームベース図面情報とに基づいて、各重要語句の説明順序を決定し(ステップS2544)、決定した説明順序に従い、各重要語句を主語とし、符号が決定されている重要語句には符号を付加して、必要に応じて記載支援用未完成メッセージを付加した文を「発明を実施するための形態」に追記し(ステップS2545)、表示用文書としての特許出願関連情報におけるクレームベース明細書情報中の重要語句、符号及び記載支援用未完成メッセージの表示要素に、強調表示等といった表示態様の制御、操作対応GUI要素としての機能を持たせる制御等のために、表示制御情報を付加する(ステップS2546)。 FIG. 51 is a flow chart showing an example of the claim-based statement information generation process (step S254). As the claim-based specification information generation process (step S254), the claim information generation unit 205a generates, for example, the "title of the invention , ``problem to be solved by the invention'' and ``means for solving the problem'' (step S2541), and in the claim-based drawing information generated in the claim-based drawing information generation process (step S253) Based on the above, the contents of the "brief description of the drawings" are generated (step S2542), and for each item of the claim, the contents and the incomplete message for supporting the description of the corresponding effect are included in the "for carrying out the invention form" (step S2543), and based on the key word relationship information generated in step S186 and the claim base drawing information, the order of explanation of each key word is determined (step S2544) and determined In accordance with the order of explanation, each key phrase is the subject, a code is added to the key phrase whose code has been determined, and if necessary, an incomplete message for supporting description is added to the sentence "Form for Carrying Out the Invention" ” (step S2545), and control of the display mode such as highlighting etc. is added to the display elements of the important phrases, symbols and incomplete messages for description support in the claim-based specification information in the patent application related information as the display document , display control information is added for control to have a function as an operation corresponding GUI element (step S2546).

図52は、クレームベース要約書情報生成処理(ステップS255)の一例を示すフローチャートである。クレームベース要約書情報生成処理(ステップS255)として、クレーム情報生成部205aは、例えば、日本国の特許出願の要約書と同様の様式の「要約」配下の「課題」欄に設定情報の取得処理(ステップS11)で取得された設定情報の未完成メッセージ情報に基づく記載支援用未完成メッセージを記載し(ステップS2551)、「解決手段」欄に、ステップS14で取得された発明文書中のクレームの先頭の項の内容を含ませ、符号決定処理(ステップS252)で符号が決定されている重要語句には符号を付加し(ステップS2552)、「選択図」の欄に、「図1」を記載し(ステップS2553)、米国出願用の日本語版の要約書として、クレームの先頭の項の内容を記載し(ステップS2554)、日本語の国際出願の様式の要約書として、クレームの先頭の項の内容を含ませ、符号決定処理(ステップS252)で符号が決定されている重要語句には後続させた丸括弧内にその符号を付加し(ステップS2555)、表示用文書としての特許出願関連情報におけるクレームベース要約書情報中の各重要語句等の表示要素に強調表示等のための表示制御情報を付加する(ステップS2556)。 FIG. 52 is a flow chart showing an example of the claim-based abstract information generation process (step S255). As the claim-based abstract information generation process (step S255), the claim information generation unit 205a, for example, acquires setting information in the "problem" column under "summary" in the same format as the abstract of the Japanese patent application. Write an incomplete message for description support based on the incomplete message information of the setting information acquired in (step S11) (step S2551), and fill in the "solution means" column of the claim in the invention document acquired in step S14. Include the content of the first term, add a code to the important phrase whose code has been determined in the code determination process (step S252) (step S2552), and enter "Fig. 1" in the "selected drawing" column. (step S2553), describe the contents of the first paragraph of the claim as an abstract of the Japanese version for the US application (step S2554), and write the first paragraph of the claim as an abstract of the Japanese international application format , and the sign is added in parentheses following the important words and phrases whose signs have been determined in the sign determination process (step S252) (step S2555), and the patent application related information as a document for display Display control information for highlighting and the like is added to display elements such as key words and phrases in the claim-based abstract information (step S2556).

図53は、修正版クレーム情報生成処理(ステップS256)の一例を示すフローチャートである。修正版クレーム情報生成処理(ステップS256)として、クレーム情報生成部205aは、例えば、クレーム情報生成処理(ステップS251)で生成されたクレーム情報に基づき、警告情報生成処理(ステップS24)で生成される警告情報の指摘情報で指摘される不適切な記載の、修正情報等に基づく、修正等により、修正版クレーム情報を生成し(ステップS2561)、修正版クレーム情報のクレームの記載を、ステップS11で取得された設定情報で指定された形式(例えば数字を全角文字にする、重要語句に符号を付加する等といった指定)に適合させるように修正し(ステップS2562)、設定情報に基づいて、プログラムのカテゴリーに属する請求対象を記載した項等の、修正版クレーム情報のクレームへの追加を行い(ステップS2563)、特許出願され得る地域(例えば米国等)に対応したクレームの各項記載(例えばクレーム情報における複数項を引用する項を、単数項を引用する項に変更する等の処理後の各項記載)の、修正版クレーム情報への追加を行い(ステップS2564)、表示用文書としての特許出願関連情報における修正版クレーム情報中の重要語句等の表示要素に、その表示要素を強調表示するため、或いは、その表示要素を操作対応GUI要素とする等のために、表示制御情報を付加する(ステップS2565)。 FIG. 53 is a flow chart showing an example of the modified complaint information generation process (step S256). As the corrected complaint information generation process (step S256), the complaint information generation unit 205a generates the warning information generated in the warning information generation process (step S24) based on the complaint information generated in the complaint information generation process (step S251), for example. Based on the correction information, etc., of the inappropriate description pointed out by the warning information, corrected complaint information is generated (step S2561). The program is modified to conform to the format specified by the acquired setting information (for example, specification such as using double-byte characters for numbers, adding signs to key words, etc.) (step S2562), and based on the setting information, the program is executed. Modified claim information, such as a claim describing the claimed object belonging to the category, is added to the claim (step S2563), and each claim description (for example, claim information (Description of each item after processing, such as changing the item citing multiple items in the paragraph to the item citing the singular item) is added to the modified claim information (step S2564), and the patent application as a display document Display control information is added to display elements such as key phrases in the modified claim information in the related information in order to highlight the display elements, or to make the display elements into operation-responsive GUI elements ( step S2565).

なお、図47~図53の各例は、一例にすぎず、クレーム情報生成部205aは、図47~図53の各々に示す一部のステップを省略又は変更した処理を実行してもよいし、図47~図53の各々に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図47~図53の各々に示す複数のステップの実行順序を変更して実行してもよいし、図47~図53の各々に示す複数のステップの全部又は一部を並列に実行してもよい。 47 to 53 are merely examples, and the complaint information generating unit 205a may execute processing in which some of the steps shown in FIGS. 47 to 53 are omitted or changed. , several processing steps may be added to the steps shown in FIGS. 47 to 53, or the execution order of the steps shown in FIGS. Alternatively, all or part of the steps shown in FIGS. 47 to 53 may be executed in parallel.

クレームツリー等生成処理(ステップS26)では、クレームツリー生成部205cが、例えば、クレームツリー、修正版クレームツリー、構成クレームツリー、及び、修正版クレームツリーを生成する。 In the claim tree generation process (step S26), the claim tree generator 205c generates, for example, a claim tree, a modified claim tree, a constituent claim tree, and a modified claim tree.

図54は、クレームツリー等生成処理(ステップS26)の一例を示すフローチャートである。クレームツリー等生成処理(ステップS26)として、クレームツリー生成部205cは、例えば、クレーム引用関係情報を参照し、クレーム情報生成処理(ステップS251)で生成されたクレーム情報及び修正版クレーム情報生成処理(ステップS256)で生成された修正版クレーム情報の各々に基づいて、クレームツリー及び修正版クレームツリーを生成し(ステップS261)、クレーム情報及び包含関係情報に基づいて構成クレームツリーを生成し(ステップS262)、修正版クレーム情報及び包含関係情報に基づいて修正版構成クレームツリーを生成し(ステップS263)、表示用文書としての特許出願関連情報における、その生成した各種クレームツリー中の引用関係の表現用の記号及び重要語句の各々の表示要素に、その表示要素を強調表示するため、或いは、その表示要素を操作対応GUI要素とする等のために、表示制御情報を付加する(ステップS264)。なお、図54の例は、一例にすぎず、クレームツリー生成部205cは、クレームツリー等生成処理として、図54に示す一部のステップを省略又は変更した処理を実行してもよいし、図54に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図54に示す複数のステップの実行順序を変更して実行してもよいし、図54に示す複数のステップの全部又は一部を並列に実行してもよい。 FIG. 54 is a flow chart showing an example of the claim tree generation process (step S26). As the claim tree etc. generating process (step S26), the claim tree generating unit 205c, for example, refers to the claim citation relationship information, and generates the claim information generated in the claim information generating process (step S251) and the modified version claim information generating process ( Based on each of the modified claim information generated in step S256), a claim tree and a modified claim tree are generated (step S261), and a constituent claim tree is generated based on the claim information and inclusion relationship information (step S262). ), generate a modified configuration claim tree based on the modified claim information and inclusion relationship information (step S263), and use it to represent the citation relationships in the generated various claim trees in the patent application related information as a display document. Display control information is added to the display elements of each of the symbols and important phrases in order to highlight the display element or to make the display element an operation-responsive GUI element (step S264). Note that the example of FIG. 54 is merely an example, and the claim tree generation unit 205c may execute processing in which some of the steps shown in FIG. 54 may be executed by adding some processing steps to the plurality of steps shown in FIG. 54, the execution order of the plurality of steps shown in FIG. All or part of multiple steps may be performed in parallel.

明細書情報等生成処理(ステップS27)では、明細書情報生成部205bが、例えば、明細書情報、明細書見出しリスト、符号リスト、及び、修正版明細書情報を生成する。 In the description information generation process (step S27), the description information generation unit 205b generates, for example, description information, a description heading list, a code list, and modified version description information.

図55は、明細書情報等生成処理(ステップS27)の一例を示すフローチャートである。明細書情報等生成処理(ステップS27)として、明細書情報生成部205bは、例えば、ステップS14で取得された発明文書の明細書に基づいて明細書を表す明細書情報を生成する明細書情報生成処理を行い(ステップS271)、明細書情報の見出しを抽出して明細書見出しリストを生成する明細書見出しリスト生成処理を行い(ステップS272)、明細書情報に記載された重要語句に付加されている符号をソートして列挙した符号リストを生成する符号リスト生成処理を行い(ステップS273)、警告情報生成処理(ステップS24)で生成された警告情報中の指摘情報に対応して明細書情報の内容における不適切な記載を修正等することで修正版明細書情報を生成する修正版明細書情報生成処理を行う(ステップS274)。なお、図55の例は、一例にすぎず、明細書情報生成部205bは、明細書情報等生成処理として、図55に示す一部のステップを省略又は変更した処理を実行してもよいし、図55に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図55に示す複数のステップの実行順序を変更して実行してもよいし、図55に示す複数のステップの全部又は一部を並列に実行してもよい。 FIG. 55 is a flow chart showing an example of the statement information generation process (step S27). As the specification information generation process (step S27), the specification information generation unit 205b generates specification information representing the specification based on the specification of the invention document acquired in step S14, for example. processing (step S271), a description heading list generation process for extracting the description information headings and generating a description heading list is performed (step S272). A code list generation process is performed to generate a code list in which the codes are sorted and enumerated (step S273). Corrected specification information generation processing is performed to generate corrected specification information by correcting inappropriate descriptions in the content (step S274). Note that the example of FIG. 55 is merely an example, and the statement information generation unit 205b may execute processing in which some of the steps shown in FIG. 55 are omitted or changed as the statement information generation processing. 55 may be executed by adding some processing steps to the plurality of steps shown in FIG. 55, or the plurality of steps shown in FIG. All or part of the steps shown in can be executed in parallel.

各種翻訳情報の生成処理(ステップS28)では、翻訳部2054が、例えば、クレーム情報、修正版クレーム情報、明細書情報、及び、修正版明細書情報の各々に対応して、その情報の内容の少なくとも一部の翻訳結果を含む、クレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、及び、修正版明細書翻訳情報を生成する。 In the various translation information generation processing (step S28), the translation unit 2054, for example, corresponds to each of the claim information, the modified claim information, the specification information, and the modified specification information, and translates the contents of the information. Generate claim translation information, modified claim translation information, specification translation information, and modified specification translation information, including at least a partial translation result.

図56は、各種翻訳情報の生成処理(ステップS28)の一例を示すフローチャートである。各種翻訳情報の生成処理(ステップS28)として、翻訳部2054は、例えば、クレーム情報等(つまりクレーム情報、修正版クレーム情報、明細書情報、及び、修正版明細書情報)の項又は行と、その項又は行について、過去に発明文書分析システム20により生成された重要語句翻訳用学習モデルを利用して重要語句の機械翻訳を実行した部分翻訳行とを、交互に含むクレーム翻訳情報等(つまりクレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、及び、修正版明細書翻訳情報)を生成し(ステップS281)、クレーム翻訳情報等の部分翻訳行について、過去に発明文書分析システム20により生成された翻訳用学習モデルを利用した機械翻訳、或いは、他の機械翻訳プログラム等を利用した機械翻訳を実行した結果である完全翻訳行を生成し(ステップS282)、クレーム翻訳情報等の部分翻訳行を完全翻訳行に置換又は部分翻訳行に完全翻訳行を追加し(ステップS283)、表示用文書としての特許出願関連情報のクレーム翻訳情報等における各重要語句に対応する対応翻訳語の表示要素に、元の重要語句の表示要素と共通性を有する表示態様で表示するための表示制御情報を付加し(ステップS284)、そのクレーム翻訳情報等における各重要語句に対応する対応翻訳語の表示要素に、元の重要語句に係るGUIの機能を含みその重要語句に対する翻訳語候補集合を表示する操作対応GUI要素とするための表示制御情報を付加する(ステップS285)。なお、図56の例は、一例にすぎず、翻訳部2054は、各種翻訳情報の生成処理として、図56に示す一部のステップを省略又は変更した処理を実行してもよいし、図56に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図56に示す複数のステップの実行順序を変更して実行してもよいし、図56に示す複数のステップの全部又は一部を並列に実行してもよい。 FIG. 56 is a flowchart showing an example of processing for generating various translation information (step S28). As the various translation information generation processing (step S28), the translation unit 2054, for example, the claim information (that is, claim information, corrected version claim information, specification information, and corrected version specification information) section or line, For that paragraph or line, claim translation information etc. that alternately include partially translated lines in which important phrases have been machine-translated using a learning model for translation of important phrases generated by the invention document analysis system 20 in the past (that is, Claim translation information, modified claim translation information, specification translation information, and modified specification translation information) are generated (step S281). Machine translation using the generated learning model for translation or machine translation using another machine translation program or the like is performed to generate complete translation lines (step S282), and partial translation of claim translation information, etc. Replace the line with the fully translated line or add the fully translated line to the partially translated line (step S283), and display elements of the corresponding translated words corresponding to each important word in the claim translation information of the patent application related information as the display document , display control information for displaying in a display mode having commonality with the display elements of the original key words (step S284), and display elements of the corresponding translated words corresponding to the key words in the claim translation information, etc. is added display control information for operation-responsive GUI elements that include GUI functions related to the original key phrase and display a translation word candidate set for the key phrase (step S285). Note that the example in FIG. 56 is merely an example, and the translation unit 2054 may execute processing in which some of the steps shown in FIG. may be executed by adding some processing steps to the plurality of steps shown in FIG. 56, the execution order of the plurality of steps shown in FIG. may be performed in parallel.

重要語句リスト等生成処理(ステップS29)では、翻訳部2054が、例えば、重要語句リスト、図面符号リスト、及び、重要語句関係翻訳情報を生成する。 In the important word list generation process (step S29), the translation unit 2054 generates, for example, an important word list, a drawing code list, and important word related translation information.

図57は、重要語句リスト等生成処理(ステップS29)の一例を示すフローチャートである。重要語句リスト等生成処理(ステップS29)として、翻訳部2054は、例えば、ステップS14で取得された発明文書から重要語句抽出処理(ステップS17)で抽出された各重要語句について、その重要語句と、翻訳語候補集合、或いは、対応翻訳語とを、対応付けて構成される重要語句リストを生成する重要語句リスト生成処理を実行し(ステップS291)、表示用文書としての特許出願関連情報における重要語句リスト中の重要語句、対応翻訳語、及び、翻訳語候補集合の各々の表示要素について表示態様の制御等のための表示制御情報を付加し(ステップS292)、ステップS15で取得された図面文書の内容と発明文書から重要語句抽出処理(ステップS17)で抽出された各重要語句についてステップS19で特定された属性情報の「符号」の項目等に基づいて、図面符号リストを生成する図面符号リスト生成処理を実行し(ステップS293)、表示用文書としての特許出願関連情報における図面符号リスト中の図面番号、重要語句、対応翻訳語、翻訳語候補集合、及び、符号の各々の表示要素について表示態様の制御等のための表示制御情報を付加し(ステップS294)、ステップS186で生成された重要語句関係情報における重要語句を、その重要語句について対応する対応翻訳語又は翻訳語候補集合に置換した重要語句関係翻訳情報を生成する(ステップS295)。なお、図57の例は、一例にすぎず、翻訳部2054は、重要語句リスト等生成処理として、図57に示す一部のステップを省略又は変更した処理を実行してもよいし、図57に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図57に示す複数のステップの実行順序を変更して実行してもよいし、図57に示す複数のステップの全部又は一部を並列に実行してもよい。 FIG. 57 is a flowchart showing an example of the important phrase list generation processing (step S29). In the important phrase list generation process (step S29), the translation unit 2054, for example, extracts each important phrase from the invention document acquired in step S14 in the important phrase extraction process (step S17), An important phrase list generation process is executed to generate an important phrase list configured by associating the translation word candidate set or the corresponding translation word (step S291), and the important phrases in the patent application related information as the document for display are generated. Display control information for controlling the display mode etc. is added to each display element of the important words in the list, the corresponding translation words, and the translation word candidate set (step S292), and the drawing document acquired in step S15 is added. Drawing code list generation for generating a drawing code list based on the "code" item of the attribute information specified in step S19 for each key word extracted from the content and the invention document in the key word extraction process (step S17) Processing is executed (step S293), and the display mode of each display element of the drawing number, key words, corresponding translation words, translation word candidate set, and code in the drawing code list in the patent application related information as the document for display is added (step S294), and the important phrases in the important phrase relation information generated in step S186 are replaced with corresponding translation words or translation word candidate sets corresponding to the important phrases. Word-related translation information is generated (step S295). Note that the example in FIG. 57 is merely an example, and the translation unit 2054 may execute processing in which some of the steps shown in FIG. 57 may be executed by adding some processing steps to the plurality of steps shown in FIG. 57, the execution order of the plurality of steps shown in FIG. may be performed in parallel.

特許出願関連情報の生成処理(ステップS30)では、特許出願関連情報出力部2082が、例えば、ステップS14で取得され分析部205の分析対象となった発明文書の各行へ行番号を追加した情報と、要素間関係判別処理(ステップS18)で生成された重要語句関係情報と、技術分野の特定処理(ステップS22)で特定された技術分野を示す技術分野情報と、警告情報生成処理(ステップS24)で生成された警告情報と、クレーム情報等生成処理(ステップS25)で生成されたクレーム情報、クレームベース図面情報、クレームベース明細書情報、クレームベース要約書情報、及び、修正版クレーム情報と、クレームツリー等生成処理(ステップS26)で生成されたクレームツリー、修正版クレームツリー、構成クレームツリー、及び、修正版構成クレームツリーと、明細書情報等生成処理(ステップS27)で生成された明細書情報、明細書見出しリスト、符号リスト、及び、修正版明細書情報と、各種翻訳情報の生成処理(ステップS28)で生成されたクレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、及び、修正版明細書翻訳情報と、重要語句リスト等生成処理(ステップS29)で生成された重要語句リスト、図面符号リスト、及び、重要語句関係翻訳情報と、発明文書等に基づいて分析部205により生成された料金情報、及び、集計情報とを、含ませることで特許出願関連情報(図15参照)を生成する。 In the process of generating patent application related information (step S30), the patent application related information output unit 2082 outputs, for example, information obtained by adding a line number to each line of the invention document acquired in step S14 and analyzed by the analysis unit 205. , important phrase relationship information generated in the inter-element relationship determination process (step S18), technical field information indicating the technical field identified in the technical field identification process (step S22), and warning information generation process (step S24) The warning information generated in , the claim information generated in the claim information generation process (step S25), the claim-based drawing information, the claim-based specification information, the claim-based abstract information, and the modified version claim information, and the claim The claim tree, modified claim tree, configuration claim tree, and modified configuration claim tree generated in the tree generation process (step S26), and the specification information generated in the specification information generation process (step S27) , specification heading list, code list, and modified specification information, claim translation information generated in the process of generating various types of translation information (step S28), modified claim translation information, specification translation information, and correction Version specification translation information, key phrase list generated in the key phrase list generation processing (step S29), drawing code list, key phrase related translation information, and invention document etc. are generated by the analysis unit 205. Patent application related information (see FIG. 15) is generated by including the charged fee information and totalized information.

表示用文書の生成処理(ステップS31)では、分析部205により生成された、表示用文書としての特許出願関連情報の一部となった各情報を統合して、表示用文書(例えばHTML文書)を生成する。 In the process of generating a document for display (step S31), each piece of information that is part of the patent application-related information as a document for display generated by the analysis unit 205 is integrated to form a document for display (for example, an HTML document). to generate

特許出願関連情報の出力処理(ステップS32)では、例えば、表示部2084が、表示用文書の生成処理(ステップS31)で生成された表示用文書としての特許出願関連情報を表示することで、特許出願関連情報を出力し、或いは、特許出願関連情報出力部2082が、表示用文書の生成処理(ステップS31)で生成された特許出願関連情報に係る表示用文書を1つ又は複数のファイルとして出力し、或いは、特許出願関連情報出力部2082が、特許出願関連情報の生成処理(ステップS30)で生成された特許出願関連情報を、テキストファイルその他のファイルとして出力する。 In the patent application related information output process (step S32), for example, the display unit 2084 displays the patent application related information as the display document generated in the display document generation process (step S31). Output the application-related information, or the patent application-related information output unit 2082 outputs the display document related to the patent application-related information generated in the display document generation process (step S31) as one or more files. Alternatively, the patent application related information output unit 2082 outputs the patent application related information generated in the patent application related information generating process (step S30) as a text file or other file.

[3-3.実施形態2に係る重要語句翻訳用学習モデル生成処理例]
発明文書分析システム20は、発明文書における重要語句についての機械翻訳のための重要語句翻訳用学習モデルを生成する重要語句翻訳用学習モデル生成処理を実行し得る。以下、重要語句翻訳用学習モデル生成処理の一例について説明する。
[3-3. Important phrase translation learning model generation processing example according to the second embodiment]
The invention document analysis system 20 can execute an important phrase translation learning model generation process for generating an important phrase translation learning model for machine translation of important phrases in invention documents. An example of the important phrase translation learning model generation process will be described below.

図58は、重要語句翻訳用学習モデル生成処理の一例を示すフローチャートである。 FIG. 58 is a flow chart showing an example of important phrase translation learning model generation processing.

発明文書分析システム20は、重要語句翻訳用学習モデル生成処理として、例えば、図58に示すように、設定情報の取得処理(ステップS11)と、重要語句設定辞書の取得(ステップS12)と、翻訳用発明文書標準規定の取得(ステップS13)と、発明文書の取得(ステップS14)と、図面文書の取得(ステップS15)と、クレームに係る引用関係分析処理(ステップS16)と、重要語句抽出処理(ステップS17)と、要素間関係判別処理(ステップS18)と、各重要語句の属性情報の特定(ステップS19)と、各重要語句の重要度の決定処理(ステップS20)と、翻訳語候補集合の特定処理(ステップS21)と、技術分野の特定処理(ステップS22)と、重要語句の表示色の決定処理(ステップS23)と、警告情報生成処理(ステップS24)と、警告情報生成処理(ステップS24)で生成される警告情報における発明文書評価情報に基づく評価値に係る評価(ステップS51)とを実行し、例えば、ステップS51での評価において不適正な場合(つまり評価値が閾値を超えない場合)にはステップS14に戻って別の発明文書の取得を行う。ステップS51での評価において適正な場合(つまり評価値が閾値を超える場合)には、発明文書分析システム20は、特許出願関連情報の生成処理(ステップS52)と、表示用文書の生成処理(ステップS53)と、発明文書のグループ分類(ステップS54)と、特許出願関連情報の表示(ステップS55)と、翻訳語候補集合要素の選択受付け(ステップS56)と、重要語句と選択結果とを教師データとして蓄積(ステップS57)と、重要語句翻訳用学習モデルの生成(ステップS58)と、重要語句翻訳用学習モデルの出力(ステップS59)とを実行する。なお、図58の例は、一例にすぎず、発明文書分析システム20は、重要語句翻訳用学習モデル生成処理として、図58に示す一部のステップを省略又は変更した処理を実行してもよいし、図58に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図58に示す複数のステップの実行順序を変更して実行してもよいし、図58に示す複数のステップの全部又は一部を並列に実行してもよい。発明文書分析システム20は、例えば、図58におけるステップS56及びステップS57での処理を、ユーザの操作に応じて、複数回繰り返し得る。また、発明文書分析システム20は、図58におけるステップS14~S57での処理をある程度の回数又は期間、繰り返し実行した後に、ステップS58及びステップS59での処理を、実行することとしてもよい。 For example, as shown in FIG. 58, the invention document analysis system 20 acquires setting information (step S11), acquires an important word/phrase setting dictionary (step S12), translates Acquisition of invention document standard specifications (step S13), acquisition of invention documents (step S14), acquisition of drawing documents (step S15), citation relationship analysis processing related to claims (step S16), and important phrase extraction processing (step S17), inter-element relationship determination processing (step S18), identification of attribute information of each key phrase (step S19), importance determination processing of each key phrase (step S20), translation word candidate set identification processing (step S21), technical field identification processing (step S22), important phrase display color determination processing (step S23), warning information generation processing (step S24), and warning information generation processing (step Evaluation (step S51) of the evaluation value based on the invention document evaluation information in the warning information generated in step S24) is performed. case), the process returns to step S14 to acquire another invention document. If the evaluation in step S51 is correct (that is, if the evaluation value exceeds the threshold), the invention document analysis system 20 performs patent application related information generation processing (step S52) and display document generation processing (step S53), classification of invention documents into groups (step S54), display of patent application-related information (step S55), acceptance of selection of translation word candidate set elements (step S56), key phrases and selection results as training data. (step S57), generation of a learning model for translation of important phrases (step S58), and output of a learning model for translation of important phrases (step S59). Note that the example of FIG. 58 is merely an example, and the invention document analysis system 20 may execute a process in which some of the steps shown in FIG. 58 are omitted or changed as the important phrase translation learning model generation process. However, some processing steps may be added to the plurality of steps shown in FIG. 58 and executed, or the execution order of the plurality of steps shown in FIG. All or some of the steps shown at 58 may be performed in parallel. The invention document analysis system 20 can, for example, repeat the processing in steps S56 and S57 in FIG. 58 multiple times according to the user's operation. Also, the invention document analysis system 20 may execute the processes in steps S58 and S59 after repeatedly executing the processes in steps S14 to S57 in FIG. 58 for a certain number of times or for a period of time.

図58の例におけるステップS11~ステップS24での処理は、図40の例に即して上述した発明文書分析処理におけるステップS11~ステップS24での処理と同様である。 The processing in steps S11 to S24 in the example of FIG. 58 is the same as the processing in steps S11 to S24 in the invention document analysis processing described above in accordance with the example of FIG.

ステップS51での、警告情報生成処理(ステップS24)で生成される警告情報における発明文書評価情報に基づく評価値に係る評価では、機械学習部207の文書評価部2071が、ステップS14で取得された発明文書について、発明文書評価情報が含む評価値が閾値を超えるか否かに基づいて、その発明文書が重要語句翻訳用学習モデルの生成に利用できる程度に適正か否かを評価する。 In the evaluation of the evaluation value based on the invention document evaluation information in the warning information generated in the warning information generation process (step S24) in step S51, the document evaluation unit 2071 of the machine learning unit 207 obtained in step S14 Based on whether or not the evaluation value included in the invention document evaluation information exceeds a threshold value, whether the invention document is appropriate enough to be used for generating a learning model for translation of important phrases is evaluated.

図58の例における特許出願関連情報の生成(ステップS52)は、図40の例に即して上述した発明文書分析処理におけるステップS25~ステップS29での処理を経て実行されるステップS30での処理と同様である。 The generation of patent application related information (step S52) in the example of FIG. 58 is the process in step S30 executed after the processes in steps S25 to S29 in the invention document analysis process described above in accordance with the example in FIG. is similar to

図58の例における表示用文書の生成処理(ステップS53)は、図40の例に即して上述した発明文書分析処理におけるステップS31での処理と同様である。 The display document generation process (step S53) in the example of FIG. 58 is the same as the process in step S31 in the invention document analysis process described above with reference to the example of FIG.

発明文書のグループ分類(ステップS54)では、分類部2053が、ステップS14で現在取得している発明文書について重要語句抽出処理(ステップS17)で抽出された重要語句群と、複数の発明文書各々から抽出された重要語句群との間の相関性等に基づいてグループ分類を行い、ステップS14で現在取得している発明文書が属するグループを特定し、或いは、ユーザ(例えば翻訳者)等によるグループの指定に応じてその発明文書が属するグループを特定する。なお、ステップS54でのグループ分類により発明文書について特定されるグループは、例えば、技術分野であってもよい。 In the group classification of invention documents (step S54), the classification unit 2053 extracts the important phrase group extracted in the important phrase extraction process (step S17) for the invention documents currently acquired in step S14, and Group classification is performed based on the correlation between the extracted key words and phrases, etc., and in step S14, the group to which the currently acquired invention document belongs is specified, or the group is classified by the user (for example, a translator). Identify the group to which the invention document belongs according to the specification. The group specified for the invention document by the group classification in step S54 may be, for example, the technical field.

特許出願関連情報の表示(ステップS55)では、ブラウザ機能を有する表示部2084が、表示用文書(例えばHTML文書)としての特許出願関連情報について、表示用文書を解釈して、表示装置に、特許出願関連情報を表示する(図17参照)。 In displaying the patent application related information (step S55), the display unit 2084 having a browser function interprets the display document (for example, HTML document) for the patent application related information as a display document, and displays the patent application related information on the display device. Display application-related information (see FIG. 17).

翻訳語候補集合要素の選択受付け(ステップS56)では、操作受付部20841が、ステップS55で表示された特許出願関連情報において重要語句と対応付けられた翻訳語候補集合の1つの要素についてのユーザ(例えば翻訳者)による選択の操作を受け付ける。例えば、各重要語句について翻訳語候補集合からの要素の選択の操作が受け付けられる毎に、ステップS57での処理が実行され得る。 In accepting the selection of a translation word candidate set element (step S56), the operation accepting unit 20841 asks the user ( For example, a translator) accepts a selection operation. For example, the processing in step S57 may be executed each time an operation for selecting an element from the translation word candidate set is accepted for each important phrase.

重要語句と選択結果とを教師データとして蓄積(ステップS57)では、機械学習部207の教師データ蓄積部2072が、重要語句と、その重要語句に対応する翻訳語候補集合からのステップS56で受け付けられた操作により選択された要素(つまりその重要語句に対応する対応翻訳語)との組を、重要語句翻訳用学習モデル生成のための機械学習用の教師データとして、記録媒体等に、蓄積する。なお、教師データ蓄積部2072は、ステップS54で特定された発明文書が属するグループと対応付けて教師データを蓄積してもよい。また、教師データ蓄積部2072は、例えば、ステップS12で取得された重要語句設定辞書における、対応翻訳語が付記された重要語句とその対応翻訳語との組を、重要語句翻訳用学習モデルの生成のための機械学習用の教師データとして、記録媒体等に蓄積してもよい。 In accumulating the key words and the selection result as training data (step S57), the training data storage unit 2072 of the machine learning unit 207 receives the key words and the translation word candidate set corresponding to the key words received in step S56. A set of elements selected by the above operation (that is, a corresponding translated word corresponding to the key phrase) is stored in a recording medium or the like as teacher data for machine learning for generating a learning model for key phrase translation. Note that the teacher data storage unit 2072 may store teacher data in association with the group to which the invention document identified in step S54 belongs. In addition, the training data storage unit 2072 generates a learning model for translation of important phrases by, for example, combining key phrases to which the corresponding translated words are added and the corresponding translated words in the important phrase setting dictionary acquired in step S12. may be accumulated in a recording medium or the like as teacher data for machine learning for

重要語句翻訳用学習モデルの生成(ステップS58)では、機械学習部207が、教師データ蓄積部2072により記録媒体等に蓄積された、重要語句翻訳用学習モデルの生成のための機械学習用の複数の教師データを用いた機械学習により、重要語句の機械翻訳のための重要語句翻訳用学習モデルを生成する。教師データ蓄積部2072により、重要語句翻訳用学習モデルの生成のための機械学習用の複数の教師データがグループと対応付けて記録媒体等に蓄積されている場合においては、機械学習部207は、教師データ蓄積部2072に蓄積された、グループ毎の重要語句翻訳用学習モデルの生成のための機械学習用の複数の教師データを用いた機械学習により、グループ毎に、重要語句の機械翻訳のための重要語句翻訳用学習モデルを生成する。例えば、グループが発明者の所属部門別に分類されているような場合において、重要語句「受信部」と対応翻訳語「receiving unit」との組、重要語句「制御部」と対応翻訳語「controlling unit」との組、重要語句「送信部」と対応翻訳語「transmitting unit」との組等を教師データとして機械学習により生成された重要語句翻訳用学習モデルには、そのグループである部門の翻訳方針等が反映されている可能性があり、その重要語句翻訳用学習モデルを用いた演算処理により重要語句「処理部」を入力として機械翻訳すると、例えば「processing unit」という機械翻訳結果が生成されることが予測され得る。また、別の翻訳方針等を有する別部門に係るグループに対応して、重要語句「受信部」と対応翻訳語「receiving circuit」との組、重要語句「制御部」と対応翻訳語「controlling circuit」との組、重要語句「送信部」と対応翻訳語「transmitting circuit」との組等を教師データとして機械学習により生成された重要語句翻訳用学習モデルにはそのグループの翻訳方針等が反映されている可能性があり、その重要語句翻訳用学習モデルを用いた演算処理により重要語句「処理部」を入力として機械翻訳すると、例えば「processing circuit」という機械翻訳結果が生成されることが予測され得る。また、更に別の翻訳方針等を有する別部門に係るグループに対応して、重要語句「受信部」と対応翻訳語「receiver」との組、重要語句「制御部」と対応翻訳語「controller」との組、重要語句「送信部」と対応翻訳語「transmitter」との組等を教師データとして機械学習により生成された重要語句翻訳用学習モデルにはそのグループの翻訳方針等が反映されている可能性があり、その重要語句翻訳用学習モデルを用いた演算処理により重要語句「処理部」を入力として機械翻訳すると、例えば「processor」という機械翻訳結果が生成されることが予測され得る。機械学習部207は、その生成した重要語句翻訳用学習モデルを、学習モデル管理部2073により、記録媒体等に保持して管理する。生成された重要語句翻訳用学習モデルは、発明文書分析システム20が発明文書分析処理(図40参照)において、翻訳語候補集合の特定処理(ステップS21)を実行する際に重要語句についての翻訳語候補集合の要素を決めるために、或いは、各種翻訳情報の生成処理(ステップS28)を実行する際等に重要語句を機械翻訳するために、利用され得る。 In the key word translation learning model generation (step S58), the machine learning unit 207 generates a plurality of machine learning models for generating key word translation learning models, which are stored in a recording medium or the like by the teacher data storage unit 2072. We generate a learning model for machine translation of important phrases by machine learning using the training data. When a plurality of pieces of teacher data for machine learning for generating a learning model for translation of key phrases are associated with groups and stored in a recording medium or the like by the teacher data storage unit 2072, the machine learning unit 207 By machine learning using a plurality of teacher data for machine learning for generating a learning model for important phrase translation for each group, accumulated in the teacher data accumulation unit 2072, for each group, important phrases for machine translation Generate a learning model for key phrase translation of For example, if the groups are classified according to the department to which the inventor belongs, the set of the important phrase "receiving unit" and the corresponding translated word "receiving unit", the important phrase "controlling unit" and the corresponding translated word "controlling unit" ”, and pairs of the key phrase “transmitting unit” and the corresponding translated word “transmitting unit” as training data. etc. may be reflected, and if machine translation is performed with the key phrase "processing unit" as input by arithmetic processing using the key phrase translation learning model, a machine translation result such as "processing unit" will be generated. can be expected. In addition, for groups related to different departments with different translation policies, etc., a set of the important phrase "receiving part" and the corresponding translated word "receiving circuit", and the important phrase "control part" and the corresponding translated word "controlling circuit" ”, and pairs of the key phrase “transmitting part” and the corresponding translated word “transmitting circuit” as training data. It is predicted that, for example, machine translation results such as "processing circuit" will be generated when the key phrase "processing part" is input and machine-translated by arithmetic processing using the key phrase translation learning model. obtain. In addition, corresponding to a group related to another department having a different translation policy, etc., a set of the important phrase "receiving part" and the corresponding translated word "receiver", the important phrase "controller" and the corresponding translated word "controller" The group's translation policy is reflected in the learning model for important phrase translation generated by machine learning using training data such as pairs of important phrases "transmitting part" and the corresponding translation word "transmitter". There is a possibility, and it can be predicted that, for example, a machine translation result of "processor" will be generated by machine-translating the key phrase "processing unit" as an input by arithmetic processing using the key phrase translation learning model. The machine learning unit 207 stores and manages the generated learning model for translation of key phrases in a recording medium or the like by the learning model management unit 2073 . The generated key word translation learning model is used for the key word translation when the invention document analysis system 20 executes the translation word candidate set identification process (step S21) in the invention document analysis process (see FIG. 40). It can be used to determine the elements of the candidate set, or to machine-translate key words when executing various translation information generating processes (step S28).

重要語句翻訳用学習モデルの出力(ステップS59)では、学習モデル出力部2081が、学習モデル管理部2073により保持されている重要語句翻訳用学習モデルを、例えばユーザの指定に応じたファイルの内容として出力する。出力された重要語句翻訳用学習モデルは、別の発明文書分析システム20が発明文書分析処理(図40参照)において、各種翻訳情報の生成処理(ステップS28)を実行する際等に、重要語句を機械翻訳するために、利用され得るし、発明文書における重要語句を一旦機械翻訳した後にその結果を利用して発明文書全体を機械翻訳するような発明文書の翻訳用の機械翻訳システム若しくは機械翻訳用のプログラム、又は、一般的な機械翻訳システム等において利用され得る。 In the output of the important phrase translation learning model (step S59), the learning model output unit 2081 outputs the important phrase translation learning model held by the learning model management unit 2073, for example, as the contents of a file specified by the user. Output. The output learning model for translation of important phrases is used when another invention document analysis system 20 executes various translation information generation processing (step S28) in the invention document analysis processing (see FIG. 40). A machine translation system for translating invention documents or for machine translation that can be used for machine translation, and once machine-translates important words in the invention document and then machine-translates the entire invention document using the result program, or a general machine translation system or the like.

[3-4.実施形態2に係る翻訳用学習モデル生成処理例]
発明文書分析システム20は、発明文書の機械翻訳のための翻訳用学習モデルを生成する翻訳用学習モデル生成処理を実行し得る。以下、翻訳用学習モデル生成処理の一例について説明する。
[3-4. Example of translation learning model generation processing according to the second embodiment]
The invention document analysis system 20 can execute a translation learning model generation process for generating a translation learning model for machine translation of an invention document. An example of the learning model generation process for translation will be described below.

図59は、翻訳用学習モデル生成処理の一例を示すフローチャートである。 FIG. 59 is a flow chart showing an example of a learning model generation process for translation.

発明文書分析システム20は、翻訳用学習モデル生成処理として、例えば、図59に示すように、設定情報の取得処理(ステップS11)と、重要語句設定辞書の取得(ステップS12)と、翻訳用発明文書標準規定の取得(ステップS13)と、発明文書の取得(ステップS14)と、図面文書の取得(ステップS15)と、クレームに係る引用関係分析処理(ステップS16)と、重要語句抽出処理(ステップS17)と、要素間関係判別処理(ステップS18)と、各重要語句の属性情報の特定(ステップS19)と、各重要語句の重要度の決定処理(ステップS20)と、警告情報生成処理(ステップS24)と、警告情報生成処理(ステップS24)で生成される警告情報における発明文書評価情報に基づく評価値に係る評価(ステップS51)とを実行し、例えば、ステップS51での評価において不適正な場合(つまり評価値が閾値を超えない場合)にはステップS14に戻って別の発明文書の取得を行う。ステップS51での評価において適正な場合(つまり評価値が閾値を超える場合)には、発明文書分析システム20は、修正版発明文書の生成(ステップS61)と、翻訳結果文書の取得(ステップS62)と、発明文書のグループ分類(ステップS63)と、修正版発明文書と翻訳結果文書とを教師データとして蓄積(ステップS64)と、翻訳用学習モデルの生成(ステップS65)と、翻訳用学習モデルの出力(ステップS66)とを実行する。なお、図59の例は、一例にすぎず、発明文書分析システム20は、翻訳用学習モデル生成処理として、図59に示す一部のステップを省略又は変更した処理を実行してもよいし、図59に示す複数のステップに更に幾つかの処理のステップを追加して実行してもよいし、図59に示す複数のステップの実行順序を変更して実行してもよいし、図59に示す複数のステップの全部又は一部を並列に実行してもよい。発明文書分析システム20は、例えば、図59におけるステップS14~ステップS64での処理をある程度の回数又は期間、繰り返し実行した後に、ステップS65及びステップS66での処理を、実行することとしてもよい。 For example, as shown in FIG. 59, the invention document analysis system 20 performs, as a translation learning model generation process, a setting information acquisition process (step S11), an important phrase setting dictionary acquisition process (step S12), an invention translation Acquisition of document standard provisions (step S13), acquisition of invention documents (step S14), acquisition of drawing documents (step S15), citation relationship analysis processing related to claims (step S16), and important phrase extraction processing (step S17), inter-element relationship determination processing (step S18), identification of attribute information of each key phrase (step S19), importance determination processing of each key phrase (step S20), and warning information generation processing (step S24) and an evaluation (step S51) related to the evaluation value based on the invention document evaluation information in the warning information generated in the warning information generation process (step S24). If so (that is, if the evaluation value does not exceed the threshold), the process returns to step S14 to acquire another invention document. If the evaluation in step S51 is correct (that is, if the evaluation value exceeds the threshold), the invention document analysis system 20 generates a modified version of the invention document (step S61) and acquires the translation result document (step S62). Then, group classification of invention documents (step S63), accumulation of revised invention documents and translation result documents as training data (step S64), generation of a learning model for translation (step S65), and creation of a learning model for translation output (step S66). Note that the example of FIG. 59 is merely an example, and the invention document analysis system 20 may execute a process in which some of the steps shown in FIG. 59 are omitted or changed as the translation learning model generation process, Some processing steps may be added to the plurality of steps shown in FIG. 59 and executed, or the execution order of the plurality of steps shown in FIG. All or some of the steps shown may be performed in parallel. For example, the invention document analysis system 20 may execute the processes in steps S65 and S66 after repeatedly executing the processes in steps S14 to S64 in FIG. 59 for a certain number of times or for a period of time.

図59の例におけるステップS11~ステップS20及びステップS24は、図40の例に即して上述した発明文書分析処理におけるステップS11~ステップS20及びステップS24と同様である。図59の例におけるステップS63での処理は、図58の例におけるステップS54での処理と同様である。 Steps S11 to S20 and S24 in the example of FIG. 59 are the same as steps S11 to S20 and S24 in the invention document analysis process described above with reference to the example of FIG. The processing in step S63 in the example of FIG. 59 is the same as the processing in step S54 in the example of FIG.

ステップS51での、警告情報生成処理(ステップS24)で生成される警告情報における発明文書評価情報に基づく評価値に係る評価では、機械学習部207の文書評価部2071が、ステップS14で取得された発明文書について、発明文書評価情報が含む評価値が閾値を超えるか否かに基づいて、その発明文書が重要語句翻訳用学習モデルの生成に利用できる程度に適正か否かを評価する。 In the evaluation of the evaluation value based on the invention document evaluation information in the warning information generated in the warning information generation process (step S24) in step S51, the document evaluation unit 2071 of the machine learning unit 207 obtained in step S14 Based on whether or not the evaluation value included in the invention document evaluation information exceeds a threshold value, whether the invention document is appropriate enough to be used for generating a learning model for translation of important phrases is evaluated.

修正版発明文書の生成(ステップS61)では、機械学習部207が、クレーム情報生成部205aが生成した修正版クレーム情報と、明細書情報生成部205bが生成した修正版明細書情報とを統合することで修正版発明文書を生成する。修正版発明文書は、ステップS51で発明文書評価情報が含む評価値が閾値を超えた発明文書に基づいて生成されることになるが、予め定められた閾値次第では、その発明文書より、修正版発明文書の内容の方が、翻訳結果文書との整合性が高い可能性があるので、修正版発明文書を生成する。 In generating the modified invention document (step S61), the machine learning unit 207 integrates the modified claim information generated by the claim information generating unit 205a and the modified specification information generated by the specification information generating unit 205b. to generate a modified invention document. The modified invention document is generated based on the invention document for which the evaluation value included in the invention document evaluation information exceeds the threshold in step S51. Since there is a possibility that the content of the invention document is more consistent with the translation result document, a modified version of the invention document is generated.

翻訳結果文書の取得(ステップS62)では、翻訳結果文書取得部2023が、ユーザ(例えば翻訳者)から指定を受ける等により、ステップS14で現在取得されている発明文書に対応した翻訳結果である翻訳結果文書を取得する。 In obtaining the translation result document (step S62), the translation result document obtaining unit 2023 obtains the translation result corresponding to the invention document currently obtained in step S14 by receiving a designation from the user (for example, a translator). Get the result document.

修正版発明文書と翻訳結果文書とを教師データとして蓄積(ステップS64)では、機械学習部207の教師データ蓄積部2072が、ステップS61で生成された修正版発明文書と、ステップS62で取得された翻訳結果文書との組を、翻訳用学習モデル生成のための機械学習用の教師データとして、記録媒体等に、蓄積する。教師データ蓄積部2072は、ステップS63で特定された発明文書が属するグループと対応付けて教師データを蓄積してもよい。教師データ蓄積部2072は、ステップS61で生成された修正版発明文書が、クレーム情報生成部205aが生成した修正版クレーム情報における複数のクレームセットを有する場合には、修正版発明文書における複数のクレームセットのうち、翻訳結果文書との整合性の高い1つのクレームセット以外の全てのクレームセットを修正版発明文書から除去した上で、修正版発明文書と翻訳結果文書との組を翻訳用学習モデル生成のための機械学習用の教師データとして、記録媒体等に、蓄積する。修正版発明文書における複数のクレームセットのうち、翻訳結果文書との整合性の高い1つのクレームセットを特定する具体的方法の一例としては、翻訳結果文書のクレームの記載との間で、クレームの項数の同一性と、クレームの各項の記載中の各引用項の項番の同一性と、クレームの各項において丸括弧内に符号が含まれる記載が含まれるか否かについての同一性とが、例えばその同一性の各項目の全てが同一である等のように、総合的に最も高い、修正版発明文書におけるクレームセットを、整合性の高いクレームセットとして特定する例が、挙げられる。なお、教師データ蓄積部2072は、修正版発明文書における符号の記載を除去したものと翻訳結果文書における符号の記載を除去したものとの組を翻訳用学習モデル生成のための機械学習用の教師データとして、記録媒体等に、蓄積することとしてもよい。また、教師データ蓄積部2072は、修正版発明文書における文毎に、その文と、その文に対応する翻訳結果文書における文との組を翻訳用学習モデル生成のための機械学習用の教師データとして、記録媒体等に、蓄積することとしてもよい。 In accumulating the modified invention document and the translation result document as training data (step S64), the training data storage unit 2072 of the machine learning unit 207 stores the modified invention document generated in step S61 and the modified invention document obtained in step S62. A combination with the translation result document is stored in a recording medium or the like as teacher data for machine learning for generating a learning model for translation. The training data accumulation unit 2072 may accumulate training data in association with the group to which the invention document identified in step S63 belongs. If the modified invention document generated in step S61 has a plurality of claim sets in the modified claim information generated by the claim information generating unit 205a, the teacher data storage unit 2072 stores the plurality of claims in the modified invention document. After removing all claim sets other than one claim set that is highly consistent with the translation result document from the modified version of the invention document, the combination of the modified version of the invention document and the translation result document is used as a learning model for translation. It is stored in a recording medium or the like as teacher data for machine learning for generation. As an example of a specific method for identifying one claim set that is highly consistent with the translation result document from among the multiple claim sets in the modified version of the invention document, the claim set between the claims in the translation result document and the The sameness of the number of items, the sameness of the item number of each cited item in the description of each item of the claim, and the sameness of whether or not each item of the claim includes a description containing a reference sign in parentheses. Identifies the claim set in the modified invention document that has the highest overall, e.g., all of the items of identity are identical, as the highly consistent claim set. . Note that the training data accumulation unit 2072 stores a set of the revised invention document from which the code description has been removed and the translation result document from which the code description has been removed as a machine learning teacher for generating a learning model for translation. It may be stored as data in a recording medium or the like. Further, the training data accumulation unit 2072 stores, for each sentence in the modified invention document, a set of the sentence and the corresponding sentence in the translation result document as training data for machine learning for generating a learning model for translation. As such, it may be stored in a recording medium or the like.

翻訳用学習モデルの生成(ステップS65)では、機械学習部207が、教師データ蓄積部2072により記録媒体等に蓄積された、翻訳用学習モデルの生成のための機械学習用の複数の教師データを用いた機械学習により、発明文書の機械翻訳のための翻訳用学習モデルを生成する。教師データ蓄積部2072により、翻訳用学習モデルの生成のための機械学習用の複数の教師データがグループと対応付けて記録媒体等に蓄積されている場合においては、機械学習部207は、教師データ蓄積部2072に蓄積された、グループ毎の翻訳用学習モデルの生成のための機械学習用の複数の教師データを用いた機械学習により、グループ毎に、発明文書の機械翻訳のための翻訳用学習モデルを生成する。機械学習部207は、その生成した翻訳用学習モデルを、学習モデル管理部2073により、記録媒体等に保持して管理する。生成された翻訳用学習モデルは、発明文書分析システム20が発明文書分析処理(図40参照)において、各種翻訳情報の生成処理(ステップS28)を実行する際等に、発明文書に係るクレーム情報、明細書情報等を機械翻訳するために、利用され得る。 In generating a learning model for translation (step S65), the machine learning unit 207 stores a plurality of teacher data for machine learning for generating a learning model for translation, which are stored in a recording medium or the like by the teacher data storage unit 2072. The machine learning used generates a translation learning model for machine translation of invention documents. When a plurality of teacher data for machine learning for generating a learning model for translation are stored in a recording medium or the like in association with a group by the teacher data storage unit 2072, the machine learning unit 207 stores the teacher data By machine learning using a plurality of teacher data for machine learning for generating a learning model for translation for each group accumulated in the accumulation unit 2072, learning for translation for machine translation of invention documents for each group Generate a model. The machine learning unit 207 stores and manages the generated learning model for translation in a recording medium or the like by the learning model management unit 2073 . The generated learning model for translation is used when the invention document analysis system 20 executes the various translation information generation process (step S28) in the invention document analysis process (see FIG. 40). It can be used to machine-translate specification information and the like.

翻訳用学習モデルの出力(ステップS66)では、学習モデル出力部2081が、学習モデル管理部2073により保持されている翻訳用学習モデルを、例えばユーザの指定に応じたファイルの内容として出力する。出力された翻訳用学習モデルは、別の発明文書分析システム20が発明文書分析処理(図40参照)において、各種翻訳情報の生成処理(ステップS28)を実行する際等に、発明文書に係るクレーム情報、明細書情報等を機械翻訳するために、利用され得るし、発明文書の翻訳用の機械翻訳システム若しくは機械翻訳用のプログラム、又は、一般的な機械翻訳システム等において利用され得る。 In outputting the learning model for translation (step S66), the learning model output unit 2081 outputs the learning model for translation held by the learning model management unit 2073, for example, as the contents of a file specified by the user. The output learning model for translation is used when another invention document analysis system 20 executes various translation information generation processing (step S28) in the invention document analysis processing (see FIG. 40). It can be used to machine-translate information, specification information, etc., and can be used in a machine translation system or a machine translation program for translating invention documents, or in a general machine translation system.

[3-5.実施形態2に係る発明文書分析システムの効果]
発明文書分析システム20は、実施形態1で示した発明文書分析システム10の一部を変形したものであるので、上述した発明文書分析システム10の効果の多くを発揮し得る。
[3-5. Effects of Invention Document Analysis System According to Second Embodiment]
Since the invention document analysis system 20 is a part of the invention document analysis system 10 shown in the first embodiment, many of the effects of the invention document analysis system 10 described above can be exhibited.

発明文書分析システム20は、分析部205により、設定情報に基づいて、重要語句抽出部2051で発明者等又は弁理士により作成された発明文書から重要語句を抽出して各重要語句に基づく各種分析を行い、分析結果として生成された各種情報を含む特許出願関連情報を、出力部208により出力するので、翻訳者等にとっては、特許出願関連情報を参照することにより、発明文書の理解が促進される可能性がある。発明文書の理解の促進は、翻訳者にとって発明文書を適切に又は効率的に翻訳するために有用となる。 The invention document analysis system 20 uses the analysis unit 205 to extract key phrases from invention documents created by the inventors or patent attorneys in the key phrase extraction unit 2051 based on the setting information, and performs various analyzes based on each key phrase. , and the output unit 208 outputs the patent application-related information including various information generated as the analysis result. There is a possibility that Promoting the understanding of the invention document is useful for translators to translate the invention document appropriately or efficiently.

発明文書分析システム20において発明文書の分析結果に基づいて生成される特許出願関連情報は、例えば、表示用文書生成部2083等により、見出し、コメント、重要語句、符号等の強調表示、操作に応じて重要語句等に基づく各種検索又は翻訳語候補集合からの対応翻訳語の選択等を行うGUI要素の表示等を実現する表示制御情報が付加された、HTML文書等の表示用文書として出力部208に出力されるので、翻訳者等にとっては、ブラウザ機能を有する各種の端末装置において、特許出願関連情報を閲覧でき、重要語句等の強調表示、重要語句等に係るGUI要素の操作等により、発明文書の迅速な理解が可能となり得るし、重要語句に対応する対応翻訳語の決定を効率的に行い得る。また、発明文書分析システム20において発明文書の分析結果に基づいて生成される表示用文書(例えばHTML文書)としての特許出願関連情報は、表示部2084により表示されるので、翻訳者等にとっては、特許出願関連情報を閲覧でき、重要語句等の強調表示、重要語句等に係るGUI要素の操作等により、発明文書の迅速な理解が可能となり得るし、重要語句に対応する対応翻訳語の決定を効率的に行い得る。なお、ブラウザ等により表示された特許出願関連情報の内容は、コピー&ペーストの対象となり得るので、翻訳者等は、必要な内容をコピー&ペーストすることで、その内容をペースト先となる、テキストエディタ等の文書作成編集機能を有するアプリケーションプログラムで、編集することができる。 The patent application-related information generated based on the analysis result of the invention document in the invention document analysis system 20 is, for example, highlighted by the display document generation unit 2083 or the like, such as headings, comments, important phrases, symbols, etc., and displayed according to the operation. Output unit 208 as a display document such as an HTML document added with display control information for realizing the display of GUI elements for performing various searches based on key words, etc., or selecting corresponding translation words from a translation word candidate set. For translators, etc., it is possible to view patent application-related information on various terminal devices with a browser function. A quick comprehension of the document may be possible, and the determination of the corresponding translation corresponding to the key phrase may be efficiently performed. In addition, the patent application-related information as a display document (for example, an HTML document) generated based on the analysis result of the invention document in the invention document analysis system 20 is displayed by the display unit 2084. By viewing patent application-related information, highlighting key words, etc., and operating GUI elements related to key words, etc., it is possible to quickly understand invention documents, and to determine corresponding translations corresponding to key words. can be done efficiently. The content of patent application-related information displayed by a browser, etc., can be copied and pasted. It can be edited with an application program such as an editor that has document creation and editing functions.

発明文書分析システム20は、例えば、発明文書の分析結果に基づいて生成される特許出願関連情報をHTML文書(例えばHTMLファイル、及び、HTMLファイルで指定されたファイル等)として出力する。これにより、HTMLに対応した各種ブラウザにより特許出願関連情報の閲覧が可能となるので、発明者等又は弁理士から、HTML文書としての特許出願関連情報の提供を受けた翻訳者等は、特別なシステム、特別なアプリケーションプログラム等を有さなくても、ブラウザ機能を有する端末装置(例えばアプリケーションプログラムとしてのブラウザを実行するPC)により、特許出願関連情報を閲覧し得る。 The invention document analysis system 20 outputs, for example, the patent application-related information generated based on the analysis result of the invention document as an HTML document (for example, an HTML file and a file specified by the HTML file, etc.). This makes it possible to browse patent application-related information using various browsers that support HTML. Even without a system, a special application program, etc., a terminal device having a browser function (for example, a PC executing a browser as an application program) can be used to browse patent application-related information.

発明文書分析システム20において発明文書の分析結果に基づいて生成される表示用文書(例えばHTML文書)としての特許出願関連情報では、例えば、発明文書におけるクレームを表すクレーム情報、発明文書における明細書を表す明細書情報等に記載された各重要語句が、クレームに記載されている重要語句か否か識別する表示態様(例えば表示色)で表示され、内容が相違する重要語句間では相違する色となる左境界線等が付されて表示されるので、翻訳者等にとっては、各重要語句を迅速に把握することが可能となり得る。 The patent application related information as a display document (for example, HTML document) generated based on the analysis result of the invention document in the invention document analysis system 20 includes, for example, claim information representing the claims in the invention document, and the specification of the invention document. Each key phrase described in the description information, etc., is displayed in a display mode (for example, display color) that distinguishes whether it is the key phrase described in the claim or not, and the key phrases with different contents are displayed in different colors. Since it is displayed with a left border line or the like attached to it, it is possible for the translator or the like to quickly grasp each important phrase.

発明文書分析システム20において発明文書の分析結果に基づいて生成されて出力される特許出願関連情報は、例えば、警告情報を含み、警告情報は、発明文書が翻訳用発明文書標準規定に適合していない等の不適切な記載を含む場合にその旨を指摘する指摘情報を含み、また、発明文書の翻訳用発明文書標準規定への適合性に係る評価値を含む発明文書評価情報を含むので、発明文書を作成した発明者等又は弁理士にとっては、警告情報を参照することで、翻訳し易い発明文書となるように発明文書を修正することが可能となり得る。また、例えば、発明者等又は弁理士から、発明文書と特許出願関連情報とを受領して翻訳を依頼される翻訳者にとっては、適切な発明文書が提供されることが期待でき、発明文書を適正又は効率的に翻訳することが可能となり得る。また、例えば、翻訳者が発明文書分析システム20を有する場合においては、発明者等又は弁理士から、発明文書と、設定情報と、重要語句設定辞書と、図面文書との提供を受けて利用することで、発明文書分析システム20により、特許出願関連情報を出力させて、特許出願関連情報を参照することで、発明文書を適正又は効率的に翻訳することが可能となり得る。発明文書分析システム20を翻訳者が利用することを前提とする場合、或いは、特許出願関連情報が翻訳者に提供されることを前提とする場合において、発明文書を受け取り翻訳する翻訳者は、特許出願関連情報を閲覧することで、発明文書を適正又は効率的に翻訳することが可能となり得るし、特許出願関連情報中の警告情報を確認することで、発明者等又は弁理士がその警告情報を無視できると判断していることを知ることが可能となり得る。発明者等又は弁理士は、必要に応じて発明文書における重要語句についての対応翻訳語を指定する情報(例えば重要語句設定辞書)を、翻訳者に提供することができ、翻訳者は、この重要語句についての対応翻訳語に係る情報を参照することで、重要語句を適切又は効率的に翻訳することが可能となり得る。なお、発明者等又は弁理士は、発明文書における重要語句についての対応翻訳語を指定する情報を、発明文書を発明文書分析システム20で分析させた結果として出力される特許出願関連情報における重要語句リスト(例えば重要語句と翻訳語候補集合との組が列挙されたリスト)を参照、編集等することで、比較的容易に生成することが可能となる。また、翻訳者等は、ブラウザ等で表示された表示用文書としての特許出願関連情報を閲覧し、特許出願関連情報中で、操作対応GUI要素として表示された重要語句等に対して操作することで、その特許出願関連情報の基礎となった発明文書に関連する他の1つ又は複数の発明文書における重要語句等の記載内容、或いは、他の1つ又は複数の発明文書における翻訳補助情報等を確認し得るし、その特許出願関連情報の基礎となった発明文書に対応する図面文書における重要語句等に関連する部分を確認し得るし、検索サイト等で表示される重要語句等の定義、翻訳語句等を確認し得る。これにより、翻訳者等は、発明文書の重要語句等について十分把握して適切又は効率的に翻訳し得る。 The patent application-related information generated and output based on the analysis result of the invention document in the invention document analysis system 20 includes, for example, warning information, and the warning information indicates whether the invention document conforms to the invention document standards for translation. In the case of inappropriate descriptions such as not included, it includes indication information pointing out that fact, and also includes invention document evaluation information including the evaluation value related to the conformity of the invention document to the standard provisions for invention documents for translation. By referring to the warning information, the inventor or patent attorney who prepared the invention document may be able to modify the invention document so that it can be easily translated. In addition, for example, a translator who receives an invention document and patent application-related information from an inventor, etc. or a patent attorney and is requested to translate the invention document can expect to be provided with an appropriate invention document. It may be possible to translate properly or efficiently. In addition, for example, when the translator has the invention document analysis system 20, the invention document, setting information, important phrase setting dictionary, and drawing document are provided by the inventor or the patent attorney and used. As a result, the invention document analysis system 20 outputs the patent application-related information, and by referring to the patent application-related information, it may be possible to translate the invention document properly or efficiently. If it is assumed that the translator will use the invention document analysis system 20, or if it is assumed that the patent application related information will be provided to the translator, the translator who receives and translates the invention document By viewing the application-related information, it may be possible to translate the invention document properly or efficiently. can be ignored. The inventors, etc. or the patent attorney can provide the translator with information (for example, a key phrase setting dictionary) that designates the corresponding translation words for the key phrases in the invention document as necessary, and the translator can By referring to the information related to the corresponding translation word for the phrase, it may be possible to translate the important phrase appropriately or efficiently. In addition, the inventors, etc. or the patent attorney may use the information specifying the corresponding translated words for the key words in the invention document as the key words in the patent application related information output as a result of analyzing the invention document with the invention document analysis system 20. By referring to, editing, etc., a list (for example, a list listing pairs of key phrases and translation word candidate sets) can be generated relatively easily. In addition, the translator, etc., can view the patent application-related information as a display document displayed on a browser, etc., and operate the important words and phrases displayed as operation-responsive GUI elements in the patent application-related information. , descriptions such as key phrases in one or more other invention documents related to the invention document on which the patent application-related information is based, or translation assistance information, etc. in one or more other invention documents can be confirmed, the part related to important words and phrases in the drawing document corresponding to the invention document that became the basis of the patent application related information can be confirmed, and the definitions of important words and phrases displayed on search sites etc. Translated words and phrases can be confirmed. As a result, the translator or the like can understand the important words and phrases of the invention document sufficiently and translate them appropriately or efficiently.

発明文書分析システム20において発明文書の分析結果に基づいて生成される表示用文書としての特許出願関連情報は、例えば、重要語句等が強調表示された、クレーム情報、修正版クレーム情報、明細書情報、明細書見出しリスト、修正版明細書情報、クレームツリー、修正版クレームツリー、構成クレームツリー、及び、修正版構成クレームツリーを含むので、特許出願関連情報を閲覧する翻訳者等にとっては、発明文書の内容を迅速に把握することが可能となり得る。発明者等又は弁理士は、例えば、特許出願関連情報における明細書見出しリストを閲覧することで、発明文書の明細書の見出しが適切か否かの判断等が容易となり得る。発明者等又は弁理士は、例えば、設定情報に、クレームを生成すべき出願先となり得る地域(例えば米国)を指定する情報等を定めておき、発明文書分析システム20が出力した特許出願関連情報における修正版クレームツリー或いは修正版構成クレームツリーを参照して修正版クレーム情報を採用するようにといった簡潔な連絡を翻訳者に対して行うことで、翻訳者は、例えば米国出願用の翻訳のために、発明文書のクレームの各項における引用項の記載をどのように修正すればよいかを、修正版クレーム情報、修正版クレームツリー或いは修正版構成クレームツリーに基づいて、明確に把握することが可能となり得る。 The patent application-related information as display documents generated based on the analysis results of the invention documents in the invention document analysis system 20 includes, for example, claim information, modified version claim information, and specification information in which important words and phrases are highlighted. , specification heading list, modified specification information, claim tree, modified claim tree, constituent claim tree, and modified constituent claim tree. It may be possible to quickly grasp the contents of For example, the inventors or patent attorneys can easily determine whether or not the headings of the specification of the invention document are appropriate by browsing the description heading list in the patent application related information. For example, the inventor or patent attorney predefines, in the setting information, information specifying a region (for example, the U.S.) that can be the filing destination where claims should be generated, and the patent application related information output by the invention document analysis system 20. By providing a brief communication to the translator to refer to the modified claim tree or modified constituent claim tree in the In addition, it is possible to clearly understand how to modify the statement of the citation in each claim section of the invention document based on the modified claim information, the modified claim tree, or the modified configuration claim tree. can be possible.

発明文書分析システム20において発明文書の分析結果に基づいて生成されて出力される特許出願関連情報は、例えば、重要語句リスト、重要語句関係情報(例えば、包含関係情報、記録関係情報、プログラム実現関係情報、等価関係情報、及び、上下概念関係情報)、及び、重要語句関係翻訳情報(例えば、包含関係翻訳情報、記録関係翻訳情報、プログラム実現関係翻訳情報、等価関係翻訳情報、及び、上下概念関係翻訳情報)を含むので、翻訳者等にとっては、重要語句に対応する対応翻訳語の決定を適正又は効率的に行うことが可能となり得る。発明文書分析システム20において発明文書の分析結果に基づいて生成される表示用文書としての特許出願関連情報は、例えば、重要語句に翻訳語候補集合を対応付けた重要語句リストを含み、翻訳語候補集合の表示要素に、操作に応じて翻訳語候補集合から1つの要素を対応翻訳語として決定するためのGUI機能を持たせる表示制御情報が付加されているので、翻訳者等にとっては、ブラウザ等により表示された翻訳語候補集合の要素の選択操作により、重要語句に対応する対応翻訳語の決定を効率的に行うことが可能となり得る。 The patent application-related information generated and output based on the analysis results of the invention documents in the invention document analysis system 20 includes, for example, a list of key words and phrases, key word relationship information (e.g., inclusion relationship information, record relationship information, program realization relationship information, equivalent relationship information, and hierarchical concept relationship information), and important phrase relationship translation information (for example, inclusion relationship translation information, record relationship translation information, program implementation relationship translation information, equivalence relationship translation information, and hierarchical concept relationship translation information), it may be possible for translators, etc., to appropriately or efficiently determine corresponding translated words corresponding to key words. The patent application-related information as a document for display generated based on the analysis result of the invention document in the invention document analysis system 20 includes, for example, an important phrase list in which a set of translation word candidates is associated with important phrases. Display control information for providing a GUI function for determining one element from the translation word candidate set as a corresponding translation word according to an operation is added to the display elements of the set. By selecting the elements of the translation word candidate set displayed by , it is possible to efficiently determine the corresponding translation word corresponding to the key phrase.

発明文書分析システム20において発明文書の分析結果に基づいて生成されて出力される特許出願関連情報は、例えば、符号リスト及び図面符号リストを含むので、翻訳者等にとっては、符号に対応する重要語句を効率的に把握し、符号に対応する図面の内容を効率的に参照することが可能となり得る。 The patent application related information generated and output based on the analysis result of the invention document in the invention document analysis system 20 includes, for example, a code list and a drawing code list, so for translators etc., important words corresponding to the code and efficiently refer to the contents of the drawings corresponding to the reference numerals.

発明文書分析システム20において発明文書の分析結果に基づいて生成される特許出願関連情報は、例えば、クレーム翻訳情報、修正版クレーム翻訳情報、明細書翻訳情報、修正版明細書翻訳情報を含むので、翻訳者にとっては、これらの情報を参照することで、発明文書の翻訳を適正又は効率的に行うことが可能となり得る。 The patent application related information generated based on the analysis result of the invention document in the invention document analysis system 20 includes, for example, claim translation information, modified claim translation information, specification translation information, and modified specification translation information, By referring to this information, the translator may be able to translate the invention document properly or efficiently.

発明文書分析システム20において発明文書の分析結果に基づいて生成されて出力される特許出願関連情報は、例えば、クレームベース図面情報、クレームベース明細書情報、及び、クレームベース要約書情報を含ませ得る。これにより、例えば、クレームを含み明細書を含まない発明文書を作成して発明文書分析システム20に分析させた発明者等又は弁理士は、クレームベース図面情報、クレームベース明細書情報、及び、クレームベース要約書情報を、参照して、修正等して利用することにより、図面文書、及び、クレーム、明細書等を含む発明文書を、効率的に生成することが可能となり得る。例えば、発明者等又は弁理士は、クレームベース明細書情報において所定の様式で記載された記載支援用未完成メッセージ部分を修正することで、発明文書における明細書の生成を効率的に行える可能性がある。発明者等又は弁理士は、クレームベース図面情報、クレームベース明細書情報、及び、クレームベース要約書情報を参照して生成した発明文書を、発明文書分析システム20に分析させることにより、出力される特許出願関連情報を参照して、その発明文書を、より適切に、修正することが可能となり得る。 The patent application-related information generated and output based on the analysis results of the invention documents in the invention document analysis system 20 can include, for example, claim-based drawing information, claim-based specification information, and claim-based abstract information. . As a result, for example, an inventor or a patent attorney who has created an invention document including claims and not including a specification and having the invention document analysis system 20 analyze the claim-based drawing information, the claim-based specification information, and the claim By referring to, correcting, and using the base abstract information, it is possible to efficiently generate invention documents including drawing documents, claims, specifications, and the like. For example, inventors, etc. or patent attorneys may be able to efficiently generate specifications in invention documents by correcting the incomplete message part for description support written in a prescribed format in the claim-based specification information. There is The inventor or patent attorney analyzes the invention document generated by referring to the claim-based drawing information, the claim-based specification information, and the claim-based abstract information in the invention document analysis system 20, and outputs It may be possible to modify the invention document more appropriately by referring to the patent application related information.

発明文書分析システム20において発明文書の分析結果に基づいて生成されて出力される特許出願関連情報は、例えば、技術分野情報、料金情報、及び、集計情報を含むので、発明者等又は弁理士は、その特許出願関連情報を参照することで、必要に応じて、発明文書を修正し得る。 The patent application-related information generated and output based on the analysis results of the invention documents in the invention document analysis system 20 includes, for example, technical field information, fee information, and aggregate information, so that inventors or patent attorneys can , may revise the invention document as necessary by referring to the patent application related information.

発明文書分析システム20は、例えば、取得した翻訳用発明文書標準規定に基づいて発明文書について生成して出力する特許出願関連情報の警告情報に、その翻訳用発明文書標準規定を公開しているウェブサイトのネットワークアドレス等の、翻訳用発明文書標準規定にアクセスするために必要な規定アクセス情報を含ませてもよい。これにより、翻訳者等は、警告情報中の規定アクセス情報を参照することで、翻訳用発明文書標準規定にアクセスしてその内容を閲覧することが可能になる。
発明文書分析システム20は、例えば、翻訳用発明文書標準規定の新しいバージョンが取得可能であれば取得し、取得した翻訳用発明文書標準規定に基づいて、発明文書について生成して出力する特許出願関連情報の警告情報には、例えば、利用した翻訳用発明文書標準規定のバージョンを示すバージョン情報を含ませる。これにより、翻訳用発明文書標準規定が時を経て洗練されて改定されることに対応でき、翻訳者等は、警告情報中の翻訳用発明文書標準規定のバージョン情報を参照することで、どのバージョンの翻訳用発明文書標準規定が利用されたかについて確認することが可能になる。
The invention document analysis system 20, for example, generates and outputs an invention document based on the acquired invention document standard specification for translation, in the warning information of the patent application related information, which publishes the invention document standard specification for translation. The prescribed access information required to access the standard specifications for invention documents for translation, such as the network address of the site, may also be included. As a result, the translator or the like can access the invention document standard specification for translation and view its contents by referring to the specified access information in the warning information.
The invention document analysis system 20 acquires, for example, a new version of the invention document standard specification for translation if it is available, and generates and outputs the invention document based on the acquired invention document standard specification for translation. The informational warning information includes, for example, version information indicating the version of the used invention document standard specification for translation. As a result, it is possible to respond to the refinement and revision of the standard specifications for invention documents for translation over time, and translators, etc. can refer to the version information of the standard specifications for invention documents for translation in the warning information to determine which version It becomes possible to confirm whether the invention document standard provisions for translation of the document have been used.

発明文書分析システム20は、例えば、発明文書が翻訳用発明文書標準規定の複数の項目各々に適合しているか否かに係る判定を行うための処理を担うプログラムモジュール、重要語句の抽出処理を担うプログラムモジュール等であるところの各プラグインモジュールを取得して利用し、プラグインモジュールのバージョン情報を管理して、新しいバージョンのプラグインモジュールが入手可能であれば取得して利用する。これにより、時を経て洗練された新しいプラグインモジュールが利用されるので、より適切に各種処理を実行することが可能となり得る。 The invention document analysis system 20 includes, for example, a program module responsible for determining whether or not an invention document conforms to each of a plurality of items of the invention document standard specifications for translation, and a process for extracting important words. Each plug-in module such as a program module is acquired and used, version information of the plug-in module is managed, and if a new version of the plug-in module is available, it is acquired and used. As a result, new plug-in modules that have been refined over time are used, and it may be possible to perform various processes more appropriately.

発明文書分析システム20の機械学習部207により生成された各種学習モデルを出力する学習モデル出力部2081は、例えば技術分野特定用学習モデルを出力する。この技術分野特定用学習モデルを利用することにより、発明文書から抽出された重要語句群を入力として、予め定められた演算処理を行うことで、その発明文書が属する技術分野の特定が可能となり得る。 A learning model output unit 2081 that outputs various learning models generated by the machine learning unit 207 of the invention document analysis system 20 outputs, for example, a learning model for specifying a technical field. By using this technical field identification learning model, it is possible to identify the technical field to which the invention document belongs by performing predetermined arithmetic processing with the important phrase group extracted from the invention document as input. .

発明文書分析システム20の学習モデル出力部2081は、例えば機械学習部207により生成された重要語句翻訳用学習モデルを出力する。この重要語句翻訳用学習モデルを利用することにより、発明文書から抽出された各重要語句を入力として、予め定められた演算処理を行うことで、その重要語句の機械翻訳結果を得ることが可能となり得る。 The learning model output unit 2081 of the invention document analysis system 20 outputs the learning model for important phrase translation generated by the machine learning unit 207, for example. By using this learning model for translating important phrases, it is possible to obtain machine translation results for the important phrases by inputting each of the important phrases extracted from the invention documents and performing predetermined arithmetic processing. obtain.

発明文書分析システム20の学習モデル出力部2081は、例えば機械学習部207により生成された翻訳用学習モデルを出力する。この翻訳用学習モデルを利用することにより、発明文書を入力として、予め定められた演算処理を行うことで、その発明文書の機械翻訳結果を得ることが可能となり得る。 The learning model output unit 2081 of the invention document analysis system 20 outputs the learning model for translation generated by the machine learning unit 207, for example. By using this learning model for translation, it is possible to obtain the result of machine translation of the invention document by performing predetermined arithmetic processing with the invention document as an input.

発明文書分析システム20は、例えば、複数の発明文書各々から重要語句抽出部2051により抽出した重要語句群間の相関性、或いは、ユーザによる指定等に基づいて、分類部2053により発明文書のグループ分類を実行し、機械学習部207によりグループ毎に、発明文書から抽出された重要語句と、対応する対応翻訳語との複数組を教師データとした機械学習により重要語句翻訳用学習モデルを生成する。これにより、発明文書が属するグループに適合した重要語句翻訳用学習モデルを利用した演算処理により発明文書における各重要語句を機械翻訳することが可能となり得る。また、発明文書分析システム20が、例えば、発明文書が属するグループに適合した重要語句翻訳用学習モデルを利用した演算処理により発明文書から抽出された重要語句を機械翻訳して、重要語句と、その機械翻訳結果を含む翻訳語候補集合との組を列挙した重要語句リストを含む特許出願関連情報を出力することとしてもよい。この重要語句リストを参照することで、翻訳者は、発明文書の重要語句を効率的に又は適正に翻訳することが可能となり得る。発明文書分析システム20は、グループ分類を行わずに重要語句翻訳用学習モデルを生成してもよい。グループ分類されていない重要語句翻訳用学習モデルを利用しても、発明文書における重要語句の適切な機械翻訳が実現される可能性はある。 The invention document analysis system 20 classifies invention documents into groups by the classification unit 2053 based on, for example, the correlation between key phrase groups extracted from each of a plurality of invention documents by the key phrase extraction unit 2051, or on the basis of designation by the user. , and the machine learning unit 207 generates a learning model for translating key words for each group by machine learning using a plurality of sets of key words extracted from invention documents and corresponding translation words as training data. As a result, it is possible to machine-translate each of the important phrases in the invention document by arithmetic processing using the important phrase translation learning model adapted to the group to which the invention document belongs. Further, the invention document analysis system 20 machine-translates the key words extracted from the invention documents by, for example, arithmetic processing using the key word translation learning model adapted to the group to which the invention documents belong, and the key words and their It is also possible to output patent application related information including a list of important words and phrases listing pairs with translation word candidate sets including machine translation results. By referring to this key phrase list, the translator may be able to efficiently or properly translate the key phrases of the invention document. The invention document analysis system 20 may generate a learning model for important phrase translation without performing group classification. Even if a learning model for important phrase translation that is not classified into groups is used, there is a possibility that appropriate machine translation of important phrases in invention documents can be realized.

発明文書分析システム20は、例えば、複数の発明文書各々から重要語句抽出部2051により抽出した重要語句群間の相関性、或いは、ユーザによる指定等に基づいて、分類部2053により発明文書のグループ分類を実行し、機械学習部207によりグループ毎に、発明文書と、対応する翻訳結果文書との組を教師データとした機械学習により翻訳用学習モデルを生成する。これにより、例えば機械翻訳システム等において、グループ毎の翻訳用学習モデルのうち、発明文書が属するグループに適合した翻訳用学習モデルを利用した演算処理により発明文書を機械翻訳することが可能となる。また、発明文書分析システム20が、例えば、グループ毎の翻訳用学習モデルのうち、発明文書が属するグループに適合した翻訳用学習モデルを利用した演算処理により発明文書の少なくとも一部を機械翻訳して、その機械翻訳結果を含む特許出願関連情報を出力することとしてもよい。このような発明文書の機械翻訳結果を参照することで、翻訳者は、発明文書を効率的に又は適正に翻訳することが可能となり得る。発明文書分析システム20は、グループ分類を行わずに翻訳用学習モデルを生成してもよい。グループ分類されていない翻訳用学習モデルを利用しても、発明文書の適切な機械翻訳が実現される可能性はある。 The invention document analysis system 20 classifies invention documents into groups by the classification unit 2053 based on, for example, the correlation between key phrase groups extracted from each of a plurality of invention documents by the key phrase extraction unit 2051, or on the basis of designation by the user. , and the machine learning unit 207 generates a translation learning model for each group by machine learning using pairs of the invention document and the corresponding translation result document as training data. As a result, for example, in a machine translation system or the like, it is possible to machine-translate an invention document by arithmetic processing using a translation learning model suitable for the group to which the invention document belongs among the translation learning models for each group. In addition, the invention document analysis system 20 machine-translates at least a part of the invention document by arithmetic processing using, for example, a translation learning model suitable for the group to which the invention document belongs among the translation learning models for each group. , the patent application related information including the machine translation result may be output. By referring to such machine translation results of the invention document, the translator may be able to translate the invention document efficiently or properly. The invention document analysis system 20 may generate a learning model for translation without performing group classification. Appropriate machine translation of invention documents may be realized even if a learning model for translation that is not classified into groups is used.

発明文書分析システム20は、例えば、翻訳用学習モデル又は重要語句翻訳用学習モデルの生成のための機械学習用の教師データの蓄積のために用いる発明文書を、文書評価部2071による評価結果に応じて絞り込むので、これにより、適切な翻訳用学習モデル又は重要語句翻訳用学習モデルの生成が可能となり得る。適切な翻訳用学習モデル又は重要語句翻訳用学習モデルの生成が可能となることは、これらの学習モデルを用いた機械翻訳の精度の向上に有用となり得る。 The invention document analysis system 20, for example, analyzes an invention document used for accumulating teacher data for machine learning for generating a learning model for translation or a learning model for important phrase translation, according to the evaluation result by the document evaluation unit 2071. This may allow generation of an appropriate learning model for translation or a learning model for important phrase translation. Being able to generate an appropriate learning model for translation or a learning model for important phrase translation can be useful in improving the accuracy of machine translation using these learning models.

発明文書分析システム20は、例えば、発明文書に基づいて生成した修正版発明文書と翻訳結果文書との組、或いは、その修正版発明文書の各文毎の、その文とその文に対応する翻訳結果文書の文との組を、機械学習用の教師データとしてもよく、これにより、より適切な翻訳用学習モデルが生成される可能性がある。発明文書分析システム20は、例えば、教師データに用いる発明文書と翻訳結果文書とから符号を除去して教師データとするので、これにより、発明文書における符号の付け忘れを翻訳時に修正して翻訳結果文書を作成したような場合に生じる両文書の内容の齟齬が抑制され、適切な翻訳用学習モデルの生成が可能となり得るし、その適切な翻訳用学習モデルを用いることは、機械翻訳の精度の向上に有用となり得る。 The invention document analysis system 20, for example, is a set of a modified invention document generated based on the invention document and a translation result document, or for each sentence of the modified invention document, the sentence and the translation corresponding to that sentence. A combination of the resulting document and the sentence may be used as teacher data for machine learning, which may generate a more appropriate learning model for translation. The invention document analysis system 20, for example, removes the code from the invention document and the translation result document used for the training data to obtain the training data. It is possible to suppress the discrepancy between the contents of both documents that occurs when a document is created, and it is possible to generate an appropriate learning model for translation. can be useful for improvement.

発明文書分析システム20は、例えば、マイクロプロセッサを備える機器に、図40に例示したような発明文書分析処理を実行させるための発明文書分析処理プログラムをインストールして構成される。発明文書分析システム20において発明文書分析処理プログラムが起動されると、発明文書分析処理が実行される。発明文書分析処理プログラムは、発明文書分析処理のために用いられるデータを包含し得る。翻訳者等にとっては、発明文書分析処理により出力された情報(例えば表示用文書としての特許出願関連情報)を参照することで、発明文書の理解が促進される可能性がある。発明文書の理解の促進は、翻訳者にとって発明文書を適切に又は効率的に翻訳するために有用となる。 The invention document analysis system 20 is configured, for example, by installing an invention document analysis processing program for executing invention document analysis processing as illustrated in FIG. 40 in a device having a microprocessor. When the invention document analysis processing program is started in the invention document analysis system 20, the invention document analysis processing is executed. The invention document analysis processing program may contain data used for the invention document analysis processing. For a translator or the like, referring to the information output by the invention document analysis process (for example, patent application-related information as a display document) may facilitate understanding of the invention document. Facilitating the understanding of the invention document is useful for translators to translate the invention document appropriately or efficiently.

(他の実施形態等)
以上のように、本開示における技術の例示として、実施形態1及び2で発明文書分析システム10、20等を説明した。しかしながら、本開示における技術は、これに限定されず、上述した実施形態1又は2に対して適宜、変更、置換、付加、省略等を行った実施形態としても具体化可能である。
(other embodiments, etc.)
As described above, the invention document analysis systems 10 and 20 and the like have been described in the first and second embodiments as examples of the technology of the present disclosure. However, the technology in the present disclosure is not limited to this, and can be embodied as an embodiment in which modifications, replacements, additions, omissions, etc. are made as appropriate to the first or second embodiment described above.

上述の実施形態では、発明文書分析システム10、20が、設定情報、翻訳用発明文書標準規定、重要語句設定辞書、発明文書、図面文書、翻訳結果文書等を取得する例を示したが、このような各種の情報の取得は、如何なる方式で実現されてもよい。各種の情報の取得は、例えば、外部の通信可能な装置からの情報信号の受信により実現されてもよいし、メモリカード等の着脱自在な記録媒体から情報を読み出すことで実現されてもよいし、キーボード、マウス、音声入力装置その他の入力装置を介してユーザ(例えば発明者等、弁理士、翻訳者等)から入力される情報を取得することであってもよく、イメージセンサによる撮像を含む各種センサによるセンシング結果としての情報の取得であってもよい。また、上述の実施形態では、発明文書分析システム10、20が、表示用文書における操作対応GUI要素に対する操作を受け付ける例を示したが、このような操作の受付けは、如何なる方式で実現されてもよい。操作の受付けは、例えば、キーボード、ポインティングデバイス、タッチパッド、音声入力装置その他の入力装置を介してユーザ(例えば発明者等、弁理士、翻訳者等)から入力される何らかの情報を取得することであってもよく、イメージセンサによる撮像を含む各種センサによるセンシング結果としてユーザから得られる何らかの情報(例えば予め定められたジェスチャー)を取得することであってもよい。また、上述の実施形態で示したユーザは、必ずしも人間に限られることはなく、人間の一部の機能と同様な機能を有するロボット等であってもよい。 In the above-described embodiments, the invention document analysis systems 10 and 20 acquire setting information, invention document standard specifications for translation, important phrase setting dictionaries, invention documents, drawing documents, translation result documents, and the like. Acquisition of such various types of information may be realized by any method. Acquisition of various types of information may be achieved, for example, by receiving an information signal from an external communicable device, or by reading information from a removable recording medium such as a memory card. , keyboard, mouse, voice input device or other input device to acquire information input from the user (for example, inventors, patent attorneys, translators, etc.), including imaging by an image sensor Acquisition of information as a result of sensing by various sensors may be possible. Further, in the above-described embodiments, the invention document analysis systems 10 and 20 exemplify receiving operations on the operation-responsive GUI elements in the document for display. good. Acceptance of operation is, for example, by acquiring some information input from a user (for example, inventors, patent attorneys, translators, etc.) via a keyboard, pointing device, touch pad, voice input device, or other input device. Alternatively, it may be acquisition of some information (for example, a predetermined gesture) obtained from the user as a result of sensing by various sensors including imaging by an image sensor. Also, the users shown in the above embodiments are not necessarily limited to humans, and may be robots or the like having functions similar to some functions of humans.

また、上述した発明文書分析システム10、20における上述した各部の機能分担は一例に過ぎず、任意に変更することができ、複数の部分を統合してもよい。また、発明文書分析システム10、20は、発明文書分析処理、各種の学習モデルの生成に係る処理等の一部を、発明文書分析システム10、20を構成する装置と通信可能な外部の装置に分担させてもよい。また、発明文書分析システム10、20における各部の全部又は一部の機能は、IC(Integrated Circuit)、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、LSI(Large Scale Integration)等の半導体装置により実現されてもよく、その半導体装置には、その各部の全部又は一部の機能を実現するプログラムを記録したメモリ及びマイクロプロセッサを含めてもよい。発明文書分析システム10、20における各種処理の全部又は一部は、専用の電子回路等のハードウェアにより実現されても、マイクロプロセッサ及びソフトウェア(例えばプログラム及びプログラムに用いられる情報)を用いて実現されてもよい。発明文書分析システム10、20の処理の全部又は一部を実現するためのプログラム(例えば発明文書分析処理プログラム)は、コンピュータが読み取り可能なROM、光ディスク、ハードディスク等の非一時的な記録媒体に記録して頒布、或いは、流通させられ得る。発明文書分析システム10、20の処理の全部又は一部を実現するためのプログラムが頒布された場合に、そのプログラムを、マイクロプロセッサを備える機器にインストールして、そのインストール先の装置のマイクロプロセッサに実行させることにより、その装置に、その処理の全部又は一部を行わせることが可能となる。なお、そのプログラムは、発明文書分析システム10、20が備える記録媒体に予め格納されていてもよいし、例えば、配信され、インターネット等を含む広域通信網等を介して、その記録媒体へ供給されてもよい。また、如何なる方式で処理を行うコンピュータであるかを問わず、コンピュータを、マイクロプロセッサを備える機器であると看做すこととしてもよい。また、発明文書分析処理プログラム等の、発明文書分析システム10、20の処理の全部又は一部を実現するためのプログラムは、如何なる言語で記述されたプログラムであってもよいし、インタープリタ、実行時コンパイラ(Just-In-Time Compiler)等を介して実行されるプログラムでもよいし、OS又は既存の各種の実行環境の上で動作するプログラムであってもよい。また、発明文書分析処理プログラムは、複数のプログラムで構成されてもよく、その複数のプログラムの各々は、複数のコンピュータ上に分散されていてもよく、複数の互いに異なる実行環境上で動作するものであってもよい。発明文書分析システム10、20の処理の全部又は一部を実現するために、互いに異なる言語で記述された複数のプログラムが、連携して動作してもよい。 Also, the above-described functional allocation of each part in the invention document analysis systems 10 and 20 described above is merely an example, and can be changed arbitrarily, and a plurality of parts may be integrated. Further, the invention document analysis systems 10 and 20 perform part of invention document analysis processing, processing related to generation of various learning models, etc. to an external device capable of communicating with the devices constituting the invention document analysis systems 10 and 20. You can share it. In addition, all or part of the function of each part in the invention document analysis system 10, 20 is implemented by IC (Integrated Circuit), ASIC (Application Specific Integrated Circuit), FPGA (Field Programmable Gate Array), LSI (Large Scale Integration), etc. It may be realized by a semiconductor device, and the semiconductor device may include a memory and a microprocessor in which a program for realizing all or part of the functions of each part is recorded. All or part of the various processes in the invention document analysis systems 10 and 20 may be realized by hardware such as a dedicated electronic circuit, or may be realized by using a microprocessor and software (for example, programs and information used in the programs). may A program (for example, an invention document analysis processing program) for realizing all or part of the processing of the invention document analysis systems 10 and 20 is recorded on a non-temporary recording medium such as a computer-readable ROM, optical disk, or hard disk. may be distributed or distributed as When a program for realizing all or part of the processing of the invention document analysis system 10, 20 is distributed, the program is installed on a device equipped with a microprocessor, and the microprocessor of the device on which it is installed By executing it, it is possible to cause the device to perform all or part of the processing. The program may be stored in advance in a recording medium provided in the invention document analysis systems 10 and 20, or may be distributed and supplied to the recording medium via a wide area communication network including the Internet. may Also, a computer may be regarded as a device having a microprocessor, regardless of how the computer performs processing. Also, the program for realizing all or part of the processing of the invention document analysis systems 10 and 20, such as the invention document analysis processing program, may be a program written in any language, an interpreter, a runtime It may be a program executed via a compiler (Just-In-Time Compiler) or the like, or a program that operates on an OS or various existing execution environments. In addition, the invention document analysis processing program may consist of a plurality of programs, each of which may be distributed on a plurality of computers and run on a plurality of execution environments different from each other. may be In order to implement all or part of the processing of the invention document analysis systems 10 and 20, a plurality of programs written in different languages may work together.

また、上述した発明文書分析システム20は、重要語句抽出部2051により、発明文書のクレームから複数の重要語句を抽出し、抽出した複数の重要語句各々が表す要素間の構成上の包含関係に基づいて、その複数の重要語句の幾つかに対応する符号を決定する符号決定処理を実行し、抽出した複数の重要語句各々が表す要素間の各種関係(例えば重要語句関係情報で表される関係)に基づいて、図面番号で特定可能な各図面についてその図面に記載されるべき内容に関連する重要語句を決定する図面内容決定処理を実行し、発明文書のクレームから抽出された各重要語句と、符号決定処理と図面内容決定処理との結果とに基づいて、明細書に記載されるべき内容を決定する明細書内容決定処理と、明細書内容決定処理で決定された内容の明細書を出力する明細書内容出力処理とを実行することとしてもよい。発明文書分析システム20は、明細書内容決定処理では、発明文書のクレームにおいて請求対象とされた重要語句に基づいて、「発明の名称」の欄の内容となる発明名称文字列を生成し、符号決定処理と図面内容決定処理との結果に基づいて、図面番号順に各図に記載されるべき内容に関連する各重要語句について、その重要語句に符号を付して、その重要語句の属性(例えば図19に示す属性情報で表される属性)に応じてその重要語句について説明する文(例えば重要語句設定辞書において重要語句に付記されている文、或いは、記載支援用未完成メッセージを含む文)を、「発明を実施するための形態」の欄の内容として生成することとしてもよい。また、発明文書分析システム20は、重要語句抽出部2051により、発明文書から複数の重要語句を抽出し、抽出した複数の重要語句各々が表す要素間に、構成上の包含関係がある場合に、例えば要素間の包含関係を表す図等の、包含関係情報(図20参照)を出力することとしてもよい。また、発明文書分析システム20は、発明文書のクレームに基づいて、クレームの項間の引用関係を表現する線又は記号を含むクレームツリーを生成して、クレームの項間の引用関係を表現する線又は記号をGUI要素としてそのクレームツリーを表示し、GUI要素に対するユーザによる操作に応じて、そのGUI要素に係る線又は記号で表現されたクレームの項間の引用関係を切断した内容の、クレームの各項を含む修正版クレーム情報を生成し、修正版クレーム情報を出力することとしてもよい。また、発明文書分析システム20は、重要語句抽出部2051により、発明文書のクレームから複数の重要語句を抽出し、抽出した複数の重要語句各々を、相違する重要語句同士は相違する表示態様(例えば相違する色の、幅を有する左境界線を重要語句に付加した表示態様)のGUI要素として表示し、GUI要素に対するユーザによる操作に応じて、そのGUI要素に係る重要語句を含むその発明文書中の各行又は各文を列挙したリストを表示することとしてもよいし、そのGUI要素に対するユーザによる操作に応じて、そのGUI要素に係る重要語句を含む、その発明文書とは別の発明文書(例えばユーザに指定された発明文書)中の各行又は各文を列挙したリストを表示することとしてもよいし、そのGUI要素に係る重要語句についての重要語句管理情報(図18参照)に含まれている情報を表示することとしてもよい。また、発明文書分析システム20は、発明文書の明細書を表す明細書情報を表示し、明細書情報における符号をGUI要素として表示し、符号のGUI要素に対するユーザによる操作に応じて、そのGUI要素に係る符号を含む図面文書中のその符号が記載された図面又はその図面の図面番号を表示することとしてもよい。 In addition, the above-described invention document analysis system 20 extracts a plurality of key phrases from the claim of the invention document by the key phrase extraction unit 2051, and based on the structural inclusion relationship between the elements represented by each of the extracted plurality of key phrases, Then, a code determination process is executed to determine codes corresponding to some of the plurality of important phrases, and various relationships between elements represented by each of the extracted plurality of important phrases (for example, relationships represented by important phrase relation information) Based on, for each drawing that can be specified by a drawing number, execute a drawing content determination process for determining key words related to the content to be described in the drawing, and each key word extracted from the claim of the invention document, Based on the results of the code determination process and the drawing content determination process, a specification content determination process for determining the contents to be described in the specification, and outputting the specification of the contents determined by the specification content determination process Description content output processing may be executed. In the specification content determination process, the invention document analysis system 20 generates an invention name character string that is the content of the "Title of invention" column based on key words that are claimed in the claims of the invention document. Based on the results of the determination process and the drawing content determination process, for each key phrase related to the content to be described in each drawing in the order of the drawing number, a code is attached to the key phrase, and the attribute of the key phrase (for example, (attribute represented by the attribute information shown in FIG. 19) (for example, a sentence attached to the key phrase in the key phrase setting dictionary, or a sentence including an incomplete message for writing support) may be generated as the contents of the "Mode for Carrying Out the Invention" column. Further, the invention document analysis system 20 extracts a plurality of key phrases from the invention document using the key phrase extraction unit 2051, and if there is a structural inclusion relationship between the elements represented by each of the extracted plurality of key phrases, For example, inclusion relationship information (see FIG. 20), such as a diagram representing inclusion relationships between elements, may be output. In addition, the invention document analysis system 20 generates a claim tree including lines or symbols representing citation relationships between claim terms based on the claims of the invention document, and the lines representing citation relationships between claim terms. Or display the claim tree using symbols as GUI elements, and according to the user's operation on the GUI elements, the content of the claim that cuts the citation relationship between the claims represented by the lines or symbols related to the GUI elements. It is also possible to generate modified claim information containing each term and output the modified claim information. In addition, the invention document analysis system 20 extracts a plurality of key phrases from the claim of the invention document using the key phrase extraction unit 2051, and displays each of the extracted plurality of key phrases in a different display mode (for example, display mode in which a left border line with a different color and width is added to key phrases), and the invention document including the key phrases related to the GUI element in response to the operation of the GUI element by the user It is also possible to display a list listing each line or sentence of the GUI element, or to display an invention document other than the invention document (for example, It is also possible to display a list listing each line or each sentence in the invention document specified by the user, or it is included in the important phrase management information (see FIG. 18) about the important phrases related to the GUI element. Information may be displayed. In addition, the invention document analysis system 20 displays specification information representing the specification of the invention document, displays the code in the specification information as a GUI element, and displays the GUI element according to the user's operation on the GUI element of the code. It is also possible to display the drawing in which the code is described or the drawing number of the drawing in the drawing document containing the code.

また、上述した発明文書分析システム20は、翻訳結果文書取得部2023が、発明文書に基づく翻訳の結果として生成された翻訳結果文書を取得した場合に、翻訳結果文書を表す翻訳結果情報を、出力部208が出力するHTML文書等の表示用文書としての特許出願関連情報中に含ませてもよい。この場合においては、発明文書分析システム20は、その発明文書から重要語句抽出部2051により抽出された各重要語句について、その重要語句に対応する、その翻訳結果文書における翻訳語句を、重要語句翻訳モデルに基づく機械翻訳の結果、重要語句設定辞書、翻訳補助情報等に基づく演算処理、或いは、重要語句と同一符号が付されている記載を検索する処理等により、特定し、表示用文書の翻訳結果情報部分におけるその特定された翻訳語句を表示要素とし、その翻訳語句の表示要素に、表示用文書のクレーム情報部分、明細書情報部分等におけるその重要語句の表示要素に付加された表示制御情報と同様の表示態様の制御(例えば同一の表示色による色付き左境界線の付加等による強調表示、表示要素の操作対応GUI要素化等)を行うような表示制御情報を付加することとしてもよい。重要語句に対応する翻訳語句の表示要素の操作対応GUI要素化により、操作に応じて、起動される関数により、同一の重要語句に対応する全ての翻訳語句をユーザに指定された語句へ一括置換する処理等の実現が可能となり得る。発明文書分析システム20が、出力部208が出力するHTML文書等の表示用文書としての特許出願関連情報中に翻訳結果情報を含ませる場合において、翻訳結果情報中における、記載様式が定まっている見出し(例えばクレームの各項の見出し、明細書の段落番号)を表示要素とし、その見出しの表示要素に、その表示要素を、操作に応じて対応するクレーム情報、明細書情報等における対応する見出し部分(例えば対応するクレームの項の内容、対応する明細書の段落の内容等)を表示するGUI要素にするための表示制御情報を付加することとしてもよい。例えば、図17に示す「メニュー選択に応じた特許出願関連情報の項目の内容表示欄」に翻訳結果情報が表示されている際に、その表示内容における明細書の段落番号である見出しの表示要素が操作(例えばマウスクリック操作)されると、図17に示す「操作対応GUI要素の操作に応じた事項の表示欄」に明細書情報における対応する段落番号の部分が表示されるように、その表示要素に付加される表示制御情報に係るスクリプトの関数を定義しておくことができる。翻訳者は、例えば、ブラウザ等で表示される、表示用文書としての特許出願関連情報の翻訳結果情報部分における表示内容の閲覧、操作等により、翻訳結果文書の妥当性の確認、重要語句に対応する翻訳語句の修正等を、効率的に行うことが可能となり得る。また、発明文書分析システム20は、翻訳結果文書のクレームの項数等、或いは、翻訳結果文書の明細書の行数、文の数、段落数等、或いは、翻訳結果文書の行数、文の数、全語句(word)数等、或いは、翻訳結果文書における明細書の実施形態記載部分における重要語句に対応する翻訳語句の記載数、或いは、翻訳結果文書における符号の記載数等を、計数して、各々の計数結果を識別可能に表現して、出力部208が出力する特許出願関連情報中の集計情報に含ませることとしてもよい。翻訳者は、例えば、特許出願関連情報の集計情報を参照して、発明文書における明細書の行数等と翻訳結果文書における明細書の行数等とを比較すること等により、翻訳結果文書の妥当性の確認等を、効率的に行うことが可能となり得る。 Further, when the translation result document acquisition unit 2023 acquires a translation result document generated as a result of translation based on the invention document, the invention document analysis system 20 described above outputs translation result information representing the translation result document. It may be included in the patent application related information as a display document such as an HTML document output by the unit 208 . In this case, the invention document analysis system 20, for each key phrase extracted from the invention document by the key phrase extraction unit 2051, translates the translated phrase in the translation result document corresponding to the key phrase into the key phrase translation model. Based on the result of machine translation based on, the translation result of the document for display is specified by arithmetic processing based on key phrase setting dictionary, translation auxiliary information, etc., or by searching for descriptions with the same sign as key phrase Display control information added to the display element of the key phrase in the claim information portion, specification information portion, etc. of the document for display, and the display element of the specified translated phrase in the information portion as a display element. It is also possible to add display control information for controlling a similar display mode (for example, highlighting by adding a colored left boundary line with the same display color, making display elements into operation-responsive GUI elements, etc.). By turning display elements of translated words corresponding to key words into operation-responsive GUI elements, all translated words corresponding to the same key word are replaced with user-specified words by a function activated in response to an operation. It may be possible to realize processing such as When the invention document analysis system 20 includes the translation result information in the patent application-related information as a display document such as an HTML document output by the output unit 208, the heading whose description format is fixed in the translation result information (e.g. headings of claims, paragraph numbers of descriptions) are used as display elements, and corresponding display elements in the display elements of the headings correspond to the corresponding claim information, description information, etc. according to the operation. Display control information for displaying GUI elements (for example, the content of the corresponding claim section, the content of the corresponding paragraph of the specification, etc.) may be added. For example, when the translation result information is displayed in the "content display column of the item of the patent application related information corresponding to the menu selection" shown in FIG. is operated (for example, a mouse click operation), the corresponding paragraph number part in the specification information is displayed in the "display field for matters corresponding to the operation of the operation-responsive GUI element" shown in FIG. It is possible to define script functions related to display control information added to display elements. For example, the translator can check the validity of the translation result document and respond to important phrases by viewing and operating the display content in the translation result information part of the patent application related information as a display document displayed on a browser etc. It may be possible to efficiently correct translated words and phrases. In addition, the invention document analysis system 20 determines the number of claims in the translation result document, the number of lines, the number of sentences, the number of paragraphs, etc. in the specification of the translation result document, or the number of lines, the number of sentences in the translation result document, etc. number of words, the number of all words, etc., or the number of translation words and phrases corresponding to the important words and phrases in the description of the embodiment of the specification in the translation result document, or the number of code descriptions in the translation result document, etc. Then, each count result may be expressed in an identifiable manner and included in the tally information in the patent application related information output by the output unit 208 . For example, the translator can compare the number of lines of the specification in the invention document with the number of lines of the specification in the translation result document by referring to the aggregated information of the patent application related information. It may be possible to efficiently confirm validity and the like.

また、上述した発明文書分析システム20は、発明文書分析処理を実行し、その発明文書分析処理では、例えば、重要語句の抽出の条件を示す条件情報を含む設定情報を取得し、技術的思想を日本語で表した特許出願用のクレーム又は明細書を記載した文書である発明文書を取得し、その設定情報に基づいてその発明文書を分析する分析処理を行い、分析処理の結果に基づいて生成された情報を出力する出力処理を行い、その分析処理はその条件情報に基づいてその発明文書から重要語句を抽出する抽出処理を含み、その出力処理では、その抽出処理により抽出された複数の重要語句各々に基づいて生成された情報を出力することとしてもよい。 In addition, the invention document analysis system 20 described above executes invention document analysis processing. Acquire an invention document, which is a document describing claims or specifications for a patent application expressed in Japanese, perform analysis processing to analyze the invention document based on the setting information, and generate based on the analysis processing result The analysis process includes an extraction process for extracting important words from the invention document based on the condition information, and the output process includes a plurality of important words extracted by the extraction process. Information generated based on each word may be output.

また、上述した実施の形態で示した構成要素及び機能を任意に組み合わせることで実現される形態も本開示の範囲に含まれる。 Further, the scope of the present disclosure also includes forms realized by arbitrarily combining the components and functions shown in the above-described embodiments.

(変形例グループ1)
本開示における発明文書分析システムは、重要語句の抽出の条件を示す条件情報を含む設定情報を取得する設定情報取得部と、技術的思想を日本語で表した特許出願用のクレーム又は明細書を記載した文書である発明文書を取得する文書取得部と、前記文書取得部により取得された発明文書を、前記設定情報に基づいて分析する分析部と、前記文書取得部により取得された発明文書についての前記分析部による分析結果に基づいて生成された情報を出力する出力部とを含み、前記分析部は、前記文書取得部により取得された発明文書から前記設定情報に基づいて重要語句を抽出する重要語句抽出部を含み、前記出力部は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々に基づいて生成された情報を出力する発明文書分析システムである。
(Modification Group 1)
The invention document analysis system according to the present disclosure includes a setting information acquisition unit that acquires setting information including condition information indicating conditions for extracting key phrases, and claims or specifications for patent applications expressing technical ideas in Japanese. A document acquisition unit that acquires an invention document that is a written document, an analysis unit that analyzes the invention document acquired by the document acquisition unit based on the setting information, and an invention document acquired by the document acquisition unit and an output unit for outputting information generated based on the analysis result by the analysis unit, wherein the analysis unit extracts key phrases based on the setting information from the invention document acquired by the document acquisition unit. An invention document analysis including an important phrase extraction unit, wherein the output unit outputs information generated based on each of a plurality of important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit. System.

ここで、例えば、前記条件情報は、重要語句の候補となる文字列のパターンを表した重要語句候補文字列パターンを示す重要語句候補文字列パターン情報と、先行記載した文字列の参照用に用いられる参照文字列のパターンを表した参照文字列パターンを示す参照文字列パターン情報とを含み、前記重要語句抽出部は、前記文書取得部により取得された発明文書に、前記参照文字列パターンに該当する第1文字列に後続して前記重要語句候補文字列パターンに該当する第2文字列が存在する場合に、当該第2文字列と同一の文字列を重要語句として抽出する第1抽出部と、前記文書取得部により取得された発明文書にクレームが含まれている場合において、当該クレーム中に、前記重要語句候補文字列パターンに該当する第3文字列に後続して句点文字が存在するときには、当該第3文字列と同一の文字列を重要語句として抽出する第2抽出部とを含むこととしてもよい。 Here, for example, the condition information includes key word candidate character string pattern information indicating key word candidate character string patterns representing character string patterns that are key word candidates, and key word candidate character string pattern information used to refer to previously described character strings. and reference character string pattern information indicating a reference character string pattern representing a reference character string pattern, wherein the important phrase extracting unit extracts information corresponding to the reference character string pattern from the invention document acquired by the document acquiring unit. a first extraction unit for extracting a character string identical to the second character string as an important phrase when a second character string corresponding to the important phrase candidate character string pattern exists subsequent to the first character string, , when a claim is included in the invention document acquired by the document acquisition unit, and a period character exists following the third character string corresponding to the important phrase candidate character string pattern in the claim , and a second extraction unit that extracts the same character string as the third character string as an important phrase.

これにより、重要語句抽出部は、例えば、発明文書において語句を参照する表現がある場合に参照される語句を一定条件下で重要語句と扱い、発明文書のクレームにおいて句点文字の直前に記載された語句を一定条件下で重要語句と扱うので、参照する程に注目して記載された語句及びクレームの請求対象を表す語句が重要語句として扱われる可能性がある。通常の発明文書のクレームにおいて請求対象に後続して句点文字が記載される傾向が十分に存在すると想定される。従って、発明文書分析システムが発明文書において重要と推定される重要語句に基づいて、出力部により情報が出力され得るので、その出力される情報は有用であり得る。 As a result, for example, when there is an expression that refers to a word in the invention document, the key word extraction unit treats the referenced word as a key word under certain conditions, and Because words and phrases are treated as key words under certain conditions, words that are written with enough attention to reference and words that describe the claimed subject matter of a claim may be treated as key words. It is assumed that there is a good tendency to have punctuation following the claimed subject matter in the claims of ordinary invention documents. Therefore, information can be output by the output unit based on the key phrases that the invention document analysis system presumes to be important in the invention document, so the output information can be useful.

また、例えば、前記条件情報は、要素名を表す文字列に後続して付記される符号の文字列のパターンを表した符号文字列パターンを示す符号文字列パターン情報と、所定の助詞である文字列のパターンを表した特定助詞文字列パターンを示す特定助詞文字列パターン情報とを含み、前記重要語句候補文字列パターン情報は、少なくとも、先頭文字が漢字である所定の文字列、及び、先頭文字が片仮名である所定の文字列が、当該重要語句候補文字列パターンに該当するように定められており、前記参照文字列パターン情報は、少なくとも、「前記」という文字列が、当該参照文字列パターンに該当するように定められており、前記符号文字列パターン情報は、少なくとも、先頭文字が数字である所定の文字列が、当該符号文字列パターンに該当するように定められており、前記特定助詞文字列パターン情報は、少なくとも、「を」、「に」、「が」、「と」、「から」、「へ」及び「は」のいずれかの文字が、当該特定助詞文字列パターンに該当するように定められており、前記重要語句抽出部は、前記文書取得部により取得された発明文書に、前記重要語句候補文字列パターンに該当する第4文字列に後続して前記符号文字列パターンに該当する第5文字列が存在する場合に、当該第4文字列と同一の文字列を重要語句として抽出する第3抽出部と、前記文書取得部により取得された発明文書に、前記重要語句候補文字列パターンに該当する第6文字列に後続して前記特定助詞文字列パターンに該当する第7文字列が存在する場合に、当該第6文字列と同一の文字列を重要語句として抽出する第4抽出部を含むこととしてもよい。 Further, for example, the condition information includes code string pattern information indicating a code string pattern representing a pattern of a code string appended after a character string representing an element name, and a character string that is a predetermined particle. and specific particle character string pattern information indicating a specific particle character string pattern representing a string pattern, wherein the important phrase candidate character string pattern information includes at least a predetermined character string whose first character is a Chinese character, and the first character. is determined to correspond to the key phrase candidate character string pattern, and the reference character string pattern information is such that at least the character string "said" is the reference character string pattern and the coded character string pattern information is defined so that at least a predetermined character string whose first character is a number corresponds to the coded character string pattern, and the specific particle In the character string pattern information, at least any character of "wo", "ni", "ga", "to", "from", "he" and "wa" corresponds to the specific particle character string pattern. The important phrase extraction unit extracts the code character string pattern following the fourth character string corresponding to the important phrase candidate character string pattern from the invention document acquired by the document acquisition unit. a third extraction unit for extracting a character string identical to the fourth character string as an important phrase when a fifth character string corresponding to When the sixth character string corresponding to the candidate character string pattern is followed by the seventh character string corresponding to the specific particle character string pattern, the character string identical to the sixth character string is extracted as an important phrase. A fourth extractor may be included.

これにより、重要語句抽出部は、例えば、発明文書において所定の助詞に先行する語句(例えば名詞句等)を一定条件下で重要語句と扱い、発明文書において符号が付されて記載された語句を一定条件下で重要語句と扱うので、主語、目的語等の比較的重要な語句及び発明文書に関連する図面中に図示されると推定される要素を表す語句が重要語句として扱われ得る。発明文書が日本語で記述されているので、漢字又は片仮名で始まる語句が重要語句である可能性は十分にある。従って、発明文書分析システムが、発明文書において重要と推定される重要語句に基づいて、出力部により情報が出力され得るので、その出力される情報は有用であり得る。 As a result, the important phrase extraction unit treats, for example, phrases (for example, noun phrases) that precede a predetermined particle in the invention document as important phrases under certain conditions, and the phrases that are marked with a code in the invention document are treated as important phrases. Since they are treated as important words under certain conditions, relatively important words such as subjects and objects and words representing elements presumed to be illustrated in drawings related to the invention document can be treated as important words. Since the invention document is written in Japanese, it is quite possible that words starting with kanji or katakana are key words. Therefore, since the invention document analysis system can output information by the output unit based on key phrases estimated to be important in the invention document, the output information can be useful.

また、例えば、前記出力部は、前記文書取得部により取得された発明文書についての前記分析部による分析結果に基づいて生成された特許出願関連情報を出力し、前記特許出願関連情報は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々について、当該重要語句に、当該重要語句に関連する付加情報を付加した情報を含むこととしてもよい。付加情報の例としては、重要語句に係る強調表示、情報付加表示、表示遷移その他の処理を実行するための表示制御情報、重要語句に対応する対応翻訳語、重要語句の対応翻訳語の候補の集合としての翻訳語候補集合、重要語句の属性情報等が、挙げられる。 Further, for example, the output unit outputs patent application-related information generated based on the analysis result of the analysis unit for the invention document acquired by the document acquisition unit, and the patent application-related information is the document For each of the plurality of key phrases extracted by the key phrase extraction unit from the invention document acquired by the acquisition unit, information obtained by adding additional information related to the key phrase to the key phrase may be included. Examples of additional information include highlighting related to important phrases, display with additional information, display control information for executing display transition and other processing, corresponding translated words corresponding to important phrases, candidates for corresponding translated words for important phrases, etc. Examples include a translation word candidate set as a set, attribute information of key words and phrases, and the like.

これにより、発明文書分析システムにより出力される特許出願関連情報を得ることで翻訳者等は、発明文書の複数の重要語句を把握でき、翻訳者は、発明文書の翻訳のために付加情報に基づいて、重要語句に対応する、重要語句と同じ意味の翻訳先の言語である翻訳語句を、効率的に又は適正に決定することが可能となり得る。 As a result, by obtaining the patent application-related information output by the invention document analysis system, translators, etc., can grasp multiple important words and phrases in the invention document, and the translator can use the additional information to translate the invention document. In this way, it may be possible to efficiently or properly determine a translated phrase corresponding to a key phrase, which is the target language of the same meaning as the key phrase.

また、例えば、前記特許出願関連情報における、前記文書取得部により取得された発明文書から抽出された前記複数の重要語句各々について付加された、当該重要語句に関連する前記付加情報は、当該重要語句の意味を表す翻訳語句である対応翻訳語に関する情報としての翻訳語情報であることとしてもよい。翻訳語句は、例えば、日本語以外の一種類の言語(例えば英語、中国語等)で表された語句である。翻訳語情報は、例えば、対応翻訳語自体を表す情報であってもよいし、対応翻訳語の候補の集合としての翻訳語候補集合を表す情報であってもよい。 Further, for example, in the patent application related information, the additional information related to each of the key words and phrases added to each of the plurality of key words and phrases extracted from the invention document acquired by the document acquisition unit is the key word and phrase It may be translated word information as information on a corresponding translated word, which is a translated word expressing the meaning of . A translated phrase is, for example, a phrase expressed in one kind of language other than Japanese (for example, English, Chinese, etc.). The translation word information may be, for example, information representing the corresponding translation word itself, or information representing a translation word candidate set as a set of candidates for the corresponding translation word.

これにより、発明文書分析システムにより出力される特許出願関連情報に含まれる翻訳語情報を参照することで翻訳者は、重要語句に対応する翻訳語句を効率的に又は適正に決定することが可能となり得る。 As a result, by referring to the translation word information included in the patent application-related information output by the invention document analysis system, the translator can efficiently or appropriately determine translation words corresponding to important words. obtain.

また、例えば、前記分析部は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された重要語句各々について、当該重要語句についての対応翻訳語の候補の集合である翻訳語候補集合を特定するための翻訳語候補集合特定部を含み、前記文書取得部により取得された発明文書の前記重要語句に関連する前記付加情報としての翻訳語情報は、前記翻訳語候補集合特定部により特定された、当該重要語句についての翻訳語候補集合を表す翻訳語候補情報を含むこととしてもよい。 Further, for example, for each of the important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit, the analysis unit obtains a translation word which is a set of corresponding translation word candidates for the relevant important phrase. a translation word candidate set identification unit for identifying a candidate set, wherein the translation word information as the additional information related to the key words of the invention document acquired by the document acquisition unit is obtained by the translation word candidate set identification unit; may include translation word candidate information representing a translation word candidate set for the relevant important phrase specified by .

これにより、発明文書分析システムにより出力される特許出願関連情報に含まれる翻訳語候補情報を参照することで翻訳者は、重要語句に対応する翻訳語候補集合から1つの翻訳語句を選択する等により、重要語句に対応する翻訳語句を効率的に又は適正に決定することが可能となり得る。 As a result, by referring to the translation word candidate information included in the patent application related information output by the invention document analysis system, the translator can select one translation word from the translation word candidate set corresponding to the important word. , it may be possible to efficiently or properly determine translation terms corresponding to key terms.

また、例えば、前記文書取得部は、第1発明文書を含む複数の発明文書を取得し、前記分析部は、前記複数の発明文書各々について、前記重要語句抽出部により複数の重要語句である重要語句群を抽出して、各々抽出した重要語句群間の相関性に基づいて、当該複数の発明文書各々が複数のグループのうちいずれに属するかを特定するためのグループ分類を行う分類部を含み、前記翻訳語候補集合特定部は、前記複数のグループ各々について、当該グループに属する発明文書における日本語の語句と翻訳先の言語の語句とを対応付けた、グループ別の各対訳辞書情報のうちから、前記分類部のグループ分類により前記第1発明文書が属すると特定されたグループの対訳辞書情報を用いて、前記第1発明文書から前記重要語句抽出部により抽出された重要語句各々についての翻訳語候補集合の特定を実行することとしてもよい。 Further, for example, the document acquisition unit acquires a plurality of invention documents including a first invention document, and the analysis unit extracts a plurality of key phrases by the key phrase extraction unit for each of the plurality of invention documents. A classifying unit that extracts word groups and performs group classification for specifying to which of a plurality of groups each of the plurality of invention documents belongs, based on the correlation between the extracted groups of important words and phrases. , the translation word candidate set identifying unit, for each of the plurality of groups, among bilingual dictionary information for each group, which associates Japanese words and phrases in invention documents belonging to the group with words and phrases in a language to be translated, using the bilingual dictionary information of the group to which the first invention document belongs according to the group classification of the classification unit, translation of each of the important phrases extracted from the first invention document by the important phrase extraction unit. Identification of a set of word candidates may also be performed.

これにより、発明文書分析システムにおいて、発明文書に適したグループの対訳辞書情報が用いられるので、重要語句に対して適切な翻訳語候補集合が特定され得る。 As a result, in the invention document analysis system, the bilingual dictionary information of the group suitable for the invention document is used, so that a suitable set of translation word candidates can be specified for the key words.

また、例えば、前記分類部は、複数の技術分野各々について当該技術分野に関することが知られている1つ以上の発明文書各々から前記重要語句抽出部により重要語句群を抽出した結果を利用することで、前記複数の技術分野のうち前記第1発明文書から前記重要語句抽出部により抽出された重要語句群との相関性が予め定められた程度以上であるところのいずれかの技術分野を、前記第1発明文書に対応する第1技術分野として特定する技術分野特定部を含み、前記翻訳語候補集合特定部は、複数の技術分野各々について、当該技術分野における日本語の語句と翻訳先の言語の語句とを対応付けた、技術分野別の各対訳辞書情報のうちから、前記技術分野特定部により特定された前記第1技術分野の対訳辞書情報を用いて、前記第1発明文書から前記重要語句抽出部により抽出された重要語句各々についての翻訳語候補集合の特定を実行することとしてもよい。 Further, for example, the classification unit uses the result of extracting a group of key phrases by the key phrase extraction unit from each of one or more invention documents known to be related to each of a plurality of technical fields. any one of the plurality of technical fields in which the correlation with the group of key words and phrases extracted from the first invention document by the key word extraction unit is equal to or greater than a predetermined degree; A technical field specifying unit for specifying a first technical field corresponding to the first invention document, wherein the translation word candidate set specifying unit specifies, for each of a plurality of technical fields, Japanese words and phrases in the relevant technical field and the translation destination language Using the bilingual dictionary information for the first technical field identified by the technical field identifying unit from among the bilingual dictionary information for each technical field associated with the words of the first invention document, the important A translation word candidate set may be specified for each of the important words extracted by the word extracting unit.

これにより、発明文書分析システムにおいて、発明文書が属する技術分野に対応する対訳辞書情報が用いられるので、重要語句に対して適切な翻訳語候補集合が特定され得る。 As a result, in the invention document analysis system, the bilingual dictionary information corresponding to the technical field to which the invention document belongs is used, so that an appropriate set of translation word candidates can be specified for the key words.

また、例えば、前記特許出願関連情報は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々が、表示されるべき内容として含まれた、表示用文書(例えばHTML文書)として出力され、前記発明文書から抽出された前記重要語句に関連する前記付加情報は、当該重要語句についての前記翻訳語候補集合のうちのいずれかの要素を操作に応じて選択可能にするように、当該翻訳語候補集合をGUI要素として表示するための表示制御情報を含み、前記重要語句に関連する前記付加情報に含まれる前記表示制御情報は、前記GUI要素として表示された状態の、当該重要語句についての前記翻訳語候補集合から、操作に応じて選択された要素を、当該重要語句に対応する対応翻訳語として決定する決定処理を実行するためのスクリプトと、当該決定処理の実行結果として対応翻訳語が決定された各重要語句について当該重要語句と該当の対応翻訳語とを対応付けた情報である翻訳補助情報を生成して出力する処理を実行するためのスクリプトとを含み、前記翻訳語候補集合特定部は、前記文書取得部により取得された、前記第1発明文書以外の1つ以上の発明文書各々について、当該発明文書の前記分析部による分析結果に基づいて生成された前記特許出願関連情報に係る前記表示用文書が前記出力部に出力されて表示のために利用された結果としての、当該1つ以上の発明文書各々における各重要語句について生成された前記翻訳補助情報に基づいて、前記第1発明文書から前記重要語句抽出部により抽出された重要語句各々についての前記翻訳語候補集合の特定を実行することとしてもよい。 Further, for example, the patent application-related information includes, as content to be displayed, each of a plurality of important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit. The additional information related to the important phrase extracted from the invention document, which is output as a document (for example, an HTML document), is obtained by manipulating any element of the translation word candidate set for the relevant important phrase. Display control information for displaying the translation word candidate set as a GUI element so as to be selectable, and the display control information included in the additional information related to the important phrase is displayed as the GUI element. a script for executing a determination process for determining an element selected in accordance with an operation from the translation word candidate set for the relevant important phrase in the state of being a corresponding translated word corresponding to the relevant important phrase; a script for executing a process of generating and outputting translation assistance information, which is information that associates each important phrase whose corresponding translated word is determined as a result of the process with the corresponding translated word; and the translation word candidate set identification unit, for each of the one or more invention documents other than the first invention document acquired by the document acquisition unit, based on the analysis result of the invention document by the analysis unit Generated for each important phrase in each of the one or more invention documents as a result of outputting the display document related to the generated patent application related information to the output unit and using it for display The translation word candidate set may be identified for each of the important phrases extracted by the important phrase extraction unit from the first invention document based on the translation auxiliary information.

これにより、翻訳者は、表示用文書のGUI要素に対する選択の操作により、翻訳語候補集合から重要語句に対応する対応翻訳語を容易に決定することができる。また、翻訳者は、例えば、ブラウザ等による表示用文書の表示内容から、決定された対応翻訳語を、所謂コピー&ペースト、所謂カット&ペースト等により、容易に取得可能となる。なお、コピー&ペースト又はカット&ペーストは、概ね、コピー(つまり複製)又はカット(つまり切り取り)の対象となるデータを選択してそのデータを、他の場所を指定してその場所にペースト(つまり貼り付け)する操作であり、この操作により、コピー又はカットの対象のデータが、OS等の管理下で所定のメモリ領域に保持され、ペーストの操作によりそのデータがその所定のメモリ領域からペースト先として指定された場所に貼り付けられる。また、翻訳者による表示用文書のGUI要素に対する選択の結果が、その後に、翻訳補助情報を介して、発明文書分析システムによる重要語句に対応する翻訳語候補集合の特定についての妥当性を向上させる可能性がある。 As a result, the translator can easily determine the corresponding translation word corresponding to the important word from the translation word candidate set by selecting the GUI element of the document for display. Further, the translator can easily obtain the determined corresponding translation word from the display contents of the display document by a browser or the like by so-called copy & paste, so-called cut & paste, or the like. In addition, copy & paste or cut & paste generally selects data to be copied (i.e. duplicated) or cut (i.e. By this operation, the data to be copied or cut is held in a predetermined memory area under the control of the OS, etc., and by the paste operation, the data is transferred from the predetermined memory area to the paste destination. is pasted at the specified location. In addition, the result of the translator's selection of the GUI elements of the document for display subsequently improves the validity of identifying a translation word candidate set corresponding to the key words by the invention document analysis system via the translation auxiliary information. there is a possibility.

また、例えば、前記特許出願関連情報は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々が、表示されるべき内容として含まれた、表示用文書として出力され、前記発明文書から抽出された重要語句に関連する前記付加情報は、当該重要語句についての前記翻訳語候補集合のうちのいずれかの要素を操作に応じて選択可能にするように、当該翻訳語候補集合をGUI要素として表示するための表示制御情報を含み、前記重要語句に関連する前記付加情報に含まれる前記表示制御情報は、前記GUI要素として表示された状態の、当該重要語句についての前記翻訳語候補集合から、操作に応じて選択された要素を、当該重要語句に対応する対応翻訳語として決定する決定処理を実行するためのスクリプトと、当該決定処理の実行結果として対応翻訳語が決定された各重要語句について当該重要語句と該当の対応翻訳語とを対応付けた情報である翻訳補助情報を生成して出力する処理を実行するためのスクリプトとを含むこととしてもよい。 Further, for example, the patent application-related information includes, as content to be displayed, each of a plurality of important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit. The additional information related to the key words and phrases that are output as a document and are extracted from the invention document make it possible to select any element of the translation word candidate set for the key words and phrases according to an operation. , display control information for displaying the translation word candidate set as a GUI element, and the display control information included in the additional information related to the important phrase is a A script for executing a determination process for determining an element selected according to an operation from the translation word candidate set for the word as a corresponding translated word corresponding to the key word, and correspondence as a result of the execution of the determination process. and a script for executing a process of generating and outputting translation assistance information, which is information in which each key phrase for which a translation word has been determined is associated with the corresponding key phrase and the corresponding translation word. .

これにより、発明文書分析システムにより出力された翻訳補助情報を活用でき、この活用により、その後における発明文書分析システムによる重要語句に対応する翻訳語候補集合の特定についての妥当性を向上させることが、可能となり得る。 As a result, the translation assistance information output by the invention document analysis system can be utilized, and this utilization can improve the validity of subsequent identification of the translation word candidate set corresponding to the important phrase by the invention document analysis system. can be possible.

また、例えば、前記文書取得部は複数の発明文書を取得し、前記出力部は、前記文書取得部により取得された複数の発明文書各々に対して出力された前記表示用文書各々が表示された結果として生成された複数の前記翻訳補助情報各々における、重要語句と、対応する対応翻訳語との組を、重要語句翻訳用の機械学習のための教師データとして用いて、機械学習により生成された学習モデルである重要語句翻訳用学習モデルを出力する学習モデル出力部を含むこととしてもよい。 Further, for example, the document acquisition unit acquires a plurality of invention documents, and the output unit displays each of the display documents output for each of the plurality of invention documents acquired by the document acquisition unit. generated by machine learning using pairs of key phrases and corresponding translation words in each of the plurality of translation auxiliary information generated as a result as training data for machine learning for translation of key phrases A learning model output unit for outputting a learning model for translation of important phrases, which is a learning model, may be included.

これにより、その重要語句翻訳用学習モデルを用いて重要語句を入力とする演算処理により、発明文書における重要語句についての機械翻訳が、実現され得る。この機械翻訳の結果を参照することで、翻訳者は、発明文書における重要語句を翻訳した翻訳語句を効率的に又は適正に決定することが可能となり得る。 As a result, the machine translation of the important phrases in the invention document can be realized by the arithmetic processing of inputting the important phrases using the learning model for the translation of the important phrases. By referring to the results of this machine translation, the translator may be able to efficiently or properly determine the translated words for the important words in the invention document.

また、例えば、前記特許出願関連情報は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々が、表示されるべき内容として含まれた、表示用文書として出力され、前記設定情報は、抽出対象とすべき重要語句を列挙した重要語句設定辞書の特定用情報を含み、前記重要語句設定辞書では、列挙されている重要語句の少なくとも一部に対して対応翻訳語が対応付けられており、前記発明文書分析システムは、前記設定情報に基づいて前記重要語句設定辞書を取得する重要語句設定辞書取得部を含み、前記重要語句抽出部は、前記重要語句設定辞書に列挙されている重要語句が前記文書取得部により取得された発明文書に含まれている場合には、当該発明文書から当該重要語句を抽出し、前記重要語句抽出部が、前記重要語句設定辞書で対応翻訳語が対応付けられている重要語句を、前記文書取得部により取得された発明文書から抽出した場合には、前記特許出願関連情報における、当該発明文書から抽出された当該重要語句に関連する前記付加情報は、当該対応翻訳語を表し、前記重要語句抽出部が、前記重要語句設定辞書で対応翻訳語が対応付けられている重要語句以外の重要語句を前記文書取得部により取得された発明文書から抽出した場合には、前記特許出願関連情報における、当該発明文書から抽出された当該重要語句に関連する前記付加情報は、当該重要語句の翻訳語候補集合のうちのいずれかの要素を操作に応じて選択可能となるように、当該翻訳語候補集合をGUI要素として、表示するための表示制御情報を含み、当該表示制御情報は、前記GUI要素として表示された状態の、当該重要語句の当該翻訳語候補集合から、操作に応じて選択された要素を、当該重要語句に対応する対応翻訳語として決定する決定処理を実行するためのスクリプトと、当該決定処理の実行結果として対応翻訳語が決定された各重要語句について当該重要語句と該当の対応翻訳語とを対応付けた情報を含むように前記重要語句設定辞書を更新する更新処理を実行するためのスクリプトとを含むこととしてもよい。 Further, for example, the patent application-related information includes, as content to be displayed, each of a plurality of important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit. The setting information includes information for specifying an important phrase setting dictionary listing important phrases to be extracted, and in the important phrase setting dictionary, for at least some of the listed important phrases, The invention document analysis system includes an important phrase setting dictionary acquisition unit that acquires the important phrase setting dictionary based on the setting information, and the important phrase extraction unit includes the important phrase extraction unit. When the important phrases listed in the phrase setting dictionary are included in the invention document acquired by the document acquisition unit, the important phrases are extracted from the invention document, and the important phrase extraction unit extracts the important phrases When an important phrase associated with a corresponding translated word in the phrase setting dictionary is extracted from the invention document acquired by the document acquisition unit, the important phrase extracted from the invention document in the patent application related information The additional information related to the phrase represents the corresponding translated word, and the important phrase extracting unit extracts important phrases other than the important phrases associated with the corresponding translated word in the important phrase setting dictionary from the document acquisition unit. When extracted from the acquired invention document, the additional information related to the key phrase extracted from the invention document in the patent application related information is any of a translation word candidate set of the key phrase display control information for displaying the translation word candidate set as a GUI element so that the element of can be selected according to the operation, and the display control information is displayed as the GUI element, A script for executing a determination process for determining an element selected in accordance with an operation from the translation word candidate set for the key word as a corresponding translation word corresponding to the key word, and a result of the determination process and a script for executing update processing for updating the important phrase setting dictionary so as to include information in which each important phrase for which a corresponding translated word has been determined is associated with the relevant translated word and the corresponding translated word. may be

これにより、例えば、発明文書を作成した発明者等又は弁理士は、特定の語句を重要語句として定めておきたい場合、重要語句についての対応翻訳語を定めておきたい場合等に、重要語句設定辞書を生成しておくことで、発明文書分析システムにより、適切な特許出願関連情報が出力されるようになり得る。このため、翻訳者は、その特許出願関連情報を参考にして発明文書の翻訳を、効率的に又は適正に行うことが可能となり得る。また、翻訳者が、重要語句について対応翻訳語を定めている場合等において重要語句設定辞書を生成しておくことで、発明者等又は弁理士から提供された発明文書を、発明文書分析システムで分析させた場合に、適切な特許出願関連情報が出力されるようになり得る。 As a result, for example, when an inventor, etc. or a patent attorney who created an invention document wants to define specific words as key words, or when he wants to define corresponding translations for key words, he or she can set key words and phrases. By generating a dictionary in advance, the invention document analysis system can output appropriate patent application related information. Therefore, the translator may be able to translate the invention document efficiently or properly by referring to the patent application-related information. In addition, by creating a key phrase setting dictionary in cases such as when the translator has defined corresponding translation words for key phrases, invention documents provided by inventors or patent attorneys can be processed by the invention document analysis system. Appropriate patent application-related information can be output when analyzed.

また、例えば、前記文書取得部は、第1発明文書と、当該第1発明文書以外の複数の発明文書とを取得し、前記文書取得部は更に、取得した前記複数の発明文書各々について、当該発明文書の翻訳結果である翻訳結果文書を取得し、前記分析部は、前記第1発明文書及び前記複数の発明文書各々について、前記重要語句抽出部により複数の重要語句である重要語句群を抽出して、各々抽出した重要語句群間の相関性に基づいて、前記第1発明文書及び前記複数の発明文書各々が複数のグループのうちいずれに属するかを特定するためのグループ分類を行う分類部を含み、前記翻訳語候補集合特定部は、前記分類部のグループ分類により前記第1発明文書が属すると特定されたグループに属する前記複数の発明文書と、対応する前記翻訳結果文書とから抽出した、重要語句と、当該重要語句に対応する対応翻訳語との複数組を、重要語句翻訳用の機械学習のための教師データとして用いて機械学習により生成された学習モデルである重要語句翻訳用学習モデルを利用する機械翻訳により、前記第1発明文書から前記重要語句抽出部により抽出された重要語句各々についての翻訳語候補集合の要素を、特定することとしてもよい。 Further, for example, the document acquisition unit acquires a first invention document and a plurality of invention documents other than the first invention document, and the document acquisition unit further acquires each of the acquired plurality of invention documents. Obtaining a translation result document, which is a translation result of an invention document, the analysis unit extracts a group of key phrases, which are a plurality of key phrases, by the key phrase extraction unit for each of the first invention document and the plurality of invention documents. Then, based on the correlation between the groups of important words and phrases extracted from each group, the classifying unit performs group classification for specifying to which of a plurality of groups the first invention document and each of the plurality of invention documents belong. and the translation word candidate set identification unit extracts from the plurality of invention documents belonging to the group identified by the group classification of the classification unit to which the first invention document belongs and the corresponding translation result documents , Key phrase translation learning, which is a learning model generated by machine learning using multiple pairs of key phrases and corresponding translation words corresponding to the key phrases as training data for machine learning for key phrase translation. The machine translation using the model may specify the elements of the translation word candidate set for each key phrase extracted by the key phrase extraction unit from the first invention document.

これにより、発明文書分析システムでは翻訳語候補集合の特定が適切になされ得る。 As a result, the invention document analysis system can appropriately identify a translation word candidate set.

また、例えば、前記特許出願関連情報は、表示用文書として出力され、前記文書取得部により取得された発明文書にクレームが含まれている場合には、前記特許出願関連情報は、前記表示用文書において表示されるべき前記クレームの内容を表すクレーム情報を含み、前記文書取得部により取得された発明文書のクレームの内容を表す前記クレーム情報は、当該発明文書から前記重要語句抽出部により抽出された当該クレーム中の複数の重要語句各々についての当該重要語句に関連する前記付加情報として、当該重要語句の表示態様を制御するための表示制御情報を含むこととしてもよい。 Further, for example, the patent application-related information is output as a document for display, and when claims are included in the invention document acquired by the document acquisition unit, the patent application-related information is output as the document for display. and the claim information representing the content of the claim of the invention document acquired by the document acquisition unit is extracted from the invention document by the key phrase extraction unit. Display control information for controlling the display mode of the key phrase may be included as the additional information related to the key phrase for each of the multiple key phrases in the claim.

これにより、例えば、翻訳者等は、ブラウザ等により表示された表示用文書に係る特許出願関連情報のクレーム情報において表示態様が制御された重要語句を識別することが可能となり得る。 As a result, for example, a translator or the like may be able to identify important words and phrases whose display mode is controlled in the claim information of the patent application related information related to the document for display displayed by the browser or the like.

また、例えば、前記文書取得部により取得された発明文書のクレームの内容を表す前記クレーム情報が含む、前記重要語句抽出部により抽出された当該クレーム中の複数の重要語句各々についての当該重要語句に関連する前記付加情報としての前記表示制御情報は更に、当該重要語句についての重要度、属性情報、対応翻訳語、若しくは、翻訳語候補集合、又は、当該重要語句の検索結果、を表示する情報付加表示のための情報と、当該重要語句を、操作に応じて当該重要語句に係る当該情報付加表示を実行するためのGUI要素として表示するための情報とを含むこととしてもよい。重要語句の検索は、例えば、その発明文書内の検索であっても、別の発明文書内の検索であっても、インターネット等のネットワーク上の検索サイト等における検索であってもよい。 Further, for example, for each of a plurality of key words in the claim extracted by the key word extracting part, the claim information representing the content of the claim of the invention document acquired by the document acquiring part contains The display control information as the related additional information is further added with information for displaying the degree of importance, attribute information, a corresponding translation word or a set of translation word candidates, or the search result of the relevant important phrase for the relevant important phrase. Information for display and information for displaying the key phrase as a GUI element for executing the information-added display related to the key phrase according to an operation may be included. The key phrase search may be, for example, a search within the invention document, a search within another invention document, or a search at a search site or the like on a network such as the Internet.

これにより、ブラウザ等により表示された表示用文書に係る特許出願関連情報におけるクレーム情報を閲覧した翻訳者等は、表示された重要語句に対する操作により、重要度、属性情報、検索結果等の情報を知得することが可能となり得るので、発明文書における重要語句について効率的に又は適正に理解することが可能となり得る。このため、翻訳者は、重要語句に対する翻訳語句を効率的に又は適正に決定することが可能となり得る。 As a result, translators, etc., who view claim information in the patent application-related information related to display documents displayed on a browser, etc., can access information such as importance, attribute information, search results, etc. by operating the displayed key words. As such, it may be possible to efficiently or properly understand key terms in an invention document. This may allow the translator to efficiently or properly determine translation terms for key terms.

また、例えば、前記表示用文書は、HTML(Hypertext Markup Language)で記載されたHTMLファイルを含むHTML文書であり、前記文書取得部により取得された発明文書に明細書が含まれている場合には、前記特許出願関連情報は、前記表示用文書において表示されるべき前記明細書の内容を表す明細書情報を含み、前記文書取得部により取得された発明文書の明細書の内容を表す前記明細書情報は、当該発明文書から前記重要語句抽出部により抽出された当該明細書中の複数の重要語句各々についての当該重要語句に関連する前記付加情報として、当該重要語句の表示態様を制御する表示制御情報を含み、前記クレーム情報及び前記明細書情報における、前記重要語句抽出部により抽出された複数の重要語句各々についての、当該重要語句の表示態様を制御するための前記表示制御情報は、当該表示制御情報に対応する当該重要語句の表示態様を、前記クレーム情報及び前記明細書情報における前記複数の重要語句以外の語句の表示態様と相違させるための強調表示情報を含み、前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句各々に対応する、表示態様を制御するための前記表示制御情報各々は、当該複数の重要語句各々を互いに相違する表示態様で表示するように制御するための、互いに相違する識別情報を含み、前記明細書情報における、前記重要語句抽出部により抽出された複数の重要語句各々についての、当該重要語句の表示態様を制御するための前記表示制御情報は、当該重要語句が、前記クレーム情報における、前記重要語句抽出部により抽出された前記クレーム中の複数の重要語句のいずれかと同一であれば、当該重要語句を、前記クレーム情報における当該同一の重要語句と同様の表示態様で表示させ、当該重要語句が、前記クレーム情報における、前記重要語句抽出部により抽出された前記クレーム中の前記複数の重要語句のいずれとも相違すれば、当該重要語句を、前記クレーム情報における当該複数の重要語句のいずれとも相違する表示態様で表示させるように制御する情報を含むこととしてもよい。 Further, for example, when the display document is an HTML document including an HTML file written in HTML (Hypertext Markup Language), and a specification is included in the invention document acquired by the document acquisition unit, , the patent application related information includes specification information representing the content of the specification to be displayed in the display document, and the specification representing the content of the specification of the invention document acquired by the document acquisition unit; The information is, as the additional information related to each of the key words in the specification extracted by the key word extracting unit from the invention document, display control for controlling the display mode of the key words. The display control information for controlling the display mode of each of the plurality of important phrases extracted by the important phrase extraction unit in the claim information and the specification information, including information, is the display including highlighting information for making the display mode of the key phrase corresponding to the control information different from the display mode of words and phrases other than the plurality of key phrases in the claim information and the specification information; Each of the display control information for controlling the display mode corresponding to each of a plurality of key words and phrases having different character strings constituting the words is arranged to display each of the plurality of key words and phrases in different display modes. the display control for controlling the display mode of each of the plurality of key phrases extracted by the key phrase extracting unit in the specification information, including identification information different from each other, for controlling If the relevant important phrase is the same as any of the multiple important phrases in the claim extracted by the important phrase extraction unit in the claim information, the information is such that if the relevant important phrase is the same as the same Displayed in the same display mode as the key phrase, and if the key phrase is different from any of the plurality of key phrases in the claim extracted by the key phrase extraction unit in the claim information, the key phrase is displayed. , and information for controlling to display in a display mode different from any of the plurality of important phrases in the complaint information.

これにより、HTMLに対応しているブラウザを搭載したPC、スマートフォンその他のコンピュータを用いて、翻訳者等はHTML文書である表示用文書としての特許出願関連情報を閲覧できる。ブラウザ等により表示された表示用文書としての特許出願関連情報を閲覧した翻訳者等は、特許出願関連情報中の明細書情報において記載された各重要語句が、クレームに記載されている重要語句か否かを識別することが可能となり、複数の重要語句が同一か相違するかを、各重要語句の表示態様により、迅速に把握することが可能となり得る。なお、発明文書分析システムにおいて、重要語句の表示態様の制御として、例えば強調表示(例えば太字で表示する等)がなされたとすれば、翻訳者等は、クレーム情報における重要語句の迅速な把握が可能となり得る。 As a result, a translator or the like can browse the patent application-related information as a display document, which is an HTML document, using a PC, smartphone, or other computer equipped with an HTML-compatible browser. Translators, etc., who have viewed the patent application-related information as a display document displayed by a browser, etc., may find that each key phrase described in the specification information in the patent application-related information is the key phrase described in the claim. It is possible to identify whether a plurality of important phrases are the same or different, and it may be possible to quickly grasp whether a plurality of important phrases are the same or different, depending on the display mode of each of the important phrases. In addition, in the invention document analysis system, if, for example, highlighting (for example, displaying in bold) is performed as a control of the display mode of the important words, the translator, etc. can quickly grasp the important words in the claim information. can be.

また、例えば、前記文書取得部により取得された発明文書のクレームの内容を表す前記クレーム情報は、前記表示用文書において表示されるべき当該クレームの内容に加えて、当該クレームの内容における前記重要語句抽出部により抽出された複数の重要語句各々について、当該クレームの内容における当該重要語句の部分を、当該重要語句に対応する対応翻訳語又は翻訳語候補集合に、置換した内容を含み、前記発明文書の明細書の内容を表す前記明細書情報は、前記表示用文書において表示されるべき明細書の内容に加えて、当該明細書の内容における前記重要語句抽出部により抽出された複数の重要語句各々について、当該明細書の内容における当該重要語句の部分を、当該重要語句に対応する対応翻訳語又は翻訳語候補集合に、置換した内容を含むこととしてもよい。 Further, for example, the claim information representing the content of the claim of the invention document acquired by the document acquisition unit may include the key phrases in the content of the claim in addition to the content of the claim to be displayed in the document for display. For each of the plurality of key words extracted by the extracting unit, the invention document includes content in which the part of the key word in the content of the claim is replaced with a corresponding translated word or a set of candidate translation words corresponding to the key word. The specification information representing the content of the specification includes, in addition to the content of the specification to be displayed in the display document, each of a plurality of key phrases extracted by the key phrase extraction unit in the content of the specification. , the part of the relevant key phrase in the content of the specification may be included in the corresponding translation word or translation word candidate set corresponding to the relevant key phrase.

これにより、翻訳者は、クレーム情報及び明細書情報における重要語句を対応翻訳語又は翻訳語候補集合に置換した内容の部分について編集することで、効率的に、発明文書の翻訳を行うことが可能となり得る。 As a result, the translator can efficiently translate the invention document by editing the part where the important words in the claim information and specification information are replaced with the corresponding translated words or a set of candidate translated words. can be.

また、例えば、前記文書取得部は更に、当該文書取得部により取得された発明文書に対応する図面文書を取得し、前記文書取得部により取得された発明文書についての分析結果に基づいて生成された前記特許出願関連情報の前記クレーム情報又は前記明細書情報における、前記重要語句抽出部により当該発明文書から抽出された複数の重要語句のうち、当該発明文書において符号が付加されて記載された要素名を表す語句と同一の重要語句について、当該重要語句に関連する前記付加情報としての前記表示制御情報は、当該重要語句を、操作に応じて、当該発明文書に対応する前記図面文書中の当該重要語句に係る当該符号が記載された部分を表示するためのGUI要素として表示するための情報を含むこととしてもよい。 Further, for example, the document acquisition unit further acquires a drawing document corresponding to the invention document acquired by the document acquisition unit, and a drawing document generated based on the analysis result of the invention document acquired by the document acquisition unit An element name described with a code added in the invention document, among a plurality of key phrases extracted from the invention document by the key phrase extraction unit, in the claim information or the specification information of the patent application related information , the display control information as the additional information related to the important phrase is to display the important phrase in the drawing document corresponding to the invention document according to the operation. It may include information for displaying as a GUI element for displaying the part in which the code related to the word is described.

これにより、ブラウザ等により表示された表示用文書に係る特許出願関連情報を閲覧した翻訳者等は、クレーム情報又は明細書情報中に表示された重要語句のGUI要素の操作により、図面文書中の、その重要語句が表す要素に対応する部分を表示させて確認することができるようになり、その重要語句の理解を効率的又は適正に行うことが可能となり得る。 As a result, translators, etc., who have browsed the patent application-related information related to the display document displayed by a browser, etc., can operate the GUI elements of the key words displayed in the claim information or the specification information, and , the part corresponding to the element represented by the important phrase can be displayed and confirmed, and the important phrase can be understood efficiently or properly.

また、例えば、前記出力部による前記特許出願関連情報の前記出力は、当該特許出願関連情報の表示により行われ、前記文書取得部により取得された発明文書にクレームが含まれている場合には、前記特許出願関連情報は、当該クレームの内容を表すクレーム情報を含み、前記文書取得部により取得された発明文書のクレームの内容を表す前記クレーム情報が含む、前記重要語句抽出部により抽出された当該クレーム中の複数の重要語句各々についての当該重要語句に関連する前記付加情報は、当該重要語句に付加される色を示し、前記文書取得部により取得された発明文書に明細書が含まれている場合には、前記特許出願関連情報は、当該明細書の内容を表す明細書情報を含み、前記文書取得部により取得された発明文書の明細書の内容を表す前記明細書情報が含む、前記重要語句抽出部により抽出された当該明細書中の複数の重要語句各々についての当該重要語句に関連する前記付加情報は、当該重要語句に付加される色を示し、前記出力部は、前記クレーム情報及び前記明細書情報における前記重要語句抽出部により抽出された複数の重要語句の表示態様を、前記複数の重要語句以外の語句の表示態様と相違させて表示し、前記出力部は、前記クレーム情報における、前記重要語句抽出部により抽出された、重要語句を構成する文字列が互いに相違する複数の重要語句各々を、互いに相違する色を付加して、表示し、前記出力部は、前記明細書情報における前記重要語句抽出部により抽出された複数の重要語句各々について、当該重要語句が、前記クレーム情報における前記重要語句抽出部により抽出された複数の重要語句のいずれかと同一であれば、前記明細書情報における当該重要語句を、前記クレーム情報における当該同一の重要語句と同一の表示色を付加して表示し、前記明細書情報における当該重要語句が、前記クレーム情報における前記重要語句抽出部により抽出された前記複数の重要語句のいずれとも相違すれば、前記明細書情報における当該重要語句を、前記クレーム情報における当該複数の重要語句のいずれとも相違する表示態様で表示し、前記出力部は、前記クレーム情報における前記重要語句抽出部により抽出された複数の重要語句各々について、当該重要語句を、操作に応じて当該重要語句に係る情報付加表示を実行するためのGUI要素として表示し、重要語句に係る前記情報付加表示は、当該重要語句についての重要度、属性情報、対応翻訳語、若しくは、翻訳語候補集合、又は、当該重要語句の検索結果、を表示することであることとしてもよい。重要語句への色の付加は、例えば、重要語句への文字色の付加、重要語句への文字背景色の付加、重要語句を囲む矩形枠の全辺又はいずれか一辺である、色付きの線幅を有する境界線の付加等である。 Further, for example, the output of the patent application-related information by the output unit is performed by displaying the patent application-related information, and when the invention document acquired by the document acquisition unit contains a claim, The patent application related information includes claim information representing the content of the claim, and the claim information representing the content of the claim of the invention document acquired by the document acquisition unit contains the relevant information extracted by the key phrase extraction unit. For each of the plurality of key words in the claim, the additional information related to the key word indicates a color to be added to the key word, and the specification is included in the invention document acquired by the document acquisition unit. In the case, the patent application related information includes specification information representing the content of the specification, and the specification information representing the content of the specification of the invention document acquired by the document acquisition unit includes the important The additional information related to each of the key phrases in the specification extracted by the phrase extraction unit indicates the color added to the key phrase, and the output unit extracts the claim information and The display mode of the plurality of key phrases extracted by the key phrase extraction unit in the description information is displayed in a manner different from the display mode of the phrases other than the plurality of key phrases, and the output unit displays a plurality of key phrases extracted by the key phrase extracting unit and having different character strings constituting the key phrases are displayed in different colors, and the output unit outputs the specification information; for each of the plurality of key phrases extracted by the key phrase extraction unit in the above, if the key phrase is the same as any of the plurality of key phrases extracted by the key phrase extraction unit in the claim information, the specification The key phrase in the information is displayed in the same display color as the same key phrase in the claim information, and the key phrase in the specification information is extracted by the important phrase extraction unit in the claim information. If it is different from any of the plurality of key phrases, the key phrase in the description information is displayed in a display mode different from any of the plurality of key phrases in the claim information, and the output unit displays the claim For each of the plurality of key phrases extracted by the key phrase extraction unit in the information, the key phrase is displayed as a GUI element for executing information addition display related to the key phrase in response to an operation, The information-added display may be to display the degree of importance, attribute information, corresponding translated words, a set of translated word candidates, or search results for the important words/phrases. Addition of color to important phrases includes, for example, addition of character color to important phrases, addition of character background color to important phrases, all sides or any one side of a rectangular frame surrounding the important phrases, colored line width , and the like.

これにより、ブラウザ等により表示された表示用文書としての特許出願関連情報を閲覧した翻訳者等は、特許出願関連情報で示された各重要語句が、クレームに記載されている重要語句か否かを識別することが可能となり、複数の重要語句が同一か相違するかを、各重要語句に付加された色により、迅速に把握することが可能となり得る。 As a result, translators, etc., who view the patent application-related information as a document for display displayed by a browser, etc., can determine whether or not each key phrase indicated in the patent application-related information is the key phrase described in the claim. can be identified, and whether a plurality of key words are the same or different can be quickly grasped by the color added to each key word.

また、例えば、前記発明文書分析システムは、翻訳対象となる発明文書が満たすべき複数の条件を定めた翻訳用発明文書標準規定を取得する翻訳用発明文書標準規定取得部を含み、前記分析部は、前記文書取得部により取得された発明文書が前記翻訳用発明文書標準規定で定められた前記複数の条件のうちの少なくとも一部の各条件を満たすか否かについての判定を行い、当該判定の結果に基づいて、当該発明文書における、不適切な可能性がある部分を指摘するための警告情報を生成し、前記発明文書についての前記分析部による分析結果に基づいて生成された前記特許出願関連情報は、前記警告情報を含むこととしてもよい。 Further, for example, the invention document analysis system includes an invention document standard specification acquisition unit for acquiring an invention document standard specification for translation that defines a plurality of conditions to be satisfied by an invention document to be translated, and the analysis unit , determining whether or not the invention document acquired by the document acquisition unit satisfies at least part of each of the plurality of conditions defined in the invention document standard specification for translation; Based on the results, warning information is generated for pointing out potentially inappropriate parts in the invention document, and the patent application-related generated based on the analysis results of the invention document by the analysis unit The information may include the warning information.

これにより、発明文書分析システムにより出力された特許出願関連情報を参考にすることにより、発明文書を作成した発明者等又は弁理士は、必要であれば発明文書の修正を行い得る。また、翻訳者は、例えば、発明者等又は弁理士から、翻訳対象となる発明文書及び特許出願関連情報の提供を受けることにより、特許出願関連情報中の警告情報での指摘が残っていてもその指摘は特に対処の必要がないと発明者等又は弁理士が判断した結果であると推定できるので、翻訳対象となる適切な発明文書を取得することができ、この結果として、発明文書の翻訳を効率的に又は適正に行うことが可能となり得る。 Accordingly, by referring to the patent application-related information output by the invention document analysis system, the inventor or the like or the patent attorney who prepared the invention document can correct the invention document if necessary. In addition, the translator, for example, receives invention documents to be translated and patent application-related information from the inventors, etc. or patent attorneys, so that even if the warning information in the patent application-related information remains pointed out, Since it can be presumed that the inventor, etc. or the patent attorney determined that there is no particular need to deal with the indication, it is possible to obtain an appropriate invention document to be translated, and as a result, the translation of the invention document can be done efficiently or properly.

また、例えば、前記発明文書についての分析結果に基づいて生成された前記特許出願関連情報における前記警告情報は、当該発明文書の、前記翻訳用発明文書標準規定への適合性を示す発明文書評価情報を含むこととしてもよい。適合性は、例えば、適合性の評価の結果としての評価値等で表される。 Further, for example, the warning information in the patent application-related information generated based on the analysis result of the invention document is invention document evaluation information indicating conformity of the invention document to the invention document standards for translation. may be included. Suitability is represented, for example, by an evaluation value or the like as a result of suitability evaluation.

これにより、発明文書分析システムにより出力された特許出願関連情報に含まれる発明文書評価情報を参考にすることで、発明者等又は弁理士は、その発明文書を適切に修正できる可能性がある。また、翻訳者は、発明文書評価情報を確認することで、翻訳対象として適切な発明文書であるか否かを認識することが可能となり得る。不適切な記載を含む発明文書は、例えば、翻訳ミスを招き易く、翻訳者が適切な権利取得(例えば特許権の取得)のために発明文書を修正した上で翻訳するような事態も生じ得る。従って、発明文書に基づいて生成された特許出願関連情報における警告情報に、翻訳用発明文書標準規定への適合性が比較的低いことを示す発明文書評価情報が含まれていた場合には、その発明文書は、その発明文書に基づいて翻訳された結果である翻訳結果文書との間で、言語が異なる以外に内容の齟齬がある可能性が十分にあり得ると判断でき、例えば、機械翻訳に用いる翻訳用学習モデルの生成のために、その発明文書と翻訳結果文書との組とを機械学習用の教師データとして用いることが有用ではないとの判断等が、可能となり得る。 Accordingly, by referring to the invention document evaluation information included in the patent application related information output by the invention document analysis system, the inventor or patent attorney may be able to appropriately correct the invention document. Further, by checking the invention document evaluation information, the translator can recognize whether or not the invention document is suitable for translation. Invention documents that include inappropriate descriptions, for example, are likely to cause translation errors, and it is possible that a translator may revise and translate the invention document in order to obtain appropriate rights (for example, to obtain patent rights). . Therefore, if the warning information in the patent application-related information generated based on the invention document includes invention document evaluation information indicating relatively low conformity with the standard provisions for invention documents for translation, It can be judged that there is a high possibility that there may be discrepancies in content between the invention document and the translation result document, which is the result of translation based on the invention document, other than the language being different. It may be possible to determine that it is not useful to use the combination of the invention document and the translation result document as teacher data for machine learning in order to generate the translation learning model to be used.

また、例えば、前記翻訳用発明文書標準規定は、翻訳対象となる発明文書が満たすべき条件を定める情報として、当該条件を満たさない不適切な可能性がある記載部分についての文字列のパターンを表した不適切文字列パターンを示す不適切文字列パターン情報と、当該記載部分の修正方法に関する修正情報とを対応付けて含み、前記分析部による前記翻訳用発明文書標準規定で定められた条件を満たすか否かについての前記判定は、前記不適切文字列パターン情報が示す前記不適切文字列パターンに該当する文字列が存在するか否かにより行われ、前記翻訳用発明文書標準規定で定められた条件に係る前記不適切文字列パターン情報が示す前記不適切文字列パターンに該当する文字列が、前記文書取得部により取得された発明文書におけるクレーム中に存在した場合には、前記特許出願関連情報は、当該クレームと、当該不適切文字列パターン情報に対応付けられた前記修正情報とに基づいて、当該条件を満たすように当該クレームを修正することで生成される修正版クレーム情報を含み、前記翻訳用発明文書標準規定で定められた条件に係る前記不適切文字列パターン情報が示す前記不適切文字列パターンに該当する文字列が、前記文書取得部により取得された発明文書における明細書中に存在した場合には、前記特許出願関連情報は、当該明細書と、当該不適切文字列パターン情報に対応付けられた前記修正情報とに基づいて、当該条件を満たすように当該明細書を修正することで生成される修正版明細書情報を含むこととしてもよい。 In addition, for example, the Standard Provisions of Invention Documents for Translation represent, as information that defines conditions to be satisfied by invention documents to be translated, patterns of character strings for possibly inappropriate description parts that do not satisfy the conditions. Inappropriate character string pattern information indicating the inappropriate character string pattern obtained by the analysis unit is associated with correction information regarding a method of correcting the description part, and satisfies the conditions stipulated by the standard specification of the invention document for translation by the analysis unit. The determination as to whether or not is carried out based on whether or not there is a character string corresponding to the inappropriate character string pattern indicated by the inappropriate character string pattern information, and is defined in the Standard Provisions for Invention Documents for Translation If a character string corresponding to the inappropriate character string pattern indicated by the inappropriate character string pattern information related to the condition exists in a claim in the invention document acquired by the document acquisition unit, the patent application related information includes modified claim information generated by modifying the claim so as to satisfy the conditions based on the claim and the modification information associated with the inappropriate character string pattern information, A character string corresponding to the inappropriate character string pattern indicated by the inappropriate character string pattern information related to the conditions stipulated in the Standard Provisions of Invention Documents for Translation is included in the specification of the invention document acquired by the document acquisition unit. If it exists, the patent application related information corrects the specification to satisfy the condition based on the specification and the correction information associated with the inappropriate character string pattern information. It may include the modified version specification information generated by.

これにより、発明文書を作成した発明者等又は弁理士は、発明文書分析システムにより出力される特許出願関連情報に含まれる修正版クレーム情報及び修正版明細書情報を参照することにより、効率的に発明文書を修正できる可能性がある。また、翻訳者は、修正版クレーム情報及び修正版明細書情報を参照することで修正された発明文書を提供されることで、その発明文書を効率的に又は適正に翻訳し得る。また、発明者等又は弁理士から発明文書及び特許出願関連情報の提供を受けて更に修正版クレーム情報及び修正版明細書情報に基づいて翻訳をすべき旨の指示を受けた翻訳者は、特許出願関連情報に含まれる修正版クレーム情報及び修正版明細書情報を参照して翻訳作業を効率的又は適正に行うことが可能となり得る。 As a result, inventors, etc. or patent attorneys who have created invention documents can efficiently It may be possible to modify the invention document. In addition, the translator can efficiently or properly translate the invention document by being provided with the invention document as amended by referring to the amended claim information and the amended specification information. In addition, a translator who receives an invention document and patent application-related information from an inventor, etc. or a patent attorney and is further instructed to translate based on the amended claim information and amended specification information may It may be possible to perform the translation work efficiently or properly by referring to the revised claim information and revised specification information included in the application-related information.

また、例えば、前記文書取得部により取得された発明文書にクレームが含まれている場合において、当該クレームの所定の一項が、複数の項を引用しているときには、当該発明文書の分析結果に基づいて生成される前記特許出願関連情報は、当該所定の一項を、当該複数の項のうちの項番が最先の1つの項のみを引用するように変更した内容を含むように、当該クレームを修正した結果を表す修正版クレーム情報と、前記修正版クレーム情報が表すクレームの各項の引用関係を、相互に引用関係のある項同士の項番間を線又は記号を用いて対応付けた表現で、表した情報としての修正版クレームツリーとを含むこととしてもよい。 In addition, for example, in the case where the invention document acquired by the document acquisition unit contains a claim, if a predetermined clause of the claim cites multiple clauses, the analysis result of the invention document The patent application-related information generated based on the Amended claim information representing the result of amending a claim and the citation relationship between each claim clause represented by the amended claim information are mapped using lines or symbols between the clause numbers of mutually quoting clauses. The representation may include the modified claim tree as the information presented.

これにより、発明者等又は弁理士から特許出願関連情報の提供を受け、発明文書のクレーム部分については修正版クレーム情報に基づいて翻訳すべき旨を伝達された翻訳者は、発明文書における複数項を引用する項を修正するか否か、修正するとしたらどのように修正すべきか等について迷うことなく、効率的に、翻訳を行うことが可能となり得る。また、翻訳者等は、修正版クレームツリーにより、修正版クレーム情報に表されたクレームの各項の引用関係を迅速に把握し得る。 As a result, translators who have received patent application-related information from inventors, etc. or patent attorneys and have been informed that the claims of the invention document should be translated based on the modified version of the claim information can It is possible to translate efficiently without hesitation about whether or not to correct the paragraphs quoting , and if so, how to correct them. In addition, the translator or the like can quickly grasp the citation relationship of each item of the claims represented in the modified claim information from the modified claim tree.

また、例えば、前記特許出願関連情報は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々の間の関係を示す重要語句関係情報を含み、前記重要語句関係情報は、複数の重要語句各々が表す要素相互間における構成上の包含関係を示す包含関係情報を含むこととしてもよい。 Further, for example, the patent application related information includes important phrase relation information indicating the relationship between each of a plurality of important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit, The important phrase relationship information may include inclusion relationship information indicating structural inclusion relationships between elements represented by each of a plurality of important phrases.

これにより、発明文書分析システムにより出力された特許出願関連情報を取得した翻訳者は、特許出願関連情報中の重要語句関係情報により発明文書における複数の重要語句間の関係を比較的迅速に把握可能となり、その関係の把握により各重要語句に対応する翻訳語句を効率的に又は適正に決定できる可能性があり、その結果として、発明文書を効率的に又は適正に翻訳することが可能となり得る。 As a result, translators who have obtained the patent application-related information output by the invention document analysis system can relatively quickly grasp the relationships between multiple key words in the invention document based on the key word relationship information in the patent application-related information. By grasping the relationship, it may be possible to efficiently or properly determine translation words corresponding to each key word, and as a result, it may be possible to translate the invention document efficiently or properly.

また、例えば、前記文書取得部は、複数の発明文書と、当該複数の発明文書各々の翻訳結果である、複数の翻訳結果文書とを取得し、前記分析部は、前記複数の発明文書各々について、前記重要語句抽出部により複数の重要語句である重要語句群を抽出して、各々抽出した重要語句群間の相関性に基づいて、当該複数の発明文書各々が複数のグループのうちいずれに属するかを特定するためのグループ分類を行う分類部を含み、前記発明文書分析システムは、当該複数のグループの各々毎に、前記複数の発明文書のうち当該グループに分類された各発明文書についての、当該発明文書と当該発明文書の翻訳結果である翻訳結果文書との各組を教師データとした機械学習により、機械翻訳のための学習モデルである翻訳用学習モデルを生成する機械学習部を含むこととしてもよい。 Further, for example, the document acquisition unit acquires a plurality of invention documents and a plurality of translation result documents that are translation results of each of the plurality of invention documents, and the analysis unit acquires each of the plurality of invention documents a group of key words and phrases, which are a plurality of key words and phrases, are extracted by the key word extraction unit, and based on the correlation between the groups of key words and phrases extracted, each of the plurality of invention documents belongs to which group among the plurality of groups The invention document analysis system includes, for each of the plurality of groups, for each invention document classified into the group among the plurality of invention documents, Including a machine learning unit that generates a learning model for translation, which is a learning model for machine translation, by machine learning using each set of the invention document and the translation result document that is the translation result of the invention document as training data may be

これにより、例えば機械翻訳システム、発明文書分析システム等において、グループ毎の翻訳用学習モデルのうち、発明文書が属するグループに適合した翻訳用学習モデルを利用した演算処理により、発明文書を機械翻訳することが可能となる。 As a result, for example, in a machine translation system, an invention document analysis system, etc., the invention document is machine-translated by arithmetic processing using the translation learning model suitable for the group to which the invention document belongs among the translation learning models for each group. becomes possible.

また、例えば、前記文書取得部は、複数の発明文書と、当該複数の発明文書各々の翻訳結果である、複数の翻訳結果文書とを取得し、前記発明文書分析システムは、翻訳対象となる発明文書が満たすべき複数の条件を定めた翻訳用発明文書標準規定を取得する翻訳用発明文書標準規定取得部と、前記文書取得部により取得された前記複数の発明文書各々について、当該発明文書が前記翻訳用発明文書標準規定で定められた前記複数の条件のうちの少なくとも一部の各条件を満たすか否かについての判定を行い、当該複数の発明文書のうち、当該判定がなされた前記条件を満たす程度が予め定めた所定程度を超えるところの発明文書を選出する文書評価部と、前記文書評価部により選出された発明文書と、当該発明文書に対応する翻訳結果文書との組を教師データとして用いた機械学習により、機械翻訳のための学習モデルである翻訳用学習モデルを生成する機械学習部とを含み、前記出力部は、前記機械学習部により生成された前記翻訳用学習モデルを出力する学習モデル出力部を含むこととしてもよい。 Further, for example, the document acquisition unit acquires a plurality of invention documents and a plurality of translation result documents that are translation results of each of the plurality of invention documents, and the invention document analysis system acquires the invention to be translated. An acquisition unit for acquiring invention document standard specifications for translation that defines a plurality of conditions to be satisfied by a document; A judgment is made as to whether or not at least some of the conditions among the plurality of conditions stipulated in the Standard Provisions for Invention Documents for Translation are satisfied, and among the plurality of invention documents, the conditions for which the judgment is made are selected. A set of a document evaluation unit that selects an invention document whose degree of satisfaction exceeds a predetermined degree, an invention document selected by the document evaluation unit, and a translation result document corresponding to the invention document is used as teacher data. a machine learning unit that generates a translation learning model, which is a learning model for machine translation, by using machine learning, and the output unit outputs the translation learning model generated by the machine learning unit It is good also as including a learning model output part.

これにより、不適切な記載を含む発明文書と、その発明文書に基づいて生成された翻訳ミス等によりその発明文書と内容に齟齬のある翻訳結果文書との組が教師データに用いられにくくなり、発明文書分析システムから、適切な翻訳用学習モデルが出力されるようになり得る。このため、例えば機械翻訳システム等において、発明文書分析システムから出力された適切な翻訳用学習モデルを利用した演算処理により発明文書を機械翻訳することが可能となる。この発明文書の機械翻訳の結果を参照することで、翻訳者は、発明文書を効率的に又は適正に翻訳することが可能となり得る。 As a result, it becomes difficult to use a combination of an invention document containing inappropriate descriptions and a translation result document whose content is inconsistent with the invention document due to a translation error or the like generated based on the invention document as training data. An appropriate learning model for translation can be output from the invention document analysis system. Therefore, for example, in a machine translation system or the like, it is possible to machine-translate an invention document by arithmetic processing using an appropriate learning model for translation output from the invention document analysis system. By referring to the result of machine translation of the invention document, the translator may be able to translate the invention document efficiently or properly.

また、例えば、前記発明文書分析システムは、翻訳対象となる発明文書が満たすべき複数の条件を定めた翻訳用発明文書標準規定を取得する翻訳用発明文書標準規定取得部を含み、前記翻訳用発明文書標準規定は、翻訳対象となる発明文書が満たすべき条件を定める情報として、当該条件を満たさない不適切な可能性がある記載部分についての文字列のパターンを表した不適切文字列パターンを示す不適切文字列パターン情報と、当該記載部分の修正方法に関する修正情報とを対応付けて含み、前記発明文書分析システムは、前記文書取得部により取得された発明文書中に、前記翻訳用発明文書標準規定で定められた条件に係る前記不適切文字列パターン情報が示す前記不適切文字列パターンに該当する文字列が存在した場合には、当該発明文書の内容と、当該不適切文字列パターン情報に対応付けられた前記修正情報とに基づいて、当該条件を満たすように当該発明文書の内容を修正することで生成される修正版発明文書と、当該発明文書に対応する翻訳結果文書との組を教師データとして用いた機械学習により、機械翻訳のための学習モデルである翻訳用学習モデルを生成する機械学習部を含み、前記出力部は、前記機械学習部により生成された前記翻訳用学習モデルを出力する学習モデル出力部を含むこととしてもよい。 Further, for example, the invention document analysis system includes an invention document standard specification acquisition unit for acquiring an invention document standard specification for translation that defines a plurality of conditions to be satisfied by an invention document to be translated, Document standard provisions indicate inappropriate character string patterns representing the character string patterns of potentially inappropriate descriptions that do not satisfy the conditions as information that defines the conditions that the invention document to be translated should satisfy. Inappropriate character string pattern information and correction information relating to a method of correcting the description portion are associated with each other, and the invention document analysis system adds the invention document standard for translation to the invention document acquired by the document acquisition unit. If there is a character string corresponding to the inappropriate character string pattern indicated by the inappropriate character string pattern information related to the conditions stipulated by the regulations, the contents of the invention document and the inappropriate character string pattern information A set of a modified version of the invention document generated by modifying the contents of the invention document so as to satisfy the conditions based on the associated correction information and the translation result document corresponding to the invention document A machine learning unit that generates a translation learning model, which is a learning model for machine translation, by machine learning used as teacher data, and the output unit outputs the translation learning model generated by the machine learning unit. It is good also as including the learning model output part which outputs.

これにより、機械学習用の教師データとして用いられる修正版発明文書と翻訳結果文書とは、相互の内容の齟齬が低減されたものとなる可能性があるので、発明文書分析システムから適切な翻訳用学習モデルが出力される可能性がある。このため、例えば機械翻訳システム等において、発明文書分析システムから出力された適切な翻訳用学習モデルを利用した演算処理により発明文書を機械翻訳することが可能となる。この発明文書の機械翻訳の結果を参照することで、翻訳者は、発明文書を効率的に又は適正に翻訳することが可能となり得る。 As a result, there is a possibility that the modified invention document and the translation result document used as training data for machine learning will have reduced discrepancies in their contents, so the invention document analysis system can A learning model may be output. Therefore, for example, in a machine translation system or the like, it is possible to machine-translate an invention document by arithmetic processing using an appropriate learning model for translation output from the invention document analysis system. By referring to the result of machine translation of the invention document, the translator may be able to translate the invention document efficiently or properly.

また、例えば、前記分析部は、機械翻訳を実行する翻訳部を含み、複数の発明文書各々について、当該発明文書から前記重要語句抽出部と同様の方式で複数の重要語句である重要語句群を抽出して、各々抽出した重要語句群間の相関性に基づいて、当該複数の発明文書各々が複数のグループのうちいずれに属するかを特定するためのグループ分類が行われ、当該複数のグループの各々毎に、当該複数の発明文書のうち当該グループに分類された各発明文書についての当該発明文書と当該発明文書の翻訳結果である翻訳結果文書との各組を教師データとした機械学習により、機械翻訳のための学習モデルである翻訳用学習モデルが生成されている状態において、前記文書取得部は所定の発明文書を取得し、前記翻訳部は、前記所定の発明文書から前記重要語句抽出部により抽出された複数の重要語句である重要語句群に基づいて当該所定の発明文書が前記複数のグループのうちいずれに属するかが特定された結果に応じて、当該所定の発明文書が属するグループに対応する前記翻訳用学習モデルを利用して、当該所定の発明文書の少なくとも一部の機械翻訳を実行し、前記出力部は、前記所定の発明文書についての前記分析部による分析結果に基づいて生成された、前記翻訳部による前記機械翻訳の結果を含む、特許出願関連情報を出力することとしてもよい。 Further, for example, the analysis unit includes a translation unit that executes machine translation, and for each of the plurality of invention documents, extracts a group of key phrases, which are a plurality of key phrases, from the invention documents in the same manner as the key phrase extraction unit. Based on the correlation between the groups of important phrases extracted and extracted, group classification is performed to specify which of the plurality of groups each of the plurality of invention documents belongs to, and the group classification is performed. For each of the plurality of invention documents, by machine learning using each set of the invention document and the translation result document that is the translation result of the invention document for each invention document classified into the group as teacher data, In a state where a learning model for translation, which is a learning model for machine translation, is generated, the document acquisition unit acquires a predetermined invention document, and the translation unit extracts the important phrase from the predetermined invention document. Based on the group of important phrases, which are a plurality of important phrases extracted by Machine translation of at least part of the predetermined invention document is performed using the corresponding learning model for translation, and the output unit is generated based on the analysis result of the predetermined invention document by the analysis unit. It is also possible to output patent application related information including the result of the machine translation by the translation unit.

これにより、発明文書分析システムにより出力された特許出願関連情報における所定の発明文書の少なくとも一部の機械翻訳の結果を参照することで、翻訳者は、発明文書を効率的に又は適正に翻訳することが可能となり得る。 As a result, the translator can efficiently or properly translate the invention document by referring to the result of machine translation of at least part of the predetermined invention document in the patent application related information output by the invention document analysis system. can be possible.

(変形例グループ2)
本開示における発明文書分析システムは、技術的思想を日本語で表した、特許出願用のクレームの記載を含む文書である発明文書を、分析する発明文書分析システムであって、重要語句の抽出の条件を示す条件情報を含む設定情報を取得する設定情報取得部と、発明文書を取得する文書取得部と、前記文書取得部により取得された発明文書を、前記設定情報に基づいて分析する分析部と、前記文書取得部により取得された発明文書についての前記分析部による分析結果に基づいて生成された情報を出力する出力部とを含み、前記分析部は、前記文書取得部により取得された発明文書から前記設定情報に基づいて重要語句を抽出する重要語句抽出部を含み、前記出力部は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々に基づいて生成された情報を出力する発明文書分析システムである。
(Modification Group 2)
An invention document analysis system according to the present disclosure is a system for analyzing an invention document, which is a document containing a description of a claim for a patent application in which a technical idea is expressed in Japanese. A setting information acquisition unit that acquires setting information including condition information indicating a condition, a document acquisition unit that acquires an invention document, and an analysis unit that analyzes the invention document acquired by the document acquisition unit based on the setting information. and an output unit configured to output information generated based on the result of analysis by the analysis unit of the invention document acquired by the document acquisition unit, wherein the analysis unit outputs the invention acquired by the document acquisition unit. an important phrase extraction unit for extracting important phrases from a document based on the setting information, wherein the output unit extracts each of the plurality of important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit. It is an invention document analysis system that outputs information generated based on.

これにより、発明文書分析システムは、例えば発明者等又は弁理士により作成されたクレームを含む発明文書を分析した結果に基づく情報を出力する。例えば、発明者等又は弁理士は、その出力された情報を参照することにより、発明文書をより適切なものへと完成させることを効率的に実現できる可能性があり得る。より適切なものへと完成された発明文書は、発明文書を翻訳する翻訳者にとって、適切に又は効率的に翻訳するために有用である。 As a result, the invention document analysis system outputs information based on the results of analysis of invention documents including claims prepared by the inventors or patent attorneys, for example. For example, the inventors or patent attorneys may be able to efficiently complete the invention documents more appropriately by referring to the output information. An invention document that has been completed to be more appropriate is useful for a translator who translates the invention document in order to translate it appropriately or efficiently.

また、例えば、前記条件情報は、重要語句の候補となる文字列のパターンを表した重要語句候補文字列パターンを示す重要語句候補文字列パターン情報と、先行記載した文字列の参照用に用いられる参照文字列のパターンを表した参照文字列パターンを示す参照文字列パターン情報と、所定の助詞である文字列のパターンを表した特定助詞文字列パターンを示す特定助詞文字列パターン情報とを含み、前記重要語句候補文字列パターン情報は、少なくとも、先頭文字が漢字である所定の文字列、及び、先頭文字が片仮名である所定の文字列が、当該重要語句候補文字列パターンに該当するように定められており、前記参照文字列パターン情報は、少なくとも、「前記」という文字列が、当該参照文字列パターンに該当するように定められており、前記特定助詞文字列パターン情報は、少なくとも、「を」、「に」、「が」、「と」、「から」、「へ」及び「は」のいずれかの文字が、当該特定助詞文字列パターンに該当するように定められており、前記重要語句抽出部は、前記文書取得部により取得された発明文書に、前記参照文字列パターンに該当する第1文字列に後続して前記重要語句候補文字列パターンに該当する第2文字列が存在する場合に、当該第2文字列と同一の文字列を重要語句として抽出し、前記文書取得部により取得された発明文書のクレーム中に、前記重要語句候補文字列パターンに該当する第3文字列に後続して句点文字が存在するときには、当該第3文字列と同一の文字列を重要語句として抽出し、前記文書取得部により取得された発明文書に、前記重要語句候補文字列パターンに該当する文字列である重要語句候補文字列に後続して前記特定助詞文字列パターンに該当する文字列である特定助詞文字列が存在する場合に、当該重要語句候補文字列と同一の文字列を重要語句として抽出し、前記重要語句抽出部は重要語句の前記抽出においては、前記重要語句候補文字列パターンに複数の文字列が該当していた場合において当該複数の文字列のうちの一の文字列が他の文字列に発明文書の記載上包含されていたときには、当該複数の文字列のうち当該一の文字列を除外した残余の文字列を選択対象として重要語句を選択して抽出し、前記分析部は、前記文書取得部により取得された発明文書のクレームから前記重要語句抽出部により抽出された各重要語句に基づいて、未完成の明細書の内容を表すクレームベース明細書情報を生成し、前記出力部は、前記文書取得部により取得された発明文書についての前記分析部による分析結果に基づいて生成された特許出願関連情報を出力し、前記特許出願関連情報は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々が、表示されるべき内容として含まれた、表示用文書として出力され、前記特許出願関連情報は、前記表示用文書において表示されるべき、前記文書取得部により取得された発明文書のクレームの内容を表すクレーム情報と、前記クレームベース明細書情報とを含み、前記文書取得部により取得された発明文書のクレームの内容を表す前記クレーム情報は、当該発明文書から前記重要語句抽出部により抽出された当該クレーム中の複数の重要語句各々について、当該重要語句の表示態様を制御するための表示制御情報を含み、前記クレーム情報における、前記重要語句抽出部により抽出された複数の重要語句各々についての、当該重要語句の表示態様を制御するための前記表示制御情報は、当該表示制御情報に対応する当該重要語句の表示態様を、前記クレーム情報における当該複数の重要語句以外の語句の表示態様と相違させるための強調表示情報を含み、前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句各々に対応する、表示態様を制御するための前記表示制御情報各々は、当該複数の重要語句各々を互いに相違する表示態様で表示するように制御するための、互いに相違する識別情報を含むこととしてもよい。 In addition, for example, the condition information is used for reference to important phrase candidate character string pattern information indicating an important phrase candidate character string pattern representing a character string pattern that is a candidate for an important phrase, and for reference to previously described character strings. including reference character string pattern information indicating a reference character string pattern representing a reference character string pattern and specific particle character string pattern information indicating a specific particle character string pattern indicating a character string pattern that is a predetermined particle, The key phrase candidate character string pattern information is defined so that at least a predetermined character string whose first character is Kanji and a predetermined character string whose first character is Katakana correspond to the important phrase candidate character string pattern. The reference character string pattern information is defined so that at least the character string "above" corresponds to the reference character string pattern, and the specific particle character string pattern information is at least "to , "ni", "ga", "to", "kara", "he" and "wa" are determined to correspond to the specific particle character string pattern, and the important The word/phrase extraction unit detects that the invention document acquired by the document acquisition unit has a second character string corresponding to the important word candidate character string pattern following the first character string corresponding to the reference character string pattern. In this case, a character string identical to the second character string is extracted as an important phrase, and a third character string corresponding to the important phrase candidate character string pattern is included in the claim of the invention document acquired by the document acquisition unit. If a period character is subsequently present, the same character string as the third character string is extracted as an important phrase, and characters corresponding to the important phrase candidate character string pattern are added to the invention document acquired by the document acquisition unit. If there is a specific particle character string that is a character string that corresponds to the specific particle character string pattern following an important phrase candidate character string that is a string, the same character string as the important phrase candidate character string is used as an important phrase. In the extraction of important phrases, the important phrase extraction unit extracts, in the case where a plurality of character strings correspond to the important phrase candidate character string pattern, one of the plurality of character strings is included in the description of the invention document, the remaining character string excluding the one character string from among the plurality of character strings is selected and extracted as an important phrase, and the analysis unit generates claim-based specification information representing the content of an incomplete specification based on each key phrase extracted by the key phrase extraction unit from the claims of the invention document acquired by the document acquisition unit; The output unit outputs patent application related information generated based on the analysis result of the analysis unit for the invention document acquired by the document acquisition unit, and the patent application related information is acquired by the document acquisition unit. each of the plurality of key phrases extracted from the invention document by the key phrase extracting unit is output as a display document containing content to be displayed, and the patent application related information is displayed in the display document. and the claim base specification information, which represents the content of the claims of the invention document acquired by the document acquisition unit. The claim information includes display control information for controlling the display mode of each of a plurality of key phrases in the claim extracted by the key phrase extraction unit from the invention document, and , for each of the plurality of key phrases extracted by the key phrase extracting unit, the display control information for controlling the display mode of the key phrase corresponds to the display mode of the key phrase corresponding to the display control information, including highlighting information for differentiating the display mode of words other than the plurality of key words in the complaint information, wherein the character strings constituting the key words in the claim information correspond to each of the plurality of key words different from each other Each of the display control information for controlling the display mode may include different identification information for controlling the plurality of important phrases to be displayed in different display modes.

これにより、特許出願関連情報を閲覧した発明者等又は弁理士は、クレーム情報における、発明文書のクレームから抽出された互いに文字列の異なる重要語句同士を迅速に識別可能であるので、クレーム内容を効率的に確認でき、クレームから抽出された重要語句に基づいて生成されたクレームベース明細書情報を参照することで、効率的に、発明文書の明細書を生成又は更新できる可能性があり得る。 As a result, inventors, etc. or patent attorneys who browse patent application-related information can quickly identify key words with different character strings extracted from the claims of the invention documents in the claim information. By referring to the claim-based specification information that can be efficiently confirmed and that is generated based on the key words extracted from the claims, there is a possibility that the specification of the invention document can be efficiently generated or updated.

また、例えば、前記分析部は、生成する前記クレームベース明細書情報に、日本国の特許出願の明細書の見出しと同様の見出しを含ませ、前記分析部は、前記発明文書のクレームにおける各項のうち全ての請求対象起点項を抽出し、当該抽出した各請求対象起点項の請求対象を表す重要語句を特定し、当該特定した重要語句に同一の複数の重要語句が含まれる場合には当該複数の重要語句のうち1つの重要語句以外を除去した結果として残る、相互に異なる請求対象を表す重要語句の集合から、当該集合の要素を所定の順に列挙して予め定められた所定の形式で配置した文字列を、当該クレームベース明細書情報における「発明の名称」の見出しに後続する発明名称文字列として決定し、前記請求対象起点項は、他の項を引用していない項、又は、他の項を引用しているが引用先の項とは請求対象が異なる項であり、前記分析部は、前記全ての請求対象起点項各々についての請求対象を表す重要語句に基づいて定めた、相互に異なる請求対象を表す重要語句の前記集合を用いて、当該集合における各重要語句と当該各重要語句に対応して特定した記載支援用未完成メッセージとを予め定められた形式で連結した1つ又は複数の文を生成し、当該生成した文を、前記クレームベース明細書情報における「発明が解決しようとする課題」の見出しに後続する記載内容として決定し、前記記載支援用未完成メッセージは、未完成記載部分であることを示す、未完成部分開始記号と未完成部分終了記号とで挟んだ文字列を含み、前記分析部は、前記全ての請求対象起点項各々の項番と、前記全ての請求対象起点項各々についての請求対象を表す重要語句に基づいて定めた、相互に異なる請求対象を表す重要語句の前記集合における各重要語句と当該各重要語句に対応して特定した記載支援用未完成メッセージとを予め定められた形式で連結した1つ又は複数の文を生成し、当該生成した文を、前記クレームベース明細書情報における「課題を解決するための手段」の見出しに後続する記載内容として決定し、前記分析部は、前記発明文書のクレームの各項についての項番と、当該項の請求対象を表す重要語句と、記載支援用未完成メッセージとに基づいて、前記クレームベース明細書情報における「発明を実施するための形態」の見出しに後続する記載内容の一部を決定し、前記分析部は、前記発明文書のクレームから前記重要語句抽出部により抽出された複数の重要語句各々についての、当該重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係、当該重要語句が表す要素の記録内容、又は、当該重要語句が表す要素の実現内容に基づいて定められた、当該重要語句を説明するための記載支援用未完成メッセージに基づいて、前記クレームベース明細書情報における「発明を実施するための形態」の見出しに後続する記載内容の一部を決定し、前記分析部は、前記発明文書のクレームから前記重要語句抽出部により抽出された複数の重要語句各々について、当該重要語句が表す要素が、他の重要語句が表す要素を構成上包含するか、又は、他の重要語句が表す要素に構成上包含されるときには、当該重要語句及び当該他の重要語句の構成上の包含関係に基づいて当該重要語句に対して符号を決定する符号決定処理を行い、前記クレームベース明細書情報における「発明を実施するための形態」の見出しに後続する記載内容の少なくとも一部に含まれる重要語句のうち、当該符号決定処理において重要語句に対して符号が決定されている重要語句については、当該重要語句の直後に決定されている当該符号を挿入することとしてもよい。 Also, for example, the analysis unit causes the claim-based specification information to be generated to include a heading similar to the heading of the specification of the Japanese patent application, and the analysis unit adds each item in the claim of the invention document extract all of the claimable originating claims, identify the key words and phrases representing the claimable object of each of the extracted claimable originating claims, and if the identified key words and phrases contain the same multiple key words and phrases, From a set of key phrases representing mutually different claimable objects remaining as a result of removing all but one key phrase out of a plurality of key phrases, the elements of the set are listed in a predetermined order and in a predetermined format The arranged character string is determined as the invention title character string following the heading of "title of the invention" in the claim-based specification information, and the claimed originating claim is a claim that does not cite other claims, or Claims that quote other claims but differ in claimed subject matter from the cited claim, and the analysis unit determines, based on key phrases representing the claimed subject matter for each of said all claimed subject-originating claims, Using the set of key words and phrases representing mutually different billing objects, each key word and phrase in the set and the incomplete message for description support specified corresponding to each of the key words and phrases are linked in a predetermined format (1). Generate one or more sentences, determine the generated sentences as description contents following the heading "Problem to be Solved by the Invention" in the claim-based specification information, and the incomplete message for description support is , including a character string sandwiched between an unfinished portion start symbol and an unfinished portion end symbol, indicating that it is an incomplete description portion, and the analysis unit includes the item number of each of the claim object originating claims, and the Each key phrase in the set of key words representing mutually different claimed subjects, which is determined based on the key words representing the claimed subject matter for each of all claimable originating claims, and description support identified corresponding to each of the key words. Generate one or more sentences concatenated with the incomplete message for use in a predetermined format, and follow the generated sentences after the heading "Means for Solving the Problem" in the claim-based specification information and the analysis unit determines the claim based on the claim number of each claim of the invention document, the key words representing the claim object of the claim, and the incomplete message for supporting description Determining a part of the description content following the heading of "Mode for Carrying out the Invention" in the base specification information, For each key phrase, the compositional inclusion relationship between the element indicated by the key phrase and the element indicated by other key phrases, the recorded content of the element indicated by the key phrase, or the actual content of the element indicated by the key phrase Based on the incomplete message for description support to explain the key phrase defined based on and the analysis unit determines, for each of a plurality of key phrases extracted by the key phrase extraction unit from the claim of the invention document, whether the element represented by the key phrase includes the element represented by another key phrase or, when it is structurally included in an element represented by another key phrase, sign determination that determines the sign for the key phrase based on the structural inclusion relationship between the key phrase and the other key phrase processing, and among the important words and phrases included in at least a part of the description content following the heading of "Mode for Carrying out the Invention" in the claim-based specification information, the key words and phrases are signed in the code determination process is determined, the determined code may be inserted immediately after the key phrase.

これにより、発明者等又は弁理士は、クレームベース明細書情報における記載支援用未完成メッセージを修正(例えば未完成部分開始記号と未完成部分終了記号とで挟まれた文字列の部分等を修正)することで、効率的に、発明文書の明細書を適切に生成又は更新できる可能性がある。 As a result, the inventors, etc. or the patent attorney can correct the incomplete message for description support in the claim-based specification information (for example, correct the part of the character string sandwiched between the incomplete part start symbol and the incomplete part end symbol). ), it may be possible to efficiently and appropriately generate or update the specification of the invention document.

また、例えば、重要語句に対して符号を決定する前記符号決定処理で、他の重要語句が表す要素を構成上包含する要素を表す当該重要語句に対して符号を決定する場合においては、当該重要語句が表す要素が構成上包含する、他の重要語句が表す要素の数に応じて当該符号を決定することとしてもよい。 Further, for example, in the sign determination process for determining the sign for the important phrase, in the case of determining the sign for the important phrase representing an element that structurally includes an element represented by another important phrase, the important phrase The code may be determined according to the number of elements represented by other important words and phrases that are structurally included in the elements represented by the words.

これにより、符号決定処理により、例えば、他の重要語句が表す要素をn個(nは自然数)包含する要素を表す重要語句についての符号を、n個を表すために必要なk桁(kは自然数)の桁数分のゼロ「0」を末尾に付加した数等として決定されることが可能となり得る。例えばnが10以上99以下であればkは2となり、他の重要語句が表す要素をn個(nは自然数)包含する要素を表す重要語句についての符号は、2桁のゼロを末尾に付加した数等、例えば「500」等と、決定され得る。そして例えば符号「500」が付加された重要語句が表す要素に包含される要素を表す各重要語句についての符号は、例えば「501」、「502」、…、「510」、…、「599」等と決定され得る。このため、各重要語句が表す要素間の包含関係を一見して認識し易いように、各重要語句の符号が決定され得る。 As a result, the code determination process allows, for example, the sign of an important phrase representing an element containing n (n is a natural number) elements expressed by other important phrases to be k digits (where k is (Natural number) can be determined as a number with zeros "0" added to the end of the number of digits. For example, if n is 10 or more and 99 or less, k becomes 2, and the code for key phrases that contain n elements (n is a natural number) that other key phrases represent has two digits of zero added to the end. number, such as "500", for example. For example, the code for each important phrase representing an element included in the element represented by the important phrase to which the code "500" is added is, for example, "501", "502", ..., "510", ..., "599". and so on. Therefore, the sign of each key phrase can be determined so that the inclusion relationship between the elements represented by each key phrase can be easily recognized at a glance.

また、例えば、前記分析部は、前記表示用文書における前記クレームベース明細書情報に含まれる重要語句の表示要素に、当該表示要素の表示態様を制御するための表示制御情報を付加し、当該表示制御情報は、当該重要語句の当該表示要素を、当該表示要素の操作に応じて、前記表示用文書における前記クレーム情報中の当該重要語句を含む記載部分を表示するためのグラフィカルユーザインタフェース(GUI)として機能させるためのものであり、前記分析部は、前記表示用文書における前記クレームベース明細書情報に含まれる少なくとも1つの記載支援用未完成メッセージが複数の選択肢を列挙したメッセージである場合において、当該記載支援用未完成メッセージの表示要素に、当該表示要素の表示態様を制御するための表示制御情報を付加し、当該表示制御情報は、当該記載支援用未完成メッセージの当該表示要素を、当該記載支援用未完成メッセージの前記複数の選択肢の選択操作を可能にするためのGUIとして機能させ、前記複数の選択肢のうちのいずれかの選択肢の選択操作がなされた場合に、当該表示要素の表示内容としての当該記載支援用未完成メッセージを、選択操作がなされた当該選択肢に適した別の予め定められた記載支援用未完成メッセージへと変更するためのものであることとしてもよい。 Further, for example, the analysis unit adds display control information for controlling a display mode of the display element to the display element of the important phrase included in the claim-based specification information in the display document, and The control information is a graphical user interface (GUI) for displaying the relevant display elements of the relevant important phrases, and the description part containing the relevant important phrases in the claim information in the display document in accordance with the operation of the relevant display elements. and the analysis unit, when at least one description support incomplete message included in the claim-based specification information in the display document is a message listing a plurality of options, Display control information for controlling the display mode of the display element is added to the display element of the incomplete message for supporting description, and the display control information controls the display element of the incomplete message for supporting description. Functioning as a GUI for enabling the selection operation of the plurality of options of the incomplete description support message, and displaying the display element when the selection operation of any one of the plurality of options is performed It may be for changing the incomplete message for description support as the content to another predetermined incomplete message for description support suitable for the option for which the selection operation has been performed.

これにより、表示用文書としての特許出願関連情報におけるクレームベース明細書情報を閲覧した発明者等又は弁理士は、クレームベース明細書情報中の記載支援用未完成メッセージに含まれる複数の選択肢のうち、明細書に記載したい事項に関連する1つの選択肢の選択操作を行うことで、その記載支援用未完成メッセージが変更された結果の、その選択操作した選択肢に適した、別の記載支援用未完成メッセージを閲覧することができる。このため、発明者等又は弁理士は、例えば、その選択操作後に表示されているクレームベース明細書情報を活用して(例えばテキストエディタ等にそのクレームベース明細書情報をコピー&ペーストして適宜修正する等により)、効率的に、発明文書の明細書を適切に生成又は更新できる可能性がある。 As a result, inventors or patent attorneys who have viewed the claim-based specification information in the patent application-related information as a display document can , by performing a selection operation of one option related to the matter to be described in the specification, another description support unfinished message suitable for the selected option as a result of changing the description support unfinished message Completion messages can be viewed. For this reason, the inventors, etc. or the patent attorney, for example, utilize the claim-based specification information displayed after the selection operation (for example, copy and paste the claim-based specification information to a text editor, etc., and modify it as appropriate). etc.), it may be possible to efficiently and appropriately generate or update the specification of the invention document.

また、例えば、前記分析部は、前記文書取得部により取得された発明文書のクレームに基づいてクレームベース図面情報を生成し、前記特許出願関連情報は、前記表示用文書において表示されるべき、前記クレームベース図面情報を含み、前記クレームベース図面情報は、1つ以上の各図面の図面番号と、各図面に記載されるべき重要語句と、重要語句間の関連性と、重要語句に符号が対応する場合には符号を示す情報を含み、前記分析部は、前記文書取得部により取得された発明文書のクレームから前記重要語句抽出部により抽出された複数の重要語句が表す要素間に構成上の包含関係がある場合に当該包含関係に基づいて、被包含側の要素を表す重要語句を囲み、当該重要語句に対応する符号を引出線で結んだ枠線の外側に、包含側の要素を表す重要語句を配置して当該包含側の重要語句と当該被包含側の要素に係る枠線とを取り囲み、当該包含側の重要語句に対して前記符号決定処理において決定された符号を引出線で結んだ枠線とを描いた構成図を、前記クレームベース図面情報における図面として生成し、前記分析部は、前記表示用文書における前記クレームベース明細書情報に含まれる符号の表示要素に、当該表示要素の表示態様を制御するための表示制御情報を付加し、当該表示制御情報は、符号の当該表示要素を、当該表示要素の操作に応じて、前記表示用文書における前記クレームベース図面情報における当該符号と同一の符号を含む部分を表示するためのGUIとして機能させるためのものであり、前記クレームベース明細書情報に含まれる当該符号の表示要素に係る当該表示制御情報は、当該符号の操作に応じて当該符号を引数として起動され、当該引数の符号を含む前記クレームベース図面情報中の部分を符号の検索により特定するスクリプトの関数名又は関数自体を定義するものであることとしてもよい。
これにより、発明文書のクレームから抽出された重要語句間の包含関係に基づいて、図面を含むクレームベース図面情報が生成されるので、発明者等又は弁理士は、クレームベース図面情報を参照することで、効率的に適切な図面を生成できる可能性がある。また、発明者等又は弁理士は、表示用文書としての特許出願関連情報のクレームベース明細書情報に含まれる符号に係るGUIに対して操作することで、その符号が記載されたクレームベース図面情報中の部分を迅速に確認することができるので、クレームベース明細書情報等を活用して、効率的に発明文書の明細書を適切に生成又は更新することが可能になり得る。
Further, for example, the analysis unit generates claim-based drawing information based on the claims of the invention document acquired by the document acquisition unit, and the patent application related information is displayed in the display document. Claim-based drawing information is included, and the claim-based drawing information includes one or more drawing numbers of each drawing, important phrases to be described in each drawing, relationships between the important phrases, and codes corresponding to the important phrases. and the analysis unit extracts from the claim of the invention document acquired by the document acquisition unit, the key phrase extraction unit extracts structurally between the elements represented by the key phrases. If there is an inclusion relationship, based on the inclusion relationship, the inclusion side element is displayed outside the frame line that encloses the key phrase that represents the included element and connects the code corresponding to the key phrase with a leader line. The important words and phrases are arranged to enclose the important words and phrases on the including side and the frame lines related to the elements on the included side, and the codes determined in the code determination process are connected to the important words and phrases on the including side with a leader line. A configuration diagram depicting a frame line is generated as a drawing in the claim-based drawing information, and the analysis unit adds the display element to the display element of the code included in the claim-based specification information in the display document Display control information for controlling the display mode of is added, and the display control information changes the display element of the code according to the operation of the display element, the code in the claim-based drawing information in the display document The display control information related to the display element of the code included in the claim-based specification information is to function as a GUI for displaying the part containing the same code as may define the function name or the function itself of a script that is started with the code as an argument and specifies the part in the claim-based drawing information that includes the code of the argument by searching the code.
As a result, claim-based drawing information including drawings is generated based on the inclusion relationship between important terms extracted from the claims of the invention document. , it is possible to efficiently generate appropriate drawings. In addition, the inventors, etc. or the patent attorney operate the GUI related to the code included in the claim-based specification information of the patent application-related information as a display document, and the claim-based drawing information in which the code is described. Since it is possible to quickly check the contents, it may be possible to appropriately generate or update the specification of the invention document efficiently by utilizing claim-based specification information and the like.

(変形例グループ3)
本開示における発明文書分析システムは、技術的思想を日本語で表した、特許出願用のクレーム又は明細書を記載した文書である発明文書を、分析する発明文書分析システムであって、重要語句の抽出の条件を示す条件情報を含む設定情報を取得する設定情報取得部と、発明文書を取得する文書取得部と、前記文書取得部により取得された発明文書を、前記設定情報に基づいて分析する分析部と、前記文書取得部により取得された発明文書についての前記分析部による分析結果に基づいて生成された情報を出力する出力部とを含み、前記分析部は、前記文書取得部により取得された発明文書から前記設定情報に基づいて重要語句を抽出する重要語句抽出部を含み、前記出力部は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々に基づいて生成された情報を出力する発明文書分析システムである。
(Modification Group 3)
The invention document analysis system in the present disclosure is an invention document analysis system that analyzes an invention document that is a document describing a claim or a specification for a patent application in which a technical idea is expressed in Japanese, A setting information acquiring unit for acquiring setting information including condition information indicating extraction conditions, a document acquiring unit for acquiring an invention document, and an invention document acquired by the document acquiring unit is analyzed based on the setting information. and an output unit configured to output information generated based on an analysis result of the invention document acquired by the document acquisition unit, wherein the analysis unit outputs information acquired by the document acquisition unit. an important phrase extraction unit for extracting important phrases from the invention document based on the setting information, and the output unit extracts a plurality of important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit It is an invention document analysis system that outputs information generated based on each word.

これにより、発明文書分析システムは、例えば発明者等(例えば発明者若しくはその関係者)又は弁理士により作成された発明文書を分析した結果に基づく情報を出力するので、例えば、その発明文書を翻訳する翻訳者等(例えば翻訳者又はその他の発明文書を用いる者)にとっては、出力された情報を参照することにより、発明文書の理解が促進される可能性がある。発明文書の理解の促進は、翻訳者にとって発明文書を適切に又は効率的に翻訳するために有用となる。発明文書における重要語句に基づいて生成された情報は、翻訳者が、発明文書の重要語句に対応する対応翻訳語を決定してから発明文書全体を翻訳するような場合において、有用となり得る。 As a result, the invention document analysis system outputs information based on the results of analysis of invention documents created by, for example, inventors (for example, inventors or their related parties) or patent attorneys. For a translator or the like (for example, a translator or other person who uses the invention document) to refer to the output information, there is a possibility that the understanding of the invention document will be promoted. Promoting the understanding of the invention document is useful for translators to translate the invention document appropriately or efficiently. Information generated based on key words in an invention document can be useful in cases where a translator determines corresponding translation words corresponding to key words in the invention document before translating the entire invention document.

ここで、例えば、前記出力部は、前記文書取得部により取得された発明文書についての前記分析部による分析結果に基づいて生成された特許出願関連情報を出力し、前記特許出願関連情報は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々について、当該重要語句に、当該重要語句に関連する付加情報を付加した情報を含み、前記特許出願関連情報における、前記文書取得部により取得された発明文書から抽出された前記複数の重要語句各々について付加された、当該重要語句に関連する前記付加情報は、当該重要語句の意味を表す翻訳語句である対応翻訳語に関する情報としての翻訳語情報を含み、前記分析部は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された重要語句各々について、当該重要語句についての対応翻訳語の候補の集合である翻訳語候補集合を特定するための翻訳語候補集合特定部を含み、前記文書取得部により取得された発明文書の前記重要語句に関連する前記付加情報に含まれる、対応翻訳語に関する情報としての前記翻訳語情報は、前記翻訳語候補集合特定部により特定された、当該重要語句についての翻訳語候補集合を表す翻訳語候補情報、又は、当該対応翻訳語を含むこととしてもよい。翻訳語句は、例えば、日本語以外の一種類の言語(例えば英語、中国語等)で表された語句である。 Here, for example, the output unit outputs patent application-related information generated based on the analysis result of the analysis unit for the invention document acquired by the document acquisition unit, and the patent application-related information is the for each of a plurality of key phrases extracted by the key phrase extracting unit from the invention document acquired by the document acquisition unit, information in which additional information related to the key phrase is added to the key phrase; In the information, the additional information related to the key words and phrases added to each of the plurality of key words and phrases extracted from the invention document acquired by the document acquisition unit is a translated word and phrase representing the meaning of the key words and phrases. including translation word information as information related to corresponding translation words, the analysis unit extracting corresponding translations for each of the key words extracted by the key word extraction unit from the invention document acquired by the document acquisition unit; a translation word candidate set specifying unit for specifying a translation word candidate set that is a set of word candidates, and included in the additional information related to the important phrase of the invention document acquired by the document acquisition unit; The translated word information as information about the translated word includes the translated word candidate information representing the translated word candidate set for the key word specified by the translated word candidate set identification unit, or the corresponding translated word. good too. A translated phrase is, for example, a phrase expressed in one kind of language other than Japanese (for example, English, Chinese, etc.).

これにより、発明文書分析システムにより出力される特許出願関連情報を得ることで翻訳者等は、発明文書の複数の重要語句を把握でき、翻訳者は、発明文書の翻訳のために付加情報に基づいて、重要語句に対応する、重要語句と同じ意味の翻訳先の言語である翻訳語句を、効率的に又は適正に決定することが可能となり得る。また、発明文書分析システムにより出力される特許出願関連情報に含まれる翻訳語情報を参照することで翻訳者は、重要語句に対応する翻訳語句を効率的に又は適正に決定することが可能となり得る。また、発明文書分析システムにより出力される特許出願関連情報に含まれる翻訳語候補情報又は対応翻訳語を参照することで翻訳者は、例えば重要語句に対応する翻訳語候補情報が表す翻訳語候補集合から1つの翻訳語句を選択する等により、重要語句に対応する翻訳語句を効率的に又は適正に決定することが可能となり得る。 As a result, by obtaining patent application-related information output by the invention document analysis system, translators, etc. can grasp multiple important words and phrases of invention documents, and translators can use additional information to translate invention documents. In this way, it may be possible to efficiently or properly determine a translated phrase corresponding to a key phrase, which is the target language with the same meaning as the key phrase. In addition, by referring to the translation word information included in the patent application related information output by the invention document analysis system, the translator can efficiently or appropriately determine the translation words corresponding to the important words. . In addition, by referring to the translation word candidate information or the corresponding translation words included in the patent application related information output by the invention document analysis system, the translator can, for example, refer to the translation word candidate set represented by the translation word candidate information corresponding to the key phrase. It may be possible to efficiently or properly determine the translation word corresponding to the key word, such as by selecting one translation word from the list.

また、例えば、前記特許出願関連情報は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された前記複数の重要語句各々が、表示されるべき内容として含まれた、表示用文書として出力され、前記発明文書から抽出された重要語句に関連する前記付加情報は、当該重要語句についての前記翻訳語候補集合のうちのいずれかの要素を操作に応じて選択可能にするように、当該翻訳語候補集合をグラフィカルユーザインタフェース(GUI:Graphical User Interface)要素として表示するための表示制御情報を含み、前記重要語句に関連する前記付加情報に含まれる前記表示制御情報は、前記GUI要素として表示された状態の、当該重要語句についての前記翻訳語候補集合から、操作に応じて選択された要素を、当該重要語句に対応する対応翻訳語として決定する決定処理を実行するためのスクリプトを含み、前記翻訳語候補集合から選択された要素を対応翻訳語として決定する前記決定処理は、表示されていた当該翻訳語候補集合を、当該対応翻訳語へと置換して表示する処理を含むこととしてもよい。 Further, for example, the patent application-related information includes, as content to be displayed, each of the plurality of important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit. The additional information related to the key words and phrases extracted from the invention documents, which is output as a technical document, is such that any element of the translation word candidate set for the key words and phrases can be selected according to an operation. (b) includes display control information for displaying the translation word candidate set as a graphical user interface (GUI) element, and the display control information included in the additional information related to the important phrase is the GUI A script for executing determination processing for determining an element selected in accordance with an operation from the set of candidate translation words for the key phrase displayed as elements as a corresponding translation word corresponding to the key phrase and the determination process of determining the element selected from the candidate translation word set as the corresponding translated word includes a process of replacing the displayed candidate translation word set with the corresponding translated word and displaying it. You can do it.

これにより、翻訳者は、表示用文書のGUI要素に対する選択の操作により、翻訳語候補集合から重要語句に対応する対応翻訳語を容易に決定することができる。また、翻訳者は、例えば、ブラウザ等による表示用文書の表示内容から、決定処理により表示された対応翻訳語等を、所謂コピー&ペースト、所謂カット&ペースト等により、容易に取得可能となる。なお、コピー&ペースト又はカット&ペーストは、概ね、コピー(つまり複製)又はカット(つまり切り取り)の対象となるデータを選択してそのデータを、他の場所を指定してその場所にペースト(つまり貼り付け)する操作であり、この操作により、コピー又はカットの対象のデータが、オペレーティングシステム(OS:Operating System)等の管理下で所定のメモリ領域に保持され、ペーストの操作によりそのデータがその所定のメモリ領域からペースト先として指定された場所に貼り付けられる。 As a result, the translator can easily determine the corresponding translation word corresponding to the important word from the translation word candidate set by selecting the GUI element of the document for display. Also, the translator can easily obtain, for example, the corresponding translated words displayed by the determination process from the display contents of the display document by a browser or the like by so-called copy & paste, so-called cut & paste, or the like. In addition, copy & paste or cut & paste generally selects data to be copied (i.e. duplicated) or cut (i.e. By this operation, the data to be copied or cut is held in a predetermined memory area under the control of the operating system (OS), etc., and by the paste operation, the data is transferred to that area. It is pasted from a predetermined memory area to a location specified as a paste destination.

また、例えば、前記条件情報は、重要語句の候補となる文字列のパターンを表した重要語句候補文字列パターンを示す重要語句候補文字列パターン情報と、先行記載した文字列の参照用に用いられる参照文字列のパターンを表した参照文字列パターンを示す参照文字列パターン情報と、要素名を表す文字列に後続して付記される符号の文字列のパターンを表した符号文字列パターンを示す符号文字列パターン情報と、所定の助詞である文字列のパターンを表した特定助詞文字列パターンを示す特定助詞文字列パターン情報とを含み、前記重要語句候補文字列パターン情報は、少なくとも、先頭文字が漢字である所定の文字列、及び、先頭文字が片仮名である所定の文字列が、当該重要語句候補文字列パターンに該当するように定められており、前記参照文字列パターン情報は、少なくとも、「前記」という文字列が、当該参照文字列パターンに該当するように定められており、前記符号文字列パターン情報は、少なくとも、先頭文字が数字である所定の文字列が、当該符号文字列パターンに該当するように定められており、前記特定助詞文字列パターン情報は、少なくとも、「を」、「に」、「が」、「と」、「から」、「へ」及び「は」のいずれかの文字が、当該特定助詞文字列パターンに該当するように定められており、前記重要語句抽出部は、前記文書取得部により取得された発明文書に、前記参照文字列パターンに該当する第1文字列に後続して前記重要語句候補文字列パターンに該当する第2文字列が存在する場合に、当該第2文字列と同一の文字列を重要語句として抽出する第1抽出部と、前記文書取得部により取得された発明文書にクレームが含まれている場合において、当該クレーム中に、前記重要語句候補文字列パターンに該当する第3文字列に後続して句点文字が存在するときには、当該第3文字列と同一の文字列を重要語句として抽出する第2抽出部と、前記文書取得部により取得された発明文書に、前記重要語句候補文字列パターンに該当する第4文字列に後続して前記符号文字列パターンに該当する第5文字列が存在する場合に、当該第4文字列と同一の文字列を重要語句として抽出する第3抽出部と、前記文書取得部により取得された発明文書に、前記重要語句候補文字列パターンに該当する第6文字列に後続して前記特定助詞文字列パターンに該当する第7文字列が存在する場合に、当該第6文字列と同一の文字列を重要語句として抽出する第4抽出部とを含み、前記重要語句抽出部は重要語句の前記抽出においては、前記重要語句候補文字列パターンに複数の文字列が該当していた場合において当該複数の文字列のうちの一の文字列が他の文字列に発明文書の記載上包含されていたときには、当該複数の文字列のうち当該一の文字列を除外した残余の文字列を選択対象として重要語句を選択して抽出し、前記設定情報は、抽出対象とすべき重要語句を列挙した重要語句設定辞書の特定用情報を含み、前記重要語句設定辞書では、列挙されている重要語句の少なくとも一部に対して対応翻訳語が対応付けられており、前記発明文書分析システムは、前記設定情報に基づいて前記重要語句設定辞書を取得する重要語句設定辞書取得部を含み、前記重要語句抽出部は、前記重要語句設定辞書に列挙されている重要語句が前記文書取得部により取得された発明文書に含まれている場合には、当該発明文書から当該重要語句を抽出し、前記重要語句抽出部が、前記重要語句設定辞書で対応翻訳語が対応付けられている重要語句を、前記文書取得部により取得された発明文書から抽出した場合には、前記特許出願関連情報における、当該発明文書から抽出された当該重要語句に関連する前記付加情報は、当該対応翻訳語を表し、前記重要語句抽出部が、前記重要語句設定辞書で対応翻訳語が対応付けられている重要語句以外の重要語句を前記文書取得部により取得された発明文書から抽出した場合には、前記特許出願関連情報における、当該発明文書から抽出された当該重要語句に関連する前記付加情報に含まれる前記表示制御情報は、前記翻訳語候補集合特定部により特定された当該重要語句の翻訳語候補集合のうちのいずれかの要素を操作に応じて選択可能となるように、当該翻訳語候補集合をGUI要素として表示するための情報を含み、当該表示制御情報は、前記GUI要素として表示された状態の、当該重要語句の当該翻訳語候補集合から、操作に応じて選択された要素を、当該重要語句に対応する対応翻訳語として決定する前記決定処理を実行するためのスクリプトを含むこととしてもよい。 In addition, for example, the condition information is used for reference to important phrase candidate character string pattern information indicating an important phrase candidate character string pattern representing a character string pattern that is a candidate for an important phrase, and for reference to previously described character strings. Reference character string pattern information that indicates the reference character string pattern that indicates the pattern of the reference character string, and the code that indicates the character string pattern of the code appended after the character string that indicates the element name Code that indicates the character string pattern Character string pattern information and specific particle character string pattern information indicating a specific particle character string pattern representing a pattern of a character string that is a predetermined particle, and the important phrase candidate character string pattern information includes at least the first character A predetermined character string of Chinese characters and a predetermined character string whose first character is Katakana are determined to correspond to the key phrase candidate character string pattern, and the reference character string pattern information is at least " The character string "said" is defined to correspond to the reference character string pattern, and the code character string pattern information is such that at least a predetermined character string whose first character is a number corresponds to the code character string pattern. is defined as applicable, and the specific particle character string pattern information is at least one of "wo", "ni", "ga", "to", "from", "he" and "ha" is determined to correspond to the specific particle character string pattern, and the important phrase extraction unit extracts the first character corresponding to the reference character string pattern from the invention document acquired by the document acquisition unit. a first extraction unit for extracting a character string identical to the second character string as an important phrase when a second character string corresponding to the key phrase candidate character string pattern exists subsequent to the string; In the case where a claim is included in the invention document acquired by the division, if the claim contains a period character following the third character string corresponding to the important phrase candidate character string pattern, the third a second extraction unit for extracting a character string identical to the character string as an important phrase; a third extraction unit for extracting a character string identical to the fourth character string as an important phrase when a fifth character string corresponding to a code character string pattern exists; , when there is a seventh character string corresponding to the specific particle character string pattern following the sixth character string corresponding to the important phrase candidate character string pattern, the character string identical to the sixth character string is regarded as important and a fourth extracting unit for extracting as a word, wherein the important word extracting unit, in the extraction of the important word/phrase, extracts the plurality of character strings when a plurality of character strings correspond to the important word/phrase candidate character string pattern. When one of the character strings is included in another character string in the description of the invention document, the remaining character strings after excluding the one character string among the plurality of character strings are selected and key words are selected. Selected and extracted, the setting information includes information for specifying an important phrase setting dictionary listing important phrases to be extracted, and in the important phrase setting dictionary, at least some of the listed important phrases include The invention document analysis system includes an important phrase setting dictionary acquisition unit that acquires the important phrase setting dictionary based on the setting information, and the important phrase extraction unit includes the When the key words listed in the key word setting dictionary are included in the invention document acquired by the document acquisition unit, the key words are extracted from the invention document, and the key word extraction unit extracts the When the key phrases associated with the corresponding translated words in the key phrase setting dictionary are extracted from the invention document acquired by the document acquisition unit, the key phrase extracted from the invention document in the patent application related information The additional information related to the important phrase represents the corresponding translated word, and the important phrase extracting unit extracts important phrases other than the important phrases associated with the corresponding translated word in the important phrase setting dictionary from the document acquisition unit. When extracted from the invention document obtained by, the display control information included in the additional information related to the key phrase extracted from the invention document in the patent application related information is the translation word candidate set including information for displaying the translation word candidate set as a GUI element so that any element of the translation word candidate set of the important phrase identified by the identification unit can be selected according to an operation; The display control information determines an element selected according to an operation from the translation word candidate set of the key word displayed as the GUI element as a corresponding translation word corresponding to the key word. A script for executing the decision process may be included.

これにより、重要語句抽出部は、例えば、発明文書において語句を参照する表現がある場合に参照される語句を一定条件下で重要語句と扱い、発明文書のクレームにおいて句点文字の直前に記載された語句を一定条件下で重要語句と扱うので、参照する程に注目して記載された語句及びクレームの請求対象を表す語句が重要語句として扱われる可能性がある。通常の発明文書のクレームにおいて請求対象に後続して句点文字が記載される傾向が十分に存在すると想定される。従って、発明文書分析システムが発明文書において重要と推定される重要語句に基づいて、出力部により情報が出力され得るので、その出力される情報は有用であり得る。また、重要語句抽出部は、例えば、他の重要語句の記載の一部をなす語句を重要語句として抽出しないように扱い、発明文書において所定の助詞に先行する語句(例えば名詞句等)を一定条件下で重要語句と扱い、発明文書において符号が付されて記載された語句を一定条件下で重要語句と扱うので、主語、目的語等の比較的重要な語句及び発明文書に関連する図面中に図示されると推定される要素を表す語句が重要語句として扱われ得る。発明文書が日本語で記述されているので、漢字又は片仮名で始まる語句が重要語句である可能性は十分にある。従って、発明文書分析システムが、発明文書において重要と推定される重要語句に基づいて、出力部により情報が出力され得るので、その出力される情報は有用であり得る。また、これにより、例えば、発明文書を作成した発明者等又は弁理士は、特定の語句を重要語句として定めておきたい場合、重要語句についての対応翻訳語を定めておきたい場合等に、重要語句設定辞書を生成しておくことで、発明文書分析システムにより、適切な特許出願関連情報が出力されるようになり得る。このため、翻訳者は、その特許出願関連情報を参考にして発明文書の翻訳を、効率的に又は適正に行うことが可能となり得る。また、翻訳者が、重要語句について対応翻訳語を定めている場合等において重要語句設定辞書を生成しておくことで、発明者等又は弁理士から提供された発明文書を、発明文書分析システムで分析させた場合に、適切な特許出願関連情報が出力されるようになり得る。 As a result, for example, when there is an expression that refers to a word in the invention document, the key word extraction unit treats the referenced word as a key word under certain conditions, and Because words and phrases are treated as key words under certain conditions, words that are written with enough attention to reference and words that describe the claimed subject matter of a claim may be treated as key words. It is assumed that there is a good tendency to have punctuation following the claimed subject matter in the claims of ordinary invention documents. Therefore, information can be output by the output unit based on the key phrases that the invention document analysis system presumes to be important in the invention document, so the output information can be useful. In addition, the important phrase extraction unit, for example, treats phrases that are part of descriptions of other important phrases so as not to extract them as important phrases, and phrases (for example, noun phrases) that precede predetermined particles in invention documents are fixed. Under certain conditions, it is treated as an important word, and the words written with a code in the invention document are treated as important words under certain conditions. can be treated as key words. Since the invention document is written in Japanese, there is a good chance that words starting with kanji or katakana are key words. Therefore, since the invention document analysis system can output information by the output unit based on key phrases estimated to be important in the invention document, the output information can be useful. In addition, with this, for example, the inventor, etc. or the patent attorney who created the invention document can, for example, specify important words and phrases when they want to specify specific words and phrases as important words, and when they want to decide the corresponding translation words for important words and phrases. By generating a word setting dictionary in advance, the invention document analysis system can output appropriate patent application related information. Therefore, the translator may be able to translate the invention document efficiently or properly by referring to the patent application-related information. In addition, by creating a key phrase setting dictionary in cases such as when the translator has defined corresponding translation words for key phrases, invention documents provided by inventors or patent attorneys can be processed by the invention document analysis system. Appropriate patent application-related information can be output when analyzed.

また、例えば、前記重要語句抽出部が、前記重要語句設定辞書で対応翻訳語が対応付けられている重要語句以外の重要語句を前記文書取得部により取得された発明文書から抽出した場合に、前記特許出願関連情報における、当該発明文書から抽出された当該重要語句に関連する前記付加情報に含まれる前記表示制御情報は、前記決定処理の実行結果として対応翻訳語が決定された重要語句について当該重要語句と該当の対応翻訳語とを対応付けた情報を含むように前記重要語句設定辞書を更新する更新処理を実行するためのスクリプトを含むこととしてもよい。 Further, for example, when the important phrase extraction unit extracts important phrases other than the important phrases associated with the corresponding translated words in the important phrase setting dictionary from the invention document acquired by the document acquisition unit, the The display control information included in the additional information related to the important phrase extracted from the invention document in the patent application related information is the important A script may be included for executing update processing for updating the important phrase setting dictionary so as to include information that associates the phrase with the corresponding translated word.

これにより、翻訳語候補集合が選択操作されることで重要語句設定辞書の内容が、その後の発明文書の分析に際してより適切に活用されるような内容に更新され得る。 As a result, the content of the important phrase setting dictionary can be updated to the content that is more appropriately utilized in the subsequent analysis of the invention document by performing the selection operation of the translation word candidate set.

また、例えば、前記特許出願関連情報は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された各重要語句について、当該重要語句と、当該重要語句についての対応翻訳語、又は、当該重要語句についての翻訳語候補集合とを、対応付けて構成される重要語句リストを含み、前記表示用文書としての前記特許出願関連情報における前記重要語句リスト中の重要語句、対応翻訳語、及び、翻訳語候補集合の各々の表示要素には、重要語句に関連する前記付加情報としての、当該表示要素の表示態様の制御のための表示制御情報が付加されていることとしてもよい。 Further, for example, the patent application related information includes, for each key phrase extracted by the key phrase extraction unit from the invention document acquired by the document acquisition unit, the key phrase and the corresponding translated word for the key phrase, Alternatively, an important phrase list configured by associating a translation word candidate set for the relevant important phrases with the important phrases in the important phrase list in the patent application-related information as the display document, and the corresponding translated words , and display control information for controlling the display mode of the display element may be added to each display element of the translation word candidate set as the additional information related to the important phrase.

これにより、翻訳者は、重要語句リストを参照することで、発明文書に含まれる重要語句を迅速に把握でき、効率的な翻訳を行うことが可能になる。また、発明者等、弁理士、或いは、翻訳者は、発明文書分析システムに一旦発明文書を分析させた結果として出力される特許出願関連情報における重要語句リストを、編集することで、効率的に、重要語句設定辞書の生成、更新等を行うことが可能となり得る。 As a result, the translator can quickly grasp the important phrases contained in the invention document by referring to the important phrase list, and can translate efficiently. In addition, inventors, patent attorneys, or translators can efficiently , it is possible to generate, update, etc. the important phrase setting dictionary.

また、例えば、前記文書取得部により取得された発明文書にクレームが含まれている場合には、前記特許出願関連情報は、前記表示用文書において表示されるべき前記クレームの内容を表すクレーム情報と、前記クレーム情報に表されるクレームについての機械翻訳の結果を表すクレーム翻訳情報とを含み、前記クレーム翻訳情報における、前記クレーム情報の一行又は一項を機械翻訳対象とした機械翻訳の結果を表す一行又は一項は、当該クレーム情報の行若しくは項の全体を翻訳先言語で表した完全翻訳行、又は、当該クレーム情報の行若しくは項に含まれる重要語句を、当該重要語句に対応する対応翻訳語、若しくは、当該重要語句についての翻訳語候補集合に、置換した結果である部分翻訳行であり、前記文書取得部により取得された発明文書に明細書が含まれている場合には、前記特許出願関連情報は、前記表示用文書において表示されるべき前記明細書の内容を表す明細書情報と、前記明細書情報に表される明細書についての機械翻訳の結果を表す明細書翻訳情報とを含み、前記明細書翻訳情報における、前記明細書情報の一行を機械翻訳対象とした機械翻訳の結果を表す一行は、当該明細書情報の行の全体を翻訳先言語で表した完全翻訳行、又は、当該明細書情報の行に含まれる重要語句を、当該重要語句に対応する対応翻訳語、若しくは、当該重要語句についての翻訳語候補集合に、置換した結果である部分翻訳行であり、前記文書取得部により取得された発明文書のクレームの内容を表す前記クレーム情報は、当該発明文書から前記重要語句抽出部により抽出された当該クレーム中の複数の重要語句各々について、当該重要語句の表示態様を制御するための表示制御情報を含み、前記文書取得部により取得された発明文書の明細書の内容を表す前記明細書情報は、当該発明文書から前記重要語句抽出部により抽出された当該明細書中の複数の重要語句各々について、当該重要語句の表示態様を制御するための表示制御情報を含み、前記クレーム情報及び前記明細書情報における、前記重要語句抽出部により抽出された複数の重要語句各々についての、当該重要語句の表示態様を制御するための前記表示制御情報は、当該表示制御情報に対応する当該重要語句の表示態様を、前記クレーム情報及び前記明細書情報における当該複数の重要語句以外の語句の表示態様と相違させるための強調表示情報を含み、前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句各々に対応する、表示態様を制御するための前記表示制御情報各々は、当該複数の重要語句各々を互いに相違する表示態様で表示するように制御するための、互いに相違する識別情報を含み、前記明細書情報における、前記重要語句抽出部により抽出された複数の重要語句各々についての、当該重要語句の表示態様を制御するための前記表示制御情報は、当該重要語句が、前記クレーム情報における、重要語句を構成する文字列が互いに相違する前記複数の重要語句のいずれかと同一であれば、当該重要語句を、前記クレーム情報における当該同一の重要語句と同様の表示態様で表示させ、当該重要語句が、前記クレーム情報における、重要語句を構成する文字列が互いに相違する当該複数の重要語句のいずれとも相違すれば、当該重要語句を、前記クレーム情報における当該複数の重要語句のいずれとも相違する表示態様で表示させるように制御する情報を含み、前記クレーム翻訳情報及び前記明細書翻訳情報は、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句各々と同一の重要語句については、当該重要語句を機械翻訳対象とした機械翻訳の結果の表示要素に付加する情報として、当該機械翻訳の結果の表示態様の少なくとも一部が前記クレーム情報及び前記明細書情報における当該重要語句の表示態様の少なくとも一部と同一となるように、当該機械翻訳の結果の表示態様を制御するための表示制御情報を含むこととしてもよい。 Further, for example, when claims are included in the invention document acquired by the document acquisition unit, the patent application related information is claim information representing the content of the claims to be displayed in the display document. , and claim translation information representing the result of machine translation of the claim represented in the claim information, and representing the result of machine translation for one line or one item of the claim information in the claim translation information. One line or one paragraph is a complete translation line that expresses the entire line or paragraph of the claim information in the target language, or a key phrase included in the line or paragraph of the claim information, and the corresponding translation corresponding to the key phrase or a partial translation line that is the result of replacement in the translation word candidate set for the key word, and if the specification is included in the invention document acquired by the document acquisition unit, the patent The application-related information includes specification information representing the content of the specification to be displayed in the display document, and specification translation information representing the result of machine translation of the specification represented by the specification information. Including, in the description translation information, one line representing the result of machine translation for one line of the description information is a complete translation line representing the entire line of the description information in the target language, or , a partially translated line that is the result of replacing key phrases contained in the line of the specification information with a corresponding translated word corresponding to the key phrase or a translation word candidate set for the key phrase, and the document The claim information representing the content of the claim of the invention document acquired by the acquisition unit is a display mode of the key phrase for each of a plurality of key phrases in the claim extracted from the invention document by the key phrase extraction unit. The description information, which includes display control information for controlling and represents the content of the description of the invention document acquired by the document acquisition unit, is extracted from the invention document by the important phrase extraction unit. for each of a plurality of key phrases, including display control information for controlling the display mode of the key phrase, and for each of the plurality of key phrases extracted by the key phrase extraction unit in the claim information and the specification information , the display control information for controlling the display mode of the key phrases is such that the display mode of the key phrases corresponding to the display control information is changed to the display mode of the key phrases other than the plurality of key phrases in the claim information and the specification information The display control for controlling the display mode, which includes highlighting information for differentiating the display mode of the words and phrases, and corresponds to each of a plurality of important words and phrases in which the character strings constituting the important words and phrases are different from each other in the complaint information. Each piece of information includes different identification information for controlling to display each of the plurality of important phrases in different display modes, The display control information for controlling the display mode of the key phrase for each key phrase is that the key phrase is the plurality of key phrases in the claim information in which the character strings constituting the key phrase are different from each other , the key phrase is displayed in the same display mode as the same key phrase in the claim information, said claim translation information including information for controlling to display said key phrase in a display mode different from any of said plurality of key phrases in said claim information if said key phrase differs from any of said plurality of different key phrases; And, in the description translation information, for the same key phrase as each of the plurality of key phrases in which the character strings constituting the key phrase in the claim information are different from each other, the result of machine translation with the key phrase as the target of machine translation As information to be added to the display elements of the machine, the machine translation results are displayed so that at least part of the display mode is the same as at least part of the display mode of the important phrase in the claim information and the description information. Display control information for controlling the display mode of the translation result may be included.

これにより、例えば、翻訳者等は、ブラウザ等により表示された表示用文書に係る特許出願関連情報のクレーム情報及び明細書情報において表示態様が制御された重要語句を識別することが可能となり得るし、クレーム翻訳情報及び明細書翻訳情報において表示態様が制御された重要語句の翻訳結果を識別し、どの翻訳結果がどの重要語句と対応するかを迅速に把握することが可能となり得る。また、特許出願関連情報を閲覧した翻訳者等は、特許出願関連情報中の明細書情報において記載された各重要語句が、クレームに記載されている重要語句か否かを識別することが可能となり、複数の重要語句が同一か相違するかを、各重要語句の表示態様により、迅速に把握することが可能となり得る。なお、発明文書分析システムにおいて、重要語句の表示態様の制御として、例えば強調表示(例えば太字で表示する等)がなされたとすれば、翻訳者等は、クレーム情報における重要語句の迅速な把握が可能となり得る。 As a result, for example, translators, etc., can identify key words whose display mode is controlled in the claim information and specification information of the patent application-related information related to the display document displayed by the browser, etc. , the translation results of key phrases whose display mode is controlled in the claim translation information and the specification translation information, and it is possible to quickly grasp which translation result corresponds to which key phrase. In addition, translators, etc., who have browsed the patent application-related information, can identify whether each key phrase described in the specification information in the patent application-related information is the key phrase described in the claim. , it may be possible to quickly grasp whether a plurality of key words are the same or different, depending on the display mode of each key word. In addition, in the invention document analysis system, if, for example, highlighting (for example, displaying in bold) is performed as a control of the display mode of the important words, the translator, etc. can quickly grasp the important words in the claim information. can be.

また、例えば、前記表示用文書は、前記特許出願関連情報を表示されるべき内容として含み、HTML(Hypertext Markup Language)で記載されたHTMLファイルを含むHTML文書であり、前記文書取得部により取得された発明文書のクレームの内容を表す前記クレーム情報が含む、前記重要語句抽出部により抽出された当該クレーム中の複数の重要語句各々についての、当該重要語句に係る前記表示制御情報は、当該重要語句に付加される表示色を示し、前記文書取得部により取得された発明文書の明細書の内容を表す前記明細書情報が含む、前記重要語句抽出部により抽出された当該明細書中の複数の重要語句各々についての、当該重要語句に係る前記表示制御情報は、当該重要語句に付加される表示色を示し、前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る前記表示制御情報は、当該複数の重要語句各々を、重要語句毎に相違する表示色を付加した表示態様で表示するように制御するためのものであり、前記クレーム情報における、重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の文字列で構成される、前記クレーム情報における重要語句に係る表示制御情報は、当該重要語句を、前記1つの重要語句と同一の表示色を付加した表示態様で表示するように制御するためのものであり、前記明細書情報における、複数の重要語句各々について、当該重要語句が、前記クレーム情報における前記複数の重要語句のうちのいずれか1つの重要語句と同一であれば、前記明細書情報における当該重要語句に係る前記表示制御情報は、当該重要語句を、前記クレーム情報における前記1つの重要語句の表示態様として付加された表示色と同一の表示色を付加した表示態様で表示するように制御するためのものであり、前記クレーム翻訳情報及び前記明細書翻訳情報は、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句各々と同一の重要語句については、当該重要語句を機械翻訳対象とした機械翻訳の結果の表示要素に付加する情報として、当該機械翻訳の結果の表示態様の少なくとも一部の表示色が前記クレーム情報及び前記明細書情報における当該重要語句の表示態様の少なくとも一部の表示色と同一となるように、当該機械翻訳の結果の表示態様を制御するための表示制御情報を含むこととしてもよい。 Further, for example, the display document is an HTML document including an HTML file written in HTML (Hypertext Markup Language) including the patent application related information as content to be displayed, and is acquired by the document acquisition unit. For each of the plurality of key words in the claim extracted by the key word extracting unit, the display control information related to the key word is a plurality of key phrases in the specification extracted by the important phrase extraction unit, including the specification information representing the content of the specification of the invention document acquired by the document acquisition unit. For each of the words, the display control information related to the key words indicates the display color to be added to the key words, and the display control information for each of the multiple key words having mutually different character strings constituting the key words in the claim information. The display control information is for controlling each of the plurality of key words and phrases to be displayed in a display mode in which a different display color is added for each key word, and constitutes the key words and phrases in the complaint information. The display control information related to the important phrase in the claim information, which is composed of the same character string as any one of the plurality of important phrases whose character strings are different from each other, It is for controlling to display in a display mode in which the same display color as one important phrase is added, and for each of a plurality of important phrases in the specification information, the relevant important phrase is the above-mentioned If it is the same as any one key phrase out of a plurality of key phrases, the display control information related to the key phrase in the specification information changes the key phrase to the one key phrase in the claim information. It is for controlling to display in a display mode to which the same display color as the display color added as a display mode is added, and the claim translation information and the specification translation information are important words and phrases in the claim information. For key phrases that are the same as each of the plurality of key phrases whose character strings are different from each other, as information to be added to the display element of the result of machine translation with the key phrase as the object of machine translation, the result of the machine translation Controlling the display mode of the result of the machine translation so that the display color of at least part of the display mode is the same as the display color of at least part of the display mode of the important phrase in the claim information and the specification information may include display control information for

これにより、HTMLに対応しているブラウザを搭載したPC、スマートフォンその他のコンピュータを用いて、翻訳者等はHTML文書である表示用文書としての特許出願関連情報を閲覧できる。ブラウザ等により表示された表示用文書としての特許出願関連情報を閲覧した翻訳者等は、特許出願関連情報中において重要語句、及び、重要語句の翻訳結果に対して付加された表示色を識別することにより、ある重要語句がクレームに記載されている重要語句か否かを識別することが可能となり、複数の重要語句が同一であるのか相違するのであるのかを迅速に把握でき、ある翻訳結果がどの重要語句に対応するのかを迅速に把握できる。 As a result, a translator or the like can browse the patent application-related information as a display document, which is an HTML document, using a PC, smartphone, or other computer equipped with an HTML-compatible browser. Translators, etc., who view the patent application-related information as a display document displayed by a browser, etc., identify important words and phrases in the patent application-related information, and the display colors added to the translation results of the important words and phrases. As a result, it becomes possible to identify whether or not a certain key phrase is the key phrase described in the claim, and it is possible to quickly grasp whether multiple key phrases are the same or different. It is possible to quickly grasp which important phrase corresponds to.

また、例えば、前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る前記表示制御情報は、当該複数の重要語句各々を、重要語句毎に相違する表示色で所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであり、前記明細書情報における、複数の重要語句各々について、当該重要語句が、前記クレーム情報における前記複数の重要語句のうちのいずれか1つの重要語句と同一であれば、前記明細書情報における当該重要語句に係る前記表示制御情報は、当該重要語句を、前記クレーム情報における前記1つの重要語句の表示態様に係る左境界線の表示色と同一の表示色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御し、前記明細書情報における当該重要語句が、前記クレーム情報における当該複数の重要語句のいずれとも相違すれば、前記明細書情報における当該重要語句に係る前記表示制御情報は、当該重要語句を、前記左境界線が付加されていない表示態様で表示するように制御するためのものであり、前記クレーム情報における重要語句に係る前記表示制御情報が、当該重要語句を、前記所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであるところの重要語句を機械翻訳対象とする、前記クレーム翻訳情報及び前記明細書翻訳情報における当該重要語句についての機械翻訳の結果に係る前記表示制御情報は、当該機械翻訳の結果を、当該重要語句の表示態様に係る左境界線の表示色と同一の表示色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであることとしてもよい。 Further, for example, the display control information relating to each of a plurality of important phrases having different character strings constituting the important phrases in the complaint information displays each of the plurality of important phrases in a different display color for each of the important phrases. It is for controlling to display in a display mode in which a left border line having a predetermined width is added. , the display control information related to the key phrase in the specification information controls the key phrase to display the one key phrase in the claim information. Control to display in a display mode to which the left border line having the predetermined width is added in the same display color as the display color of the left border line according to the mode, and the important phrase in the description information is displayed in the claim information , the display control information related to the key phrase in the specification information is such that the key phrase is displayed in a display mode in which the left border line is not added. The display control information related to the key phrase in the claim information is for controlling to display the key phrase in a display mode with the left boundary line having the predetermined width added. The display control information relating to the result of machine translation of the key words in the claim translation information and the specification translation information, which targets the key words and phrases of the It may be for controlling to display in a display mode to which the left boundary line having the predetermined width is added in the same display color as the display color of the left boundary line related to the display mode of the important phrase.

これにより、ブラウザ等により表示された表示用文書としての特許出願関連情報を閲覧した翻訳者等は、特許出願関連情報中においてクレーム情報に含まれる相違する重要語句同士を、その各重要語句に付加された左境界線の表示色を識別することで、迅速に区別できる。なお、相違する重要語句同士について、重要語句に付加された左境界線の表示色を相違させて表現する方法には、重要語句の文字色或いは文字背景色を相違させて表現する方法より、表示領域の背景色が暗い色(例えば黒)か明るい色(例えば白)かに拘わらず重要語句自体の判読性を低下させないという利点がある。またHTML文書で一部の表示要素に付加可能な左境界線は、文字ではないので、重要語句を含む記載の表示内容のテキストについてのコピー&ペースト等を行う場合に無視されるため、表示内容をテキストエディタ等へとコピー&ペーストして、重要語句を含む記載等を編集するような場合において、邪魔にならない。また、特許出願関連情報を閲覧した翻訳者等は、特許出願関連情報中において重要語句、及び、重要語句の翻訳結果に対して付加された左境界線の表示色を識別することにより、あるクレームの重要語句の翻訳結果が、クレームに記載されているどの重要語句に対応するのかを迅速に把握することが可能となる。 As a result, translators, etc., who view the patent application-related information as a display document displayed by a browser, etc., can add different key phrases included in the claim information in the patent application-related information to each key phrase. can be quickly distinguished by identifying the display color of the left border line. It should be noted that the method of expressing different key phrases by using different display colors for the left boundary line added to the key phrases is more important than the method of expressing key phrases by using different character colors or character background colors. There is an advantage that the readability of the important phrase itself is not degraded regardless of whether the background color of the region is dark (eg black) or bright (eg white). In addition, the left border line that can be added to some display elements in HTML documents is not a character, so it is ignored when copying and pasting the text of the display content that includes important phrases. It does not get in the way when copying and pasting into a text editor etc. and editing descriptions including important phrases. In addition, translators, etc., who have browsed the patent application-related information, can identify a certain claim by identifying the important words in the patent application-related information and the display color of the left border line added to the translation results of the important words and phrases. It is possible to quickly grasp which key words and phrases described in the claim correspond to the translation result of the key words and phrases.

また、例えば、前記クレーム翻訳情報は、前記クレーム情報の各行を包含し、包含したクレーム情報の一行毎又は一項毎について、当該一行又は一項の内容の直後に、当該一行又は一項の内容である機械翻訳対象に対応する機械翻訳の結果を表す、完全翻訳行又は部分翻訳行を、挿入したものであり、前記明細書翻訳情報は、前記明細書情報の各行を包含し、包含した明細書情報の一行毎について、当該一行の直後に、当該一行である機械翻訳対象に対応する機械翻訳の結果を表す、完全翻訳行又は部分翻訳行を挿入したものであり、前記クレーム翻訳情報及び前記明細書翻訳情報には、前記クレーム翻訳情報及び前記明細書翻訳情報における機械翻訳対象の少なくとも一部分の表示要素の表示態様と、当該機械翻訳対象に対応する機械翻訳の結果の少なくとも一部分の表示要素の表示態様とが、少なくとも一部で相違するように制御するために、当該各表示要素に表示制御情報が付加されていることとしてもよい。 Further, for example, the claim translation information includes each line of the claim information, and for each line or item of the included claim information, immediately after the content of the line or item, the content of the line or item A fully translated line or a partially translated line representing the result of machine translation corresponding to the machine translation target is inserted, and the specification translation information includes each line of the specification information, and the included specification For each line of the document information, a complete translation line or a partial translation line representing the result of machine translation corresponding to the machine translation target of the line is inserted immediately after the line, and the claim translation information and the The description translation information includes the display mode of at least a part of the machine translation target in the claim translation information and the description translation information, and the display element of at least a part of the machine translation result corresponding to the machine translation target. Display control information may be added to each of the display elements in order to control the display mode to be at least partially different.

これにより、ブラウザ等により表示された表示用文書としての特許出願関連情報を閲覧した翻訳者等は、クレーム翻訳情報及び明細書翻訳情報において、機械翻訳対象の行と、機械翻訳結果の行とを迅速に識別可能となる。 As a result, translators, etc., who view the patent application-related information as a display document displayed by a browser, etc., can distinguish between the lines to be machine-translated and the lines resulting from machine translation in the claim translation information and the specification translation information. quickly identifiable.

また、翻訳者等は、クレーム翻訳情報或いは明細書翻訳情報における機械翻訳対象の行を目視して確認しながら、その機械翻訳対象の行の後方に配置されている機械翻訳結果の行の内容を適宜修正して、より適切な翻訳文を効率的に作成することが可能となり得る。 In addition, while visually confirming the line to be machine-translated in the claim translation information or the description translation information, the translator, etc., can read the contents of the line of the machine translation result located after the line to be machine-translated. It may be possible to make appropriate corrections to efficiently create more appropriate translations.

また、例えば、前記クレーム翻訳情報及び前記明細書翻訳情報には、前記クレーム翻訳情報及び前記明細書翻訳情報における機械翻訳対象の少なくとも一部分の表示要素の表示態様と、当該機械翻訳対象に対応する機械翻訳の結果の少なくとも一部分の表示要素の表示態様とが、文字背景色、文字色、文字装飾、フォントサイズ、フォントスタイル、及び、フォントウェイトのうちの少なくとも1つにおいて相違するように制御するために、当該各表示要素に表示制御情報が付加されていることとしてもよい。 Further, for example, the claim translation information and the specification translation information include a display mode of at least a part of a display element to be machine-translated in the claim translation information and the specification translation information, and a machine corresponding to the machine-translation target. To control the display mode of display elements of at least a part of the translation result to be different in at least one of character background color, character color, character decoration, font size, font style, and font weight , display control information may be added to each display element.

これにより、ブラウザ等により表示された表示用文書としての特許出願関連情報を閲覧した翻訳者等は、クレーム翻訳情報及び明細書翻訳情報において、機械翻訳対象の行と、機械翻訳結果の行とを、文字背景色、文字色、文字装飾、フォントサイズ、フォントスタイル、及び、フォントウェイトのうちの少なくとも1つの相違により、迅速に識別可能となる。 As a result, translators, etc., who view the patent application-related information as a display document displayed by a browser, etc., can distinguish between the lines to be machine-translated and the lines resulting from machine translation in the claim translation information and the specification translation information. , character background color, character color, character decoration, font size, font style, and font weight.

また、例えば、前記クレーム翻訳情報及び前記明細書翻訳情報における重要語句を機械翻訳対象とする機械翻訳の結果の表示要素には、当該表示要素の操作に応じて当該重要語句に対する、当該機械翻訳の結果とは異なる翻訳語候補集合を表示するGUIとしての機能を当該表示要素に持たせるための、翻訳語候補情報を含む表示制御情報が付加されており、当該表示制御情報は、当該操作の結果として表示された当該翻訳語候補集合を表示する当該GUIに対する、当該翻訳語候補集合から1つの要素の選択操作がなされた場合に、機械翻訳の結果の当該表示要素の内容を当該選択操作により選択された当該1つの要素に変更するように定められていることとしてもよい。 In addition, for example, in the display element of the result of machine translation for which key words in the claim translation information and the specification translation information are to be machine-translated, the Display control information including translation word candidate information is added for the display element to have a GUI function for displaying a set of translation word candidates different from the result, and the display control information is the result of the operation. When an operation to select one element from the set of candidate translation words is performed on the GUI displaying the set of candidate translation words displayed as , the content of the display element of the result of machine translation is selected by the selection operation It may be determined to change to the one element that has been specified.

これにより、ブラウザ等により表示された表示用文書としての特許出願関連情報を閲覧した翻訳者等は、クレーム翻訳情報及び明細書翻訳情報における重要語句についての機械翻訳の結果を、必要に応じて選択操作により容易に変更できるようになる。 As a result, translators, etc., who view the patent application-related information as a display document displayed by a browser, etc., can select the results of machine translation of important terms in the claim translation information and the specification translation information as necessary. It can be changed easily by operation.

また、例えば、前記文書取得部は複数の発明文書を取得し、前記クレーム翻訳情報及び前記明細書翻訳情報の前記部分翻訳行における対応翻訳語は、重要語句の機械翻訳のための学習モデルである重要語句翻訳用学習モデルを利用した機械翻訳の結果として生成され、前記発明文書分析システムは、翻訳対象となる発明文書が満たすべき複数の条件を定めた翻訳用発明文書標準規定を取得する翻訳用発明文書標準規定取得部と、前記文書取得部により取得された前記複数の発明文書各々について、当該発明文書が前記翻訳用発明文書標準規定で定められた前記複数の条件のうちの少なくとも一部の各条件を満たすか否かについての判定を行い、当該複数の発明文書のうち、当該判定がなされた前記条件を満たす程度が予め定めた所定程度を超えるところの発明文書を選出する文書評価部と、機械学習部とを含み、前記機械学習部は、前記文書評価部により選出された発明文書に基づいて、前記発明文書分析システムにより表示用文書が生成されて重要語句についての翻訳語候補集合に係るGUIが表示された結果として当該重要語句と当該翻訳候補集合から選択された1つの要素との組を、前記重要語句翻訳用学習モデルの生成のための機械学習用の教師データとして蓄積して、過去に蓄積された複数の教師データを用いた機械学習により、重要語句の機械翻訳のための前記重要語句翻訳用学習モデルを生成する機能を含むこととしてもよい。 Further, for example, the document acquisition unit acquires a plurality of invention documents, and the corresponding translated words in the partially translated lines of the claim translation information and the specification translation information are learning models for machine translation of important words. Generated as a result of machine translation using a learning model for translation of key words, the invention document analysis system acquires invention document standard specifications for translation that define a plurality of conditions to be satisfied by invention documents to be translated. an invention document standard specification acquisition unit; and for each of the plurality of invention documents acquired by the document acquisition unit, the invention document satisfies at least a part of the plurality of conditions stipulated by the invention document standard specification for translation. a document evaluation unit that determines whether or not each condition is satisfied, and selects, from among the plurality of invention documents, invention documents for which the degree of the condition for which the determination is made exceeds a predetermined degree; , and a machine learning unit, wherein the machine learning unit generates a document for display by the invention document analysis system based on the invention document selected by the document evaluation unit and converts it into a translation word candidate set for important words. As a result of displaying the GUI, a set of the key phrase and one element selected from the translation candidate set is accumulated as teacher data for machine learning for generating the learning model for the translation of the key phrase. , a function of generating a learning model for machine translation of important phrases by machine learning using a plurality of teacher data accumulated in the past.

これにより、翻訳用発明文書標準規定への適合性が比較的高い発明文書が選出されて、その発明文書における重要語句と、対応する翻訳候補集合から選択された要素とが重要語句翻訳用学習モデルの生成に利用され、翻訳が困難なような不適切な発明文書が重要語句翻訳用学習モデルの生成材料から除外されるので、重要語句翻訳用学習モデルが適切に生成され得る。また、生成された重要語句翻訳用学習モデルが後に発明文書の分析に利用されることにより、発明文書における重要語句についてのより適切な機械翻訳が、実現され得る。より適切な機械翻訳の結果を参照することで、翻訳者は、発明文書における重要語句を翻訳した翻訳語句を効率的に又は適正に決定することが可能となり得る。 As a result, an invention document having a relatively high conformity to the invention document standard specification for translation is selected, and the key words in the invention document and the elements selected from the corresponding translation candidate set are combined into a learning model for translation of key words. , and inappropriate invention documents that are difficult to translate are excluded from the materials for generating the learning model for important phrase translation, so that the learning model for important phrase translation can be appropriately generated. In addition, by using the generated learning model for translation of important phrases later in the analysis of the invention document, more appropriate machine translation of the important phrases in the invention document can be realized. By referring to the results of more appropriate machine translation, the translator may be able to efficiently or properly determine translated words and phrases for the important words and phrases in the invention document.

また、例えば、前記クレーム翻訳情報及び前記明細書翻訳情報における前記完全翻訳行は、機械翻訳のための学習モデルである翻訳用学習モデルを利用した機械翻訳の結果として生成され、前記文書取得部は、複数の発明文書と、当該複数の発明文書各々の翻訳結果である、複数の翻訳結果文書とを取得し、前記発明文書分析システムは、翻訳対象となる発明文書が満たすべき複数の条件を定めた翻訳用発明文書標準規定を取得する翻訳用発明文書標準規定取得部と、前記文書取得部により取得された前記複数の発明文書各々について、当該発明文書が前記翻訳用発明文書標準規定で定められた前記複数の条件のうちの少なくとも一部の各条件を満たすか否かについての判定を行い、当該複数の発明文書のうち、当該判定がなされた前記条件を満たす程度が予め定めた所定程度を超えるところの発明文書を選出する文書評価部と、機械学習部とを含み、前記機械学習部は、前記文書評価部により選出された発明文書と、当該発明文書に基づいて翻訳された結果としての翻訳結果文書との複数組を教師データとして用いた機械学習により、前記翻訳用学習モデルを生成する機能を含むこととしてもよい。 Further, for example, the complete translation line in the claim translation information and the specification translation information is generated as a result of machine translation using a translation learning model, which is a learning model for machine translation, and the document acquisition unit , a plurality of invention documents and a plurality of translation result documents, which are translation results of each of the plurality of invention documents, are acquired, and the invention document analysis system defines a plurality of conditions to be satisfied by the invention documents to be translated. and an acquisition unit for standard specifications for invention documents for translation that acquires the standard specifications for invention documents for translation, and for each of the plurality of invention documents acquired by the document acquisition unit, the invention documents are specified by the standard specifications for invention documents for translation. A determination is made as to whether or not each of at least some of the conditions among the plurality of conditions is satisfied, and among the plurality of invention documents, the extent to which the conditions for which the determination is made satisfies a predetermined degree. and a machine learning unit, wherein the machine learning unit selects the invention document selected by the document evaluation unit and the translation result based on the invention document It may include a function of generating the learning model for translation by machine learning using a plurality of sets of translation result documents as teacher data.

これにより、翻訳用発明文書標準規定に基づいて発明文書の選出がなされるので、不適切な記載を含む発明文書と、その発明文書に基づいて生成された翻訳ミス等によりその発明文書と内容に齟齬のある翻訳結果文書との組が教師データに用いられにくくなり、発明文書分析システムで、適切な翻訳用学習モデルが生成されるようになり得る。また、発明文書分析システムにおいて、その適切な翻訳用学習モデルを利用した演算処理により発明文書を機械翻訳することが可能となる。この発明文書の機械翻訳の結果としてのクレーム翻訳情報及び明細書翻訳情報における完全翻訳行を参照し、適宜修正することで、翻訳者は、発明文書を効率的に又は適正に翻訳することが可能となり得る。 As a result, invention documents are selected based on the standard rules for invention documents for translation. Pairs with inconsistent translation result documents are less likely to be used as teacher data, and the invention document analysis system can generate an appropriate learning model for translation. In addition, in the invention document analysis system, it becomes possible to machine-translate the invention document by arithmetic processing using the appropriate learning model for translation. By referring to the complete translation lines in the claim translation information and the specification translation information as a result of machine translation of this invention document and correcting them accordingly, the translator can translate the invention document efficiently or properly. can be.

また、例えば、前記分析部は、前記文書取得部により取得された発明文書に基づいて一定条件下で警告情報を生成し、前記特許出願関連情報は、前記警告情報を含み、前記警告情報は、前記文書取得部により取得された発明文書が前記翻訳用発明文書標準規定に定められた複数の条件を満たすか否かを検査して条件が満たされない場合にその旨を指摘する指摘情報と、前記文書取得部により取得された発明文書が前記翻訳用発明文書標準規定に定められた複数の条件のうちの少なくとも一部の各条件を満たすか否かの検査の結果に基づいて予め定められた演算により算出された、当該発明文書の翻訳用発明文書標準規定への適合性の評価値を示す発明文書評価情報とを含むこととしてもよい。 Further, for example, the analysis unit generates warning information under certain conditions based on the invention document acquired by the document acquisition unit, the patent application related information includes the warning information, and the warning information is indication information that inspects whether or not the invention document acquired by the document acquisition unit satisfies a plurality of conditions stipulated in the invention document standard specification for translation and points out if the conditions are not met; Predetermined calculation based on the result of checking whether or not the invention document acquired by the document acquisition unit satisfies at least some of the plurality of conditions defined in the invention document standard specification for translation and invention document evaluation information indicating the evaluation value of conformity of the invention document to the invention document standard specification for translation calculated by the invention document evaluation information.

これにより、発明文書分析システムにより出力された特許出願関連情報を参考にすることにより、発明文書を作成した発明者等又は弁理士は、必要であれば発明文書の修正を行い得る。また、翻訳者は、例えば、発明者等又は弁理士から、翻訳対象となる発明文書及び特許出願関連情報の提供を受けることにより、特許出願関連情報中の警告情報での指摘が残っていてもその指摘は特に対処の必要がないと発明者等又は弁理士が判断した結果であると推定できるので、翻訳対象となる適切な発明文書を取得することができ、この結果として、発明文書の翻訳を効率的に又は適正に行うことが可能となり得る。 Accordingly, by referring to the patent application-related information output by the invention document analysis system, the inventor or the like or the patent attorney who prepared the invention document can correct the invention document if necessary. In addition, the translator, for example, receives invention documents to be translated and patent application-related information from the inventors, etc. or patent attorneys, so that even if the warning information in the patent application-related information remains pointed out, Since it can be presumed that the inventor, etc. or the patent attorney determined that there is no particular need to deal with the indication, it is possible to obtain an appropriate invention document to be translated, and as a result, the translation of the invention document can be done efficiently or properly.

また、発明文書分析システムにより出力された特許出願関連情報に含まれる発明文書評価情報を参考にすることで、発明者等又は弁理士は、その発明文書を適切に修正できる可能性がある。また、翻訳者は、発明文書評価情報を確認することで、翻訳対象として適切な発明文書であるか否かを認識することが可能となり得る。不適切な記載を含む発明文書は、例えば、翻訳ミスを招き易く、翻訳者が適切な権利取得(例えば特許権の取得)のために発明文書を修正した上で翻訳するような事態も生じ得る。従って、発明文書に基づいて生成された特許出願関連情報における警告情報に、翻訳用発明文書標準規定への適合性が比較的低いことを示す発明文書評価情報が含まれていた場合には、その発明文書は、その発明文書に基づいて翻訳された結果である翻訳結果文書との間で、言語が異なる以外に内容の齟齬がある可能性が十分にあり得ると判断でき、例えば、機械翻訳に用いる翻訳用学習モデルの生成のために、その発明文書と翻訳結果文書との組とを機械学習用の教師データとして用いることが有用ではないとの判断等が、可能となり得る。 Further, by referring to the invention document evaluation information included in the patent application-related information output by the invention document analysis system, the inventor or patent attorney may be able to appropriately correct the invention document. Further, by checking the invention document evaluation information, the translator can recognize whether or not the invention document is suitable for translation. Invention documents that include inappropriate descriptions, for example, are likely to cause translation errors, and it is possible that a translator may revise and translate the invention document in order to obtain appropriate rights (for example, to obtain patent rights). . Therefore, if the warning information in the patent application-related information generated based on the invention document includes invention document evaluation information indicating relatively low conformity with the standard provisions for invention documents for translation, It can be judged that there is a high possibility that there may be discrepancies in content between the invention document and the translation result document, which is the result of translation based on the invention document, other than the language being different. It may be possible to determine that it is not useful to use the combination of the invention document and the translation result document as teacher data for machine learning in order to generate the translation learning model to be used.

また、例えば、前記翻訳用発明文書標準規定は、当該翻訳用発明文書標準規定のバージョンを示すバージョン情報と、発明文書が当該翻訳用発明文書標準規定で定められた複数の条件各々に適合しているか否かに係る判定を行う処理のための検査プログラムとを含み、前記翻訳用発明文書標準規定取得部は、ネットワーク上のリソースとしての前記翻訳用発明文書標準規定にアクセスして、既に取得している前記翻訳用発明文書標準規定の前記バージョン情報が示すバージョンより新しいバージョンの翻訳用発明文書標準規定が取得可能であれば、当該新しいバージョンの翻訳用発明文書標準規定を取得し、前記分析部は、前記翻訳用発明文書標準規定に含まれる前記検査プログラムの実行により、前記文書取得部により取得された発明文書が前記翻訳用発明文書標準規定で定められた複数の条件各々に適合しているか否かを判定し、当該判定の結果を用いることで前記警告情報の生成を行うこととしてもよい。 Further, for example, the standard specification of invention documents for translation includes version information indicating the version of the standard specification of invention documents for translation, and whether the invention document conforms to each of a plurality of conditions stipulated in the standard specification of invention documents for translation. and an inspection program for processing for determining whether or not there is an invention document standard specification for translation, and the acquisition unit accesses the invention document standard specification for translation as a resource on the network and has already acquired If it is possible to acquire a newer version of the invention document standard specification for translation than the version indicated by the version information of the invention document standard specification for translation, the new version of the invention document standard specification for translation is acquired, and the analysis unit Whether the invention document acquired by the document acquisition unit by executing the inspection program included in the standard specification of invention documents for translation conforms to each of the plurality of conditions stipulated in the standard specification of invention documents for translation The warning information may be generated by determining whether or not, and using the result of the determination.

翻訳用発明文書標準規定が、例えば、翻訳用の発明文書の標準化を目的とした団体等といった特定団体又は特定者により制定された規定であって、インターネット等のネットワーク上に提供(例えば公開等)されたものである場合においては、時を経るにつれて、制定した特定団体又は特定者によって翻訳用発明文書標準規定をより適切なものにするためのバージョンアップがなされ得るが、この発明文書分析システムによれば、必要な時において新しいバージョンの翻訳用発明文書標準規定をネットワークから取得して発明文書の分析、(つまり警告情報の生成等)に利用するので、分析時において適切な分析(つまり警告情報の生成等)がなされ得る。 Standard provisions for invention documents for translation are, for example, provisions established by a specific organization or a specific person, such as an organization aiming to standardize invention documents for translation, and are provided on a network such as the Internet (for example, public, etc.) In that case, over time, the specific organization or person who enacted the invention document standard specification for translation may be upgraded to make it more appropriate, but this invention document analysis system According to this, when necessary, a new version of the invention document standard specification for translation is acquired from the network and used for analysis of the invention document (that is, generation of warning information, etc.), so appropriate analysis (that is, warning information , etc.) can be performed.

また、例えば、前記クレーム翻訳情報及び前記明細書翻訳情報における前記完全翻訳行は、機械翻訳のための学習モデルである翻訳用学習モデルを利用した機械翻訳の結果として生成され、前記発明文書分析システムは、翻訳対象となる発明文書が満たすべき複数の条件を定めた翻訳用発明文書標準規定を取得する翻訳用発明文書標準規定取得部を含み、前記翻訳用発明文書標準規定は、翻訳対象となる発明文書が満たすべき条件を定める情報として、当該条件を満たさない不適切な可能性がある記載部分についての文字列のパターンを表した不適切文字列パターンを示す不適切文字列パターン情報と、当該記載部分の修正方法に関する修正情報とを対応付けて含み、前記発明文書分析システムは、機械学習部を含み、前記機械学習部は、前記文書取得部により取得された発明文書中に、前記翻訳用発明文書標準規定で定められた条件に係る前記不適切文字列パターン情報が示す前記不適切文字列パターンに該当する文字列が存在した場合には、当該発明文書の内容と、当該不適切文字列パターン情報に対応付けられた前記修正情報とに基づいて、当該条件を満たすように当該発明文書の内容を修正することで生成される修正版発明文書と、当該発明文書に対応する翻訳結果文書との組を教師データとして用いた機械学習により、機械翻訳のための学習モデルである前記翻訳用学習モデルを生成する機能を含むこととしてもよい。 Further, for example, the complete translation line in the claim translation information and the specification translation information is generated as a result of machine translation using a translation learning model, which is a learning model for machine translation, and the invention document analysis system includes an invention document standard specification acquisition unit for acquiring an invention document standard specification for translation that defines a plurality of conditions to be satisfied by an invention document to be translated, and the invention document standard specification for translation is to be translated. Inappropriate character string pattern information indicating an inappropriate character string pattern representing a character string pattern of a possibly inappropriate description part that does not satisfy the conditions, as information that defines the conditions to be satisfied by the invention document; The invention document analysis system includes correction information related to a method of correcting the description portion in association with the invention document analysis system, and the machine learning unit stores the translation information in the invention document acquired by the document acquisition unit. If there is a character string corresponding to the inappropriate character string pattern indicated by the inappropriate character string pattern information related to the conditions stipulated in the standard provisions of the invention document, the contents of the invention document and the inappropriate character string A modified invention document generated by modifying the contents of the invention document so as to meet the conditions based on the modification information associated with the pattern information, and a translation result document corresponding to the invention document. It is also possible to include a function of generating the learning model for translation, which is a learning model for machine translation, by machine learning using a set of as teacher data.

これにより、機械学習用の教師データとして用いられる修正版発明文書と翻訳結果文書とは、相互の内容の齟齬が低減されたものとなる可能性があるので、発明文書分析システムにより適切な翻訳用学習モデルが生成される可能性がある。また、発明文書分析システムにおいて、その適切な翻訳用学習モデルを利用した演算処理により発明文書を機械翻訳することが可能となる。この発明文書の機械翻訳の結果としてのクレーム翻訳情報及び明細書翻訳情報における完全翻訳行を参照し、適宜修正することで、翻訳者は、発明文書を効率的に又は適正に翻訳することが可能となり得る。 As a result, there is a possibility that the modified invention document and the translation result document used as training data for machine learning will have reduced discrepancies in their contents, so that the invention document analysis system can A learning model may be generated. In addition, in the invention document analysis system, it becomes possible to machine-translate the invention document by arithmetic processing using the appropriate learning model for translation. The translator can translate the invention document efficiently or properly by referring to the complete translation line in the claim translation information and the description translation information as a result of the machine translation of the invention document and correcting them accordingly. can be.

また、例えば、前記発明文書分析システムは、複数の発明文書各々から前記重要語句抽出部により抽出された重要語句群間の相関性に基づいて、又は、ユーザによる指定に基づいて、発明文書のグループ分類を実行し、グループ毎に、発明文書から抽出された重要語句と、対応する対応翻訳語との複数組を教師データとした機械学習により、重要語句の機械翻訳のための学習モデルである重要語句翻訳用学習モデルを生成し、前記文書取得部により取得された一の発明文書に基づき生成された前記クレーム翻訳情報及び前記明細書翻訳情報の前記部分翻訳行における対応翻訳語は、当該一の発明文書が属するグループの重要語句翻訳用学習モデルを利用した機械翻訳の結果として生成されたものであることとしてもよい。このグループ分類は、例えば発明の属する技術分野が同一である複数の発明文書各々から抽出された重要語句群間の相関性は一定程度以上高いと想定できることから、発明文書に係る発明の属する技術分野の分類であり得るし、ユーザによる指定に基づいて、IPCで分類した場合におけるIPCのセクション、或いは、セクション及びクラスが相違するものを互いに異なるグループとするような分類であり得るし、ユーザによる指定に基づいて、一の発明文書で示された発明を創作した発明者の所属部門を、他の部門と区別するように、発明文書に係る発明者の所属部門別に異なるグループとするような分類であり得るが、発明者等、弁理士、或いは、翻訳者にとって有用なグループ分類がなされるように運用することが想定される。 In addition, for example, the invention document analysis system, based on the correlation between key phrase groups extracted from each of a plurality of invention documents by the key phrase extraction unit, or based on a user's designation, groups invention documents. Classification is performed, and for each group, a learning model for machine translation of important phrases is created by machine learning using multiple pairs of key phrases extracted from invention documents and corresponding translated words as training data. A learning model for word translation is generated, and the corresponding translated word in the partial translation line of the claim translation information and the specification translation information generated based on one invention document acquired by the document acquisition unit is the one It may be generated as a result of machine translation using the important phrase translation learning model of the group to which the invention document belongs. In this grouping, for example, it can be assumed that the correlation between key phrase groups extracted from each of a plurality of invention documents to which the invention belongs is high to a certain extent or higher, so that the technical field to which the invention pertaining to the invention document belongs can be a classification based on the user's designation, and can be a classification such that sections of the IPC in the case of classification by IPC, or sections and classes that are different are grouped differently from each other. In order to distinguish the department to which the inventor who created the invention indicated in one invention document belongs from other departments based on Although it is possible, it is assumed that the inventors, etc., patent attorneys, or translators will operate so as to make useful group classifications.

これにより、発明文書が属するグループに適合した重要語句翻訳用学習モデルを利用した演算処理により発明文書における各重要語句を機械翻訳することが可能となり得る。また、クレーム翻訳情報及び明細書翻訳情報の部分翻訳行を参照することで、翻訳者は、発明文書の重要語句を効率的に又は適正に翻訳することが可能となり得る。 As a result, it is possible to machine-translate each of the important phrases in the invention document by arithmetic processing using the important phrase translation learning model adapted to the group to which the invention document belongs. Also, by referring to the partial translation lines of the claim translation information and the description translation information, the translator may be able to efficiently or properly translate the key words of the invention document.

また、例えば、前記発明文書分析システムは、複数の発明文書各々から前記重要語句抽出部により抽出された重要語句群間の相関性に基づいて、又は、ユーザによる指定に基づいて、複数の発明文書のグループ分類を実行し、グループ毎に、発明文書と、対応する翻訳結果文書との複数組を教師データとした機械学習により、機械翻訳のための学習モデルである翻訳用学習モデルを生成し、前記文書取得部により取得された一の発明文書に基づき生成された前記クレーム翻訳情報及び前記明細書翻訳情報における前記完全翻訳行は、当該一の発明文書が属するグループの翻訳用学習モデルを利用した機械翻訳の結果として生成されたものであることとしてもよい。 Further, for example, the invention document analysis system may extract a plurality of invention documents based on the correlation between key phrase groups extracted by the key phrase extraction unit from each of the plurality of invention documents, or based on a user's designation. For each group, a learning model for translation, which is a learning model for machine translation, is generated by machine learning using multiple sets of invention documents and corresponding translation result documents as training data, The complete translation line in the claim translation information and the specification translation information generated based on the one invention document acquired by the document acquisition unit uses the learning model for translation of the group to which the one invention document belongs. It may be generated as a result of machine translation.

これにより、発明文書が属するグループに適合した翻訳用学習モデルを利用した演算処理により発明文書における各重要語句を機械翻訳することが可能となり得る。また、クレーム翻訳情報及び明細書翻訳情報の完全翻訳行を参照することで、翻訳者は、発明文書を効率的に又は適正に翻訳することが可能となり得る。 As a result, it may be possible to machine-translate each key phrase in the invention document by arithmetic processing using a translation learning model suitable for the group to which the invention document belongs. Also, by referring to the complete translation lines of the claim translation information and the specification translation information, the translator may be able to translate the invention document efficiently or properly.

また、例えば、発明文書の前記グループ分類は、複数の発明文書各々から前記重要語句抽出部により抽出された重要語句群間の相関性に基づいて実行され、前記複数の発明文書各々から抽出された重要語句群間の相関性は、前記複数の発明文書各々から抽出された重要語句群の各重要語句について、当該重要語句の属性情報に基づいて決定された当該重要語句の重要度の高さに対応した重み付けを行った上で、算定され、発明文書から抽出された重要語句の前記属性情報は、当該発明文書のクレーム中で当該重要語句が使用されているか否かを識別する情報、当該発明文書中において当該重要語句に対応する符号が存在するか否かを識別する情報、当該発明文書中で当該重要語句の主語としての使用があるか否かを識別する情報、及び、当該重要語句が予め定められた技術用語特有語尾文字列を有するか否かを識別する情報を含むこととしてもよい。 Further, for example, the grouping of the invention documents is performed based on the correlation between the key phrase groups extracted from each of the plurality of invention documents by the key phrase extraction unit, and The correlation between key phrase groups is determined based on the importance of each key phrase of the key phrase group extracted from each of the plurality of invention documents, based on the attribute information of the key phrase. The attribute information of the key words and phrases calculated and extracted from the invention document after performing corresponding weighting is information identifying whether or not the key words and phrases are used in the claims of the invention document, the invention Information identifying whether or not there is a code corresponding to the key phrase in the document, information identifying whether the key phrase is used as a subject in the invention document, and information identifying whether the key phrase is used as a subject It may also include information identifying whether or not it has a predetermined technical term-specific ending string.

これにより、各重要語句の重要度が、重要語句群間の相関性に反映されるので、グループ分類が重要語句翻訳用学習モデル又は翻訳用学習モデルの生成のためにおいて一層適切なものとなり得る。発明文書分析システムが、そのグループ分類の結果として生成された重要語句翻訳用学習モデル又は翻訳用学習モデルを用いて発明文書を機械翻訳した結果を参照することで、翻訳者は、発明文書をより効率的に翻訳することが可能となり得る。 As a result, the degree of importance of each key phrase is reflected in the correlation between key phrase groups, so group classification can be more appropriate for generation of a learning model for translation of key phrases or a learning model for translation. By referring to the result of machine translation of the invention document by the invention document analysis system using the key phrase translation learning model or the translation learning model generated as a result of the group classification, the translator can further improve the invention document. It may be possible to translate efficiently.

また、例えば、発明文書から抽出された各重要語句についての前記属性情報に基づいて決定された重要度は、当該発明文書における各重要語句が表す各要素の相互間における構成上の包含関係に基づいて、包含側の要素に係る重要語句の重要度が、当該包含側の要素に係る重要語句が表す要素に包含される全ての被包含側の要素に係る各重要語句についての重要度のうちで最高値の重要度の値と同一以上の値となるように更新された後に、重要語句群間の前記相関性の算定に用いられることとしてもよい。 Further, for example, the importance determined based on the attribute information for each key phrase extracted from the invention document is based on the structural inclusion relationship between each element represented by each key phrase in the invention document. , the importance of the important phrases related to the containing element is the degree of importance of each important phrase related to all the included elements contained in the element represented by the important phrase related to the containing element After being updated to a value equal to or greater than the highest importance value, it may be used for calculating the correlation between the important phrase groups.

これにより、構成上の包含関係を有する要素間における被包含側の要素群に係る重要語句のうち、重要度が属性情報に基づいて一旦最も高く決定された重要語句の重要度が、最終的には、包含側の要素に係る重要語句の重要度へ伝播されるので、重要語句に係る構成上の包含関係を踏まえて算定される上述の重要語句群間の相関性に基づくグループ分類の結果は、重要語句翻訳用学習モデル又は翻訳用学習モデルの生成のためにおいて一層適切なものとなり得る。 As a result, the importance of the important phrase whose importance is once determined to be the highest based on the attribute information among the important phrases related to the contained element group between the elements having the structural inclusion relationship is finally changed to is propagated to the importance of the important phrases related to the element on the inclusion side, so the result of grouping based on the correlation between the above-mentioned important phrase groups calculated based on the compositional inclusion relation related to the important phrases is , for the generation of learning models for key phrase translation or learning models for translation.

また、例えば、前記文書取得部により取得された発明文書について生成された前記特許出願関連情報に係る前記表示用文書における重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、当該表示要素の操作に応じて、当該重要語句に対する前記属性情報を表示する処理と、当該発明文書に基づく前記クレーム情報、前記明細書情報、又は、当該発明文書とは別の発明文書から、当該重要語句を含む行を列挙して表示する重要語句包含記載列挙処理と、ネットワーク上の検索サイトで、当該重要語句を含むウェブページ、当該重要語句の定義、当該重要語句の類義語、若しくは、当該重要語句の関連画像を検索する処理、又は、ネットワーク上の翻訳サイトで当該重要語句を翻訳させる処理とを実行するGUIとして機能させるものであり、前記重要語句包含記載列挙処理は、操作対象となった重要語句を含む行を、前記クレーム情報、前記明細書情報又は前記別の発明文書から、列挙して表示し、当該列挙して表示した各行における当該重要語句については強調表示を行い、表示した行には、当該行に対する操作に応じて、前記クレーム情報、前記明細書情報又は前記別の発明文書における当該行を含む複数行へのリンク表示のためのGUIとして当該行を機能させるための表示制御情報を付加する処理であることとしてもよい。 Further, for example, the display control information related to key phrases in the display document related to the patent application-related information generated for the invention document acquired by the document acquisition unit is configured to display elements of the key phrases in the display. A process for displaying the attribute information for the key phrase in response to the operation of the element, and the claim information based on the invention document, the description information, or the key phrase from an invention document other than the invention document. Important phrase inclusion description listing process for listing and displaying lines containing It functions as a GUI for executing a process of retrieving related images or a process of translating the relevant key words on a translation site on the network. are listed and displayed from the claim information, the specification information, or the separate invention document, and the key phrase in each listed and displayed line is highlighted, and in the displayed line , display control information for causing the line to function as a GUI for displaying links to multiple lines including the line in the claim information, the specification information, or the another invention document in response to an operation on the line. It may be a process of adding.

これにより、ブラウザ等により表示された表示用文書に係る特許出願関連情報を閲覧した翻訳者等は、表示された特許出願関連情報中の重要語句に対する操作により、その重要語句の属性情報、重要語句の検索結果(例えば重要語句を含むウェブページ、重要語句の定義、類義語、関連画像)、重要語句の翻訳結果等の情報を知得することが可能となり得るので、発明文書における重要語句について効率的に又は適正に理解することが可能となり得る。このため、翻訳者は、重要語句に対する翻訳語句を効率的に又は適正に決定することが可能となり得る。 As a result, a translator, etc. who browses the patent application-related information related to the display document displayed by a browser or the like can operate the key words in the displayed patent application-related information to search results (e.g. web pages containing key words, definitions of key words, synonyms, related images), translation results of key words, etc., so that important words in invention documents can be efficiently Or it may be possible to understand properly. This may allow the translator to efficiently or properly determine translation terms for key terms.

また、翻訳者等は、操作した重要語句を含むことで重要語句包含記載列挙処理により列挙された行におけるその重要語句が強調表示されるので、その重要語句を的確に識別できる。また、翻訳者等は、操作した重要語句を含むことで重要語句包含記載列挙処理により列挙された行のうちの1つの行に対して更に操作することで、更に表示されることになるその1つの行に前後する、クレーム情報、明細書情報又は別の発明文書における複数行を、容易に確認可能となる。 In addition, by including the manipulated important phrase, the important phrase in the line listed by the important phrase inclusion description enumeration process is highlighted, so that the translator can accurately identify the important phrase. In addition, the translator or the like further operates one of the lines listed by the important phrase inclusion description enumeration process by including the operated important phrase, so that it is further displayed. Multiple lines of claim information, specification information, or other invention documents that precede or follow a single line can be readily identified.

また、例えば、前記発明文書から抽出された重要語句に関連する前記付加情報に含まれる前記表示制御情報は、前記決定処理を実行するための前記スクリプトの実行によって当該決定処理の実行結果として対応翻訳語が決定された各重要語句について当該重要語句と該当の対応翻訳語とを対応付けた情報である翻訳補助情報を生成して出力する処理を実行するためのスクリプトを含み、前記文書取得部により取得された発明文書の一の重要語句に関連する前記付加情報に含まれる前記翻訳語情報が前記翻訳語候補集合である場合には、当該翻訳語候補集合の要素は、前記発明文書システムによって、過去に、1つ以上の発明文書各々について、当該発明文書の前記分析部による分析結果に基づいて生成された前記特許出願関連情報に係る前記表示用文書が前記出力部に出力されて表示のために利用された結果としての、当該1つ以上の発明文書各々における各重要語句について生成された前記翻訳補助情報に基づいて、特定されたものであり、前記文書取得部により取得された発明文書の一の重要語句に関連する前記付加情報に含まれる前記翻訳語情報が対応翻訳語である場合には、当該対応翻訳語は、当該一の重要語句に対する前記翻訳補助情報を用いることで決定されたものであることとしてもよい。 Further, for example, the display control information included in the additional information related to the important phrases extracted from the invention document is translated as a result of execution of the decision processing by executing the script for executing the decision processing. A script for executing processing for generating and outputting translation assistance information, which is information in which each key phrase for which a word has been determined is associated with the key phrase and the corresponding translated word, wherein the document acquisition unit When the translation word information included in the additional information related to one key phrase of the acquired invention document is the translation word candidate set, the elements of the translation word candidate set are: In the past, for each of one or more invention documents, the display document related to the patent application related information generated based on the analysis result of the invention document by the analysis unit was output to the output unit for display. of the invention document, which is specified based on the translation assistance information generated for each key phrase in each of the one or more invention documents as a result of the use of the invention document acquired by the document acquisition unit When the translated word information included in the additional information related to one important phrase is a corresponding translated word, the corresponding translated word is determined by using the translation assistance information for the one important phrase. It may be a thing.

これにより、翻訳者による表示用文書の翻訳語候補集合に係るGUI要素に対する選択操作の結果が、その後に、翻訳補助情報を介して、発明文書分析システムによる重要語句に対応する対応翻訳語の決定について又は重要語句に対する翻訳語候補集合の特定についての妥当性を向上させる可能性がある。 As a result, the results of the selection operation performed by the translator on the GUI elements related to the translation word candidate set of the document for display are then used by the invention document analysis system to determine the corresponding translation words corresponding to the important words and phrases via the translation auxiliary information. or the validity of identifying a translation word candidate set for key phrases.

また、例えば、前記文書取得部により取得された発明文書の一の重要語句に関連する前記付加情報に含まれる前記翻訳語情報が前記翻訳語候補集合である場合には、当該翻訳語候補集合の要素は、前記発明文書分析システムによって、過去に、複数の発明文書各々に基づいて出力された前記表示用文書各々が表示された結果として生成された複数の前記翻訳補助情報各々における、重要語句と、対応する対応翻訳語との組を、重要語句翻訳用の機械学習のための教師データとして用いて、機械学習により生成された学習モデルである重要語句翻訳用学習モデルを利用した機械翻訳の結果として、特定されたものであり、前記文書取得部により取得された発明文書の一の重要語句に関連する前記付加情報に含まれる前記翻訳語情報が対応翻訳語である場合には、当該対応翻訳語は、前記翻訳補助情報に基づいて生成された前記重要語句翻訳用学習モデルを利用した、当該一の重要語句の機械翻訳の結果として、決定されたものであることとしてもよい。 Further, for example, when the translation word information included in the additional information related to one key phrase of the invention document acquired by the document acquisition unit is the translation word candidate set, the translation word candidate set Elements are important words and phrases in each of the plurality of translation assistance information generated as a result of displaying each of the display documents output based on each of the plurality of invention documents in the past by the invention document analysis system. , a set of corresponding translation words as training data for machine learning for translation of key phrases, and results of machine translation using a learning model for translation of key phrases, which is a learning model generated by machine learning. , and when the translation word information included in the additional information related to one key phrase of the invention document acquired by the document acquisition unit is the corresponding translation word, the corresponding translation The word may be determined as a result of machine translation of the one key phrase using the learning model for key phrase translation generated based on the translation auxiliary information.

これにより、翻訳者による表示用文書の翻訳語候補集合に係るGUI要素に対する選択操作の結果として生成された翻訳補助情報に基づき生成された重要語句翻訳用学習モデルが、後に、発明文書分析システムに用いられることにより、発明文書分析システムによる重要語句に対応する対応翻訳語の決定について又は重要語句に対する翻訳語候補集合の特定についての妥当性が向上し得る。 As a result, the important word translation learning model generated based on the translation assistance information generated as a result of the translator's selection operation on the GUI elements related to the translation word candidate set of the display document is later applied to the invention document analysis system. By using it, the validity of determining the corresponding translation word corresponding to the key word or specifying the translation word candidate set for the key word by the invention document analysis system can be improved.

また、例えば、前記文書取得部は複数の発明文書を取得し、前記出力部は、前記文書取得部により取得された複数の発明文書各々に対して出力された前記表示用文書各々が表示された結果として生成された複数の前記翻訳補助情報各々における、重要語句と、対応する対応翻訳語との組を、重要語句翻訳用の機械学習のための教師データとして用いて、機械学習により生成された学習モデルである重要語句翻訳用学習モデルを出力する学習モデル出力部を含むこととしてもよい。 Further, for example, the document acquisition unit acquires a plurality of invention documents, and the output unit displays each of the display documents output for each of the plurality of invention documents acquired by the document acquisition unit. generated by machine learning using pairs of key phrases and corresponding translation words in each of the plurality of translation auxiliary information generated as a result as training data for machine learning for translation of key phrases A learning model output unit for outputting a learning model for translation of important phrases, which is a learning model, may be included.

これにより、発明文書の機械翻訳を行うための機械翻訳システム等において、その重要語句翻訳用学習モデルを用いて重要語句を入力とする演算処理を実行することで、発明文書における重要語句についての機械翻訳が、実現され得る。 As a result, in a machine translation system or the like for performing machine translation of invention documents, by executing arithmetic processing with key phrases as input using the learning model for translation of key phrases, machine translation of key phrases in invention documents can be performed. A translation can be realized.

この機械翻訳の結果を参照することで、翻訳者は、発明文書における重要語句を翻訳した翻訳語句を効率的に又は適正に決定することが可能となり得る。 By referring to the results of this machine translation, the translator may be able to efficiently or properly determine the translated words and phrases for the key words and phrases in the invention document.

また、例えば、前記文書取得部により取得された発明文書について生成された前記特許出願関連情報に係る前記表示用文書における、当該発明文書から前記重要語句抽出部により抽出された重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、当該表示要素の操作に応じて、当該重要語句の属性情報を表示する処理と、当該発明文書に基づく前記クレーム情報及び前記明細書情報から当該重要語句を含む行を列挙して表示する重要語句包含記載列挙処理と、ネットワーク上の検索サイトで当該重要語句を含むウェブページ、当該重要語句の定義、当該重要語句の類義語、若しくは、当該重要語句の関連画像を検索する処理、又は、ネットワーク上の翻訳サイトで当該重要語句を翻訳させる処理とを実行するGUIとして機能させるものであり、前記発明文書から抽出された重要語句の前記属性情報は、当該発明文書のクレーム中で当該重要語句が使用されている場合に当該重要語句が記載されたクレームの項の項番を示す情報と、当該発明文書中において当該重要語句に符号が付加された記載が存在する場合に当該符号を示す情報とを含むこととしてもよい。 Further, for example, in the display document related to the patent application-related information generated for the invention document acquired by the document acquisition unit, the display related to the key phrase extracted from the invention document by the key phrase extraction unit The control information includes processing for displaying the display element of the key phrase, attribute information of the key phrase in response to the operation of the display element, and processing of the key phrase from the claim information and the specification information based on the invention document. Important phrase inclusion description enumeration process for listing and displaying lines containing , web pages containing the relevant important phrases on a network search site, definitions of the relevant important phrases, synonyms of the relevant important phrases, or relationships of the relevant important phrases It functions as a GUI for executing a process of searching for an image or a process of translating the key phrase on a translation site on the network, and the attribute information of the key phrase extracted from the invention document is used for the invention. If the key phrase is used in the claims of the document, information indicating the paragraph number of the claim that includes the key phrase, and the description in the invention document with the key phrase added with a code. It is also possible to include information indicating the code when doing so.

これにより、ブラウザ等により表示された表示用文書に係る特許出願関連情報を閲覧した翻訳者等は、表示された特許出願関連情報中の重要語句に対する操作により、その重要語句の属性情報としての重要語句が記載されたクレームの項番及び重要語句に対応する符号、重要語句の検索結果(例えば重要語句を含むウェブページ、重要語句の定義、類義語、関連画像)、重要語句の翻訳結果等の情報を知得することが可能となり得るので、発明文書における重要語句について効率的に又は適正に理解することが可能となり得る。このため、翻訳者は、重要語句に対する翻訳語句を効率的に又は適正に決定することが可能となり得る。 As a result, translators, etc., who have browsed the patent application-related information related to the display document displayed by a browser, etc., can operate the key words in the displayed patent application-related information, and the important words as attribute information of the key words. Information such as the claim number in which the phrase is stated, the code corresponding to the key phrase, the search results of the key phrase (e.g. web pages containing the key phrase, the definition of the key phrase, synonyms, related images), the translation results of the key phrase, etc. Because it may be possible to know the key terms in the invention document, it may be possible to efficiently or properly understand the key terms. This may allow the translator to efficiently or properly determine translation terms for key terms.

また、本開示における発明文書分析処理プログラムは、マイクロプロセッサ(Microprocessor)を備える機器に、技術的思想を日本語で表した特許出願用のクレーム又は明細書を記載した文書である発明文書を分析する発明文書分析処理を、行わせるための発明文書分析処理プログラムであって、前記発明文書分析処理は、重要語句の抽出の条件を示す条件情報を含む設定情報を取得する設定情報取得ステップと、発明文書を取得する文書取得ステップと、前記文書取得ステップにより取得された発明文書を、前記設定情報に基づいて分析する分析ステップと、前記文書取得ステップにより取得された発明文書についての前記分析ステップによる分析結果に基づいて生成された情報を出力する出力ステップとを含み、前記分析ステップは、前記文書取得ステップにより取得された発明文書から前記設定情報に基づいて重要語句を抽出する重要語句抽出ステップを含み、前記出力ステップでは、前記文書取得ステップにより取得された発明文書から前記重要語句抽出ステップにより抽出された複数の重要語句各々に基づいて生成された情報を出力する発明文書分析処理プログラムである。
この発明文書分析処理プログラムを、マイクロプロセッサを備える機器等にインストールすることで、その機器等は、発明文書分析処理を実現し得る。この発明文書分析処理プログラムにより実現される発明文書分析処理により、出力された情報を参照することで、翻訳者等にとっては、発明文書の理解が促進される可能性がある。発明文書の理解の促進は、翻訳者にとって発明文書を適切に又は効率的に翻訳するために有用となる。
In addition, the invention document analysis processing program in the present disclosure analyzes an invention document, which is a document describing a claim or specification for a patent application expressing a technical idea in Japanese, in a device equipped with a microprocessor. An invention document analysis processing program for performing invention document analysis processing, wherein the invention document analysis processing includes a setting information acquisition step of acquiring setting information including condition information indicating conditions for extracting key words; a document acquisition step of acquiring a document; an analysis step of analyzing the invention document acquired by the document acquisition step based on the setting information; and an analysis by the analysis step of the invention document acquired by the document acquisition step. an output step of outputting information generated based on the result, and the analysis step includes an important phrase extraction step of extracting important phrases from the invention document acquired by the document acquisition step based on the setting information. and the output step outputs information generated based on each of the plurality of important phrases extracted by the important phrase extraction step from the invention document acquired by the document acquisition step.
By installing this invention document analysis processing program in a device or the like having a microprocessor, the device or the like can implement the invention document analysis processing. By referring to the information output by the invention document analysis processing realized by this invention document analysis processing program, there is a possibility that translators and the like will be able to facilitate understanding of the invention document. Facilitating the understanding of the invention document is useful for translators to translate the invention document appropriately or efficiently.

また、本開示における表示用文書は、上述した発明文書分析システムにより出力され、コンピュータプログラムとしてのスクリプトを含み得るデータであり、マークアップ言語で記述された文書を含むデータである。本開示における表示用文書は、マークアップ言語で記述された文書を含み、マイクロプロセッサを備える機器におけるブラウザによる解釈の対象とされ、上述した発明文書分析システムにより生成された上述の特許出願関連情報を、表示されるべき内容として含む。
この表示用文書を、マイクロプロセッサを備える機器におけるブラウザに解釈させることで、特許出願関連情報が表示される。この特許出願関連情報を参照することで、翻訳者等にとって発明文書の理解が促進される可能性がある。
In addition, the display document in the present disclosure is data output by the invention document analysis system described above, which may include a script as a computer program, and is data including a document written in a markup language. Documents for display in the present disclosure include documents written in a markup language, are subject to interpretation by a browser in a device equipped with a microprocessor, and display the above-mentioned patent application-related information generated by the above-described invention document analysis system. , as content to be displayed.
The patent application-related information is displayed by causing the browser in the device having the microprocessor to interpret this display document. By referring to this patent application-related information, there is a possibility that the understanding of the invention document will be promoted for translators and the like.

本開示に係る発明文書分析システム及び発明文書分析処理プログラムは、発明文書の分析に利用可能であり、本開示に係る表示用文書は、発明文書の理解の促進のために利用可能である。 The invention document analysis system and invention document analysis processing program according to the present disclosure can be used to analyze invention documents, and the display document according to the present disclosure can be used to promote understanding of invention documents.

10,20 発明文書分析システム
10a,10c,10d,10e,10g,10h 端末装置
10b,10f,10i サーバ装置
101,201 設定情報取得部
102,202 文書取得部
103,203 重要語句設定辞書取得部
104,204 翻訳用発明文書標準規定取得部
105,205 分析部
106,2071 文書評価部
107,207 機械学習部
108,208 出力部
1051,2051 重要語句抽出部
10511 第1抽出部
10512 第2抽出部
10513 第3抽出部
10514 第4抽出部
1052,20541 翻訳語候補集合特定部
1053,2053 分類部
10531,20531 技術分野特定部
1054,2054 翻訳部
1081,2081 学習モデル出力部
2021 発明文書取得部
2022 図面文書取得部
2023 翻訳結果文書取得部
2055 重要度決定部
2056 属性特定部
2057 クレーム引用関係検出部
2058 要素間関係判別部
2059 警告情報生成部
205a クレーム情報生成部
205b 明細書情報生成部
205c クレームツリー生成部
2072 教師データ蓄積部
2073 学習モデル管理部
2082 特許出願関連情報出力部
2083 表示用文書生成部
2084 表示部
20841 操作受付部
10, 20 invention document analysis system 10a, 10c, 10d, 10e, 10g, 10h terminal device 10b, 10f, 10i server device 101, 201 setting information acquisition unit 102, 202 document acquisition unit 103, 203 important phrase setting dictionary acquisition unit 104 , 204 invention document standard definition acquisition unit for translation 105, 205 analysis unit 106, 2071 document evaluation unit 107, 207 machine learning unit 108, 208 output unit 1051, 2051 key phrase extraction unit 10511 first extraction unit 10512 second extraction unit 10513 Third extraction unit 10514 Fourth extraction unit 1052, 20541 Translation word candidate set identification unit 1053, 2053 Classification unit 10531, 20531 Technical field identification unit 1054, 2054 Translation unit 1081, 2081 Learning model output unit 2021 Invention document acquisition unit 2022 Drawing document Acquisition unit 2023 Translation result document acquisition unit 2055 Importance determination unit 2056 Attribute identification unit 2057 Claim citation relation detection unit 2058 Inter-element relation determination unit 2059 Warning information generation unit 205a Claim information generation unit 205b Description information generation unit 205c Claim tree generation unit 2072 Teacher data accumulation unit 2073 Learning model management unit 2082 Patent application related information output unit 2083 Display document generation unit 2084 Display unit 20841 Operation reception unit

Claims (35)

技術的思想を日本語で表した、特許出願用のクレーム及び明細書を記載した文書である発明文書を、分析する発明文書分析システムであって、
重要語句の抽出の条件を示す条件情報を含む設定情報を取得する設定情報取得部と、
発明文書を取得する文書取得部と、
前記文書取得部により取得された発明文書を、前記設定情報に基づいて分析する分析部と、
前記文書取得部により取得された発明文書についての前記分析部による分析結果に基づいて生成された情報を出力する出力部とを含み、
前記分析部は、前記文書取得部により取得された発明文書から前記設定情報に基づいて重要語句を抽出する重要語句抽出部を含み、
前記出力部は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々に基づいて生成された情報を出力する
発明文書分析システム。
An invention document analysis system for analyzing an invention document, which is a document describing claims and specifications for a patent application, in which a technical idea is expressed in Japanese,
a setting information acquisition unit for acquiring setting information including condition information indicating conditions for extracting key words;
a document acquisition unit that acquires an invention document;
an analysis unit that analyzes the invention document acquired by the document acquisition unit based on the setting information;
an output unit that outputs information generated based on the analysis result of the analysis unit for the invention document acquired by the document acquisition unit;
The analysis unit includes an important phrase extraction unit that extracts important phrases based on the setting information from the invention document acquired by the document acquisition unit,
The invention document analysis system, wherein the output unit outputs information generated based on each of the plurality of important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit.
記出力部は、前記文書取得部により取得された発明文書についての前記分析部による分析結果に基づいて生成された特許出願関連情報を出力し、
前記特許出願関連情報は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された複数の重要語句各々が、表示されるべき内容として含まれた、表示用文書として出力され、
前記特許出願関連情報は、前記表示用文書において表示されるべき、前記文書取得部により取得された発明文書の前記クレームの内容を表すクレーム情報を含み、
前記文書取得部により取得された発明文書のクレームの内容を表す前記クレーム情報は、当該発明文書から前記重要語句抽出部により抽出された当該クレーム中の複数の重要語句各々について、当該重要語句の表示態様を制御するための表示制御情報を含み、
前記特許出願関連情報は、前記表示用文書において表示されるべき、前記文書取得部により取得された発明文書の前記明細書の内容を表す明細書情報を含み、
前記文書取得部により取得された発明文書の明細書の内容を表す前記明細書情報は、当該発明文書から前記重要語句抽出部により抽出された当該明細書中の複数の重要語句各々について、当該重要語句の表示態様を制御するための表示制御情報を含み、
前記クレーム情報及び前記明細書情報における、前記重要語句抽出部により抽出された複数の重要語句各々についての、当該重要語句の表示態様を制御するための前記表示制御情報は、当該表示制御情報に対応する当該重要語句の表示態様を、前記クレーム情報及び前記明細書情報における当該複数の重要語句以外の語句の表示態様と相違させるための強調表示情報を含み、
前記クレーム情報に表される重要語句のうち、重要語句を構成する文字列が互いに相違する複数の重要語句各々に対応する、表示態様を制御するための前記表示制御情報各々は、当該複数の重要語句各々を互いに相違する表示態様で表示するように制御するための、互いに相違する識別情報を含み、
前記明細書情報に表される重要語句のうち、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の重要語句の表示態様を制御するための前記表示制御情報は、当該重要語句の表示要素を、前記クレーム情報における前記1つの重要語句の表示要素の表示態様と少なくとも一部において同様の表示態様で表示するように制御するための情報を含
請求項1記載の発明文書分析システム。
The output unit outputs patent application related information generated based on the analysis result of the analysis unit for the invention document acquired by the document acquisition unit,
The patent application-related information is output as a display document containing, as contents to be displayed, each of a plurality of important phrases extracted by the important phrase extraction unit from the invention document acquired by the document acquisition unit. ,
The patent application related information includes claim information representing the content of the claim of the invention document acquired by the document acquisition unit, which is to be displayed in the display document,
The claim information representing the content of the claim of the invention document acquired by the document acquisition unit is a display of the key phrase for each of a plurality of key phrases in the claim extracted from the invention document by the key phrase extraction unit. including display control information for controlling aspects,
The patent application related information includes specification information representing the content of the specification of the invention document acquired by the document acquisition unit, which should be displayed in the display document,
The description information representing the content of the specification of the invention document acquired by the document acquisition unit is for each of a plurality of key words in the specification extracted by the key word extraction unit from the invention document, including display control information for controlling the display mode of words,
The display control information for controlling the display mode of each of the plurality of important phrases extracted by the important phrase extraction unit in the claim information and the specification information corresponds to the display control information. including highlighting information for making the display mode of the key words and phrases to be different from the display mode of words and phrases other than the multiple key words and phrases in the claim information and the specification information,
Each of the display control information for controlling a display mode corresponding to each of a plurality of important phrases having different character strings constituting the important phrase among the important phrases represented in the claim information is Including different identification information for controlling each word to be displayed in a different display mode,
A mode of displaying key words and phrases that are the same as any one of the plurality of key words and phrases in which the character strings constituting the key words and phrases in the claim information are different from each other, among the key words and phrases represented in the specification information. The display control information for controlling the display element of the key phrase is controlled to be displayed in a display mode that is at least partially similar to the display mode of the display element of the one key phrase in the claim information. contains information for
The invention document analysis system according to claim 1.
前記文書取得部により取得された発明文書のクレームの内容を表す前記クレーム情報が含む、前記重要語句抽出部により抽出された当該クレーム中の複数の重要語句各々についての、当該重要語句に係る前記表示制御情報は、当該重要語句に付加される表示色を示す情報を含み、
前記文書取得部により取得された発明文書の明細書の内容を表す前記明細書情報が含む、前記重要語句抽出部により抽出された当該明細書中の複数の重要語句各々についての、当該重要語句に係る前記表示制御情報は、当該重要語句に付加される表示色を示す情報を含み、
前記クレーム情報に表される重要語句のうち、重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る前記表示制御情報は、当該複数の重要語句各々の表示要素を、重要語句毎の前記識別情報に対応して、相違する表示色を付加した表示態様で表示するように制御するための情報を含み、
前記明細書情報に表される重要語句のうち、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句のいずれとも相違する重要語句の表示態様を制御するための前記表示制御情報は、当該重要語句の表示要素を、前記クレーム情報における当該複数の重要語句の表示要素のいずれとも相違する表示態様で表示させるように制御するための情報を含み、
前記明細書情報に表される重要語句のうち、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記クレーム情報における前記1つの重要語句の表示要素の表示態様として付加された表示色と同一の表示色を付加した表示態様で表示するように制御するための情報を含む
請求項2記載の発明文書分析システム。
For each of a plurality of key words in the claim extracted by the key word extracting part, the display related to the key word/phrase included in the claim information representing the content of the claim of the invention document acquired by the document acquiring part. The control information includes information indicating a display color to be added to the important phrase,
For each of a plurality of key phrases in the specification extracted by the key phrase extraction unit, the key phrase is included in the specification information representing the content of the specification of the invention document acquired by the document acquisition unit. The display control information includes information indicating a display color to be added to the important phrase,
The display control information related to each of a plurality of key phrases having different character strings constituting the key phrase among the key phrases represented in the claim information controls the display element of each of the plurality of key phrases for each key phrase. Including information for controlling to display in a display mode with a different display color added, corresponding to the identification information of
the display for controlling the display mode of key words and phrases represented in the specification information that differ from any of the plurality of key words and phrases in which the character strings constituting the key words and phrases in the claim information are different from each other; The control information includes information for controlling the display element of the key phrase to be displayed in a display mode different from any of the display elements of the plurality of key phrases in the claim information,
of the key phrases represented in the specification information, the key phrases that are the same as any one of the plurality of key phrases in which the character strings constituting the key phrases in the claim information are different from each other; The display control information controls to display the display element of the important phrase in a display mode to which the same display color as the display mode of the display element of the one important phrase in the complaint information is added. 3. The invention document analysis system according to claim 2, wherein the information for analyzing the invention document is included.
前記表示用文書は、前記特許出願関連情報を表示されるべき内容として含み、HTML(Hypertext Markup Language)で記載されたHTMLファイルを含むHTML文書であり、
前記クレーム情報における、重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の文字列で構成される、前記クレーム情報における重要語句に係る表示制御情報は、当該重要語句を、前記1つの重要語句の表示態様として付加された表示色と同一の表示色を付加した表示態様で表示するように制御するためのものであり、
前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る前記表示制御情報は、当該複数の重要語句各々を、重要語句毎に相違する表示色で所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであり、
前記明細書情報における、複数の重要語句各々について、当該重要語句が、前記クレーム情報における前記複数の重要語句のうちのいずれか1つの重要語句と同一であれば、前記明細書情報における当該重要語句に係る前記表示制御情報は、当該重要語句を、前記クレーム情報における前記1つの重要語句の表示態様に係る左境界線の表示色と同一の表示色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであり、前記明細書情報における当該重要語句が、前記クレーム情報における当該複数の重要語句のいずれとも相違すれば、前記明細書情報における当該重要語句に係る前記表示制御情報は、当該重要語句を、前記所定幅を有する左境界線が付加されていない表示態様で表示するように制御するためのものである
請求項3記載の発明文書分析システム。
The display document is an HTML document containing an HTML file written in HTML (Hypertext Markup Language) containing the patent application-related information as content to be displayed,
Display control for an important phrase in the complaint information, which is composed of the same character string as any one of the plurality of important phrases in which the character strings constituting the important phrase are different from each other in the complaint information. The information is for controlling to display the key phrase in a display mode to which the same display color as the display mode of the one key phrase is added,
In the claim information, the display control information for each of the plurality of key phrases having different character strings constituting the key phrase has a predetermined width in which each of the plurality of key phrases is displayed in a different display color for each key phrase. It is for controlling to display in a display mode with a left border added,
For each of the plurality of key phrases in the specification information, if the key phrase is the same as any one of the plurality of key phrases in the claim information, the key phrase in the specification information In the display control information relating to the claim information, a left boundary line having the predetermined width is added to the important phrase in the same display color as the left border line according to the display mode of the one important phrase in the claim information. If the key phrase in the description information is different from any of the plurality of key phrases in the claim information, the key phrase in the description information 4. The invention document analysis system according to claim 3, wherein the display control information pertaining to is for controlling to display the important phrase in a display mode in which the left boundary line having the predetermined width is not added.
前記所定幅は、1文字分の幅であり、
前記クレーム情報における、重要語句を構成する文字列が互いに相違する前記複数の重要語句各々について、当該重要語句に係る前記表示制御情報は、当該重要語句を、右境界線、上境界線及び下境界線が付加されていない表示態様で表示するように制御するためのものであり、
前記重要語句毎に相違する表示色は、前記重要語句毎に色相成分が相違する表示色、又は、前記重要語句毎に表示色を表すRGB値の各成分が相違する表示色である
請求項記載の発明文書分析システム。
The predetermined width is a width for one character,
In the claim information, for each of the plurality of key phrases having different character strings constituting the key phrase, the display control information related to the key phrase controls the key phrase as a right boundary line, an upper boundary line, and a lower boundary line. It is for controlling to display in a display mode without lines added,
The different display colors for each of the important phrases are display colors having different hue components for each of the important phrases, or display colors having different components of RGB values representing display colors for each of the important phrases.
The invention document analysis system according to claim 4 .
前記特許出願関連情報は、発明文書から前記重要語句抽出部により抽出された複数の重要語句各々について、当該重要語句の属性情報の少なくとも一部を含む、又は、当該重要語句の属性情報の少なくとも一部に基づく情報を含むThe patent application related information includes at least part of the attribute information of each of the key phrases extracted from the invention document by the key phrase extraction unit, or at least one of the attribute information of the key phrases. Contains information based on
請求項3~5のいずれか一項に記載の発明文書分析システム。The invention document analysis system according to any one of claims 3 to 5.
前記分析部は、前記文書取得部により取得された発明文書に記載されたクレームから前記重要語句抽出部により抽出された重要語句各々が表す要素間の関係について判別し、当該判別の結果を示す重要語句関係情報を生成する要素間関係判別部を含み、
前記特許出願関連情報は、前記重要語句関係情報を含み、
前記要素間関係判別部は、前記重要語句関係情報に、前記発明文書に記載されたクレームから前記重要語句抽出部により抽出された複数の重要語句各々について、当該重要語句の前記属性情報の一部としての、当該重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係を表現した包含関係情報含ませる
請求項記載の発明文書分析システム。
The analysis unit discriminates the relationship between the elements represented by the key words extracted by the key word extraction unit from the claims written in the invention document acquired by the document acquisition unit, including an inter-element relationship determination unit that generates word relationship information;
The patent application related information includes the important phrase related information,
The inter-element relation determining unit stores, in the important phrase relation information , part of the attribute information of the relevant important phrase for each of the plurality of important phrases extracted by the important phrase extraction unit from the claims written in the invention document. 7. The invention document analysis system according to claim 6 , wherein the inclusion relationship information expressing the compositional inclusion relationship between the element represented by the key phrase and the element represented by another key phrase is included .
前記設定情報取得部が取得する前記設定情報にはコメント行又はコメントを特定する情報であるコメント特定用情報が含まれ、
前記分析部は、前記特許出願関連情報中の前記クレーム情報において表される前記クレームの各項の引用関係を木構造の形式で表現したクレームツリーを生成するクレームツリー生成部を含み、
前記特許出願関連情報は、前記クレームツリーを含み、
前記クレームツリー生成部は、
前記クレーム情報におけるクレームの各項について、項番が小さい順に、行を改めて、当該項が引用している項の項番を示す情報を、引用関係の表現用の記号及び項番により表記したクレームツリーを生成し、
当該クレームツリーの各行に係る各項について、
前記クレーム情報における当該項の直前行が前記コメント特定用情報に基づいて特定される所定の形式のコメント行である場合には、当該コメント行の内容を、当該クレームツリーにおける当該項の項番を記載する行に付記し、
前記クレーム情報における当該項の直前行が前記コメント行でない場合において、当該項の見出しと同一の行に、前記コメント特定用情報に基づいて特定される所定の形式でコメントが記載されているときには、当該コメントの内容を、当該クレームツリーにおける当該項の項番を記載する行に付記し、
前記クレーム情報における当該項の直前行が前記コメント行でなく、かつ、当該項の見出しと同一の行に前記コメントが記載されていない場合において、前記発明文書のクレームの当該項に記載され前記重要語句抽出部により抽出された1つ以上の重要語句が存在するときには、当該1つ以上の重要語句のうち少なくとも1つの重要語句を、当該クレームツリーにおける当該項の項番を記載する行に付記し、
前記クレームツリー生成部は、前記特許出願関連情報中の前記クレーム情報において表される前記クレームの各項の引用関係を木構造の形式で表現した構成クレームツリーを生成し、
前記特許出願関連情報は、前記構成クレームツリーを含み、
前記クレームツリー生成部は、前記クレーム情報におけるクレームの各項について、項番が小さい順に、行を改めて、当該項が引用している項の項番を示す情報を、引用関係の表現用の記号及び項番により表記した構成クレームツリーを生成し、当該構成クレームツリーの各行に係る各項について、前記クレーム情報における当該項に記載され前記重要語句抽出部により抽出された1つ以上の重要語句が存在するときには、当該各重要語句を、当該項の項番を記載する行に付記し、当該項に付記すべき重要語句が複数であって当該複数の重要語句各々が表す要素間が構成上の包含関係を有するならば重要語句間の関係を表す記載を当該行に付記する
請求項7記載の発明文書分析システム。
The setting information acquired by the setting information acquisition unit includes comment specifying information that is information specifying a comment line or a comment,
The analysis unit includes a claim tree generation unit that generates a claim tree that expresses the citation relationship of each item of the claim represented in the claim information in the patent application related information in a tree structure format,
The patent application related information includes the claim tree,
The claim tree generator,
For each claim clause in the above claim information, in ascending order of the clause number, on a new line, the claim that indicates the information indicating the clause number of the clause cited by the said clause by the symbol for expressing the citation relationship and the clause number generate a tree,
For each term in each row of such claim tree:
If the line immediately preceding the relevant paragraph in the claim information is a comment line in a prescribed format identified based on the aforementioned comment identifying information, the content of the comment line shall be the number of the relevant paragraph in the claim tree. Append to the line to be described,
If the line immediately preceding the relevant section in the claim information is not the comment line, and a comment is written in a predetermined format specified based on the comment specifying information on the same line as the heading of the relevant section, Append the content of the comment to the line that describes the item number of the item in the claim tree,
If the line immediately preceding the paragraph in the claim information is not the comment line and the comment is not stated on the same line as the heading of the paragraph, the When there are one or more key phrases extracted by the phrase extraction unit, at least one of the one or more key phrases is added to the line describing the item number of the claim tree. ,
The claim tree generation unit generates a configuration claim tree that expresses, in a tree structure format, the citation relationship of each item of the claim represented in the claim information in the patent application related information,
The patent application related information includes the configuration claim tree,
The claim tree generating unit, for each claim clause in the claim information, replaces the line in ascending order of the clause number, and converts information indicating the clause numbers of the clauses cited by the clauses into symbols for expressing citation relationships. and an item number, and for each item related to each line of the configuration claim tree, one or more important phrases described in the relevant item in the claim information and extracted by the important phrase extraction unit are If there is, each key phrase is added to the line that describes the paragraph number of the paragraph, and there are multiple key phrases to be added to the paragraph, and there is a structural gap between the elements represented by each of the multiple key phrases. If there is an inclusion relationship, add a description to the line that shows the relationship between key words
The invention document analysis system according to claim 7 .
前記特許出願関連情報は、前記表示用文書において表示されるべき、前記文書取得部により取得された発明文書の前記明細書の内容を表すクレームベース明細書情報を含み、The patent application-related information includes claim-based specification information representing the content of the specification of the invention document acquired by the document acquisition unit, which should be displayed in the display document,
前記クレームベース明細書情報は、発明を実施するための形態の見出しに後続する記載内容の一部として、前記発明文書に記載されたクレームから前記重要語句抽出部により抽出された複数の重要語句各々についての、当該重要語句の前記属性情報の一部としての、当該重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係を表現した包含関係情報に基づく、包含の許容を表すが必ずしも包含関係を示している訳ではない、適宜修正されて利用されるための記載支援用未完成メッセージ付きの文字列の記載を含むThe claim-based specification information is each of a plurality of key phrases extracted by the key phrase extraction unit from the claims described in the invention document as part of the description content following the heading of the mode for carrying out the invention. , as part of the attribute information of the key phrase, inclusion based on inclusion relationship information that expresses the structural inclusion relationship between the element represented by the key phrase and the element represented by another key phrase Contains a description of a string with an incomplete message for description support to be used with appropriate modification, which represents but does not necessarily indicate inclusion
請求項6~8のいずれか一項に記載の発明文書分析システム。The invention document analysis system according to any one of claims 6 to 8.
前記発明文書分析システムは、前記文書取得部により取得された発明文書に記載されたクレームから前記重要語句抽出部により抽出された複数の重要語句各々のうち当該発明文書において符号が対応していない重要語句については、当該重要語句の前記属性情報の一部としての、当該重要語句が表す要素と他の重要語句が表す要素との構成上の包含関係を表現した包含関係情報に基づき、当該重要語句の前記属性情報の一部としての符号を決定し、The invention document analysis system extracts from the claims written in the invention document acquired by the document acquisition unit the key phrase extraction unit, among the plurality of key phrases extracted by the key phrase extraction unit, key phrases whose codes do not correspond in the invention document. For words and phrases, the important words and phrases are identified based on the inclusion relationship information that expresses the structural inclusion relationship between the elements that the important words and phrases express and the elements that other important words and phrases express, as part of the attribute information of the relevant important words and phrases. determine the sign as part of the attribute information of
前記特許出願関連情報は、前記発明文書に記載されたクレームから前記重要語句抽出部により抽出された複数の重要語句各々について、当該重要語句の前記属性情報の一部としての符号を当該重要語句と関連付けて表した符号リストを含み、The patent application related information includes, for each of a plurality of important phrases extracted by the important phrase extraction unit from the claims described in the invention document, a code as a part of the attribute information of the relevant important phrase as the important phrase. containing an associated code list,
前記特許出願関連情報は、クレームベース図面情報を含み、The patent application related information includes claim-based drawing information,
前記クレームベース図面情報は、前記発明文書に記載されたクレームから前記重要語句抽出部により抽出された複数の重要語句各々についての、当該重要語句の前記属性情報の一部としての符号に基づく構成図を含むThe claim-based drawing information is a configuration diagram based on a code as part of the attribute information of each of a plurality of key words and phrases extracted by the key word extraction unit from the claims described in the invention document. including
請求項6~9のいずれか一項に記載の発明文書分析システム。The invention document analysis system according to any one of claims 6 to 9.
前記特許出願関連情報は、発明文書から前記重要語句抽出部により抽出された重要語句毎に行を改めて重要語句と当該重要語句の属性情報の少なくとも一部とを列挙した重要語句リストを含み、
前記重要語句リストの各行は所定の順序で並べられ、当該順序は、行毎の重要語句について属性情報の少なくとも一部に基づいて決定された重要度の高い順、行毎の重要語句について文字コード順でのソート結果に従った順、行毎の重要語句についての発明文書における使用数の多い順、又は、行毎の重要語句についての発明文書のクレームにおける使用数の多い順である
請求項6~10のいずれか一項に記載の発明文書分析システム。
The patent application-related information includes an important phrase list listing important phrases and at least a part of attribute information of the important phrases extracted from the invention document by the important phrase extracting unit.
Each line of the list of important words and phrases is arranged in a predetermined order. The order according to the result of sorting in order, the descending order of the number of usage in the invention document for the key words for each line, or the descending order of the number of uses in the claims of the invention document for the key words for each line . 11. The invention document analysis system according to any one of -10 .
前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る前記表示制御情報は、当該複数の重要語句各々を、重要語句毎に相違する表示色で所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであり、
前記重要語句リストにおける各重要語句について、当該重要語句が、前記クレーム情報における前記複数の重要語句のうちのいずれか1つの重要語句と同一であれば、前記重要語句リストにおける当該重要語句には、当該重要語句を、前記クレーム情報における前記1つの重要語句の表示態様に係る左境界線の表示色と同一の表示色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御する表示制御情報が付加される
請求項11記載の発明文書分析システム。
In the claim information, the display control information for each of the plurality of key phrases having different character strings constituting the key phrase has a predetermined width in which each of the plurality of key phrases is displayed in a different display color for each key phrase. It is for controlling to display in a display mode with a left border added,
For each key phrase in the key phrase list, if the key phrase is the same as any one of the plurality of key phrases in the claim information, the key phrase in the key phrase list includes: The key phrase is displayed in a display mode to which a left border line having the predetermined width is added in the same display color as the display color of the left border line according to the display mode of the one key phrase in the claim information. 12. The invention document analysis system according to claim 11 , wherein control display control information is added.
前記分析部は、前記文書取得部により取得された発明文書から前記重要語句抽出部により抽出された1つ以上の重要語句について、当該重要語句についての対応翻訳語の候補の集合である翻訳語候補集合を特定するための翻訳語候補集合特定部を含み、
前記重要語句リストの各行は、1つの重要語句と、当該重要語句に対応する対応翻訳語又は翻訳語候補集合とを含む
請求項11又は12記載の発明文書分析システム。
The analysis unit is configured to, for one or more key phrases extracted by the key phrase extraction unit from the invention document acquired by the document acquisition unit, translate word candidates that are a set of corresponding translation word candidates for the key phrases. including a translation word candidate set identification unit for identifying a set,
13. The invention document analysis system according to claim 11 or 12, wherein each line of said important phrase list includes one important phrase and a corresponding translation word or translation word candidate set corresponding to said important phrase.
前記文書取得部により取得された発明文書について生成された前記特許出願関連情報に係る前記表示用文書における、当該発明文書から前記重要語句抽出部により抽出された重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、操作に応じて、当該重要語句の属性情報の少なくとも一部の表示のためのグラフィカルユーザインタフェースとして機能させるものであ
請求項6~13のいずれか一項に記載の発明文書分析システム。
The display control information related to key phrases extracted from the invention document by the key phrase extraction unit in the display document relating to the patent application related information generated for the invention document acquired by the document acquisition unit, The display element of the key phrase functions as a graphical user interface for displaying at least part of the attribute information of the key phrase according to the operation.
The invention document analysis system according to any one of claims 6 to 13 .
前記文書取得部により取得された発明文書について生成された前記特許出願関連情報に係る前記表示用文書における、当該発明文書から前記重要語句抽出部により抽出された重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、マウスオーバー操作に応じて、当該重要語句を定義しているクレームの項の項番、及び、当該重要語句を参照しているクレームの項の項番の表示のためのグラフィカルユーザインタフェースとして機能させるものであるThe display control information related to the important phrase extracted from the invention document by the important phrase extraction unit in the display document related to the patent application related information generated for the invention document acquired by the document acquisition unit, To display the number of the claim section that defines the relevant key term and the claim number that refers to the relevant key term in accordance with the mouseover operation on the display element of the relevant key term It functions as a graphical user interface for
請求項14記載の発明文書分析システム。The invention document analysis system according to claim 14.
前記文書取得部により取得された発明文書について生成された前記特許出願関連情報に係る前記表示用文書における、当該発明文書から前記重要語句抽出部により抽出された重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、操作に応じて、ネットワーク上の検索サイトで、当該重要語句を含むウェブページ、当該重要語句の定義、当該重要語句の類義語、若しくは、当該重要語句の関連画像を検索する処理、又は、ネットワーク上の翻訳サイトで当該重要語句を翻訳させる処理を、実行するグラフィカルユーザインタフェースとして機能させるものである
請求項6~15のいずれか一項に記載の発明文書分析システム。
The display control information related to key phrases extracted from the invention document by the key phrase extraction unit in the display document relating to the patent application related information generated for the invention document acquired by the document acquisition unit, Using the display elements of the relevant important phrases to search for web pages containing the relevant important phrases, definitions of the relevant important phrases, synonyms of the relevant important phrases, or images related to the relevant important phrases on a search site on the network according to the operation. 16. The invention document analysis system according to any one of claims 6 to 15, wherein the invention document analysis system functions as a graphical user interface that executes a process of translating the relevant key words on a translation site on a network.
前記文書取得部により取得された発明文書について生成された前記特許出願関連情報に係る前記表示用文書における、当該発明文書から前記重要語句抽出部により抽出された重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、操作に応じて、前記クレーム情報及び前記明細書情報から当該重要語句を含む行を列挙して表示する重要語句包含記載列挙処理を実行するためのグラフィカルユーザインタフェースとして機能させるものであ
請求項6~16のいずれか一項に記載の発明文書分析システム。
The display control information related to key phrases extracted from the invention document by the key phrase extraction unit in the display document relating to the patent application related information generated for the invention document acquired by the document acquisition unit, Functioning as a graphical user interface for executing an important phrase inclusion description listing process for listing and displaying lines containing the relevant important phrase from the claim information and the specification information in accordance with the operation of the display element of the relevant important phrase. is what makes
The invention document analysis system according to any one of claims 6 to 16 .
前記発明文書分析システムは、前記発明文書から前記重要語句抽出部により抽出された重要語句のうち、符号が対応する重要語句について、当該重要語句の前記属性情報の一部としての当該符号と当該重要語句とを関係付けて表したリストである符号リストを生成して前記特許出願関連情報に含ませ、
前記発明文書分析システムは、
前記発明文書から前記重要語句抽出部により抽出された重要語句に後続して記載された符号を列挙して、符号と対応する重要語句とを関連付けて表し、
前記重要語句抽出部により抽出された重要語句に符号が後続して付加された記載が、前記発明文書中に存在しない場合において、当該重要語句が表す要素が他の重要語句が表す要素を構成上包含するか、又は、他の重要語句が表す要素に構成上包含されるときには、当該重要語句及び当該他の重要語句の構成上の包含関係に基づいて符号を決定して、決定した符号と当該重要語句とを関連付けて表すことにより、
前記符号リストを生成する
請求項6~17のいずれか一項に記載の発明文書分析システム。
In the invention document analysis system, of the important phrases extracted from the invention document by the important phrase extraction unit, for important phrases corresponding to codes, the code and the important phrase are included as a part of the attribute information of the important phrases . Generate a code list that is a list in which words and phrases are associated and include it in the patent application related information,
The invention document analysis system is
Listing the codes described after the important words and phrases extracted by the important word extracting unit from the invention document, and representing the codes and the corresponding important words in association with each other,
If there is no description in the invention document in which a sign is added after the key phrase extracted by the key phrase extraction unit, the element represented by the key phrase is structurally different from the element represented by another key phrase. or when it is structurally contained in an element represented by another key phrase, a code is determined based on the structural inclusion relationship between the key phrase and the other key phrase, and the determined code and the By associating with key words and phrases,
The invention document analysis system according to any one of claims 6 to 17, wherein the code list is generated.
前記特許出願関連情報は、前記文書取得部により取得された発明文書の明細書における段落番号を表す見出しの記載を含む行を、当該明細書における記載順に列挙した明細書見出しリストを含み、
前記明細書見出しリストにおける、前記発明文書の前記明細書中の段落番号を表す見出しの記載を含む行については、当該明細書における当該段落番号に係る段落範囲内に当該発明文書のクレーム中から前記重要語句抽出部により抽出された重要語句と同一の重要語句がある場合に、当該重要語句を、前記明細書見出しリストの当該行に追記する
請求項3~18のいずれか一項に記載の発明文書分析システム。
The patent application related information includes a description heading list in which lines containing descriptions of headings representing paragraph numbers in the description of the invention document acquired by the document acquisition unit are listed in the order of description in the description,
In the specification heading list, for the line containing the description of the heading representing the paragraph number in the specification of the invention document, within the paragraph range related to the paragraph number in the specification, from the claim of the invention document to the above If there is a key phrase that is the same as the key phrase extracted by the key phrase extraction unit, the key phrase is added to the line of the specification heading list.
The invention document analysis system according to any one of claims 3 to 18 .
前記分析部は、前記文書取得部により取得された発明文書に基づいて、当該発明文書に含まれる不適切な記載に関する指摘を表す1つ以上の指摘情報を含めた警告情報を生成する警告情報生成部を含み、
前記特許出願関連情報は、前記警告情報を含み、
前記警告情報生成部は、
前記文書取得部により取得された発明文書中に、同一の符号の直前には同一の要素名が記載されるという条件を満たしていない記載が含まれていることを検出した場合には、当該同一の符号と、当該符号が付加された複数の相違する表現の要素名とを示す指摘情報を、前記警告情報に含ませ
前記文書取得部により取得された発明文書のクレームのいずれかの項に、参照文字列に後続して語句が記載されている場合にその語句と同一の被参照語句が、当該項の当該参照文字列に先行した部分に記載されている必要がある、又は、引用連鎖を踏まえて当該項が引用した項内に記載されている必要があるという条件を満たしていない参照文字列に係る記載が含まれていることを検出した場合には、先行した被参照語句の記載が存在しない旨と、当該検出した参照文字列に係る記載を含んでいる項の項番と、当該参照文字列に係る記載の内容とを示す指摘情報を、前記警告情報に含ませ
請求項3~19のいずれか一項に記載の発明文書分析システム。
The analysis unit generates warning information based on the invention document acquired by the document acquisition unit, and generates warning information including one or more pieces of indication information indicating inappropriate statements contained in the invention document. including the part
The patent application related information includes the warning information,
The warning information generation unit
If it is detected that the invention document acquired by the document acquisition unit contains a description that does not satisfy the condition that the same element name is described immediately before the same code, the same The warning information includes indication information indicating the code of and the element names of a plurality of different expressions to which the code is added ,
If a word or phrase is described following a reference character string in any of the claims of the invention document acquired by the document acquisition unit, the referenced word or phrase that is the same as that word or phrase is the reference character of the relevant paragraph. Including descriptions of reference strings that do not meet the requirement that they must appear in the part preceding the column or must appear within the paragraph to which the paragraph is cited given the chain of citations. If it is detected that there is no preceding referenced word, the section number of the section containing the description related to the detected reference character string, and the description related to the reference character string The warning information includes indication information indicating the contents of
The invention document analysis system according to any one of claims 3 to 19 .
前記警告情報生成部は、前記表示用文書としての前記特許出願関連情報に含まれる前記警告情報における少なくとも1つの前記指摘情報の表示要素に、当該指摘情報の指摘に該当する前記クレーム情報又は前記明細書情報における記載箇所へのリンク表示のためのグラフィカルユーザインタフェースとして当該表示要素を機能させるための表示制御情報を付加する
請求項20記載の発明文書分析システム。
The warning information generation unit adds the claim information or the specification corresponding to the indication of the indication information to at least one display element of the indication information in the warning information included in the patent application related information as the display document. 21. The invention document analysis system according to claim 20 , further comprising adding display control information for causing the display element to function as a graphical user interface for displaying a link to the description location in the book information.
前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る前記表示制御情報は、当該複数の重要語句各々を、重要語句毎に相違する表示色で所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであり、
前記特許出願関連情報は、前記クレーム情報の各行を包含して、包含した前記クレーム情報の一行毎又は一項毎に、当該一行又は当該一項の内容の直後に、当該一行又は当該一項に含まれる重要語句を当該重要語句に対応する対応翻訳語に置換した結果を含む翻訳行を挿入したクレーム翻訳情報を含み、
前記特許出願関連情報は、前記明細書情報の各行を包含して、包含した前記明細書情報の一行毎に、当該一行の内容の直後に、当該一行に含まれる重要語句を当該重要語句に対応する対応翻訳語に置換した結果を含む翻訳行を挿入した明細書翻訳情報を含み、
前記クレーム翻訳情報及び前記明細書翻訳情報は、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句各々と同一の重要語句に対応する対応翻訳語について、当該重要語句に対応する対応翻訳語の表示態様を制御するための表示制御情報を含み、
前記クレーム翻訳情報及び前記明細書翻訳情報における前記重要語句に対応する前記対応翻訳語に係る前記表示制御情報は、当該対応翻訳語を、当該重要語句に付加された表示色と同色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものである
請求項3~21のいずれか一項に記載の発明文書分析システム。
In the claim information, the display control information for each of the plurality of key phrases having different character strings constituting the key phrase has a predetermined width in which each of the plurality of key phrases is displayed in a different display color for each key phrase. It is for controlling to display in a display mode with a left border added,
The patent application-related information includes each line of the claim information, and for each line or item of the included claim information, immediately after the contents of the line or item, Include claim translation information in which a translation line containing the result of replacing the included key phrase with a corresponding translated word corresponding to the key phrase is inserted,
The patent application related information includes each line of the specification information, and for each line of the included specification information, immediately after the content of the line, the important phrase contained in the line corresponds to the important phrase. Including the description translation information in which the translation line containing the result of replacement with the corresponding translated word is inserted,
The claim translation information and the description translation information are arranged so that corresponding translated words corresponding to the same key words as each of the plurality of key words having different character strings constituting the key words in the claim information are translated into the key words and phrases. including display control information for controlling the display mode of the corresponding corresponding translated word,
The display control information related to the corresponding translated word corresponding to the important phrase in the claim translation information and the specification translation information displays the corresponding translated word in the same color as the display color added to the relevant important phrase and in the predetermined width. The invention document analysis system according to any one of claims 3 to 21, which is for controlling display in a display mode in which a left boundary line having
前記条件情報は、
重要語句の候補となる文字列のパターンを表した重要語句候補文字列パターンを示す重要語句候補文字列パターン情報と、
先行記載した文字列の参照用に用いられる参照文字列のパターンを表した参照文字列パターンを示す参照文字列パターン情報と、
要素名を表す文字列に後続して付記される符号の文字列のパターンを表した符号文字列パターンを示す符号文字列パターン情報と、
所定の助詞である文字列のパターンを表した特定助詞文字列パターンを示す特定助詞文字列パターン情報とを含み、
前記重要語句候補文字列パターン情報は、少なくとも、先頭文字が漢字である所定の文字列、及び、先頭文字が片仮名である所定の文字列が、当該重要語句候補文字列パターンに該当するように定められており、
前記参照文字列パターン情報は、少なくとも、「前記」という文字列が、当該参照文字列パターンに該当するように定められており、
前記符号文字列パターン情報は、少なくとも、先頭文字が数字である所定の文字列が、当該符号文字列パターンに該当するように定められており、
前記特定助詞文字列パターン情報は、少なくとも、「を」、「に」、「が」、「と」、「から」、「へ」及び「は」のいずれかの文字が、当該特定助詞文字列パターンに該当するように定められており、
前記重要語句抽出部は、
前記文書取得部により取得された発明文書に、前記参照文字列パターンに該当する第1文字列に後続して前記重要語句候補文字列パターンに該当する第2文字列が存在する場合に、当該第2文字列と同一の文字列を重要語句として抽出する第1抽出部と、
前記文書取得部により取得された発明文書のクレーム中に、前記重要語句候補文字列パターンに該当する第3文字列に後続して句点文字が存在するときには、当該第3文字列と同一の文字列を重要語句として抽出する第2抽出部と、
前記文書取得部により取得された発明文書に、前記重要語句候補文字列パターンに該当する第4文字列に後続して前記符号文字列パターンに該当する第5文字列が存在する場合に、当該第4文字列と同一の文字列を重要語句として抽出する第3抽出部と、
前記文書取得部により取得された発明文書に、前記重要語句候補文字列パターンに該当する第6文字列に後続して前記特定助詞文字列パターンに該当する第7文字列が存在する場合に、当該第6文字列と同一の文字列を重要語句として抽出する第4抽出部とを含み、
前記重要語句抽出部は重要語句の前記抽出においては、前記重要語句候補文字列パターンに複数の文字列が該当していた場合において当該複数の文字列のうちの一の文字列が他の文字列に発明文書の記載上包含されていたときには、当該複数の文字列のうち当該一の文字列を除外した残余の文字列を選択対象として重要語句を選択して抽出する
請求項1~22のいずれか一項に記載の発明文書分析システム。
The condition information is
key phrase candidate character string pattern information indicating key phrase candidate character string patterns representing patterns of character strings that are key phrase candidates;
Reference character string pattern information indicating a reference character string pattern representing a reference character string pattern used for referencing the previously described character string;
coded string pattern information indicating a coded string pattern representing a pattern of a coded string appended after a string representing an element name;
and specific particle character string pattern information indicating a specific particle character string pattern representing a pattern of a character string that is a predetermined particle,
The key phrase candidate character string pattern information is defined so that at least a predetermined character string whose first character is Kanji and a predetermined character string whose first character is Katakana correspond to the important phrase candidate character string pattern. and
The reference character string pattern information is defined so that at least the character string "said" corresponds to the reference character string pattern,
The coded character string pattern information is defined so that at least a predetermined character string whose first character is a number corresponds to the coded character string pattern,
In the specific particle character string pattern information, at least any one of the characters "wo", "ni", "ga", "to", "kara", "he" and "ha" corresponds to the specific particle character string It is determined to correspond to the pattern,
The important phrase extraction unit
If the invention document acquired by the document acquisition unit contains a second character string corresponding to the key word candidate character string pattern subsequent to the first character string corresponding to the reference character string pattern, the second character string corresponding to the key phrase candidate character string pattern exists. a first extraction unit that extracts a character string that is the same as the two character strings as an important phrase;
In the claim of the invention document acquired by the document acquisition unit, when there is a period character following the third character string corresponding to the important phrase candidate character string pattern, the same character string as the third character string as an important phrase; and
If the invention document acquired by the document acquisition unit contains a fifth character string corresponding to the code character string pattern following the fourth character string corresponding to the important phrase candidate character string pattern, the fourth character string corresponding to the code character string pattern a third extraction unit that extracts the same character string as the four character strings as an important phrase;
If the invention document acquired by the document acquisition unit contains a seventh character string corresponding to the specific particle character string pattern following the sixth character string corresponding to the important phrase candidate character string pattern, a fourth extraction unit that extracts the same character string as the sixth character string as an important phrase,
In the extraction of important phrases, the important phrase extracting unit, when a plurality of character strings correspond to the important phrase candidate character string pattern, replaces one of the plurality of character strings with another character string. is included in the description of the invention document, select and extract the important words and phrases from the remaining character strings excluding the one character string among the plurality of character strings.
The invention document analysis system according to any one of claims 1 to 22 .
前記文書取得部は、複数の発明文書と、当該複数の発明文書各々の翻訳結果である、複数の翻訳結果文書とを取得し、
前記発明文書分析システムは、
翻訳対象となる発明文書が満たすべき複数の条件を定めた翻訳用発明文書標準規定を取得する翻訳用発明文書標準規定取得部と、
前記文書取得部により取得された前記複数の発明文書各々について、当該発明文書が前記翻訳用発明文書標準規定で定められた前記複数の条件のうちの少なくとも一部の各条件を満たすか否かについての判定を行い、当該複数の発明文書のうち、当該判定がなされた条件を満たす程度が予め定めた所定程度を超えるところの発明文書を選出する文書評価部と、
前記文書評価部により選出された発明文書と当該発明文書に対応する翻訳結果文書との組を教師データとして用いた機械学習により、機械翻訳のための学習モデルである翻訳用学習モデルを生成する機械学習部とを含み、
前記出力部は、前記機械学習部により生成された前記翻訳用学習モデルを出力する学習モデル出力部を含む
請求項1~23のいずれか一項に記載の発明文書分析システム。
The document acquisition unit acquires a plurality of invention documents and a plurality of translation result documents, which are translation results of each of the plurality of invention documents,
The invention document analysis system is
an invention document standard specification acquisition unit for acquiring an invention document standard specification for translation that defines a plurality of conditions to be satisfied by an invention document to be translated;
Regarding each of the plurality of invention documents acquired by the document acquisition unit, whether or not the invention document satisfies at least some of the plurality of conditions defined in the standard specification of invention documents for translation and a document evaluation unit that selects, from among the plurality of invention documents, invention documents for which the extent to which the conditions for which the judgment has been made exceeds a predetermined extent;
A machine that generates a learning model for translation, which is a learning model for machine translation, by machine learning using a combination of an invention document selected by the document evaluation unit and a translation result document corresponding to the invention document as teacher data. a learning part;
The invention document analysis system according to any one of claims 1 to 23, wherein the output unit includes a learning model output unit that outputs the learning model for translation generated by the machine learning unit.
マイクロプロセッサを備える機器に、技術的思想を日本語で表した特許出願用のクレーム及び明細書を記載した文書である発明文書を分析して表示用文書を生成する発明文書分析処理を、行わせる発明文書分析方法であって、
前記発明文書分析処理は、
発明文書を取得する文書取得ステップと、
前記文書取得ステップにより取得された発明文書を、予め定められた重要語句の抽出の条件に基づく重要語句の抽出を行うことにより、分析する分析ステップと、
前記文書取得ステップにより取得された発明文書についての前記分析ステップによる分析結果に基づいて生成された特許出願関連情報を表示するための前記表示用文書を生成して出力する出力ステップとを含み、
前記表示用文書は、マークアップ言語で記述された文書を含み、マイクロプロセッサを備える機器におけるブラウザによる解釈の対象とされ、技術的思想を日本語で表した特許出願用の発明文書におけるクレームの内容を表すクレーム情報と、当該発明文書における明細書の内容を表す明細書情報とを含む特許出願関連情報が表示されるべき内容として含まれたものであり、
前記クレームの内容を表す前記クレーム情報は、当該クレームの各語句のうち、予め定められた重要語句の抽出の前記条件に基づいて抽出される各重要語句について、当該重要語句の表示要素の表示態様を制御するための表示制御情報を含み、
前記クレーム情報に表される重要語句のうち、重要語句を構成する文字列が互いに相違する複数の重要語句各々に係る前記表示制御情報各々は、当該複数の重要語句各々の表示要素を、互いに相違する表示色を付加した表示態様で表示するように制御するための情報を含み、
前記クレーム情報に表される重要語句のうち、重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の文字列で構成される重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記1つの重要語句の表示要素の表示態様として付加された表示色と同一の表示色を付加した表示態様で表示するように制御するための情報を含み、
前記明細書の内容を表す前記明細書情報は、当該明細書中の各語句のうち、重要語句の抽出の前記条件に基づいて抽出される各重要語句について、当該重要語句の表示要素の表示態様を制御するための表示制御情報を含み、
前記明細書情報に表される重要語句のうち、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記クレーム情報における前記1つの重要語句の表示要素の表示態様として付加された表示色と同一の表示色を付加した表示態様で表示するように制御するための情報を含
発明文書分析方法。
A device equipped with a microprocessor analyzes an invention document, which is a document describing claims and specifications for a patent application in which technical ideas are expressed in Japanese, and performs invention document analysis processing to generate a document for display. An invention document analysis method,
The invention document analysis process includes:
a document obtaining step of obtaining an invention document;
an analysis step of analyzing the invention document obtained by the document obtaining step by extracting important phrases based on predetermined conditions for extracting important phrases;
an output step of generating and outputting the display document for displaying the patent application-related information generated based on the analysis result of the analysis step for the invention document acquired by the document acquisition step;
The display document includes a document written in a markup language, is subject to interpretation by a browser in a device equipped with a microprocessor, and contains claims in an invention document for a patent application in which technical ideas are expressed in Japanese. and patent application related information including claim information representing the content of the specification of the invention document and the content to be displayed ,
The complaint information representing the contents of the complaint includes, for each key phrase extracted based on the predetermined conditions for extracting key phrases among the terms of the complaint, the display mode of the display element of the key phrase. contains display control information for controlling the
Each of the display control information relating to each of a plurality of key phrases having different character strings constituting the key phrase among the key phrases represented in the claim information controls display elements of the plurality of key phrases to be different from each other. Including information for controlling to display in a display mode with the display color added,
related to an important phrase composed of the same character string as any one of the plurality of important phrases in which the character strings constituting the important phrase are different from each other among the important phrases represented in the claim information The display control information is for controlling to display the display element of the key phrase in a display mode to which the same display color as the display mode of the display element of the one key phrase is added. contains information,
The specification information representing the content of the specification includes, for each key phrase extracted based on the conditions for extraction of key phrases among the terms in the specification, the display mode of the display element of the key phrase. contains display control information for controlling the
of the key phrases represented in the specification information, the key phrases that are the same as any one of the plurality of key phrases in which the character strings constituting the key phrases in the claim information are different from each other; The display control information controls to display the display element of the important phrase in a display mode to which the same display color as the display mode of the display element of the one important phrase in the complaint information is added. contains information for
Invention document analysis method.
前記表示用文書は、前記特許出願関連情報が表示されるべき内容としてHTML(Hypertext Markup Language)で記載されたHTMLファイルを含むHTML文書であり、
記クレーム情報における、重要語句を構成する文字列が互いに相違する前記複数の重要語句各々に係る前記表示制御情報は、当該複数の重要語句各々の表示要素を、重要語句毎に相違する表示色で所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものであり、
前記明細書情報における各重要語句について、当該重要語句が、前記クレーム情報における前記複数の重要語句のうちのいずれか1つの重要語句と同一であれば、前記明細書情報における当該重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記クレーム情報における前記1つの重要語句の表示要素の表示態様に係る左境界線の表示色と同一の表示色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御し、前記明細書情報における当該重要語句が、前記クレーム情報における当該複数の重要語句のいずれとも相違すれば、前記明細書情報における当該重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、前記所定幅を有する左境界線が付加されていない表示態様で表示するように制御するためのものである
請求項25記載の発明文書分析方法
The display document is an HTML document containing an HTML file written in HTML (Hypertext Markup Language) as content for displaying the patent application-related information,
In the claim information, the display control information related to each of the plurality of key phrases having different character strings constituting the key phrase may display the display element of each of the plurality of key phrases in a different display color for each key phrase. is for controlling to display in a display mode with a left border line having a predetermined width added,
For each key phrase in the specification information, if the key phrase is the same as any one of the plurality of key phrases in the claim information, the key phrase related to the key phrase in the specification information The display control information sets the display element of the important phrase to a left boundary line having the predetermined width in the same display color as the display color of the left boundary line according to the display mode of the display element of the one important phrase in the claim information. is added, and if the key phrase in the description information is different from any of the multiple key phrases in the claim information, the key phrase in the description information 26. The invention document analysis method according to claim 25 , wherein said display control information is for controlling the display element of said important phrase to be displayed in a display mode in which said left boundary line having said predetermined width is not added. .
前記所定幅は、1文字分の幅であり、
前記特許出願関連情報は、前記クレーム情報における、重要語句を構成する文字列が互いに相違する複数の重要語句各々を、重要語句毎に行を改めて、列挙した重要語句リストを含み、
前記重要語句リストにおける各重要語句については、当該重要語句の表示要素の表示態様を制御するための表示制御情報が付加され、
前記重要語句リストにおける前記重要語句に係る前記表示制御情報は、当該重要語句が、前記クレーム情報における、重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一であれば、当該重要語句の表示要素を、前記クレーム情報における前記1つの重要語句の表示要素の表示態様に係る左境界線の表示色と同一の表示色で前記所定幅を有する左境界線が付加された表示態様で表示するように制御するためのものである
請求項26記載の発明文書分析方法
The predetermined width is a width for one character,
The patent application-related information includes an important phrase list in which each of a plurality of important phrases in which the character strings constituting the important phrases in the claim information are different from each other are listed on a new line for each important phrase,
Each key phrase in the key phrase list is added with display control information for controlling the display mode of the display element of the key phrase,
The display control information related to the important phrase in the important phrase list is such that the important phrase is any one of the plurality of important phrases in the claim information, the character strings of which are different from each other. If it is the same as the phrase, the display element of the important phrase is displayed in the same display color as the display color of the left boundary line according to the display mode of the display element of the one important phrase in the claim information, and has the predetermined width. 27. The invention document analysis method according to claim 26 , wherein the invention document analysis method is for controlling display in a display mode in which a boundary line is added.
前記重要語句リストの各行は、1つの重要語句と、当該重要語句に対応する対応翻訳語、又は、当該重要語句についての対応翻訳語の候補の集合である翻訳語候補集合とを含み、
前記重要語句リストにおける前記重要語句に係る前記表示制御情報は、
当該重要語句についての前記翻訳語候補集合の表示要素を、操作に応じて、当該翻訳語候補集合のうちのいずれかの要素を選択可能にするグラフィカルユーザインタフェースとして機能するように制御するためのものであり、
当該グラフィカルユーザインタフェースとして機能している状態の当該翻訳語候補集合の表示要素に対しての操作に応じて選択された、当該翻訳語候補集合の要素を、当該重要語句に対応する対応翻訳語として決定して、当該翻訳語候補集合の表示要素の内容を、決定した当該対応翻訳語へと置換して表示する処理を実行するためのスクリプトを含む
請求項27記載の発明文書分析方法
Each row of the important phrase list includes one important phrase and a corresponding translated word corresponding to the important phrase, or a translation word candidate set that is a set of candidates for the corresponding translated word for the important phrase,
The display control information related to the important phrases in the important phrase list,
for controlling the display elements of the set of candidate translation words for the key phrase so as to function as a graphical user interface that enables selection of any element of the set of candidate translation words in response to an operation and
An element of the set of candidate translation words selected in response to an operation on the display element of the set of candidate translation words while functioning as the graphical user interface is used as a corresponding translation word corresponding to the key phrase. 28. The invention document analysis method according to claim 27 , further comprising a script for executing a process of determining, replacing the content of the display element of the set of candidate translation words with the determined corresponding translation word, and displaying the result.
前記特許出願関連情報における前記重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、操作に応じて、ネットワーク上の検索サイトで、当該重要語句を含むウェブページ、当該重要語句の定義、当該重要語句の類義語、若しくは、当該重要語句の関連画像を検索する処理、又は、ネットワーク上の翻訳サイトで当該重要語句を翻訳させる処理を、実行するグラフィカルユーザインタフェースとして機能させるものである
請求項25~28のいずれか一項に記載の発明文書分析方法
The display control information related to the key phrase in the patent application related information is such that the display element of the key phrase is displayed on a search site on the network according to the operation, the web page including the key phrase, the definition of the key phrase , a process of searching for synonyms of the relevant key words or related images of the relevant key words, or a process of translating the key words on a translation site on the network. The invention document analysis method according to any one of 25 to 28 .
前記特許出願関連情報における前記重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、操作に応じて、当該重要語句の属性情報の少なくとも一部の表示、又は、当該重要語句の属性情報に基づいて決定された当該重要語句の重要度の表示のためのグラフィカルユーザインタフェースとして機能させるものであり、
前記重要語句の前記属性情報は、
前記クレーム情報が表すクレーム中で当該重要語句を定義しているクレームの項が存在する場合に当該項の項番を示す情報と、
前記クレーム情報が表すクレーム中で当該重要語句を参照しているクレームの項が存在する場合に当該項の項番を示す情報と、
前記明細書情報が表す明細書中において当該重要語句に符号が付加された記載が存在する場合に当該符号を示す情報とを含む
請求項25~29のいずれか一項に記載の発明文書分析方法
The display control information related to the key phrase in the patent application related information causes the display element of the key phrase to display at least a part of the attribute information of the key phrase, or the attribute of the key phrase, according to the operation. serves as a graphical user interface for displaying the importance of the relevant key phrases as determined based on information;
The attribute information of the important phrase is
information indicating the item number of a claim that defines the key phrase in the claim represented by the claim information, if there is one;
information indicating, if there is a claim section referring to the key phrase in the claim represented by the claim information, the number of the claim;
The invention document analysis method according to any one of claims 25 to 29, including information indicating the code when there is a description with a code added to the key phrase in the specification represented by the description information. .
前記特許出願関連情報における前記重要語句に係る前記表示制御情報は、当該重要語句の表示要素を、操作に応じて、前記クレーム情報及び前記明細書情報から当該重要語句を含む行を列挙する重要語句包含記載列挙処理を実行するためのグラフィカルユーザインタフェースとして機能させるものであり、
前記重要語句包含記載列挙処理は、操作対象となった重要語句を含む行を前記クレーム情報及び前記明細書情報から列挙して表示し、当該列挙して表示した各行における当該重要語句については強調表示を行い、表示した行には、当該行に対する操作に応じて、前記クレーム情報又は前記明細書情報における当該行を含む複数行へのリンク表示のためのグラフィカルユーザインタフェースとして当該行を機能させるための表示制御情報を付加する処理である
請求項25~30のいずれか一項に記載の発明文書分析方法
The display control information related to the key phrase in the patent application related information is a key phrase that lists the lines containing the key phrase from the claim information and the specification information according to the operation of the display element of the key phrase. It functions as a graphical user interface for executing inclusion description enumeration processing,
The key phrase inclusion description listing process lists and displays lines containing key phrases to be operated from the claim information and the specification information, and highlights the key phrases in each of the listed and displayed lines. and for the displayed line to function as a graphical user interface for displaying links to multiple lines including the line in the claim information or the description information according to the operation on the line. The invention document analysis method according to any one of claims 25 to 30, which is a process of adding display control information.
前記特許出願関連情報は、前記クレーム情報に表されるクレームについての機械翻訳の結果を表すクレーム翻訳情報と、前記明細書情報に表される明細書についての機械翻訳の結果を表す明細書翻訳情報とを含み、
前記クレーム翻訳情報における、前記クレーム情報の一行又は一項を機械翻訳対象とした機械翻訳の結果を表す一行又は一項は、当該クレーム情報の行若しくは項の全体を翻訳先言語で表した完全翻訳行、又は、当該クレーム情報の行若しくは項に含まれる重要語句を、当該重要語句に対応する対応翻訳語、若しくは、当該重要語句についての翻訳語候補集合に、置換した結果である部分翻訳行であり、
前記明細書翻訳情報における、前記明細書情報の一行を機械翻訳対象とした機械翻訳の結果を表す一行は、当該明細書情報の行の全体を翻訳先言語で表した完全翻訳行、又は、当該明細書情報の行に含まれる重要語句を、当該重要語句に対応する対応翻訳語、若しくは、当該重要語句についての翻訳語候補集合に、置換した結果である部分翻訳行であり、
前記クレーム翻訳情報及び前記明細書翻訳情報は、前記クレーム情報における重要語句を構成する文字列が互いに相違する前記複数の重要語句のうちのいずれか1つの重要語句と同一の重要語句について、当該重要語句を機械翻訳対象とした機械翻訳の結果の表示要素の表示態様を制御するための表示制御情報を含み、当該機械翻訳の結果の表示要素に係る当該表示制御情報は、当該表示要素の表示態様の少なくとも一部に、前記クレーム情報及び前記明細書情報における当該重要語句の表示要素に付加された表示色と同一の表示色が付加されるように、当該表示要素の表示態様を制御するためのものである
請求項25~31のいずれか一項に記載の発明文書分析方法
The patent application related information includes claim translation information representing the results of machine translation of the claims represented in the claim information, and specification translation information representing the results of machine translation of the specification represented in the specification information. and
In the claim translation information, one line or one item representing the result of machine translation of one line or one item of the claim information is a complete translation of the entire line or item of the claim information in the target language. A partially translated line that is the result of replacing a key phrase contained in a line or a line or paragraph of the claim information with a corresponding translated word corresponding to the key phrase or a translation word candidate set for the key phrase can be,
In the description translation information, one line representing the result of machine translation for one line of the description information is a complete translation line that represents the entire line of the description information in the target language, or the A partially translated line that is the result of replacing key words contained in a line of specification information with a corresponding translated word corresponding to the key word or a translation word candidate set for the key word,
The claim translation information and the description translation information are arranged so that, for the same important phrase as any one of the plurality of important phrases in which the character strings constituting the important phrases in the claim information are different from each other, the important Including display control information for controlling the display mode of the display element of the result of machine translation of words and phrases as the object of machine translation, the display control information related to the display element of the result of the machine translation is the display mode of the display element for controlling the display mode of the display element so that at least a part of The invention document analysis method according to any one of claims 25 to 31 .
前記クレーム翻訳情報は、前記クレーム情報の各行を包含し、包含したクレーム情報の一行毎又は一項毎について、当該一行又は一項の内容の直後に、当該一行又は一項の内容である機械翻訳対象に対応する機械翻訳の結果を表す前記完全翻訳行又は前記部分翻訳行を、挿入したものであり、
前記明細書翻訳情報は、前記明細書情報の各行を包含し、包含した明細書情報の一行毎について、当該一行の直後に、当該一行である機械翻訳対象に対応する機械翻訳の結果を表す前記完全翻訳行又は前記部分翻訳行を挿入したものであり、
前記クレーム翻訳情報及び前記明細書翻訳情報には、前記クレーム翻訳情報及び前記明細書翻訳情報における機械翻訳対象の少なくとも一部分の表示要素の表示態様と、当該機械翻訳対象に対応する機械翻訳の結果の少なくとも一部分の表示要素の表示態様とが、文字背景色、文字色、文字装飾、フォントサイズ、フォントスタイル、及び、フォントウェイトのうちの少なくとも1つにおいて相違するように制御するために、当該各表示要素に表示制御情報が付加されている
請求項32記載の発明文書分析方法
The claim translation information includes each line of the claim information, and for each line or item of the included claim information, immediately after the content of the line or item, a machine translation of the content of the line or item The fully translated line or the partially translated line representing the result of machine translation corresponding to the target is inserted,
The description translation information includes each line of the description information, and for each line of the included description information, immediately after the line, the machine translation result corresponding to the machine translation target that is the line A fully translated line or the partially translated line is inserted,
In the claim translation information and the specification translation information, the display mode of at least a part of the display element to be machine-translated in the claim translation information and the specification translation information, and the result of machine translation corresponding to the machine-translation target In order to control the display mode of at least a part of the display elements to be different in at least one of character background color, character color, character decoration, font size, font style, and font weight, each display 33. The invention document analysis method according to claim 32 , wherein display control information is added to the element.
前記特許出願関連情報は、警告情報を含み、
前記警告情報は、
前記発明文書の前記クレーム又は前記明細書が、予め規定された翻訳用発明文書標準規定に定められた複数の条件を満たすか否かを検査して条件が満たされない場合にその旨を指摘する指摘情報と、
前記発明文書の前記クレーム又は前記明細書が前記翻訳用発明文書標準規定に定められた複数の条件のうちの少なくとも一部の各条件を満たすか否かの検査の結果に基づいて予め定められた演算により算出された、当該発明文書の翻訳用発明文書標準規定への適合性の評価値を示す発明文書評価情報と、
前記翻訳用発明文書標準規定へのアクセスのための規定アクセス情報と、
前記翻訳用発明文書標準規定のバージョンを示すバージョン情報とを含む
請求項25~33のいずれか一項に記載の発明文書分析方法
The patent application related information includes warning information,
The warning information is
Pointing out whether or not the claim or the specification of the invention document satisfies a plurality of conditions set forth in the predefined Standard Rules for Invention Documents for Translation, and points out when the conditions are not met. information and
Predetermined based on the result of an examination as to whether or not the claim or the specification of the invention document satisfies at least some of a plurality of conditions stipulated in the invention document standard rules for translation Invention document evaluation information indicating the evaluation value of conformity of the invention document to the invention document standard provisions for translation calculated by the calculation;
provisional access information for accessing said invention document standard provision for translation;
The invention document analysis method according to any one of claims 25 to 33, further comprising: version information indicating a version of said invention document standard specification for translation.
マイクロプロセッサを備える機器に、技術的思想を日本語で表した特許出願用のクレーム及び明細書を記載した文書である発明文書を分析して表示用文書を生成する発明文書分析処理を行わせることで、請求項25~34のいずれか一項に記載の発明文書分析方法を実現するための発明文書分析処理プログラム。 A device equipped with a microprocessor analyzes an invention document, which is a document describing claims and specifications for a patent application in which technical ideas are expressed in Japanese, and performs invention document analysis processing to generate a document for display. An invention document analysis processing program for realizing the invention document analysis method according to any one of claims 25 to 34 .
JP2020122433A 2019-09-06 2020-07-16 Invention document analysis system, invention document analysis method, and invention document analysis processing program Active JP7448205B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019163381 2019-09-06
JP2019163381 2019-09-06

Publications (3)

Publication Number Publication Date
JP2021043955A JP2021043955A (en) 2021-03-18
JP2021043955A5 true JP2021043955A5 (en) 2023-06-07
JP7448205B2 JP7448205B2 (en) 2024-03-12

Family

ID=74863213

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020122424A Active JP7165163B2 (en) 2019-09-06 2020-07-16 Invention document analysis system and invention document analysis processing program
JP2020122433A Active JP7448205B2 (en) 2019-09-06 2020-07-16 Invention document analysis system, invention document analysis method, and invention document analysis processing program

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020122424A Active JP7165163B2 (en) 2019-09-06 2020-07-16 Invention document analysis system and invention document analysis processing program

Country Status (1)

Country Link
JP (2) JP7165163B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7442747B2 (en) 2021-10-19 2024-03-04 三菱電機ビルソリューションズ株式会社 Classification device and method
JP7266339B1 (en) * 2022-02-22 2023-04-28 弁理士法人Ipx Information processing device, information processing system, information processing method, creation method and program
JP7171103B1 (en) 2022-03-22 2022-11-15 弁理士法人Ipx Information processing device, information processing method and program

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03105566A (en) * 1989-09-20 1991-05-02 Hitachi Ltd Summary preparing system
JPH08329108A (en) * 1995-06-01 1996-12-13 Hitachi Ltd Method for converting text into hypertext
JP3437710B2 (en) * 1996-04-22 2003-08-18 エイディシーテクノロジー株式会社 Machine translation equipment
JP2003186789A (en) * 2001-12-18 2003-07-04 Logo Vista Corp Electronic mail translation system
JP4628790B2 (en) 2002-10-23 2011-02-09 有限会社アイ・アール・ディー Information processing apparatus, information processing method, and program
JP4301879B2 (en) 2003-07-08 2009-07-22 財団法人日本特許情報機構 Abstract creation support system and patent document search system
JP3978678B2 (en) 2003-08-22 2007-09-19 株式会社 ミドリインターナショナル Translation support system
JP2005122424A (en) * 2003-10-16 2005-05-12 Canon Inc Watchdog timer
JP2007004757A (en) 2005-06-24 2007-01-11 Hiroshi Kida Patent document translation system and program
JP5011751B2 (en) 2006-02-27 2012-08-29 富士通株式会社 Translation information output processing program, processing method, and processing apparatus
JP2007265068A (en) 2006-03-29 2007-10-11 National Institute Of Information & Communication Technology Document difference detection device and program
JP5586772B1 (en) 2013-11-22 2014-09-10 株式会社バイトルヒクマ Translation system, translation program, and translation method
JP6649124B2 (en) 2015-05-25 2020-02-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America Machine translation method, machine translation device and program
CN110476164A (en) 2017-04-05 2019-11-19 特斯雷特私人有限公司 Language translation assistor

Similar Documents

Publication Publication Date Title
US11977570B2 (en) Methods, systems, and computer-readable media for semantically enriching content and for semantic navigation
Higuchi KH Coder 3 reference manual
US11321364B2 (en) System and method for analysis and determination of relationships from a variety of data sources
Sikos Mastering structured data on the Semantic Web: From HTML5 microdata to linked open data
CN114616572A (en) Cross-document intelligent writing and processing assistant
JP7165163B2 (en) Invention document analysis system and invention document analysis processing program
US20090138466A1 (en) System and Method for Search
US11354501B2 (en) Definition retrieval and display
US20090228777A1 (en) System and Method for Search
Sannier et al. An automated framework for detection and resolution of cross references in legal texts
US20140304579A1 (en) Understanding Interconnected Documents
Oksanen et al. Semantic Finlex: Transforming, publishing, and using Finnish legislation and case law as linked open data on the web
CA3010817C (en) Methods, systems, and computer-readable media for semantically enriching content and for semantic navigation
JP2021043955A5 (en) Invention document analysis system, invention document analysis method, and invention document analysis processing program
EP4085353A1 (en) System and method for analysis and determination of relationships from a variety of data sources
Del Alamo et al. A systematic mapping study on automated analysis of privacy policies
Higuchi KH Coder 2. x reference manual
Böschen Software review: The JATSdecoder package—extract metadata, abstract and sectioned text from NISO-JATS coded XML documents; Insights to PubMed central’s open access database
Batista-Navarro et al. A text mining-based framework for constructing an RDF-compliant biodiversity knowledge repository
Abdekhodaie et al. WordCommentsAnalyzer: A windows software tool for qualitative research
Odat et al. Extracting structured data from publications in the Art Conservation Domain
US20230170099A1 (en) Pharmaceutical process
Iorio et al. Analysing and Discovering Semantic Relations in Scholarly Data
Ben Mesmia et al. Extraction of Semantic Relation between Arabic Named Entities Using Different Kinds of Transducer Cascades
Zhu et al. A visual analysis approach for data transformation via domain knowledge and intelligent models