JP4806249B2 - Document information analysis apparatus and document information analysis method - Google Patents
Document information analysis apparatus and document information analysis method Download PDFInfo
- Publication number
- JP4806249B2 JP4806249B2 JP2005325036A JP2005325036A JP4806249B2 JP 4806249 B2 JP4806249 B2 JP 4806249B2 JP 2005325036 A JP2005325036 A JP 2005325036A JP 2005325036 A JP2005325036 A JP 2005325036A JP 4806249 B2 JP4806249 B2 JP 4806249B2
- Authority
- JP
- Japan
- Prior art keywords
- document information
- block
- information
- unit
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は、例えば、特許文献や学術文献等の文献情報を分析する文献情報分析装置及び文献情報分析方法に関する。 The present invention relates to a document information analysis apparatus and a document information analysis method for analyzing document information such as patent documents and academic documents, for example.
例えば、文献情報としての特許文献を調査することにより、研究開発の方向性を探ったり、事業計画の立案等を行うことができる。ところで、特許公開公報のような特許文献の場合は、例えば、いわゆる親出願と分割出願、国内優先権主張出願と国内優先権主張の基礎となった出願等のように、複数の文献が密接に関係している場合がある。 For example, by investigating patent documents as document information, it is possible to find out the direction of research and development and to make business plans. By the way, in the case of a patent document such as a patent publication, a plurality of documents are closely connected, such as a so-called parent application and divisional application, a domestic priority claim application and an application on which the domestic priority claim is based. May be related.
このような関係にある複数の特許文献を精査することにより、その分割や国内優先権主張の可否等を判断することができる。そこで、引用された文献及びそれを引用する文献の関連性を視覚的に表現させるものが提案されている(特許文献1)。
前記文献に記載の技術によれば、文献単位での関連性はわかるが、各文献がどのように関連しているのかまでを知ることができない。ここで、文書作成ソフトウェアの中には、複数の文献間の相違を分析して、ユーザに知らせる機能を備えるものがある。しかし、このような文献比較機能を備えたソフトウェアは、単純に両文献のテキストコードの順番を解析するに過ぎず、文献間の実質的な相違を検出することはできない。 According to the technique described in the document, it is possible to know the relevance of each document, but it is impossible to know how each document is related. Here, some document creation software has a function of analyzing a difference between a plurality of documents and notifying the user. However, software provided with such a document comparison function simply analyzes the order of the text codes of both documents, and cannot detect a substantial difference between documents.
例えば、2つの段落の順番を入れ替えただけに過ぎない場合でも、そのようなソフトウェアは、各段落が全て変更されたと判断する。従って、ユーザは、関連性のある文献を一頁ずつ確認しながら、一致部分及び相違部分を解析する必要があり、作業性が低く、精査に要する時間及びコストが増大するという問題がある。 For example, even if only the order of two paragraphs is changed, such software determines that all the paragraphs have been changed. Therefore, it is necessary for the user to analyze the matching part and the different part while checking the related documents one page at a time, and there is a problem that the workability is low and the time and cost required for the examination increase.
そこで、本発明の目的は、ユーザにより選択された第1文献情報及び第2文献情報を所定単位のブロックで比較することにより、両者の内容をより適切に対比することができる文献情報分析装置及び文献情報分析方法を提供することにある。本発明の他の目的は、関連性のあるブロック同士を関連を示す表示要素で接続して可視化し、この関連を示す表示要素をユーザが選択するだけで各ブロック間の対比結果を容易に確認することができる文献情報分析装置及び文献情報分析方法を提供することにある。本発明のさらなる目的は、後述する実施形態の記載から明らかになるであろう。 Therefore, an object of the present invention is to compare the first document information and the second document information selected by the user with a block of a predetermined unit, and thereby compare the contents of the two more appropriately. It is to provide a literature information analysis method. Another object of the present invention is to connect and visualize related blocks with a display element indicating the relation, and the user can easily confirm the comparison result between the blocks only by selecting the display element indicating the relation. An object of the present invention is to provide a literature information analysis apparatus and a literature information analysis method that can be used. The further objective of this invention will become clear from description of embodiment mentioned later.
上記課題を解決すべく、本発明の一つの観点に従う文献情報分析装置は、それぞれ電子化された複数の文献情報をそれぞれ記憶する文献情報記憶部と、記憶された各文献情報のうちユーザにより選択された第1文献情報及び第2文献情報を文献情報記憶部からそれぞれ取得し、第1文献情報及び前記第2文献情報をそれぞれ所定単位のブロックとして処理させる文献情報取得部と、少なくとも第1文献情報及び第2文献情報に含まれる単語群に基づいて決定される座標系において、各ブロックの座標をそれぞれ算出するブロック座標算出部と、各ブロックの座標に基づいて各ブロックを配置し、かつ、各ブロックのうち第1文献情報に由来する所定の第1ブロックと第2文献情報に由来する所定の第2ブロックとを、両者の関連を示す表示要素で接続することによりマップ情報を生成するマップ生成部と、生成された前記マップ情報を表示させるマップ表示部と、を備える。
第1文献情報の全体及び第2文献情報の全体をぞれぞれ一つずつの所定単位のブロックとして扱うこともできるし、または、第1文献情報を分割してなる複数の情報及び前記第2文献情報を分割してなる複数の情報を、それぞれ一つずつの所定単位のブロックとして扱うこともできる。なお、文献情報の全体を一つのブロックとして扱う場合、例えば、このブロックを「全体ブロック」と呼ぶことができ、文献情報を複数に分割してそれぞれを一つずつのブロックとして扱う場合は、これらのブロックを「部分ブロック」または「サブブロック」と呼ぶことができる。
In order to solve the above-described problem, a literature information analyzing apparatus according to one aspect of the present invention includes a literature information storage unit that stores a plurality of digitized literature information, and a user's selection among each stored literature information. A first document information acquisition unit that acquires the first document information and the second document information obtained from the document information storage unit, and processes each of the first document information and the second document information as a block of a predetermined unit, and at least the first document In the coordinate system determined based on the word group included in the information and the second document information, a block coordinate calculation unit that calculates the coordinates of each block, and arranges each block based on the coordinates of each block, and Of each block, a predetermined first block derived from the first document information and a predetermined second block derived from the second document information are displayed to indicate the relationship between the two. In comprising a map generator for generating map information by connecting a map display unit for displaying the generated the map information.
The whole of the first document information and the whole of the second document information can be treated as a block of a predetermined unit each, or a plurality of information obtained by dividing the first document information and the first information A plurality of pieces of information obtained by dividing two pieces of document information can be handled as a predetermined unit block. When handling the entire document information as one block, for example, this block can be referred to as an “entire block”. When the document information is divided into a plurality of blocks and treated as one block, these These blocks can be called “partial blocks” or “sub-blocks”.
ここで、文献情報としては、技術文献情報、学術論文情報、特許文献情報等を挙げることができる。特許文献情報としては、例えば、特許公開公報や実用新案登録公報等のように、特許出願または実用新案登録出願に関する文献情報を挙げることができる。所定単位としては、段落単位または請求項単位のいずれか又は両方を使用可能である。 Here, examples of the document information include technical document information, academic paper information, and patent document information. Examples of patent document information include document information relating to patent applications or utility model registration applications such as patent publications and utility model registration gazettes. As the predetermined unit, either a paragraph unit or a claim unit or both can be used.
ユーザは、第1文献情報及び第2文献情報をそれぞれ選択することができるが、いずれか一方または両方の選択に際して、支援を与えることもできる。例えば、各文献情報に含まれている書誌的事項(出願人名、発明者名、特記事項、出願番号、基礎出願番号、出願日、公開日等)や従来技術に関する事項(先行特許文献を特定する公報番号等)に基づいて、互いに関連する文献情報を自動的に抽出することができる。このような関連する文献情報を自動的に抽出する関連文献抽出手段を設けることにより、ユーザは、第1文献情報を指定するだけでよく、操作性が向上する。第1文献情報に関連する(対応する)第2文献情報は、関連文献抽出手段によって自動的に抽出される。 The user can select the first document information and the second document information, respectively, but can also provide support when selecting either one or both. For example, bibliographic items (applicant name, inventor name, special remarks, application number, basic application number, application date, publication date, etc.) included in each document information and prior art items (prior patent documents are specified) Bibliographic information related to each other can be automatically extracted based on a publication number or the like. By providing the related document extracting means for automatically extracting such related document information, the user only has to specify the first document information, and the operability is improved. The second document information related to (corresponding to) the first document information is automatically extracted by the related document extracting means.
このように、ユーザは、直接的にまたは間接的に、複数の文献情報を選択することができる。選択された各文献情報は、所定単位のブロックにそれぞれ分割される。ユーザが指定した範囲についてのみ、各文献情報をそれぞれブロックに分割してもよい。例えば、特許文献の場合、特許請求の範囲のみを請求項単位で分割したり、実施形態の記載のみを段落単位で分割することができる。 In this way, the user can select a plurality of document information directly or indirectly. Each selected document information is divided into predetermined units of blocks. Each document information may be divided into blocks only for the range designated by the user. For example, in the case of patent documents, only the claims can be divided in units of claims, or only the description of the embodiment can be divided in units of paragraphs.
そして、ブロック座標算出部は、所定の座標系における各ブロックの座標をそれぞれ算出する。所定の座標系は、例えば、選択された各文献情報にそれぞれ含まれる単語群の出現頻度等を解析することにより、決定可能である。あるいは、文献情報の全体を一つのブロックとして扱う場合、複数の文献情報から抽出されるキーワードの組合せ及び出現頻度を主成分分析することにより、座標系を決定することができる。座標軸を2つ設定すれば2次元の座標系を得ることができ、座標軸を3つ設定すれば3次元の座標系を得ることができる。ブロック座標算出部は、例えば、第1文献情報及び第2文献情報をそれぞれ分割してなるブロックを用いる場合において、各ブロックにそれぞれ含まれる各単語の座標の平均値を求め、この平均値をそのブロックの座標として決定する。 Then, the block coordinate calculation unit calculates the coordinates of each block in a predetermined coordinate system. The predetermined coordinate system can be determined, for example, by analyzing the appearance frequency of a word group included in each selected document information. Alternatively, when the entire document information is handled as one block, the coordinate system can be determined by performing principal component analysis on keyword combinations and appearance frequencies extracted from a plurality of document information. If two coordinate axes are set, a two-dimensional coordinate system can be obtained, and if three coordinate axes are set, a three-dimensional coordinate system can be obtained. For example, in the case where a block formed by dividing the first document information and the second document information is used, the block coordinate calculation unit obtains an average value of the coordinates of each word included in each block, and calculates the average value as the average value. Determined as block coordinates.
以下、主として、第1文献情報及び第2文献情報をそれぞれ複数のブロックに分割する場合を例に挙げて説明する。マップ生成部は、各ブロックをそれぞれの座標に配置し、さらに、所定のブロック同士を、両者の関連を示す表示要素で接続することにより、マップ情報を生成する。両者の関連を示す表示要素としては、例えば、線や楕円、長方形、三角形等の各種表示要素を挙げることができる。関連するブロック同士を線で接続する場合、マップ情報の表示エリアを有効に利用することができる。これにより、所定の座標系に各ブロックがそれぞれの位置に配置され、かつ、所定のブロック同士が表示要素で接続されて関連性が可視化されたマップ情報が生成される。ここで、留意すべきは、第1文献情報に由来する第1ブロックと、第2文献情報に由来する第2ブロックとが接続される点である。即ち、第1ブロック同士、または第2ブロック同士が接続されることはない。 Hereinafter, a case where the first document information and the second document information are each divided into a plurality of blocks will be mainly described as an example. A map generation part arrange | positions each block to each coordinate, and also produces | generates map information by connecting predetermined blocks with the display element which shows both relationship. Examples of display elements indicating the relationship between the two include various display elements such as lines, ellipses, rectangles, and triangles. When connecting related blocks with a line, the display area of map information can be used effectively. As a result, map information is generated in which each block is arranged at each position in a predetermined coordinate system, and the predetermined blocks are connected to each other by the display element to visualize the relationship. Here, it should be noted that the first block derived from the first document information and the second block derived from the second document information are connected. That is, the first blocks or the second blocks are not connected.
本発明の実施形態では、マップ生成部は、第1ブロックと第2ブロックが所定距離以上離れている場合に、これら第1ブロック及び第2ブロック同士を、両者の関連を示す表示要素で接続する。第1ブロックと第2ブロックとが所定距離以上離れていない場合、即ち、両ブロックが近接している場合、両者の内容がほぼ同一であると判断することが可能である。従って、この場合は、各ブロックを接続せず、有意な相違が見られるブロック同士のみを接続する。 In the embodiment of the present invention, when the first block and the second block are separated from each other by a predetermined distance or more, the map generation unit connects the first block and the second block with a display element indicating the relationship between the first block and the second block. . When the first block and the second block are not separated by a predetermined distance or more, that is, when both blocks are close to each other, it is possible to determine that the contents of both are almost the same. Therefore, in this case, the blocks are not connected, and only the blocks where a significant difference is seen are connected.
本発明の実施形態では、マップ生成部は、所定距離以上離間している第1ブロックと第2ブロックとの少なくともいずれか一方が複数存在する場合、その中で最も近い第1ブロックと第2ブロックとを、両者の関連を示す表示要素で接続させる。そのブロックに最も近いブロックとの関連性が高いと考えられるためである。 In the embodiment of the present invention, when there are a plurality of at least one of the first block and the second block that are separated by a predetermined distance or more, the map generation unit is closest to the first block and the second block. Are connected with a display element indicating the relationship between the two. This is because it is considered highly relevant to the block closest to that block.
本発明の実施形態では、関連を示す表示要素がユーザによって選択された場合、この選択された関連を示す表示要素によって接続されている第1ブロックの内容と第2ブロックの内容とを予め設定された所定のレベルで対比し、この対比結果を出力させるブロック対比部を備える。 In the embodiment of the present invention, when the display element indicating the relation is selected by the user, the contents of the first block and the contents of the second block connected by the display element indicating the selected relation are preset. In addition, a block comparison unit is provided that compares at a predetermined level and outputs the comparison result.
ここで、所定のレベルとしては、例えば、単語レベル、句レベル、文レベルを挙げることができる。これらのレベルのうち、いずれを使用するかは、ユーザが自由に選択することができる。 Here, examples of the predetermined level include a word level, a phrase level, and a sentence level. The user can freely select which of these levels to use.
ブロック対比部は、関連を示す表示要素で接続された第1ブロックの内容と第2ブロックの内容との相違部分を対比結果として出力させることもできるし、両ブロックの共通部分を対比結果として出力させることもできる。 The block comparison unit can output the difference between the content of the first block and the content of the second block connected by the display element indicating the relationship as a comparison result, or output the common part of both blocks as the comparison result It can also be made.
本発明の他の観点に従うプログラムは、コンピュータを、文献情報記憶部に電子化されて記憶された複数の文献情報の中からユーザにより選択された第1文献情報及び第2文献情報をそれぞれ取得し、第1文献情報及び第2文献情報をそれぞれ所定単位のブロックに分割する文献情報分割手段と、第1文献情報及び第2文献情報に含まれる単語群に基づいて決定される座標系において、各ブロックの座標をそれぞれ算出するブロック座標算出手段と、各ブロックの座標に基づいて各ブロックを配置し、かつ、各ブロックのうち第1文献情報に由来する所定の第1ブロックと第2文献情報に由来する所定の第2ブロックとを、両者の関連を示す表示要素で接続することによりマップ情報を生成するマップ生成手段として、それぞれ機能させる。 A program according to another aspect of the present invention acquires a first document information and a second document information selected by a user from a plurality of document information stored electronically in a document information storage unit. In the coordinate system determined based on the word information included in the first document information and the second document information, the document information dividing means for dividing the first document information and the second document information into blocks of predetermined units, respectively, Block coordinate calculating means for calculating the coordinates of each block, each block is arranged based on the coordinates of each block, and the predetermined first block and second document information derived from the first document information among each block The predetermined second blocks that are derived are functioned as map generation means for generating map information by connecting them with display elements indicating the relationship between them.
本発明のさらに別の観点に従う文献情報分析方法は、文献情報記憶部に記憶された複数の文献情報の中からユーザによって選択された第1文献情報及び第2文献情報をそれぞれ取得するステップと、第1文献情報及び第2文献情報をそれぞれ所定単位のブロックに分割するステップと、第1文献情報及び第2文献情報に含まれる単語群に基づいて決定される座標系において、各ブロックの座標をそれぞれ算出するステップと、各ブロックの座標に基づいて、各ブロックを座標系に従うマップ上にそれぞれ配置させるステップと、マップに配置された各ブロックのうち第1文献情報に由来する所定の第1ブロックと第2文献情報に由来する所定の第2ブロックとを、両者の関連を示す表示要素で接続させるすることによりマップ情報を生成するステップと、生成されたマップ情報を表示させるステップと、ユーザによって両者の関連を示す表示要素が選択された場合には、この選択された関連を示す表示要素によって接続されている第1ブロックの内容と第2ブロックの内容とを予め設定された所定のレベルで対比し、この対比結果を出力させるステップとを含む。 The document information analysis method according to still another aspect of the present invention includes a step of acquiring first document information and second document information selected by a user from among a plurality of document information stored in a document information storage unit, In the coordinate system determined based on a word group included in the first document information and the second document information, the step of dividing the first document information and the second document information into blocks of predetermined units, respectively, A step of calculating, a step of arranging each block on a map according to the coordinate system based on the coordinates of each block, and a predetermined first block derived from the first document information among the blocks arranged on the map Map information is generated by connecting a predetermined second block derived from the second document information with a display element indicating a relation between the two and the second document information. The step of displaying the generated map information and the display element showing the relation between the two when the user selects the contents of the first block connected by the display element showing the selected relation And comparing the contents of the second block with a predetermined level set in advance and outputting the comparison result.
なお、複数の文献情報をブロック単位で比較する前に、比較対象の各文献情報間の関連性を予め自動的に検出し、両文献情報を両者の関連性を示す接続線で接続しておくこともできる。例えば、ユーザによって選択された複数の文献情報間の関係(分割前と分割後の出願、変更前と変更後の出願、補正前と補正後の出願、引用・被引用等)を各文献情報に含まれる書誌事項等に基づいて自動的に判定し、この判定された関係に応じた線種(色彩や線の種類、線の太さ等)の接続線を自動的に選択し、各文献情報を接続線で接続して表示させることができる。そして、ユーザが手動操作で接続線を選択すると、この接続線で結ばれた各文献情報がブロック単位で比較されるようにしてもよい。 Before comparing a plurality of document information in units of blocks, the relationship between each document information to be compared is automatically detected in advance, and both document information is connected by a connection line indicating the relationship between the two. You can also. For example, the relationship between a plurality of document information selected by the user (pre-division and post-division applications, pre-change and post-change applications, pre-correction and post-correction applications, citations and citations, etc.) Judgment is automatically made based on the bibliographic items included, and the connection line of the line type (color, line type, line thickness, etc.) corresponding to the determined relationship is automatically selected, and each document information Can be connected and displayed. And when a user selects a connection line by manual operation, each literature information connected with this connection line may be compared in a block unit.
以下、図面に基づき、本発明の実施の形態を説明する。本実施形態に係る文献情報分析装置1は、マップ制御部10と、対比制御部20及び情報蓄積部30を備えたコンピュータ装置として構成可能である。そして、文献情報分析装置1は、例えば、インターネットやLAN(Local Area Network)等の通信ネットワークを介して、クライアント端末2と双方向通信可能に接続されている。クライアント端末2は、例えば、パーソナルコンピュータや携帯情報端末(携帯電話を含む)等として構成可能である。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. The document
マップ制御部10は、情報蓄積部30に記憶されている多数の文献情報に基づいて、技術マップ100を生成し、出力する。生成されたマップ100は、通信ネットワークを介して、クライアント端末2に送信される。マップ100は、クライアント端末2内に保存可能としてもよいし、クライアント端末2内に保存不能としてもよい。マップ制御部10の詳細はさらに後述する。
The
対比制御部20は、マップ100に表示されている接続線がユーザによって選択された場合に、その接続線で結ばれている各ブロック111,112の内容を比較し、その結果をマップ100上に表示させる。対比制御部20の詳細はさらに後述する。
When the connection line displayed on the
情報蓄積部30は、例えば、特許公開公報や登録公報、あるいは、科学技術論文等のような文献情報を多数記憶している。
The
マップ100の構成を説明する。マップ100は、ユーザから指示された目的に添って生成されるものである。ユーザは、例えば、文献番号やサーチワード等を指定することにより、情報蓄積部30に記憶されている多数の文献情報群の中から、少なくとも2つ以上の文献情報を選ぶことができる。例えば、ユーザは、いわゆる親出願と分割出願、国内優先権主張出願と基礎出願、変更出願と変更前の出願、実用新案登録に基づく特許出願と実用新案登録出願、引用れた出願とこの出願を引用している出願等のように、互いに関連する複数の文献情報をそれぞれ選択することができる。
The configuration of the
後述のように、相互に関連する文献情報のうちいずれか一方がユーザによって選択された場合、この選択された文献情報に関連する他方の文献情報を自動的に選択する構成としてもよい。以下の説明では、ユーザによって選択された一方の文献情報を第1文献情報と、他方の文献情報を第2文献情報と呼ぶ。 As will be described later, when any one of the mutually related document information is selected by the user, the other document information related to the selected document information may be automatically selected. In the following description, one document information selected by the user is referred to as first document information, and the other document information is referred to as second document information.
ユーザにより選択された互いに関連する複数の文献情報は、マップ制御部10によって解析され、マップ100が生成される。生成されたマップ100は、クライアント端末2に提供される。
A plurality of pieces of document information related to each other selected by the user are analyzed by the
次に、マップ100の構成を説明する。等高線101A,101Bは、マップ100に含まれる単語の分布密度を示す表示要素である。また、マップ100には、複数のブロック111,112が表示されている。第1ブロック111は、第1文献情報を所定単位で分割することにより生成されたものである。第2ブロック112は、第2文献情報を所定単位で分割することにより生成されたものである。所定単位としては、特許文献の場合を例に挙げると、段落単位、請求項単位、実施例単位等を用いることができる。
Next, the configuration of the
そして、各ブロック111,112のうち互いに関連するブロック同士は、接続線113によって接続されている。この接続線113により、ユーザは、そのブロック間に関連性が存在することを容易に把握することができる。ユーザが、接続線113をクリック等して選択すると、対比制御部20は、その接続線113で結ばれたブロックの内容を対比し、対比結果を表示させる。
Of the
このように、本実施形態では、複数の文献情報の全体をそのまま対比するのではなく、各文献情報をブロック111,112に分割し、関連性のあるブロック同士のみを接続線113で接続してユーザに通知する。ユーザは、所望の接続線113を個別に選択することにより、特定のブロック間の対比結果を得ることができる。以下、本実施形態の詳細をさらに説明する。
In this way, in this embodiment, rather than comparing the entire plurality of document information as they are, each document information is divided into
図2は、文献情報分析装置1の機能構成を示すブロック図である。マップ制御部10は、例えば、マップ生成条件入力受付部11と、文献情報分割部12と、ブロック座標算出部13と、ブロック間類似度判定部14と、マップ生成部15及びマップ表示部16とを含んで構成することができる。
また、情報蓄積部30の一例として、文献データベース(図中、データベースを「DB」と略記)31と、単語データベース32と、インデックスデータベース33とを設けることができる。
文献データベース31は、複数の文献情報を記憶するものである。単語データベース32は、辞書として使用されるものである。インデックスデータベース33は、各文献にどのようなキーワードが含まれているかを管理するためのものである。
FIG. 2 is a block diagram illustrating a functional configuration of the document
In addition, as an example of the
The
マップ生成条件入力受付部11は、ユーザから指定されるマップ生成条件の入力を受け付けるためのものである。受け付けるとは、例えば、ユーザの指定するマップ生成条件を示す情報を通信インターフェースを介して電子情報として受信し、メモリ等に記憶させることを意味する。
The map generation condition
文献情報分割部12は、ユーザによって選択された第1文献情報及び第2文献情報を、ユーザから指定された条件に基づいて、それぞれ分割する。ユーザは、例えば、段落単位や請求項単位等の分割単位を指定することができる。なお、各文献情報は、同一レベル(単位)で分割される。
The document
ブロック座標算出部13は、文献データベース(図中、データベースを「DB」と略記)31及び単語データベース32を検索することにより、各ブロックに含まれている単語を抽出する。例えば、ブロック座標算出部13は、そのブロック内の各単語の座標の平均値を算出することにより、そのブロックの座標を算出する。
The block coordinate
ブロック間類似度判定部14は、各ブロック111,112の座標を比較し、両者の類似度を判別する。これにより、実質的に同一内容であると判定可能なブロック同士を接続の対象から排除し、実質的に同一ではないが関連するブロック同士のみを接続対象として抽出することができる。
The inter-block
マップ生成部15は、各ブロック111,112をそれぞれの座標に配置すると共に、互いに関連するブロック同士を接続線113で接続することにより、マップ100の論理的構造を生成する。
The
マップ表示部16は、生成されたマップ100の構造に応じて、所定の表示要素をそれぞれ割り当てることにより、ユーザが視認可能なマップ100を生成し、クライアント端末2に提供する。所定の表示要素としては、例えば、各ブロックを示すための図形要素、等高線101A等、マップ100に対する操作を行うためのメニュー表示部などを挙げることができる。
The
ユーザは、クライアント端末2の端末画面に表示されたマップ100を閲覧することにより、選択した文献情報の記述内容(ブロック)がどのように分布しており、どの記述内容同士が互いに関連しているのか等を容易に読みとることができる。
The user browses the
対比制御部20は、例えば、接続線指定情報入力受付部21と、ブロック対比部22と、対比結果出力部23とを含んで構成することができる。
The
接続線指定情報入力受付部21は、ユーザから入力される接続線指定情報を電子的に受け付けて記憶する。例えば、ユーザによるマップ100上の操作は、イベントハンドラによってイベントとして検出することができる。
The connection line designation information
ブロック対比部22は、ユーザの選択する接続線113によって接続されているブロック111,112の内容をテキストマイニング等の手法を用いて対比する。この対比結果は、対比結果出力部23によって、マップ100上に表示される。
The
対比結果表示部24は、例えば、対比対象のブロック間の一致部分と不一致部分とが明確に区別できるような形態で、対比結果を表示する。例えば、下線や取消線、フォント種別、大きさ、色等を適宜変えることにより、どの部分が一致しており、どの部分が一致していないのかを区別して表示させることができる。
For example, the comparison
図3は、文献情報分析装置1及びクライアント端末2のハードウェア構成の概略を示す構成説明図である。文献情報分析装置1は、上述のように、サーバコンピュータ等のように構成可能である。
FIG. 3 is a configuration explanatory diagram showing an outline of the hardware configuration of the document
文献情報分析装置1は、例えば、通信インターフェース(図中、インターフェースを「I/F」と略記)1001と、CPU(Central Processing Unit)1002と、ROM(Read Only Memory)1003と、RAM(Random Access Memory)1004と、補助記憶装置1005を備えて構成することができる。
The
補助記憶装置1005には、例えば、OS(Operating System)の他に、文献データベース31と、単語データベース32と、表示制御プログラム1110と、主成分分析プログラム1120と、構造解析プログラム1130と、検索プログラム1140及びウェブサーバプログラム1150を、それぞれ記憶させることができる。
In the
文献データベース31には、上述のように、特許公開公報等の文献情報が予め記憶されている。単語データベース32には、例えば、助詞や接続詞等のようなキーワードに不適切な単語、同義語、類義語等が予め記憶されている。インデックスデータベース33は、各文献に含まれているキーワードを管理する。表示制御プログラム1110は、マップ100の描画処理等を行うプログラムである。主成分分析プログラム1120は、主成分分析を行うプログラムである。構造解析プログラム1130は、例えば、テキストマイニング等の手法に基づいて、テキストデータの構造を解析するプログラムである。検索プログラム1140は、入力された検索条件に基づいて、文献データベース31等を検索するプログラムである。ウェブサーバプログラム1150は、ウェブサーバ機能を実現するプログラムである。
As described above, the
クライアント端末2の構成を説明する。クライアント端末2は、インターネット等の通信ネットワークCNを介して文献情報分析装置1に接続されており、例えば、通信インターフェース2001と、CPU2002と、ROM2003と、RAM2004及び補助記憶装置2005を備えて構成可能である。
The configuration of the
なお、以上の構成は例示であって、本発明はこれに限定されない。例えば、プログラムに代えて、プログラマブル・ロジック・デバイス等のようなハードウェア回路を用いて、各機能の少なくとも一部を実現可能な場合もある。 In addition, the above structure is an illustration and this invention is not limited to this. For example, it may be possible to realize at least a part of each function by using a hardware circuit such as a programmable logic device instead of the program.
文献情報分析装置1(以下、分析装置1とも呼ぶ)を用いた文献情報分析方法について説明する。図4は、全体動作の概要を示すフローチャートである。なお、以下に述べる各フローチャートも同様であるが、各フローチャートは、処理の概要を示しており、実際のプログラムとは相違する。なお、後述のように、ユーザによって直接的または間接的に選択された複数の文献情報間の関係を自動的に判定し、判定された関係に応じた線種の接続線で両文献情報を接続して表示しておくこともできる。 A document information analysis method using the document information analysis apparatus 1 (hereinafter also referred to as the analysis apparatus 1) will be described. FIG. 4 is a flowchart showing an overview of the overall operation. The flowcharts described below are also the same, but each flowchart shows an outline of the process and is different from an actual program. In addition, as described later, the relationship between a plurality of document information selected directly or indirectly by the user is automatically determined, and both document information is connected by a connection line of a line type corresponding to the determined relationship. It can also be displayed.
まず、ユーザは、クライアント端末2のユーザインターフェースを介して、比較対象となる文献情報を指定する(S10)。例えば、ユーザは、第1文献情報及び第2文献情報のそれぞれの文献番号等を指定することができる。あるいは、ユーザは、いずれか一方の文献番号のみを指定することもできる。 First, the user designates document information to be compared via the user interface of the client terminal 2 (S10). For example, the user can designate the respective document numbers of the first document information and the second document information. Alternatively, the user can specify only one of the document numbers.
分析装置1は、クライアント端末2から指定条件を取得すると(S11)、この指定条件に基づいて文献データベース31を検索し、指定条件に合致する文献情報をそれぞれ抽出する(S12)。
When the
抽出された文献情報の文献番号等は、分析装置1からクライアント端末2に送信され(S13)、クライアント端末2の画面に表示される(S14)。ユーザは、クライアント端末2の画面を介して、解析(対比)の実行を指示する(S15)。
The document number etc. of the extracted document information is transmitted from the
この指示を与える際に、ユーザは、対比条件を指定することもできる。対比条件としては、例えば、第1文献情報及び第2文献情報のどの部分をどの単位で対比するか等の条件を挙げることができる。 When giving this instruction, the user can also specify a comparison condition. Examples of the comparison condition include conditions such as which part of the first document information and the second document information is compared in which unit.
分析装置1は、ユーザから指示を受信すると、抽出された第1文献情報及び第2文献情報に基づいて、マップ100を生成する。詳細は後述するが、分析装置1は、第1文献情報及び第2文献情報をそれぞれ複数のブロックに分割し、各ブロックをマップ上に配置すると共に、互いに関連するブロック同士を接続線113で接続させる。生成されたマップ100は、クライアント端末2に送信される(S17)。
When receiving an instruction from the user, the
ユーザは、クライアント端末2の画面を介して、マップ100を閲覧し、ブロックの配置具合や接続線113の設定状態等を確認する。そして、ユーザは、詳細な対比を希望する場合、所望のブロック間を結ぶ接続線113を指定する(S19)。
The user browses the
分析装置1は、ユーザによる接続線の指定を検出すると、ブロック間の内容を対比し(S20)、この対比結果をクライアント端末2に送信する(S21)。ユーザは、マップ100に表示された表示部24を閲覧することにより、所望のブロック111,112の内容がどの程度相違しているか(共通しているか)を確認することができる。
When the
図5は、各文献情報を複数のブロックに分割等してマップ100を生成するための処理を示すフローチャートである。この処理は、図4中のS16に対応する。まず、分析装置1は、第1文献情報及び第2文献情報にそれぞれ含まれる単語群に基づいて、各単語の出現頻度等から単語の座標軸を2つ決定する(S31)。
なお、S31における座標軸算出処理は、一般的な多変量解析の一手法である主成分分析を利用している。例えば、座標算出のために使用する基礎データとして、各文献(または各ブロック)のそれぞれについて、対象の単語が出現しているか否かを「1(出現)」「0(非出現)」のマトリックスを利用して算出し、この結果算出される「主成分負荷量」と呼ばれる指標を実際の座標とする。
FIG. 5 is a flowchart showing a process for generating the
Note that the coordinate axis calculation processing in S31 uses principal component analysis, which is a common multivariate analysis technique. For example, as basic data used for coordinate calculation, a matrix of “1 (appearance)” and “0 (non-appearance)” indicates whether or not the target word appears for each document (or each block). An index called “principal component load amount” calculated as a result is used as an actual coordinate.
次に、分析装置1は、第1文献情報を予め設定された所定単位のブロックにそれぞれ分割する(S32)。上述のように、例えば、段落単位や請求項単位等のように、各文献情報をそれぞれ分割することができる。ここで、所定単位とは、意味内容上の単位であり、ブロックのデータサイズとは直接関係しない点に留意すべきである。各ブロックのデータサイズは、それぞれに含まれているデータ量によって相違する。
Next, the
次に、分析装置1は、第1文献情報を分割してなる第1ブロック群の各ブロックについて、以下のS34〜S37をそれぞれ実行する(S33)。分析装置1は、一つの第1ブロック111を選択して、この第1ブロック111の内容を構文解析し(S34)、その第1ブロック111に含まれている単語を全て抽出する(S35)。
Next, the
分析装置1は、そのブロック111に含まれている各単語の座標をそれぞれ求めて、その平均値を算出する。そして、分析装置1は、この算出された平均値を、そのブロック111の座標として使用する(S36)。分析装置1は、算出された座標位置に、そのブロック111を所定の表示形態で配置させる(S37)。所定の表示形態とは、例えば、そのブロック111を示す図形の形状や色彩等を意味する。以上の処理を第1ブロック群の全ブロック111について繰り返すことにより、第1文献情報はブロック単位で分割されて、マップ100に分散して表示される。
The
次に、分析装置1は、第1ブロック111と同じ単位で、第2文献情報を複数のブロック112にそれぞれ分割する(S38)。分析装置1は、第2文献情報を分割してなる第2ブロック群の各ブロック112について、以下のS40〜S47をそれぞれ実行する(S39)。
Next, the
分析装置1は、一つの第2ブロック112を選択して、この第2ブロック112の内容を構文解析し(S40)、そこに含まれている単語を全て抽出する(S41)。分析装置1は、そのブロック112に含まれている各単語の座標の平均値を算出することにより、その第2ブロック112の座標を決定する(S42)。
The
分析装置1は、算出された座標位置に、その第2ブロック112を所定の表示形態で配置させる(S43)。以上の処理を第2ブロック群の全ブロック112について繰り返すことにより、第2文献情報はブロック単位で分割されて、マップ100に分散して表示される。
The
次に、接続線設定処理が実行される。分析装置1は、その第2ブロック112の座標から所定範囲内に第1ブロック111が存在するか否かを判定する(S44)。第2ブロック112から所定範囲内に第1ブロック111が存在する場合(S44:YES)、その第2ブロック112と第1ブロック111の内容はほぼ同一であると判断できる。従って、この場合は、接続線113を設定せずに、次の第2ブロック112の処理に移る。
Next, connection line setting processing is executed. The
これに対し、その第2ブロック112の位置から所定範囲内に第1ブロック111が存在しない場合(S44:NO)、第2ブロック112と実質的に同一内容の第1ブロック111が、その第2ブロック112の近傍に位置しない場合である。即ち、その第2ブロック112とは内容の異なる第1ブロック111が、その第2ブロック112の周辺に存在すると判断可能な場合である(S45)。
On the other hand, when the
そこで、分析装置1は、その第2ブロック112から最も近い第1ブロック111を検索し(S46)、検索された最短距離の第1ブロック111と第2ブロック112とを接続線113で接続する(S47)。
Therefore, the
ここで、分析装置1は、各ブロック111,112間の距離に応じて、接続線113の表示形態を変更させることができる。例えば、接続線表示形態管理テーブルT1に、ブロック間の距離と線種との関係を予め登録しておけば、分析装置1は、各ブロック間の距離に応じた線種で、接続線113を表示させることができる。ここにいう「線種」とは、線の種類(実線、点線、一点鎖線等)、線の太さ、線の色のいずれか一つまたは複数を含む概念である。
Here, the
次に、図6は、ブロック間の内容を対比するブロック間対比処理を示すフローチャートである。この処理は、図5中のS20に対応する。分析装置1は、マップ100上の接続線113のいずれかがユーザによって指定されたか否かを判定する(S51)。
Next, FIG. 6 is a flowchart showing an inter-block comparison process for comparing contents between blocks. This process corresponds to S20 in FIG. The
接続線113がユーザによって指定されると(S51:YES)、分析装置1は、その指定された接続線113で結ばれている第1ブロック111と第2ブロック113とをそれぞれ特定する(S52)。分析装置1は、第1ブロック111の内容及び第2ブロック112の内容をそれぞれ取得する(S53,S54)。
When the
そして、分析装置1は、第1ブロック111の内容と第2ブロック112の内容とを比較し(S55)、その一致部分(共通部分)及び相違部分(差分)をそれぞれ抽出して一時的に記憶する(S56)。分析装置1は、抽出された一致部分及び相違部分をマップ100に表示させる(S57)。
Then, the
図7は、対比結果表示部24による表示例を示す説明図である。例えば、各ブロック111,112の原文を最上段に表示し、次の段に両ブロック111,112の一致部分を表示し、最後の段に両ブロック111,112の相違部分を表示することができる。
FIG. 7 is an explanatory diagram illustrating a display example by the comparison
なお、これに限らず、例えば、下線や取消線等を用いて、各ブロック111,112の原文中に一致部分及び相違部分を同時に表示させる構成でもよい。
However, the present invention is not limited to this, and for example, a configuration may be used in which a matching portion and a different portion are simultaneously displayed in the original text of each of the
また、対比するレベルは、単語レベル、フレーズレベル、センテンスレベルのいずれかまたは複数をユーザが自由に設定することができる。 In addition, the user can freely set one or more of a word level, a phrase level, and a sentence level as levels to be compared.
次に、図8は、クライアント端末2の画面に表示されるマップ生成メニュー画面G1の一例を示す説明図である。例えば、メニュー画面G1には、文献指定部G2と、比較範囲指定部G3と、ブロック単位指定部G4と、関連文献検索ボタンB1と、実行指示ボタンB2及び取消ボタンB3とを含めることができる。
Next, FIG. 8 is an explanatory diagram showing an example of the map generation menu screen G1 displayed on the screen of the
文献指定部G2には、ユーザが第1文献情報及び第2文献情報の文献番号をそれぞれ直接入力することができる。あるいは、ユーザは、いずれか一方の文献番号のみを入力した後、関連文献検索ボタンB1を操作することにより、その入力済の文献番号に関連する文献番号を分析装置1に自動的に検索させてセットさせることもできる。
The document designation part G2 allows the user to directly input the document numbers of the first document information and the second document information. Alternatively, after the user inputs only one of the document numbers, the user operates the related document search button B1 to cause the
比較範囲指定部G3では、各文献情報のどの部分について比較するかを指定する。例えば、文献の全体、特許請求の範囲、発明の詳細な説明、課題を解決するための手段、発明の効果、要約等のように、ユーザは所望の範囲を指定することができる。なお、比較範囲は複数指定することができる。 The comparison range designating part G3 designates which part of each document information is to be compared. For example, the user can specify a desired range such as the whole literature, claims, detailed explanation of the invention, means for solving the problem, effects of the invention, summary, and the like. A plurality of comparison ranges can be specified.
ブロック単位指定部G4では、ブロックの生成単位を指定する。例えば、請求項単位、段落単位、ページ単位のように、ユーザは所望の単位をいずれか一つまたは複数選択することができる。 The block unit designation unit G4 designates a block generation unit. For example, the user can select any one or a plurality of desired units such as a claim unit, a paragraph unit, and a page unit.
そして、各文献情報を特定するための情報(文献番号)や比較範囲及びブロック単位を指定した後、ユーザが実行指示ボタンB2を操作すると、分析装置1は、上述した処理を実行してマップ100を生成する。
When the user operates the execution instruction button B2 after designating information (reference number) for identifying each piece of document information, a comparison range, and a block unit, the
本実施例は上述の構成を採用するため、以下の効果を奏する。本実施例では、第1文献情報及び第2文献情報をそれぞれ所定単位のブロックに分割し、互いに関連する第1ブロック111と第2ブロック112を接続線113で接続してマップ100に表示させる構成とした。従って、各文献情報の全体を単純に対比する場合に比べて、ブロック単位で各文献情報の構造を把握でき、かつ、各文献情報のどの部分がどのように関連しているのかを視覚を通じて直感的に把握することが可能となり、使い勝手が向上する。
Since the present embodiment employs the above-described configuration, the following effects can be obtained. In the present embodiment, the first document information and the second document information are each divided into predetermined units of blocks, and the
本実施例では、第1ブロック111と第2ブロック112が所定距離以上離れている場合に、これら第1ブロック111及び第2ブロック112同士を、接続線113で接続して表示させる構成とした。従って、互いに関連し、かつ、内容の相違するブロック同士だけを接続線113で対応付けることができ、使い勝手が向上する。
In the present embodiment, when the
本実施例では、第1ブロック111と第2ブロック112とが所定距離以上離間している場合に、最も近い第1ブロック111と第2ブロック112とを接続線113で接続して表示させる構成とした。従って、互いに関連する可能性が高いブロック同士を接続して可視化することができ、使い勝手が向上する。
In the present embodiment, when the
本実施例では、接続線113がユーザによって選択された場合、この接続線113で接続されている第1ブロック111の内容と第2ブロックの内容112とを予め設定された所定のレベルで対比し、この対比結果を出力させる構成とした。従って、ユーザは、接続線113を選択するだけで、所望のブロック間の類似度合を簡単に把握することができ、使い勝手が向上する。
In this embodiment, when the
本実施例では、各ブロックの一致部分または相違部分のいずれかまたは両方を表示可能な構成とした。従って、各文献情報の共通部分や相違部分をブロック単位で個別に精査することができ、使い勝手が向上する。 In the present embodiment, either one or both of the matching part and the different part of each block can be displayed. Therefore, common parts and different parts of each document information can be individually examined in units of blocks, and usability is improved.
図9〜図12に基づいて、本発明の第2実施例を説明する。前記第1実施例では、文献情報を複数のブロックに分割し、ブロック単位で比較する場合を説明したが、本実施例では、各文献情報をブロック単位で比較する前に、比較対象の文献情報間の関連性を区別して表示させる。 A second embodiment of the present invention will be described with reference to FIGS. In the first embodiment, the case where the document information is divided into a plurality of blocks and compared in units of blocks has been described. However, in this embodiment, before comparing each document information in units of blocks, the document information to be compared is compared. Differentiate the relationship between them.
図9は、本実施例の全体概要を示す説明図である。本実施例では、文献情報分析装置1の前処理として、ユーザにより選択された文献情報間の関連性を視覚化する。
関連性分析装置300は、文献情報の関連性を検出し、その関連性に応じた接続線で文献情報間を接続して表示させるものである。関連性分析装置300は、文献情報分析装置1と同一のコンピュータ装置に設けることもできるし、あるいは文献情報分析装置1とは別のコンピュータ装置に設けることもできる。
FIG. 9 is an explanatory diagram showing an overall outline of the present embodiment. In the present embodiment, as the preprocessing of the document
The
「文献情報分析装置1の前処理装置」として表現可能な関連性分析装置300は、例えば、文献選択部310と、関連性検出部320と、接続線選択部330と、表示画面350を生成する表示出力部340と、選択操作検出部360とを備えて構成できる。
関連性分析装置300は、文献情報分析装置1と同様に、文献データベース31,単語データベース32及びインデックスデータベース33を使用可能である。即ち、これら各データベース31〜33は、両分析装置1,300間で共用されている。
The
The
文献選択部310は、ユーザから指定された条件に基づいて、文献データベース31(または文献データベース31及びインデックスデータベース33)を検索することにより、ユーザの望む文献情報を抽出するものである。例えば、ユーザは、特許公開公報番号や特許出願番号等のような文献番号を指定することにより、複数の文献情報111A,112A,113Aを抽出させることができる。
The
関連性検出部320は、抽出された各文献情報111A,112A,113Aの関係を判定する。例えば、関連性判定部320は、各文献情報111A,112A,113Aに含まれる書誌事項に基づいて、第1文献情報111Aに関連する第2文献情報112Aを抽出することができる。
The
書誌事項には、例えば、特許分類、出願人氏名、発明者氏名、代理人氏名、出願番号、公開番号、登録番号、出願日、公開日、登録日、特別な出願の表示(優先権主張、分割変更の表示、新規性喪失の例外規定の適用等)、請求項の数、審査請求の有無、先行技術文献の番号等が含まれている。従って、関連性検出部320は、書誌事項を解析することにより、互いに関連する複数の文献情報111A,112Aを抽出可能である。
図9の表示画面350では、第1文献情報111Aを基準として、複数の第2文献情報112Aが第1文献情報111Aに関連している様子を示している。なお、第3文献情報113Aは、第1文献情報111Aと直接的な関連性(例えば、法的関係)はなく、共通するキーワード等を有するだけの文献である。
Bibliographic items include, for example, patent classification, applicant name, inventor name, agent name, application number, publication number, registration number, application date, publication date, registration date, special application indication (priority claim, Display of divisional change, application of exception provision for loss of novelty, etc.), the number of claims, presence / absence of examination request, number of prior art documents, etc. Therefore, the
The
接続線選択部330は、関連性検出部320によって検出された関連性に基づいて、接続線表示形態管理テーブルT1を参照することにより、文献情報間の関連性に応じた線種の接続線113Aを選択する。
The connection
表示出力部340は、選択された接続線113Aを用いて、各文献情報111A,112Aを接続することにより、表示画面350を生成する。生成された表示画面350は、通信ネットワークを介してクライアント端末に提供される。
The
ユーザがクライアント端末を介して、接続線113Aを選択操作すると、この選択操作は、選択操作検出部360によって検出される。選択操作検出部360は、ユーザの選択操作を検出すると、文献情報分析装置1に分析開始を指示する。これにより、文献情報分析装置1は、上述のように、各文献情報111A,112Aを複数のブロックに分割し、対応するブロック同士を接続し、その内容を対比する。
When the user selects the
図10は、接続線表示形態管理テーブルT1の一例を示す説明図である。このテーブルT1には、例えば、複数のテーブルT1A,T1Bの少なくともいずれか一方を含めることができる。
一方のテーブルT1Aは、文献情報111A,112A間の距離に応じた線種を選択するためのものである。例えば、ユーザによって抽出された多数の文献情報群に基づいて設定される座標系において、第1文献情報111A,第2文献情報112Aの座標をそれぞれ求め、各文献情報111A,112A間の距離を算出可能な場合に、テーブルT1Aを使用することができる。このテーブルT1Aでは、例えば、距離に応じて線の太さや種類が異なるように設定されている。
FIG. 10 is an explanatory diagram showing an example of the connection line display form management table T1. The table T1 can include, for example, at least one of a plurality of tables T1A and T1B.
One table T1A is for selecting a line type according to the distance between the
他方のテーブルT1Bは、文献情報111A,112Aの関連性に応じた線種を選択するためのものである。関連性としては、上述のように、分割出願や変更出願等のような法的関係を挙げることができる。このテーブルT1Bでは、両文献情報の関連に応じて、異なる色彩の接続線113Aが設定されている。
The other table T1B is for selecting a line type according to the relevance of the
なお、線の太さ及び色彩に限らず、例えば、接続線113Aを点滅させたり、アニメーション表示させてもよい。また、どのような表示形態で接続線113Aを表示させるかは、ユーザがカスタマイズ可能としてもよい。
For example, the
次に、図11は、本実施例の全体動作を示すフローチャートである。
まず、ユーザは、クライアント端末2のユーザインターフェースを介して、検索条件を入力する(S60)。検索条件は、例えば、「光触媒」等のようなキーワードを指定することにより、あるいは特許分類コードや文献の公開日等を指定することにより、行うことができる。
Next, FIG. 11 is a flowchart showing the overall operation of this embodiment.
First, the user inputs search conditions via the user interface of the client terminal 2 (S60). The search condition can be performed, for example, by specifying a keyword such as “photocatalyst” or by specifying a patent classification code, a publication date of a document, or the like.
関連性分析装置300は、クライアント端末2から検索条件を取得すると(S61)、この検索条件に基づいてインデックスデータベース33及び文献データベース31を検索し、検索条件に合致する文献情報を全て抽出する(S62)。より具体的には、ユーザから指定されたキーワードを有する文献情報を抽出するために、インデックスデータベース33が使用される。そして、指定されたキーワードを有する文献情報が特定されると、その文献情報が文献データベース31から読み出される。そして、抽出された結果は、関連性分析装置300からクライアント端末2に送信され(S63)、クライアント端末2の画面に表示される(S64)。
When acquiring the search condition from the client terminal 2 (S61), the
ユーザは、クライアント端末2の画面を介して、抽出された文献の総数や文献名称等を確認し、少なくとも一つの文献情報(第1文献情報111A)を選択する(S65)。
関連性分析装置300は、書誌事項を解析することにより、ユーザによって選択された第1文献情報111Aに関連する第2文献情報112Aを全て抽出する(S66)。
The user confirms the total number of extracted documents, document names, and the like via the screen of the
The
関連性分析装置300は、抽出された各第2文献情報112Aと第1文献情報111Aとの関連性に応じた接続線113Aを選択し(S68)、各文献情報111A,112A同士を接続して(S69)、クライアント端末の画面に表示させる(S70)。
The
ユーザがいずれかの接続線113Aをクリック操作等して選択すると(S71)、関連性分析装置300は、文献情報分析装置1に分析開始を指示する(S72)。これにより、第1実施例で述べた処理が開始され、マップ100が生成される。
When the user selects one of the
なお、S60〜S64は省略可能である。即ち、ユーザは、第1文献情報111A及び第2文献情報112Aの文献番号をそれぞれ明示して指定することもできる。また、ユーザは、接続線113Aの選択操作に代えて、表示画面350に表示されるメニューを操作することにより、第1実施例で述べた処理に移行させることもできる。
Note that S60 to S64 can be omitted. That is, the user can explicitly specify the document numbers of the
このように構成される本実施例では、関連する文献情報111A,112A間の関連性を視覚を通じて直感的に判断することができる。そして、両文献情報111A,112A間の関係を把握した上で、各文献情報111A,112Aをブロック単位で比較し、詳細に一致点や相違点を検討することができ、使い勝手が向上する。
In this embodiment configured as described above, it is possible to intuitively determine the relationship between the
なお、本発明は、上述した実施の形態に限定されない。当業者であれば、本発明の範囲内で、種々の追加や変更等を行うことができる。例えば、第1実施例では、第1文献情報及び第2文献情報に含まれる単語群から座標系を決定する場合を述べたが、これに限らず、より多数の文献情報に含まれる単語群に基づいて座標系を決定してもよい。
また、第1実施例では、文献情報を複数のブロックに分割して対比する場合を述べたが、これに限らず、文献情報の全体を一つのブロックとして扱い、文献全体同士を対比させることもできる。
The present invention is not limited to the above-described embodiment. A person skilled in the art can make various additions and changes within the scope of the present invention. For example, in the first embodiment, the case where the coordinate system is determined from the word group included in the first document information and the second document information is described. However, the present invention is not limited to this, and the word group included in a larger number of document information. A coordinate system may be determined based on this.
In the first embodiment, the case where the document information is divided into a plurality of blocks and compared is described. However, the present invention is not limited to this, and the entire document information may be treated as one block and the entire documents may be compared. it can.
1…文献情報分析装置、2…クライアント端末、10…マップ制御部、11…マップ生成条件入力受付部、12…文献情報分割部、13…ブロック座標算出部、14…ブロック間類似度判定部、15…マップ生成部、16…マップ表示部、20…対比制御部、21…接続線指定情報入力受付部、22…ブロック対比部、23…対比結果出力部、24…対比結果表示部、30…情報蓄積部、31…文献データベース、32…単語データベース、100…マップ、101A,101B…等高線、111,112…ブロック、300…関連性分析装置、310…文献選択部、320…関連性検出部、330…接続線選択部、340…表示出力部、350…表示画面、360…選択操作検出部
DESCRIPTION OF
Claims (9)
前記記憶された各文献情報のうちユーザから入力されるマップ生成条件により選択された第1文献情報及び第2文献情報を前記文献情報記憶部からそれぞれ取得し、前記第1文献情報及び前記第2文献情報をそれぞれ前記マップ生成条件に基づいて段落単位または請求項単位のいずれか又は両方である所定単位のブロックに分割して処理させる文献情報取得部と、
少なくとも前記第1文献情報及び前記第2文献情報に含まれる単語の文献情報毎またはブロック毎の出現頻度に基づいて主成分分析を用いることにより決定される座標系において、前記各ブロックに含まれる各単語の前記座標系における座標の平均値を前記各ブロックの座標としてそれぞれ算出するブロック座標算出部と、
前記各ブロックの座標に基づいて前記各ブロックを配置し、かつ、前記各ブロックのうち前記第1文献情報に由来する所定の第1ブロックと前記座標系における所定の距離以上離れている前記第2文献情報に由来する所定の第2ブロックとを、表示要素で接続することによりマップ情報を生成するマップ生成部と、
生成された前記マップ情報を表示させるマップ表示部と、
を備えた文献情報分析装置。 A document information storage unit that stores a plurality of document information, each of which is a patent document related to an electronic patent application or utility model registration application ,
The first document information and the second document information selected according to the map generation condition input from the user among the stored document information are respectively acquired from the document information storage unit, and the first document information and the second document information are acquired. A document information acquisition unit that divides and processes document information into blocks of a predetermined unit that is either a paragraph unit or a claim unit or both based on the map generation condition ,
Each of the blocks included in each block in a coordinate system determined by using principal component analysis based on the frequency of appearance of each word or each block of word information included in the first document information and the second document information and the block coordinate calculation unit configured to calculate an average value of coordinates in the coordinate system of the word as the coordinates of the blocks,
The respective blocks are arranged based on the coordinates of the respective blocks, and the second of the blocks is separated from a predetermined first block derived from the first document information by a predetermined distance in the coordinate system. a map generating unit for generating map information by a predetermined second block derived from literature data, connected by Viewing elements,
A map display unit for displaying the generated map information;
A bibliographic information analyzer.
前記文献情報取得部は、前記接続線がユーザにより選択されると、前記接続線で接続されている前記各文献情報を前記第1文献情報及び前記第2文献情報として前記文献情報記憶部からそれぞれ取得する、When the connection line is selected by a user, the document information acquisition unit converts each document information connected by the connection line from the document information storage unit as the first document information and the second document information, respectively. get,
請求項1〜6のいずれかに記載の文献情報分析装置。The literature information analyzer according to any one of claims 1 to 6.
文献情報記憶部に電子化されて記憶された特許出願または実用新案登録出願に関する特許文献である複数の文献情報の中からユーザから入力されるマップ生成条件により選択された第1文献情報及び第2文献情報をそれぞれ取得し、前記第1文献情報及び前記第2文献情報をそれぞれ前記マップ生成条件に基づいて段落単位または請求項単位のいずれか又は両方である所定単位のブロックに分割する文献情報分割手段と、
前記第1文献情報及び前記第2文献情報に含まれる単語の文献情報毎またはブロック毎の出現頻度に基づいて主成分分析を用いることにより決定される座標系において、前記各ブロックに含まれる各単語の前記座標系における座標の平均値を前記各ブロックの座標としてそれぞれ算出するブロック座標算出手段と、
前記各ブロックの座標に基づいて前記各ブロックを配置し、かつ、前記各ブロックのうち前記第1文献情報に由来する所定の第1ブロックと前記座標系における所定の距離以上離れている前記第2文献情報に由来する所定の第2ブロックとを、表示要素で接続することによりマップ情報を生成するマップ生成手段として、
それぞれ機能させるプログラム。 Computer
The first document information and the second document information selected by the map generation condition input from the user from among a plurality of document information that is a patent document or a patent document relating to a utility model registration application electronically stored in the document information storage unit Document information division for acquiring document information and dividing the first document information and the second document information into blocks of a predetermined unit that is either a paragraph unit or a claim unit or both based on the map generation condition. Means,
Each word included in each block in the coordinate system determined by using principal component analysis based on the frequency of appearance of each word information or block for each word included in the first document information and the second document information and block coordinates calculating means for calculating respective average values of the coordinates as the coordinates of the respective blocks in the coordinate system of
The respective blocks are arranged based on the coordinates of the respective blocks, and the second of the blocks is separated from a predetermined first block derived from the first document information by a predetermined distance in the coordinate system. and a predetermined second block derived from literature data, a map generating means for generating map information by connecting with Viewing elements,
Each program that functions.
前記コンピュータが、前記第1文献情報及び前記第2文献情報をそれぞれ前記マップ生成条件に基づいて段落単位または請求項単位のいずれか又は両方である所定単位のブロックに分割するステップと、
前記コンピュータが、前記第1文献情報及び前記第2文献情報に含まれる単語の文献情報毎またはブロック毎の出現頻度に基づいて主成分分析を用いることにより決定される座標系において、前記各ブロックに含まれる各単語の前記座標系における座標の平均値を前記各ブロックの座標としてそれぞれ算出するステップと、
前記コンピュータが、前記各ブロックの座標に基づいて、前記各ブロックを前記座標系に従うマップ上にそれぞれ配置させるステップと、
前記コンピュータが、前記マップに配置された各ブロックのうち前記第1文献情報に由来する所定の第1ブロックと前記座標系における所定の距離以上離れている前記第2文献情報に由来する所定の第2ブロックとを、表示要素で接続することによりマップ情報を生成するステップと、
前記コンピュータが、生成された前記マップ情報を表示させるステップと、
前記コンピュータが、前記ユーザによって前記表示要素が選択された場合には、この選択された表示要素によって接続されている前記第1ブロックの内容と前記第2ブロックの内容とを単語レベル、句レベル、文レベルのうち前記ユーザによって選択された少なくともいずれか一つのレベルで対比し、この対比結果を出力させるステップと、を実行する文献情報分析方法。 The first document information and the second document selected by the computer based on the map generation condition input from the user from among a plurality of document information that is a patent application or a patent document related to the utility model registration application stored in the document information storage unit Obtaining each information step;
The computer dividing the first document information and the second document information into blocks of a predetermined unit which is either a paragraph unit or a claim unit or both based on the map generation condition ;
The computer, in the coordinate system is determined by using a principal component analysis based on the appearance frequency of each document information or each block of words contained in the first document information and the second document information, wherein in each block calculating respective average values of coordinates in the coordinate system of each word contained as the coordinates of the blocks,
The computer placing each block on a map according to the coordinate system based on the coordinates of each block;
The computer has a predetermined first block derived from the second document information that is separated from the predetermined first block derived from the first document information by a predetermined distance in the coordinate system among the blocks arranged on the map. and generating the map information by the two blocks, connected by Viewing elements,
The computer displaying the generated map information; and
Said computer, said if the selected pre-Symbol Display element by the user, the selected Viewing elements by the connected with the contents of the first block is the second block of the content and the word level, phrasal, compared with at least one of the level selected by the user out of the sentence level, document information analyzing method for performing the step of outputting the comparison result.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005325036A JP4806249B2 (en) | 2005-11-09 | 2005-11-09 | Document information analysis apparatus and document information analysis method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005325036A JP4806249B2 (en) | 2005-11-09 | 2005-11-09 | Document information analysis apparatus and document information analysis method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007133587A JP2007133587A (en) | 2007-05-31 |
JP4806249B2 true JP4806249B2 (en) | 2011-11-02 |
Family
ID=38155204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005325036A Active JP4806249B2 (en) | 2005-11-09 | 2005-11-09 | Document information analysis apparatus and document information analysis method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4806249B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590185A (en) * | 2017-08-04 | 2018-01-16 | 深圳市金证科技股份有限公司 | A kind of expression and terminal of wire distribution facilities |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017215893A (en) * | 2016-06-02 | 2017-12-07 | 株式会社アイ・アール・ディー | Patent information processing device, patent information processing method and program |
JP6777445B2 (en) * | 2016-07-07 | 2020-10-28 | 株式会社野村総合研究所 | Citation map generator, citation map generation method and computer program |
JPWO2021214963A1 (en) * | 2020-04-24 | 2021-10-28 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003233626A (en) * | 2002-02-06 | 2003-08-22 | Just Syst Corp | Association presence/absence display device, association presence/absence display method and program for implementing the method on computer |
-
2005
- 2005-11-09 JP JP2005325036A patent/JP4806249B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590185A (en) * | 2017-08-04 | 2018-01-16 | 深圳市金证科技股份有限公司 | A kind of expression and terminal of wire distribution facilities |
Also Published As
Publication number | Publication date |
---|---|
JP2007133587A (en) | 2007-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11663230B2 (en) | Interface including graphic representation of relationships between search results | |
CA3022944C (en) | System and method for displaying search results for a trademark query in an interactive graphical representation | |
JP4116329B2 (en) | Document information display system, document information display method, and document search method | |
JP3577819B2 (en) | Information search apparatus and information search method | |
JP2006344010A (en) | Document retrieval device | |
JPH0981574A (en) | Method and system for data base retrieval using retrieval set display picture | |
CN108763486A (en) | Paper duplicate checking method, terminal and storage medium based on terminal | |
JP2001350793A (en) | Related information display controller and related information display method | |
JP4806249B2 (en) | Document information analysis apparatus and document information analysis method | |
JP3356519B2 (en) | Document information retrieval device | |
JP5827206B2 (en) | Document management system, document management method, and document management program | |
JP2006127523A (en) | Document information display system | |
JP3385297B2 (en) | Automatic document classification method, information space visualization method, and information retrieval system | |
JP2007109183A (en) | Literature information analysis device and literature information analysis method | |
JP4699909B2 (en) | Keyword correspondence analysis apparatus and analysis method | |
US20060036659A1 (en) | Method of retrieving information using combined context based searching and content merging | |
US20120191725A1 (en) | Document ranking system with user-defined continuous term weighting | |
JP6534454B2 (en) | INFORMATION SEARCH METHOD, INFORMATION SEARCH DEVICE, AND INFORMATION SEARCH SYSTEM | |
JP2011018152A (en) | Information presentation device, information presentation method, and program | |
JP2000090110A (en) | Full-text retrieval method, device therefor and recording medium recorded with full-text retrieving program | |
Lyding et al. | Visual Corpus Interface--Putting Text Visualizations at Use | |
KR101372613B1 (en) | System for grouping documents | |
JPH1069485A (en) | Interactive information retrieval device | |
Amende et al. | Visualizing an Auto-Generated Topic Map | |
JPH07175815A (en) | Information retrieving device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081008 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110809 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110812 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4806249 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140819 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |