JP2007199906A - キーワード対応関係分析装置及び分析方法 - Google Patents

キーワード対応関係分析装置及び分析方法 Download PDF

Info

Publication number
JP2007199906A
JP2007199906A JP2006016136A JP2006016136A JP2007199906A JP 2007199906 A JP2007199906 A JP 2007199906A JP 2006016136 A JP2006016136 A JP 2006016136A JP 2006016136 A JP2006016136 A JP 2006016136A JP 2007199906 A JP2007199906 A JP 2007199906A
Authority
JP
Japan
Prior art keywords
keyword
information
document information
candidate
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006016136A
Other languages
English (en)
Other versions
JP4699909B2 (ja
Inventor
Seiji Takano
誠司 高野
Takashi Nakai
隆 中居
Katsuya Mimuro
克哉 三室
Eisuke Sudo
英介 須藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2006016136A priority Critical patent/JP4699909B2/ja
Publication of JP2007199906A publication Critical patent/JP2007199906A/ja
Application granted granted Critical
Publication of JP4699909B2 publication Critical patent/JP4699909B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】本発明は、表現の異なるキーワード間の対応関係を分析する。
【解決手段】対象文献抽出部2は、分析対象の文献情報を情報蓄積部3から抽出し、キーワードランキング生成部4は、各文献情報に含まれるキーワード及び出現頻度を順位付けして示すテーブル5を生成する。基準キーワード検出部6は、多くの文献情報で使用されているが、一部の文献情報では使用されていない基準キーワードを検出する。対応キーワード候補検出部7は、基準キーワードを含まない文献情報において、基準キーワードに対応する可能性のあるキーワードを検出する。基準キーワードの平均順位と対応キーワード候補の順位とを比較することにより、対応キーワード検出部11は、基準キーワードに対応するキーワードを検出する。キーワード対応関係出力部12は、基準キーワードと対応キーワードとを関連づけて、出力する。
【選択図】図1

Description

本発明は、例えば、特許文献や学術文献等の文献情報に含まれるキーワードの対応関係を分析するキーワード対応関係分析装置及び分析方法に関する。
例えば、文献情報としての特許文献を調査することにより、研究開発の方向性を探ったり、あるいは事業計画の立案等を行うことができる。このために、膨大な特許文献群から所定の目的に合致する特許文献を抽出し、抽出された特許文献群を分析する。この分析結果を二次元平面に表現したものは、いわゆる特許マップとして知られており、特許文献群から特許マップを自動的に作成する技術は知られている(特許文献1)。
また、形態素解析を行って、対象の文書内で所定数以上出現した用語を抽出することにより、辞書に未登録の専門用語や特定の組織でのみ使用される略称であっても、用語として検出できるようにした技術も知られている(特許文献2)。
特開2005−149346号公報 特開2002−342321号公報
特許文献等では、できるだけ正確な用語を用いるのが好ましい。しかし、特許文献は、最新の技術を対象とするため、正確な用語が制定される前に作成されやすいという性質を有する。出願の際に業界で使用されている用語を用いて、特許文献は作成されるため、同一の技術要素を示す用語でも、出願人によってばらつきを生じる場合がある。
また、最新の用語ではない場合でも、各出願人(企業等)で慣用されている用語がそれぞれ異なる場合もある。例えば、ある出願人は、日本工業規格等で制定された正式な名称を使用し、他の出願人は、正式名称の略称を使用し、さらに別の出願人は、その組織内でのみ使用されている特殊な用語を使用する場合がある。
さらに、用語は時代と共に変遷していく性質を備える。従って、ある時代で標準的な用語であっても、別の時代には別の用語で表現されている場合もある。
同一の技術要素を示す用語が、種々の異なる用語で表現されている場合、機械検索による検索精度は、一般的に低下する。その技術分野の知識及び検索技術の両方に精通した検索者であれば、検索漏れ及びノイズの少ない検索結果を得られるであろうが、技術知識または検索技術のいずれかが不足している検索者の場合、精度の高い検索結果を得るのは難しい。
また、熟練した検索者であっても、同一の技術用語が異なる用語で表現されている場合は、検索に要する時間も手間も増大する。検索者は、例えば、多数の特許文献を事前に読み込んで、用語の異称を研究してから、検索式を組み立てる必要があるためである。
さらに、普段使用している用語とは別の用語が使用されている特許文献を読む場合、正しい内容を短時間で把握するのは難しく、混乱や誤解を招く可能性がある。
本発明は、上述の問題点に鑑みてなされたもので、その目的は、特定の文献情報でのみ使用されているキーワードを自動的に検出することができるキーワード対応関係分析装置及び分析方法を提供することにある。本発明の他の目的は、多くの文献情報で使用されている標準的なキーワードと特定の文献情報でのみ使用されているキーワードとの対応関係を自動的に検出し、キーワード検索を支援できるキーワード対応関係分析装置及び分析方法を提供することにある。本発明のさらに別の目的は、標準的ではないキーワードが使用されている文献情報の内容把握を支援できるようにしたキーワード対応関係分析装置及び分析方法を提供することにある。本発明の更なる目的は、後述する実施形態の記載から明らかになるであろう。
上記課題を解決すべく、本発明の一つの観点に従うキーワード対応関係分析装置は、電子化された複数の文献情報を記憶する文献情報記憶部と、与えられた分析条件に基づいて文献情報記憶部を検索することにより、分析対象の文献情報を抽出する対象文献抽出部と、抽出された文献情報に基づいて、当該文献情報に出現するキーワード毎に、その出願頻度を解析してなるキーワード出現頻度解析情報を生成する出現頻度解析部と、キーワード出現頻度解析情報に基づいて、抽出された文献情報に含まれるキーワードのうち、所定の文献情報で使用されている第1キーワードを検出する第1キーワード検出部と、キーワード出現頻度解析情報に基づいて、第1キーワードに対応する第2キーワードの候補となる第2キーワード候補を、抽出された文献情報のうち所定の文献情報以外の他の文献情報に含まれるキーワードの中から検出する第2キーワード候補検出部と、検出された第2キーワード候補の中から第1キーワードに対応する第2キーワードを検出する第2キーワード検出部と、を備える。
文献情報としては、例えば、特許文献(公開公報、登録公報等を含む)や学術論文等を挙げることができる。文献情報は、電子化されて文献情報記憶部に記憶されている。文献情報記憶部に記憶された複数の文献情報のうち、与えられた分析条件に基づいて、分析対象の文献情報が抽出される。より詳しくは、分析対象として抽出される文献情報は、特定の技術分野に関する文献情報である。
出現頻度解析部は、抽出された各文献情報に含まれるキーワード毎に、それぞれの出現頻度を算出し、例えば、出現頻度の高いものから順番に順位を付与して、キーワード出現頻度解析情報を生成する。第1キーワード検出部は、所定の文献情報で使用されている第1キーワードを検出する。この第1キーワードは、例えば、所定数以上の所定の文献情報で使用されている標準的なキーワードである。第2キーワード候補検出部は、第1キーワードに対応する第2キーワードの候補となるキーワードを検出する。第2キーワードとは、所定の文献情報以外の他の文献情報でのみ使用されている特殊なキーワードであり、いわゆる方言的なキーワードと呼ぶこともできる。そして、第2キーワード検出部は、第2キーワード候補の中から、第1キーワードに対応する第2キーワードを検出する。これにより、表現の異なるキーワード同士の対応関係を自動的に検出することができる。
本発明の一態様では、第2キーワード検出部は、第2キーワード候補のうちユーザにより選択された第2キーワード候補を第2キーワードとして検出する。例えば、第2キーワード候補の候補リストをユーザに提示し、ユーザによって第2キーワードを選択させることができる。例えば、候補リストには、第1キーワードに対応する可能性の高いものから順番に、第2キーワード候補が記載される。
本発明の一態様では、検出された第1キーワードの特徴情報を検出する第1特徴情報検出部と、検出された第2キーワード候補の特徴情報を検出する第2特徴情報検出部と、をさらに備え、第2キーワード検出部は、検出された第1キーワードの特徴情報と検出された第2キーワード候補の特徴情報とを比較することにより、第2キーワード候補の中から第2キーワードを検出する。特徴情報としては、例えば、抽出された文献情報に基づいて生成された座標系における各キーワードの座標や、各キーワードの出現頻度の順位等を用いることができる。第2キーワード検出部は、第1キーワードとの間で特徴情報の差異が最も少ない第2キーワード候補を第2キーワードとして検出可能である。
本発明の一態様では、検出された第1キーワードの特徴情報を検出する第1特徴情報検出部と、検出された第2キーワード候補の特徴情報を検出する第2特徴情報検出部と、第1キーワードの特徴情報と第2キーワードの特徴情報とを比較する特徴情報比較部と、特徴情報比較部による比較結果を出力する比較結果出力部と、をさらに備え、第2キーワード検出部は、比較結果に基づいて、第2キーワード候補のうちユーザにより選択された第2キーワード候補を第2キーワードとして検出するユーザ指定モードと、比較結果に基づいて、第1キーワードの特徴情報との差異が最も少ない特徴情報を有する第2キーワード候補を第2キーワードとして検出する自動検出モードと、を備える。
本発明の一態様では、第1キーワード検出部は、キーワード出現頻度解析情報に基づいて、第1の所定値までの出現頻度順位を有するキーワードのうち、第2の所定値以上かつ抽出された文献情報の総数未満の所定の文献情報で使用されているキーワードを、第1キーワードとして検出する。
本発明の一態様では、第2キーワード候補検出部は、キーワード出現頻度解析情報に基づいて、所定の文献情報以外の他の文献情報に含まれるキーワードのうち、所定の文献情報で第3の所定値以上使用されているキーワードを除去して残ったキーワードを、第2キーワード候補として検出する。
本発明の一態様では、第1特徴情報検出部は、第1キーワードの所定の文献情報における平均出現頻度順位を第1キーワードの特徴情報として検出し、第2特徴情報検出部は、所定の文献情報以外の他の文献情報における第2キーワード候補の出現頻度順位を第2キーワードの特徴情報として検出する。
本発明の一態様では、抽出された文献情報の総数及び抽出された文献情報から抽出される所定の複数のキーワードの出現数に基づいて主成分分析を行うことにより、抽出された文献情報に含まれるキーワードの座標を算出するキーワード座標算出部をさらに備え、第1特徴情報検出部は、キーワード座標算出部により算出される第1キーワードの座標を第1キーワードの特徴情報として検出し、第2特徴情報検出部は、キーワード座標算出部により算出される第2キーワード候補の座標を第2キーワード候補の特徴情報として検出する。
本発明の一態様では、前記第1特徴情報検出部は、前記所定の文献情報において前記第1キーワードと係り受けをなす単語のランキングを前記第1特徴情報として検出し、
前記第2特徴情報検出部は、前記所定の文献情報以外の他の文献情報において前記第2キーワード候補と係り受けをなす単語のランキングを前記第2特徴情報として検出するようになっている。
本発明の一態様では、抽出された文献情報から抽出される所定の複数のキーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、抽出された文献情報群の各文献情報の座標をそれぞれ算出する文献座標算出部と、所定の各キーワードを含む文献情報の総数及び所定の各キーワードの出現数に基づいて主成分分析を行うことにより、所定の各キーワードの座標をそれぞれ算出するキーワード座標算出部と、文献座標算出部により算出された各文献情報の座標に基づいて各文献情報の分布密度を算出し、この算出された分布密度に基づく輪郭を有するマップ図形及び所定のキーワードをそれぞれ可視化してマップ情報を生成するマップ生成部をさらに備えており、第1キーワード及び第2キーワードは、マップ情報に可視化されている。
ここで、文献座標算出部は、所定の複数のキーワードの組合せ及び所定の複数のキーワードの出現数に基づいて、主成分分析を行い、抽出された文献情報の座標をそれぞれ算出する。主成分分析とは、多変量解析の一手法であり、簡単に言えば、それぞれ多くの変量を含む各サンプル情報について、その相違を最も端的に表す幾つかの総合的指標(主成分)で代表させ、次元数を縮減させる分析方法である。
同様にして、キーワード座標算出部は、主成分分析により、所定の各キーワードの座標をそれぞれ算出する。マップ生成部は、各文献情報の座標に基づいて、文献情報の分布密度を算出する。例えば、マップ生成部は、マップの全領域を複数のブロックに区切り、各ブロックに位置する文献情報の数を算出することによって、各ブロック毎の文献情報の粗密を検出可能である。マップ生成部は、例えば、文献情報の分布密度に表示要素(例えば等高線等)を対応付けることにより、輪郭を有するマップ図形を作成する。また、マップ生成部は、このマップ図形とキーワードの存在を示す表示要素(例えば、キーワードの文字そのもの、あるいはシンボル)とをマップ領域上に配置することにより、マップ情報を生成する。このマップ情報は、例えば、2次元平面に表現されるが、これに限らず、3次元空間に表現することもできる。
第2キーワード検出部は、キーワード座標算出部によりそれぞれ算出される第1キーワードの座標及び第2キーワード候補の座標を比較することにより、第2キーワード候補の中から第2キーワードを検出することができる。
第1キーワードと第2キーワードとは、それぞれ異なる表示形態でマップ情報に可視化されており、マップ情報には、第1キーワードと第2キーワードとの対応関係を示す表示要素を含めることができる。
本発明の一態様では、第2キーワードを第1キーワードに置換するキーワード置換部を備える。例えば、キーワード置換部は、前記他の文献情報に含まれる第2キーワードを第1キーワードに置換した状態で、当該他の文献情報を出力させることができる。
本発明の一態様では、第2キーワードを第1キーワードに関連づけて記憶させる関連性登録部を備える。
本発明の他の観点に従うプログラムは、コンピュータを、電子化された複数の文献情報を記憶する文献情報記憶手段と、与えられた分析条件に基づいて分析対象の文献情報を抽出する対象文献抽出手段と、抽出された文献情報に基づいて、当該文献情報に出現するキーワード毎に、その出願頻度を解析してなるキーワード出現頻度解析情報を生成する出現頻度解析手段と、キーワード出現頻度解析情報に基づいて、抽出された文献情報に含まれるキーワードのうち、所定の文献情報で使用されている第1キーワードを検出する第1キーワード検出手段と、キーワード出現頻度解析情報に基づいて、第1キーワードに対応する第2キーワードの候補となる第2キーワード候補を、抽出された文献情報のうち所定の文献情報以外の他の文献情報に含まれるキーワードの中から検出する第2キーワード候補検出手段と、検出された第2キーワード候補の中から第1キーワードに対応する第2キーワードを検出する第2キーワード検出手段と、して機能させる。
本発明のさらに別の観点に従うキーワード対応関係分析方法は、分析条件を取得するステップと、取得された分析条件に基づいて文献情報記憶部を検索することにより、分析対象の文献情報を抽出するステップと、抽出された文献情報に基づいて、当該文献情報に出現するキーワード毎に、その出願頻度を解析してなるキーワード出現頻度解析情報を生成するステップと、キーワード出現頻度解析情報に基づいて、抽出された文献情報に含まれるキーワードのうち所定の文献情報で使用されている第1キーワードを検出するステップと、キーワード出現頻度解析情報に基づいて、第1キーワードに対応する第2キーワードの候補となる第2キーワード候補を、抽出された文献情報のうち所定の文献情報以外の他の文献情報に含まれるキーワードの中から検出するステップと、検出された第2キーワード候補の中から第1キーワードに対応する第2キーワードを検出するステップと、を含んでいる。
以下、図面に基づき、本発明の実施の形態を説明する。まず最初に、キーワード対応関係分析装置を単独で構成する場合を説明し、次に、文献情報分析装置の中にキーワード対応関係分析装置を組み込む場合を説明する。
図1は、キーワード対応関係分析装置(以下、「対応関係分析装置」と略す場合がある)の全体構成を示す説明図である。この対応関係分析装置は、それぞれ後述するように、例えば、分析条件設定部1と、対象文献抽出部2と、情報蓄積部3と、キーワードランキング生成部4と、基準キーワード検出部6と、対応キーワード候補検出部7と、基準キーワード特徴情報検出部8と、対応キーワード候補特徴情報検出部9と、特徴情報比較部10と、対応キーワード検出部11と、キーワード対応関係出力部12と、シソーラス登録部14及びキーワード置換部15を備えて構成することができる。対応関係分析装置は、コンピュータ装置またはコンピュータに所定の機能を実現させるプログラムとして、構成される。
分析条件設定部1は、ユーザにより指定される分析条件を設定するものである。ユーザは、種々の分析条件を指定可能である。例えば、ユーザは、特定の企業、特定の技術分野、特定の文献作成期間または公開期間、特定の発明者、特定の技術用語等のように、種々の条件を単独で、または組み合わせて、分析条件を指定することができる。例えば、ユーザは、「特定の企業により特定の技術分野について、特定期間内に出願された特許文献」等のような分析条件を指定することができる。分析条件を設定することにより、分析対象となる母集団が特定される。
対象文献抽出部2は、分析条件に合致する文献情報を、情報蓄積部3から抽出するものである。情報蓄積部3には、文献情報記憶部3Aやキーワード等を記憶する記憶部3B等が設けられている。文献情報記憶部3Aには、例えば、特許文献、科学技術文献、学術論文等の各種文献が電子化された状態で記憶されている。キーワード等を記憶する記憶部3Bには、例えば、各文献情報で使用されている主要なキーワードや、辞書等の情報が記憶されている。
キーワードランキング生成部4は、抽出された文献情報を分析することにより、キーワードランキングテーブル5を生成するものである。キーワードランキング生成部4は「出現頻度解析部」に、キーワードランキングテーブル5は「キーワード出現頻度解析情報」に、それぞれ対応する。キーワードランキング生成部(以下、ランキング生成部と略す場合もある)4は、抽出された各文献情報で使用されているキーワードを抽出し、各キーワード毎に、その出現頻度をカウントする。そして、出現頻度の高い順番に順位を付けて、キーワードランキングテーブル5を生成する。
ここで、キーワードの抽出方法としては、公知の種々の方法を採用できる。また、例えば、「ガラス」と「カ”ラス」のように、濁点等をあえて別の記号や文字に置き換えて表現しているキーワードであっても、ひとかたまりのキーワードとして検出可能である。この場合は、例えば、文章中に含まれるカタカナの文字ブロック集合を形態素分析で抽出すればよい。
また、キーワード中に不要なスペースコードや改行コードが含まれている場合、これらのスペースコードや改行コードを削除することにより、キーワードとして抽出することができる。従って、濁点や余分なコードの追加等によって、標準的な表現とは異なる表現で記述されたキーワードであっても、キーワードとして検出することができ、標準的なキーワードとの対応関係を検出することができる。
図1に示すキーワードランキングテーブル5では、3人の出願人A社、B社、C社によりそれぞれ作成された特定の技術分野に関する文献情報群において使用されているキーワードが第1位から第3位まで示されている。
基準キーワード検出部6は、基準となるキーワードを検出するものであり、「第1キーワード検出部」に対応する。ここで、基準キーワードとは、多くの文献情報で使用されているが、一部の文献情報では使用されていないものを意味する。即ち、基準キーワードは、分析母集団を構成する文献情報群において標準的に使用されているキーワード、多数派の使用する主流キーワードと表現することもできる。分析母集団を構成する文献情報群のうち、基準キーワードを含む文献情報は「所定の文献情報」に該当し、基準キーワードを含まない文献情報は「所定の文献情報以外の他の文献情報」に該当する。
なお、厳密には、多数の文献情報で使用されているキーワードであっても、それが正式名称であるとは限らない。略称の方が正式名称よりも頻繁に使用される場合もある。また、登録商標の普通名称化または慣用商標化として知られているように、特定企業の登録商標が有名になった結果、正式名称よりも登録商標の方が使用される場合もある。
図1中のキーワードランキングテーブル5内に示す例では、キーワードW2が基準キーワードに該当する。キーワードW2は、A社での出現頻度は第2位であり、B社での出現頻度は第1位であるのに対し、C社では出現していない。分析母集団内の多くの文献情報に出現しているにもかかわらず、一部の文献情報では出現していないため、キーワードW2は基準キーワードとして検出される。
対応キーワード候補検出部7は、対応キーワードの候補となりうるキーワードを検出するものであり、「第2キーワード候補検出部」に該当する。対応キーワードとは、基準キーワードを含まない文献情報において、基準キーワードに対応していると考えられるキーワードである。対応キーワードは、標準的な表現から外れた、いわゆる方言的キーワードと考えることができる。本実施例における対応キーワード、即ち、方言的キーワードには、特定の組織内で慣用されているマイナーな表現の他に、略称や異表記も含まれる。
ある特定の文献情報から構成される分析母集団は、その分析条件に適合する共通のキーワードを一つまたは複数含んでいると考えられる。特に、出現頻度の順位が所定範囲内のキーワードは、各出願人間で共通しやすい。しかし、一部の出願人(C社)では、キーワードW2が使用されていない。このことは、一部の出願人において、標準的な表現とは異なる別の表現を用いて、特定の技術要素を記述している可能性を意味する。そこで、対応キーワード候補検出部7は、基準キーワードに対応するキーワードを、一部の出願人の文献情報群から検出する。図1に示す例では、C社の文献情報に登場するキーワードのうち、第2位のW4及び第3位のW5が、対応キーワード候補に該当する。キーワードW1は、全ての出願人において使用されているため、対応キーワードの候補から除外される。
基準キーワード特徴情報検出部8は、基準キーワードの有する属性情報のうち、対応キーワードとの関連性を調べるために有用と考えられる特徴情報を検出するものであり、「第1特徴情報検出部」に該当する。
対応キーワード候補特徴情報検出部9は、同様に、対応キーワード候補の特徴情報を検出するものであり、「第2特徴情報検出部」に該当する。
ここで、属性情報としては、例えば、キーワードの文字種(平仮名、カタカナ、英数字、記号、漢字の別)、文字列の長さ等が知られているが、本実施例では、出現頻度の順位及び特許マップ上での位置(座標)に着目する。特徴情報は、例えば、キーワード同士の関連性を判断するための関連性判断情報、キーワード間の近似性を判断するための近似性判断情報等のように表現することもできる。
詳細は後述するが、図1の例では、基準キーワードW1の出現頻度の順位は、A社で第2位、B社で第1位であるから、その平均順位は、1.5位となる。対応キーワード候補W4の順位は第2位、別の対応キーワード候補W5の順位は第3位である。
特徴情報比較部10は、基準キーワード特徴情報検出部8により検出された特徴情報と、対応キーワード候補特徴情報検出部9により検出された特徴情報とを比較する。対応キーワード検出部11は、特徴情報の比較結果に基づいて、対応キーワード候補の中から、基準キーワードに対応するキーワードを検出する。対応キーワード検出部11は、「第2キーワード検出部」に該当する。上記の例では、基準キーワードW1の平均登場順位「1.5」であるから、これに最も近い順位(第2位)を有するキーワードW4が対応キーワードとして検出される。
キーワード対応関係出力部12は、基準キーワードと対応キーワードとを関連づけて、出力させるものである。例えば、キーワードの対応関係は、ディスプレイ等の表示部13を介して、ユーザに提示される。なお、後述の実施例からも明らかなように、対応キーワードの検出に際して、ユーザの判断を仰ぐことも可能である。
また、キーワードランキングテーブル5それ自体を、表示部13に出力させることもできる。そして、キーワードランキングテーブル5を画面出力する場合、基準キーワードと対応キーワード(または対応キーワード候補)との対応関係が明確に区別できるように、例えば、フォントの種類、フォントサイズ、文字色等を適宜設定することもできる。
シソーラス登録部14は、検出された対応キーワードを基準キーワードに対応付けて、例えば、辞書に登録する。これにより、次の検索では、より改善された辞書を用いることができ、検索精度が向上する。
キーワード置換部15は、対応キーワードを基準キーワードに置換するものである。逆に、基準キーワードを対応キーワードに置換することも可能である。これにより、標準的な表現で文献情報を精読することができ、ユーザの利便性が向上する。
図2は、データ処理の流れを模式的に示す説明図である。ユーザは、ユーザインターフェースを介して、分析条件1Aを指定する。この例では、特定の出願人(作成者)A〜E社によって、特定の技術分野に関して作成された文献情報を指定している。技術分野は、例えば、特許分類コードや技術用語等により特定することができる。また、例えば、所定の限られた研究者の関与する研究内容を分析する場合、研究者の氏名によって技術分野を特定することもできる。
この分析条件1Aに合致する文献情報群は、情報蓄積部3から抽出される。この抽出された文献情報群は、分析対象の母集団を構成する。この分析母集団について、キーワードの出現頻度が解析され、キーワードランキングテーブル5が生成される。
キーワードランキングテーブル5を解析することにより、基準キーワードテーブル6Aが生成される。図2に示す例では、太字で示すキーワード「パソコン」が基準キーワードとして検出され、基準キーワードテーブル6Aに記憶される。
キーワード「パソコン」の出現頻度は、A社では第3位、B社では第4位、C社では第2位、D社では第3位である。C社では、正式名称である「パーソナルコンピュータ」が使用されているが、この実施例では、正式名称「パーソナルコンピュータ」と略称「パソコン」とは、同義語であることが既に判明しており、情報蓄積部3に登録済みであるものとする。
キーワード「パソコン(パーソナルコンピュータを含む)」は、A社〜D社において高い順位で登場するのに対し、E社では、判断対象の順位内(図示の例では、第1位〜第6位)で使用されていない。従って、キーワード「パソコン」は基準キーワードとして検出される。
そして、キーワードランキングテーブル5に記録されているE社のキーワード群の中から、基準キーワードに対応しうるキーワードの候補が検出される。検出されたキーワードは、対応キーワード候補テーブル7Aに記憶される。
図2に示す例では、「ソフトウェア」、「ハードウェア」及び「システム」は、全ての出願人A社〜E社で使用されている共通のキーワードである。従って、これら「ソフトウェア」、「ハードウェア」及び「システム」は、基準キーワードまたは対応キーワードのいずれにも該当しない。
また、「プログラム」というキーワードは、D社を除くA社,B社,C社及びE社で使用されており、共通キーワードではないが、多くの出願人で使用されているため(即ち、多くの文献情報で使用されているため)、基準キーワード「パソコン」に対応するキーワードとはならない。A社,B社,C社及びE社において、「プログラム」は、その通りの意味で使用されていると考えられる。そこで、所定数以上の出願人で使用されているキーワード「プログラム」は、対応キーワードの候補とならず、除外される。
もっとも、D社に関して「プログラム」というキーワードに着目すると、この「プログラム」は、別の基準キーワードに相当する。説明の便宜上、以下では、一つの基準キーワード「パソコン」に着目して説明するが、本実施例のキーワード対応関係分析装置は、キーワードランキングテーブル5から複数の基準キーワードを検出することができ、各基準キーワードに対応するキーワードをそれぞれ検出することができる。
即ち、特定の技術分野に関する文献情報群において、複数の出願人がそれぞれ別々の方言的表現(基準キーワードと異なるキーワード)を使用している場合でも、それぞれの方言的表現を別々に検出し、対応する標準的表現(基準キーワード)との関係を検出することができる。
さて、E社で使用されているキーワード「情報処理装置」及び「音声認識」は、他の出願人A社〜D社において所定数以上使用されていない。従って、これらの「情報処理装置」及び「音声認識」は、基準キーワード「パソコン」に対応しうるキーワードであるとして検出され、対応キーワード候補テーブル7Aに記憶される。即ち、E社では、「パソコン」という技術要素を「情報処理装置」または「音声認識」という別のキーワードで表現している可能性がある。
次に、基準キーワードと対応キーワード候補の特徴情報に着目する。ここでは、特徴情報として、キーワードの出現頻度順位を採用する。基準キーワード「パソコン」の順位は、A社では第3位、B社では第4位、C社では第2位、D社では第3位であるから、その平均値は「3」となる。これに対し、対応キーワード候補「情報処理装置」の順位は第3位であり、別の対応キーワード候補「音声認識」の順位は第6位である。そこで、より順位の近い「情報処理装置」が、基準キーワード「パソコン」に対応するキーワードとして検出される。
なお、基準キーワードに最も順位の近い対応キーワード候補のみを選択するのではなく、基準キーワードの平均順位から所定範囲内の順位を有する対応キーワード候補を全て選択して、キーワード対応関係テーブル12Aを生成することができる。
キーワード対応関係テーブル12Aには、基準キーワード「パソコン」と対応キーワード「情報処理装置」とが関連づけられて記憶される。この対応関係は、表示部13を介してユーザに提示される。また、この対応関係は、情報蓄積部3に反映され、そこに含まれる辞書を改善する。
図3は、キーワード対応関係分析処理を示すフローチャートである。以下に述べる各フローチャートは、発明の理解及び実施に必要な程度で、処理の概要をそれぞれ示しており、実際のコンピュータプログラムとは相違する。なお、以下の説明ではステップを「S」と略記する。
対応関係分析装置は、ユーザにより指定された分析条件1Aを取得し(S11)、この分析条件1Aに合致する文献情報群を情報蓄積部3から抽出する(S12)。そして、対応関係分析装置は、抽出された文献情報群に基づいて、キーワードランキングテーブル5を生成する(S13)。キーワードランキングテーブル5を生成するステップについては、図4と共に詳述する。
次に、対応関係分析装置は、キーワードランキングテーブル5に基づいて、基準キーワードテーブル6Aを生成し(S14)、さらに、基準キーワードの平均順位を算出する(S15)。基準キーワードテーブル6Aを生成するステップについては、図5と共に詳述する。
対応関係分析装置は、キーワードランキングテーブル5に基づいて、対応キーワード候補テーブル7Aを生成し(S16)、検出された対応キーワード候補の順位をそれぞれ取得する(S17)。対応キーワード候補テーブル7Aを生成するステップについては、図6と共に詳述する。
そして、対応関係分析装置は、基準キーワードの平均順位と、各対応キーワード候補の順位とを比較し(S18)、順位の近い対応キーワード候補と基準キーワードとを関連づけて、キーワード対応関係テーブル12Aを生成する(S19)。
上述のように、キーワード対応関係テーブル12Aには、対応キーワード候補を一つだけ登録することもできるし、複数の対応キーワード候補を登録することもできる。第1に、基準キーワードの平均順位に最も近い順位を有するキーワードのみをテーブル12Aに登録する方法が考えられる。第2に、基準キーワードの平均順位から所定範囲内の順位を有する複数のキーワードをテーブル12Aに登録する方法が考えられる。第3に、ユーザによる事前の、または事後の選択により、第1の方法と第2の方法とを切り替える方法も考えられる。
ここでは、第2または第3の方法により、複数の対応キーワード(候補)がユーザに提示される場合を説明する。ユーザは、提示された複数のキーワードの中から、いずれか一つのキーワードを選択することができる(S21)。
図2の例では、ユーザは、「情報処理装置」と「音声認識」のいずれが、「パソコン」に対応するキーワードであるかを手動で選択することができる。ユーザによって選択された場合(S21:YES)、対応関係分析装置は、その選択されたキーワードを基準キーワードに対応するキーワードとして対応付ける(S22)。ユーザによる手動選択が行われない場合(S21:NO)、対応関係分析装置は、最も順位の近いキーワードを自動的に選択し、基準キーワードに対応付ける(S23)。この対応付け(S22,S23)により、対応キーワードが確定する。
対応関係分析装置は、キーワード間の対応関係を種々の方法で利用できる。例えば、ユーザがシソーラスの登録を希望する場合(S24:YES)、対応関係分析装置は、対応キーワードを基準キーワードのシソーラスとして登録する(S25)。また、例えば、ユーザが、対応キーワードの置換を希望する場合(S26:YES)、対応関係分析装置は、分析母集団に含まれるE社によって作成された全ての文献情報、または、ユーザにより選択された一部の文献情報について、対応キーワードを基準キーワードに変換する(S27)。なお、これとは逆に、基準キーワードを対応キーワードに変換することもできる。
次に、図4は、図3中のS13で示されたキーワードランキングテーブル生成処理の詳細を示すフローチャートである。まず、対応関係分析装置は、分析条件1A中の出願人の中から一人の出願人を選択し(S130)、選択された出願人により作成された文献情報を取得する(S131)。
そして、対応関係分析装置は、文献情報の中から助詞や定型句、見出し等の不要な語句を除去し(S132)、キーワードのみを抽出する(S133)。そして、対応関係分析装置は、抽出された各キーワード毎に、それぞれの出現回数を算出し(S134)、各キーワードを出現頻度の高い順に並び替え(S135)、キーワードランキングテーブル5に登録する(S136)。
対応関係分析装置は、分析条件1A中の全ての出願人についてキーワードの出現頻度を解析したか否かを判定し(S137)、未解析の出願人が残っている場合(S137:NO)、次の出願人を選択して(S138)、S131に戻る。このように、各出願人のそれぞれについて、文献情報中に使用されているキーワード及びその出現頻度を検出する。
図5は、図3中のS14で示された基準キーワードテーブル生成処理を示すフローチャートである。対応関係分析装置は、キーワードランキングテーブル5を参照し(S140)、判断対象の順位N1までのキーワードを取得する(S141)。この判断対象の順位N1は、ユーザが指定可能である。図2に示す例では、「6」がN1に該当する。
次に、対応関係分析装置は、順位N1までのキーワードについて、各出願人による使用状況をそれぞれ検出し(S142)、全出願人で使用されている共通のキーワードを基準キーワードから除外する(S143)。
次に、対応関係分析装置は、所定数N2以上の出願人で使用されているキーワードを検出し(S144)、この検出されたキーワードを基準キーワードとして、基準キーワードテーブル6Aに登録する(S145)。N2の値は、ユーザが指定可能である。N2は、2以上、かつ、分析母集団の文献情報の総数未満の値に設定される。
そして、対応関係分析装置は、基準キーワードを使用している出願人の名称または識別コードを記憶する(S146)。基準キーワードを使用する出願人を基準出願人と呼ぶことができる。同様に、対応関係分析装置は、基準キーワードを使用していない出願人の名称または識別コードを記憶する(S147)。基準キーワードを使用していない出願人を対象出願人と呼ぶことができる。基準出願人の名称または識別コード(装置内で、出願人を特定可能な情報であればよい)は、基準キーワードテーブル6Aに登録される。対象出願人の名称等は、対応キーワード候補テーブル7Aの生成に使用される。
図6は、図3中のS16で示された対応キーワード候補テーブル生成処理を示すフローチャートである。対応関係分析装置は、キーワードランキングテーブル5を参照し(S160)、対象出願人の作成した文献情報群で使用されている順位N1までのキーワードを取得する(S161)。
対応関係分析装置は、取得されたキーワード毎に、基準出願人による使用状況を検出し(S162)、所定数N3以上の基準出願人により使用されているキーワードを、対応キーワード候補から除外する(S163)。このようにして、対象出願人により使用されている順位N1までのキーワードから、不要なキーワードが取り除かれる。そして、対応関係分析装置は、残されたキーワードを対応キーワード候補として、対応キーワード候補テーブル7Aに登録する(S164)。
本実施例は、上述のように構成されるので、以下の効果を奏する。本実施例では、同一の技術要素が、出願人間で異なる用語で表現されている場合でも、キーワード間の対応関係を分析し、基準キーワードに対応するキーワードを検出することができる。従って、用語が統一されていない技術分野の文献を、より効率的に、より高い精度で調査することができ、ユーザの使い勝手が向上する。
即ち、本実施例によれば、基準キーワード(標準的表現)を使用する文献情報群と、標準的表現から外れた対応キーワード(方言的表現)を使用する文献情報群との対応関係を把握することができる。つまり、標準的な表現とは異なる表現が使用されている文献情報群の中から、方言的な表現を抽出し、抽出された方言的な表現と標準的な表現との対応関係を可視化して示すことができる。
本実施例では、キーワードランキングテーブル5に基づいて、基準キーワードに対応するキーワードを自動的に、または半自動的に検出可能な構成とした。従って、比較的簡易な構成でありながら、キーワード間の対応関係を解析することができる。
本実施例では、キーワード同士の出現頻度順位を比較することにより、対応するキーワードの組合せを検出する構成とした。従って、キーワードランキングテーブル5を用いた比較的簡易な制御構成で、キーワード間の対応関係を解析することができる。
本実施例では、キーワードの対応関係をシソーラスとして登録可能な構成とした。従って、情報蓄積部3内の辞書を改善することができ、次の検索に役立たせることができ、ユーザの利便性が向上する。
本実施例では、対応キーワードを基準キーワードに置換可能な構成とした。従って、一部の出願人によって使用されている独特の表現を標準的な表現に翻訳することにより、内容把握に役立たせることができ、ユーザの使い勝手が向上する。即ち、元の「なまった」明細書の全体について、検出された方言キーワードを標準キーワードに置き換えることにより、その「なまった」明細書の理解に役立たせることができる。
図7〜図13に基づいて、第2実施例を説明する。第2実施例では、第1実施例で述べたキーワード対応関係分析装置を、マップを自動作成するための文献情報分析装置100内に組み込んでいる。
文献情報分析装置100は、マップ制御部110と、キーワード対応関係分析部120及び情報蓄積部300を備えたコンピュータ装置として構成可能である。そして、文献情報分析装置100は、例えば、インターネットやLAN(Local Area Network)等の通信ネットワークを介して、クライアント端末200と双方向通信可能に接続されている。クライアント端末200は、例えば、パーソナルコンピュータや携帯情報端末(携帯電話を含む)等として構成可能である。
マップ制御部110は、情報蓄積部300に記憶されている多数の文献情報に基づいて、技術マップ150を生成し、出力する。生成されたマップ150は、通信ネットワークを介して、クライアント端末200に送信される。マップ150は、クライアント端末200内に保存可能としてもよいし、クライアント端末200内に保存不能としてもよい。マップ制御部110の詳細はさらに後述する。
キーワード対応関係分析部120は、ユーザから指定された分析条件に基づいて、マップ150上にマッピングされキーワード間の対応関係を分析する。キーワード対応関係分析部120は、上述したキーワード対応関係分析装置と同様の機能を備える。
情報蓄積部300は、例えば、特許公開公報や登録公報、あるいは、科学技術論文等のような文献情報を多数記憶している。
マップ150の構成を説明する。マップ150は、ユーザから指示された目的に添って生成されるものである。ユーザは、例えば、調査を希望する技術分野や特定のサーチワード等を指定することにより、情報蓄積部300に記憶されている多数の文献情報群の中から所定の文献情報群のみを選ぶことができる。ユーザによって選ばれた文献情報群の内容は、マップ制御部110によって解析され、マップ150が生成される。
等高線151A,151B,151C及び151Dは、マップ150に含まれる文献情報の分布密度を示す表示要素である。例えば、等高線151Aは、そこに存在する文献情報の数が1以上B1未満であることを示し、等高線151Bは、そこに存在する文献情報の数がB1以上B2未満であることを示す(B1,B2は自然数)。このように、151Aから151B、151C、151Dへと向かうにつれて、そこに含まれる文献情報の数は段階的に増大する。
マップ150には、複数のキーワード152も表示されている。これらのキーワード152は、マップ150を構成する文献情報群の各文献情報を特徴づける主要なキーワードであり、以下の説明では、主要キーワード152と呼ぶ場合がある。
また、主要キーワード152のうち、一つまたは複数のキーワードは、基準キーワード152Aとなり、一つまたは複数のキーワードは、対応キーワード152Bとなる。基準キーワード152Aと対応キーワード152Bとは、両者の対応関係を示すための接続線153によって接続されている。基準キーワード152Aと対応キーワード152Bとは、例えば、色彩や線種、線の太さ等を他のキーワード152と変えることにより、マップ150上で目立たせることができる。あるいは、対応するキーワード152A,152Bを明滅等させて、他のキーワード152と区別することもできる。
なお、本発明の実施に必要な範囲内で、特開2005−149346号公報の開示内容を利用可能である。
図8は、文献情報分析装置100の機能構成を示すブロック図である。マップ制御部110は、例えば、マップ生成条件入力受付部111と、文献抽出部112と、文献座標算出部113と、キーワード抽出部114と、キーワード座標算出部115と、マップ生成部116及びマップ表示部117とを含んで構成することができる。
また、情報蓄積部300の一例として、文献データベース(図中、データベースを「DB」と略記)31と、単語データベース32と、インデックスデータベース33とを設けることができる。
文献データベース31は、複数の文献情報を記憶するものである。単語データベース32は、辞書として使用されるものである。インデックスデータベース33は、各文献にどのようなキーワードが含まれているかを管理するためのものである。
マップ生成条件入力受付部111は、ユーザから指定されるマップ生成条件の入力を受け付けるためのものである。受け付けるとは、例えば、ユーザの指定するマップ生成条件を示す情報を通信インターフェースを介して電子情報として受信し、メモリ等に記憶させることを意味する。
文献抽出部112は、ユーザから指定された条件に基づいて、文献データベース31及びインデックスデータベース33を検索することにより、所定範囲内の文献情報を抽出するものである。文献座標算出部113は、抽出された文献情報を解析することにより、マップ150上における座標を算出するものである。例えば、文献座標算出部113は、抽出された各文献情報に含まれるキーワードの組合せ及び出現数に対して主成分分析を施すことにより、二次元平面上における各文献の座標をそれぞれ算出する。
キーワード抽出部114は、抽出された文献情報を解析することにより、そこに含まれている複数のキーワードを抽出する。キーワード座標算出部115は、抽出されたキーワードの座標をそれぞれ算出するものである。例えば、キーワード座標算出部115は、キーワードを含む各文献情報の総数及び出現総数に対して主成分分析を施すことにより、二次元平面上における各キーワードの座標をそれぞれ算出するものである。なお、主成分分析は、多変量解析のための一手法であり、公知の技術であるため詳細を割愛する。算出されたキーワード座標は、キーワード対応関係分析部120にも使用される。
マップ生成部116は、算出された各文献情報の座標及び各キーワードの座標に基づいて、マップ150を生成する。例えば、マップ生成部116は、有限の二次元平面を縦横に細かく区切って多数のブロック領域を設定し、各ブロック領域に存在する文献情報の数を算出する。これにより、マップ生成部116は、文献情報の分布密度を求め、この分布密度に対応する等高線151A等を設定し、マップ図形を作成する。
マップ表示部117は、生成されたマップ150の構成に応じて所定の表示要素をそれぞれ割り当てることにより、ユーザが視認可能なマップ150を生成し、クライアント端末200に提供する。所定の表示要素としては、例えば、各等高線151A等を示すための輪郭線や各キーワードを示すための文字等を挙げることができる。このほかに、マップ150に対する操作を行うためのメニュー表示部等も追加される。
キーワード対応関係分析部120は、例えば、対象文献抽出部121と、キーワードランキング生成部122と、基準キーワード検出部123と、対応キーワード候補検出部124と、キーワード座標比較部125と、対応キーワード検出部126及びキーワード対応関係出力部127を備えて構成される。
対象文献抽出部121は、ユーザの指定する分析条件に合致する文献情報を抽出するもので、図1中の対象文献抽出部2に対応する。対象文献抽出部121は、マップ150を構成する全ての文献情報、または、一部の文献情報を抽出する。
キーワードランキング生成部122は、キーワードランキングテーブル5を生成するもので、図1中のキーワードランキング生成部4に対応する。基準キーワード検出部123は、基準キーワードを検出するもので、図1中の基準キーワード検出部6に対応する。対応キーワード候補検出部124は、基準キーワードに対応しうるキーワードの候補を検出するもので、図1中の対応キーワード候補検出部7に対応する。キーワード座標比較部125は、基準キーワードのマップ150における座標と対応キーワード候補のマップ150における座標とを比較するもので、図1中の特徴情報比較部10に対応する。なお、キーワード座標算出部115は、図1中の各特徴情報検出部8,9に対応する。
対応キーワード検出部126は、基準キーワードに対応するキーワードを検出するもので、図1中の対応キーワード検出部11に対応する。キーワード対応結果出力部127は、基準キーワードと対応キーワードの関係を出力するもので、図1中のキーワード対応関係出力部12に対応する。
図9は、文献情報分析装置100及びクライアント端末200のハードウェア構成の概略を示す構成説明図である。文献情報分析装置100は、上述のように、サーバコンピュータ等のように構成可能である。
文献情報分析装置100は、例えば、通信インターフェース(図中、インターフェースを「I/F」と略記)1001と、CPU(Central Processing Unit)1002と、ROM(Read Only Memory)1003と、RAM(Random Access Memory)1004と、補助記憶装置1005を備えて構成することができる。
補助記憶装置1005には、例えば、OS(Operating System)の他に、文献データベース31と、単語データベース32と、インデックスデータベース33と、キーワード対応関係分析プログラム1100と、表示制御プログラム1110と、主成分分析プログラム1120と、構造解析プログラム1130と、検索プログラム1140及びウェブサーバプログラム1150を、それぞれ記憶させることができる。
文献データベース31には、上述のように、特許公開公報等の文献情報が予め記憶されている。単語データベース32には、例えば、助詞や接続詞等のようなキーワードに不適切な単語、同義語、類義語等が予め記憶されている。各文献情報に含まれているキーワードは、文献データベース31と単語データベース32とを用いることにより、それぞれ抽出することができる。インデックスデータベース33は、このようにして抽出された各文献情報毎のキーワードの所在をそれぞれ管理する。従って、インデックスデータベース33を用いることにより、多数の文献情報を記憶する文献データベース31の中から、必要な文献情報を速やかに検索することができる。
キーワード対応関係分析プログラム1100は、マップ150に含まれるキーワード間の対応関係を分析し、その分析結果をマップ150上に表示させるものである。表示制御プログラム1110は、マップ150の描画処理等を行うプログラムである。主成分分析プログラム1120は、主成分分析を行うプログラムである。構造解析プログラム1130は、例えば、テキストマイニング等の手法に基づいて、テキストデータの構造を解析するプログラムである。検索プログラム1140は、入力された検索条件に基づいて、文献データベース31等を検索するプログラムである。ウェブサーバプログラム1150は、ウェブサーバ機能を実現するプログラムである。
クライアント端末200の構成を説明する。クライアント端末200は、インターネット等の通信ネットワークCNを介して文献情報分析装置100に接続されており、例えば、通信インターフェース2001と、CPU2002と、ROM2003と、RAM2004及び補助記憶装置2005を備えて構成可能である。
なお、以上の構成は例示であって、本発明はこれに限定されない。例えば、プログラムに代えて、プログラマブル・ロジック・デバイス等のようなハードウェア回路を用いて、各機能の少なくとも一部を実現可能な場合もある。
文献情報分析装置100(以下、分析装置100とも呼ぶ)を用いた文献情報分析方法について説明する。図10は、マップ150を生成して出力するためのマップ制御処理の概要を示すフローチャートである。
まず、ユーザは、クライアント端末200のユーザインターフェースを介して、検索条件を入力する(S30)。検索条件は、例えば、「光触媒」等のようなキーワードを指定することにより、あるいは特許分類コードや文献の公開日等を指定することにより、行うことができる。
分析装置100は、クライアント端末200から検索条件を取得すると(S31)、この検索条件に基づいてインデックスデータベース33及び文献データベース31を検索し、検索条件に合致する文献情報を全て抽出する(S32)。より具体的には、ユーザから指定されたキーワードを有する文献情報を抽出するために、インデックスデータベース33が使用される。そして、指定されたキーワードを有する文献情報が特定されると、その文献情報が文献データベース31から読み出される。そして、抽出された結果は、分析装置100からクライアント端末200に送信され(S33)、クライアント端末200の画面に表示される(S34)。
ユーザは、クライアント端末200の画面を介して、抽出された文献の総数や文献名称等を確認し、抽出結果に承認を与える(S35)。なお、ユーザが抽出結果に満足しない場合、検索条件を変えて、再度検索を指示することができる。
分析装置100は、ユーザの承認を確認すると、抽出された各文献情報からキーワードをそれぞれ抽出する(S36)。このキーワード抽出結果は、分析装置100からクライアント端末200に送信され(S37)、クライアント端末200の画面に表示される(S38)。ユーザは、キーワード抽出結果に所望するキーワードが含まれているか等を確認して、承認を与える(S39)。なお、ユーザがキーワード抽出結果に満足しない場合、再度のキーワード抽出を要求することもできる。
分析装置100は、ユーザの承認を確認すると、主成分分析を行うことにより、抽出された各文献情報の座標をそれぞれ算出する(S40)。続いて、分析装置100は、各文献情報の座標に基づいて、文献情報の分布密度を算出する(S41)。
分析装置100は、主成分分析を行うことにより、抽出された各キーワードの座標をそれぞれ算出する(S42)。そして、分析装置100は、マップ150を生成してクライアント端末200に送信する(S43)。ユーザは、クライアント端末200の画面に表示されたマップ150を確認する(S44)。
図11は、マップ150を生成する様子を模式的に示す説明図である。分析装置100は、各文献情報の座標を算出し、文献座標管理テーブルT1に記憶させる。文献座標管理テーブルT1には、例えば、文献情報を特定するための文献番号に、その文献情報のX軸座標及びY軸座標とが対応付けられている。
また、分析装置100は、抽出された各キーワード(主要キーワード)の座標を算出し、キーワード座標管理テーブルT2に記憶させる。キーワード座標管理テーブルT2は、例えば、キーワードと、そのキーワードが含まれている文献番号と、そのキーワードのX軸座標及びY軸座標がそれぞれ記憶されている。なお、図中では、キーワードが含まれている文献番号を一つのみ示しているが、そのキーワードが含まれる全ての文献番号のリストを含めることができる。
図11の下側に示すように、例えば、マップ150のX軸方法及びY軸方向をそれぞれ複数ずつ分割することにより、多数のブロック領域130をマップ150上に設定することができる。分析装置100は、各ブロック領域130に位置する文献情報の数をそれぞれ算出することにより、文献情報の分布密度を求める。この算出された分布密度に応じて、等高線151が設定される。
図12は、キーワード対応関係分析処理を示すフローチャートである。このフローチャートは、図3に示すフローチャートと共通するステップを含んでいる。そこで、重複した説明を割愛し、本実施例に特徴的なステップを中心に説明する。
本実施例では、マップ150を生成する文献情報分析装置100内に、キーワード対応関係を分析する機能を組み込んでいるため、キーワードの特徴情報としてキーワードの座標を使用する(S15A,S17A)。なぜなら、同一の技術要素を意味するが、その表現形態のそれぞれ異なるキーワード同士は、マップ150上で比較的近い位置に配置されると考えられるためである。
分析装置100は、基準キーワードの座標と対応キーワード候補の座標を比較し(S18A)、座標の近い対応キーワード候補を選択して、キーワード対応関係テーブル12Aを生成する(S19A)。分析装置100は、キーワード対応関係の分析結果を、マップ150上に表示させる。そして、分析装置100は、ユーザが対応キーワード候補を選択しなかった場合(S21:NO)、基準キーワードの座標に最も近い座標を有するキーワードを、基準キーワードに対応付ける(S23A)。
本実施例によれば、上述した第1実施例と同様の作用効果を奏する。そして、本実施例では、図13に示すように、マップ150上に、複数のキーワード152が表示されると共に、基準キーワード152Aと対応キーワード152Bとが接続線153で接続されて表示される。従って、ユーザは、マップ150を構成する文献情報群の全部または一部において、一部の用語が不統一であることと、その用語の標準的な表現とをマップ150上で容易に把握することができる。
図14に基づいて第3実施例を説明する。本実施例では、ユーザが、対応キーワード候補の中から基準キーワードに対応するキーワードを選択しない場合に、特徴情報としての出現頻度順位(座標でもよい)を算出し、キーワード間の順位を比較する。
まず、分析装置100は、ユーザにより指定された分析条件1Aを取得し(S51)、マップ150を構成する文献情報群のうち、分析条件1Aに合致する文献情報群を抽出する(S12)。そして、分析装置100は、抽出された文献情報群に基づいて、キーワードランキングテーブル5を生成し(S53)、キーワードランキングテーブル5に基づいて、基準キーワードテーブル6A及び対応キーワード候補テーブル7Aをそれぞれ生成する(S54,S55)。
そして、分析装置100は、キーワード対応関係テーブル12Aを生成して出力し(S56,S57)、ユーザからの選択を待つ(S58)。ユーザが、対応キーワード候補の中からいずれか一つのキーワードを手動操作で選択すると(S58:YES)、その選択されたキーワードが基準キーワードに対応付けられる(S62)。
これに対し、ユーザが、対応キーワード候補の中からいずれか一つのキーワードを選択しない場合(S58:NO)、分析装置100は、基準キーワードの平均順位を算出し(S59)、対応キーワード候補の順位を取得する(S60)。そして、分析装置100は、基準キーワードの平均順位と最も近い順位を有する対応キーワード候補を選択し、この選択された対応キーワードを基準キーワードに対応付ける(S61)。
以下、図3で述べたと同様に、ユーザがシソーラスの登録を希望する場合(S63:YES)、分析装置100は、対応キーワードを基準キーワードのシソーラスとして登録し(S64)、ユーザが対応キーワードの置換を希望する場合(S65:YES)、対応キーワードを基準キーワードに変換する(S66)。
次に、図15,図16に基づいて、第4実施例を説明する。本実施例では、基準キーワードと係り受けをなす単語群と、各対応キーワード候補とそれぞれ係り受けをなす単語群とをそれぞれ求め、これら各係り受け単語群の最も一致する対応キーワード候補を対応キーワードとして検出する。
図15は、本実施例によるキーワード対応関係分析装置によるデータの流れを模式的に示す説明図である。紙面の都合上、図15では、図2中に示す分析条件1A及び情報蓄積部3の図示を省略している。
本実施例では、基準キーワード特徴情報検出部8は、基準キーワードと係り受けをなす単語のランキングテーブル8Aを生成する。例えば、形態素解析や係り受け解析を行うことにより、基準キーワードと係り受けをなす単語を抽出し、この抽出された単語を出現頻度順に並べ替えることにより、係り受け単語ランキングテーブル8Aを生成することができる。例えば、基準キーワードが「パソコン」の場合、係り受けをなす単語としては、「インストールする」、「フリーズする」、「購入する」等が挙げられる。
上記同様に、対応キーワード候補特徴情報検出部9は、各対応キーワード候補毎に、それぞれの対応キーワード候補と係り受けをなす単語のランキングテーブル9Aをそれぞれ生成する。例えば、対応キーワード候補が「情報処理装置」の場合、係り受けをなす単語としては、「フリーズする」、「インストールする」、「制御する」等が挙げられる。対応キーワード候補が「マウス」の場合、係り受けをなす単語としては、「ドラッグする」、「クリックする」、「購入する」等が挙げられる。
そして、対応キーワード検出部11は、基準キーワードの係り受け単語ランキングテーブル8Aと、各対応キーワード候補の係り受け単語ランキングテーブル9Aとをそれぞれ比較する。これにより、対応キーワード検出部11は、所定順位内の係り受け単語の一致する数が所定値以上である対応キーワード候補を複数検出する。あるいは、対応キーワード検出部11は、所定順位内の係り受け単語が最も一致する対応キーワード候補を1つだけ検出することもできる。
図16は、キーワード対応関係分析処理を示すフローチャートである。このフローチャートは、図12と同様に、図3に示すフローチャートと共通するステップを含む。そこで、重複した説明を割愛し、本実施例に特徴的なステップを中心に説明する。
本実施例では、上述のように、基準キーワード及び対応キーワード候補の属性を直接的に比較するのではなく、これら各キーワードと係り受けをなす単語のランキングに基づいて、基準キーワードと対応キーワード候補との関係を推測する。
そこで、S15Bでは、基準キーワードと係り受けをなす単語のランキングテーブル8Aを生成し、S17Bでは、対応キーワード候補毎に、各対応キーワード候補と係り受けをなす単語のランキングテーブル9Aを生成する。そして、S18Bでは、各係り受け単語ランキングテーブル8A,9Aを比較し、続くS19Bでは、係り受け単語が所定値以上一致する対応キーワード候補を抽出する。ユーザによる手動操作の選択が行われない場合(S21:NO)、係り受け単語の一致する数(即ち、一致率)の最も大きい対応キーワード候補が一つ選択される(S23B)。
なお、本発明は、上述した実施の形態に限定されない。当業者であれば、本発明の範囲内で、種々の追加や変更等を行うことができる。例えば、当業者であれば、前記各実施例を適宜組み合わせることができる。
例えば、上記実施例では、出願人単位で基準キーワードと対応キーワードとの関係を解析したが、これに限らず、文献単位でキーワード間の関係を分析することもできる。また、期間単位で、キーワード間の分析を行うこともできる。例えば、PHS(Personal Handyphone System)は、以前PHP(Personal Handy Phone)と呼ばれていたが、このように時代によって用語が変化した場合にも、本発明によって検出できる。さらに、発明者の氏名や出願人の名称に基づいてキーワードランキングを算出することにより、結婚等で発明者の氏名が変化した場合でも、旧姓との関係を把握し、現在の氏名に統合して管理することができる。同様に、企業の合併や分割等により、出願人の名称が変化した場合でも、旧名称と最新の名称との対応関係を容易に把握することができる。
また、キーワード間の対応関係を検出するためのアルゴリズムを複数種類組合せて用いることもできる。例えば、キーワード出現順位に基づく方法と、キーワード座標に基づく方法と、キーワードと係り受けをなす単語の一致率に基づく方法の中から、いずれか複数の方法を組み合わせることにより、対応関係の検出精度を高めることもできる。
本発明の実施形態に係るキーワード対応関係分析装置の全体を示す説明図である。 キーワード対応関係分析処理におけるデータの流れを模式的に示す説明図である。 キーワード対応関係分析処理を示すフローチャートである。 図3中のキーワードランキングテーブル生成処理を示すフローチャートである。 図3中の基準キーワードテーブル生成処理を示すフローチャートである。 図3中の対応キーワード候補テーブル生成処理を示すフローチャートである。 本発明の第2実施例に係り、キーワード対応関係分析機能を備えた文献情報分析装置の全体を示す説明図である。 文献情報分析装置の機能ブロック図である。 文献情報分析装置のハードウェア及びソフトウェアの構成概要を示す説明図である。 マップを生成し表示させる処理を示すフローチャートである。 文献座標管理テーブル及びキーワード座標管理テーブルとマップとの関係を示す説明図である。 キーワード対応関係分析処理を示すフローチャートである。 キーワードの対応関係がマップ上に表示されている様子を示す説明図である。 本発明の第3実施例に係るキーワード対応関係分析処理のフローチャートである。 本発明の第4実施例に係るキーワード対応関係分析処理におけるデータの流れを模式的に示す説明図である。 キーワード対応関係分析処理を示すフローチャートである。
符号の説明
1…分析条件設定部、1A…分析条件、2…対象文献抽出部、3…情報蓄積部、3A…文献情報記憶部、3B…キーワード等記憶部、4…キーワードランキング生成部、5…キーワードランキングテーブル、6…基準キーワード検出部、6A…基準キーワードテーブル、7…対応キーワード候補検出部、7A…対応キーワード候補テーブル、8…基準キーワード特徴情報検出部、8A…基準キーワードと係り受けをなす単語のランキングテーブル、9…対応キーワード候補特徴情報検出部、9A…対応キーワード候補と係り受けをなす単語のランキングテーブル、10…特徴情報比較部、11…対応キーワード検出部、12…キーワード対応関係出力部、12A…キーワード対応関係テーブル、13…表示部、14…シソーラス登録部、15…キーワード置換部、31…文献データベース、32…単語データベース、33…インデックスデータベース、100…文献情報分析装置、110…マップ制御部、111…マップ生成条件入力受付部、112…文献抽出部、113…文献座標算出部、114…キーワード抽出部、115…キーワード座標算出部、116…マップ生成部、117…マップ表示部、120…キーワード対応関係分析部、121…対象文献抽出部、122…キーワードランキング生成部、123…基準キーワード検出部、124…対応キーワード候補検出部、125…キーワード座標比較部、126…対応キーワード検出部、127…キーワード対応結果出力部、127…キーワード対応関係出力部、150…マップ、151A,151B,151C…等高線、152…キーワード、152A…基準キーワード、152B…対応キーワード、153…接続線、200…クライアント端末

Claims (16)

  1. 電子化された複数の文献情報を記憶する文献情報記憶部と、
    与えられた分析条件に基づいて文献情報記憶部を検索することにより、分析対象の文献情報を抽出する対象文献抽出部と、
    前記抽出された文献情報に基づいて、当該文献情報に出現するキーワード毎に、その出願頻度を解析してなるキーワード出現頻度解析情報を生成する出現頻度解析部と、
    前記キーワード出現頻度解析情報に基づいて、前記抽出された文献情報に含まれるキーワードのうち、所定の文献情報で使用されている第1キーワードを検出する第1キーワード検出部と、
    前記キーワード出現頻度解析情報に基づいて、前記第1キーワードに対応する第2キーワードの候補となる第2キーワード候補を、前記抽出された文献情報のうち前記所定の文献情報以外の他の文献情報に含まれるキーワードの中から検出する第2キーワード候補検出部と、
    前記検出された第2キーワード候補の中から前記第1キーワードに対応する前記第2キーワードを検出する第2キーワード検出部と、
    を備えたキーワード対応関係分析装置。
  2. 前記第2キーワード検出部は、前記第2キーワード候補のうちユーザにより選択された第2キーワード候補を前記第2キーワードとして検出する請求項1に記載のキーワード対応関係分析装置。
  3. 前記検出された第1キーワードの特徴情報を検出する第1特徴情報検出部と、
    前記検出された第2キーワード候補の特徴情報を検出する第2特徴情報検出部と、をさらに備え、
    前記第2キーワード検出部は、前記検出された第1キーワードの特徴情報と前記検出された第2キーワード候補の特徴情報とを比較することにより、前記第2キーワード候補の中から前記第2キーワードを検出する請求項1に記載のキーワード対応関係分析装置。
  4. 前記検出された第1キーワードの特徴情報を検出する第1特徴情報検出部と、
    前記検出された第2キーワード候補の特徴情報を検出する第2特徴情報検出部と、
    前記第1キーワードの特徴情報と前記第2キーワードの特徴情報とを比較する特徴情報比較部と、
    前記特徴情報比較部による比較結果を出力する比較結果出力部と、をさらに備え、
    前記第2キーワード検出部は、
    前記比較結果に基づいて、前記第2キーワード候補のうちユーザにより選択された第2キーワード候補を前記第2キーワードとして検出するユーザ指定モードと、
    前記比較結果に基づいて、前記第1キーワードの特徴情報との差異が最も少ない特徴情報を有する第2キーワード候補を前記第2キーワードとして検出する自動検出モードと、を備えている請求項1に記載のキーワード対応関係分析装置。
  5. 前記第1キーワード検出部は、前記キーワード出現頻度解析情報に基づいて、第1の所定値までの出現頻度順位を有するキーワードのうち、第2の所定値以上かつ前記抽出された文献情報の総数未満の前記所定の文献情報で使用されているキーワードを、前記第1キーワードとして検出する請求項1に記載のキーワード対応関係分析装置。
  6. 前記第2キーワード候補検出部は、前記キーワード出現頻度解析情報に基づいて、前記所定の文献情報以外の前記他の文献情報に含まれるキーワードのうち、前記所定の文献情報で第3の所定値以上使用されているキーワードを除去して残ったキーワードを、前記第2キーワード候補として検出する請求項1に記載のキーワード対応関係分析装置。
  7. 前記第1特徴情報検出部は、前記第1キーワードの前記所定の文献情報における平均出現頻度順位を前記第1キーワードの特徴情報として検出し、
    前記第2特徴情報検出部は、前記所定の文献情報以外の前記他の文献情報における前記第2キーワード候補の出現頻度順位を前記第2キーワードの特徴情報として検出する請求項3または請求項4のいずれかに記載のキーワード対応関係分析装置。
  8. 前記抽出された文献情報の総数及び前記抽出された文献情報から抽出される所定の複数のキーワードの出現数に基づいて主成分分析を行うことにより、前記抽出された文献情報に含まれるキーワードの座標を算出するキーワード座標算出部をさらに備え、
    前記第1特徴情報検出部は、前記キーワード座標算出部により算出される前記第1キーワードの座標を前記第1キーワードの特徴情報として検出し、
    前記第2特徴情報検出部は、前記キーワード座標算出部により算出される前記第2キーワード候補の座標を前記第2キーワード候補の特徴情報として検出する請求項3または請求項4のいずれかに記載のキーワード対応関係分析装置。
  9. 前記第1特徴情報検出部は、前記所定の文献情報において前記第1キーワードと係り受けをなす単語のランキングを前記第1特徴情報として検出し、
    前記第2特徴情報検出部は、前記所定の文献情報以外の他の文献情報において前記第2キーワード候補と係り受けをなす単語のランキングを前記第2特徴情報として検出する請求項3または請求項4のいずれかに記載のキーワード対応関係分析装置。
  10. 前記抽出された文献情報から抽出される所定の複数のキーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、前記抽出された文献情報群の各文献情報の座標をそれぞれ算出する文献座標算出部と、
    前記所定の各キーワードを含む文献情報の総数及び前記所定の各キーワードの出現数に基づいて主成分分析を行うことにより、前記所定の各キーワードの座標をそれぞれ算出するキーワード座標算出部と、
    前記文献座標算出部により算出された前記各文献情報の座標に基づいて前記各文献情報の分布密度を算出し、この算出された分布密度に基づく輪郭を有するマップ図形及び前記所定のキーワードをそれぞれ可視化してマップ情報を生成するマップ生成部をさらに備えており、
    前記第1キーワード及び前記第2キーワードは、前記マップ情報に可視化されている請求項1に記載のキーワード対応関係分析装置。
  11. 前記第2キーワード検出部は、前記キーワード座標算出部によりそれぞれ算出される前記第1キーワードの座標及び前記第2キーワード候補の座標を比較することにより、前記第2キーワード候補の中から前記第2キーワードを検出する請求項10に記載のキーワード対応関係分析装置。
  12. 前記第1キーワードと前記第2キーワードとは、それぞれ異なる表示形態で前記マップ情報に可視化されており、前記マップ情報には、前記第1キーワードと前記第2キーワードとの対応関係を示す表示要素が含まれている請求項10に記載のキーワード対応関係分析装置。
  13. 前記第2キーワードを前記第1キーワードに置換するキーワード置換部を備えた請求項1または請求項10のいずれかに記載のキーワード対応関係分析装置。
  14. 前記第2キーワードを前記第1キーワードに関連づけて記憶させる関連性登録部を備えた請求項1または請求項10のいずれかに記載のキーワード対応関係分析装置。
  15. コンピュータを、
    電子化された複数の文献情報を記憶する文献情報記憶手段と、
    与えられた分析条件に基づいて分析対象の文献情報を抽出する対象文献抽出手段と、
    前記抽出された文献情報に基づいて、当該文献情報に出現するキーワード毎に、その出願頻度を解析してなるキーワード出現頻度解析情報を生成する出現頻度解析手段と、
    前記キーワード出現頻度解析情報に基づいて、前記抽出された文献情報に含まれるキーワードのうち、所定の文献情報で使用されている第1キーワードを検出する第1キーワード検出手段と、
    前記キーワード出現頻度解析情報に基づいて、前記第1キーワードに対応する第2キーワードの候補となる第2キーワード候補を、前記抽出された文献情報のうち前記所定の文献情報以外の他の文献情報に含まれるキーワードの中から検出する第2キーワード候補検出手段と、
    前記検出された第2キーワード候補の中から前記第1キーワードに対応する前記第2キーワードを検出する第2キーワード検出手段と、して機能させるプログラム。
  16. 分析条件を取得するステップと、
    取得された前記分析条件に基づいて文献情報記憶部を検索することにより、分析対象の文献情報を抽出するステップと、
    前記抽出された文献情報に基づいて、当該文献情報に出現するキーワード毎に、その出願頻度を解析してなるキーワード出現頻度解析情報を生成するステップと、
    前記キーワード出現頻度解析情報に基づいて、前記抽出された文献情報に含まれるキーワードのうち所定の文献情報で使用されている第1キーワードを検出するステップと、
    前記キーワード出現頻度解析情報に基づいて、前記第1キーワードに対応する第2キーワードの候補となる第2キーワード候補を、前記抽出された文献情報のうち前記所定の文献情報以外の他の文献情報に含まれるキーワードの中から検出するステップと、
    前記検出された第2キーワード候補の中から前記第1キーワードに対応する前記第2キーワードを検出するステップと、
    を含むキーワード対応関係分析方法。
JP2006016136A 2006-01-25 2006-01-25 キーワード対応関係分析装置及び分析方法 Active JP4699909B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006016136A JP4699909B2 (ja) 2006-01-25 2006-01-25 キーワード対応関係分析装置及び分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006016136A JP4699909B2 (ja) 2006-01-25 2006-01-25 キーワード対応関係分析装置及び分析方法

Publications (2)

Publication Number Publication Date
JP2007199906A true JP2007199906A (ja) 2007-08-09
JP4699909B2 JP4699909B2 (ja) 2011-06-15

Family

ID=38454485

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006016136A Active JP4699909B2 (ja) 2006-01-25 2006-01-25 キーワード対応関係分析装置及び分析方法

Country Status (1)

Country Link
JP (1) JP4699909B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009294824A (ja) * 2008-06-04 2009-12-17 Sony Corp 情報処理装置および方法、並びにプログラム
JP2014132406A (ja) * 2013-01-07 2014-07-17 Nec Corp 同義語抽出システム、方法およびプログラム
KR101423560B1 (ko) 2012-09-28 2014-08-08 (주)오픈놀 키워드 기반 지식 맵 서비스 방법
KR101573449B1 (ko) * 2014-01-29 2015-12-01 한국외국어대학교 연구산학협력단 모바일 애플리케이션 기회 맵 생성 방법 및 장치
CN111428478A (zh) * 2020-03-20 2020-07-17 北京百度网讯科技有限公司 一种词条同义判别的寻证方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1125108A (ja) * 1997-07-02 1999-01-29 Matsushita Electric Ind Co Ltd 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム
JPH11272702A (ja) * 1998-03-23 1999-10-08 Oki Electric Ind Co Ltd 文字列自動分類装置およびその方法並びにその制御プログラムを記録した媒体
JP2003303206A (ja) * 2002-04-10 2003-10-24 Toshiba Corp 辞書編集システムおよび辞書編集方法
JP2005149346A (ja) * 2003-11-19 2005-06-09 Nomura Research Institute Ltd 文献情報分析システム及び文献情報分析プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1125108A (ja) * 1997-07-02 1999-01-29 Matsushita Electric Ind Co Ltd 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム
JPH11272702A (ja) * 1998-03-23 1999-10-08 Oki Electric Ind Co Ltd 文字列自動分類装置およびその方法並びにその制御プログラムを記録した媒体
JP2003303206A (ja) * 2002-04-10 2003-10-24 Toshiba Corp 辞書編集システムおよび辞書編集方法
JP2005149346A (ja) * 2003-11-19 2005-06-09 Nomura Research Institute Ltd 文献情報分析システム及び文献情報分析プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009294824A (ja) * 2008-06-04 2009-12-17 Sony Corp 情報処理装置および方法、並びにプログラム
KR101423560B1 (ko) 2012-09-28 2014-08-08 (주)오픈놀 키워드 기반 지식 맵 서비스 방법
JP2014132406A (ja) * 2013-01-07 2014-07-17 Nec Corp 同義語抽出システム、方法およびプログラム
KR101573449B1 (ko) * 2014-01-29 2015-12-01 한국외국어대학교 연구산학협력단 모바일 애플리케이션 기회 맵 생성 방법 및 장치
CN111428478A (zh) * 2020-03-20 2020-07-17 北京百度网讯科技有限公司 一种词条同义判别的寻证方法、装置、设备和存储介质
CN111428478B (zh) * 2020-03-20 2023-08-15 北京百度网讯科技有限公司 一种词条同义判别的寻证方法、装置、设备和存储介质

Also Published As

Publication number Publication date
JP4699909B2 (ja) 2011-06-15

Similar Documents

Publication Publication Date Title
US7769771B2 (en) Searching a document using relevance feedback
US20200233888A1 (en) Document relationship analysis system
KR101524889B1 (ko) 간접 화법 내에서의 시맨틱 관계의 식별
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
JP2020135891A (ja) 検索提案を提供する方法、装置、機器及び媒体
JP2007219722A (ja) 文書検索サーバおよび文書検索方法
JP4699909B2 (ja) キーワード対応関係分析装置及び分析方法
JP2001290843A (ja) 文書検索装置及びその方法並びに文書検索プログラム及びそのプログラムを記録した記録媒体
JP2007011604A (ja) 不具合診断システム及びプログラム
JP2006323517A (ja) テキスト分類装置およびプログラム
JP2012113459A (ja) 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム
KR20190033821A (ko) 폴더 추천 방법 및 폴더 추천 장치
JP2008262506A (ja) 情報抽出システム、情報抽出方法および情報抽出用プログラム
JP7167997B2 (ja) 文献検索方法および文献検索システム
JP5790820B2 (ja) 不整合検出装置、プログラム及び方法、修正支援装置、プログラム及び方法
JP2007279978A (ja) 文書検索装置及び文書検索方法
JP2019061522A (ja) 文書推薦システム、文書推薦方法および文書推薦プログラム
JP4813312B2 (ja) 電子文書検索方法、電子文書検索装置及びプログラム
JP4148247B2 (ja) 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP6181890B2 (ja) 文献解析装置、文献解析方法およびプログラム
KR101078966B1 (ko) 문서 분석 시스템
JP6534454B2 (ja) 情報検索方法及び情報検索装置並びに情報検索システム
JP5293336B2 (ja) マルチメディア統合検索プログラム、方法及び装置
KR20110045927A (ko) 전자도서컨텐츠 검색 서비스 시스템 및 전자도서컨텐츠 검색 서비스 방법
JP2007241635A (ja) 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110303

R150 Certificate of patent or registration of utility model

Ref document number: 4699909

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250