JP2007199906A - キーワード対応関係分析装置及び分析方法 - Google Patents
キーワード対応関係分析装置及び分析方法 Download PDFInfo
- Publication number
- JP2007199906A JP2007199906A JP2006016136A JP2006016136A JP2007199906A JP 2007199906 A JP2007199906 A JP 2007199906A JP 2006016136 A JP2006016136 A JP 2006016136A JP 2006016136 A JP2006016136 A JP 2006016136A JP 2007199906 A JP2007199906 A JP 2007199906A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- information
- document information
- candidate
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title description 34
- 238000004458 analytical method Methods 0.000 claims abstract description 183
- 238000001514 detection method Methods 0.000 claims abstract description 82
- 238000003860 storage Methods 0.000 claims abstract description 35
- 238000000605 extraction Methods 0.000 claims abstract description 23
- 239000000284 extract Substances 0.000 claims abstract description 16
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000000513 principal component analysis Methods 0.000 claims description 16
- 238000009826 distribution Methods 0.000 claims description 12
- 230000001419 dependent effect Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 8
- 230000014509 gene expression Effects 0.000 abstract description 25
- 230000010365 information processing Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000006854 communication Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000491 multivariate analysis Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 102200095678 rs11004439 Human genes 0.000 description 2
- 102220531547 39S ribosomal protein L4, mitochondrial_S17A_mutation Human genes 0.000 description 1
- 101001118566 Homo sapiens 40S ribosomal protein S15a Proteins 0.000 description 1
- 102220588438 Keratin, type I cytoskeletal 18_S15A_mutation Human genes 0.000 description 1
- 102220588437 Keratin, type I cytoskeletal 18_S18A_mutation Human genes 0.000 description 1
- 102220588432 Keratin, type I cytoskeletal 18_S23A_mutation Human genes 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000011941 photocatalyst Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】対象文献抽出部2は、分析対象の文献情報を情報蓄積部3から抽出し、キーワードランキング生成部4は、各文献情報に含まれるキーワード及び出現頻度を順位付けして示すテーブル5を生成する。基準キーワード検出部6は、多くの文献情報で使用されているが、一部の文献情報では使用されていない基準キーワードを検出する。対応キーワード候補検出部7は、基準キーワードを含まない文献情報において、基準キーワードに対応する可能性のあるキーワードを検出する。基準キーワードの平均順位と対応キーワード候補の順位とを比較することにより、対応キーワード検出部11は、基準キーワードに対応するキーワードを検出する。キーワード対応関係出力部12は、基準キーワードと対応キーワードとを関連づけて、出力する。
【選択図】図1
Description
前記第2特徴情報検出部は、前記所定の文献情報以外の他の文献情報において前記第2キーワード候補と係り受けをなす単語のランキングを前記第2特徴情報として検出するようになっている。
なお、厳密には、多数の文献情報で使用されているキーワードであっても、それが正式名称であるとは限らない。略称の方が正式名称よりも頻繁に使用される場合もある。また、登録商標の普通名称化または慣用商標化として知られているように、特定企業の登録商標が有名になった結果、正式名称よりも登録商標の方が使用される場合もある。
また、キーワードランキングテーブル5それ自体を、表示部13に出力させることもできる。そして、キーワードランキングテーブル5を画面出力する場合、基準キーワードと対応キーワード(または対応キーワード候補)との対応関係が明確に区別できるように、例えば、フォントの種類、フォントサイズ、文字色等を適宜設定することもできる。
即ち、特定の技術分野に関する文献情報群において、複数の出願人がそれぞれ別々の方言的表現(基準キーワードと異なるキーワード)を使用している場合でも、それぞれの方言的表現を別々に検出し、対応する標準的表現(基準キーワード)との関係を検出することができる。
即ち、本実施例によれば、基準キーワード(標準的表現)を使用する文献情報群と、標準的表現から外れた対応キーワード(方言的表現)を使用する文献情報群との対応関係を把握することができる。つまり、標準的な表現とは異なる表現が使用されている文献情報群の中から、方言的な表現を抽出し、抽出された方言的な表現と標準的な表現との対応関係を可視化して示すことができる。
なお、本発明の実施に必要な範囲内で、特開2005−149346号公報の開示内容を利用可能である。
Claims (16)
- 電子化された複数の文献情報を記憶する文献情報記憶部と、
与えられた分析条件に基づいて文献情報記憶部を検索することにより、分析対象の文献情報を抽出する対象文献抽出部と、
前記抽出された文献情報に基づいて、当該文献情報に出現するキーワード毎に、その出願頻度を解析してなるキーワード出現頻度解析情報を生成する出現頻度解析部と、
前記キーワード出現頻度解析情報に基づいて、前記抽出された文献情報に含まれるキーワードのうち、所定の文献情報で使用されている第1キーワードを検出する第1キーワード検出部と、
前記キーワード出現頻度解析情報に基づいて、前記第1キーワードに対応する第2キーワードの候補となる第2キーワード候補を、前記抽出された文献情報のうち前記所定の文献情報以外の他の文献情報に含まれるキーワードの中から検出する第2キーワード候補検出部と、
前記検出された第2キーワード候補の中から前記第1キーワードに対応する前記第2キーワードを検出する第2キーワード検出部と、
を備えたキーワード対応関係分析装置。 - 前記第2キーワード検出部は、前記第2キーワード候補のうちユーザにより選択された第2キーワード候補を前記第2キーワードとして検出する請求項1に記載のキーワード対応関係分析装置。
- 前記検出された第1キーワードの特徴情報を検出する第1特徴情報検出部と、
前記検出された第2キーワード候補の特徴情報を検出する第2特徴情報検出部と、をさらに備え、
前記第2キーワード検出部は、前記検出された第1キーワードの特徴情報と前記検出された第2キーワード候補の特徴情報とを比較することにより、前記第2キーワード候補の中から前記第2キーワードを検出する請求項1に記載のキーワード対応関係分析装置。 - 前記検出された第1キーワードの特徴情報を検出する第1特徴情報検出部と、
前記検出された第2キーワード候補の特徴情報を検出する第2特徴情報検出部と、
前記第1キーワードの特徴情報と前記第2キーワードの特徴情報とを比較する特徴情報比較部と、
前記特徴情報比較部による比較結果を出力する比較結果出力部と、をさらに備え、
前記第2キーワード検出部は、
前記比較結果に基づいて、前記第2キーワード候補のうちユーザにより選択された第2キーワード候補を前記第2キーワードとして検出するユーザ指定モードと、
前記比較結果に基づいて、前記第1キーワードの特徴情報との差異が最も少ない特徴情報を有する第2キーワード候補を前記第2キーワードとして検出する自動検出モードと、を備えている請求項1に記載のキーワード対応関係分析装置。 - 前記第1キーワード検出部は、前記キーワード出現頻度解析情報に基づいて、第1の所定値までの出現頻度順位を有するキーワードのうち、第2の所定値以上かつ前記抽出された文献情報の総数未満の前記所定の文献情報で使用されているキーワードを、前記第1キーワードとして検出する請求項1に記載のキーワード対応関係分析装置。
- 前記第2キーワード候補検出部は、前記キーワード出現頻度解析情報に基づいて、前記所定の文献情報以外の前記他の文献情報に含まれるキーワードのうち、前記所定の文献情報で第3の所定値以上使用されているキーワードを除去して残ったキーワードを、前記第2キーワード候補として検出する請求項1に記載のキーワード対応関係分析装置。
- 前記第1特徴情報検出部は、前記第1キーワードの前記所定の文献情報における平均出現頻度順位を前記第1キーワードの特徴情報として検出し、
前記第2特徴情報検出部は、前記所定の文献情報以外の前記他の文献情報における前記第2キーワード候補の出現頻度順位を前記第2キーワードの特徴情報として検出する請求項3または請求項4のいずれかに記載のキーワード対応関係分析装置。 - 前記抽出された文献情報の総数及び前記抽出された文献情報から抽出される所定の複数のキーワードの出現数に基づいて主成分分析を行うことにより、前記抽出された文献情報に含まれるキーワードの座標を算出するキーワード座標算出部をさらに備え、
前記第1特徴情報検出部は、前記キーワード座標算出部により算出される前記第1キーワードの座標を前記第1キーワードの特徴情報として検出し、
前記第2特徴情報検出部は、前記キーワード座標算出部により算出される前記第2キーワード候補の座標を前記第2キーワード候補の特徴情報として検出する請求項3または請求項4のいずれかに記載のキーワード対応関係分析装置。 - 前記第1特徴情報検出部は、前記所定の文献情報において前記第1キーワードと係り受けをなす単語のランキングを前記第1特徴情報として検出し、
前記第2特徴情報検出部は、前記所定の文献情報以外の他の文献情報において前記第2キーワード候補と係り受けをなす単語のランキングを前記第2特徴情報として検出する請求項3または請求項4のいずれかに記載のキーワード対応関係分析装置。 - 前記抽出された文献情報から抽出される所定の複数のキーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、前記抽出された文献情報群の各文献情報の座標をそれぞれ算出する文献座標算出部と、
前記所定の各キーワードを含む文献情報の総数及び前記所定の各キーワードの出現数に基づいて主成分分析を行うことにより、前記所定の各キーワードの座標をそれぞれ算出するキーワード座標算出部と、
前記文献座標算出部により算出された前記各文献情報の座標に基づいて前記各文献情報の分布密度を算出し、この算出された分布密度に基づく輪郭を有するマップ図形及び前記所定のキーワードをそれぞれ可視化してマップ情報を生成するマップ生成部をさらに備えており、
前記第1キーワード及び前記第2キーワードは、前記マップ情報に可視化されている請求項1に記載のキーワード対応関係分析装置。 - 前記第2キーワード検出部は、前記キーワード座標算出部によりそれぞれ算出される前記第1キーワードの座標及び前記第2キーワード候補の座標を比較することにより、前記第2キーワード候補の中から前記第2キーワードを検出する請求項10に記載のキーワード対応関係分析装置。
- 前記第1キーワードと前記第2キーワードとは、それぞれ異なる表示形態で前記マップ情報に可視化されており、前記マップ情報には、前記第1キーワードと前記第2キーワードとの対応関係を示す表示要素が含まれている請求項10に記載のキーワード対応関係分析装置。
- 前記第2キーワードを前記第1キーワードに置換するキーワード置換部を備えた請求項1または請求項10のいずれかに記載のキーワード対応関係分析装置。
- 前記第2キーワードを前記第1キーワードに関連づけて記憶させる関連性登録部を備えた請求項1または請求項10のいずれかに記載のキーワード対応関係分析装置。
- コンピュータを、
電子化された複数の文献情報を記憶する文献情報記憶手段と、
与えられた分析条件に基づいて分析対象の文献情報を抽出する対象文献抽出手段と、
前記抽出された文献情報に基づいて、当該文献情報に出現するキーワード毎に、その出願頻度を解析してなるキーワード出現頻度解析情報を生成する出現頻度解析手段と、
前記キーワード出現頻度解析情報に基づいて、前記抽出された文献情報に含まれるキーワードのうち、所定の文献情報で使用されている第1キーワードを検出する第1キーワード検出手段と、
前記キーワード出現頻度解析情報に基づいて、前記第1キーワードに対応する第2キーワードの候補となる第2キーワード候補を、前記抽出された文献情報のうち前記所定の文献情報以外の他の文献情報に含まれるキーワードの中から検出する第2キーワード候補検出手段と、
前記検出された第2キーワード候補の中から前記第1キーワードに対応する前記第2キーワードを検出する第2キーワード検出手段と、して機能させるプログラム。 - 分析条件を取得するステップと、
取得された前記分析条件に基づいて文献情報記憶部を検索することにより、分析対象の文献情報を抽出するステップと、
前記抽出された文献情報に基づいて、当該文献情報に出現するキーワード毎に、その出願頻度を解析してなるキーワード出現頻度解析情報を生成するステップと、
前記キーワード出現頻度解析情報に基づいて、前記抽出された文献情報に含まれるキーワードのうち所定の文献情報で使用されている第1キーワードを検出するステップと、
前記キーワード出現頻度解析情報に基づいて、前記第1キーワードに対応する第2キーワードの候補となる第2キーワード候補を、前記抽出された文献情報のうち前記所定の文献情報以外の他の文献情報に含まれるキーワードの中から検出するステップと、
前記検出された第2キーワード候補の中から前記第1キーワードに対応する前記第2キーワードを検出するステップと、
を含むキーワード対応関係分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006016136A JP4699909B2 (ja) | 2006-01-25 | 2006-01-25 | キーワード対応関係分析装置及び分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006016136A JP4699909B2 (ja) | 2006-01-25 | 2006-01-25 | キーワード対応関係分析装置及び分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007199906A true JP2007199906A (ja) | 2007-08-09 |
JP4699909B2 JP4699909B2 (ja) | 2011-06-15 |
Family
ID=38454485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006016136A Active JP4699909B2 (ja) | 2006-01-25 | 2006-01-25 | キーワード対応関係分析装置及び分析方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4699909B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009294824A (ja) * | 2008-06-04 | 2009-12-17 | Sony Corp | 情報処理装置および方法、並びにプログラム |
JP2014132406A (ja) * | 2013-01-07 | 2014-07-17 | Nec Corp | 同義語抽出システム、方法およびプログラム |
KR101423560B1 (ko) | 2012-09-28 | 2014-08-08 | (주)오픈놀 | 키워드 기반 지식 맵 서비스 방법 |
KR101573449B1 (ko) * | 2014-01-29 | 2015-12-01 | 한국외국어대학교 연구산학협력단 | 모바일 애플리케이션 기회 맵 생성 방법 및 장치 |
CN111428478A (zh) * | 2020-03-20 | 2020-07-17 | 北京百度网讯科技有限公司 | 一种词条同义判别的寻证方法、装置、设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1125108A (ja) * | 1997-07-02 | 1999-01-29 | Matsushita Electric Ind Co Ltd | 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム |
JPH11272702A (ja) * | 1998-03-23 | 1999-10-08 | Oki Electric Ind Co Ltd | 文字列自動分類装置およびその方法並びにその制御プログラムを記録した媒体 |
JP2003303206A (ja) * | 2002-04-10 | 2003-10-24 | Toshiba Corp | 辞書編集システムおよび辞書編集方法 |
JP2005149346A (ja) * | 2003-11-19 | 2005-06-09 | Nomura Research Institute Ltd | 文献情報分析システム及び文献情報分析プログラム |
-
2006
- 2006-01-25 JP JP2006016136A patent/JP4699909B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1125108A (ja) * | 1997-07-02 | 1999-01-29 | Matsushita Electric Ind Co Ltd | 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム |
JPH11272702A (ja) * | 1998-03-23 | 1999-10-08 | Oki Electric Ind Co Ltd | 文字列自動分類装置およびその方法並びにその制御プログラムを記録した媒体 |
JP2003303206A (ja) * | 2002-04-10 | 2003-10-24 | Toshiba Corp | 辞書編集システムおよび辞書編集方法 |
JP2005149346A (ja) * | 2003-11-19 | 2005-06-09 | Nomura Research Institute Ltd | 文献情報分析システム及び文献情報分析プログラム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009294824A (ja) * | 2008-06-04 | 2009-12-17 | Sony Corp | 情報処理装置および方法、並びにプログラム |
KR101423560B1 (ko) | 2012-09-28 | 2014-08-08 | (주)오픈놀 | 키워드 기반 지식 맵 서비스 방법 |
JP2014132406A (ja) * | 2013-01-07 | 2014-07-17 | Nec Corp | 同義語抽出システム、方法およびプログラム |
KR101573449B1 (ko) * | 2014-01-29 | 2015-12-01 | 한국외국어대학교 연구산학협력단 | 모바일 애플리케이션 기회 맵 생성 방법 및 장치 |
CN111428478A (zh) * | 2020-03-20 | 2020-07-17 | 北京百度网讯科技有限公司 | 一种词条同义判别的寻证方法、装置、设备和存储介质 |
CN111428478B (zh) * | 2020-03-20 | 2023-08-15 | 北京百度网讯科技有限公司 | 一种词条同义判别的寻证方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4699909B2 (ja) | 2011-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7769771B2 (en) | Searching a document using relevance feedback | |
US20200233888A1 (en) | Document relationship analysis system | |
KR101524889B1 (ko) | 간접 화법 내에서의 시맨틱 관계의 식별 | |
US8024175B2 (en) | Computer program, apparatus, and method for searching translation memory and displaying search result | |
JP2020135891A (ja) | 検索提案を提供する方法、装置、機器及び媒体 | |
JP2007219722A (ja) | 文書検索サーバおよび文書検索方法 | |
JP4699909B2 (ja) | キーワード対応関係分析装置及び分析方法 | |
JP2001290843A (ja) | 文書検索装置及びその方法並びに文書検索プログラム及びそのプログラムを記録した記録媒体 | |
JP2007011604A (ja) | 不具合診断システム及びプログラム | |
JP2006323517A (ja) | テキスト分類装置およびプログラム | |
JP2012113459A (ja) | 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム | |
KR20190033821A (ko) | 폴더 추천 방법 및 폴더 추천 장치 | |
JP2008262506A (ja) | 情報抽出システム、情報抽出方法および情報抽出用プログラム | |
JP7167997B2 (ja) | 文献検索方法および文献検索システム | |
JP5790820B2 (ja) | 不整合検出装置、プログラム及び方法、修正支援装置、プログラム及び方法 | |
JP2007279978A (ja) | 文書検索装置及び文書検索方法 | |
JP2019061522A (ja) | 文書推薦システム、文書推薦方法および文書推薦プログラム | |
JP4813312B2 (ja) | 電子文書検索方法、電子文書検索装置及びプログラム | |
JP4148247B2 (ja) | 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP6181890B2 (ja) | 文献解析装置、文献解析方法およびプログラム | |
KR101078966B1 (ko) | 문서 분석 시스템 | |
JP6534454B2 (ja) | 情報検索方法及び情報検索装置並びに情報検索システム | |
JP5293336B2 (ja) | マルチメディア統合検索プログラム、方法及び装置 | |
KR20110045927A (ko) | 전자도서컨텐츠 검색 서비스 시스템 및 전자도서컨텐츠 검색 서비스 방법 | |
JP2007241635A (ja) | 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081008 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110301 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110303 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4699909 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |