JP2006302024A - 関連文書表示方法及びプログラム - Google Patents

関連文書表示方法及びプログラム Download PDF

Info

Publication number
JP2006302024A
JP2006302024A JP2005123786A JP2005123786A JP2006302024A JP 2006302024 A JP2006302024 A JP 2006302024A JP 2005123786 A JP2005123786 A JP 2005123786A JP 2005123786 A JP2005123786 A JP 2005123786A JP 2006302024 A JP2006302024 A JP 2006302024A
Authority
JP
Japan
Prior art keywords
topic
information
document
phrase
document information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005123786A
Other languages
English (en)
Inventor
Yuichiro Sekiguchi
裕一郎 関口
Harumi Kawashima
晴美 川島
Tsutomu Sasaki
努 佐々木
Masakatsu Okubo
雅且 大久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005123786A priority Critical patent/JP2006302024A/ja
Publication of JP2006302024A publication Critical patent/JP2006302024A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 話題が発生している期間を限定した関連文書を表示する。
【解決手段】 本発明は、外部から作成時刻情報を含む文書群が入力されると、該文書群を解析して、該文書群中で話題となっている話題語句と、該話題語句の文書群中の出現頻度の時間的な変化である語句話題度、及び該話題語句を含む関連文書情報からなる話題語句情報を取得し、話題語句情報を時間軸に沿って整理し、話題となっている話題語句と該話題語句が話題になっていた期間と該話題語句に関連する関連文書情報とから構成される話題情報を算出し、話題情報群を用いて、閲覧対象として入力された閲覧文書情報が含んでいる話題語句を第2の記憶手段から抽出し、該話題語句に関連する文書情報を、該閲覧文書情報に付与して表示する。
【選択図】 図1

Description

本発明は、関連文書表示方法及びプログラムに係り、特に、文書データベースに登録された複数の文書中から処理対象文書に関連する文書を表示する技術において、処理対象文書の作成時刻情報を用いて当該処理対象文書に含まれる話題語句を識別することにより、当該話題語句に関連する文書を、当該処理対象文書の関連文書として表示するための関連文書表示方法及びプログラムに関する。
インターネットをはじめとした情報メディアの発達により、様々な種類の文書が蓄積され、閲覧されるようなった。その中には、作成時に話題になっていた出来事に対する感想を綴った日記文章の蓄積など、閲覧時に元となる話題の情報を知らなくては理解できない文書情報も多く含まれる。そのため、文書理解を補助する目的で、閲覧文書に関連する文書を検索し、表示する技術が提案されている。
その技術としては、キーワードとなる語句と当該語句に関連する文書とを蓄積したキーワード
データベースを作成し、当該データベースに含まれる語句が閲覧文書に含まれる際に、当該語句に関連する文書のリストへのハイパーリンクを表示するものがある(例えば、非特許文献1参照)。
http://d.hatena.ne.jp/help#keyword
しかしながら、上記従来の技術では、文書に含まれる語句が同じであったとしても、その語句が出現した時期が異なることにより扱っている話題の内容が異なることがあり得る。
例えば、同じ「横須賀市」という地名であっても、その場所で交通事故が起きた時期と芸能人のコンサートが行われた時期とでは、異なる話題を表す語句となる。従って、キーワードデータベースとのマッチングによる関連文書の提示を行う方法では、同じキーワードを用いた異なる話題を扱う文書が関連文書として表示されてしまう問題がある。
また、キーワードデータベースを人手で作成する必要があり、データベースが大規模になると運用が困難になる問題がある。
本発明は、上記の点に鑑みなされたもので、話題が発生している期間を限定した関連文書を表示することが可能な関連文書表示方法及びプログラムを提供することを目的とする。
図1は、本発明の原理を説明するための図である。
本発明(請求項1)は、閲覧対象となる文書情報を入力とし、該文書情報を解析することにより、該文書情報に含まれる話題に関連する文書を表示する関連文書表示方法であって、
外部から作成時刻情報を含む文書群が入力されると、該文書群を解析して、該文書群中で話題となっている話題語句と、該話題語句の文書群中の出現頻度の時間的な変化である語句話題度、及び該話題語句を含む関連文書情報からなる話題語句情報を取得し、第1の記憶手段に格納する話題抽出ステップ(ステップ1)と、
話題抽出ステップ(ステップ1)で得られた話題語句情報を時間軸に沿って整理し、話題となっている話題語句と該話題語句が話題になっていた期間と該話題語句に関連する関連文書情報とから構成される話題情報を算出し、第2の記憶手段に格納する話題情報整理ステップ(ステップ2)と、
閲覧対象として入力された閲覧文書情報が含んでいる話題語句を第2の記憶手段から抽出し、該話題語句に関連する文書情報を、該閲覧文書情報に付与して表示する関連文書情報付与ステップ(ステップ3)と、を行う。
また、本発明(請求項2)は、関連文書情報付与ステップ(ステップ3)において、
閲覧文書情報の作成時刻と構成語句を解析し、
話題情報整理ステップ(ステップ2)において第2の記憶手段に格納された話題情報群と比較することにより、閲覧文書情報の話題語句を判別し、該話題語句に関連する情報のみを関連文書情報として該閲覧文書情報に付与する。
また、本発明(請求項3)は、関連文書情報付与ステップ(ステップ3)の代わりに、
閲覧文書情報が予め与えられている作成時刻情報付き文書群が蓄積された文書情報データベースから選ばれるものとし、
文書情報データベース中の文書情報全てに対し、予め文書内容を解析し、関連文書情報を付与する文書データベース更新ステップと、
文書データベース更新ステップにおいて得られた関連文書情報が付与された文書情報データベースに対する検索条件を外部から取得し、該文書情報データベースを検索することにより得られた関連文書情報付き文書情報を表示するデータベース検索ステップと、
を行う。
本発明(請求項4)は、閲覧対象となる文書情報を入力とし、該文書情報を解析することにより、該文書情報に含まれる話題に関連する文書を表示する関連文書表示プログラムであって、
記憶手段に、少なくとも、文書群中で話題となっている話題語句と、該話題語句の文書群中の出現頻度の時間的な変化である語句話題度、及び該話題語句を含む関連文書情報からなる話題語句情報を格納する第1の記憶手段と、話題語句と該話題語句が話題になっていた期間と該話題語句に関連する関連文書情報とから構成される話題情報を格納する第2の記憶手段とを備えるコンピュータに、請求項1乃至3記載の方法を実現するための各ステップを実行させるプログラムである。
本発明によれば、話題となる語句と当該語句が話題となっていた期間と当該語句に関連する文書情報とによってなる話題情報が蓄積された話題情報データベースを自動的に作成することにより、ある時刻において作成された文書に対し、その文書が含む話題についての関連文書情報を抽出することが可能となる。特に、話題が発生している期間を限定して関連文書情報を付与するため、文書の作成当時に話題となっていなかったような重要度の低い関連情報が付与されることがなく、精度の高い関連情報の付与が可能になる。
以下、図面と共に本発明の実施の形態を説明する。
[第1の実施の形態]
図2は、本発明の第1の実施の形態における関連情報付与装置の構成を示す。
同図に示す関連情報付与装置100には、入力となる文書データを蓄積している文書データベース210と、出力となる関連情報付文書情報を表示する表示装置230が接続されている。
関連情報付与装置100は、話題抽出部110、話題情報整理部120、話題情報データベース130、関連情報付与部140、表示画面生成部150から構成される。
関連情報付与装置100は、ユーザから閲覧文書情報が入力されると、当該文書情報に関連する文書の情報を付加し、表示装置230に出力する。
文書データベース210には、作成時刻情報が付加された文書情報が蓄積され、随時更新されている。例えば、Web上に公開されている文書に“2005 2/12 15:08”といったような作成時刻を付加し、次々と入力して記録することにより、当該データベースを構築することができる。例えば、インターネット上のニュースサイト等の新しい情報を含む文書が逐次更新される情報源から文書を入力するのが望ましい。この場合には、サイト内の文書の作成時刻だけでなく、更新情報を監視し、更新された時刻を文書作成時刻と見做し、新しく作成された文書と同様に収集してもよい。
話題情報データベース130には、図3に示すように、話題語句情報と、当該話題語句の話題の度合いを表す語句話題度情報と、当該話題語句が話題となっていた期間の開始時刻情報と終了時刻情報とからなる話題期間情報と、当該話題語句について書かれた関連文書情報とにより構成される話題情報が蓄積されている。また、話題情報データベース130には、当該データベースが最後に更新された最終更新時刻情報も記録されている。
図3に示す話題情報データベース130の例において、1番目に記載されている項目は、「空爆」という語句が“2005/02/14”から“2005/02/21”までの期間話題になっており、その間の語句話題度の最大値が0.322で、当該期間に当該語句について書かれた関連文書情報“itnl1.txt, itnl2.txt, itnl3.txt”とからなる話題情報を表している。図3中の「米フロリダ州」のように、同じ話題語句であっても話題になっていた時期が異なる場合は異なる話題情報として扱う。なお、語句話題度は、文書群中で語句の出現頻度の時間的な変化を数値化したものであり、頻度が増加すると大きく、頻度が減少すると小さくなる。例えば、1日に5回しか出現しなかった語句が、1日に30回出現するようになると、その語句の語句話題度を高くするというものである。
以下に、文書情報付与装置における動作を説明する。
図4は、本発明の第1の実施の形態における動作のフローチャートである。
ステップ110) 話題抽出部110は、処理が開始されると、文書データベース210に蓄積されている文書を1文書ずつ読み出し、一般的な話題語句抽出技術(例えば、「文書の類似度と新鮮度に基づく話題語抽出」佐藤、川島、佐々木、大久保(NTT)情報処理学会自然言語処理研究会発表資料、2005-NL-165, pp.29-55、2005年1月11〜12日開催)による解析を行い、処理時刻での話題を表す話題語句と当該話題語句の語句話題度と当該話題語句を含み、語句話題度の値が高い関連文書情報とが組となった話題語句情報を抽出し、話題情報整理部120の話題語句バッファに蓄積する。
この一連の処理は終了信号が送られるまで、予め設定された時間毎に定期的に実行される。話題語句バッファに蓄積される話題データの例を図5に示す。
図5の例において、話題語句「空爆」の関連文書情報として蓄積されている文書情報を“itnl1.txt.itnl2.txt,itnl3.txt”と表している。
ステップ120) 話題情報整理部120は、話題抽出部110によって話題語句バッファに書き込まれた話題情報データから語句話題度が一定数以上のデータを選択し、時間的な連続性をもって整理し、話題情報データベース130に格納する。詳細な処理については後述する。
ステップ130) ユーザから入力された作成時刻情報付きの閲覧文書情報が関連情報付与部140に入力される。
ステップ140) 関連情報付与部140は、関連文書情報に付与されている作成時刻情報の時間範囲に含まれる話題情報を話題情報データベース130から取得し、当該話題情報に含まれる話題語句と同じ語句が、入力された閲覧文書情報に含まれるか否かを判別し、話題語句を含む場合には、当該話題情報データベース130から取得した話題語句の関連文書の情報を入力された関連文書情報に付与して、表現画面生成部150の表示情報バッファに蓄積する。具体的な入力情報の例としては、作成時刻情報が記載されているウェブログ記事のURL情報がある。詳細な処理については後述する。
ステップ150) 表示画面生成部150は、表示情報バッファに書き込まれている関連文書情報付閲覧文書情報を読み込み、閲覧文書情報の下部に、閲覧文書情報の含む話題語句と当該話題語句の関連文書のタイトル部分の一覧と当該関連文書へのハイパーリンクとを付加した表示画面情報を作成し、表示装置230に出力する。表示画面生成部150で生成された表示画面情報の例を図6に示す。
次に、上記のステップ120の話題情報整理部120の詳細な動作を説明する。
図7は、本発明の第1の形態における話題情報整理部の詳細な動作のフローチャートである。
ステップ121) 話題情報整理部120は、処理が開始されると、話題語句バッファから語句話題度が予め装置に設定された閾値以下の話題語句情報を消去する。当該閾値が0.2だとすると、図5に含まれる話題語句のうち、「空爆」から「撤退声明」までの話題語句情報は残され、その他の話題語句情報は消去されることとなる。
ステップ122) 話題語句バッファに話題語句情報が残っているかを確認し、話題語句情報が処理話題バッファに1つ以上含まれていればステップ123に移行し、話題語句バッファに話題語句情報が残っていなかったら、現在時刻を話題情報データベース130の最終更新時刻として当該データベース130に記録し、処理を終了する。
ステップ123) 話題語句バッファから話題語句情報を1つ取り出し、処理話題バッファに格納する。
ステップ124) 話題情報データベース130から、処理話題バッファに蓄積された話題語句情報の話題語句と同じ語句を持ち、かつ、終了時刻情報が当該話題情報データベースの最終更新時刻情報と同一となる話題情報を検索し、該当する話題情報があるかを確認する。該当する話題情報が得られなかった場合はステップ125に移行し、得られた場合はステップ126に移行する。
ステップ125) 新規の処理話題バッファ中の話題語句情報を新規の話題情報と判断し、当該話題語句情報の話題語句と関連文書情報と現在時刻が開始時刻と終了時刻とに設定されている話題期間情報とを組にした話題情報を話題情報データベース130に記録し、ステップ122に移行する。
ステップ126) ステップ124において該当する話題情報が得られた場合は、処理話題バッファ中の話題語句情報は当該話題情報と連続していると判断し、当該話題情報の内容を更新し、ステップ122に移行する。
具体的には、当該話題情報の話題期間情報の終了時刻を処理時点の時刻に変更する。また、当該話題情報の語句話題度よりも処理話題バッファ中の話題語句情報の語句話題度の方が大きい場合は、語句話題度情報と関連文書情報とを処理話題バッファ中の話題語句情報のもつ語句話題度情報と関連文書情報との内容に書き換える。
上記のステップ124及びステップ126において、話題期間を取得する場合に、話題語句整理部120が、時刻T1,T2,…というタイミングで実行されているとき、時刻Tnにおいて実行された際に、「空爆」という語句を話題情報データベース130に格納する場合、前回時刻Tn−1に実行した際にも「空爆」という話題語句を話題情報データベース130に格納していたならば、「空爆」という語句の話題期間はTn−1からTnまで連続していたと判断する。
具体的には、ステップ124において、時刻Tnの時点で「空爆」という語句を持つ話題情報を話題情報データベース130から検索して、“語句:空爆、話題期間:Tn−k〜Tn−1”という情報が得られた場合、ステップ126では、「空爆」という語句は連続していると判断し、“語句:空爆、話題期間:Tn−k〜Tn”という内容に更新する。
次に、上記のステップ140の関連情報付与部140の処理を詳細に説明する。
図8は、本発明の第1の実施の形態における詳細な動作のフローチャートである。
ステップ141) 関連情報付与部140は、閲覧文書情報が入力されると、当該閲覧文書情報に付加されている作成時刻情報を取得し、話題情報データベース130から当該作成時刻情報に対応する話題機関情報の時間範囲に含まれる話題情報を読み出す。
ステップ142) 話題情報データベース130から取得した全ての話題情報について、当該話題情報に含まれる話題語句と同じ語句が閲覧文書情報に含まれているかを確認する。閲覧文書情報に話題語句が含まれていた場合にはステップ143に移行し、含まれていない場合はステップ144に移行する。
ステップ143) 当該話題語句と組となっている話題情報データベース130の関連文書情報をそれぞれ閲覧文書情報に付与する。ここで、複数の話題語句が閲覧文書情報に含まれている場合には、各話題語句の関連文書情報をそれぞれ閲覧文書情報に付与するものとする。
ステップ144) ステップ143において関連文書情報が付与された場合には、関連文書情報付閲覧文書情報を、また、ステップ142において閲覧文書情報に話題語が含まれていなかった場合は閲覧文書情報を、表示画面生成部150の表示情報バッファに書き込む。
[第2の実施の形態]
前述の第1の実施の形態では、文書データベース210に蓄積される文書情報と、ユーザが閲覧文書情報として入力する文書情報は異なるものであった。これに対し、入力となる閲覧文書情報が常に文書データベース中から選ばれる場合には、予め関連情報を付与した文書情報のデータベースを構築することが考えられる。
本実施の形態では関連情報が付与された文書データベースを想定した場合の例を説明する。
図9は、本発明の第2の実施の形態における関連文書情報付与装置の構成を示す。
同図に示す関連文書情報付与装置300は、出力となる関連情報付文書情報を表示する表示装置410が接続されている。
関連文書情報付与装置300は、文書データベース310、話題抽出部320、話題情報整理部330、話題情報データベース340、文書データベース更新部350、データベース検索部360、表示画面生成部370、から構成され、ユーザからの検索条件が入力として与えられると、検索条件を元に文書データベース310から関連情報が既に付与された文書情報を取得し、表示装置410にその結果を表示する。
文書データベース310は、図10に示すように、作成時刻情報と関連話題語句情報と関連文書情報とが付与された文書情報群を蓄積する。文書データベース310は、前述の第1の実施の形態における文書データベース210と同様に、作成時刻付の文書情報を入力として受け付け、順次蓄積していく。
図9に示す話題抽出部320、話題情報蓄積部330、話題情報データベース340は、前述の第1の実施の形態における話題抽出部110、話題情報整理部120、話題情報データベース130と同様の処理を行う。従って、話題情報データベース340には、図3と同様の内容が蓄積される。
文書データベース更新部350は、話題情報データベース340の話題情報を参照し、文書データベース310に蓄積された文書情報群に関連話題語句情報と関連文書情報を付与し更新する。
図11は、本発明の第2の実施の形態における動作のフローチャートである。
ステップ310) 話題抽出部320は、処理が開始されると、文書データベース410に蓄積されている文書を1文書ずつ読み出し、一般的な話題語句抽出技術による解析を行い、処理時刻での話題を表す話題語句と当該話題語句の語句話題度と当該話題語句を含み、語句話題度の値が高い関連文書情報とが組となった話題語句情報を抽出し、話題情報蓄積部330の話題語句バッファに蓄積する。
この一連の処理は終了信号が送られるまで、予め設定された時間毎に定期的に実行される。
ステップ320) 話題情報蓄積部330は、話題抽出部310によって話題語句バッファに書き込まれた話題情報データから語句話題度が一定数以上のデータを選択し、時間的な連続性をもって整理し、話題情報データベース340に格納する。話題情報データベース340の構成は、前述の第1の実施の形態における図3の構成と同様である。
ステップ330) 文書データベース更新部350は、話題情報データベース340を参照して、文書DB310の文書情報群に話題情報データベース340の話題語句情報(話題語句、語句話題度、話題期間)と、関連文書情報を付与し、文書データベース310を更新する。
ステップ340) データベース検索部360にユーザから検索条件が入力される。ここで検索条件は、例えば、ユーザが検索したい語句であるものとする。
ステップ350) データベース検索部360は、入力された検索条件に基づいて、文書データベース310を検索し、検索された文書情報を表示情報バッファに蓄積する。
ステップ360) 表示画面生成部370において、表示情報バッファに蓄積されている関連文書付文書情報を読み込み、表示画面情報を作成し、表示装置410に出力する。
次に、上記のステップ330の文書データベース更新部350の処理を詳細に説明する。
図12は、本発明の第2の実施の形態における文書データベース更新部の詳細な動作のフローチャートである。
ステップ331) 文書データベース更新部350は、予め設定された一定時間ごとに動作を開始する。処理が開始されると、話題情報データベース340にアクセスし、前回の処理開始時刻以降に更新または追加された話題情報を取得する。取得した話題情報群は、取得話題情報バッファに記録される。
ステップ332) 取得話題情報バッファに未処理のデータがあるかを確認し、未処理のデータがある場合には、ステップ333に移行し、ない場合にはステップ330の処理を終了する。
ステップ333) 未処理のデータがある場合には、取得話題情報バッファからデータを一つ取り出し、当該データを処理話題バッファに移動する。
ステップ334) 文書データベース310から処理話題バッファ中の話題情報の話題期間内に作成時刻が含まれる文書情報を取得する。
ステップ335) 取得した文書情報から、処理話題バッファ中の話題情報の話題語句を含む文書情報を選択し、当該文書情報の関連話題語句情報と関連文書情報とに、話題処理バッファ中の話題情報の話題語句情報とを追加し、文書データベース310を更新する。更新処理が終了したら、ステップ332に移行する。
なお、上記の第1の実施の形態及び第2の実施の形態における動作をプログラムとして構築し、記憶手段に文書データベース、話題情報データベースを有するコンピュータに実行させる、または、ネットワークを介して流通させることも可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、データベースに登録されている文書から処理対象文書に関連する文書を出力する技術に適用可能である。
本発明の原理を説明するための図である。 本発明の第1の実施の形態における関連文書情報付与装置の構成図である。 本発明の第1の実施の形態における話題情報データベースの例である。 本発明の第1の実施の形態における動作のフローチャートである。 本発明の第1の実施の形態における話題抽出部の出力例である。 本発明の第1の実施の形態における出力画面の例である。 本発明の第1の実施の形態における話題語句整理部の詳細な動作のフローチャートである。 本発明の第1の実施の形態における関連情報付与部の詳細な動作のフローチャートである。 本発明の第2の実施の形態における関連文書情報付与装置の構成図である。 本発明の第2の実施の形態における文書データベースの例である。 本発明の第2の実施の形態における動作のフローチャートである。 本発明の第2の実施の形態における文書データベース更新部の詳細な動作のフローチャートである。
符号の説明
100 関連文書情報付与装置
110 話題抽出部
120 話題情報整理部
130 話題情報データベース
140 関連情報付与部
150 表示画面生成部
210 時刻付き文書データベース
230 表示装置
300 関連文書情報付与装置
310 文書データベース
320 話題抽出部
330 話題情報蓄積部
340 話題情報データベース
350 文書データベース更新部
360 データベース検索部
370 表示画面生成部
410 表示装置

Claims (4)

  1. 閲覧対象となる文書情報を入力とし、該文書情報を解析することにより、該文書情報に含まれる話題に関連する文書を表示する関連文書表示方法であって、
    外部から作成時刻情報を含む文書群が入力されると、該文書群を解析して、該文書群中で話題となっている話題語句と、該話題語句の文書群中の出現頻度の時間的な変化である語句話題度、及び該話題語句を含む関連文書情報からなる話題語句情報を取得し、第1の記憶手段に格納する話題抽出ステップと、
    前記話題抽出ステップで得られた前記話題語句情報を時間軸に沿って整理し、話題となっている話題語句と該話題語句が話題になっていた期間と該話題語句に関連する関連文書情報とから構成される話題情報を算出し、第2の記憶手段に格納する話題情報整理ステップと、
    閲覧対象として入力された閲覧文書情報が含んでいる話題語句を前記第2の記憶手段から抽出し、該話題語句に関連する文書情報を、該閲覧文書情報に付与して表示する関連文書情報付与ステップと、
    を行うことを特徴とする関連文書情報表示方法。
  2. 前記関連文書情報付与ステップにおいて、
    前記閲覧文書情報の作成時刻と構成語句を解析し、
    前記話題情報整理ステップにおいて前記第2の記憶手段に格納された話題情報群と比較することにより、前記閲覧文書情報の話題語句を判別し、該話題語句に関連する情報のみを関連文書情報として該閲覧文書情報に付与する、
    請求項1記載の関連文書情報表示方法。
  3. 前記関連文書情報付与ステップの代わりに、
    前記閲覧文書情報が予め与えられている作成時刻情報付き文書群が蓄積された文書情報データベースから選ばれるものとし、
    前記文書情報データベース中の文書情報全てに対し、予め文書内容を解析し、関連文書情報を付与する文書データベース更新ステップと、
    前記文書データベース更新ステップにおいて得られた関連文書情報が付与された文書情報データベースに対する検索条件を外部から取得し、該文書情報データベースを検索することにより得られた関連文書情報付き文書情報を表示するデータベース検索ステップと、
    を行う請求項1記載の関連文書情報表示方法。
  4. 閲覧対象となる文書情報を入力とし、該文書情報を解析することにより、該文書情報に含まれる話題に関連する文書を表示する関連文書表示プログラムであって、
    記憶手段に、少なくとも、文書群中で話題となっている話題語句と、該話題語句の文書群中の出現頻度の時間的な変化である語句話題度、及び該話題語句を含む関連文書情報からなる話題語句情報を格納する第1の記憶手段と、話題語句と該話題語句が話題になっていた期間と該話題語句に関連する関連文書情報とから構成される話題情報を格納する第2の記憶手段とを備えるコンピュータに、
    前記請求項1乃至3記載の方法を実現するための各ステップを実行させることを特徴とする関連文書表示プログラム。
JP2005123786A 2005-04-21 2005-04-21 関連文書表示方法及びプログラム Pending JP2006302024A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005123786A JP2006302024A (ja) 2005-04-21 2005-04-21 関連文書表示方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005123786A JP2006302024A (ja) 2005-04-21 2005-04-21 関連文書表示方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2006302024A true JP2006302024A (ja) 2006-11-02

Family

ID=37470227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005123786A Pending JP2006302024A (ja) 2005-04-21 2005-04-21 関連文書表示方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2006302024A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008276784A (ja) * 2007-05-04 2008-11-13 Nhn Corp キーワード比較を用いた広告評価方法、広告評価システム、記録媒体
JP2009116469A (ja) * 2007-11-02 2009-05-28 Fujitsu Ltd 情報抽出プログラムおよび情報抽出装置
JP2012190142A (ja) * 2011-03-09 2012-10-04 Ntt Docomo Inc 評価装置および評価方法
JP2012247923A (ja) * 2011-05-26 2012-12-13 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法、情報検索装置及び情報検索プログラム
JP2013161329A (ja) * 2012-02-07 2013-08-19 Dainippon Printing Co Ltd サーバ装置、プログラム及び通信システム
JP2015035223A (ja) * 2014-10-14 2015-02-19 富士通株式会社 制御プログラムおよびコンピュータ

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008276784A (ja) * 2007-05-04 2008-11-13 Nhn Corp キーワード比較を用いた広告評価方法、広告評価システム、記録媒体
JP2009116469A (ja) * 2007-11-02 2009-05-28 Fujitsu Ltd 情報抽出プログラムおよび情報抽出装置
JP2012190142A (ja) * 2011-03-09 2012-10-04 Ntt Docomo Inc 評価装置および評価方法
JP2012247923A (ja) * 2011-05-26 2012-12-13 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法、情報検索装置及び情報検索プログラム
JP2013161329A (ja) * 2012-02-07 2013-08-19 Dainippon Printing Co Ltd サーバ装置、プログラム及び通信システム
JP2015035223A (ja) * 2014-10-14 2015-02-19 富士通株式会社 制御プログラムおよびコンピュータ

Similar Documents

Publication Publication Date Title
JP6376569B2 (ja) 検索方法及び検索システム
US9146999B2 (en) Search keyword improvement apparatus, server and method
US8312022B2 (en) Search engine optimization
US8655648B2 (en) Identifying topically-related phrases in a browsing sequence
US8244719B2 (en) Computer method and apparatus providing social preview in tag selection
JP2008158511A (ja) 音声データ検索用webサイトシステム
US20100005092A1 (en) Search result sub-topic identification system and method
KR20090087269A (ko) 컨텍스트 기반 정보 처리 방법 및 장치, 그리고 컴퓨터기록 매체
JP2016126567A (ja) コンテンツ推薦装置、及びプログラム
JP2006302024A (ja) 関連文書表示方法及びプログラム
JP2007140603A (ja) アーリーアダプタ抽出方法及び装置及びプログラム及び話題語予測方法及び装置及びプログラム
KR100455439B1 (ko) 인터넷 자원의 도메인화와 확장 사이트맵을 이용한정보검색 및 브라우징방법
JP4912384B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP4850882B2 (ja) Webページにリンクを挿入する方法
JP2000331020A (ja) 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体
JP4796527B2 (ja) ドキュメント絞り込み検索装置、方法及びプログラム
JP2004362121A (ja) 情報検索装置、携帯情報端末装置、情報検索方法、情報検索プログラム及び記録媒体
CN111405374A (zh) 一种视频进度节点生成方法、装置、设备及存储介质
JP2005301432A (ja) 最新情報提供方法及びシステム及びプログラム
JP2013156876A (ja) 推薦クエリ抽出装置及び方法及びプログラム
JP2000148778A (ja) 情報検索支援方法及び情報検索支援プログラムを記録した記録媒体
KR100914647B1 (ko) 추천 검색어 생성 방법 및 장치
JP4996513B2 (ja) 情報検索装置
JP2004227165A (ja) ドキュメントスコア計算方法及び装置並びにプログラム
JP2007148689A (ja) 操作検索方法及び装置及びコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070815

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100223

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100706

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100906

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110104