JP4379378B2 - コンテンツ出力システム、及び、プログラム - Google Patents

コンテンツ出力システム、及び、プログラム Download PDF

Info

Publication number
JP4379378B2
JP4379378B2 JP2005126560A JP2005126560A JP4379378B2 JP 4379378 B2 JP4379378 B2 JP 4379378B2 JP 2005126560 A JP2005126560 A JP 2005126560A JP 2005126560 A JP2005126560 A JP 2005126560A JP 4379378 B2 JP4379378 B2 JP 4379378B2
Authority
JP
Japan
Prior art keywords
content
feature amount
user
information
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005126560A
Other languages
English (en)
Other versions
JP2006302194A (ja
Inventor
哲 柳
裕二 佐藤
雅俊 小久保
一磨 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2005126560A priority Critical patent/JP4379378B2/ja
Priority to CN200810211813XA priority patent/CN101398848B/zh
Priority to CN2008102118144A priority patent/CN101398849B/zh
Priority to US11/276,272 priority patent/US7912806B2/en
Priority to CN2008102118125A priority patent/CN101398847B/zh
Publication of JP2006302194A publication Critical patent/JP2006302194A/ja
Application granted granted Critical
Publication of JP4379378B2 publication Critical patent/JP4379378B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、ユーザの関心事を推定し、それに対応するコンテンツをユーザに提供する技術に関する。
ユーザインタフェースに対するユーザの入力に基づき、ユーザの関心があると推定されるコンテンツを検索し、そのコンテンツを、モニタ出力してユーザに提供するコンテンツ提供システムが知られている。例えば、マイクロフォンからの入力音声を認識し、この音声から抽出したキーワードに基づいて検索したコンテンツを、モニタ出力するコンテンツ提供システムが知られている(特許文献1参照)。
このコンテンツ提供システムでは、抽出したキーワードにしたがって順にコンテンツを取得して再生を行うが、次のコンテンツを再生しようとした際に先のコンテンツがまだ終了していない場合には、後続の(次の)コンテンツの取得および再生を一定時間保留する。そして、その一定時間の間に先のコンテンツの再生が終了した場合は、それを確認した後に後続のコンテンツの取得を行ってそのコンテンツの再生を行うが、一定時間の間に先のコンテンツの再生が終了しない場合は、後続のコンテンツの取得も再生も行わないようになっている(特許文献1の段落「0037」参照)。また、次のコンテンツを再生しようとした際に先のコンテンツがまだ終了していない場合に、先のコンテンツの再生を打ち切り、後続の(次の)コンテンツの取得および再生を開始する例についても特許文献1には記載されている(特許文献1の段落「0053」参照)。
特開2004−164678号
しかしながら、特許文献1に記載の技術では、コンテンツの再生がユーザの関心事の推移に間に合わないときに、保留分のコンテンツの再生を止めたり、再生中のコンテンツの再生を打ち切るので、ユーザにとって有用なコンテンツの再生が行われなかったり中断されることがあった。
本発明は、こうした問題に鑑みなされたものであり、従来より適切に、ユーザの関心事に合わせて、ユーザの関心事に適合するコンテンツを、ユーザに提供可能な技術を提供することを目的とする。
かかる目的を達成するためになされた本発明のコンテンツ出力システムは、データ取得手段と、抽出手段と、第一特徴量導出手段と、第二特徴量導出手段と、コンテンツ取得手段と、コンテンツ記録手段と、類似度評価手段と、出力手段と、コンテンツ出力制御手段と、を備える。
このコンテンツ出力システムにおけるデータ取得手段は、ユーザインタフェースを備える情報処理装置において、ユーザからユーザインタフェースに入力されたキーワードを含むテキストデータ、及び、ユーザインタフェースからユーザに向けて出力されたキーワードを含むテキストデータの少なくとも一方を、その情報処理装置から取得する。抽出手段は、このデータ取得手段が取得したテキストデータからキーワードを抽出する。
一方、第一特徴量導出手段は、データ取得手段が上記テキストデータを取得する度に、このテキストデータから抽出手段が抽出したキーワードに基づき、このキーワードをユーザの関心事が反映されたキーワードとみなして、当該テキストデータの特徴量であって、現在のユーザの関心事に対応した特徴量を導出する。
また、第二特徴量導出手段は、第一特徴量導出手段によって導出された過去所定期間分の特徴量の推移に応じた補正量を、第一特徴量導出手段により導出された最新の特徴量に作用させて、当該最新の特徴量を補正することで、この補正後の特徴量を、ユーザの主たる関心事に対応した特徴量として導出する。
その他、コンテンツ取得手段は、データ取得手段が情報処理装置から取得した各テキストデータに対応するコンテンツを、コンテンツを保持する装置から取得し、コンテンツ記録手段は、コンテンツ取得手段が取得したコンテンツと、このコンテンツに対応するテキストデータから抽出されたキーワードに基づき第一特徴量導出手段が導出した特徴量と、を関連付けて、記憶手段に記憶させる。
また、類似度評価手段は、記憶手段が記憶する各コンテンツ毎に、当該コンテンツに関連付けて記憶手段が記憶する特徴量と、第二特徴量導出手段が導出した特徴量と、を用いて、当該コンテンツに対応するユーザの関心事と、第二特徴量導出手段が導出した特徴量に対応するユーザの主たる関心事と、の類似度を評価する。
また、出力手段は、記憶手段が記憶する各コンテンツを、ユーザに向けて出力する構成にされ、コンテンツ出力制御手段は、記憶手段が記憶する各コンテンツを、類似度評価手段により類似度が高いと評価されたコンテンツから、優先的に出力手段に出力させる。
このように構成された本発明のコンテンツ出力システムでは、第一特徴量導出手段により導出された最新の特徴量を補正することにより、ユーザの主たる関心事に対応した特徴量を導出して、ユーザの主たる関心事を推定し、このユーザの主たる関心事との類似度を、出力候補の各コンテンツについて、当該コンテンツに関連付けて記憶手段が記憶する特徴量を用いて評価するため、データ取得手段が最近取得したデータに対応するコンテンツの評価値(類似度)が高くなる傾向にあるものの、ユーザの主たる関心事との類似度が高ければ、取得時刻にかかわらず、そのコンテンツがユーザに対して優先的に出力される。従って、本発明によれば、従来のように、出力候補のコンテンツを順に処理するよりも、適切に、ユーザの関心に合わせて、ユーザの関心に適合するコンテンツを、ユーザに提供することができる。
また、このように構成されたコンテンツ出力システムによれば、キーワードを抽出して、ユーザの関心事に対応した特徴量を導出するので、データに示された文章の文脈を解釈するなどして、ユーザの関心事を推定する場合よりも、関心事の推定を簡単に行うことができる。
尚、本発明において、第二特徴量導出手段が第一特徴量導出手段により導出された最新の特徴量を補正して、ユーザの主たる関心事を推定するのは、第一特徴量導出手段により導出されるユーザの関心事に対応する特徴量の揺動が大きく、第一特徴量導出手段により導出された最新の特徴量を用いて、最新の特徴量とコンテンツに関連付けられた当該コンテンツに対応するテキストデータの特徴量との類似度を評価するだけであると、ユーザの関心事の変化に、過敏に反応しすぎて、コンテンツを適切な順番で出力することができない可能性があるためである。
本発明によれば、第一特徴量導出手段により導出された最新の特徴量を、過去所定期間分の特徴量の推移に基づき補正して、ユーザの主たる関心事を推定し、これとの類似度を上述したように評価して、コンテンツの出力優先度を決めるので、ユーザにとって有用度の高いコンテンツを、適切に出力することができる。
ところで、上記コンテンツ出力システムにおけるコンテンツ取得手段は、データ取得手段が情報処理装置から取得したテキストデータ毎に、そのテキストデータから抽出手段が抽出したキーワードに関連するコンテンツを、コンテンツを保持する装置(例えば、ウェブサーバ等)から取得する構成にすることができる
また、上述の発明では、コンテンツの出力に際して、類似度の高いものを優先的に取扱う旨記載したが、コンテンツの取得に際して、類似度の高いものを優先的に取扱うように、コンテンツ出力システムを構成してもよい。
即ち、コンテンツ出力システムは、上記構成のデータ取得手段及び抽出手段及び第一特徴量導出手段を備えると共に、以下に説明するデータ記録手段、第二特徴量導出手段、コンテンツ取得手段、出力手段、類似度評価手段、及び、コンテンツ取得制御手段を備える構成にすることができる
このコンテンツ出力システムにおけるデータ記録手段は、第一特徴量導出手段が導出した特徴量と、当該特徴量の導出に用いられた情報処理装置からの取得データとしてのキーワードとを、関連付けて、記憶手段に記憶させる。
また、第二特徴量導出手段は、第一特徴量導出手段によって導出された過去所定期間分の特徴量の推移に応じた補正量を、第一特徴量導出手段により導出された最新の特徴量に作用させて、当該最新の特徴量を補正することで、この補正後の特徴量を、ユーザの主たる関心事に対応した特徴量として導出する。その他、コンテンツ取得手段は、記憶手段が記憶する情報処理装置からの各取得データに対応するコンテンツを、コンテンツを保持する装置から取得し、出力手段は、このコンテンツ取得手段が取得した各コンテンツを、ユーザに向けて出力する。
一方、類似度評価手段は、記憶手段が記憶する各取得データ毎に、当該取得データに関連付けて記憶手段が記憶する特徴量と、第二特徴量導出手段が導出した特徴量と、を用いて、当該取得データに対応するユーザの関心事と、第二特徴量導出手段が導出した特徴量に対応するユーザの主たる関心事と、の類似度を評価し、コンテンツ取得制御手段は、記憶手段が記憶する各取得データを、類似度評価手段により類似度が高いと評価されたデータから、優先的に処理対象に選択し、選択した処理対象の取得データに対応するコンテンツを優先的に、コンテンツ取得手段に取得させる。
このコンテンツ出力システムでは、上述したように、ユーザの主たる関心事との類似度が高いコンテンツが、情報処理装置からのデータ取得時刻にかかわらず、コンテンツを保持する装置(例えばウェブサーバ等)から優先的に取得され、ユーザに対し出力される。
このように、本発明によれば、有用度の高いコンテンツを優先的に取得するため、コンテンツを取得する際のCPUの負荷、及び、ネットワークの負荷を減少させた上で、適切に、ユーザの関心に適合するコンテンツを取得し、ユーザに提供することができる。
また、このコンテンツ出力システムにおけるコンテンツ取得手段は、記憶手段が記憶する処理対象の取得データに含まれるキーワードに関連するコンテンツを、コンテンツを保持する装置から取得することにより、処理対象の取得データに対応するコンテンツを取得する構成にすることができる。
その他、上述のコンテンツ出力システムにおいては、次のように第一特徴量導出手段を構成すると、ユーザの関心事に対応した特徴量を、簡単且つ適切に導出することができると共に、類似度評価が簡単になり便利である。
即ち、第一特徴量導出手段は、上記特徴量として、テキストデータの特徴ベクトルを導出する構成にされるとよい。具体的には、データ取得手段が上記テキストデータを取得する度に、このテキストデータから抽出手段が抽出した各キーワードを、予め定められた複数のクラスのいずれかに分類して、クラス毎のクラス値をキーワードに基づき求め、これら各クラスのクラス値を要素の値とした特徴ベクトルを導出する構成にされるとよい
このコンテンツ出力システムによれば、ユーザの関心事を、キーワードの種類(クラス)によって、適切に表現することができると共に、特徴ベクトルの内積をとることで、類似度評価手段による類似度評価を簡単且つ適切に行うことができる。また、この結果、一層適切にユーザの関心に合わせて、ユーザの関心に適合するコンテンツを、ユーザに提供することができる。
その他、上述の第二特徴量導出手段は、第一特徴量導出手段により過去所定期間に導出された特徴ベクトルの推移に応じた要素毎の補正量を、第一特徴量導出手段により導出された最新の特徴ベクトルの各要素に作用させて、当該最新の特徴ベクトルを補正することで、この補正後の特徴ベクトルを、ユーザの主たる関心事に対応した特徴量として導出する構成にすることができる。
このように構成されたコンテンツ出力システムでは、特徴量の推移を、ベクトルの各要素の時間的変化にて適切に評価することができ、現在におけるユーザの主たる関心事を適切に推定することができる。
尚具体的に、第二特徴量導出手段は、第一特徴量導出手段により導出された特徴ベクトルにおいて、値が増加した要素の重み付け係数を大きくし、値が減少した要素の重み付け係数を小さくして、第一特徴量導出手段による最新の特徴量を補正する構成にすることができる。このように第二特徴量導出手段を構成すれば、ユーザの主たる関心事を、適切に推定することができる。
また、上述したコンテンツ出力システムにおける各手段としての機能は、プログラムによりコンピュータに実現させることができる。
以下、本発明が適用された実施形態について図面を用いて説明する。尚、本発明の実施の形態は、下記の実施形態に何ら限定されることはなく、本発明の技術的範囲に属する限り種々の形態を採りうる。
[構成等の説明]
図1は、本発明が適用されたコンテンツ提供システム1の構成を表す説明図である。
本実施形態のコンテンツ提供システム1は、インターネット等のWAN(広域ネットワーク)に、各種コンテンツを有するウェブサーバ10、及び、情報検索サーバ装置20等が接続され、そのWANにルータRT等を介して接続されたLAN(ローカルエリアネットワーク)に、パーソナルコンピュータ(以下、「パソコン」と表現する)30、ディジタル電話装置50、及び、情報収集解析装置70、が接続された構成にされている。
(1)情報検索サーバ装置20について
情報検索サーバ装置20は、CPU、ROM、RAM等(図示せず)を備え、各種演算処理を行う制御部21と、ハードディスク装置等で構成される記憶部23と、WANに接続された他の通信装置と通信を行うための通信部25と、を有し、ウェブサーバ10が有する各種コンテンツのリンク情報(URL情報)群からなるデータベースと、各種検索プログラムとを記憶部23に有する。
検索プログラムは、情報検索サーバ装置20が有するウェブサーバソフトウェアの配下にあり、外部の通信装置からアクセスがあると、制御部21により実行される。即ち、情報検索サーバ装置20は、検索プログラムに対するクエリを受信すると、そのクエリが含む検索式に従って、検索式に対応するコンテンツを、検索プログラムを用いて検索し、検索結果として、そのコンテンツのリンク情報(URL情報)を、クエリの送信元に返信する。
(2)パソコン30について
パソコン30は、CPU、ROM、RAM等(図示せず)を備え、各種演算処理を行う制御部31と、ハードディスク装置等で構成される記憶部33と、監視部35と、WANやLANに接続された他の通信装置と通信を行うための通信部37と、ユーザの操作情報を制御部31に伝達し、制御部31の演算結果を、ユーザに伝達するユーザインタフェース40と、を備える。また、パソコン30は、ユーザインタフェース40として、キーボードやポインティングデバイス等からなるユーザが操作可能な入力部41と、各種情報をユーザに向けて表示する表示部43と、を備える。
記憶部33には、ユーザが入力部41を通じて文書を作成したり、表示部43を通じて文書を閲覧したりするためのソフトウェア(アプリケーションソフトウェア)がインストールされており、制御部31は、このソフトウェアを実行することによって、入力部41から入力されるデータに従い、文書ファイル(データファイル)を作成・更新すると共に、その文書ファイルが有するテキストデータ(文字情報)を、表示部43に表示させる。また、入力部41から、文書ファイルの読出指令が入力されると、その文書ファイルが有するテキストデータ(文字情報)を、表示部43に表示させる。
その他、監視部35は、制御部31が実行するソフトウェアを監視し、ソフトウェアが表示部43に出力するデータであって、表示部43がユーザに向けて出力するテキストデータ(表示対象データ)を、上記ソフトウェアから収集し、これを情報収集解析装置70へ通信部37を通じて送信する。図2は、パソコン30の監視部35が実行するパソコン監視処理を表すフローチャートである。
監視部35は、パソコン監視処理を実行すると、S110にて、予め定められたデータ収集対象のソフトウェアの中に、未収集の表示対象データを保持するソフトウェアが存在するか否かを判断し、未収集の表示対象データを保持するソフトウェアが存在しないと判断すると(S110でNo)、未収集の表示対象データが発生するまで待機し、未収集の表示対象データを保持するソフトウェアが存在すると判断すると(S110でYes)、タイマーをリセットする(S120)。
S120での処理を終えると、監視部35は、未収集の表示対象データを有するソフトウェアが、文書作成モード、及び、文書閲覧モードのいずれのモードにあるか否かを判断し(S130)、文書作成モードであると判断すると(S130でYes)、「文書作成」を意味する装置利用情報を生成し(S140)、文書作成モードではない(即ち、文書閲覧モードである)と判断すると(S130でNo)、「文書閲覧」を意味する装置利用情報を生成する(S145)。
尚、ここでいう文書作成モードとは、上記ソフトウェアが、ユーザから入力されたデータに基づいて文書ファイル及び表示内容を逐次更新している状態であることを示し、文書閲覧モードとは、ユーザに向けて、ユーザから指定された文書ファイルが有するテキストデータ(文字情報)を表示している状態であることを示す。本実施形態では、データ収集対象のソフトウェアが、文書作成モード、及び、文書閲覧モードのいずれかの動作モードを、監視部35に通知する構成にされていることとする。
S140又はS145で装置利用情報を生成すると、監視部35は、上記ソフトウェアが、表示対象データとして表示部43に向けて出力するテキストデータであって、上記ソフトウェアから未収集のテキストデータを、そのソフトウェアから取得し、これを送信対象ファイルに書き込む(S150)。尚、この際、監視部35は、単位時間T1(例えば1分)の間に、制御部31が、表示部43に向けて出力する表示対象データであって、未収集のテキストデータを、逐次、送信対象ファイルに書き込むことにより、単位時間T1分のテキストデータを、送信対象ファイルに格納する。
そして、単位時間T1が経過すると(S160でYes)、現在時刻を記したソース生成時刻情報を生成し(S170)、その後、上記生成した単位時間T1分のテキストデータを有する送信対象ファイルと、S170で生成したソース生成時刻情報と、「パソコン」を意味する入力元情報と、S140又はS145で生成した装置利用情報と、を関連付けて、これらを情報収集解析装置70に送信する(S180)。
S180での処理を終えると、監視部35は、制御部31等から終了指令が入力されているか否かを判断し(S190)、終了指令が入力されていないと判断すると(S190でNo)、S110に移行して、次の未収集データが発生するまで待機し、終了指令が入力されていると判断すると(S190でYes)、当該パソコン監視処理を終了する。
(3)ディジタル電話装置50について
説明を図1に戻し、ディジタル電話装置50は、CPU、ROM、RAM等(図示せず)を備え、各種演算処理を行う制御部51と、設定情報等を記憶する記憶部53と、監視部55と、WANやLANに接続された他の通信装置と通信を行うための通信部57と、ユーザの入力を内部装置(制御部51や通信部57)に伝達し、内部装置(制御部51や通信部57)の出力を、ユーザに伝達するユーザインタフェース60と、を備える。
通信部57は、WANを介して外部の電話装置と通信可能な構成(例えばIP(インターネットプロトコル)電話機能を有する構成)にされており、当該ディジタル電話装置50は、ユーザインタフェース60として、ユーザから発せられる声を、音声データに変換して集音するマイクロフォン等からなる音入力部61と、通信部57が外部の電話装置から受信した音声データを再生するスピーカ等からなる音出力部63と、を備える。
また、監視部55は、音入力部61から制御部51を介して通信部57へ入力される音声データ、通信部57から制御部51を介して音出力部63へ入力される音声データを取得し、これらを、単位時間T2分(例えば10秒分)の音声データ毎に、テキストデータに変換して、送信対象ファイルを生成し、これを情報収集解析装置70に送信する構成にされている。図3は、ディジタル電話装置50の監視部55が繰返し実行する電話監視処理を表すフローチャートである。
電話監視処理を実行すると、監視部55は、当該ディジタル電話装置50と他の電話装置との接続がなされるまで待機し、当該ディジタル電話装置50と他の電話装置との接続がなされると(S210でYes)、その接続が、当該ディジタル電話装置50の発呼を原因とするものであるか否かを判断し(S220)、ディジタル電話装置50の発呼を原因とするものであると判断すると、「発呼」を意味する装置利用情報を生成し(S230)、上記接続が、他の電話装置の発呼(ディジタル電話装置50の着呼)を原因とするものであると判断すると、「着呼」を意味する装置利用情報を生成する(S235)。その後、S240に移行する。
S240に移行すると、監視部55は、単位時間T2分の音声データを取得し、取得した音声データをテキストデータに変換して、これを格納した送信対象ファイルを生成する。更に、現在時刻を記したソース生成時刻情報を生成し(S250)、その後、上記生成した送信対象ファイルと、S250で生成したソース生成時刻情報と、「ディジタル電話装置」を意味する入力元情報と、S230又はS235で生成した装置利用情報と、を関連付けて、これらを、情報収集解析装置70に送信する(S260)。
S260での処理を終えると、監視部55は、上記接続が断たれたか否かを判断し、上記接続が断たれていないと判断すると(S270でNo)、S240に移行して、次の時間T2分の音声データをテキストデータに変換し、これを情報収集解析装置70に送信する。また、上記接続が断たれたと判断すると(S270でYes)、当該電話監視処理を一旦終了する。そして、次の接続がなされるまで待機する(S210)。
(4)情報収集解析装置70について
説明を図1に戻し、本実施形態のコンテンツ提供システム1を構成する情報収集解析装置70は、CPU、ROM、RAM等(図示せず)を備え、各種演算処理を行う制御部71と、ハードディスク装置等で構成される記憶部73と、WANやLANに接続された他の通信装置と通信を行うための通信部75と、ウェブサーバ10等から取得したコンテンツをユーザに向けて表示するための表示部77と、コンテンツが、音声データを含む場合に、その音声データを再生して出力する音出力部79と、を備える。
この情報収集解析装置70は、記憶部73に、制御部71が実行する各種プログラムや、そのプログラム実行時に用いられる各種テーブルを備え、各種プログラムを実行することによって、情報検索サーバ装置20にクエリを送信し、クエリに設定した検索キーに対応するWAN上のウェブサーバ10が有するコンテンツを特定する情報(例えばURL)を、情報検索サーバ装置20から検索結果として取得する。また、その検索結果に基づいてウェブサーバ10にアクセスし、ウェブサーバ10が提供するコンテンツを取得して、これを表示・再生する。
図4は、表示部77が表示するコンテンツ提供画面の構成を表す説明図である。コンテンツ提供画面は、テキスト及び画像を表示するための領域であって、新しい情報を、スクロール表示する構成にされたテキスト・画像領域と、動画ファイルの再生結果を表示するための動画再生領域と、用語検索結果を表示するための用語表示領域と、を備える。
情報収集解析装置70は、パソコン30やディジタル電話装置50から受信したファイル(上記送信対象ファイル)に含まれるテキストデータに基づき、クエリを発行し、このコンテンツ提供画面に表示すべきコンテンツを、ウェブサーバ10から取得する。そして、これらを、表示・音出力の形態でユーザに提供する。
以下には、このコンテンツ提供サービスを実現するために、制御部71が実行する各種処理と、その処理実行時に用いられるテーブルの構成について説明する。
(4−1)ソース情報登録処理について
図5は、制御部71が繰返し実行するソース情報登録処理を表すフローチャートである。
ソース情報登録処理を実行すると、制御部71は、パソコン30から、S180(図2参照)で送信されるデータを受信するか、ディジタル電話装置50から、S260(図3参照)で送信されるデータを受信するまで待機し(S310)、受信すると(S310でYes)、その受信データに含まれるファイル(上記送信対象ファイル)を、記憶部73に保存する(S320)。更に、このファイルと共に受信したソース生成時刻情報、入力元情報、及び、装置利用情報と、上記ファイルの名称と、からなるソース情報を生成し、これをソース管理テーブルに登録する(S330)。その後、当該ソース情報登録処理を一旦終了し、次のデータを受信するまで待機する(S310)。
図6に示すように、ソース管理テーブルは、ソース生成時刻情報、入力元情報、装置利用情報、及び、ファイル名称、からなるソース情報を、複数記憶可能な構成になっており、制御部71は、このソース管理テーブルに登録されたソース情報に基づき、受信ファイル(上記送信対象ファイル)を、記憶部73から読み出し、受信ファイルの内容を解析する。
(4−2)キーワード抽出処理について(関心ベクトル算出処理を含む)
図7は、制御部71が、ソース情報登録処理と並列に実行するキーワード抽出処理を表すフローチャートである。
キーワード抽出処理を実行すると、制御部71は、S415の処理について未処理のソース情報がソース管理テーブルに存在するか否かを判断する(S410)。ここで、未処理のソース情報がソース管理テーブルに存在しないと判断すると(S410でNo)、未処理のソース情報がソース情報登録処理によって生成されるまで待機し、未処理のソース情報がソース管理テーブルに存在すると判断すると(S410でYes)、未処理のソース情報に関連付けられたファイルのテキストデータを解析(形態素解析)して、テキストデータ内の名詞を抽出し、更に、予め定められた特定名詞以外の名詞をキーワードとして抽出する(S415)。尚、本実施形態では、コンテンツの検索時にキーワードとして機能しない一般的な名詞が、特定名詞として、記憶部73に記憶されているものとする。
S415での処理を終えると、制御部71は、S420に移行し、関心ベクトル算出処理を実行する。図8は、制御部71が実行する関心ベクトル算出処理を表すフローチャートである。尚、本実施形態では、ユーザの関心事をベクトル表現し、これを用いて、ユーザに提供するコンテンツの出力の優先度を決定する。詳細は、必要に応じて適宜に説明するが、本実施形態でいう「関心ベクトル」とは、ユーザの関心事を数値化したベクトルのことである。具体的に、関心ベクトルVは、予め定められた関心の種類毎に、対応する要素を持つ1行n列のベクトルで表現される。
V=(v1,v2,…,vn)
関心ベクトル算出処理を実行すると、制御部71は、まず初めに、関心ベクトルVを、ゼロにリセットし(S510)、S415(図7参照)で抽出したキーワード群の中から、S530以降の処理について未処理のキーワードを、一つ処理対象に選択し(S520)、選択した処理対象のキーワードを記憶部73が記憶する関心事推定テーブル内で検索する(S530)。尚、図9は、関心事推定テーブルの構成を表す説明図である。
関心事推定テーブルは、予め定められた関心の種類毎に、その関心の種類に属するキーワードと、関心ベクトルの算出時に行う重み付けについての定義情報(重み付け定義情報)と、を有する。
図8に説明を戻し、制御部71は、処理対象のキーワードが、関心事推定テーブルに登録されているキーワードの中に存在する場合、S540にてYesと判断し、関心事推定テーブルに基づいて、処理対象のキーワードが属する関心の種類を判別する(S550)。そして、処理対象のキーワードが属する関心の種類i(i=1,2,…,n)に対応する関心ベクトルVの要素viの値を、1加算する(S560)。その後、S570に移行する。一方、処理対象のキーワードが、関心事推定テーブルに登録されたキーワードではない場合、制御部71は、S540でNo(検索対象なし)と判断し、S570に移行する。
S570に移行すると、制御部71は、S530以降の処理を実行していない未処理のキーワードが、S530で抽出したキーワード群の中に存在するか否かを判断し、未処理のキーワードが存在すると判断すると(S570でYes)、S520に移行し、未処理のキーワードの中から、一つのキーワードを処理対象に選択し、S530以降の処理を実行する。
尚、本実施形態では、S530で抽出したキーワード群の中に、同一のキーワードが複数ある場合において、一のキーワードについてS530以降の処理を実行した場合であっても、他のキーワード(同一のキーワード)を処理済とせず、各キーワード(同一のキーワードの夫々)について、S530以降の処理を実行する。
そして、未処理のキーワードが存在しないと判断すると(S570でNo)、関心事推定テーブルの重み付け定義情報に従い、関心ベクトルVの各要素viの値を、重み付けする(S580)。
関心事推定テーブルの重み付け定義情報は、二種類の定義情報に分類され、第一種の重み付け定義情報は、装置利用情報と、重み付け係数Wとの組合せからなる。これに対し、第二種の重み付け定義情報は、時刻情報と、重み付け係数Wとの組合せからなる。
制御部71は、第一種の重み付け定義情報が設定された関心の種類に対応する関心ベクトルの要素viに対し、S415(図7参照)でキーワードを抽出したファイルに対応するソース情報の装置利用情報と、重み付け定義情報が示す装置利用情報とが一致する場合にのみ、重み付け定義情報に従って、重み付けを行う。
即ち、S580において、制御部71は、S415(図7参照)でキーワードを抽出したファイルに対応するソース情報の装置利用情報と一致する第一種の重み付け定義情報が設定された関心の種類に対応する関心ベクトルの要素viを、重み付けの対象とし、重み付け対象の要素viを、重み付け係数W倍にする。
vi←vi×W
また、制御部71は、第二種の重み付け定義情報が設定された関心の種類に対応する関心ベクトルの要素viに対し、現在時刻が、その重み付け定義情報の時刻情報が示す範囲内にある場合にのみ、重み付け定義情報に従って、重み付けを行う。
即ち、S580において、制御部71は、時刻情報が示す範囲内に現在時刻がある第二種の重み付け定義情報が設定された関心の種類に対応する関心ベクトルの要素viを、重み付けの対象とし、重み付け対象の要素viを、重み付け係数W倍にする。
S580にて、各要素についての重み付けが終了すると、制御部71は、関心ベクトルVの算出を完了して、これを返値として出力し、当該関心ベクトル算出処理を終了する。
説明を図7に戻し、S420で、上述の関心ベクトル算出処理を終了すると、制御部71は、S425に移行し、関心ベクトルVにおいて、最大値をとる要素(即ち、他の要素よりも値の大きい要素)に対応する関心の種類を判別する(S425)。
S425での処理を終えると、記憶部73が記憶する検索情報管理テーブルにおいて、個別検索情報の新規書込領域を確保し(S430)、その領域に、S415でキーワードを抽出したソース情報が有するソース生成時刻情報を書込み(S435)、更に、S420で算出した関心ベクトルを書込み(S440)、更に、S415で抽出したキーワードを検索キーとして書込み(S445)、その検索キーの数を書き込む(S450)。
図10は、検索情報管理テーブルの構成を表す説明図である。図10に示すように、各個別検索情報は、ソース生成時刻情報と、関心ベクトルの値と、検索キーの情報と、検索キーの数の情報と、からなる。
即ち、制御部71は、S430〜S450の処理を実行することによって、検索情報管理テーブルに、S415でキーワードを抽出したソース情報に対応する個別検索情報を登録する。そして、S450の処理を終えると、S455に移行して、終了指令が入力されているか否かを判断し、終了指令が入力されていないと判断すると(S455でNo)、S410に移行して、未処理のソース情報が生成されるまで待機し、終了指令が入力されていると判断すると(S455でYes)、当該キーワード抽出処理を終了する。
(4−3)検索制御処理について
次に、制御部71が、キーワード抽出処理と並列に実行する検索制御処理について説明する。図11は、制御部71が実行する検索制御処理を表すフローチャートである。
検索制御処理を実行すると、まずS610において、S670の処理について未処理の個別検索情報が、検索情報管理テーブル内に存在するか否かを判断し、未処理の個別検索情報が存在すると判断すると(S610でYes)、S630に移行し、未処理の個別検索情報が存在しないと判断すると(S610でNo)、未処理の個別検索情報が生成されるまで待機する。
S630に移行すると、制御部71は、未処理の個別検索情報であって、ソース生成時刻が最新の個別検索情報を処理対象に選択する。また、S630において処理対象の個別検索情報が複数存在する場合は、その中で検索キー数が最大の個別検索情報を、改めて処理対象として選択する(S650)。
S650での処理を終えると、制御部71は、検索プログラム管理テーブルから、クエリ未発行の検索プログラム情報を一つ選択する(S660)。そして、S650で選択した個別検索情報を処理対象に指定し、上記選択した検索プログラム情報についての検索プロセスを起動する(S670)。
尚、図12は、記憶部73が記憶する検索プログラム管理テーブルの構成を表す説明図である。図12に示すように、検索プログラム管理テーブルは、実行対象の検索プログラム毎に、検索プログラムを有する情報検索サーバ装置20のアドレス情報(URL情報)と、クエリの生成方法(検索式の生成方法を含む)を示すクエリ生成情報と、検索プログラムが検索するコンテンツの種類を表すカテゴリ情報と、からなる検索プログラム情報を有する。
つまり、S660において、制御部71は、この検索プログラム管理テーブルが有する検索プログラム情報の内、クエリをアドレス情報に従うURL先の情報検索サーバ装置20に送信していない検索プログラム情報(クエリ未発行の検索プログラム情報)を、処理対象に一つ選択し、S670において、検索プロセスを起動する。尚、起動された検索プロセスは、スケジューラにより管理されて、他のプロセスと並列に実行され、指定された検索プログラム情報が示すクエリ生成情報に基づいてクエリを生成し、これを、検索プログラム情報のアドレス情報が示すURL先の情報検索サーバ装置20に送信する。
S670での処理を終えると、制御部71は、クエリ未発行の検索プログラム情報が、検索プログラム管理テーブルに存在するか否かを判断し(S680)、クエリ未発行の検索プログラム情報が存在すると判断すると(S680でYes)、S660に移行し、クエリ未発行の検索プログラム情報の中から、処理対象の検索プログラム情報を一つ選択し、S670以降の処理を実行する。
一方、クエリ未発行の検索プログラム情報が、検索プログラム管理テーブルに存在しないと判断すると(S680でNo)、終了指令が入力されているか否かを判断し(S690)、終了指令が入力されていないと判断すると(S690でNo)、S610に移行する。一方、終了指令が入力されていると判断すると(S690でYes)、当該検索制御処理を終了する。
(4ー4)検索処理について
次に、制御部71が並列に実行する各検索プロセスにて、実現される検索処理について説明する。図13は、検索処理を表すフローチャートである。
検索処理を実行すると、制御部71は、まず、検索プログラム管理テーブルから、選択された検索プログラム情報を読み出し(S705)、読み出した検索プログラム情報が有するクエリ生成情報と、指定された処理対象の個別検索情報が有する検索キーの一群と、に基づいて、その個別検索情報が有する検索キーを、検索キーに設定した検索式を生成し、これを格納した情報検索サーバ装置20への問合せ信号であるクエリを生成する(S710)。
そして、生成したクエリを、検索プログラム情報が示すURL先に送信して、情報検索サーバ装置20が有する上記URL先の検索プログラムを、情報検索サーバ装置20に実行させる(S715)。この際、情報検索サーバ装置20は、受信したクエリが含む検索式に従って、上記個別検索情報が有する検索キーに対応するコンテンツを検索し、検索結果として、そのコンテンツのリンク情報(URL情報)を格納した応答信号を、情報収集解析装置70に返信する。
制御部71は、S715にてクエリを送信した後、応答信号を情報検索サーバ装置20から受信したか否かを判断し(S720)、応答信号を受信していないと判断すると(S720でNo)、応答信号を受信するまで待機する。
一方、S720で、応答信号を受信したと判断すると(S720でYes)、S725に移行して、応答信号が検索結果であるか、それとも、検索を中断した旨の応答信号であるかを判断し、応答信号が検索結果ではない(検索を中断した旨の応答信号である)と判断すると(S725でNo)、当該検索処理(検索プロセス)を終了する。
一方、応答信号が検索結果であると判断すると(S725でYes)、制御部71は、指定された検索プログラム情報のカテゴリ情報が「用語検索」であるか否かを判断し(S730)、「用語検索」ではなく「一般検索」であると判断すると(S730でNo)、応答信号として受信したリンク情報の一群からなる検索結果から、一般検索用に予め定められた件数分(例えば5件分)のリンク情報(URL情報)を抽出し、リンク情報毎に、対応するリンク情報を記した個別結果情報を生成し(S735)、生成したリンク情報毎の個別結果情報を、記憶部73が記憶する検索結果管理テーブルに登録する(S740)。
尚、個別結果情報は、ソース生成時刻情報と、検索結果を出力した検索プログラムの種類を表すカテゴリ情報と、リンク情報(URL情報)を記したコンテンツ記憶先アドレス情報と、リンク情報の取得原因となった個別検索情報の記憶先情報と、取得有無情報と、取得完了時刻と、出力有無情報と、評価値と、からなる。
図14は、記憶部73が記憶する検索結果管理テーブルの構成を表す説明図である。検索結果管理テーブルは、一つ又は複数の個別結果情報からなる。
制御部71は、S735にて、抽出したリンク情報毎に、上記処理対象の個別検索情報のソース生成時刻情報と、上記カテゴリ情報と、そのリンク情報を記したコンテンツ記憶先アドレス情報と、上記処理対象の個別検索情報の記憶先情報と、「NO」に設定された取得有無情報と、「NULL」に設定された取得完了時刻情報と、「NO」に設定された出力有無情報と、「NULL」に設定された評価値と、を備える個別結果情報を生成し、各個別結果情報を検索結果管理テーブルに登録する(S740)。また、S740での処理を終えると、当該検索処理(検索プロセス)を終了する。
一方、S730にて、上記指定された検索プログラム情報のカテゴリ情報が「用語検索」であると判断すると(S730でYes)、制御部71は、応答信号として受信したリンク情報の一群からなる検索結果から、用語検索用に予め定められた件数分(例えば1件分)のリンク情報(URL情報)を抽出し、そのリンク情報を記した個別結果情報(上述したものと同様のもの)を生成し(S745)、生成した個別結果情報を、記憶部73が記憶する検索結果管理テーブルに登録する(S750)。そして、S750での処理を終えると、当該検索処理(検索プロセス)を終了する。
(4−5)検索結果評価処理について(読出処理およびカレント関心テーブル更新処理を含む)
次に、制御部71が、検索制御処理と並列に実行する検索結果評価処理について説明する。図15は、制御部71が実行する検索結果評価処理を表すフローチャートである。
検索結果評価処理を実行すると、制御部71は、まず、S820以降の処理について、未処理の個別結果情報が、検索結果管理テーブル内に存在するか否かを判断し(S810)、未処理の個別結果情報が存在すると判断すると(S810でYes)、S820に移行し、未処理の個別結果情報が存在しないと判断すると(S810でNo)、未処理の個別結果情報が、検索結果管理テーブル内に登録されるまで待機する。
S820に移行すると、制御部71は、未処理の個別結果情報を処理対象に選択し、S820での処理を終えるとS830に移行し、読出処理を実行する。図16は、制御部71が実行する読出処理を表すフローチャートである。
読出処理を実行すると、制御部71は、まず、タイマーをリセットする(S905)。その後、検索結果管理テーブルから、指定された処理対象の個別結果情報が有するコンテンツ記憶先アドレス情報を読み出し(S710)、読み出したコンテンツ記憶先アドレス情報が示すURL先に、コンテンツの要求信号を送信する(S915)。
制御部71は、S915にて要求信号を送信した後、タイマーの値に基づき、予め定められた処理制限時間が経過したか否かを判断し(S920)、処理制限時間が経過していないと判断すると(S920でNo)、S930に移行する。一方、処理制限時間が経過していると判断すると(S920でYes)、S925にてセッションを閉じ(通信を終了し)、当該読出処理(読出プロセス)を終了する。
S930に移行すると、制御部71は、S915で送信した要求信号に対する応答信号の受信が完了したか否かを判断し、応答信号の受信が完了していないと判断すると(S930でNo)、S920に移行する。一方、S930で応答信号の受信が完了したと判断すると(S930でYes)、制御部71は、応答信号が要求したコンテンツであるか、それとも、エラー情報であるのかを判断し(S940)、応答信号がコンテンツではない(エラー情報である)と判断すると(S940でNo)、当該読出処理(読出プロセス)を終了する。
一方、応答信号がコンテンツであると判断すると(S940でYes)、そのコンテンツを、記憶部73に保存し(S945)、その後、処理対象の個別結果情報が有するコンテンツ記憶先アドレス情報を、コンテンツの保存先を表すURL情報に変更して、検索結果管理テーブル(個別結果情報)を更新する(S950)。その後、当該読出処理(読出プロセス)を終了する。
説明を図15に戻し、読出処理を終えると、制御部71は、S840に移行し、S830における読出処理において、正常にコンテンツを読み出すことができたか否かを判断する。この判断は、S950(図16参照)を経て読出処理を終えたか否かで判断する(S950を経て読出処理を終えた場合は正常にコンテンツを読み出すことができたと判断し、S950を経ずに読出処理を終えた場合は正常にコンテンツを読み出すことができなかったと判断する)。
S840において、S830における読出処理において正常にコンテンツを読み出すことができたと判断すると(S840でYes)、S845に移行する。一方、S830における読出処理において正常にコンテンツを読み出すことができなかったと判断すると(S840でNo)、終了指令が入力されているか否かを判断し(S880)、終了指令が入力されていないと判断すると(S880でNo)、S810に移行する。一方、終了指令が入力されていると判断すると(S880でYes)、当該検索結果評価処理を終了する。
また、S845に移行すると、制御部71は、S830における読出処理において正常に読み出すことができたコンテンツに対応する個別結果情報の取得有無情報を「YES」に更新すると共に取得完了時刻情報の領域に現在時刻を書き込む。その後、S850に移行して、カレント関心テーブル更新処理を実行する。図17は、制御部71が実行するカレント関心テーブル更新処理を表すフローチャートである。
カレント関心テーブル更新処理を実行すると、制御部71は、検索情報管理テーブルにおいてソース生成時刻が最も新しい個別検索情報の関心ベクトルを読み出す(S961)。尚、ソース情報が次々と生成されている期間には、このS961の処理において、毎回、異なる最新の個別検索情報の関心ベクトルを読み出すことになるが、ソース情報の生成が途切れている期間には、このS961の処理において、上記途切れる直前に生成されたソース情報に対応する個別検索情報の関心ベクトルが繰返し読み出されることになる。
S961での処理を終えると、制御部71は、記憶部73が有する関心履歴テーブルに、履歴情報(登録時刻情報と累積関心ベクトルからなる情報)が登録されているか否かを判断する(S963)。尚、図18(a)は、記憶部73が有する関心履歴テーブルの構成を表す説明図である。関心履歴テーブルは、予め定められた最大数(本実施形態では3個)までの履歴情報を記憶可能な構成にされている。
具体的に、S963では、関心履歴テーブルに一つの履歴情報も登録されていない場合、Noと判断して、S965に移行し、一つでも履歴情報が関心履歴テーブルに登録されている場合、Yesと判断して、S971に移行する。
S965に移行すると、制御部71は、現在時刻を登録時刻とし、S961で読み出したソース生成時刻が最も新しい個別検索情報の関心ベクトルを、累積関心ベクトルとして履歴情報を生成し、これを関心履歴テーブルに登録する。その後、現在時刻を更新時刻とし、S961で読み出した上記個別検索情報の関心ベクトルを、カレント関心ベクトルVcとして、これらをカレント関心テーブルに登録する(S977)。その後、当該カレント関心テーブル更新処理を終了する。
尚、図18(b)は、記憶部73が有するカレント関心テーブルの構成を表す説明図である。カレント関心テーブルは、1レコードのみから構成されるテーブルであり、レコードの更新時刻を示す更新時刻情報と、現在のユーザの主たる関心事を表す関心ベクトルとして取扱われるカレント関心ベクトルVcと、を関連付けて記憶する。
また、S963でYesと判断して、S971に移行すると、制御部71は、関心履歴テーブルに登録されている登録時刻が最新の履歴情報に記された累積関心ベクトルに、S961で読み出した個別検索情報の関心ベクトルを加算して、新規に、累積関心ベクトルを生成する。
そして、関心履歴テーブルに登録されている履歴情報が最大数(3個)未満である場合には、S973でYesと判断し、この新規に生成した累積関心ベクトルを、関心履歴テーブルに登録する(S975)。具体的には、S971で生成した累積関心ベクトルと、現在時刻を記した登録時刻情報とからなる履歴情報を生成し、これを、関心履歴テーブルに登録する(S975)。また、この処理(S975)を終えると、現在時刻を更新時刻とし、S961で読み出した上記個別検索情報の関心ベクトルを、カレント関心ベクトルVcとして、これらをカレント関心テーブルに登録し(S977)、その後、当該カレント関心テーブル更新処理を終了する。
一方、関心履歴テーブルに登録されている履歴情報が最大値(3個)であると判断すると(S973でNo)、関心履歴テーブルに登録されている履歴情報の中から、登録時刻の最も古い履歴情報を削除対象に選択し、これを関心履歴テーブルから削除する(S981)。また、S971で生成した累積関心ベクトルと、現在時刻を記した登録時刻情報とからなる履歴情報を生成し、これを、関心履歴テーブルに登録する(S983)。
その後、関心履歴テーブルの履歴情報を、登録時刻の新しい順にソート(並び替え)して、関心履歴テーブルを更新する(S985)。
また、S985での処理を終えると、S987に移行し、推移係数K=(k1,k2,…,kn)を算出する。具体的に、推移係数Kは、図18(a)に示すように、次式に従って求められる。
K=((v11−v12)/(v12−v13),(v21−v22)/(v22−v23),…,(vn1−vn2)/(vn2−vn3))
但し、ここでは、関心履歴テーブルに登録されている履歴情報のうち、最も登録時刻が新しい履歴情報の累積関心ベクトルを、(v11,v21,…,vn1)と表現する。また、関心履歴テーブルに登録されている履歴情報のうち、2番目に登録時刻が新しい履歴情報の累積関心ベクトルを、(v12,v22,…,vn2)と表現する。そして、関心履歴テーブルに登録されている履歴情報のうち、3番目に登録時刻が新しい(換言すると、最も登録時刻が古い)履歴情報の累積関心ベクトルを、(v13,v23,…,vn3)と表現する。
このようにして、S987で推移係数Kを算出し終えると、制御部71は、S989に移行し、S961で読み出した個別検索情報の関心ベクトルV=(v1,v2,…,vn)に、算出した推移係数K=(k1,k2,…,kn)を、要素毎に乗算して、カレント関心ベクトルVcを算出する。
Vc=(k1・v1,k2・v2,…,kn・vn)
そして、このカレント関心ベクトルVcを、カレント関心テーブルに登録する(S990)。尚、この際には、現在時刻を更新時刻として、カレント関心ベクトルVcを登録する。このようにして、カレント関心テーブル内のカレント関心ベクトルを更新すると、制御部71は、当該カレント関心テーブル更新処理を終了する。
説明を図15に戻し、カレント関心テーブル更新処理を終えると、制御部71は、S860に移行し、S820で選択した個別結果情報に基づき、この個別結果情報に上記記憶先情報にて関連付けられた個別検索情報の関心ベクトルVと、カレント関心テーブルの関心ベクトルVcとの内積を計算し、これを評価値として、検索結果管理テーブルにおけるS820で選択した個別結果情報の評価値の領域に書き込む。尚、この内積計算は、以下のようにして行う。
まず、個別検索情報の関心ベクトルVを、関心ベクトルVのノルム||V||で除算することにより、関心ベクトルVについての正規ベクトルE(単位ベクトルともいう)を算出する。
E=V/||V||
また、カレント関心ベクトルVcを、カレント関心ベクトルVのノルム||Vc||で除算することにより、カレント関心ベクトルVcについての正規ベクトルEcを算出する。
Ec=Vc/||Vc||
その後、関心ベクトルVについての正規ベクトルEと、カレント関心ベクトルVcについての正規ベクトルEcとの内積Rを算出する。
R=E・Ec
これによって内積を計算し、検索結果管理テーブルにおける上記処理対象の個別結果情報を更新する。
また、S860での処理を終えると、制御部71は、S870に移行し、S860で書き込んだ評価値が閾値未満であったものについてのみ、再度、当該個別結果情報の評価値の領域に0を書き込む。ここで言う閾値というのは、実験やユーザの好み等によって定められるべきものであり、この閾値を調整することにより、コンテンツの出力有無の判断具合を調整することができる。
そして、S870での処理を終えると、終了指令が入力されているか否かを判断し(S880)、終了指令が入力されていないと判断すると(S880でNo)、S810に移行する。一方、終了指令が入力されていると判断すると(S880でYes)、当該検索結果評価処理を終了する。
(4−6)出力処理について(表示制御処理を含む)
次に、制御部71が検索結果評価処理等と並列に実行する出力処理について説明する。図19は、制御部71が実行する出力処理を表すフローチャートである。
出力処理を実行すると、制御部71は、記憶部73に保存されたコンテンツの内、未出力のコンテンツが存在するか否かを判断する(S1010)。記憶部73に未出力のコンテンツが存在するか否かの判断は、検索結果管理テーブルにおける取得有無情報と出力有無情報と、に基づいて行う。具体的には、取得有無情報が「YES」であり、かつ、出力有無情報が「NO」である個別結果情報が検索結果管理テーブルに登録されている場合、この個別結果情報に対応するコンテンツを未出力のコンテンツと判断し、未出力のコンテンツが記憶部73に存在すると判断する。
このようにして判断した結果、未出力のコンテンツが記憶部73に存在しないと判断すると(S1010でNo)、制御部71は、未出力のコンテンツが発生するまで待機し、未出力のコンテンツが存在すると判断すると(S1010でYes)、未出力のコンテンツのうち対応する個別結果情報の評価値が最大のコンテンツを一つ、処理対象として選択する(S1015)。しかし、その最大値が0より大きくない場合には(S1020でNo)、その選択したコンテンツに対応する個別結果情報の出力有無情報を「YES」に更新してS1010に移行する。一方、最大値が0より大きい場合には(S1020でYes)、そのコンテンツに対応する個別結果情報に基づき、処理対象のコンテンツが用語検索結果であるか否かを判断する(S1025)。
具体的には、例えば、コンテンツに対応する個別結果情報が示すカテゴリ情報が「用語検索」であるか否かを判断することにより、処理対象のコンテンツが、用語検索結果であるか否かを判断する。その他、コンテンツを解析して、処理対象のコンテンツが用語検索結果であるか否かを判断してもよい。
S1025で、コンテンツが用語検索結果であると判断すると(S1025でYes)、制御部71は、コンテンツを、表示部77のコンテンツ提供画面における用語表示領域に表示し(S1030)、その後S1060に移行する。一方、S1025で、コンテンツが用語検索結果ではないと判断すると、S1035に移行して、処理対象のコンテンツが動画ファイルであるか否かを判断し、処理対象のコンテンツが動画ファイルであると判断すると(S1035でYes)、処理対象のコンテンツと、コンテンツを取得する元となったソース情報が示すソース生成時刻情報と、を関連付けて動画再生データキューへ登録する。その後、S1060に移行する。
尚、本実施形態の情報収集解析装置70では、制御部71が、動画再生データキューとしての機能と、動画再生データキューに登録されたコンテンツ(動画ファイル)を再生する機能と、を有する。図21(a)は、制御部71にて実現される動画再生データキューと、制御部71にて実行される動画再生領域表示制御プロセスと、を示した説明図である。
動画再生領域表示制御プロセスは、動画再生データキューに登録されたコンテンツを、登録された順に再生処理して、コンテンツ提供画面における動画再生領域に動画を出力し、音声を音出力部79に出力する。
説明を図19に戻し、S1035で、処理対象のコンテンツが動画ファイルではないと判断すると(S1035でNo)、S1045に移行し、処理対象のコンテンツが、音声ファイルであるか否かを判断する。そして、音声ファイルであると判断すると(S1045でYes)、そのコンテンツ(音声ファイル)を再生処理し、音出力部79に、コンテンツを音出力させる(S1050)。その後、S1060に移行する。
尚、S1050の実行時に、過去に再生を開始した音声ファイルの再生処理が継続中である場合には、その音声ファイルの再生処理を中断して、上記処理対象のコンテンツ(音声ファイル)を再生処理する。その他、動画再生領域表示制御プロセスにより、音声を伴う動画が再生されている場合には、その音出力に代えて、当該コンテンツ(音声ファイル)の音出力を、音出力部79に実行させる。
また、処理対象のコンテンツが音声ファイルではないと判断すると(S1045でNo)、S1055に移行して、制御部71は表示制御処理を実行する。図20は、制御部71が実行する表示制御処理を表すフローチャートである。
表示制御処理を実行すると、制御部71は、現在、テキスト・画像領域の表示データキューに入っているコンテンツの評価値の合計に占める、現在処理対象としているコンテンツ(図19のS1015で選択したコンテンツ)の評価値の割合を求め、その割合を重みとする(S1110)。
S1110での処理を終えると、現在処理対象としているコンテンツの表示文字の大きさを20pt*重みとし(S1115)、テキスト・画像領域に占める当該コンテンツの表示領域の縦サイズを200mm*重みとし(S1120)、当該コンテンツの表示文字の濃度を、標準文字*(0.5+重み)というように計算して決定する(S1125)。
そして、S1130に移行すると、重みが0.5より大きいか否かを判断し、重みが0.5より大きいと判断すると(S1130でYes)、当該コンテンツの表示インデントを表示領域の左端から0mmとし(S1135)、表示文字も太文字とする(S1140)。そして、S1165に移行する。
一方、重みが0.5より大きくないと判断すると(S1130でNo)、重みが0.2より小さいか否かを判断し(S1145)、重みが0.2より小さいと判断すると(S1145でYes)、当該コンテンツの表示インデントを表示領域の左端から20mmとし(S1155)、画像情報を表示対象から削除する(S1160)。そして、S1165に移行する。
また、重みが0.2より小さくないと判断すると(S1145でNo)、当該コンテンツの表示インデントを表示領域の左端から10mmとし(S1150)、S1165に移行する。
S1165に移行すると、制御部71は、表示データキューに、このコンテンツと、コンテンツを取得する元となったソース情報が示すソース生成時刻情報と、を関連付けて登録する。その後、当該表示制御処理を終了する。
尚、本実施形態の情報収集解析装置70では、制御部71が、表示データキューとしての機能と、表示データキューに登録されたコンテンツ(ウェブページ等の文字・画像情報)を表示する機能と、を有する。図21(b)は、制御部71にて実現される表示データキューと、制御部71にて実行されるテキスト・画像領域表示制御プロセスと、を示した説明図である。テキスト・画像領域表示制御プロセスは、表示データキューに登録されたコンテンツを、登録された順に、表示処理して、コンテンツ提供画面におけるテキスト・画像領域に表示する。
説明を図19に戻し、S1055における表示制御処理を終えると、制御部71は、S1060に移行し、処理対象のコンテンツに対応する個別結果情報の出力有無情報を、「YES」に更新し、その後、S1065に移行して、ソース生成時刻と現在時刻との差分が、所定時間を超過しているコンテンツを、動画再生データキュー及び表示データキューから削除する。
その後、終了指令が入力されているか否かを判断し(S1070)、終了指令が入力されていないと判断すると(S1070でNo)、S1010に移行し、終了指令が入力されていると判断すると(S1070でYes)、当該出力処理を終了する。
但し、この出力処理では、S1015で評価値が最大のコンテンツを優先的に処理対象に選択することによって、本発明特有の効果が発揮されるので、未出力コンテンツの発生スピード(読出処理の実行周期)に対して、S1015の実行周期が早すぎると、評価値が最大のコンテンツを処理対象に選択する動作が意味をなさなくなってしまう。従って、本実施形態の出力処理では、S1070でNoと判断した場合には、未出力コンテンツの発生スピード(読出処理の実行周期)よりも十分に遅く設定された所定周期の移行タイミングが到来するまで、S1010に移行することなく待機し、上記移行タイミングが到来した後に、S1010に移行して、未出力コンテンツが存在するか否か判断する。
(5)本実施形態の効果
このように構成された本実施形態のコンテンツ提供システム1によれば、情報収集解析装置70が、ソース情報登録処理により、パソコン30において、表示部43に表示される表示対象データ(ユーザから入力部41に入力されたデータであって表示部43に表示されるデータを含む)を、パソコン30から取得すると共に、ディジタル電話装置50において、ユーザから音入力部61に入力されたデータ及び音出力部63からユーザに向けて出力されたデータを、ディジタル電話装置50から取得する(データ取得手段)。
また、ソース情報が登録されると、S415にて、そのソース情報毎に、ソース情報に関連付けられた受信ファイルからキーワードを抽出し(抽出手段)、各キーワード毎に、そのキーワードが関心事推定テーブルに登録されているものである場合、この関心事推定テーブルに従って、キーワードのクラス(関心の種類)を判別し(S550)、判別したクラスの要素(クラス値)を1加算して、ユーザの関心事を数値化し、関心ベクトルを求める(第一特徴量導出手段)。
その他、情報収集解析装置70は、カレント関心テーブル更新処理を実行する度に、その時点で最新の関心ベクトルを、過去の関心ベクトルに加算して、累積関心ベクトルを生成し、これと、過去の累積関心ベクトルとに基づき、過去所定期間(2回分)の関心ベクトルの推移を評価して、推移係数Kを算出し、これを最新の関心ベクトルに作用させて、最新の関心ベクトルを補正する。これによって、現在におけるユーザの主たる関心事を、カレント関心ベクトルとして求める(第二特徴量導出手段)。
尚、本実施形態では、推移係数Kを、最新の関心ベクトルに作用させることによって、最近、高まりつつある関心の種類に対応する要素の値を増幅し、静まりつつある関心の種類に対応する要素の値を減少させ、現在におけるユーザの主たる関心事をカレント関心ベクトルに表す。
また、本実施形態では、ソース生成時刻が最新の個別検索情報に基づき、この個別検索情報に示された検索キーに対応するコンテンツを検索して、検索結果が得られた順に、その検索結果(個別結果情報)に基づき、S830にて、コンテンツを取得し(コンテンツ取得手段)、これを記憶部73に保存する。また、この際、検索結果管理テーブルにおいて、コンテンツの保存先を、コンテンツ記憶先アドレス情報に記すことによって、コンテンツと、個別検索情報の関心ベクトルとを、関連付けて記憶部73に記憶させる(コンテンツ記録手段)。
その他、情報収集解析装置70は、S860の処理を、コンテンツを取得する度に繰返し実行することによって、記憶部73に記憶した各コンテンツについて、それに対応する関心ベクトルと、カレント関心ベクトルとの内積をとり、各コンテンツに対応するユーザの関心事と、ユーザの主たる関心事との類似度を評価する(類似度評価手段)。
また、記憶部73が記憶する各コンテンツを、上記類似度が高いと評価されたコンテンツ(評価値の高いコンテンツ)から、優先的に出力対象に選択して(S1015)、これをコンテンツ提供画面等からユーザに向けて出力する(コンテンツ出力制御手段)。
このように、本実施形態のコンテンツ提供システム1では、コンテンツを取得した後にそのコンテンツに対する現時点のユーザの関心度を評価し、関心度が高ければ、ソース生成時刻にかかわらず、そのコンテンツを、ユーザに対して優先的に出力するので、従来のように、出力候補のコンテンツを順に処理するよりも、適切に、ユーザの関心に合わせて、ユーザの関心に適合するコンテンツを、ユーザに提供することができる。
特に、本実施形態では、現時点のユーザの主たる関心事を推定して、コンテンツに対する関心度を評価し、出力優先度を決定するので、ユーザにとって有用度の高いコンテンツを、適切に出力することができる。
また、本実施形態では、パソコン30及びディジタル電話装置50から得られたテキストデータからキーワードを抽出して、ユーザの関心事を推定し、関心ベクトルを算出するので、データに示された文章の文脈を解釈するなどして、ユーザの関心事を推定する場合よりも、関心事の推定を簡単に行うことができる。また、関心事をベクトル表現するので、内積をとることで、適切に、複数の関心事(関心ベクトル)の類似度を評価することができ、ユーザの関心に適合するコンテンツを、適切にユーザに提供することができる。
また、本実施形態によれば、コンテンツを出力する際、上記評価結果が0以下のものを出力しないため(S1020でNo)、出力されるコンテンツがユーザの関心に比較的合致したもの(つまり価値が高いもの)のみとなり、ユーザにとって価値の低いコンテンツが出力されることを防止できる。
尚、上記実施形態では、コンテンツを検索する際には、ソース生成時刻が最も新しい検索キーから処理し、検索結果に対応する各コンテンツを、検索結果の発生順に取得し、取得したコンテンツを、ユーザの現在における主たる関心事に近いものから、優先的に出力するようにしたが、ユーザの現在における主たる関心事に近いコンテンツから、優先的に検索することで、コンテンツの取得を、ユーザの現在における主たる関心事に近いものから優先的に行うように、情報収集解析装置70を構成してもよい。
[他の実施形態]
以下には、上述したように、ユーザの現在における主たる関心事に近いコンテンツから、優先的に検索して取得する情報収集解析装置70の構成について説明する。尚、この情報収集解析装置70は、図11に示す検索制御処理に代えて、図22に示す検索制御処理を実行し、図10に示す検索情報管理テーブルに代えて、図23に示す検索情報管理テーブルを用い、図13に示す検索処理に代えて、図24に示す検索処理を実行し、図15に示す検索結果評価処理に代えて、図25に示す読出制御処理を実行するように、上記実施形態の情報収集解析装置70を構成すれば、完成するので、以下では、図22〜図25を用いて、上記実施形態と異なる構成についての説明するに留める。
(1)検索制御処理について
本実施形態では、制御部71が、図11に示す検索制御処理に代えて、図22に示す検索制御処理を実行する。図22は、制御部71が実行する検索制御処理を表すフローチャートである。
図22に示す検索制御処理を実行すると、制御部71は、まず、S1270の処理について未処理の個別検索情報が、検索情報管理テーブル内に存在するか否かを判断し(S1210)、未処理の個別検索情報が存在しないと判断すると(S1210でNo)、未処理の個別検索情報が生成されるまで待機し、未処理の個別検索情報が存在すると判断すると(S1210でYes)、1220に移行して、図17に示すカレント関心テーブル更新処理を実行する。カレント関心テーブル更新処理の内容については、上述した通りである。
S1220でカレント関心テーブル更新処理を終了すると、制御部71は、S1270の処理について未処理の個別検索情報であって、その関心ベクトルと、カレント関心テーブルに登録されているカレント関心ベクトルとの内積Rが最大の個別検索情報を、処理対象に選択する(S1230)。
尚具体的に、S1230では、S1270の処理について未処理の各個別検索情報の関心ベクトルVの正規(単位)ベクトルEを、算出すると共に、カレント関心テーブルに登録されているカレント関心ベクトルVcの正規(単位)ベクトルEcを算出し、各ベクトルEと、ベクトルEcとの内積Rをとって、値Rが最大となったベクトルEに対応する個別検索情報を、処理対象に選択する。
その後、制御部71は、S1235に移行し、S1230で処理対象に選択した個別検索情報の中から、ソース生成時刻が最新の個別検索情報を、改めて処理対象に選択する。尚、ここでの処理は、S1230で値Rが最大となった個別検索情報が複数ある場合に、意味のある処理となる。
また、S1235での処理を終えると、制御部71は、S1240に移行し、S1235で処理対象に選択した個別検索情報の中から、検索キーが最大の個別検索情報を一つ、改めて、処理対象に選択する(S1240)。尚、ここでの処理は、S1235でソース生成時刻が同一の個別検索情報が複数選択された場合に、意味のある処理となる。
S1240での処理を終えると、制御部71は、S1240で選択された処理対象の個別検索情報の評価値として、S1230で算出した最大の内積Rを、検索情報管理テーブルに書き込む(S1250)。尚、本実施形態では、検索情報管理テーブルが、ソース生成時刻情報と、関心ベクトルと、検索キーの情報と、検索キーの数の情報と、評価値の情報と、からなる個別検索情報を記憶可能な構成にされているものとする。
図23は、本実施形態の検索情報管理テーブルの構成を表す説明図である。各個別検索情報における評価値の情報は、初期段階でNULLに設定され、S1250の処理によって、内積値Rに書き換えられる。
S1250での処理を終えると、制御部71は、検索プログラム管理テーブルから、クエリ未発行の検索プログラム情報を一つ選択する(S1260)。そして、S1240で選択した個別検索情報を処理対象に指定し、上記選択した検索プログラム情報についての検索プロセスを起動する(S1270)。
つまり、S1260において、制御部71は、図12に示す検索プログラム管理テーブルが有する検索プログラム情報の内、クエリをアドレス情報に従うURL先の情報検索サーバ装置20に送信していない検索プログラム情報(クエリ未発行の検索プログラム情報)を、処理対象に一つ選択し、S1270において、検索プロセスを起動する。尚、起動された検索プロセスは、スケジューラにより管理されて、他のプロセスと並列に実行され、図24に示すように、指定された検索プログラム情報が示すクエリ生成情報に基づいてクエリを生成し、これを、検索プログラム情報のアドレス情報が示すURL先の情報検索サーバ装置20に送信する。
S1270での処理を終えると、制御部71は、クエリ未発行の検索プログラム情報が、検索プログラム管理テーブルに存在するか否かを判断し(S1280)、クエリ未発行の検索プログラム情報が存在すると判断すると(S1280でYes)、S1260に移行し、クエリ未発行の検索プログラム情報の中から、処理対象の検索プログラム情報を一つ選択し、S1270以降の処理を実行する。
一方、クエリ未発行の検索プログラム情報が、検索プログラム管理テーブルに存在しないと判断すると(S1280でNo)、制御部71は、終了指令が入力されているか否かを判断し(S1290)、終了指令が入力されていないと判断すると(S1290でNo)、S1210に移行する。一方、終了指令が入力されていると判断すると(S1290でYes)、当該検索制御処理を終了する。
但し、この検索制御処理では、S1230で評価値が最大の個別検索情報を優先的に処理対象に選択することによって、本発明特有の効果が発揮されるので、個別検索情報の生成スピードに対して、S1230の実行周期が早すぎると、評価値が最大の個別検索情報を処理対象に選択する動作が意味をなさなくなってしまう。従って、本実施形態の検索制御処理では、S1290でNoと判断した場合、個別検索情報の生成スピードよりも十分に遅く設定された所定周期の移行タイミングが到来するまで、S1210に移行することなく待機し、上記移行タイミングが到来した後に、S1210に移行する。
(2)検索処理について
次に、本実施形態の制御部71が並列に実行する各検索プロセスにて、実現される検索処理について説明する。図24は、検索処理を表すフローチャートである。
図24に示す検索処理を実行すると、制御部71は、まず、検索プログラム管理テーブルから、選択された検索プログラム情報を読み出し(S1305)、読み出した検索プログラム情報が有するクエリ生成情報と、指定された処理対象の個別検索情報が有する検索キーの一群と、に基づいて、その個別検索情報が有する検索キーを、検索キーに設定した検索式を生成し、これを格納した情報検索サーバ装置20への問合せ信号であるクエリを生成する(S1310)。
そして、生成したクエリを、検索プログラム情報が示すURL先に送信して、情報検索サーバ装置20が有する上記URL先の検索プログラムを、情報検索サーバ装置20に実行させる(S1315)。この際、情報検索サーバ装置20は、受信したクエリが含む検索式に従って、上記個別検索情報が有する検索キーに対応するコンテンツを検索し、検索結果として、そのコンテンツのリンク情報(URL情報)を格納した応答信号を、情報収集解析装置70に返信する。
制御部71は、S1315にてクエリを送信した後、応答信号を情報検索サーバ装置20から受信したか否かを判断し(S1320)、応答信号を受信していないと判断すると(S1320でNo)、応答信号を受信するまで待機する。
一方、S1320で、応答信号を受信したと判断すると(S1320でYes)、S1325に移行して、応答信号が検索結果であるか、それとも、検索を中断した旨の応答信号であるかを判断し、応答信号が検索結果ではない(検索を中断した旨の応答信号である)と判断すると(S1325でNo)、当該検索処理(検索プロセス)を終了する。
これに対し、応答信号が検索結果であると判断すると(S1325でYes)、指定された検索プログラム情報のカテゴリ情報が「用語検索」であるか否かを判断し(S1330)、「用語検索」ではなく「一般検索」であると判断すると(S1330でNo)、応答信号として受信したリンク情報の一群からなる検索結果から、一般検索用に予め定められた件数分(例えば5件分)のリンク情報(URL情報)を抽出し、リンク情報毎に、対応するリンク情報を記した個別結果情報を生成し(S1335)、生成したリンク情報毎の個別結果情報を、記憶部73が記憶する検索結果管理テーブルに登録する(S1340)。
また、S1340での処理を終えると、S1360に移行し、今回、検索結果管理テーブルに登録した各個別結果情報の評価値の欄に、上記指定された処理対象の個別検索情報が示す評価値を、書き込んで、検索結果管理テーブルを更新する。その後、当該検索処理(検索プロセス)を終了する。
一方、S1330にて、上記指定された検索プログラム情報のカテゴリ情報が「用語検索」であると判断すると(S1330でYes)、制御部71は、応答信号として受信したリンク情報の一群からなる検索結果から、用語検索用に予め定められた件数分(例えば1件分)のリンク情報(URL情報)を抽出し、そのリンク情報を記した個別結果情報を生成し(S1345)、生成した個別結果情報を、記憶部73が記憶する検索結果管理テーブルに登録する(S1350)。
また、S1350での処理を終えると、S1360に移行し、今回、検索結果管理テーブルに登録した個別結果情報の評価値の欄に、上記指定された処理対象の個別検索情報が示す評価値を、書き込んで、検索結果管理テーブルを更新する。その後、当該検索処理(検索プロセス)を終了する。
(3)読出制御処理について
次に、制御部71が、図15に示す検索結果評価処理に代えて、実行する読出制御処理について説明する。図25は、制御部71が実行する読出制御処理を表すフローチャートである。
図25に示す読出制御処理を実行すると、制御部71は、まず、S1430の処理について、未処理の個別結果情報が、検索結果管理テーブル内に存在するか否かを判断し(S1410)、未処理の個別結果情報が存在しないと判断すると(S1410でNo)、未処理の個別結果情報が、検索結果管理テーブル内に登録されるまで待機し、未処理の個別結果情報が存在すると判断すると(S1410でYes)、S1420に移行する。
S1420に移行すると、制御部71は、未処理の個別結果情報を一つ処理対象に選択し、その後、図16に示す読出処理を実行する(S1430)。読出処理の内容については、上述した通りである。
また、この読出処理を終えると、制御部71は、S1440に移行し、S1430における読出処理において、正常にコンテンツを読み出すことができたか否かを判断する。そして、正常にコンテンツを読み出すことができたと判断すると(S1440でYes)、S1445に移行する。一方、正常にコンテンツを読み出すことができなかったと判断すると(S1440でNo)、終了指令が入力されているか否かを判断し(S1450)、終了指令が入力されていないと判断すると(S1450でNo)、S1410に移行する。一方、終了指令が入力されていると判断すると(S1450でYes)、当該読出制御処理を終了する。
また、S1445に移行すると、制御部71は、S1430における読出処理において正常に読み出すことができたコンテンツに対応する個別結果情報の取得有無情報を「YES」に更新すると共に取得完了時刻情報の領域に現在時刻を書き込む。その後、S1450に移行して、終了指令が入力されているか否かを判断し(S1450)、終了指令が入力されていると判断すると(S1450でYes)、当該読出制御処理を終了する。
(4)本実施形態の効果
本実施形態では、キーワード抽出処理によって、関心ベクトルを算出すると共に、この関心ベクトルを算出するのに用いたパソコン30又はディジタル電話装置50からのテキストデータから抽出した検索キーと、関心ベクトルとを関連付けてなる個別検索情報を検索情報管理テーブルに登録する(データ記録手段)。
その他、情報収集解析装置70は、S1230の処理を、コンテンツ未検索の個別検索情報が存在する限りにおいて繰返し実行することによって、未検索の各個別検索情報について、その関心ベクトルと、カレント関心ベクトルとの内積をとり、各個別検索情報に対応するユーザの関心事と、ユーザの主たる関心事との類似度を評価する(類似度評価手段)。
そして、各個別検索情報を、上記類似度が高いと評価された個別検索情報(評価値の高い個別検索情報)から、優先的に選択して(S1230〜S1240)、この個別検索情報が示す検索キーに対応するコンテンツを検索し(S1270)、検索が終わった順に、読出制御処理にて、検索結果(個別結果情報)に基づき、対応するコンテンツを、ウェブサーバから取得する(コンテンツ取得制御手段)。
すなわち、本実施形態のコンテンツ提供システム1では、ユーザの主たる関心事との類似度が高いコンテンツが優先的に、ソース生成時刻にかかわらず、ウェブサーバから取得され、ユーザに対し出力される。本実施形態によれば、このように、有用度の高いコンテンツを優先的に取得するため、コンテンツを取得する際のCPUの負荷、及び、ネットワークの負荷を減少させた上で、適切に、ユーザの関心に適合するコンテンツを取得して、ユーザに提供することができる。
その他、本実施形態でも、上述したように、推移係数Kを、最新の関心ベクトルに作用させて、最近、高まりつつある関心の種類に対応する要素の値を増幅し、静まりつつある関心の種類に対応する要素の値を減少させ、現在におけるユーザの主たる関心事を数値化し上記評価の基準とする。
従って、本実施形態によれば、現在におけるユーザの主たる関心事に適合するコンテンツを、適切に、検索・取得することができ、有用度の高いコンテンツを、適切にユーザに提供することができる。
[その他]
上記実施形態のコンテンツ提供システム1では、情報収集解析装置70が単体の装置として存在するようになっているが、このような構成はあくまでも説明を容易にするための構成例にすぎず、これ以外にも様々な構成をとることが可能である。例えば、パソコン30と情報収集解析装置70とが一体となった構成でもよい。
また、上記実施例では、図8に示すように、パソコン30やディジタル電話装置50からのテキストデータから、キーワードを抽出し、関心事推定テーブルに登録されたキーワードと一致するキーワード数により、ユーザの関心事を数値化して、これを関心ベクトルとして表すようにしたが、ユーザの関心事は、その他の手法によって数値化されてもよい。
例えば、関心事推定テーブルにおいて、キーワード毎に、関心の種類と、点数とを定めておき、同一のキーワードが、パソコン30やディジタル電話装置50からのテキストデータに含まれる場合には、その関心の種類の点数をカウントして、ユーザの関心事を数値化してもよい。
本発明が適用されたコンテンツ提供システム1の構成を表す説明図である。 パソコン30の監視部35が実行するパソコン監視処理を表すフローチャートである。 ディジタル電話装置50の監視部55が繰返し実行する電話監視処理を表すフローチャートである。 表示部77が表示するコンテンツ提供画面の構成を表す説明図である。 制御部71が実行するソース情報登録処理を表すフローチャートである。 ソース管理テーブルの構成を表す説明図である。 制御部71が実行するキーワード抽出処理を表すフローチャートである。 制御部71が実行する関心ベクトル算出処理を表すフローチャートである。 関心事推定テーブルの構成を表す説明図である。 検索情報管理テーブルの構成を表す説明図である。 制御部71が実行する検索制御処理を表すフローチャートである。 検索プログラム管理テーブルの構成を表す説明図である。 検索プロセスにて実現される検索処理を表すフローチャートである。 検索結果管理テーブルの構成を表す説明図である。 制御部71が行う検索結果評価処理を表すフローチャートである。 読出プロセスにて実現される読出処理を表すフローチャートである。 制御部71が行うカレント関心テーブル更新処理を表すフローチャートである。 関心履歴テーブルの構成を表す説明図(a)及びカレント関心テーブルの構成を表す説明図(b)である。 制御部71が実行する出力処理を表すフローチャートである。 制御部71が実行する表示制御処理を表すフローチャートである。 動画再生データキュー及び動画再生領域表示制御プロセスを示した説明図(a)、及び、表示データキュー及びテキスト・画像領域表示制御プロセスを示した説明図(b)である。 他の実施形態での検索制御処理を表すフローチャートである。 他の実施形態での検索情報管理テーブルの構成を表すフローチャートである。 他の実施形態での検索処理を表すフローチャートである。 他の実施形態で制御部71が行う読出制御処理を表すフローチャートである。
1…コンテンツ提供システム、10…ウェブサーバ、20…情報検索サーバ装置、21,31,51,71…制御部、23,33,53,73…記憶部、25,37,57,75…通信部、30…パソコン、35,55…監視部、40,60…ユーザインタフェース、41…入力部、43,77…表示部、50…ディジタル電話装置、61…音入力部、63,79…音出力部、70…情報収集解析装置

Claims (8)

  1. ユーザインタフェースを備える情報処理装置において、ユーザから前記ユーザインタフェースに入力されたキーワードを含むテキストデータ、及び、前記ユーザインタフェースからユーザに向けて出力されたキーワードを含むテキストデータの少なくとも一方を、前記情報処理装置から取得するデータ取得手段と、
    前記データ取得手段が取得したテキストデータからキーワードを抽出する抽出手段と、
    前記データ取得手段が前記テキストデータを取得する度に、このテキストデータから前記抽出手段が抽出したキーワードに基づき、このキーワードを前記ユーザの関心事が反映されたキーワードとみなして、当該テキストデータの特徴量であって、現在のユーザの関心事に対応した特徴量を導出する第一特徴量導出手段と、
    前記第一特徴量導出手段によって導出された過去所定期間分の特徴量の推移に応じた補正量を、前記第一特徴量導出手段により導出された最新の特徴量に作用させて、当該最新の特徴量を補正することで、この補正後の特徴量を、前記ユーザの主たる関心事に対応した特徴量として導出する第二特徴量導出手段と、
    前記データ取得手段が取得した各テキストデータに対応するコンテンツを、コンテンツを保持する装置から取得するコンテンツ取得手段と、
    前記コンテンツ取得手段が取得したコンテンツと、このコンテンツに対応する前記テキストデータから前記抽出手段が抽出したキーワードに基づき前記第一特徴量導出手段が導出した前記特徴量と、を関連付けて、記憶手段に記憶させるコンテンツ記録手段と、
    前記記憶手段が記憶する各コンテンツ毎に、当該コンテンツに関連付けて前記記憶手段が記憶する前記特徴量と、前記第二特徴量導出手段が導出した前記特徴量と、を用いて、当該コンテンツに対応するユーザの関心事と、前記第二特徴量導出手段が導出した前記特徴量に対応するユーザの主たる関心事と、の類似度を評価する類似度評価手段と、
    前記記憶手段が記憶する各コンテンツを、前記ユーザに向けて出力する出力手段と、
    前記記憶手段が記憶する各コンテンツを、前記類似度評価手段により前記類似度が高いと評価されたコンテンツから、優先的に前記出力手段に出力させるコンテンツ出力制御手段と、
    を備えることを特徴とするコンテンツ出力システム。
  2. 前記コンテンツ取得手段は、前記データ取得手段が前記情報処理装置から取得したテキストデータ毎に、そのテキストデータから前記抽出手段が抽出したキーワードに関連するコンテンツを、コンテンツを保持する装置から取得することにより、前記データ取得手段が取得した各テキストデータに対応するコンテンツを取得する構成にされていること
    を特徴とする請求項1記載のコンテンツ出力システム。
  3. ユーザインタフェースを備える情報処理装置において、ユーザから前記ユーザインタフェースに入力されたキーワードを含むテキストデータ、及び、前記ユーザインタフェースからユーザに向けて出力されたキーワードを含むテキストデータの少なくとも一方を、前記情報処理装置から取得するデータ取得手段と、
    前記データ取得手段が取得したテキストデータからキーワードを抽出する抽出手段と、
    前記データ取得手段が前記テキストデータを取得する度に、このテキストデータから前記抽出手段が抽出したキーワードに基づき、このキーワードを前記ユーザの関心事が反映されたキーワードとみなして、当該テキストデータの特徴量であって、現在のユーザの関心事に対応した特徴量を導出する第一特徴量導出手段と、
    前記第一特徴量導出手段が導出した前記特徴量と、当該特徴量の導出に用いられた前記情報処理装置からの取得データとしての前記キーワードとを、関連付けて、記憶手段に記憶させるデータ記録手段と、
    前記第一特徴量導出手段によって導出された過去所定期間分の特徴量の推移に応じた補正量を、前記第一特徴量導出手段により導出された最新の特徴量に作用させて、当該最新の特徴量を補正することで、この補正後の特徴量を、前記ユーザの主たる関心事に対応した特徴量として導出する第二特徴量導出手段と、
    前記記憶手段が記憶する前記情報処理装置からの各取得データに対応するコンテンツを、コンテンツを保持する装置から取得するコンテンツ取得手段と、
    前記コンテンツ取得手段が取得した各コンテンツを、前記ユーザに向けて出力する出力手段と、
    前記記憶手段が記憶する前記各取得データ毎に、当該取得データに関連付けて前記記憶手段が記憶する前記特徴量と、前記第二特徴量導出手段が導出した前記特徴量と、を用いて、当該取得データに対応するユーザの関心事と、前記第二特徴量導出手段が導出した前記特徴量に対応するユーザの主たる関心事と、の類似度を評価する類似度評価手段と、
    前記記憶手段が記憶する前記各取得データを、前記類似度評価手段により前記類似度が高いと評価されたデータから、優先的に処理対象に選択し、前記選択した処理対象の取得データに対応するコンテンツを優先的に、前記コンテンツ取得手段に取得させるコンテンツ取得制御手段と、
    を備えることを特徴とするコンテンツ出力システム。
  4. 前記コンテンツ取得手段は、前記記憶手段が記憶する処理対象の前記取得データに含まれるキーワードに関連するコンテンツを、コンテンツを保持する装置から取得することにより、前記処理対象の取得データに対応するコンテンツを取得する構成にされていること
    を特徴とする請求項3記載のコンテンツ出力システム。
  5. 前記第一特徴量導出手段は、前記特徴量として、前記テキストデータの特徴ベクトルを導出する構成にされ、前記データ取得手段が前記テキストデータを取得する度に、このテキストデータから前記抽出手段が抽出した各キーワードを、予め定められた複数のクラスのいずれかに分類して、前記クラス毎のクラス値を前記キーワードに基づき求め、これら各クラスのクラス値を要素の値とした前記特徴ベクトルを導出する構成にされていることを特徴とする請求項1〜請求項4のいずれかに記載のコンテンツ出力システム。
  6. 前記第二特徴量導出手段は、前記第一特徴量導出手段により過去所定期間に導出された前記特徴ベクトルの推移に応じた要素毎の補正量を、前記第一特徴量導出手段により導出された最新の特徴ベクトルの各要素に作用させて、当該最新の特徴ベクトルを補正することで、この補正後の特徴ベクトルを、前記ユーザの主たる関心事に対応した特徴量として導出する構成にされていること
    を特徴とする請求項5記載のコンテンツ出力システム。
  7. 記憶手段を有するコンピュータに、
    ユーザインタフェースを備える情報処理装置において、ユーザから前記ユーザインタフェースに入力されたキーワードを含むテキストデータ、及び、前記ユーザインタフェースからユーザに向けて出力されたキーワードを含むテキストデータの少なくとも一方を、前記情報処理装置から取得するデータ取得手段と、
    前記データ取得手段が取得したテキストデータからキーワードを抽出する抽出手段と、
    前記データ取得手段が前記テキストデータを取得する度に、このテキストデータから前記抽出手段が抽出したキーワードに基づき、このキーワードを前記ユーザの関心事が反映されたキーワードとみなして、当該テキストデータの特徴量であって、現在のユーザの関心事に対応した特徴量を導出する第一特徴量導出手段と、
    前記第一特徴量導出手段によって導出された過去所定期間分の特徴量の推移に応じた補正量を、前記第一特徴量導出手段により導出された最新の特徴量に作用させて、当該最新の特徴量を補正することで、この補正後の特徴量を、前記ユーザの主たる関心事に対応した特徴量として導出する第二特徴量導出手段と、
    前記データ取得手段が取得した各テキストデータに対応するコンテンツを、コンテンツを保持する装置から取得するコンテンツ取得手段と、
    前記コンテンツ取得手段が取得したコンテンツと、このコンテンツに対応する前記テキストデータから前記抽出手段が抽出したキーワードに基づき前記第一特徴量導出手段が導出した前記特徴量と、を関連付けて、前記記憶手段に記憶させるコンテンツ記録手段と、
    前記記憶手段が記憶する各コンテンツ毎に、当該コンテンツに関連付けて前記記憶手段が記憶する前記特徴量と、前記第二特徴量導出手段が導出した前記特徴量と、を用いて、当該コンテンツに対応するユーザの関心事と、前記第二特徴量導出手段が導出した前記特徴量に対応するユーザの主たる関心事と、の類似度を評価する類似度評価手段と、
    前記記憶手段が記憶する各コンテンツを、前記ユーザに向けて出力する出力手段と、
    前記記憶手段が記憶する各コンテンツを、前記類似度評価手段により前記類似度が高いと評価されたコンテンツから、優先的に前記出力手段に出力させるコンテンツ出力制御手段
    としての機能を実現させるためのプログラム。
  8. 記憶手段を有するコンピュータに、
    ユーザインタフェースを備える情報処理装置において、ユーザから前記ユーザインタフェースに入力されたキーワードを含むテキストデータ、及び、前記ユーザインタフェースからユーザに向けて出力されたキーワードを含むテキストデータの少なくとも一方を、前記情報処理装置から取得するデータ取得手段と、
    前記データ取得手段が取得したテキストデータからキーワードを抽出する抽出手段と、
    前記データ取得手段が前記テキストデータを取得する度に、このテキストデータから前記抽出手段が抽出したキーワードに基づき、このキーワードを前記ユーザの関心事が反映されたキーワードとみなして、当該テキストデータの特徴量であって、現在のユーザの関心事に対応した特徴量を導出する第一特徴量導出手段と、
    前記第一特徴量導出手段が導出した前記特徴量と、当該特徴量の導出に用いられた前記情報処理装置からの取得データとしての前記キーワードとを、関連付けて、記憶手段に記憶させるデータ記録手段と、
    前記第一特徴量導出手段によって導出された過去所定期間分の特徴量の推移に応じた補正量を、前記第一特徴量導出手段により導出された最新の特徴量に作用させて、当該最新の特徴量を補正することで、この補正後の特徴量を、前記ユーザの主たる関心事に対応した特徴量として導出する第二特徴量導出手段と、
    前記記憶手段が記憶する前記情報処理装置からの各取得データに対応するコンテンツを、コンテンツを保持する装置から取得するコンテンツ取得手段と、
    前記コンテンツ取得手段が取得した各コンテンツを、前記ユーザに向けて出力する出力手段と、
    前記記憶手段が記憶する前記各取得データ毎に、当該取得データに関連付けて前記記憶手段が記憶する前記特徴量と、前記第二特徴量導出手段が導出した前記特徴量と、を用いて、当該取得データに対応するユーザの関心事と、前記第二特徴量導出手段が導出した前記特徴量に対応するユーザの主たる関心事と、の類似度を評価する類似度評価手段と、
    前記記憶手段が記憶する前記各取得データを、前記類似度評価手段により前記類似度が高いと評価されたデータから、優先的に処理対象に選択し、前記選択した処理対象の取得データに対応するコンテンツを優先的に、前記コンテンツ取得手段に取得させるコンテンツ取得制御手段
    としての機能を実現させるためのプログラム。
JP2005126560A 2005-02-21 2005-04-25 コンテンツ出力システム、及び、プログラム Expired - Fee Related JP4379378B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2005126560A JP4379378B2 (ja) 2005-04-25 2005-04-25 コンテンツ出力システム、及び、プログラム
CN200810211813XA CN101398848B (zh) 2005-02-21 2006-02-21 用于提供内容的系统和装置
CN2008102118144A CN101398849B (zh) 2005-02-21 2006-02-21 用于提供内容的系统和装置
US11/276,272 US7912806B2 (en) 2005-02-21 2006-02-21 System and device for providing contents
CN2008102118125A CN101398847B (zh) 2005-02-21 2006-02-21 用于提供内容的系统和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005126560A JP4379378B2 (ja) 2005-04-25 2005-04-25 コンテンツ出力システム、及び、プログラム

Publications (2)

Publication Number Publication Date
JP2006302194A JP2006302194A (ja) 2006-11-02
JP4379378B2 true JP4379378B2 (ja) 2009-12-09

Family

ID=37470376

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005126560A Expired - Fee Related JP4379378B2 (ja) 2005-02-21 2005-04-25 コンテンツ出力システム、及び、プログラム

Country Status (1)

Country Link
JP (1) JP4379378B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009037050A (ja) * 2007-08-02 2009-02-19 Toyota Motor Corp 対話装置と対話用プログラム
US8671104B2 (en) * 2007-10-12 2014-03-11 Palo Alto Research Center Incorporated System and method for providing orientation into digital information
JP5522166B2 (ja) * 2009-05-20 2014-06-18 富士通株式会社 情報処理装置、通信制御方法および通信制御プログラム
JP5740814B2 (ja) * 2009-12-22 2015-07-01 ソニー株式会社 情報処理装置および方法
JP5944535B2 (ja) * 2012-02-22 2016-07-05 ノキア テクノロジーズ オーユー コンテキストを決定するシステムおよび方法
KR102278190B1 (ko) * 2020-10-08 2021-07-15 이상휘 공방 운영 플랫폼 서비스 방법 및 시스템

Also Published As

Publication number Publication date
JP2006302194A (ja) 2006-11-02

Similar Documents

Publication Publication Date Title
JP4608740B2 (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP5355949B2 (ja) 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム
JP4379378B2 (ja) コンテンツ出力システム、及び、プログラム
JP5164901B2 (ja) 画像検索装置
US7912806B2 (en) System and device for providing contents
JP5469046B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラム
JP2003242176A (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP4407532B2 (ja) コンテンツ出力システムおよびプログラム
JP5834102B2 (ja) メタデータを自動的に生成/更新するマルチメディア・データの記録方法及び装置
JP4379374B2 (ja) コンテンツ提供システム、及び、プログラム
JP4308315B2 (ja) 目的推定装置および目的推定方法
KR100644016B1 (ko) 동영상 검색 시스템 및 방법
JP4379365B2 (ja) コンテンツ提供装置,コンテンツ提供システムおよびプログラム
JP4754849B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP5466217B2 (ja) オブジェクトコンピュータシステムの情報を起動する方法、システムおよびコンピュータプログラム
JP5418138B2 (ja) 文書検索システム、情報処理装置およびプログラム
JP4821894B2 (ja) コンテンツ出力システムおよびプログラム
JP4605415B2 (ja) 情報処理装置および方法、並びに記録媒体
JP4120597B2 (ja) 部分コンテンツ作成方法及び装置及びプログラム
JP4379364B2 (ja) コンテンツ提供システム、及び、プログラム
JP3614765B2 (ja) 概念辞書拡張装置
JP4416644B2 (ja) 予測機能付き文字処理装置、方法、記録媒体およびプログラム
JP2011170743A (ja) 通信装置、コンテンツ検索方法およびプログラム
JP4412199B2 (ja) コンテンツ提供システム,検索制御装置およびプログラム
JP2013191119A (ja) 検索式生成のためのプログラム、情報処理方法及び情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090825

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090907

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4379378

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131002

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees