以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
ユーザが電子検索を通じて所望する閲覧情報を得るものとしては、上述したような電子マニュアル(オンラインマニュアル)に限らず、質問を特定して、その質問に対する適切な閲覧情報を得るFAQ等、様々な検索態様が考えられる。ここで、閲覧情報は、任意の技術分野や任意の製品種別といった所定の技術範囲における、内容や事情についての知らせであり、それによって、ユーザに知識や適切な判断を生じさせるものをいう。したがって、本実施形態の閲覧情報の検索対象は、所定の技術範囲に限られる。
本実施形態では、例えば、デジタルビデオムービーカムのオンラインマニュアルを例に挙げて説明するが、本実施形態がこれに限定されるものではなく、上述したFAQや、その他の様々な閲覧形態や検索形態に適用することができる。本実施形態は、オンラインマニュアルが参照されることを前提に、そのオンラインマニュアル自体を生成することを目的とする。そこで、第1の実施形態において、前提となる、ユーザに目的語と述語とを入力させるだけで、予め準備された複数の閲覧情報からユーザが所望する適切な閲覧情報を効率的に抽出する情報閲覧システム100を説明し、第2の実施形態において、情報閲覧システム100を構築するため、任意の閲覧情報をユーザが所望する適切な位置に配置する閲覧情報生成装置300を説明し、第3の実施形態において、そのように構築された閲覧情報を容易に改編(追加、削除、編集)する閲覧情報生成装置500を説明する。
(第1の実施形態:情報閲覧システム100)
図1は、情報閲覧システム100の概略的な関係を示した説明図である。情報閲覧システム100は、通信網102と、クライアント装置110と、サーバ装置120とを含んで構成される。通信網102は、インターネット、LAN、専用回線等で構成され、クライアント装置110、サーバ装置120それぞれを接続する。
クライアント装置110は、パーソナルコンピュータ、ノート型パーソナルコンピュータ、PDA(Personal Digital Assistant)、携帯電話等、Webブラウザを利用可能な電子機器であり、ブラウザプログラムを備え、サーバ装置120が蓄積している、音楽、静止画、動画等の様々な情報を、Webブラウザを通じて取得することができる。本実施形態において、クライアント装置110は、サーバ装置120に保持されているオンラインマニュアルを利用し、所望する閲覧情報を得ることを目的とする。
サーバ装置120は、Webサイトを管理し、クライアント装置110による、Webページの取得を要求する情報取得要求に応じ、クライアント装置110のWebブラウザを通じて、サーバ装置120自体で管理しているオンラインマニュアルに関する様々なWebページを提供する。ここで、Webサイトは、サーバ装置120を特定するドメイン下にあるWebページ群をいう。クライアント装置110およびサーバ装置120の具体的構成は、以下のようになる。
(クライアント装置110)
図2は、クライアント装置110の電気的構成を示した機能ブロック図である。クライアント装置110は、操作部140と、表示部142と、クライアントメモリ144と、クライアント通信部146と、クライアント制御部148とを含んで構成される。
操作部140は、キーボード、ポインティングデバイス、十字キー、ジョイスティック、ジョグダイヤル、タッチパネル、音声認識(音声入力)デバイス等で構成され、ユーザ112の操作入力または音声入力(以下、音声入力も含めて単に操作入力という。)、例えば、閲覧情報の抽出(検索)を試みた場合の、目的語に相当する単語および述語に相当する単語の直接の文字入力を受け付ける。以下、目的語として入力された単語を「目的単語」、述語として入力された単語を「述単語」と称する。
表示部142は、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ等で構成され、Webブラウザを通じてサーバ装置120から提供されるWebページを表示したり、様々な画像を表示する。本実施形態において、所定のWebサイトにアクセスする場合は、クライアント装置110自体のWebブラウザを通じてサーバ装置120から提供されるWebページ(例えば、サーバ装置120のPHP・JavaScriptプログラムによるXML(eXtensible Style Language)で記述されたオンラインマニュアル)を表示し、ユーザ112は、WebページにおけるUI(User Interface)を、操作部140を通じて操作することで、Webページに関する様々な処理を実現する。また、表示部142は、操作部140を通じて入力した、例えば、目的単語や述単語を表示して入力結果の確認に利用したり、本実施形態の遂行によって抽出された閲覧情報を表示したりする。
クライアントメモリ144は、HDD(Hard disk drive)、フラッシュメモリ、RAM等の記憶媒体で構成され、後述するクライアント制御部148で利用されるOS(Operating System)、制御プログラム、ブラウザプログラム、通信処理プログラムや、Webブラウザを通じてサーバ装置120からWebページと共にダウンロードしたドキュメント等の情報を保持する。なお、HDDは正確には装置であるが、説明の便宜上本説明では他の記憶媒体と同義として扱う。
クライアント通信部146は、TCP/IP等のプロトコルを用い、通信網102を通じてサーバ装置120と通信接続を行う。クライアント制御部148は、中央処理装置(CPU)を含む半導体集積回路で構成され、クライアントメモリ144や他の電子回路と協働してクライアント装置110全体を管理および制御する。また、クライアント制御部148は、クライアント送信制御部150、クライアント受信制御部152としても機能する。
クライアント送信制御部150は、サーバ装置120にアクセスし、サーバ装置120から提供されるWebページの内容に応じ、操作部140を通じて目的語として入力された単語(目標単語)と、述語として入力された単語(述単語)とを送信する。また、クライアント送信制御部150は、サーバ装置120による質問に応じて選択された回答をサーバ装置120に送信する。クライアント受信制御部152は、サーバ装置120から質問206および選択肢を受信し、表示部142に表示させて、ユーザ112に選択肢を選択させる。また、クライアント受信制御部152は、サーバ装置120から閲覧情報を受信し、表示部142に表示させる。
(サーバ装置120)
図3は、サーバ装置120の電気的構成を示した機能ブロック図である。サーバ装置120は、サーバメモリ160と、サーバ通信部162と、サーバ制御部164とを含んで構成される。
サーバメモリ160は、HDD、フラッシュメモリ、RAM等の記憶媒体で構成され、後述するサーバ制御部164で利用されるOS、制御プログラム、Webサーバプログラム、通信処理プログラム、オンラインマニュアル処理プログラムや、Webブラウザを通じてクライアント装置110に提供可能な、オンラインマニュアルやFAQ等の情報を保持する。ここで、オンラインマニュアルやFAQとしては、複数の閲覧情報を含む閲覧情報群、類語関係を有する目的語に相当する単語をグループ化した目的語グループを複数含む目的語グループ群、類語関係を有する述語に相当する単語をグループ化した述語グループを複数含む述語グループ群、および、目的語グループと述語グループとに基づいて閲覧情報へ案内するための案内情報を一意に特定するマトリクステーブルが保持されている。閲覧情報群、目的語グループ群、述語グループ群、および、マトリクステーブルは本実施形態を理解する上で前提となるので、先だってその構成を簡単に説明する。
図4および図5は、閲覧情報群200の一部を説明するための説明図である。閲覧情報群200は、複数の閲覧情報202を枝とし、その上位階層として、閲覧情報202を導くための選択肢204(後述する閲覧特定情報ともなる)を幹とするツリー構造で形成されている。例えば、図4のツリー構造の最下位階層(閲覧情報202)以外の階層には、質問206と、その質問206の複数の回答で構成される選択肢204とが示され、例えば、「どのメディアに保存しますか」という質問206に対して、「光ディスク」または「外付HDD」という選択肢204が準備されている。そして、ユーザ112が、準備された選択肢204から1の回答を選択すると、その選択肢204に属する下位階層に準備された質問206が提示され、ユーザ112は、下位階層の質問206に対して順次選択肢204を選択していくことで、最終的に所望する閲覧情報202を閲覧することができる。また、かかる質問206や選択肢204のデータ位置は、図4中「image_cpy.xml」といったファイル名やそのファイル中のディレクトリ「opt」等で特定することができる。
このような閲覧情報群200では、最上位階層(図示せず)に相当する質問206に対する選択肢204毎にその下位階層が複数のファイルに分けられて保持されている。したがって、図4に示したツリー構造も閲覧情報群200の一部に当たり、最上位階層の選択肢204で「映像保存」が選ばれた場合に、はじめて呼び出されるものである。閲覧情報群200のツリー構造は、例えば、図4に示したように、アルゴリズムやプログラム処理を示す手段としてのPAD(Problem Analysis Diagram)で表すことができる。また、閲覧情報群200のツリー構造を、マークアップ記述言語XMLで記述すると図5のように表すことができる。
このような閲覧情報群200さえ準備しておけば、ユーザ112は、最上位階層の質問206を適宜選び、さらに、図4のように閲覧情報群200の質問206に適宜回答(選択肢204を選択)していくことで、所望する閲覧情報202を得ることができる。しかし、一般的に、ツリー構造の階層は深く(多く)、ユーザ112は、所望する最下位階層の閲覧情報202に到達するまで多くの選択肢204を選択しなければならず、手間と時間を要するばかりか、到達した最下位階層の閲覧情報202が所望するものでなかった場合、再度、最上位階層の質問206からを繰り返し、前回と異なる選択肢204を意識的に選択して自力で所望する閲覧情報202を探し当てなければならないものである。
また、所望する閲覧情報202を直接導き出せる、閲覧情報202の1つ上位階層に当たる質問206や選択肢204をキーワードとして思いついたとしても、閲覧情報群200の最上位階層以外の階層に設けられた質問206や選択肢204を直接指定する手段はなく、ユーザ112は、やはり、最上位階層の質問206から選択せねばならず、所望する閲覧情報202の抽出に手間と時間を費やすこととなる。
そこで、本実施形態における情報閲覧システム100では、上述した閲覧情報群200が既に存在すること、または、新たに閲覧情報群200を後に生成することを前提に、以下に示す、目的語グループ群、述語グループ群を用い、マトリクステーブルを経由した(マトリクステーブルによって所望する選択肢204または閲覧情報202までショートカットした)絞り込み処理によって、効率的に閲覧情報202をユーザ112に閲覧させることを目的とする。
図6は、目的語グループ群208を説明するための説明図である。上述したように、目的語グループは、類語関係を有する目的語に相当する単語をグループ化したものであり、図6における縦方向には、その目的語グループ210が目的語番号212に関連付けられて並べられている。また、図6における横方向には、目的語グループ210の代表単語214(類語1に相当)、例えば「静止画」と、目的語グループ210内のいずれかの単語と類語関係にある1または複数の単語、例えば、「スナップショット」、「写真」、「コマ」が並置されている。なお、目的語グループ210内の類語の数は限定されない。
このように、類語関係を有する目的語に相当する単語をグループ化する構成により、多数の単語を類語として目的語グループ群208のいずれかの目的語グループ210に関連付けることができるので、目的語グループ群208に含まれる単語の総数(バリエーション)を容易に増やすことが可能となり、ユーザ112が入力した任意の目的単語に対して閲覧情報を抽出できる確率が高くなる。また、複数の類語をグループ化し、その纏まったグループに対して閲覧情報202を準備する構成により、サーバメモリ160の容量や処理負荷を抑えることができる。
また、目的語グループ群208は、目的語グループ210内の単語それぞれが検索に用いられた頻度を示す目的語頻度216の項目も有する。かかる目的語頻度216は、後述する目的語グループ特定部174において、検索頻度が高い順に目的語を検索するために用いられる。
図7は、述語グループ群218を説明するための説明図である。述語グループは、類語関係を有する述語に相当する単語をグループ化したものであり、図7における縦方向には、その述語グループ220が述語番号222に関連付けられて並べられている。また、図7における横方向には、述語グループ220の代表単語224、例えば「撮影」と、述語グループ220内のいずれかの単語と類語関係にある1または複数の単語、例えば、「録画」、「記録」、「REC」が並置されている。なお、述語グループ220内の類語の数は限定されない。
このように、類語関係を有する述語に相当する単語をグループ化する構成により、目的語同様、多数の単語を類語として述語グループ群218のいずれかの述語グループ220に関連付けることができるので、述語グループ群218に含まれる単語の総数(バリエーション)を容易に増やすことが可能となり、ユーザ112が入力した任意の述単語に対して閲覧情報を抽出できる確率が高くなる。また、複数の類語をグループ化し、その纏まったグループに対して閲覧情報202を準備する構成により、サーバメモリ160の容量や処理負荷を抑えることができる。また、述語グループ群218は、述語グループ220内の単語それぞれが検索に用いられた頻度を示す述語頻度226の項目も有する。かかる述語頻度226は、後述する述語グループ特定部176において、検索頻度が高い順に述語を検索するために用いられる。
図8は、マトリクステーブル228を説明するための説明図である。マトリクステーブル228では、図8における縦方向に配された複数の目的語グループ210(図8では、目的語グループ210の代表単語214のみを示す。)と、図8における横方向に配された複数の述語グループ220(図8では、述語グループ220の代表単語224のみを示す。)とが掛け合わされた2次元配列となっており、1の目的語グループ210と1の述語グループ220に基づいて閲覧情報202へ案内するための1の案内情報230が導き出されるようになっている。
例えば、目的単語が代表単語「静止画」の目的語グループ210に含まれ、述単語が代表単語「撮影」の述語グループ220に含まれている場合、図8に示すように、2次元配列上で両者の行列が交わるところに示される案内情報「L−0001」が抽出される。かかる案内情報「L−0001」は、閲覧情報202を直接特定する直接リンク情報(図8中「L−」を付した配列要素で示す。)であり、ユーザ112は、当該案内情報「L−0001」によって、閲覧情報群200の質問206や選択肢204を経由することなく、閲覧情報202を直接閲覧することができる。
ただし、目的語グループ210と述語グループ220の組み合わせによっては、複数の閲覧情報202が候補となってしまい、1の閲覧情報202を特定できない場合がある。このような目的語グループ210および述語グループ220に関して、2次元配列上で両者の行列が交わるところには、上述した直接リンク情報と異なる、閲覧情報202を特定するための絞り込み処理に移行する間接リンク情報(図8中「S−」を付した配列要素で示す。)が案内情報230として示される。このように案内情報230が間接リンク情報であった場合、ユーザ112は、直接閲覧情報202を閲覧することはできないが、閲覧情報群200の比較的下位の階層ある任意の質問206に直接移行し、最小限の質問206および選択肢204を経由して閲覧情報202を効率的に得ることができる。このようなマトリクステーブル228を経由した絞り込み処理については、後述する閲覧情報特定部180の動作で具体的に説明する。
図3に戻って説明すると、サーバ通信部162は、TCP/IP等のプロトコルを用い、通信網102を通じてクライアント装置110と通信接続する。サーバ制御部164は、中央処理装置(CPU)を含む半導体集積回路で構成され、サーバメモリ160や他の電子回路と協働してサーバ装置120全体を管理および制御する。また、サーバ制御部164は、サーバ受信制御部170、サーバ送信制御部172、目的語グループ特定部174、述語グループ特定部176、案内情報特定部178、閲覧情報特定部180、頻度更新部182、再入力促進部184、類語登録部186としても機能する。
サーバ受信制御部170は、クライアント装置110から目的単語と述単語とを受信し、目的語グループ特定部174および述語グループ特定部176に伝達する。また、サーバ受信制御部170は、クライアント装置110から選択肢204に対する回答を受信し、閲覧情報特定部180に伝達する。サーバ送信制御部172は、案内情報特定部178が案内情報230として間接リンク情報を特定した場合、閲覧情報202を絞り込むための質問206および選択肢204をクライアント装置110に送信する。また、サーバ送信制御部172は、閲覧情報特定部180によって特定された閲覧情報202をクライアント装置110に送信する。
目的語グループ特定部174は、目的語グループ群208における複数の目的語グループ210のいずれに、目的語として入力された目的単語が含まれるかを判定する。このとき、目的語グループ特定部174は、目的語グループ群208内の単語それぞれの検索頻度である目的語頻度216の高い順に、目的語グループ群208の単語と目的単語とが一致するか否かを判定し、目的単語が含まれる目的語グループ210を特定する。
図9は、目的語グループ特定部174の判定処理のイメージを示した説明図である。ユーザ112がクライアント装置110の操作部140を通じて目的単語を入力し、サーバ受信制御部170がその目的単語を受信すると、目的語グループ特定部174は、まず、目的語グループ210といった枠に囚われることなく、目的語グループ群208内の全ての単語の目的語頻度216を参照し、目的語頻度216が高い順に目的語に相当する単語を抽出する。例えば、図9に示すように、目的語番号212を「1」とする目的語グループ210内の単語「静止画」の目的語頻度216が「220」で最大となっているので、目的語グループ特定部174は、単語「静止画」と目的単語とが一致するか否か判定する。目的単語が単語「静止画」と異なる場合、目的語グループ特定部174は、単語「静止画」の次に目的語頻度216が大きい単語「動画」と目的単語との一致判定を行う。
そして、目的語グループ特定部174は、目的単語が目的語グループ群208のいずれかの単語と一致するまで、図9に示すような目的語頻度216の高い順に当該判定処理を繰り返し、一致する単語が有れば、その目的語グループ210の目的語番号212、例えば、目的単語が「写真」であれば、「写真」を類語として含む目的語グループ210を示す目的語番号「1」を案内情報特定部178に送信する。また、一致する単語が見つからなかった場合、目的語グループ特定部174は、目的単語は目的語グループ群208に含まれていなかったとして当該判定処理を終了する。
上述した目的語頻度216は、過去にその単語が用いられた累積結果ではあるが、今後その単語が利用される可能性をも示すこととなる。したがって、目的語グループ特定部174は、かかる目的語頻度216が高い順に、目的単語が含まれる目的語グループ210を検索することで、目的語グループ210を効率的に見つけ出すことが可能となり、ユーザ112が所望する閲覧情報を早期に得ることができる。
ここで、目的語グループ特定部174は、目的単語の入力を受けて、一旦、目的語頻度216の高い順に、比較対象となる単語を抽出しているが、かかる場合に限られず、例えば、図9のような目的語頻度216の高い順に単語を並べたテーブルを予め作成しておいてもよい。この場合、後述する頻度更新部182が、テーブル内の目的語頻度216の更新と、検索順位のソート(並べ替え)を行う。
述語グループ特定部176は、述語グループ群218における複数の述語グループ220のいずれに、述語として入力された述単語が含まれるかを、述語グループ群218内の単語それぞれの検索頻度である述語頻度226の高い順に判定し、述単語が含まれる述語グループ220を特定する。
ユーザ112がクライアント装置110の操作部140を通じて述単語を入力し、サーバ受信制御部170がその述単語を受信すると、述語グループ特定部176は、目的語グループ特定部174同様、まず、述語グループ群218内の全ての単語の述語頻度226を参照し、述語頻度226が高い順に述語に相当する単語を抽出し、その抽出された単語と述単語とが一致するか否か判定する。したがって、述語グループ特定部176は、かかる述語頻度226が高い順に、述単語が含まれる述語グループ220を検索することで、述語グループ220を迅速に見つけ出すことが可能となり、ユーザ112が所望する閲覧情報を早期に得ることができる。
図10は、ユーザ112による目的単語と述単語の入力処理を示した説明図である。例えば、サーバ装置120は、クライアント装置110の表示部142に、初期画面として、図10(a)のような、目的単語と述単語の入力を促すGUI(Graphical User Interface)である入力画面232を表示し、ユーザ112は、クライアント装置110の操作部140を通じて、表示部142に表示された目的語ボックス234に目的単語を、述語ボックス236に述単語を入力し、確定ボタン238を選択決定する。本実施形態では、単純にキーワードを羅列するだけでなく、ユーザ112が希望する具体的な動作(目的語と述語)を入力してもらい、それに準じて、閲覧情報202を検索する。
例えば、デジタルビデオムービーのオンラインマニュアルを参照する際、ユーザ112が、撮影した映像の保存に関する情報取得を希望する場合、ユーザ112は、図10(b)のように、入力画面232の目的語ボックス234に「映像」を、述語ボックス236に「保存」を入力する。そうすると、その目的単語と述単語とで「映像(を)保存(したい)」という文章が形成される。かかるユーザ112の入力を受けて、目的語グループ特定部174は、目的語ボックス234に入力された目的単語「映像」を、目的語グループ群208から目的語頻度216が高い順に検索し、述語グループ特定部176は、述語ボックス236に入力された述単語「保存」を、述語グループ群218から述語頻度226が高い順に検索する。
また、他の入力手段として、図10(c)に示すように、入力画面232の文章ボックス240に、目的単語や述単語が含まれた文章をそのまま入力することもできる。ユーザ112が、入力画面232の文章ボックス240に、例えば、文章「映像を保存したい」を入力し、確定ボタン238を選択決定すると、目的語グループ特定部174および述語グループ特定部176は、入力された文章から目的単語と述単語をそれぞれ抽出する。具体的に、目的語グループ特定部174は、入力された文章から、格助詞「を」または「に」を検索し、「を」または「に」が存在すると、その前の単語を目的単語とする。また、述語グループ特定部176は、入力された文章から、助動詞「たい」または「したい」を検索し、「たい」または「したい」が存在すると、その前の単語を述単語とする。
このように、格助詞や助動詞を検索するだけで、目的語や述語を抽出する構成により、構文解析や形態素解析といった解析処理が不要となり、処理負荷の低減を図ることが可能となる。
案内情報特定部178は、図8に示したマトリクステーブル228を用い、目的語グループ特定部174および述語グループ特定部176で特定された目的語グループ210と述語グループ220とに基づいて案内情報230を特定する。例えば、目的単語として「映像」が入力され、述単語として「保存」が入力された場合、案内情報特定部178は、目的語グループ特定部174が特定した目的語グループ「代表単語:映像」と、述語グループ特定部176で特定された述語グループ「代表単語:保存」とに基づいて、図8に示したマトリクステーブル228上で両グループが交わるところに示される案内情報「S−0003」(間接リンク情報)を特定する。このように、目的単語と述単語といった、2語の入力のみで案内情報230を特定する構成により、操作性および検索効率の向上を図ることができる。また、案内情報特定部178は、マトリクステーブル228を用いて1の案内情報230を特定するので、複数の結果が検出されてしまう従来の技術に比べ、閲覧情報の候補から所望する閲覧情報を自力で探さずに済む利点がある。
また、案内情報特定部178は、目的語グループ210の目的語番号212と述語グループ220の述語番号222とを用いて、さらに迅速に案内情報230を導き出すことができる。
図11は、マトリクステーブルの他の例を示した説明図である。図11のマトリクステーブル242は、図8のマトリクステーブル228と異なり、縦方向に、複数の目的語グループ210を示す目的語番号212が配され、横方向に、複数の述語グループ220を示す述語番号222が配されており、1の目的語グループ210を示す目的語番号212と1の述語グループ220を示す述語番号222によって1の案内情報230を示す案内番号244が導き出されるようになっている。このように、図11におけるマトリクステーブル242では、案内情報230が全て単純な数値に置き換えられている。
ここで、案内情報特定部178は、目的語番号212と述語番号222を加算し、その加算結果に基づいて案内番号244を導出する。目的語番号212は、1〜999の数値で表され、述語番号222は、1000単位の数値で表されているので、それぞれの数値がユニークであるように、両者を加算した値もユニークな値になる。したがって、目的語番号212と述語番号222を加算するだけといった簡易な手順で一意に案内番号244を導き出すことができ、処理負荷の軽減が可能となる。
また、目的語グループ特定部174が目的語グループ210を特定できない、または、述語グループ特定部176が述語グループ220を特定できない場合、即ち、一方のグループを特定できない場合に、案内情報特定部178は、目的語グループ210または述語グループ220のうち特定できた方のみによって案内情報230を特定する。これは、一方のグループが特定されたことで、閲覧情報群200の全ての範囲から閲覧情報202を探し出さなくても、少なくともその検索対象範囲を狭めることができ、閲覧情報群200の最上位階層ではない、下位の階層の選択肢204に移行することが可能になるからである。
したがって、案内情報特定部178は、特定できた一方のグループを前提とし、特定できなかった他方のグループのあらゆる単語に対応した閲覧情報202を取得可能な、閲覧情報群200上の選択肢204に移行する間接リンク情報(図8中、「ワイルドカード」で示されるワイルドカード行列246にある。)を案内情報230(または案内番号244)として特定する。
例えば、クライアント装置110の操作部140を通じ、ユーザ112によって目的単語「写真」と述単語「写す」とが入力されたとする。図6の目的語グループ群208では、目的語番号1の目的語グループ210に「写真」という類語が存在するが、図7の述語グループ群218には、「写す」という単語が存在しない。ここで、案内情報特定部178は、図8において、目的単語「写真」を含む目的語グループ210のワイルドカード行列246に準備された案内情報「S−0050」を特定する(以下、ワイルドカード行列246を通じた検索をワイルドカード検索という。)。
かかる構成により、ユーザ112は、閲覧情報群200の最上位階層ではない任意の質問206に直接移行することができるので、最小限の質問206および選択肢204を経由して閲覧情報202を効率的に得ることができる。
閲覧情報特定部180は、案内情報特定部178によって特定された案内情報230に基づき、閲覧情報群200を用いて閲覧情報202を特定する。案内情報230は、上述したように、閲覧情報202を直接閲覧させる直接リンク情報と、閲覧情報202を特定するための絞り込み処理に移行する間接リンク情報とで構成される。また、案内情報230には、案内情報230が、直接リンク情報と間接リンク情報のいずれであるかを示すインデックス情報も関連付けられている。
閲覧情報特定部180は、まず、案内情報特定部178によって特定された案内情報230に関連付けられたインデックス情報が直接リンク情報と間接リンク情報のいずれであるか判断する。そして、閲覧情報特定部180は、インデックス情報が直接リンク情報であれば、直接リンク情報によって閲覧情報202を特定し、インデックス情報が間接リンク情報であれば、絞り込み処理に移行し、ユーザ112による選択肢204の新たな選択入力を通じて閲覧情報202を特定する。
図12および図13は、閲覧情報特定部180の動作処理を説明するための説明図であり、特に図12(a)は、直接リンク情報群248を示し、図12(b)は、間接リンク情報群250を示している。閲覧情報特定部180は、インデックス情報(図12中「種別」で示す。)に基づいて、それが直接リンク情報であれば、予め定められた移動・制御先にジャンプし、間接リンク情報であれば、予め定められたファイルを呼び出す。
例えば、目的単語として「静止画」、述単語として「撮影」が特定され、案内情報特定部178が、図8のマトリクステーブル228において案内情報「L−0001」を特定した場合、閲覧情報特定部180は、インデックス情報(種別が「L」であること)によって、その案内情報230が直接リンク情報であることを認識し、図12(a)の直接リンク情報群248を参照し、案内情報「L−0001」に対応したWebページのURL(Uniform Resource Locator)を通じて「静止画の撮影方法のWebページ」(「http://www.jvc.com/webman/photo_rec.html」)にジャンプする。こうして閲覧情報をユーザ112に閲覧させることができる。
また、上述したように、閲覧情報群200は、ツリー構造で形成されており、間接リンク情報は、ツリー構造の幹に相当する選択肢204にリンクする情報である。例えば、目的単語として「映像」、述単語として「保存」が入力され、案内情報特定部178が、図8のマトリクステーブル228において案内情報「S−0003」を特定した場合、閲覧情報特定部180は、インデックス情報(種別が「S」であること)によって、その案内情報が間接リンク情報であることを把握し、図12(b)に示す間接リンク情報群250を参照し、案内情報「S−0003」に対応した「映像保存のシナリオ」(「image_cpy_xml」のXMLファイル)を呼び出す。かかるXMLファイルは、図4のPADに対応している。したがって、閲覧情報特定部180は、図4の「どのメディアに保存しますか」の質問206から絞り込み処理を実行する。さらに、目的単語として「DVD」、述単語として「保存」が入力され、案内情報「S−0004」が特定された場合、閲覧情報特定部180は、案内情報「S−0004」に対応した、「DVDディスクへの保存のシナリオ」(「image_cpy_xml」のdvd)を呼び出し、図4の「どちらを使いますか」の質問206から絞り込み処理を実行する。
ここで、間接リンク情報を用いているのは、上述したように、入力された目的単語や述単語の組み合わせによっては複数の閲覧情報202が候補となってしまい、1の閲覧情報202を特定できない場合があり、その際、さらなる質問206によっていずれの閲覧情報202を閲覧させるべきか絞り込むためである。
例えば、上述した案内情報「S−0004」の例では、ユーザ112が、DVDディスクへ保存することに関する閲覧情報202を所望しているのは把握できるが、それに属する閲覧情報202は図4の如く複数存在しており、仮に全ての閲覧情報202を提示し、ユーザ112に個々に確認させるとすると、ユーザ112の手間と時間が費やされる。ここでは、閲覧情報特定部180が、1の閲覧情報202を提示するための適切な選択肢204に移行し、最小限の絞り込み処理によって閲覧情報を効率的に特定することで、ユーザ112は早期に所望する閲覧情報を得ることが可能となる。
また、間接リンク情報は、リンク先である閲覧情報群200自体を変更することなく、閲覧情報群200と独立して閲覧情報群200のいずれの選択肢204にも事後的かつ容易にリンクすることができる。したがって、案内情報230は、閲覧情報群200内の選択肢204や閲覧情報202の数に拘わらず、無数に設けることができるので、閲覧情報群200の情報量を増やすことなく、目的語グループ群208、述語グループ群218、マトリクステーブル228の情報を増やすことが可能となる。また、マトリクステーブル228の案内情報230は全て閲覧情報群200にリンクしているので、案内情報230毎に別途、質問206や選択肢204を作成する必要もなく、データ量の不要な拡大を回避することが可能となる。
こうして、目的単語と述単語によって直接閲覧情報202を導ける場合には、そのように動作すると共に、さらに絞り込みが必要な場合には、閲覧情報群200の、適切な階層の質問206および選択肢204から絞り込み処理を開始し、迅速かつ確実に閲覧情報を特定することができる。
また、図11に示したマトリクステーブル242を用いた場合、案内情報230は目的語番号212と述語番号222を加算した単純な数値である案内番号244によって示され、図12の直接リンク情報群248および間接リンク情報群250は、図13のように1つのテーブルで表される。ここでは、案内番号244によって、一意に次の処理を特定することが可能となるので、処理負荷の低減を図ることができる。
閲覧情報特定部180は、閲覧情報202を特定すると、その特定された閲覧情報202を表した画像をクライアント装置110の表示部142に表示させる。
頻度更新部182は、閲覧情報特定部180が閲覧情報202をクライアント装置110の表示部142に表示させ、閲覧情報202に関する一通りの処理が完了すると、目的語グループ群208内の今回の処理で用いられた目的語に相当する単語の目的語頻度216、および、述語グループ群218のうち今回の処理で用いられた述語に相当する単語の述語頻度226を更新(インクリメント)する。
再入力促進部184は、案内情報特定部178によって案内情報230を特定できなかった場合、即ち、目的単語が目的語グループ群208に存在せず、かつ、述単語が述語グループ群218に存在しなかった場合に、他の目的単語および他の述単語による再入力をユーザ112に促す画像をクライアント装置110の表示部142に表示させる。
類語登録部186は、目的語グループ特定部174が目的語グループ210を特定できない、または、述語グループ特定部176が述語グループ220を特定できない場合であって、上述したように、案内情報特定部178が、目的語グループ210または述語グループ220のうち特定できた方のグループのみによって案内情報230を特定し、閲覧情報特定部180が閲覧情報を特定した場合に、マトリクステーブル228における特定できた方のグループの1または複数の案内情報のうち、特定された閲覧情報を案内する案内情報230があれば、その案内情報230を示す特定できなかった方のグループを抽出し、そのグループの類語として、特定できなかった単語を新たに登録する。
具体的に、例えば、目的単語として「写真」が入力され、述単語として「写す」が入力された場合、目的単語「写真」は目的語グループ群208に含まれるが、述単語「写す」はその時点で述語グループ群218に含まれていない。そこで、案内情報特定部178が、目的語グループ210または述語グループ220のうち特定できた方、ここでは、目的単語「写真」を含む目的語グループ210(「代表単語:静止画」のグループ)のみによって、ワイルドカード検索を示す案内情報「S−0050」を特定し、閲覧情報特定部180が閲覧情報「静止画の撮影方法のWebページ」を特定したとする。即ち、述単語「写す」は、どの述語グループ220にも含まれないが、目的単語「写真」のみから閲覧情報202が特定されたとする。
ここで、類語登録部186は、マトリクステーブル228における特定できた方のグループ、ここでは目的語グループ210(「代表単語:静止画」のグループ)の1または複数の案内情報(図8において行252で示す。)に、特定された閲覧情報「静止画の撮影方法のWebページ」を案内する案内情報230、特に直接リンク情報があるか否か判定する。ここでは、直接リンク情報である案内情報「L−0001」が、案内情報特定部178に特定された閲覧情報「静止画の撮影方法のWebページ」と等しいので、類語登録部186は、その案内情報「L−0001」を示す、特定できなかった方のグループ、ここでは述語グループ「代表単語:撮影」を抽出し、そのグループの類語として、特定できなかった述単語である「写す」を登録する。
また、特定できなかった述単語の他の登録手段として、類語登録部186は、マトリクステーブル228における特定できた方のグループ、ここでは目的語グループ210(「代表単語:静止画」のグループ)のすべての案内情報を示す、特定できなかった方の1または複数のグループ、図8の例では述語グループ「代表単語:撮影」、「代表単語:再生」、「代表単語:検索」を抽出し、抽出した述語グループの選択を促す映像をクライアント装置110の表示部142に表示させる。そして類語登録部186は、ユーザ112による、クライアント装置110の操作部140を通じた選択入力によって選択された述語グループ、例えば、述語グループ「代表単語:撮影」の類語として、特定できなかった述単語である「写す」を登録する。このとき、ユーザ112が対応する述語グループ220が存在しないと判断した場合、特定できなかった述単語の登録は実行しない。
このようにして、類語登録部186は、目的語グループ210または述語グループ220を特定できなかった単語を、品詞が等しいグループの類語として登録する。したがって、目的語グループ210または述語グループ220の一方が特定できなくとも、案内情報特定部178によるワイルドカード検索を用いて閲覧情報202をユーザ112に提供すると共に、その特定できなかった単語を適切なグループに登録することが可能となる。こうして、次回から同じ単語が入力された場合、ワイルドカード検索を利用することなく、グループを特定でき、軽処理負荷かつ短時間で閲覧情報を取得することができる。
また、新たな単語がグループに登録されるので、登録された単語は、案内情報特定部178に特定された案内情報230に限らず、その目的語グループ210または述語グループ220とマトリクステーブル228において掛け合わされる複数の組み合わせ全てにその影響が及び、検索対象の拡大を図ることができる。
ただし、このような登録は、次回の検索に影響を及ぼすので、不本意な閲覧情報202が抽出されるような登録をしてはならない。そこで、類語登録部186は、以下の3つの条件のうち、予め定められた1または複数の条件によって、登録を制限し、条件を満たす単語のみを登録する。
(1)類語登録部186は、特定できなかった単語中の一部の漢字が、抽出されたグループ内のいずれかの類語の一部の漢字と等しい場合に、特定できなかった単語を登録する。例えば、述単語として「撮像」が入力された場合に、抽出された述語グループ220内の類語「撮影」中の漢字「撮」が述単語「撮像」の漢字「撮」と等しいので、述単語「撮像」は類語「撮影」を含む述語グループ220に登録される。
(2)類語登録部186は、さらに、目的単語と述単語のうち、特定できなかった単語を、抽出されたグループ内の任意の単語に置換して表示部142に表示させ、操作部140を通じたユーザ112の承認入力(承認する旨の入力)に応じて、特定できなかった単語を登録する。例えば、上述した例では、ユーザ112が、「写真」を「写す」と入力しているが、特定できなかった述単語「写す」を、抽出された述語グループ220の代表単語「撮影」に置換して、「写真を撮影する」とういう文章を表した画像をクライアント装置110の表示部142に表示させ、その文章「写真を撮影する」がユーザ112の所望する文章であるか否かを問い合わせ、ユーザ112から、クライアント装置110の操作部140を通じた承認入力があると、類語登録部186は、代表単語が「撮影」である述語グループ220に述単語「写す」を登録する。
ここでは、置換する任意の単語を各グループの代表単語としている。代表単語は、目的語グループ210や述語グループ220において、予め定められた単語でもよいし、目的語頻度216や述語頻度226が最大の単語をその都度、代表単語としてもよい。
(3)類語登録部186は、さらに、抽出されたグループの類語としての登録候補として特定できなかった単語を累積し、1のグループに対して特定できなかった単語の累積数が予め定められた数を超えると、特定できなかった単語を登録する。例えば、上述した述単語「写す」が何回も検索に用いられた場合、その検索に用いられた回数が累積され、累積数が例えば20回を超えると、述単語「写す」は、適切な述語グループ220に登録される。また、累積数は、そのまま述語頻度226として保持される。
以上説明したように本実施形態の情報閲覧システム100では、クライアント装置110から目的単語と述単語とを入力するだけで、予め準備された複数の閲覧情報202からユーザ112が所望する適切な閲覧情報202を効率的に抽出することが可能となる。以下、このような情報閲覧システム100におけるクライアント装置110とサーバ装置120との情報閲覧処理の流れを簡単に説明する。
(クライアント装置110とサーバ装置120とによる情報閲覧処理の流れ)
図14は、情報閲覧方法の全体的な流れを示したシーケンス図である。ユーザ112が、クライアント装置110を操作してサーバ装置120のWebサイトへのアクセスを試みると、クライアント装置110のクライアント送信制御部150は、サーバ装置120に閲覧情報の取得要求を行う(S260)。サーバ装置120のサーバ送信制御部172は、情報取得要求に応じて、クライアント装置110に対し、図10(a)に示す入力画面232をWebページとして送信し(S262)、クライアント装置110は、入力画面232を表示部142に表示させる(S264)。
ユーザ112が、クライアント装置110の操作部140を通じて、入力画面232の目的語ボックス234に目的単語を入力し、述語ボックス236に述単語を入力して、確定ボタン238を選択決定すると(S266)、クライアント装置110のクライアント送信制御部150は、入力された目的単語と述単語とをサーバ装置120に送信する(S268)。
サーバ装置120のサーバ受信制御部170が目的単語と述単語を受信すると、目的語グループ特定部174は、目的語グループ群208における複数の目的語グループ210のいずれに、クライアント装置110から送信された目的単語が含まれるかを、目的語グループ群208内の単語それぞれの目的語頻度216の高い順に判定し、目的単語が含まれる目的語グループ210を特定する(S270)。同様に、述語グループ特定部176は、述語グループ群218における複数の述語グループ220のいずれに、送信された述単語が含まれるかを、述語グループ群218内の単語それぞれの述語頻度226の高い順に判定し、述単語が含まれる述語グループ220を特定する(S272)。
続いて、サーバ装置120の案内情報特定部178は、目的語グループ特定部174と述語グループ特定部176とによって特定された目的語グループ210および述語グループ220に基づいて、マトリクステーブル228を用い、案内情報230を特定する(S274)。
このとき、目的語グループ210または述語グループ220のいずれか一方が特定されていなければ、案内情報特定部178は、目的語グループ210または述語グループ220のうち特定できた方のみのグループに基づき、上述したワイルドカード検索を用いて案内情報230を特定する。
続いて、閲覧情報特定部180は、特定された案内情報230に基づいて閲覧情報を特定する(S276)。このとき、特定された案内情報230が直接リンク情報であれば、閲覧情報を直接特定できるが、間接リンク情報であれば、閲覧情報特定部180は、間接リンク情報によって移行した閲覧情報群200の質問206と選択肢204とによって図15に示す入力画面232を形成し、サーバ送信制御部172は、入力画面232をWebページとしてクライアント装置110に送信する(S278)。クライアント装置110のクライアント受信制御部152は、かかる入力画面232を受信して表示部142に表示させ(S280)、ユーザ112は、操作部140を通じて入力画面232から選択肢204に相当する選択肢チェックボックス254を選択し、クライアント装置110のクライアント送信制御部150は、選択された選択肢チェックボックス254に対応する選択肢204の回答をサーバ装置120に送信する(S282)。このようなサーバ装置120とクライアント装置110間でのやりとりを通じて、最終的に1の閲覧情報202を特定する。
サーバ装置120のサーバ送信制御部172は、特定された閲覧情報202をクライアント装置110に送信し(S284)、クライアント装置110のクライアント受信制御部152は、閲覧情報202を受信して表示部142に表示させる(S286)。こうして、ユーザ112は、所望する閲覧情報202を閲覧することができる。
サーバ装置120の頻度更新部182は、クライアント受信制御部152が閲覧情報202を表示部142に表示させ、閲覧情報202に関する一通りの処理が完了すると、目的語グループ群208内の今回の処理で用いられた目的語に相当する単語の目的語頻度216、および、述語グループ群218のうち今回の処理で用いられた述語に相当する単語の述語頻度226を更新(インクリメント)する(S288)。
また、案内情報特定部178がワイルドカード検索を用いて案内情報230を特定した場合、類語登録部186は、マトリクステーブル228における特定できた方のグループの1または複数の案内情報230のうち、閲覧情報特定部180が特定した閲覧情報202を案内する案内情報230があれば、その案内情報230を示す特定できなかった方のグループを抽出し、そのグループの類語として、特定できなかった単語を登録する(S290)。
かかる情報閲覧方法によっても、目的単語と述単語とを入力するだけで、予め準備された複数の閲覧情報202からユーザ112が所望する適切な閲覧情報202を効率的に抽出することが可能となる。
ここでは、クライアント装置110とサーバ装置120とが通信網102を通じて情報をやりとりするため、類語登録部186による新たな単語として多数のサンプルを取得でき、多岐のバリエーションを形成できる。したがって、サービス提供者側が主体となってデータを蓄積しなくとも、複数のユーザ112による多数のサンプルによって自動的にグループ内の類語が増え、目的単語や述単語が目的語グループ210や述語グループ220内に存在する確率が高まり、ユーザ112は、閲覧情報202をより効率的に閲覧することが可能となる。
また、上述した実施形態では、通信網102を介して本実施形態のサービスを提供する情報閲覧システム100を説明したが、クライアント装置110が目的語グループ特定部174、述語グループ特定部176、案内情報特定部178、閲覧情報特定部180、頻度更新部182、再入力促進部184、類語登録部186を備え、閲覧情報群200、目的語グループ群208、述語グループ群218、および、マトリクステーブル228を、クライアント通信部146を通じてサーバ装置120からダウンロードする、または、任意の記憶媒体からインストールして用い、スタンドアローンで本実施形態を実現することもできる。
(第2の実施形態:閲覧情報生成装置300)
第1の実施形態で説明した情報閲覧システム100では、ユーザ112に目的語と述語とを入力させるだけで、予め準備された複数の閲覧情報群200からユーザが所望する適切な閲覧情報202を効率的に抽出することができるようになった。第2の実施形態においては、このような情報閲覧システム100を構築するため、任意の閲覧情報をユーザが所望する適切な位置に自動的に配置し閲覧情報群200を生成する閲覧情報生成装置300を説明する。
図16は、閲覧情報生成装置300の電気的構成を示した機能ブロック図である。閲覧情報生成装置300は、操作部310と、表示部312と、装置メモリ314と、装置通信部316と、装置制御部318とを含んで構成される。当該閲覧情報生成装置300は、第1の実施形態で説明した閲覧情報群200自体を生成することを目的とし、生成された閲覧情報群200はサーバ装置120のサーバメモリ160に保持される。したがって、閲覧情報生成装置300をサーバ装置120と独立して構成してもよいし、サーバ装置120と一体的に構成することもできる。
操作部310は、キーボード、ポインティングデバイス、十字キー、ジョイスティック、ジョグダイヤル、タッチパネル、音声認識(音声入力)デバイス等で構成され、製作者(ユーザ)の操作入力を受け付ける。表示部312は、液晶ディスプレイ、有機ELディスプレイ等で構成される。
装置メモリ314は、HDD、フラッシュメモリ、RAM等の記憶媒体で構成され、後述する装置制御部318で利用されるOS、制御プログラム、ブラウザプログラム、通信処理プログラム等の情報を保持する。装置通信部316は、TCP/IP等のプロトコルを用い、通信網102を通じてサーバ装置120と通信接続を行う。装置制御部318は、中央処理装置(CPU)を含む半導体集積回路で構成され、装置メモリ314や他の電子回路と協働して閲覧情報生成装置300全体を管理および制御する。また、装置制御部318は、装置送信制御部320、テキスト取得部322、目的語決定部324、述語決定部326、階層特定部328、テキスト配置部330としても機能する。
装置送信制御部320は、サーバ装置120にアクセスし、サーバ装置120に対して、生成した閲覧情報群200を送信する。
テキスト取得部322は、閲覧情報と、この閲覧情報を特定するための閲覧特定情報(最下位階層(閲覧情報202)の1段上の階層における選択肢204)との組み合わせを含む予め準備されたテキスト文を取得する。閲覧特定情報と閲覧情報は、選択肢とその選択肢に対する回答に相当する。また、FAQにおいて、閲覧特定情報と閲覧情報は、質問とその回答に相当する。テキスト文のフォーマットは例えばカンマで区切ったCSV(Comma Separated Values)形式を用いることもできる。ここで、FAQ等のテキスト文は、過去にユーザから受けた質問に対する電話対応による回答を、時系列にリスト化したものを、そのまま利用することができる。ただし、この時点では、文章が乱雑に羅列されている状態なので、本実施形態では、このテキスト文を閲覧情報群200として適切に形成することを目的としている。
目的語決定部324は、テキスト文の閲覧特定情報から、例えば形態素解析を利用して目的語を抽出し、代表目的語を決定し、述語決定部326は、同テキスト文の閲覧特定情報から、例えば形態素解析を利用して述語を抽出し、代表述語を決定する。具体的に、目的語決定部324および述語決定部326は、まず、テキスト文から閲覧特定情報を抽出する。ここでは、閲覧特定情報として図17(a)に示す、(1)「どのようなメディアに保存できますか」、(2)「DVD−Rには、何時間分保存できますか」、(3)「コピーできるディスクの種類を知りたい」、(4)「推奨するSDカードを教えて下さい」、(5)「DVD−RWは、何回くらい上書きできますか」、(6)「DVDライタに接続できません」を例示し、その形態素解析の結果をそれぞれ図17(b)に示している。
例えば、(1)「どのようなメディアに保存できますか」に着目すると、図17(b)に示された形態素解析の結果において、名詞「メディア」が目的語となり、そのまま代表目的語となる。また、サ変他動詞語幹となる名詞(名サ他)「保存」と動詞「できる」が述語となり、いずれも代表述語の候補となる。続いて、(2)「DVD−Rには、何時間分保存できますか」に着目すると、図17(b)に示された形態素解析の結果において、名詞「DVD−R」、「何時間」が目的語となり、いずれも代表目的語の候補となる。また、サ変他動詞語幹となる名詞「保存」と動詞「できる」が述語となり、いずれも代表述語の候補となる。他の(3)〜(6)も同様に目的語および述語を抽出する。
続いて、目的語決定部324および述語決定部326は、抽出した目的語や述語が複数ある場合、その中から1の代表目的語および代表述語を決定する。図18は、代表目的語を決定するための目的語表350を示し、図19は、代表述語を決定するための述語表352を示している。目的語や述語は類語毎にグループ化され、また、そのグループ単位で優先順位が付されている。
ここで、優先順位は、対象となる閲覧特定情報と閲覧情報との組み合わせを閲覧情報群200の適切な階層に配置するためのもので、閲覧情報群200のツリー構造の下位階層に相当する目的語や述語の優先順位が高くなるように設定されている。即ち、選択肢や質問の内容によって、その回答を特定(限定)し易い目的語や述語ほど、優先順位が高くなっている。
例えば、図17(b)に示した(2)「DVD−Rには、何時間分保存できますか」の例では、目的語表350における目的語「DVD−R」の優先順位は3であり、目的語「何時間」(類語「時間」)の優先順位は11なので、優先順位の高い目的語「DVD−R」が代表目的語となる。同様に、図17(b)に示した(1)「どのようなメディアに保存できますか」や(2)「DVD−Rには、何時間分保存できますか」の例では、述語表352における述語「保存」の優先順位は2であり、述語「できる」の優先順位は11なので、優先順位の高い述語「保存」が代表述語となる。
また、優先順位は、テキスト文を、上位階層が等しい選択肢の下位階層においてどの階層に配置すべきかが特定されれば足り、上位階層が異なる選択肢の下位階層間に優先順位を付しても大した効果は得られない。したがって、上位階層が異なる場合、その上位階層の選択肢毎に上記図18や図19に示した目的語表や述語表を設けてもよい。
ここでは、目的語決定部324および述語決定部326が、図18の目的語表350や図19の述語表352を参照して類語と優先順位を一度に抽出する例を挙げて説明したが、かかる場合に限られず、例えば、図20のように、目的語類語表354によってその候補となった目的語の基本語(類語中の代表単語)を抽出し、目的語優先順位表356によってその基本語の優先順位を判定するといったように2段階で代表目的語を決定してもよく、同様に、図21のように、述語類語表358によってその候補となった述語の基本語を抽出し、述語優先順位表360によってその基本語の優先順位を判定するといったように2段階で代表述語を決定してもよい。
また、ここでは、目的語や述語の抽出に形態素解析を用いているが、必ずしも形態素解析を用いる必要はなく、目的語決定部324および述語決定部326は、上記目的語表350や述語表352に含まれる単語と直接比較し、一致したものを目的語や述語として抽出することもできる。
さらに、ここでは、目的語決定部324および述語決定部326が、選択肢や質問に相当する閲覧特定情報から目的語を抽出しているが、回答に相当する閲覧情報から目的語を抽出することもできる。
階層特定部328は、マトリクステーブルを用い、目的語決定部324によって決定された代表目的語および述語決定部326によって決定された代表述語に基づいて閲覧情報群200のツリー構造の階層を特定する。
図22は、階層を特定するためのマトリクステーブル362を説明するための説明図である。マトリクステーブル362では、図22における縦方向に配された複数の代表目的語364と、横方向に配された複数の代表述語366とが掛け合わされた2次元配列となっており、1の代表目的語と1の代表述語に基づいて幹番号368が導き出されるようになっている。幹番号368は、後述する閲覧情報群200への閲覧情報の配置に用いられる。
図23は、階層特定部328の動作を説明するための説明図である。図17を用いて説明した6つのテキスト文の閲覧特定情報について、目的語決定部324および述語決定部326により、図23(a)に示された代表目的語364および代表述語366が決定される。階層特定部328は、上述したマトリクステーブル362を用い、その代表目的語364および代表述語366に基づいて、代表目的語364および代表述語366に対応する幹番号368を特定する。
例えば、図22に示すように、階層特定部328は、テキスト文「どのようなメディアに保存できますか」に関し、マトリクステーブル362において、代表目的語「メディア」に対応する8行目と代表述語「保存」に対応する2列目とが交わるところに示される幹番号「_1_1」を特定する。他のテキスト文も同様の処理により、図23(a)の如く幹番号368が特定される。かかる幹番号368は、閲覧情報群200のツリー構造の階層に対応した数値で表され、入力されることが予想される組み合わせについて予め設定されている。
テキスト配置部330は、特定された階層にテキスト文を配置する。図23(a)のように各テキスト文の幹番号368を全て特定すると、テキスト配置部330は、まず、その幹番号368における階層のクラスに対応した順番にテキスト文をソートする。階層のクラスは、図23(b)に示すように、幹番号368の左に位置する番号から第1クラス、第2クラス…と対応しており、クラスの序数が小さいほど、階層が上位であることを示し、また、クラス内の数値はツリー構造の幹の順番にそれぞれ対応している。
また、かかる幹番号368をファイル管理するにあたり、幹番号368の桁数を揃えるべく、幹番号368のクラスが最大値に満たない場合は、その下のクラスとして「_0」を付す。例えば、図23(c)のように、クラスの桁数が最大の5ある幹番号「_1_2_1_2_2」については実質的な幹番号368の変更を伴わないが、クラスの桁数が2しかない幹番号「_1_1」には「_0」を最大値に満たないクラス分追加し、幹番号「_1_1_0_0_0」に変換する。このように全てのテキスト文に関して、クラスの桁数を揃えることで適切にソートを行うことができる。
そして、このようにソートされた幹番号368とテキスト文は、閲覧情報群200として、一度に、マークアップ記述言語XMLで記述され、XMLデータとして出力される。かかるXMLデータは、ツリー構造を構成する。
図24は、XMLデータのテキスト例を示している。ここでは、23の任意のテキスト文に関して幹番号368を導出し、そのクラスに対応させてXMLデータを生成している。図24のXMLデータにおいて、「質問xxx01」は閲覧特定情報に相当し、「回答xxx01」は閲覧情報に相当する。また、「回答xxx01」等の閲覧情報は、テキスト文によって内容を直接把握できるものもあれば、「http://〜」等、WebページのURLによって、回答に対応するhtmlに遷移することもある。
図25は、図24のXMLデータによる閲覧情報群200のツリー構造を示した説明図である。ここでは、XMLデータにもあるように、最上位階層として「保存(_1)」、「撮影(_2)」、「再生(_3)」、「編集(_4)」の選択肢(幹)があり、「保存」の幹にはさらに「メディア(_1_1)」および「機器(_1_2)」の幹が階層を異にして続いている。また、「メディア」の幹にはさらに「光ディスク(_1_1_1)」や「SDカード(_1_1_2)」といった幹が階層を異にして続いている。
また、ソートされた結果、図23(a)における(1)「どのようなメディアに保存できますか」の幹番号は「_1_1」なので、幹番号「_1_1」である図25における「メディア」直下の「質問xxx12」の位置に配置され、(2)「DVD−Rには、何時間分保存できますか」の幹番号は「_1_1_1_2_1」なので、図25「DVD−R」直下の「質問xxx05」の位置に配置され、(3)「コピーできるディスクの種類を知りたい」の幹番号は「_1_1_1」なので、図25「光ディスク」直下の「質問xxx09」の位置に配置され、(4)「推奨するSDカードを教えて下さい」の幹番号は「_1_1_2」なので、図25「SDカード」直下の「質問xxx10」の位置に配置され、(5)「DVD−RWは、何回くらい上書きできますか」の幹番号は「_1_1_1_2_2」なので、図25「DVD−RW」直下の「質問xxx07」の位置に配置され、(6)「DVDライタに接続できません」の幹番号は「_1_2_1_2_2」なので、図25「DVDライタ」直下の「質問xxx19」の位置に配置される。また、テキスト文の閲覧特定情報である(1)「どのようなメディアに保存できますか」に対応したテキスト文の閲覧情報である、例えば「Blu−ray、DVD、SDカードです。」は図25の「質問xxx12」の回答として「回答xxx12」の位置に配置されることになる。
このようにして生成された閲覧情報群200の「メディア」等の選択肢および「質問xxx01」等の閲覧特定情報は、図4に示した閲覧情報群200の選択肢204に相当し、「回答xxx01」等の閲覧情報は、図4に示した閲覧情報群200の閲覧情報202に相当することとなる。
以上、説明した閲覧情報生成装置300による閲覧情報生成に関する全体的な処理の流れを図26、図27、図28のフローチャートを用いて説明する。
(閲覧情報生成方法)
図26のフローチャートを参照すると、まず、閲覧情報生成装置300のテキスト取得部322は、閲覧特定情報と閲覧情報とを含むテキスト文を取得し(S400)、目的語決定部324および述語決定部326は、取得されたテキスト文の閲覧特定情報を形態素解析し、それぞれ目的語と述語を抽出する(S402)。
そして、目的語決定部324および述語決定部326は、抽出された1または複数の目的語と述語をそれぞれ基本語に類語変換し(S404)、目的語決定部324は、抽出された目的語が目的語表350内に含まれているか否か比較し(S406)、目的語が目的語表350内のいずれかの単語と一致していれば(S408におけるYES)、代表目的語決定処理S412に移行し、一致してなければ(S408におけるNO)、最下位の優先順位でその目的語を登録してから(S410)、代表目的語決定処理S412に移行する。このように不一致の目的語は一旦優先順位が最下位になるが、事後的に適切な優先順位に移動させるのが望ましい。
図27に示す代表目的語決定処理S412において、目的語決定部324は、メモリに記憶されている最高順位の単語とその優先順位をクリアし(S450)、形態素解析によって抽出された1または複数の目的語を取得する(S452)。
そして、目的語決定部324は、取得した目的語が目的語表350内に含まれているか否か比較し(S454)、目的語が目的語表350内のいずれかの単語と一致していれば(S456におけるYES)、その目的語の基本語とその優先順位を、保持された最高順位の単語とその優先順位と比較し(S458)、新たな目的語の方が、優先順位が高い場合(S460におけるYES)、最高順位の単語とその優先順位に新たな目的語の基本語とその優先順位を上書きする(S462)。目的語が目的語表350内のいずれかの単語と一致していない場合(S456におけるNO)、または、新たな目的語の方が、優先順位が低い場合(S460におけるNO)、何らの処理も実行しないで次の完了確認処理S464に移行する。
そして、全ての目的語について、当該処理が完了したか判定され(S464)、完了していなければ(S464におけるNO)、目的語取得処理S452からを繰り返す。目的語の処理が完了していれば(S464におけるYES)、メインルーチンに戻る。
続いて、述語決定部326は、抽出された述語が述語表352内に含まれているか否か比較し(S414)、述語が述語表352内のいずれかの単語と一致していれば(S416におけるYES)、代表述語決定処理S420に移行し、一致してなければ(S416におけるNO)、最下位の優先順位でその述語を登録してから(S418)、代表述語決定処理S420に移行する。このように不一致の述語は一旦優先順位が最下位になるが、事後的に適切な優先順位に移動させるのが望ましい。
図28に示す代表述語決定処理S420において、述語決定部326は、メモリに記憶されている最高順位の単語とその優先順位をクリアし(S470)、形態素解析によって抽出された1または複数の述語を取得する(S472)。
そして、述語決定部326は、取得した述語が述語表352内に含まれているか否か比較し(S474)、述語が述語表352内のいずれかの単語と一致していれば(S476におけるYES)、その述語の基本語とその優先順位を、保持された最高順位の単語とその優先順位と比較し(S478)、新たな述語の方が、優先順位が高い場合(S480におけるYES)、最高順位の単語とその優先順位に新たな述語の基本語とその優先順位を上書きする(S482)。述語が述語表352内のいずれかの単語と一致していない場合(S476におけるNO)、または、新たな述語の方が、優先順位が低い場合(S480におけるNO)、何らの処理も実行しないで次の完了確認処理S484に移行する。
そして、全ての述語について、当該処理が完了したか判定され(S484)、完了していなければ(S484におけるNO)、述語取得処理S472からを繰り返す。述語の処理が完了していれば(S484におけるYES)、メインルーチンに戻る。
階層特定部328は、マトリクステーブル362を用い、代表目的語364および代表述語366に基づいて閲覧情報群200のツリー構造の階層を特定し(S422)、テキスト配置部330は、特定された階層にテキスト文を配置する(S424)。そして、全てのテキスト文について、当該処理が完了したか判定され、完了していなければ(S426におけるNO)、テキスト文取得処理S400からを繰り返す。
テキスト文の処理が完了していれば(S426におけるYES)、テキスト文に基づいて導出された幹番号に従ってテキスト文をソートし(S428)、ソート結果をマークアップ記述言語であるXMLデータに変換して閲覧情報群200として出力する(S430)。
以上、説明した閲覧情報生成装置300や閲覧情報生成方法によって、予め準備された閲覧情報に相当するテキスト文の閲覧特定情報の目的語と述語により、テキスト文が配置されるべき幹番号368を容易に特定でき、情報閲覧システム100における閲覧情報群200に適切かつ容易にテキスト文(閲覧特定情報+閲覧情報)を配置することで、製作者の負担を軽減することが可能となる。
また、コンピュータを、閲覧情報生成装置300として機能させるプログラムや当該プログラムを記録した、コンピュータで読み取り可能なフレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD(Compact Disc)、DVD、BD等の記憶媒体も提供される。ここで、プログラムは、任意の言語や記述方法にて記述されたデータ処理手段をいう。
(第3の実施形態:閲覧情報生成装置500)
第2の実施形態で予め準備された複数のテキスト文を用いて閲覧情報群200を一度に生成する閲覧情報生成装置300を説明した。このように生成された閲覧情報群200を情報閲覧システム100に反映した後、新たなFAQ等が生じた場合、そのFAQを逐次閲覧情報群200に追加することで、閲覧情報群200で参照可能な閲覧情報が充実し、より使い勝手が向上する。しかし、追加対象となる閲覧情報を、閲覧情報群200の元となったテキスト文に加えて再度、閲覧情報群200を生成すると手間がかかる。そこで、第3の実施形態では、そのように生成した閲覧情報群200に対し事後的に閲覧情報を簡易な操作入力を通じて容易に追加、削除、編集する技術を説明する。
図29は、閲覧情報生成装置500の電気的構成を示した機能ブロック図である。閲覧情報生成装置500は、操作部310と、表示部312と、装置メモリ314と、装置通信部316と、装置制御部318とを含んで構成される。また、装置制御部318は、装置通信制御部520、対象語取得部522、階層特定部524、テキスト配置部526、削除特定部528、削除実行部530、編集特定部532、編集実行部534、階層指定促進部536としても機能する。第2の実施形態における構成要素として既に述べた操作部310と、表示部312と、装置メモリ314と、装置通信部316と、装置制御部318とは、実質的に機能が同一なので重複説明を省略し、ここでは、構成が相違する装置通信制御部520、対象語取得部522、階層特定部524、テキスト配置部526、削除特定部528、削除実行部530、編集特定部532、編集実行部534、階層指定促進部536を主に説明する。
装置通信制御部520は、サーバ装置120にアクセスし、サーバ装置120に保持されている閲覧情報群200を改編する。他の機能部である対象語取得部522、階層特定部524、テキスト配置部526、削除特定部528、削除実行部530、編集特定部532、編集実行部534、階層指定促進部536に関しては、その処理と併せて説明する。
(閲覧情報の追加処理)
例えば、図4に示した閲覧情報群200においては、DVDの保存方法として「DVDライタ」および「DVDレコーダ」の選択肢204が準備されている。ここで、製作者は、DVDの保存方法として「パソコン」という新たな選択肢204を追加し、その「パソコン」を閲覧特定情報とした上で、閲覧情報としてパソコンの保存方法を示すURLを追加することを試みる。
図30、図31および図33は、製作者による目的単語と述単語の入力処理を示した説明図である。対象語取得部522は、表示部312に、図30(a)のような、目的単語と述単語の入力を促す入力画面550を表示し、製作者は、操作部310を通じて、入力画面550の目的語ボックス552に目的単語を、述語ボックス554に述単語を入力し、確定ボタン556を選択決定する。本実施形態では、単純にキーワードを羅列するだけでなく、製作者が希望する具体的な動作(目的語と述語)を入力してもらい、それに準じて、閲覧情報群200の階層を特定する。
例えば、デジタルビデオムービーのオンラインマニュアルを改編する際、製作者が、上述したようにDVDへの保存に関する項目「パソコン」の追加を希望している場合、図30(b)のように、入力画面550の目的語ボックス552に「DVD」を、述語ボックス554に「保存」を入力する。そうすると、その目的単語と述単語とで「DVD(に)保存(したい)」という文章が形成される。かかる製作者の入力を受けて、対象語取得部522は、目的語ボックス552に入力された目的単語「DVD」を目的語として、述語ボックス554に入力された述単語「保存」を述語として取り込む。
階層特定部524は、図22に示したようなマトリクステーブル362を用い、対象語取得部522が取得した目的語および述語に基づき、階層特定部328と同様の処理を通じて閲覧情報群200のツリー構造の階層を特定する。ここでは、目的語「DVD」および述語「保存」から「DVDディスクへの保存のシナリオ」(「image_cpy_xml」のdvd)階層が特定されたとする。階層特定部524は、階層が特定されると、図30(c)に示す特定結果画面558を表示部312に表示し、表示枠560a、560bを通じて特定した階層に設定されている閲覧特定情報(選択肢204)である「DVDライタ」と「DVDレコーダ」とを製作者に提示する。このとき、製作者が追加ボタン562を選択決定すると、対象語取得部522は、図31の追加画面570を表示する。
対象語取得部522が追加画面570を表示すると、製作者は、操作部310を通じて、追加画面570の閲覧特定情報ボックス572に閲覧特定情報を、閲覧情報ボックス574に閲覧情報を入力し、確定ボタン576を選択決定する。例えば、図31(b)に示すように、製作者が、追加画面570の閲覧特定情報ボックス572に「パソコン」を、閲覧情報ボックス574にパソコンでの保存方法のURLを入力すると、対象語取得部522は、入力された単語を閲覧特定情報および閲覧情報として取り入れる。
テキスト配置部526は、このように階層特定部524に特定された階層(「image_cpy_xml」のdvd)に、対象語取得部522で取得された閲覧特定情報(「パソコン」)および閲覧情報(パソコンでの保存方法のURL:「http://***」)を関連付けて配置する。こうして図32の閲覧情報群200に示すように、新たに選択肢204としての閲覧特定情報「パソコン」とその閲覧情報であるパソコンでの保存方法のURLが追加される。
(閲覧情報の削除処理)
また、上述した閲覧特定情報や閲覧情報の追加のみならず、既に設定されている閲覧特定情報や閲覧情報を削除することもある。ここでは、仮に、製作者が、DVDの保存方法として設定されている「DVDレコーダ」を削除するとする。閲覧情報の追加処理同様、対象語取得部522は、目的語と述語を取得し、階層特定部524は、マトリクステーブル362を用い、目的語および述語に基づいて閲覧情報群200のツリー構造の階層を特定する。こうして、階層特定部524は、図33(a)に示す特定結果画面558を表示する。
ここで、表示枠560a、560bに表示された閲覧特定情報(選択肢204)である「DVDライタ」と「DVDレコーダ」とは削除候補ともなる。製作者が、このような閲覧特定情報から、削除を所望する例えば「DVDレコーダ」を選択決定すると、図33(b)に示すように、表示枠560bは枠内が反転表示されると共に削除ボタン564が有効化される。この処理は、削除特定部528が、階層特定部524で特定された階層に配置された閲覧特定情報または閲覧情報を表示し、操作部310を通じて削除対象となる閲覧特定情報または閲覧情報を特定させる処理に相当する。
そして、製作者が削除ボタン564を選択決定すると、削除実行部530は、削除特定部528に特定された、閲覧特定情報とそれに関連付けられた閲覧情報、または、閲覧情報とそれに関連付けられた閲覧特定情報、ここでは、閲覧特定情報「DVDレコーダ」と、それに関連付けられた閲覧情報「DVDレコーダの使い方のURL」を削除する。
(閲覧情報の編集処理)
さらに、上述した閲覧特定情報や閲覧情報の追加や削除のみならず、既に設定されている閲覧特定情報や閲覧情報を編集することもある。ここでは、仮に、製作者が、DVDの保存方法として設定されている「DVDレコーダ」を編集するとする。閲覧情報の追加処理や削除処理同様、対象語取得部522は、目的語と述語を取得し、階層特定部524は、マトリクステーブル362を用い、目的語および述語に基づいて閲覧情報群200のツリー構造の階層を特定する。こうして、階層特定部524は、図33(a)に示す特定結果画面558を表示する。
ここで、表示枠560a、560bに表示された閲覧特定情報(選択肢204)である「DVDライタ」と「DVDレコーダ」とは編集候補ともなる。製作者が、このような閲覧特定情報から、編集を所望する例えば「DVDレコーダ」を選択決定すると、図33(b)に示すように、表示枠560bは枠内が反転表示されると共に編集ボタン566が有効化される。この処理は、編集特定部532が、階層特定部524で特定された階層に配置された閲覧特定情報または閲覧情報を表示し、操作部310を通じて編集対象となる閲覧特定情報または閲覧情報を特定させる処理に相当する。
編集実行部534は、編集特定部532に特定された、閲覧特定情報とそれに関連付けられた閲覧情報、または、閲覧情報とそれに関連付けられた閲覧特定情報、ここでは、閲覧特定情報「DVDレコーダ」と、それに関連付けられた閲覧情報「DVDレコーダの使い方のURL」を、操作部310を通じて編集させる。
階層指定促進部536は、上述した閲覧情報の追加処理、削除処理、編集処理において、階層特定部524が目的語と述語とによって階層を特定できなかった場合、また、階層は特定できたが、その階層が、製作者が所望する階層でなかった場合に、閲覧情報群200のツリー構造全体を表示し、操作部310を通じて製作者に所望する階層を指定させる。
以上、説明した閲覧情報生成装置500による閲覧情報群200を生成、改編する全体的な処理の流れを図34のフローチャートを用いて説明する。
(閲覧情報生成方法)
図34のフローチャートを参照すると、まず、対象語取得部522は、表示部312に、目的単語と述単語の入力を促す入力画面550を表示し(S600)、階層特定部524は、マトリクステーブル362を用い、製作者が入力画面550に入力した目的語および述語に基づき、閲覧情報群200のツリー構造の階層を特定する(S602)。ここで、階層が特定されないと(S604におけるNO)、階層指定促進部536は、閲覧情報群200のツリー構造全体を表示し、操作部310を通じて製作者に所望する階層を指定させる(S606)。階層が特定されると(S604におけるYES)、次の特定結果画面表示処理S608に移行する。
続いて、階層特定部524は、特定結果画面558を通じて特定された階層を表示し(S608)、製作者の操作部310を通じた操作入力待ちに移行する(S610におけるNO)。ここで、製作者が追加ボタン562を選択決定すると(S612におけるYES)、対象語取得部522は追加画面570を表示し(S614)、追加画面570を通じて閲覧特定情報および閲覧情報が取得されると(S616)、テキスト配置部526は、階層特定部524に特定された階層に、対象語取得部522で取得された閲覧特定情報および閲覧情報を関連付けて配置する(S618)。
また、製作者が削除ボタン564を選択決定すると(S620におけるYES)、削除実行部530は、削除ボタン564が選択決定される前に予め選択されている閲覧特定情報とそれに関連付けられた閲覧情報、または、閲覧情報とそれに関連付けられた閲覧特定情報を削除する(S622)。
また、製作者が編集ボタン566を選択決定すると(S624におけるYES)、編集実行部534は、編集ボタン566が選択決定される前に予め選択されている閲覧特定情報とそれに関連付けられた閲覧情報、または、閲覧情報とそれに関連付けられた閲覧特定情報を編集する(S626)。
さらに、特定された階層が、製作者が所望する階層でなかった場合に、製作者が特定結果画面558をキャンセルすると(S628におけるYES)、階層指定促進部536は、閲覧情報群200のツリー構造全体を表示し、操作部310を通じて製作者に所望する階層を指定させる(S630)。閲覧情報生成方法では、上記の処理を繰り返す。
以上、説明した閲覧情報生成装置500により、情報閲覧システム100における閲覧情報群200のツリー構造を把握していない場合であっても、また、ツリー構造の階層が深い場合であっても、そのツリー構造の多数の階層うち、閲覧情報を追加、削除、編集を所望する階層を、目的語と述語のみで適切かつ容易に特定することで、製作者の負担を軽減することが可能となる。このように閲覧情報群200の追加、削除、編集が容易になることで、複数の製作者によって内容が充実した閲覧情報群200をユーザに提供することができる。
また、目的語と述語とによって階層を特定できなかった場合や、階層は特定できたが、その階層が、製作者が所望する階層でなかった場合においても、閲覧情報群200のツリー構造全体から目的とする階層を特定することができるので、閲覧情報群200を効率的に生成することが可能となる。
また、コンピュータを、閲覧情報生成装置500として機能させるプログラムや当該プログラムを記録した、コンピュータで読み取り可能なフレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD、DVD、BD等の記憶媒体も提供される。ここで、プログラムは、任意の言語や記述方法にて記述されたデータ処理手段をいう。
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
なお、本明細書の閲覧情報生成方法における各工程は、必ずしもフローチャートおよびシーケンス図として記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。