以下に添付図面を参照して、検索装置、方法及びプログラムの最良な実施形態を詳細に説明する。なお、以下に説明する実施形態では、TV端末やAV−PC等に搭載される検索装置について説明するが、適用される態様はこれに限らないものとする。
[第1の実施形態]
まず、図1を参照して、本実施形態の検索装置について説明する。図1は、検索装置1のハードウェア構成を示したブロック図である。図1に示すように、検索装置1は、CPU(Central Processing Unit)11、入力部12、表示部13、ROM(Read Only Memory)14、RAM(Random Access Memory)15、通信部16及び記憶部17等を備え、各部はバス18により接続されている。なお、後述する検索装置2〜4についても、検索装置1と同様のハードウェア構成を備えているものとする。
CPU11は、RAM15の所定領域を作業領域として、ROM14又は記憶部17に予め記憶された各種制御プログラムとの協働により各種処理を実行し、検索装置1を構成する各部の動作を統括的に制御する。
また、CPU11は、ROM14又は記憶部17に予め記憶された所定のプログラムとの協働により、後述する受付部21、音声認識部22、音声認識辞書生成部23、単語拡張部24、検索単語選択部25、コンテンツ検索部26、コンテンツ選択部27、再生制御部28、コンテンツ受信部29、日時計測部30等の各機能部を実現させる。なお、各機能部の詳細については後述する。
入力部12は、操作ボタンや音声入力装置を有し、ユーザから操作入力された内容を指示信号として受け付け、CPU11に出力する。
図2は、入力部12の一例を示した図であって、入力部12をリモコン型とした場合の外観構成を示している。同図において、電源ボタン121は検索装置1のオンとオフとを切り替える切り替えスイッチである。ユーザは、この電源ボタン121を押下し、検索装置1をオンとすることで、検索装置1は検索可能な状態へと移行する。
マイクロフォン122は、マイクロフォン等の音声入力装置である。検索ボタン123の押下中にマイクロフォン122に音声が入力されることで、この音声信号が後述する受付部21に出力されるようになっている。
検索ボタン123は、検索装置1に検索処理の実行を指示するための指示ボタンである。検索装置1は、当該検索ボタン123の押下信号に応じ、後述する各機能部によりコンテンツの検索に係る種々の動作を実行する。スピーカ124は、スピーカやブザー等の音声出力装置であって、ユーザの操作に応じた操作音や、警告音等を出力する。
選択ボタン125は、表示部13に表示された表示画面からユーザが所望する項目を選択するための選択手段である。また、決定ボタン126は、選択ボタン125により選択された項目を確定するための指示手段である。この決定ボタン126が押下されることで、選択ボタン125により選択された項目を指示する指示信号が後述する検索単語選択部25又は再生制御部28に出力されるようになっている。
戻るボタン127は、表示部13に表示された画面を直前の画面に戻す場合や、直前の処理に戻す場合等に操作するための指示手段である。また、ヘルプボタン128は、入力部12を用いたコンテンツの検索操作に関する使い方や解説の表示を指示するための指示手段である。このヘルプボタン128が押下された場合、CPU11は記憶部17に記憶されたコンテンツの検索操作に関する使い方や解説を記したヘルプファイル(図示せず)を読み出し、表示部13に表示させる。
なお、図2に示したように入力部12をリモコン型とした場合には、検索装置1と有線により接続する態様としてもよいし、無線により接続する態様としてもよい。また、入力部12の形態はリモコン型に限らず、検索装置1と一体的に設ける態様としてもよい。
図1に戻り、表示部13は、LCD(Liquid Crystal Display)等の表示デバイスにより構成され、CPU11からの表示信号に基づいて各種情報を表示する。
ROM14は、検索装置1の制御にかかるプログラムや各種設定情報等を書き換え不可能に記憶する。
RAM15は、SDRAM等の揮発性の記憶デバイスであって、CPU11の作業エリアとして機能し、各種情報を一時的に保持するバッファ領域としての役割を果たす。
通信部16は、図示しないネットワークを通じ外部装置との間で通信を行うインタフェースである。通信部16は、受信した各種情報をCPU11に出力し、また、CPU11から出力される各種情報を外部装置へと送信する。また、通信部16は、図示しない放送局から番組の放送を受信する受信装置としての機能も有するものとする。
記憶部17は、磁気的又は光学的に記録可能な記憶媒体を有し、検索装置1の制御にかかるプログラムや各種設定情報等を書き換え可能に記憶する。また、記憶部17は、その記憶領域に後述するコンテンツ記憶部171、単語辞書172、音声認識辞書173等を予め記憶している。
次に、図3を参照して、CPU11とROM14又は記憶部17に記憶されたプログラムとの協働により実現される検索装置1の各機能部について説明する。図3は、検索装置1の機能的構成を示したブロック図である。
図3に示したように、検索装置1は、受付部21、音声認識部22、音声認識辞書生成部23、単語拡張部24、検索単語選択部25、コンテンツ検索部26、コンテンツ選択部27、再生制御部28、コンテンツ受信部29、日時計測部30を備えている。また、記憶部17は、コンテンツ記憶部171、単語辞書172、音声認識辞書173を記憶している。
まず、記憶部17に記憶された各情報について説明する。コンテンツ記憶部171は、検索装置1で検索可能なコンテンツを記憶する記憶領域であって、テレビジョン等の番組表を記憶するコンテンツ情報記憶部1711と、録画或いは録音した動画や写真、音楽等のコンテンツ素材を記憶するコンテンツ素材記憶部1712とを有している。
ここで、コンテンツ情報記憶部1711に記憶される番組表は、EPGと呼ばれる電子番組表データであって、そのデータ形式は、図4に示したようにXML(eXtensible Markup Language)形式で記述されている。
図4は、コンテンツ情報記憶部1711に記憶された電子番組表データの一例を示した図である。同図において、「<?xml version=“1.0”encoding=“UTF−8”?>」のタグは、本電子番組表データがXML形式で記述されていることを示しており、続く「<epgdata>」から、文末の「</epgdata>」までのタグが、電子番組表データの本文であることを示している。
また、「<contents cnt=“3802”>」のタグは、取得した電子番組表データのIDを示すものであり、「<dt dy=“2005/10/08”/>」のタグは、本電子番組表データが、2005年10月8日の配信分であることを示している。また、「<ch cd=“A044001”/>」のタグは、チャンネルコードを示すものであり、チャンネルコードがA04401であることを示している。
「<program>」のタグは、TV番組に関する番組データが以下に続くことを示しており、その終了は「</program>」となっている。この、「<program>」から「</program>」までのタグが、一の番組(コンテンツ)を表している。以下、同様の形式で「<program>」と「</program>」とのタグに挟まれた番組が続いている。なお、本実施形態では、電子番組表データ内に記述された各番組に関する情報を独立したコンテンツ(コンテンツ素材)とし、コンテンツ素材記憶部1712に記憶されたコンテンツ素材(動画データや音楽データ)と同様に取り扱う。
最初の番組において、「<dt>2005/10/08</dt>」のタグは、この番組が放送される放送日を示しており、「<ch>A044001<ch>」のタグは、チャンネルコードを、「<bc>NNN総合</bc>」のタグはチャンネル名称を示すものである。「<st>13:00</st>」のタグは番組開始時刻を、「<et>13:15</et>」のタグは番組終了時刻を示している。また、「<gb>00</gb>」のタグは番組のジャンルを示しており、「<tn>ニュース</tn>」のタグは番組タイトルを示すものである。そして、「<cn>・・・</cn>」のタグは番組の内容を示すものである。なお、ここで「<gb>00</gb>」の「00」はニュース番組を示すものとする。
また次の番組において、「<gb>30</gb>」の「30」は番組のジャンルとしてドラマを示すものとする。この番組内において、「<bm>[多][分]</bm>」のタグは、放送形式を示すものであり音声多重及び文字放送であることを示している。また、「<gt>[作]土井美和子[出]杉田薫[出]的場司</gt>」のタグは、この番組の制作に係わった人名を簡略的に示すものであり、「[作]」はこのドラマの作者を、「[出]」は出演者を示している。
続く「<go>」と「</go>」とに挟まれた各タグ内には、この番組の制作に係わった人名が入力される。ここで、「<nn…/>」のタグは、この番組(ドラマ)の作者を示すものであり、「na=」にその人名(例えば、土井美和子)が入力されている。また、「<pp…/>」のタグは、この番組の出演者を示すものであり、「na=」にその人名(例えば、杉田薫)が入力されている。なお、各タグ内において「yo=」で指示された文字列(例えば、すぎたかおる)は、その人名の「読み」を示している。また、「<co>・・・</co>」のタグは、この番組の概要を示すものである。
また次の番組において、「<gb>40</gb>」の「40」は番組のジャンルとして歌番組を示すものとする。この番組内において、「<stn>・・・</stn>」のタグは、この番組のサブタイトルを示すものである。また、「<pp>・・・</pp>」のタグは、この番組の出演者を簡略的に示すものであり、「[ゲ]」はこの歌番組のゲストを、「[司]」はこの歌番組の司会者を示している。
上記したように、電子番組表データにおいて、人名に読みが付与される番組は区々であり、一般的に番組ジャンルがドラマの場合に付与されることが多い。また、人名は、人名毎にタグで区切られて表記される場合もあるが、一般的に番組概要やサブタイトル等に列挙された形態で表記されることが多い。なお、電子番組表データは、後述するコンテンツ受信部29の制御により所定の時間毎に外部装置から受信され、所定期間分(例えば、2週間分)の放送内容を含んだ新たな電子番組表データに更新されるものとする。
一方、コンテンツ素材記憶部1712には、録画或いは録音された動画データや音楽データがコンテンツとして記憶される。ここで、放送を受信して録画されたコンテンツには、図4に示した電子番組表データの一部又は全てが付属情報として関連付けて記憶されている。
図5は、コンテンツ素材記憶部1712の各コンテンツに関連付けて記憶された付属情報の一例を示した図である。図5に示したように、付属情報には、コンテンツ(番組データ)を放送した放送局やファイルフォーマット等を表すメディア種別(メディア)や記録日時(記録日付、開始時刻、終了時刻)、番組タイトル(タイトル)、当該コンテンツの番組出演者(出演者)、コンテンツ内容の一画面を表すサムネール画像へのアドレス(サムネール)、コンテンツ本体が存在するアドレス情報(本体)、番組内容等のコンテンツに関する詳細情報(詳細)等が含まれる。ここで、「サムネール」や「本体」に格納されたアドレスにより、対応するコンテンツに付属情報が関連付けられている。なお、「アドレス」は、各付属情報のアドレス(格納アドレス)を示しており、各付属情報の登録時に自動的に付与されるものである。
図5において、第1行目(アドレス:c201)は番組ジャンルがニュース番組のコンテンツに関する付属情報であり、出演者の項目には該当する情報がないため「NULL(該当なし)」となっている。
また、第2行目(アドレス:c215)は番組ジャンルが歌番組のコンテンツに関する付属情報である。図4の電子番組表データの例で説明したように、歌番組の場合に出演者には「[出]」という識別子は付与されておらず、サブタイトル等に列挙された記述となっている。そのため、人名等を抽出するタグ解析以上の処理をしない場合には、「<pp>」タグに示された人名のみが出演者として記憶されることになる。
また、第3行目(アドレス:c233)は、CD(Compact Disk)等の音楽メディアから抽出したコンテンツに関する付属情報である。この場合には、出演者とサムネールは存在しないため、「NULL(該当なし)」となっている。
単語辞書172は、単語拡張部24が実行する後述する単語拡張処理の際に用いられる辞書情報であって、図6に示したように、各単語の「見出し毎」に、その単語の「読み」と「係累属性」と「分類属性」とが関連付けて登録されている。
ここで、係累属性とは各単語間の親子関係を表した情報であって、具体的には、正式名称とその略語や愛称等の別称との関係を表すものである。例えば、見出し「トウキョウ娘。」では、係累属性は「f1000M」となっている。ここで「f1000M」のうち「f1000」は同一グループ、即ち、同一の単語(正式名称)を親とする単語群を識別するための識別情報(係累情報)であり、同一グループの単語には共通の係累情報が付与されている。また、「M」はこのグループの語源(Mother)となる単語、つまり、正式名称であることを示している。なお、正式名称となる単語毎に互いに異なる係累情報が付与されているものとする。
正式名称以外の単語には、「M」の代りに「D」が付与されている。例えば、見出し「T娘。」をみると、係累属性は「f1000D」になっている。これは、係累「f1000M」の子供(Daughter)、つまり、「トウキョウ娘。」の別称であることを示している。なお、別称を持たない単語については、係累属性は付与されておらず、当該係累属性の非適用を意味する「NA」が付与されている。
分類属性には、各単語が表す対象の分野名が登録されており、これら分野名により各単語が分類される。なお、図6では、「人」、「タイトル」を分野名とした例を示しているが、これに限らず、「芸能人」や「その他」等の他の分野名を用いる態様としてもよい。
音声認識辞書173は、音声認識部22が行う音声認識処理時に用いられる辞書情報であって、図7に示したように、「語彙」毎に、「辞書番号」と、その語彙の「発音」と「品詞」とが関連付けて登録されている。
図7において、「辞書番号」は各単語の登録時に自動的に付与される識別情報であって、単語毎に固有の番号が付与されている。「語彙」は単語の見出しに相当するものであり、「発音」はその単語の「読み」に相当するものである。また、「品詞」は各単語の品詞を表すものである。図7に示した各単語は全て固有名詞であるため、「品詞」は全て固有名詞となっている。
次に、検索装置1の各機能部について説明する。受付部21は、入力部12から入力されるコンテンツの検索に係る種々の指示信号を受け付ける機能部である。具体的に、受付部21は、入力部12の検索ボタン123の押下を指示する指示信号を受け付けると、表示部13に検索対象となるキーワードの入力を促す画面(GUI)を表示させる。また、受付部21は、入力部12のマイクロフォン122を介して入力されたアナログの音声信号をAD変換し、変換したデジタルの音声信号を音声認識部22に出力する。なお、図2に示したように入力部12をリモコン型とした場合には、AD変換に係る部位を入力部12が備える態様としてもよい。
音声認識部22は、受付部21から入力されるデジタルの音声信号に対しFFT(高速フーリエ解析)等を行うことで、この音声信号の特徴量を抽出する。また、音声認識部22は、HMM(隠れマルコフモデル)等の技術を用い、音声信号から抽出した特徴量と、音声認識辞書173に登録された各語彙とのマッチングを行うことで、音声信号に対応する単語(群)を検索対象のキーワードとして夫々認識する。
音声認識辞書生成部23は、単語辞書172に登録された各単語に基づき、当該各単語(語彙)と発音(読み)と品詞とを関連付けて音声認識辞書173に登録することで、音声認識辞書173を生成する。ここで、音声認識辞書173の生成については、例えば、特開2007−047412号公報に開示された公知の方法を用いることができる。
具体的に、音声認識辞書生成部23は、単語辞書172に登録された各単語と、語彙の発音を定義した図示しない発音辞書とを比較し、単語辞書172に登録された単語のうち発音辞書に定義された語彙と一致する単語については、音声認識辞書173に登録を行う登録対象の語彙として識別する。また、音声認識辞書生成部23は、各語彙の品詞を定義した図示しない品詞辞書に基づいて、登録対象の語彙の品詞を識別する。また、音声認識辞書生成部23は、登録対象の語彙毎に固有の辞書番号を付与し、辞書番号と、当該辞書番号に対応する語彙と、この語彙の発音と、品詞とを関連付けて音声認識辞書173に登録する。
単語拡張部24は、音声認識部22から入力されたキーワードの文字列に基づき、キーワードに一致する単語を単語辞書172から検索するとともに、この単語に関連付けられた係累属性に基づいて、当該単語に係累する他の単語(係累単語)を単語辞書172から検索する。そして、単語拡張部24は、単語辞書172から検索した単語を、検索候補単語として表示部13に表示させる。また、単語拡張部24は、検索単語選択部25から入力された後述する検索単語と、この検索単語に係累する係累単語とを検索対象となる拡張検索単語に設定し、コンテンツ検索部26に出力する。
検索単語選択部25は、表示部13に表示された検索候補単語から特定の単語を選択する指示信号を、入力部12(選択ボタン125及び決定ボタン126)から受け付ける機能部である。以下、検索候補単語群から選択された特定の単語を検索単語という。
コンテンツ検索部26は、単語拡張部24から入力された拡張検索単語に基づいて、当該拡張検索単語に含まれた単語のうち、何れかの単語を含んだコンテンツを、コンテンツ記憶部171のコンテンツ情報記憶部1711及びコンテンツ素材記憶部1712から検索する。
具体的に、コンテンツ検索部26は、コンテンツ情報記憶部1711の番組表に記された各コンテンツに含まれる番組タイトル等の情報、及び、コンテンツ素材記憶部1712に記憶された各コンテンツの付属情報に含まれる番組タイトル等の情報に、拡張検索単語に含まれた各単語の何れかと一致する文字列が存在するか否かを判定する。また、コンテンツ検索部26は、拡張検索単語の何れかの単語と一致する文字列を含むと判定したコンテンツについて、当該コンテンツに関係するサムネール画像や情報等を表示部13に表示させる。
コンテンツ選択部27は、コンテンツ検索部26の制御により表示部13に表示された各コンテンツから特定のコンテンツを選択する指示信号を、入力部12(選択ボタン125及び決定ボタン126)から受け付ける機能部である。
再生制御部28は、検索装置1の操作を支援するための種々のGUIを表示部13に表示させる。また、再生制御部28は、コンテンツ選択部27を介して選択されたコンテンツの再生を制御する。
具体的に、再生制御部28は、コンテンツ選択部27を介して選択されたコンテンツが、コンテンツ情報記憶部1711又はコンテンツ素材記憶部1712の何れに記憶されたコンテンツかを判別し、コンテンツ素材記憶部1712の場合には、選択されたコンテンツを再生し表示部13に表示させる。
また、再生制御部28は、選択されたコンテンツが、コンテンツ情報記憶部1711に記憶されていると判断した場合、即ち、電子番組表データに記述された番組と判断した場合、この番組の放送日、開始時刻及び終了時刻を参照し、日時計測部30が計測する現在日時と比較する。なお、番組の放送日、開始時刻、終了時刻は、図4で示した電子番組表データのうち、「<dt>・・・</dt>」、「<st>・・・</st>」、「<et>・・・</et>」の各タグに挟まれた文字列部分から取得されるものとする。
ここで、再生制御部28は、選択された番組(コンテンツ)の放送日、開始時刻及び終了時刻が現在日時と時系列的に重なると判断した場合には、現在放送中の番組であるため、当該番組の放送をコンテンツ受信部29に受信させ、その内容を表示部13に表示させる。なお、選択された番組の放送日及び開始時刻が、現在日時より過去にあたると判断した場合には、当該番組の再生は不可能であるため、その旨を報知する情報を表示部13に表示させるものとする。
また、再生制御部28は、選択された番組の放送日及び開始時刻が、現在日時より未来にあたると判断した場合、即ち、放送予定の番組と判断した場合には、電子番組表データに記された放送予定日時に基づいて当該番組の録画を予約する。このように、番組の予約を行った場合には、再生制御部28は、番組の放送日時にコンテンツ受信部29により受信させ、録画を開始する。なお、ここで録画とは、番組の実データ(映像データ、音声データ)と、当該番組の電子番組表データ(付属情報)とを関連付けてコンテンツ素材記憶部1712に記憶すること意味する。
コンテンツ受信部29は、コンテンツ情報記憶部1711に記憶された電子番組表データに基づいて、再生制御部28から指示された番組の放送を受信する。
日時計測部30は、図示しないクロック生成器等から生成されるクロック信号に基づいて、現在の日付と時刻を計測する。
以下、本実施形態の検索装置1の動作について説明する。図8は、検索装置1の各機能部により実行されるコンテンツ検索・再生処理の手順を示したフローチャートである。
まず、受付部21は、入力部12から指示信号が入力されるまで待機する(ステップS11)。この状態において、入力部12の検索ボタン123が押下されたことを示す指示信号を受け付けたと判断すると(ステップS12;検索)、受付部21は、表示部13に検索対象となるキーワードの入力を促す画面を表示させる(ステップS13)。
次いで、受付部21は、検索ボタン123が押下されたことを示す指示情報の入力中に、マイクロフォン122に入力された音声の音声信号を受け付けたと判断すると、この音声信号をAD変換し音声認識部22に出力する(ステップS14)。続く音声認識部22では、ステップS14でAD変換されたデジタルの音声信号に基づいて音声認識処理を実行する(ステップS15)。
以下、図9を参照して、ステップS15の音声認識処理を説明する。図9は、音声認識処理の手順を示したフローチャートである。
まず、音声認識部22は、ステップS14でAD変換されたデジタルの音声信号に対し、FFT等を行うことで音声信号の特徴量を抽出する(ステップS151)。次いで、音声認識部22は、HMM等の技術を用い、ステップS151で抽出した特徴量と、音声認識辞書173に登録された各語彙の発音とのマッチングを行うことで、音声情報に対応する語彙(群)を夫々キーワードとして音声認識辞書173から特定する(ステップS152)。
続いて、音声認識部22は、ステップS152で特定したキーワードを単語拡張部24に出力し(ステップS153)、図8のステップS16の処理へと移行する。
図8に戻り、単語拡張部24は、音声認識部22から入力されたキーワードに基づいて単語拡張処理を実行する(ステップS16)。以下、図10を参照してステップS16の単語拡張処理を説明する。
図10は、ステップS16の単語拡張処理の手順を示したフローチャートである。まず、単語拡張部24は、音声認識部22から入力されたキーワードのうち一のキーワードを処理対象とすると(ステップS161)、このキーワードに一致する単語を単語辞書172から検索する(ステップS162)。ここで、処理対象のキーワードと一致する単語が単語辞書172に登録されていないと判定した場合(ステップS162;No)、単語拡張部24は、処理対象のキーワードが表す単語を検索候補単語として保持し(ステップS164)、ステップS168の処理へと移行する。
一方、ステップS162において、処理対象のキーワードと一致する単語が単語辞書172に登録されていると判定した場合(ステップS162;Yes)、単語拡張部24は、その単語に係累属性が付与されているか否かを判定する(ステップS163)。ここで、検索した単語に係累属性が付与されていないと判定した場合(ステップS163;No)、単語拡張部24は、処理対象のキーワードが表す単語を検索候補単語として保持し(ステップS164)、ステップS168の処理へと移行する。
また、ステップS163において、検索した単語に係累属性が付与されていると判定した場合(ステップS163;Yes)、単語拡張部24は、この単語の係累属性に基づいて、当該係累属性の係累情報と同一の係累情報を有する他の単語(係累単語)を単語辞書172から検索する(ステップS165)。そして、単語拡張部24は、ステップS165で検索した係累単語と、処理対象のキーワードと一致した単語とを、当該各単語の係累属性と関連付けて保持する(ステップ166)。以下、ステップS166で保持したものを検索結果情報という。
ここで、図6で示した単語辞書172を例とし、ステップS166で保持された検索結果情報について説明する。処理対象のキーワードが「T娘。」である場合、単語辞書172に「T娘。」が登録されているため、単語拡張部24は、係累属性が付与されているか否かの判定を行う。
ここで、単語辞書172に登録された「T娘。」の係累属性は「f1000D」であるため、単語拡張部24は、この係累属性の係累情報と同一の係累情報が付与された係累単語を単語辞書172から検索する。この場合、「T娘。」の係累情報は「f1000」であるので、この「f1000」が付与された単語、即ち、「トウキョウ娘。」(f1000M)、「娘。」(f1000D)、「TKO娘。」(f1000D)が係累単語として検索される。
ステップS166において、単語拡張部24は、検索した係累単語と、処理対象のキーワードに対応する単語とを、当該各単語の係累属性と関連付けて保持する。つまり、「(T娘。、f1000D)」、「(トウキョウ娘。、f1000M)」、「(娘。、f1000D)」及び「(TKO娘。、f1000D)」が、検索結果情報として保持されることになる。
次いで、単語拡張部24は、ステップS166で保持した検索結果情報から係累属性に語源を意味する「M」が含まれた係累単語を、処理対象のキーワードに対応する単語ととともに検索候補単語として保持し(ステップS167)、ステップS168の処理へと移行する。なお、処理対象のキーワードが係累属性に語源を意味する「M」が含まれた係累単語と一致するような場合、即ち、処理対象のキーワードが特定の対象の正式名称を表しているような場合には、キーワードに対応する単語のみを検索候補単語として保持するものとする。
続くステップS168では、単語拡張部24が、音声認識部22から入力された全てのキーワードを処理対象としたか否かを判定し、未処理のキーワードが存在すると判定した場合には(ステップS168;No)、ステップS161に移行し未処理のキーワードを処理対象とする。
一方、ステップS168において、全てのキーワードを処理対象としたと判定した場合には(ステップS168;Yes)、単語拡張部24は、これまでに検索候補単語として保持した各単語を選択可能な状態で表示部13に表示させ(ステップS169)、ステップS17の処理へと移行する。
ここで、図6で示した単語辞書172及び図7で示した音声認識辞書173に基づいて、ステップS14〜S16の動作を具体的に説明する。
ステップS14において、音声情報「てぃーむす」が受付部21で受け付けられたとすると、音声認識部22は、この音声情報「てぃーむす」に基づいて、ステップS15の音声認識処理を実行する。この音声認識処理により「てぃーむす」、「ちーむ」、「てぃーむ」の3つの発音がマッチングしたとすると、音声認識部22は、音声認識辞書173からこれら発音に対応する語彙「T娘。」、「チーム」、「ティーム」をキーワードとして夫々特定する。
続いて、単語拡張部24は、音声認識部22から入力されたキーワード「T娘。」、「チーム」及び「ティーム」について単語拡張処理を実行する。キーワード「T娘。」については、単語辞書172に登録されているため、単語拡張部24は、係累属性が付加されているか否かの判定に進む(ステップS163)。
ここで、単語辞書172に登録された「T娘。」の係累属性は「f1000D」となっている。つまり、語源を表す「M」ではなく、その別称を表す「D」が係累属性に含まれている。そのため、単語拡張部24は、この係累属性と同一の係累情報(f1000)で、且つ、係累属性に語源を意味する「M」が含まれた係累単語「トウキョウ娘。」(f1000M)を単語辞書172から読み出し、キーワード「T娘。」とともに検索候補単語として保持する。
一方、キーワード「チーム」については、単語辞書172に登録されているものの(ステップS162;Yes)、係累属性は登録されていないため(ステップS163;No)、単語拡張部24は、キーワード「チーム」を検索候補単語として保持する。また、キーワード「ティーム」についても、単語辞書172に登録されているものの(ステップS162;Yes)、係累属性は登録されていないため(ステップS163;No)、単語拡張部24は、キーワード「ティーム」を検索候補単語として保持する。
単語拡張部24は、全てのキーワードを処理対象とすると、これまでに保持した検索候補単語を選択可能な状態で表示部13に表示させる。つまり、単語拡張部24は、マイクロフォン122を介して入力された音声情報「てぃーむす」に対し、「T娘。」、「トウキョウ娘。」、「チーム」及び「ティーム」を、検索候補の単語群として表示部13に表示する。
図11−1、図11−2は、表示部13に表示された検索候補単語を説明するための図である。ここで、図11−1は、検索ボタン123の押下時(ステップS12)に、再生制御部28の制御により表示部13に表示された画面の一例を示した図である。この表示画面において、検索ボタン123が押下された状態で、マイクロフォン122に検索対象の呼称である音声信号「てぃーむす」が入力されると、音声認識処理(ステップS15)及び単語拡張処理(ステップS16)が実行される。そして、単語拡張部24は、図11−2に示したように、検索候補単語として「T娘。」、「トウキョウ娘。」、「チーム」及び「ティーム」を表示部13の画面内に表示させる。
ユーザは、入力部12の選択ボタン125及び決定ボタン126を介し、表示部13に表示された検索候補単語から特定の単語を選択することが可能となっている。ここで、選択された特定の単語は、検索単語として検索単語選択部25により受け付けられる。なお、検索単語として選択される単語は、一に限らず複数であってもよいものとする。
図8に戻り、検索単語選択部25は、検索候補単語の中から検索単語を指示する指示情報を入力部12から受け付けると、この検索単語を単語拡張部24に出力する(ステップS17)。
単語拡張部24は、検索単語選択部25から検索単語が入力されると、この検索単語の係累情報と同一の係累情報が付与された係累単語を検索結果情報から特定し、この検索単語と当該検索単語の係累単語とを拡張検索単語としてコンテンツ検索部26に出力する(ステップS18)。なお、本実施形態では、ステップS16のステップS166で保持した検索結果情報を用いることとしたが、検索単語に係累する係累単語を単語辞書172から再度検索する態様としてもよい。
例えば、検索単語として「T娘。」が入力された場合には、この「T娘。」の係累情報に基づき、係累単語として「トウキョウ娘。」、「娘。」及び「TKO娘。」が読み出されることになる。なお、検索単語に係累属性が存在しない場合には、この検索単語のみをコンテンツ検索部26に出力するものとする。
続くステップS19において、コンテンツ検索部26は、単語拡張部24から入力された拡張検索単語に基づき、この拡張検索単語に含まれた各単語の何れかに関係するコンテンツを、コンテンツ情報記憶部1711に記憶された番組表、及び、コンテンツ素材記憶部1712に記憶された各コンテンツの付属情報から検索する(ステップS19)。
例えば、検索単語として「T娘。」、「トウキョウ娘。」、「娘。」及び「TKO娘。」が入力された場合には、これら各単語の何れかの文字列が含まれるコンテンツが検索されることになる。
ここで、ステップS18の処理を行わず、検索単語選択部25で受け付けられた検索単語「T娘。」のみでコンテンツの検索を行った場合を考える。この場合、図4に示した番組表及び図5に示した付属情報の何れにも「T娘。」の文字列は含まれないため、検索結果は「該当なし」となる。つまり、「T娘。」の正式名称である「トウキョウ娘。」が図5の付属情報に登録されているにも関わらず、異なる文字列であるため検索することはできない。
これに対し、ステップS18の処理により、検索単語「T娘。」の係累単語も含めることで、「T娘。」の正式名称である「トウキョウ娘。」と、他の別称である「娘。」、「TKO娘。」をも検索単語とすることができる。そのため、同一の対象が複数の名称を有するような場合であっても、各名称に基づいて関連するコンテンツを検索することが可能となり、当該対象に関連するコンテンツをより確実に検索することができる。
続くステップS20では、コンテンツ検索部26が、ステップS19で検索した各コンテンツを選択可能な状態で表示部13に表示させた後(ステップS20)、ステップS11の処理へと再び戻る。なお、ステップS19の検索処理において、該当するコンテンツが存在しなかった場合には、その旨を報知する情報が表示部13に表示されるものとする。
図12は、ステップS20の処理により表示部13に表示された画面の一例を示した図である。ここでは、「トウキョウ娘。」についての検索結果を示しており、図5のアドレス:c215の出演者に「トウキョウ娘。」があることから、このコンテンツのサムネール等関連する情報が表示部13に表示されている。
図8に戻り、ステップS11において、ステップS20で表示されたコンテンツの一覧から、処理対象のコンテンツを選択する指示信号がコンテンツ選択部27により受け付けられると(ステップS12;選択)、再生制御部28は、この選択されたコンテンツがコンテンツ素材記憶部1712に記憶されたものか否かを判定する(ステップS21)。
ステップS21において、選択されたコンテンツがコンテンツ素材記憶部1712に記憶されていると判断した場合には(ステップS21;Yes)、再生制御部28は、コンテンツ素材記憶部1712から該当するコンテンツを読み出す(ステップS22)。次いで、再生制御部28は、読み出したコンテンツを再生することで表示部13に表示させた後(ステップS23)、本処理を終了する。
一方、ステップS21において、選択されたコンテンツがコンテンツ情報記憶部1711に記憶されていると判定した場合、即ち、電子番組表データに記述された番組と判断した場合には(ステップS21;No)、再生制御部28はこの番組の放送日、開始時刻及び終了時刻と、現在時刻とを比較する(ステップS24)。
ここで、選択された番組の放送日、開始時刻及び終了時刻が、現在日時と時系列的に重なると判断した場合、即ち、現在放送中の番組と判断した場合には(ステップS24;Yes)、この番組の放送をコンテンツ受信部29に受信させ(ステップS25)、受信した番組を表示部13に表示させた後(ステップS26)、本処理を終了する。
また、ステップS24において、選択された番組の放送日及び開始時刻が、現在日時より未来にあたると判断した場合、即ち、放送予定の番組と判断した場合には(ステップS24;No)、当該番組の録画を予約し(ステップS27)、本処理を終了する。
以上のように、本実施形態によれば、単語辞書に登録された各単語の係累属性に基づいて、音声入力されたキーワードに係累する単語を検索単語に含めることができるため、キーワードが表す名称とその別称とに関連するコンテンツを効率的に検索することができ、ユーザの利便性を向上させることができる。
なお、本実施形態の単語拡張処理(ステップS16)では、単語拡張部24から入力されたキーワードが正式名称でない場合、即ち、キーワードを表す単語の係累属性に語源を意味する「M」が含まれない場合であっても検索候補単語に含める態様としたが、これに限らないものとする。
例えば、キーワードが別称であるような場合には、検索候補単語に含めない態様としてもよい。この場合、図10で説明した単語拡張処理のステップS167において、ステップS166で保持した検索結果情報から係累属性に語源を意味する「M」が含まれた係累単語のみを検索候補単語として保持することで、実現することができる。この態様とした場合、表示部13に表示される検索候補単語は、図13のように表される。なお、図13は、上述した図11−2と対応する図であって、音声信号「てぃーむす」が入力された場合の表示例を示している。同図に示したように、音声信号「てぃーむす」が入力されたにも関わらず、この音声信号に対応する「T娘。」は表示されずに、「T娘。」の正式名称「トウキョウ娘。」のみが表示されることになる。
また、本実施形態では、コンテンツ情報記憶部1711及びコンテンツ素材記憶部1712から、拡張検索単語に含まれる各単語の何れかに関係するコンテンツを検索する態様としたが、これに限らないものとする。例えば、コンテンツ情報記憶部1711又はコンテンツ素材記憶部1712の一方のみから該当するコンテンツを検索する態様としてもよい。
[第2の実施形態]
次に、第2の実施形態の検索装置について説明する。なお、上述した第1の実施形態と同様の構成については、同一の符号を付与し、その説明を省略する。
第1の実施形態で説明した構成のうち、コンテンツ情報記憶部1711に記憶されるコンテンツは電子番組表データ(EPG)であるため、時間経過とともにその内容は随時更新される。また、コンテンツ素材記憶部1712に記憶されたコンテンツは、ユーザが録画(又は録音)したものであるため、録画が行われる毎に新たなコンテンツが記憶される。
このように、各コンテンツの内容は時間経過とともに変化することになるため、単語辞書172に登録する単語もコンテンツ情報記憶部1711及びコンテンツ素材記憶部1712の変化に追随させる必要がある。しかし、上述した第1の実施形態では、単語辞書172を予め記憶された固定的なものとしたため、このような変化に追随することができず、新たな単語に対応できない可能性がある。
そのため、第2の実施形態では、上記したようなコンテンツ内容の経時変化に追随することが可能な検索装置2について説明する。
まず、図14を参照して、上述したCPU11とROM14又は記憶部17に記憶されたプログラムとの協働により実現される検索装置2の各機能部について説明する。図14は、検索装置2の機能的構成を示したブロック図である。
図14に示したように、検索装置2は、上述した受付部21、音声認識部22、音声認識辞書生成部23、検索単語選択部25、コンテンツ選択部27、再生制御部28、コンテンツ受信部29、日時計測部30に加えて、単語辞書登録部31、単語拡張部32及びコンテンツ検索部33を備えている。また、記憶部17は、単語辞書172に代えて単語辞書174を記憶している。
単語辞書登録部31は、コンテンツ情報記憶部1711の電子番組表データ、コンテンツ素材記憶部1712の付属情報に含まれる各文字列に形態素解析を施すことで単語を抽出し、この抽出した単語を単語辞書174に登録する。
ここで、形態素解析とは文字列を形態素(言語で意味を持つ最小単位)に分割する技術である。形態素解析では、「品詞」等の情報を持つ単語リストからなる辞書と、その活用形を定義した情報と、読みの情報(何れも図示せず)とを基に、形態素候補を列挙したラティスと呼ばれるグラフ構造を形成し、その中から、規則或いは統計的処理により、最も可能性の高い候補を単語として抽出する。なお、形態素解析には公知の技術を用いることが可能である。
また、単語辞書登録部31は、抽出した単語の単語辞書174への登録時において、抽出した単語がコンテンツ情報記憶部1711或いはコンテンツ素材記憶部1712のどちらに記憶されているかを示す存在属性を対応付けて登録する。
図15は、記憶部17に記憶された単語辞書174の一例を示した図である。同図に示したように、各単語の見出し毎に、「読み」と「係累属性」と「分類属性」と「存在属性」とが関連付けて登録されている。
単語辞書174おいて、図6で示した単語辞書172との違いは、最後の列にある存在属性のみである。ここで存在属性は、各単語の格納場所を示すものであって、具体的には、見出しで示した単語がコンテンツ記憶部171に存在するか、存在するとしたらコンテンツ情報記憶部1711とコンテンツ素材記憶部1712とのどちらに存在するかを示している。
例えば、「トウキョウ娘」の場合には、存在属性として「c202」が登録されている。ここで「c202」の「c」は、コンテンツ素材記憶部1712に記憶されていることを示している。また、「杉田薫」の場合には、存在属性として「e3802」が登録されている。ここで「e3802」の「e」は、コンテンツ情報記憶部1711に記憶されていることを示している。また、「c」又は「e」に続く文字列(例えば、3802)は、この単語が存在するコンテンツのヘッダのアドレス(格納アドレス)を意味している。
一方、「T娘。」の場合には、存在属性が「NA」となっている。これは、コンテンツ情報記憶部1711、コンテンツ素材記憶部1712の何れにも「T娘。」という単語が存在しないことを意味している。
図14に戻り、単語拡張部32は、音声認識部22から入力されたキーワードの文字列に基づき、キーワードに一致する単語を単語辞書174から検索するとともに、この単語に関連付けられた係累属性に基づいて、当該単語に係累する他の単語(係累単語)を単語辞書174から検索する。また、単語拡張部32は、検索した単語(キーワードと係累単語)を、検索候補単語として表示部13に表示させる。さらに、単語拡張部32は、検索単語選択部25から入力された検索単語と、この検索単語に係累する係累単語とを、各単語に関連付けられた存在属性とともに拡張検索単語としてコンテンツ検索部33に出力する。
コンテンツ検索部33は、単語拡張部32から入力された拡張検索単語に含まれる各単語の何れかの文字列を含んだコンテンツを、各単語に関連付けられた存在属性に基づいて、コンテンツ情報記憶部1711及びコンテンツ素材記憶部1712から検索する。
具体的に、コンテンツ検索部33は、存在属性によりコンテンツ情報記憶部1711に記憶されていると示された単語については、コンテンツ情報記憶部1711から検索し、また、存在属性によりコンテンツ素材記憶部1712に記憶されていると示された単語については、コンテンツ素材記憶部1712から検索する。なお、存在属性が「NA」の単語については、コンテンツ情報記憶部1711及びコンテンツ素材記憶部1712中に存在しない単語であるため、当該単語にかかる検索は行われないものとする。
以下、本実施形態の検索装置2の動作について説明する。図16は、検索装置2によるコンテンツ検索・再生処理の手順を示したフローチャートである。
まず、受付部21は、入力部12から指示信号が入力されるまで待機する(ステップS31)。この状態において、入力部12の検索ボタン123が押下されたことを示す指示信号を受け付けたと判断すると(ステップS32;検索)、受付部21は、表示部13に検索対象となるキーワードの入力を促す画面を表示させる(ステップS33)。
次いで、受付部21は、検索ボタン123が押下されたことを示す指示情報の入力中に、マイクロフォン122に入力された音声の音声信号を受け付けたと判断すると、この音声信号をAD変換し音声認識部22に出力する(ステップS34)。続く音声認識部22では、ステップS34でAD変換されたデジタルの音声信号に基づいて音声認識処理を実行する(ステップS35)。ここで、ステップS35の音声認識処理は、図9で説明したステップS15の音声認識処理と同様であるため、説明は省略する。
続いて、単語拡張部32は、音声認識部22から入力されたキーワードに基づいて単語拡張処理を実行する(ステップS36)。以下、図17を参照してステップS36の単語拡張処理を説明する。
図17は、ステップS36の単語拡張処理の手順を示したフローチャートである。まず、単語拡張部32は、音声認識部22から入力されたキーワードのうち一のキーワードを処理対象とすると(ステップS3611)、このキーワードに一致する単語を単語辞書174から検索することで、単語辞書174にキーワードが登録されているか否かを判定する(ステップS3612)。ここで、単語辞書174にキーワードと一致する単語が登録されていないと判定した場合(ステップS3612;No)、単語拡張部32は、処理対象のキーワードが表す単語を検索候補単語として保持し(ステップS3615)、ステップS3619の処理へと移行する。
一方、ステップS3612において、単語辞書174にキーワードと一致する単語が登録されていると判定した場合(ステップS3612;Yes)、単語拡張部32は、その単語に係累属性が付与されているか否かを判定する(ステップS3613)。ここで、検索した単語に係累属性が付与されていないと判定した場合(ステップS3613;No)、単語拡張部32は、処理対象のキーワードと一致した単語を、当該単語の存在属性と関連付けた検索結果情報として保持する(ステップS3614)。次いで、単語拡張部32は、処理対象のキーワードが表す単語を検索候補単語として保持し(ステップS3615)、ステップS3619の処理へと移行する。
また、ステップS3613において、検索した単語に係累属性が関連付けられていると判定した場合(ステップS3613;Yes)、単語拡張部32は、この単語の係累属性に基づいて、当該係累属性の係累情報と共通の係累情報を有する他の単語(係累単語)を単語辞書174から検索する(ステップS3616)。そして、単語拡張部32は、ステップS3616で検索した係累単語と、処理対象のキーワードに対応する単語とを、当該各単語の係累属性及び存在属性と関連付けた検索結果情報を保持する(ステップ3617)。
ここで、図15で示した単語辞書174を例とし、ステップS3617で保持された検索結果情報について説明する。処理対象のキーワードが「T娘。」である場合、単語辞書174に「T娘。」が登録されているため、単語拡張部32は、係累属性が付与されているか否かの判定を行う。
ここで、単語辞書174に登録された「T娘。」の係累属性は「f1000D」であるため、単語拡張部32は、この係累属性の係累情報と同一の係累情報が付与された係累単語を単語辞書174から検索する。この場合、「T娘。」の係累情報は「f1000」であるので、この「f1000」が付与された単語、即ち、「トウキョウ娘。」(f1000M)、「娘。」(f1000D)、「TKO娘。」(f1000D)が係累単語として検索される。
ステップS3617において、単語拡張部32は、検索した係累単語と、処理対象のキーワードに対応する単語とを、当該各単語の係累属性と存在属性と関連付けて保持する。つまり、「(T娘。、f1000D、NA)」、「(トウキョウ娘。、f1000M、c202)」、「(娘。、f1000D、NA)」及び「(TKO娘。、f1000D、NA)」が、検索結果情報として保持されることになる。なお、ステップS3614で保持される検索結果情報には、係累属性が存在しないため、例えば「(チーム、NA、e178)」のような状態で保持されることになる。
続くステップS3618において、単語拡張部32は、ステップS3617で保持した検索結果情報から係累属性に語源を意味する「M」が含まれた係累単語を、処理対象のキーワードに対応する単語ととともに検索候補単語として保持し(ステップS3618)、ステップS3619の処理へと移行する。なお、処理対象のキーワードが係累属性に語源を意味する「M」が含まれた係累単語と一致するような場合、即ち、処理対象のキーワードが特定の対象の正式名称を表しているような場合には、キーワードに対応する単語のみを検索候補単語として保持するものとする。
続くステップS3619では、単語拡張部32が、音声認識部22から入力された全てのキーワードを処理対象としたか否かを判定し、未処理のキーワードが存在すると判定した場合には(ステップS3619;No)、ステップS3611に移行し未処理のキーワードを処理対象とする。
一方、ステップS3619において、全てのキーワードを処理対象としたと判定した場合には(ステップS3619;Yes)、単語拡張部32は、これまでに検索候補単語として保持した単語群を表示部13に表示させ(ステップS3620)、ステップS37の処理へと移行する。
図16に戻り、検索単語選択部25は、検索候補単語の中から検索単語を指示する指示情報を入力部12から受け付けると、この検索単語を単語拡張部32に出力する(ステップS37)。
次いで、単語拡張部32は、検索単語選択部25から検索単語が入力されると、この検索単語の係累情報と同一の係累情報が付加された係累単語を検索結果情報から特定し、この検索単語と当該検索単語の係累単語とを対応する存在属性と関連付け、拡張検索単語としてコンテンツ検索部33に出力する(ステップS38)。なお、本実施形態では、ステップS36のステップS3617で保持した検索結果情報を用いることとしたが、検索単語について単語辞書174から係累単語を再度検索する態様としてもよい。
次に、コンテンツ検索部33は、単語拡張部32から入力された拡張検索単語に基づき、この拡張検索単語に含まれる何れかの単語を含んだコンテンツを存在属性に基づいて、コンテンツ情報記憶部1711及びコンテンツ素材記憶部1712から検索する(ステップS39)。
例えば、単語拡張部32から拡張検索単語をとして「(T娘。、NA)」、「(トウキョウ娘。、c202)」、「(娘。、NA)」及び「(TKO娘。、NA)」が入力されたとすると、コンテンツ検索部33は、存在情報が「NA」以外の単語、即ち「(トウキョウ娘。、c202)」についてのみ検索を行う。また、コンテンツ検索部33は、(トウキョウ娘。、c202)」の存在属性「c202」に基づき、この単語をコンテンツ素材記憶部1712から検索する。
なお、単語拡張部32から、存在属性が関連付けられていない単語が拡張検索単語として入力された場合には、存在情報自体が付与されていない状態、即ち、単語辞書174への登録前の単語と考えられる。そのため、コンテンツ検索部33は、存在属性が関連付けられていない単語と一致する文字列を含んだコンテンツを、コンテンツ情報記憶部1711及びコンテンツ素材記憶部1712から検索するものとする。
次いで、コンテンツ検索部33は、ステップS39で検索した各コンテンツを選択可能な状態で表示部13に表示させ(ステップS40)、ステップS31の処理へと再び戻る。なお、ステップS39の検索処理において、該当するコンテンツが存在しなかった場合には、その旨を報知する情報が表示部13に表示されるものとする。
ステップS31において、ステップS40で表示されたコンテンツの一覧から、処理対象のコンテンツを選択する指示信号がコンテンツ選択部27により受け付けられると(ステップS32;選択)、再生制御部28は、この選択されたコンテンツがコンテンツ素材記憶部1712に記憶されたものか否かを判定する(ステップS41)。ここで、コンテンツの記憶場所の判定は、存在属性に基づいて行うこととしてもよい。
ステップS41において、選択されたコンテンツがコンテンツ素材記憶部1712に記憶されていると判断した場合には(ステップS41;Yes)、再生制御部28は、コンテンツ素材記憶部1712から該当するコンテンツを読み出す(ステップS42)。次いで、再生制御部28は、読み出したコンテンツを再生することで表示部13に表示させた後(ステップS43)、本処理を終了する。
一方、ステップS41において、選択されたコンテンツがコンテンツ情報記憶部1711に記憶されていると判定した場合、即ち、電子番組表データに記述された番組と判断した場合には(ステップS41;No)、再生制御部28はこの番組の放送日、開始時刻及び終了時刻と、現在時刻とを比較する(ステップS44)。
ここで、選択された番組の放送日、開始時刻及び終了時刻が、現在日時と時系列的に重なると判断した場合、即ち、現在放送中の番組と判断した場合には(ステップS44;Yes)、この番組の放送をコンテンツ受信部29に受信させ(ステップS45)、受信した番組を表示部13に表示させた後(ステップS46)、本処理を終了する。
また、ステップS44において、選択された番組の放送日及び開始時刻が、現在日時より未来にあたると判断した場合、即ち、放送予定の番組と判断した場合には(ステップS44;No)、当該番組の録画を予約し(ステップS47)、本処理を終了する。
以上のように、本実施形態によれば、単語辞書に登録された各単語の係累属性に基づいて、音声入力されたキーワードに係累する単語を検索単語に含めることができるため、キーワードが表す名称とその別称とに関連するコンテンツを効率的に検索することができ、ユーザの利便性を向上させることができる。
また、本実施形態によれば、各コンテンツに含まれた各単語の存在属性を単語辞書に登録し、この存在属性に基づいてコンテンツの検索を行うため、キーワードが表す名称とその別称とに関連するコンテンツをより効率的に検索することができる。
なお、本実施形態では、図15に示したように、存在属性に単語が存在するコンテンツのヘッダのアドレスを含めた態様としたが、これに限らないものとする。
例えば、存在属性に、コンテンツ情報記憶部1711とコンテンツ素材記憶部1712とのどちらに存在するかを示す情報のみを含めた態様としてもよい。具体的には、コンテンツ情報記憶部1711に存在する場合には「e」、コンテンツ素材記憶部1712に存在する場合には「c」、何れにも存在しない場合には「NA」とする態様とすることができる。
また、図15では、存在情報を各見出しについて一つのみ関連付けた態様としたが、これに限らないものとする。例えば、ある単語がコンテンツ情報記憶部1711とコンテンツ素材記憶部1712との両方に存在する場合もある。このような場合には、二つの存在情報が登録される態様としてもよい。
[第3の実施形態]
次に、第3の実施形態の検索装置について説明する。なお、上述した第1、第2の実施形態と同様の構成については、同一の符号を付与し、その説明を省略する。
上述した第2の実施形態では、単語辞書登録部31により、コンテンツ情報記憶部1711やコンテンツ素材記憶部1712に含まれた文字列から、単語辞書174に登録する単語を抽出する態様を説明した。この態様では、抽出した単語を単語辞書174に登録することは可能であるが、抽出した単語が他の単語と係累関係にあるか否かの判定については、改善の余地がある。
例えば、「東京大学」→「東大」、「アメリカ合衆国」→「米」、「インターカレッジ」→「インカレ」、「コンピュータグラフィックス」→「CG」等のようなものは、形態素解析に用いる辞書の中に省略語として具備しておくことで対応することは可能である。しかしながら、「トウキョウ娘。」→「T娘。」、「トウキョウ娘。」→「娘。」、「トウキョウ娘。」→「TKO娘。」といった時流とともに変化する別称に追随するためには、ユーザ自身が各単語間の係累関係を設定する必要がある。
そのため、第3の実施形態では、上記した各単語間の係累関係の設定を改善することが可能な検索装置3について説明する。
まず、図18を参照して、上述したCPU11とROM14又は記憶部17に記憶されたプログラムとの協働により実現される検索装置3の各機能部について説明する。図18は、検索装置3の機能的構成を示したブロック図である。
図18に示したように、検索装置3は、上述した受付部21、音声認識部22、音声認識辞書生成部23、検索単語選択部25、コンテンツ選択部27、再生制御部28、コンテンツ受信部29、日時計測部30、単語拡張部32、コンテンツ検索部33に加えて、単語辞書登録部34、インターネット接続部35を備えている。また、インターネット等のネットワークNを介して、検索装置3と単語辞書マスタサーバ5とが通信可能に接続されている。
ここで、単語辞書マスタサーバ5は、外部装置に情報を提供することが可能なWebサーバやftpサーバ等であって、ネットワークN上に存在する情報資源である。具体的に、単語辞書マスタサーバ5は、検索装置3からの要求に応じ、自己の装置内に記憶した単語辞書マスタ51を外部装置(検索装置3)に提供する。ここで、単語辞書マスタ51は、単語辞書174のマスタとなる単語辞書であって、第3者による手動又は後述するバッカス記法を用いた自動制御により、各単語とその別称との関係が所定の時間間隔(例えば、数時間毎)に更新されているものとする。
図19は、単語辞書マスタ51の一例を示した図である。図19に示したように、単語辞書マスタ51には、各単語の見出し毎に、その単語の「読み」と、「係累属性」と、「分類属性」と、「存在属性」と、が関連付けて記憶されている。各項目の説明は上述したとおりである。なお、図19の例では、各見出しについて「存在属性」を関連付けた態様を示したが、この「存在属性」を省略した態様としてもよい。また、図19の例のように「存在属性」を関連付けた場合には、検索装置毎にコンテンツの保存場所は異なるため、「存在属性」に「NA」を付与しておくことが好ましい。
図18に戻り、単語辞書登録部34は、上述した単語辞書登録部31と同様の機能を有するとともに、インターネット接続部35を介して単語辞書マスタサーバ5から単語辞書マスタ51を取得し、この単語辞書マスタ51と単語辞書174とを比較することで単語辞書174の内容を更新する。
具体的に、単語辞書登録部34は、単語辞書マスタ51の「見出し」、「読み」、「係累属性」、「分類属性」、「存在属性」の各項目について、単語辞書174にマージを行うことで単語辞書174の内容を更新する。なお、「存在属性」については、単語辞書174の登録内容が優先されるものとする。
例えば、単語辞書174が、図20に示した状態であったとする。単語辞書登録部34は、図19で示した単語辞書マスタ51と、図20の単語辞書174と、を比較しその差分を単語辞書174に追加・変更することで、図21に示した単語辞書174の状態へと更新する。
また、単語辞書登録部34は、形態素解析によるコンテンツ情報記憶部1711及びコンテンツ素材記憶部1712からの単語抽出時に、単語辞書174において「存在属性」が「NA」の単語と一致した単語については、この単語の存在位置を表す文字列を「存在属性」に登録するものとする。
インターネット接続部35は、通信部16を介し、ネットワークNに接続された外部の装置から情報の取得を行う機能部である。具体的には、単語辞書登録部34からの指示に応じ、ネットワークNに接続された単語辞書マスタサーバ5から単語辞書マスタ51を取得する。
以上のように、本実施形態によれば、単語辞書に登録された各単語の係累属性に基づいて、音声入力されたキーワードに係累する単語を検索単語に含めることができるため、キーワードが表す名称とその別称とに関連するコンテンツを効率的に検索することができ、ユーザの利便性を向上させることができる。
また、本実施形態によれば、単語辞書マスタサーバ5から取得した単語辞書マスタ51に基づいて、単語辞書174を更新することができるため、時流とともに呼称や名称が変化するような単語についても、その変化に追随することができる。
なお、単語辞書登録部34が単語辞書マスタサーバ5から単語辞書マスタ51を取得するタイミングは、特に問わないものとするが、例えば、1日1回等所定の時間間隔毎に行われることが好ましい。
[第4の実施形態]
次に、第4の実施形態の検索装置について説明する。なお、上述した第1、第2、第3の実施形態と同様の構成については、同一の符号を付与し、その説明を省略する。
上述した第3の実施形態では、単語辞書マスタサーバ5により提供される単語辞書マスタ51により単語辞書174を更新する態様を説明した。第4の実施形態の検索装置4では、検索装置4自体がコンテンツ記憶部171に記憶したコンテンツに含まれる各単語間の係累関係を判定し、この判定結果に基づいて単語辞書174を更新する態様を説明する。
まず、図22を参照して、上述したCPU11とROM14又は記憶部17に記憶されたプログラムとの協働により実現される検索装置4の各機能部について説明する。図22は、検索装置4の機能的構成を示したブロック図である。
図22に示したように、検索装置4は、上述した受付部21、音声認識部22、音声認識辞書生成部23、検索単語選択部25、コンテンツ選択部27、再生制御部28、コンテンツ受信部29、日時計測部30、単語拡張部32、コンテンツ検索部33、インターネット接続部35に加えて、単語辞書登録部36を備えている。また、記憶部17は、後述する接続先テーブル175及び係累解析ルール176を記憶している。また、インターネット等のネットワークNを介して、検索装置4とWebサーバ6とが通信可能に接続されている。
ここで、Webサーバ6は、外部装置に情報を提供することが可能なWebサーバであって、ネットワークN上に存在する情報資源である。具体的に、Webサーバ6は、検索装置4からの要求に応じ、自己の装置内に記憶した又は動的に生成したHTMLファイル等のWebページ(図示せず)を外部装置(検索装置4)に提供する。なお、ネットワークNに接続されるWebサーバ6の個数は、特に問わないものとする。
単語辞書登録部36は、上述した単語辞書登録部31と同様の機能を有するとともに、コンテンツ情報記憶部1711及びコンテンツ素材記憶部1712に含まれた文字列を解析し抽出した単語を基に、この単語に関連したWebページを、インターネット接続部35を介してWebサーバ6から取得する。
なお、Webサイトの中には、CGN(Consumer Generated Media)と呼ばれる多数のユーザが知識を共有するためのサイトが存在する。このようなサイトでは、一般的に取り扱う分野に応じて特化した知識が共有されていることが多いため、検索する単語の分野毎に接続先となるWebサイト(Webサーバ6のURL(Uniform Resource Locator))を予め設定しておくことで、検索の精度を高めることができる。
図23は、検索対象の単語の分野に応じて、接続先となるWebサーバ6のURLを設定した接続先テーブル175の一例を示した図である。同図において、「分類属性」は単語辞書174に含まれる「分類属性」と対応するものであり、分野毎に、第1検索〜第3検索までの3つの接続先となるWebサーバ6のURLが登録されている。このような接続先テーブル175を記憶部17に予め記憶しておくことで、検索する単語の分野毎に接続先となるWebサーバ6を使い分けることができる。
上記の接続先テーブル175を用いる場合、単語辞書登録部36は、単語辞書174に登録された単語の「分類属性」に対応するURLを接続先テーブル175から参照し、このURLのWebサーバ6に接続することで、この単語に関連したWebページの検索を行う。例えば、「トウキョウ娘。」については、図24−1や図24−2で示したような検索結果(Webページ)を得ることができる。また、「DNA」といった略語に対しても図24−3に示したような検索結果を得ることができる。
なお、単語辞書登録部36による、検索については「係累属性」が「NA」の単語についてのみ行われることが好ましい。また、接続先のWebサーバ6が、検索サイトの場合には、単語辞書登録部36は、検索対象となる単語(例えば、トウキョウ娘。)を検索キーとして送信するものとする。
また、単語辞書登録部36は、係累属性解析部361を有している。係累属性解析部361は、Webサーバ6から得られた検索結果(Webページ)を、例えば図25に示したような係累解析ルール176を用いて解析し、検索対象となった単語に係累する単語やその読みを抽出する。
図25に示した係累解析ルール176は、バッカス記法(BNF:Backus-Naur Form)と呼ばれ、構文を記述するための正規表現にしたがって書かれたものである。なお、実際のWebページは、HTMLで記述されているため、HTMLのタグも含んだ係累解析ルールを記述すべきであるが、この図では、説明の簡略化のためHTMLの記述に関連する部分を省略した係累解析ルールを示している。
バッカス記法では、「<」と「>」とで囲まれた文字列は構成要素と呼ばれている。また、「::=」は、その左辺にある構成要素が右辺にある文字列で構成されていることを示している。例えば、「<英数字>」は、「a」から「z」の英字、「A」から「Z」の英字、「0」から「9」までの数字の何れかで構成されていることを示している。なお、「|」は、「または(OR)」という意味を示すものである。
図25において、構成要素「係累単語列」は、係累指示語(略称、愛称、通称)と、助詞(が、は、を、も、に、には)と、係累単語から構成されている。図24−1の例を用いて具体的に説明すると、1行目の「トウキョウ娘。」は名詞であるが、これは検索語(トウキョウ娘。)それ自身である。この場合、図25で示したルールの「<検索語列>::=<検索語><よみ>|<検索語><空白><よみ>|<検索語><かっこはじめ><よみ><かっこおわり>|」という記述の「<検索語><よみ>」に合致する。これから、「トウキョウ娘。」の<よみ>が、「とうきょうむすめ」であることがわかる。
また、図24−1の2行目は、図25で示したルールの「<係累単語列>::=<係累指示語><助詞>{係累単語}<句読点>|<係累指示語><助詞>{<係累単語><句読点>}|<係累指示語><助詞>{係累単語}<助詞><文字列><句読点>|<係累指示語><助詞>{<係累単語><句読点>}<助詞><文字列><句読点>|<係累指示語><助詞><文字列>{係累単語}<助詞><文字列><句読点>|<係累指示語><助詞><文字列>{<係累単語><句読点>}<助詞><文字列><句読点>|」という記述の「<係累指示語><助詞><文字列>{係累単語}<助詞><文字列><句読点>」に合致する。
つまり、「<係累指示語>(通称)+<助詞>(は)+<文字列>(主に)+(かっこはじめ)(「」+<係累単語>(T娘。)+<よみ>(<かっこはじめ>(()+<よみ>(てぃーむす)+<かっこおわり>())+<かっこおわり>(」)+<かっこはじめ>(「)+<係累単語>(TKO娘。)+<かっこおわり>(」)+<かっこはじめ>(「)+<係累単語>(娘。)+<かっこおわり>(」)+<助詞>(が)+<文字列>(広く使われている)+<句読点>(。)」と解析される。なお「(」と「)」で囲んだ文字列が、図24−1の2行目の各文字列を表している。
この解析結果から、「トウキョウ娘。」の係累単語として「T娘。」、「TKO娘。」、「娘。」が抽出される。また、係累単語の読みとして、「T娘。」に対応する「てぃーむす」が抽出される。
また、係累属性解析部361は、係累解析ルール176を用いた解析により、Webページから抽出した係累単語やその読みを、単語辞書174に登録する。ここで、係累属性解析部361は、共通の単語を語源とする係累単語に、同一の係累情報を付与するものとする。なお、語源となる単語が不明な場合には、係累属性に「D」又は「M」を含めず、係累情報のみを付与する態様としてもよい。
また、係累属性解析部361が、係累単語の抽出先となったWebサーバ6のURLを、単語辞書174に併せて登録する態様としてもよい。図26は、単語辞書174の他の態様を示した図であって、係累単語の抽出先となったWebサーバ6のURLを併せて登録した場合の単語辞書177の一例を示した図である。図26に示したように、単語辞書177には各単語の見出し毎に、その単語の「抽出Web」と「読み」と「係累属性」と「分類属性」と「存在属性」とが関連付けて登録されている。この「抽出Web」の項目に、係累単語の抽出先となったWebサーバ6のURLが登録される。なお、該当するURLが存在しない場合には、該当なしを意味する「NA」が登録されるものとする。
以上のように、本実施形態によれば、単語辞書に登録された各単語の係累属性に基づいて、音声入力されたキーワードに係累する単語を検索単語に含めることができるため、キーワードが表す名称とその別称とに関連するコンテンツを効率的に検索することができ、ユーザの利便性を向上させることができる。
また、本実施形態によれば、検索装置4自体がコンテンツ記憶部171に記憶したコンテンツに含まれる各単語間の係累関係を特定し、単語辞書174を更新することができるため、時流とともに呼称や名称が変化するような単語についても、その変化に追随することができる。
なお、本実施形態では、係累解析ルールとして図25に示した各ルールを用いた例を説明したが、解析ルールの内容はこの例に限定されるものではない。例えば、電子番組表データ(EPG)中のタグやHTMLのタグを用いるような記述も可能である。また。係累単語については、正式名称の文字数より少なくなる傾向があるため、「係累単語の文字数<正式名称の文字数」のような文字数に関する制約を規定することも可能である。
また、読みに関しても、読みの文字数が、形態素解析により付記される読みの文字数を上回ることはないため、「抽出された読みの文字数<形態素解析による読みの文字数」といった文字数に関する制約を規定することも可能である。
以上、発明の実施の形態について説明したが、本発明はこれに限定されるものではなく、本発明の主旨を逸脱しない範囲での種々の変更、置換、追加などが可能である。
なお、上記した実施形態の検索装置で実行されるプログラムは、ROM14や記憶部17等に予め組み込まれて提供するものとするが、これに限らず、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。また、このプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよく、インターネット等のネットワーク経由で提供又は配布するように構成してもよい。