JP5178109B2

JP5178109B2 - 検索装置、方法及びプログラム

Info

Publication number: JP5178109B2
Application number: JP2007247995A
Authority: JP
Inventors: 美和子土井; 薫鈴木; 敏之古賀; 幸一山本
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2007-09-25
Filing date: 2007-09-25
Publication date: 2013-04-10
Anticipated expiration: 2027-09-25
Also published as: US20090083029A1; US8374845B2; JP2009080579A

Description

本発明は、音声入力されたキーワードに関連するコンテンツを検索する検索装置、方法及びプログラムに関する。

ブロードバンドの普及に伴い、インターネット網を介して映画等の映像配信サービスＶＯＤ（Video On Demand）を利用することが可能なＴＶ端末が普及してきている。また、ハードディスク等の記憶装置を備えたＴＶ端末も普及してきており、受信だけでなく録画ができるものが普及してきている。ＴＶ端末以外でも、アナログ方法や地上波デジタル放送を視聴の主とした高解像度のＡＶ−ＰＣ（Audio Video Personal Computer）が普及し始めており、受信した番組等のコンテンツ素材をハードディスクに録画することが可能となっている。また、コンテンツ素材をハードディスクに録画するハードディスクレコーダも普及してきている。

さらに、上記したＡＶ−ＰＣやＴＶ端末、ハードディスクレコーダ等の機器間の相互接続を可能とするＤＬＮＡ（Digital Living Network Alliance）ガイドラインが存在しており、このガイドラインに準じた機器間では、各機器に記録されたコンテンツ素材（以下、コンテンツという）の視聴を相互に行うことが可能となっている。

このように、非常に多数のコンテンツの視聴が可能となってきているが、特定のコンテンツを視聴するような場合、多数のコンテンツの中から視聴したいコンテンツを検索する必要がある。従来、この検索に供する情報として、コンテンツの記録時に併せて記録した電子番組表（ＥＰＧ：Electronic Program Guide）が用いられている。このＥＰＧを用いることで、スポーツやニュース等のジャンルや、出演者等、ＥＰＧに含まれた特定の単語に基づいて検索することが可能となる。

また、ＡＶ−ＰＣやＴＶ端末、ハードディスクレコーダの機能増加に伴う操作方法の煩雑化から、音声認識による操作方法も注目されている。音声認識によりコンテンツの検索を行うためには、コンテンツに関係する単語についての「読み」が必要となる。この音声認識にかかる技術については、従来より種々の技術が提案されている。

例えば、特許文献１には、登録されていない未知語について、ユーザがその未知語の読みを入力することで、その読みに従って文章を読み上げる技術が開示されている。また、特許文献２には、ＥＰＧの単語に読み仮名が付加されている場合には、その読み仮名を単語の読みとして用いる技術が開示されている。なお、このような音声認識技術では、音声認識の精度を高めるため、対象となる単語を予め辞書に登録しておき、それを認識する「孤立単語認識方式」が一般に用いられている。

特開２００４−１７１１７４号公報特開２００５−２２７５４５号公報

ところで、言葉は使用されるにつれて、その形態が変化するという傾向がある。特に人名等では、口頭にのぼる機会が増えるほど省略された略称となったり愛称が付与されたりする等、別称で呼ばれることが多くなる。そのため、上記した孤立単語認識方式では、単語の呼称変化に追従することができず、予め記憶された単語の読みと、この単語が表す同一対象物の現在の読み（呼称）とに、相違が生じることになる。

また、上記のような理由から、過去に録画された番組と、現在放送されている番組やこれから放送される番組とでは、同一の対象を表すのにも係わらずＥＰＧ中の単語が一致しない状態が発生する場合がある。例えば、同じ人物や番組タイトル等を表す名称であっても、過去の番組のＥＰＧには正式名称で記述されていたものが、現在や今後の番組のＥＰＧには略称や愛称等の別称で記述されることがある。そのため、ＥＰＧを用いた従来の検索技術では、ユーザが使っている略称や愛称で検索してもＥＰＧ中には別の名称で表されているため、該当する番組が存在したとしてもそれを検索できないという問題がある。また、逆にＥＰＧ中に略称や愛称で記述されていた場合には、ユーザが正式名称で検索してもＥＰＧ中には別の名称で表されているため、該当する番組が存在したとしてもそれを検索できないという問題がある。

なお、特許文献１の技術を用い、略称や愛称を手動で登録することで上記の問題に対応することが考えられるが、略称や愛称毎にユーザ自身が登録する必要があるため、その操作は煩雑となる。さらに、ユーザが略称や愛称等の別称の読みを知らない場合には、登録することができないという問題がある。

また、ＥＰＧ内に付与される読みは、一般に正式名称に対してのみであるため、当該正式名称の別称の読みをＥＰＧから取得することはできない。そのため、特許文献２の技術を用いたとしても、上記の問題を解決することはできない。

本発明は上記に鑑みてなされたものであって、音声入力されたキーワードが表す名称とその別称とに関連するコンテンツを効率的に検索することが可能な検索装置、検索方法及び検索プログラムを提供することを目的とする。

上述した課題を解決し、目的を達成するために、本発明は、コンテンツを記憶する複数の第１記憶手段と、複数の登録単語と、当該登録単語が前記複数の第１記憶手段の何れに存在するかを示す存在属性とを関連付けて登録するとともに、正式名称とその別称とを表す登録単語間にその関係性を示す係累属性を関連付けて登録した単語辞書を記憶する第２記憶手段と、前記単語辞書に登録された登録単語に関する関連情報を、外部の情報資源から取得する外部通信手段と、前記関連情報から前記単語辞書内の登録単語と係累関係にある単語を抽出する抽出手段と、前記抽出手段が抽出した単語に前記登録単語との係累属性を関連付け、新たな登録単語として前記単語辞書に登録する登録手段と、音声信号の入力を受け付ける音声入力手段と、前記音声信号に対応する１又は複数の文字列をキーワードとして認識する音声認識手段と、前記単語辞書から、前記キーワードに対応する登録単語と当該登録単語に係累する登録単語とを検索候補単語として検索する検索候補拡張手段と、前記検索候補単語に含まれた登録単語のうち、何れかの単語を検索単語とする選択指示を受け付ける検索単語選択手段と、前記単語辞書に基づいて、前記検索単語に対応する登録単語と、当該検索単語に係累する登録単語とを拡張検索単語に設定する検索単語拡張手段と、前記拡張検索単語に含まれた登録単語のうち、何れかの登録単語に関係するコンテンツを、当該登録単語に関連付けられた存在属性が示す前記第１記憶手段から検索する検索手段と、を備えたことを特徴とする。

また、本発明は、コンテンツの検索を行う検索装置で実行される検索方法であって、前記検索装置は、音声入力手段と、複数の登録単語と当該登録単語が含まれるコンテンツの格納先を示す存在属性とを関連付けて登録するとともに、正式名称とその別称とを表す登録単語間にその関係性を示す係累属性を関連付けて登録した単語辞書を記憶する記憶手段と、を備え、外部通信手段が、前記単語辞書に登録された登録単語に関する関連情報を、外部の情報資源から取得するステップと、抽出手段が、前記関連情報から前記単語辞書内の登録単語と係累関係にある単語を抽出するステップと、登録手段が、前記抽出された単語に前記登録単語との係累属性を関連付け、新たな登録単語として前記単語辞書に登録するステップと、音声受付手段が、前記音声入力手段を介して入力された音声信号を受け付けるステップと、音声認識手段が、前記音声信号に対応する１又は複数の文字列をキーワードとして認識するステップと、検索候補拡張手段が、前記単語辞書から、前記キーワードに対応する登録単語と当該登録単語に係累する登録単語とを検索候補単語として検索するステップと、検索単語選択手段が、前記検索候補単語に含まれた登録単語のうち、何れかの単語を検索単語とする選択指示を受け付けるステップと、検索単語拡張手段が、前記単語辞書に基づいて、前記検索単語に対応する登録単語と、当該検索単語に係累する登録単語とを拡張検索単語に設定するステップと、検索手段が、前記拡張検索単語に含まれた登録単語のうち、何れかの登録単語に関係するコンテンツを、当該登録単語に関連付けられた存在属性が示す格納先から検索するステップと、を含むことを特徴とする。

また、本発明は、音声入力手段を備えたコンピュータを、複数の登録単語と、当該登録単語が含まれるコンテンツの格納先を示す存在属性とを関連付けて登録するとともに、正式名称とその別称とを表す登録単語間にその関係性を示す係累属性を関連付けて登録した単語辞書に登録された登録単語に関する関連情報を、外部の情報資源から取得する外部通信手段と、前記関連情報から前記単語辞書内の登録単語と係累関係にある単語を抽出する抽出手段と、前記抽出手段が抽出した単語に前記登録単語との係累属性を関連付け、新たな登録単語として前記単語辞書に登録する登録手段と、前記音声入力手段を介して音声信号を受け付ける受付手段と、前記音声信号に対応する１又は複数の文字列をキーワードとして認識する音声認識手段と、前記単語辞書から、前記キーワードに対応する登録単語と当該登録単語に係累する登録単語とを検索候補単語として検索する検索候補拡張手段と、前記検索候補単語に含まれた登録単語のうち、何れかの単語を検索単語とする選択指示を受け付ける検索単語選択手段と、前記単語辞書に基づいて、前記検索単語に対応する登録単語と、当該検索単語に係累する登録単語とを拡張検索単語に設定する検索単語拡張手段と、前記拡張検索単語に含まれた登録単語のうち、何れかの登録単語に関係するコンテンツを、当該登録単語に関連付けられた存在属性が示す格納先から検索する検索手段と、して機能させることを特徴とする。

本発明によれば、音声入力されたキーワードに加えて、当該キーワードに係累する単語をも検索単語とすることができるため、キーワードが表す名称とその別称とに関連するコンテンツを効率的に検索することができる。

以下に添付図面を参照して、検索装置、方法及びプログラムの最良な実施形態を詳細に説明する。なお、以下に説明する実施形態では、ＴＶ端末やＡＶ−ＰＣ等に搭載される検索装置について説明するが、適用される態様はこれに限らないものとする。

［第１の実施形態］
まず、図１を参照して、本実施形態の検索装置について説明する。図１は、検索装置１のハードウェア構成を示したブロック図である。図１に示すように、検索装置１は、ＣＰＵ（Central Processing Unit）１１、入力部１２、表示部１３、ＲＯＭ（Read Only Memory）１４、ＲＡＭ（Random Access Memory）１５、通信部１６及び記憶部１７等を備え、各部はバス１８により接続されている。なお、後述する検索装置２〜４についても、検索装置１と同様のハードウェア構成を備えているものとする。

ＣＰＵ１１は、ＲＡＭ１５の所定領域を作業領域として、ＲＯＭ１４又は記憶部１７に予め記憶された各種制御プログラムとの協働により各種処理を実行し、検索装置１を構成する各部の動作を統括的に制御する。

また、ＣＰＵ１１は、ＲＯＭ１４又は記憶部１７に予め記憶された所定のプログラムとの協働により、後述する受付部２１、音声認識部２２、音声認識辞書生成部２３、単語拡張部２４、検索単語選択部２５、コンテンツ検索部２６、コンテンツ選択部２７、再生制御部２８、コンテンツ受信部２９、日時計測部３０等の各機能部を実現させる。なお、各機能部の詳細については後述する。

入力部１２は、操作ボタンや音声入力装置を有し、ユーザから操作入力された内容を指示信号として受け付け、ＣＰＵ１１に出力する。

図２は、入力部１２の一例を示した図であって、入力部１２をリモコン型とした場合の外観構成を示している。同図において、電源ボタン１２１は検索装置１のオンとオフとを切り替える切り替えスイッチである。ユーザは、この電源ボタン１２１を押下し、検索装置１をオンとすることで、検索装置１は検索可能な状態へと移行する。

マイクロフォン１２２は、マイクロフォン等の音声入力装置である。検索ボタン１２３の押下中にマイクロフォン１２２に音声が入力されることで、この音声信号が後述する受付部２１に出力されるようになっている。

検索ボタン１２３は、検索装置１に検索処理の実行を指示するための指示ボタンである。検索装置１は、当該検索ボタン１２３の押下信号に応じ、後述する各機能部によりコンテンツの検索に係る種々の動作を実行する。スピーカ１２４は、スピーカやブザー等の音声出力装置であって、ユーザの操作に応じた操作音や、警告音等を出力する。

選択ボタン１２５は、表示部１３に表示された表示画面からユーザが所望する項目を選択するための選択手段である。また、決定ボタン１２６は、選択ボタン１２５により選択された項目を確定するための指示手段である。この決定ボタン１２６が押下されることで、選択ボタン１２５により選択された項目を指示する指示信号が後述する検索単語選択部２５又は再生制御部２８に出力されるようになっている。

戻るボタン１２７は、表示部１３に表示された画面を直前の画面に戻す場合や、直前の処理に戻す場合等に操作するための指示手段である。また、ヘルプボタン１２８は、入力部１２を用いたコンテンツの検索操作に関する使い方や解説の表示を指示するための指示手段である。このヘルプボタン１２８が押下された場合、ＣＰＵ１１は記憶部１７に記憶されたコンテンツの検索操作に関する使い方や解説を記したヘルプファイル（図示せず）を読み出し、表示部１３に表示させる。

なお、図２に示したように入力部１２をリモコン型とした場合には、検索装置１と有線により接続する態様としてもよいし、無線により接続する態様としてもよい。また、入力部１２の形態はリモコン型に限らず、検索装置１と一体的に設ける態様としてもよい。

図１に戻り、表示部１３は、ＬＣＤ（Liquid Crystal Display）等の表示デバイスにより構成され、ＣＰＵ１１からの表示信号に基づいて各種情報を表示する。

ＲＯＭ１４は、検索装置１の制御にかかるプログラムや各種設定情報等を書き換え不可能に記憶する。

ＲＡＭ１５は、ＳＤＲＡＭ等の揮発性の記憶デバイスであって、ＣＰＵ１１の作業エリアとして機能し、各種情報を一時的に保持するバッファ領域としての役割を果たす。

通信部１６は、図示しないネットワークを通じ外部装置との間で通信を行うインタフェースである。通信部１６は、受信した各種情報をＣＰＵ１１に出力し、また、ＣＰＵ１１から出力される各種情報を外部装置へと送信する。また、通信部１６は、図示しない放送局から番組の放送を受信する受信装置としての機能も有するものとする。

記憶部１７は、磁気的又は光学的に記録可能な記憶媒体を有し、検索装置１の制御にかかるプログラムや各種設定情報等を書き換え可能に記憶する。また、記憶部１７は、その記憶領域に後述するコンテンツ記憶部１７１、単語辞書１７２、音声認識辞書１７３等を予め記憶している。

次に、図３を参照して、ＣＰＵ１１とＲＯＭ１４又は記憶部１７に記憶されたプログラムとの協働により実現される検索装置１の各機能部について説明する。図３は、検索装置１の機能的構成を示したブロック図である。

図３に示したように、検索装置１は、受付部２１、音声認識部２２、音声認識辞書生成部２３、単語拡張部２４、検索単語選択部２５、コンテンツ検索部２６、コンテンツ選択部２７、再生制御部２８、コンテンツ受信部２９、日時計測部３０を備えている。また、記憶部１７は、コンテンツ記憶部１７１、単語辞書１７２、音声認識辞書１７３を記憶している。

まず、記憶部１７に記憶された各情報について説明する。コンテンツ記憶部１７１は、検索装置１で検索可能なコンテンツを記憶する記憶領域であって、テレビジョン等の番組表を記憶するコンテンツ情報記憶部１７１１と、録画或いは録音した動画や写真、音楽等のコンテンツ素材を記憶するコンテンツ素材記憶部１７１２とを有している。

ここで、コンテンツ情報記憶部１７１１に記憶される番組表は、ＥＰＧと呼ばれる電子番組表データであって、そのデータ形式は、図４に示したようにＸＭＬ（eXtensible Markup Language）形式で記述されている。

図４は、コンテンツ情報記憶部１７１１に記憶された電子番組表データの一例を示した図である。同図において、「＜？ｘｍｌｖｅｒｓｉｏｎ＝“１．０”ｅｎｃｏｄｉｎｇ＝“ＵＴＦ−８”？＞」のタグは、本電子番組表データがＸＭＬ形式で記述されていることを示しており、続く「＜ｅｐｇｄａｔａ＞」から、文末の「＜／ｅｐｇｄａｔａ＞」までのタグが、電子番組表データの本文であることを示している。

また、「＜ｃｏｎｔｅｎｔｓｃｎｔ＝“３８０２”＞」のタグは、取得した電子番組表データのＩＤを示すものであり、「＜ｄｔｄｙ＝“２００５／１０／０８”／＞」のタグは、本電子番組表データが、２００５年１０月８日の配信分であることを示している。また、「＜ｃｈｃｄ＝“Ａ０４４００１”／＞」のタグは、チャンネルコードを示すものであり、チャンネルコードがＡ０４４０１であることを示している。

「＜ｐｒｏｇｒａｍ＞」のタグは、ＴＶ番組に関する番組データが以下に続くことを示しており、その終了は「＜／ｐｒｏｇｒａｍ＞」となっている。この、「＜ｐｒｏｇｒａｍ＞」から「＜／ｐｒｏｇｒａｍ＞」までのタグが、一の番組（コンテンツ）を表している。以下、同様の形式で「＜ｐｒｏｇｒａｍ＞」と「＜／ｐｒｏｇｒａｍ＞」とのタグに挟まれた番組が続いている。なお、本実施形態では、電子番組表データ内に記述された各番組に関する情報を独立したコンテンツ（コンテンツ素材）とし、コンテンツ素材記憶部１７１２に記憶されたコンテンツ素材（動画データや音楽データ）と同様に取り扱う。

最初の番組において、「＜ｄｔ＞２００５／１０／０８＜／ｄｔ＞」のタグは、この番組が放送される放送日を示しており、「＜ｃｈ＞Ａ０４４００１＜ｃｈ＞」のタグは、チャンネルコードを、「＜ｂｃ＞ＮＮＮ総合＜／ｂｃ＞」のタグはチャンネル名称を示すものである。「＜ｓｔ＞１３：００＜／ｓｔ＞」のタグは番組開始時刻を、「＜ｅｔ＞１３：１５＜／ｅｔ＞」のタグは番組終了時刻を示している。また、「＜ｇｂ＞００＜／ｇｂ＞」のタグは番組のジャンルを示しており、「＜ｔｎ＞ニュース＜／ｔｎ＞」のタグは番組タイトルを示すものである。そして、「＜ｃｎ＞・・・＜／ｃｎ＞」のタグは番組の内容を示すものである。なお、ここで「＜ｇｂ＞００＜／ｇｂ＞」の「００」はニュース番組を示すものとする。

また次の番組において、「＜ｇｂ＞３０＜／ｇｂ＞」の「３０」は番組のジャンルとしてドラマを示すものとする。この番組内において、「＜ｂｍ＞［多］［分］＜／ｂｍ＞」のタグは、放送形式を示すものであり音声多重及び文字放送であることを示している。また、「＜ｇｔ＞［作］土井美和子［出］杉田薫［出］的場司＜／ｇｔ＞」のタグは、この番組の制作に係わった人名を簡略的に示すものであり、「［作］」はこのドラマの作者を、「［出］」は出演者を示している。

続く「＜ｇｏ＞」と「＜／ｇｏ＞」とに挟まれた各タグ内には、この番組の制作に係わった人名が入力される。ここで、「＜ｎｎ…／＞」のタグは、この番組（ドラマ）の作者を示すものであり、「ｎａ＝」にその人名（例えば、土井美和子）が入力されている。また、「＜ｐｐ…／＞」のタグは、この番組の出演者を示すものであり、「ｎａ＝」にその人名（例えば、杉田薫）が入力されている。なお、各タグ内において「ｙｏ＝」で指示された文字列（例えば、すぎたかおる）は、その人名の「読み」を示している。また、「＜ｃｏ＞・・・＜／ｃｏ＞」のタグは、この番組の概要を示すものである。

また次の番組において、「＜ｇｂ＞４０＜／ｇｂ＞」の「４０」は番組のジャンルとして歌番組を示すものとする。この番組内において、「＜ｓｔｎ＞・・・＜／ｓｔｎ＞」のタグは、この番組のサブタイトルを示すものである。また、「＜ｐｐ＞・・・＜／ｐｐ＞」のタグは、この番組の出演者を簡略的に示すものであり、「［ゲ］」はこの歌番組のゲストを、「［司］」はこの歌番組の司会者を示している。

上記したように、電子番組表データにおいて、人名に読みが付与される番組は区々であり、一般的に番組ジャンルがドラマの場合に付与されることが多い。また、人名は、人名毎にタグで区切られて表記される場合もあるが、一般的に番組概要やサブタイトル等に列挙された形態で表記されることが多い。なお、電子番組表データは、後述するコンテンツ受信部２９の制御により所定の時間毎に外部装置から受信され、所定期間分（例えば、２週間分）の放送内容を含んだ新たな電子番組表データに更新されるものとする。

一方、コンテンツ素材記憶部１７１２には、録画或いは録音された動画データや音楽データがコンテンツとして記憶される。ここで、放送を受信して録画されたコンテンツには、図４に示した電子番組表データの一部又は全てが付属情報として関連付けて記憶されている。

図５は、コンテンツ素材記憶部１７１２の各コンテンツに関連付けて記憶された付属情報の一例を示した図である。図５に示したように、付属情報には、コンテンツ（番組データ）を放送した放送局やファイルフォーマット等を表すメディア種別（メディア）や記録日時（記録日付、開始時刻、終了時刻）、番組タイトル（タイトル）、当該コンテンツの番組出演者（出演者）、コンテンツ内容の一画面を表すサムネール画像へのアドレス（サムネール）、コンテンツ本体が存在するアドレス情報（本体）、番組内容等のコンテンツに関する詳細情報（詳細）等が含まれる。ここで、「サムネール」や「本体」に格納されたアドレスにより、対応するコンテンツに付属情報が関連付けられている。なお、「アドレス」は、各付属情報のアドレス（格納アドレス）を示しており、各付属情報の登録時に自動的に付与されるものである。

図５において、第１行目（アドレス：ｃ２０１）は番組ジャンルがニュース番組のコンテンツに関する付属情報であり、出演者の項目には該当する情報がないため「ＮＵＬＬ（該当なし）」となっている。

また、第２行目（アドレス：ｃ２１５）は番組ジャンルが歌番組のコンテンツに関する付属情報である。図４の電子番組表データの例で説明したように、歌番組の場合に出演者には「［出］」という識別子は付与されておらず、サブタイトル等に列挙された記述となっている。そのため、人名等を抽出するタグ解析以上の処理をしない場合には、「＜ｐｐ＞」タグに示された人名のみが出演者として記憶されることになる。

また、第３行目（アドレス：ｃ２３３）は、ＣＤ（Compact Disk）等の音楽メディアから抽出したコンテンツに関する付属情報である。この場合には、出演者とサムネールは存在しないため、「ＮＵＬＬ（該当なし）」となっている。

単語辞書１７２は、単語拡張部２４が実行する後述する単語拡張処理の際に用いられる辞書情報であって、図６に示したように、各単語の「見出し毎」に、その単語の「読み」と「係累属性」と「分類属性」とが関連付けて登録されている。

ここで、係累属性とは各単語間の親子関係を表した情報であって、具体的には、正式名称とその略語や愛称等の別称との関係を表すものである。例えば、見出し「トウキョウ娘。」では、係累属性は「ｆ１０００Ｍ」となっている。ここで「ｆ１０００Ｍ」のうち「ｆ１０００」は同一グループ、即ち、同一の単語（正式名称）を親とする単語群を識別するための識別情報（係累情報）であり、同一グループの単語には共通の係累情報が付与されている。また、「Ｍ」はこのグループの語源（Ｍｏｔｈｅｒ）となる単語、つまり、正式名称であることを示している。なお、正式名称となる単語毎に互いに異なる係累情報が付与されているものとする。

正式名称以外の単語には、「Ｍ」の代りに「Ｄ」が付与されている。例えば、見出し「Ｔ娘。」をみると、係累属性は「ｆ１０００Ｄ」になっている。これは、係累「ｆ１０００Ｍ」の子供（Ｄａｕｇｈｔｅｒ）、つまり、「トウキョウ娘。」の別称であることを示している。なお、別称を持たない単語については、係累属性は付与されておらず、当該係累属性の非適用を意味する「ＮＡ」が付与されている。

分類属性には、各単語が表す対象の分野名が登録されており、これら分野名により各単語が分類される。なお、図６では、「人」、「タイトル」を分野名とした例を示しているが、これに限らず、「芸能人」や「その他」等の他の分野名を用いる態様としてもよい。

音声認識辞書１７３は、音声認識部２２が行う音声認識処理時に用いられる辞書情報であって、図７に示したように、「語彙」毎に、「辞書番号」と、その語彙の「発音」と「品詞」とが関連付けて登録されている。

図７において、「辞書番号」は各単語の登録時に自動的に付与される識別情報であって、単語毎に固有の番号が付与されている。「語彙」は単語の見出しに相当するものであり、「発音」はその単語の「読み」に相当するものである。また、「品詞」は各単語の品詞を表すものである。図７に示した各単語は全て固有名詞であるため、「品詞」は全て固有名詞となっている。

次に、検索装置１の各機能部について説明する。受付部２１は、入力部１２から入力されるコンテンツの検索に係る種々の指示信号を受け付ける機能部である。具体的に、受付部２１は、入力部１２の検索ボタン１２３の押下を指示する指示信号を受け付けると、表示部１３に検索対象となるキーワードの入力を促す画面（ＧＵＩ）を表示させる。また、受付部２１は、入力部１２のマイクロフォン１２２を介して入力されたアナログの音声信号をＡＤ変換し、変換したデジタルの音声信号を音声認識部２２に出力する。なお、図２に示したように入力部１２をリモコン型とした場合には、ＡＤ変換に係る部位を入力部１２が備える態様としてもよい。

音声認識部２２は、受付部２１から入力されるデジタルの音声信号に対しＦＦＴ（高速フーリエ解析）等を行うことで、この音声信号の特徴量を抽出する。また、音声認識部２２は、ＨＭＭ（隠れマルコフモデル）等の技術を用い、音声信号から抽出した特徴量と、音声認識辞書１７３に登録された各語彙とのマッチングを行うことで、音声信号に対応する単語（群）を検索対象のキーワードとして夫々認識する。

音声認識辞書生成部２３は、単語辞書１７２に登録された各単語に基づき、当該各単語（語彙）と発音（読み）と品詞とを関連付けて音声認識辞書１７３に登録することで、音声認識辞書１７３を生成する。ここで、音声認識辞書１７３の生成については、例えば、特開２００７−０４７４１２号公報に開示された公知の方法を用いることができる。

具体的に、音声認識辞書生成部２３は、単語辞書１７２に登録された各単語と、語彙の発音を定義した図示しない発音辞書とを比較し、単語辞書１７２に登録された単語のうち発音辞書に定義された語彙と一致する単語については、音声認識辞書１７３に登録を行う登録対象の語彙として識別する。また、音声認識辞書生成部２３は、各語彙の品詞を定義した図示しない品詞辞書に基づいて、登録対象の語彙の品詞を識別する。また、音声認識辞書生成部２３は、登録対象の語彙毎に固有の辞書番号を付与し、辞書番号と、当該辞書番号に対応する語彙と、この語彙の発音と、品詞とを関連付けて音声認識辞書１７３に登録する。

単語拡張部２４は、音声認識部２２から入力されたキーワードの文字列に基づき、キーワードに一致する単語を単語辞書１７２から検索するとともに、この単語に関連付けられた係累属性に基づいて、当該単語に係累する他の単語（係累単語）を単語辞書１７２から検索する。そして、単語拡張部２４は、単語辞書１７２から検索した単語を、検索候補単語として表示部１３に表示させる。また、単語拡張部２４は、検索単語選択部２５から入力された後述する検索単語と、この検索単語に係累する係累単語とを検索対象となる拡張検索単語に設定し、コンテンツ検索部２６に出力する。

検索単語選択部２５は、表示部１３に表示された検索候補単語から特定の単語を選択する指示信号を、入力部１２（選択ボタン１２５及び決定ボタン１２６）から受け付ける機能部である。以下、検索候補単語群から選択された特定の単語を検索単語という。

コンテンツ検索部２６は、単語拡張部２４から入力された拡張検索単語に基づいて、当該拡張検索単語に含まれた単語のうち、何れかの単語を含んだコンテンツを、コンテンツ記憶部１７１のコンテンツ情報記憶部１７１１及びコンテンツ素材記憶部１７１２から検索する。

具体的に、コンテンツ検索部２６は、コンテンツ情報記憶部１７１１の番組表に記された各コンテンツに含まれる番組タイトル等の情報、及び、コンテンツ素材記憶部１７１２に記憶された各コンテンツの付属情報に含まれる番組タイトル等の情報に、拡張検索単語に含まれた各単語の何れかと一致する文字列が存在するか否かを判定する。また、コンテンツ検索部２６は、拡張検索単語の何れかの単語と一致する文字列を含むと判定したコンテンツについて、当該コンテンツに関係するサムネール画像や情報等を表示部１３に表示させる。

コンテンツ選択部２７は、コンテンツ検索部２６の制御により表示部１３に表示された各コンテンツから特定のコンテンツを選択する指示信号を、入力部１２（選択ボタン１２５及び決定ボタン１２６）から受け付ける機能部である。

再生制御部２８は、検索装置１の操作を支援するための種々のＧＵＩを表示部１３に表示させる。また、再生制御部２８は、コンテンツ選択部２７を介して選択されたコンテンツの再生を制御する。

具体的に、再生制御部２８は、コンテンツ選択部２７を介して選択されたコンテンツが、コンテンツ情報記憶部１７１１又はコンテンツ素材記憶部１７１２の何れに記憶されたコンテンツかを判別し、コンテンツ素材記憶部１７１２の場合には、選択されたコンテンツを再生し表示部１３に表示させる。

また、再生制御部２８は、選択されたコンテンツが、コンテンツ情報記憶部１７１１に記憶されていると判断した場合、即ち、電子番組表データに記述された番組と判断した場合、この番組の放送日、開始時刻及び終了時刻を参照し、日時計測部３０が計測する現在日時と比較する。なお、番組の放送日、開始時刻、終了時刻は、図４で示した電子番組表データのうち、「＜ｄｔ＞・・・＜／ｄｔ＞」、「＜ｓｔ＞・・・＜／ｓｔ＞」、「＜ｅｔ＞・・・＜／ｅｔ＞」の各タグに挟まれた文字列部分から取得されるものとする。

ここで、再生制御部２８は、選択された番組（コンテンツ）の放送日、開始時刻及び終了時刻が現在日時と時系列的に重なると判断した場合には、現在放送中の番組であるため、当該番組の放送をコンテンツ受信部２９に受信させ、その内容を表示部１３に表示させる。なお、選択された番組の放送日及び開始時刻が、現在日時より過去にあたると判断した場合には、当該番組の再生は不可能であるため、その旨を報知する情報を表示部１３に表示させるものとする。

また、再生制御部２８は、選択された番組の放送日及び開始時刻が、現在日時より未来にあたると判断した場合、即ち、放送予定の番組と判断した場合には、電子番組表データに記された放送予定日時に基づいて当該番組の録画を予約する。このように、番組の予約を行った場合には、再生制御部２８は、番組の放送日時にコンテンツ受信部２９により受信させ、録画を開始する。なお、ここで録画とは、番組の実データ（映像データ、音声データ）と、当該番組の電子番組表データ（付属情報）とを関連付けてコンテンツ素材記憶部１７１２に記憶すること意味する。

コンテンツ受信部２９は、コンテンツ情報記憶部１７１１に記憶された電子番組表データに基づいて、再生制御部２８から指示された番組の放送を受信する。

日時計測部３０は、図示しないクロック生成器等から生成されるクロック信号に基づいて、現在の日付と時刻を計測する。

以下、本実施形態の検索装置１の動作について説明する。図８は、検索装置１の各機能部により実行されるコンテンツ検索・再生処理の手順を示したフローチャートである。

まず、受付部２１は、入力部１２から指示信号が入力されるまで待機する（ステップＳ１１）。この状態において、入力部１２の検索ボタン１２３が押下されたことを示す指示信号を受け付けたと判断すると（ステップＳ１２；検索）、受付部２１は、表示部１３に検索対象となるキーワードの入力を促す画面を表示させる（ステップＳ１３）。

次いで、受付部２１は、検索ボタン１２３が押下されたことを示す指示情報の入力中に、マイクロフォン１２２に入力された音声の音声信号を受け付けたと判断すると、この音声信号をＡＤ変換し音声認識部２２に出力する（ステップＳ１４）。続く音声認識部２２では、ステップＳ１４でＡＤ変換されたデジタルの音声信号に基づいて音声認識処理を実行する（ステップＳ１５）。

以下、図９を参照して、ステップＳ１５の音声認識処理を説明する。図９は、音声認識処理の手順を示したフローチャートである。

まず、音声認識部２２は、ステップＳ１４でＡＤ変換されたデジタルの音声信号に対し、ＦＦＴ等を行うことで音声信号の特徴量を抽出する（ステップＳ１５１）。次いで、音声認識部２２は、ＨＭＭ等の技術を用い、ステップＳ１５１で抽出した特徴量と、音声認識辞書１７３に登録された各語彙の発音とのマッチングを行うことで、音声情報に対応する語彙（群）を夫々キーワードとして音声認識辞書１７３から特定する（ステップＳ１５２）。

続いて、音声認識部２２は、ステップＳ１５２で特定したキーワードを単語拡張部２４に出力し（ステップＳ１５３）、図８のステップＳ１６の処理へと移行する。

図８に戻り、単語拡張部２４は、音声認識部２２から入力されたキーワードに基づいて単語拡張処理を実行する（ステップＳ１６）。以下、図１０を参照してステップＳ１６の単語拡張処理を説明する。

図１０は、ステップＳ１６の単語拡張処理の手順を示したフローチャートである。まず、単語拡張部２４は、音声認識部２２から入力されたキーワードのうち一のキーワードを処理対象とすると（ステップＳ１６１）、このキーワードに一致する単語を単語辞書１７２から検索する（ステップＳ１６２）。ここで、処理対象のキーワードと一致する単語が単語辞書１７２に登録されていないと判定した場合（ステップＳ１６２；Ｎｏ）、単語拡張部２４は、処理対象のキーワードが表す単語を検索候補単語として保持し（ステップＳ１６４）、ステップＳ１６８の処理へと移行する。

一方、ステップＳ１６２において、処理対象のキーワードと一致する単語が単語辞書１７２に登録されていると判定した場合（ステップＳ１６２；Ｙｅｓ）、単語拡張部２４は、その単語に係累属性が付与されているか否かを判定する（ステップＳ１６３）。ここで、検索した単語に係累属性が付与されていないと判定した場合（ステップＳ１６３；Ｎｏ）、単語拡張部２４は、処理対象のキーワードが表す単語を検索候補単語として保持し（ステップＳ１６４）、ステップＳ１６８の処理へと移行する。

また、ステップＳ１６３において、検索した単語に係累属性が付与されていると判定した場合（ステップＳ１６３；Ｙｅｓ）、単語拡張部２４は、この単語の係累属性に基づいて、当該係累属性の係累情報と同一の係累情報を有する他の単語（係累単語）を単語辞書１７２から検索する（ステップＳ１６５）。そして、単語拡張部２４は、ステップＳ１６５で検索した係累単語と、処理対象のキーワードと一致した単語とを、当該各単語の係累属性と関連付けて保持する（ステップ１６６）。以下、ステップＳ１６６で保持したものを検索結果情報という。

ここで、図６で示した単語辞書１７２を例とし、ステップＳ１６６で保持された検索結果情報について説明する。処理対象のキーワードが「Ｔ娘。」である場合、単語辞書１７２に「Ｔ娘。」が登録されているため、単語拡張部２４は、係累属性が付与されているか否かの判定を行う。

ここで、単語辞書１７２に登録された「Ｔ娘。」の係累属性は「ｆ１０００Ｄ」であるため、単語拡張部２４は、この係累属性の係累情報と同一の係累情報が付与された係累単語を単語辞書１７２から検索する。この場合、「Ｔ娘。」の係累情報は「ｆ１０００」であるので、この「ｆ１０００」が付与された単語、即ち、「トウキョウ娘。」（ｆ１０００Ｍ）、「娘。」（ｆ１０００Ｄ）、「ＴＫＯ娘。」（ｆ１０００Ｄ）が係累単語として検索される。

ステップＳ１６６において、単語拡張部２４は、検索した係累単語と、処理対象のキーワードに対応する単語とを、当該各単語の係累属性と関連付けて保持する。つまり、「（Ｔ娘。、ｆ１０００Ｄ）」、「（トウキョウ娘。、ｆ１０００Ｍ）」、「（娘。、ｆ１０００Ｄ）」及び「（ＴＫＯ娘。、ｆ１０００Ｄ）」が、検索結果情報として保持されることになる。

次いで、単語拡張部２４は、ステップＳ１６６で保持した検索結果情報から係累属性に語源を意味する「Ｍ」が含まれた係累単語を、処理対象のキーワードに対応する単語ととともに検索候補単語として保持し（ステップＳ１６７）、ステップＳ１６８の処理へと移行する。なお、処理対象のキーワードが係累属性に語源を意味する「Ｍ」が含まれた係累単語と一致するような場合、即ち、処理対象のキーワードが特定の対象の正式名称を表しているような場合には、キーワードに対応する単語のみを検索候補単語として保持するものとする。

続くステップＳ１６８では、単語拡張部２４が、音声認識部２２から入力された全てのキーワードを処理対象としたか否かを判定し、未処理のキーワードが存在すると判定した場合には（ステップＳ１６８；Ｎｏ）、ステップＳ１６１に移行し未処理のキーワードを処理対象とする。

一方、ステップＳ１６８において、全てのキーワードを処理対象としたと判定した場合には（ステップＳ１６８；Ｙｅｓ）、単語拡張部２４は、これまでに検索候補単語として保持した各単語を選択可能な状態で表示部１３に表示させ（ステップＳ１６９）、ステップＳ１７の処理へと移行する。

ここで、図６で示した単語辞書１７２及び図７で示した音声認識辞書１７３に基づいて、ステップＳ１４〜Ｓ１６の動作を具体的に説明する。

ステップＳ１４において、音声情報「てぃーむす」が受付部２１で受け付けられたとすると、音声認識部２２は、この音声情報「てぃーむす」に基づいて、ステップＳ１５の音声認識処理を実行する。この音声認識処理により「てぃーむす」、「ちーむ」、「てぃーむ」の３つの発音がマッチングしたとすると、音声認識部２２は、音声認識辞書１７３からこれら発音に対応する語彙「Ｔ娘。」、「チーム」、「ティーム」をキーワードとして夫々特定する。

続いて、単語拡張部２４は、音声認識部２２から入力されたキーワード「Ｔ娘。」、「チーム」及び「ティーム」について単語拡張処理を実行する。キーワード「Ｔ娘。」については、単語辞書１７２に登録されているため、単語拡張部２４は、係累属性が付加されているか否かの判定に進む（ステップＳ１６３）。

ここで、単語辞書１７２に登録された「Ｔ娘。」の係累属性は「ｆ１０００Ｄ」となっている。つまり、語源を表す「Ｍ」ではなく、その別称を表す「Ｄ」が係累属性に含まれている。そのため、単語拡張部２４は、この係累属性と同一の係累情報（ｆ１０００）で、且つ、係累属性に語源を意味する「Ｍ」が含まれた係累単語「トウキョウ娘。」（ｆ１０００Ｍ）を単語辞書１７２から読み出し、キーワード「Ｔ娘。」とともに検索候補単語として保持する。

一方、キーワード「チーム」については、単語辞書１７２に登録されているものの（ステップＳ１６２；Ｙｅｓ）、係累属性は登録されていないため（ステップＳ１６３；Ｎｏ）、単語拡張部２４は、キーワード「チーム」を検索候補単語として保持する。また、キーワード「ティーム」についても、単語辞書１７２に登録されているものの（ステップＳ１６２；Ｙｅｓ）、係累属性は登録されていないため（ステップＳ１６３；Ｎｏ）、単語拡張部２４は、キーワード「ティーム」を検索候補単語として保持する。

単語拡張部２４は、全てのキーワードを処理対象とすると、これまでに保持した検索候補単語を選択可能な状態で表示部１３に表示させる。つまり、単語拡張部２４は、マイクロフォン１２２を介して入力された音声情報「てぃーむす」に対し、「Ｔ娘。」、「トウキョウ娘。」、「チーム」及び「ティーム」を、検索候補の単語群として表示部１３に表示する。

図１１−１、図１１−２は、表示部１３に表示された検索候補単語を説明するための図である。ここで、図１１−１は、検索ボタン１２３の押下時（ステップＳ１２）に、再生制御部２８の制御により表示部１３に表示された画面の一例を示した図である。この表示画面において、検索ボタン１２３が押下された状態で、マイクロフォン１２２に検索対象の呼称である音声信号「てぃーむす」が入力されると、音声認識処理（ステップＳ１５）及び単語拡張処理（ステップＳ１６）が実行される。そして、単語拡張部２４は、図１１−２に示したように、検索候補単語として「Ｔ娘。」、「トウキョウ娘。」、「チーム」及び「ティーム」を表示部１３の画面内に表示させる。

ユーザは、入力部１２の選択ボタン１２５及び決定ボタン１２６を介し、表示部１３に表示された検索候補単語から特定の単語を選択することが可能となっている。ここで、選択された特定の単語は、検索単語として検索単語選択部２５により受け付けられる。なお、検索単語として選択される単語は、一に限らず複数であってもよいものとする。

図８に戻り、検索単語選択部２５は、検索候補単語の中から検索単語を指示する指示情報を入力部１２から受け付けると、この検索単語を単語拡張部２４に出力する（ステップＳ１７）。

単語拡張部２４は、検索単語選択部２５から検索単語が入力されると、この検索単語の係累情報と同一の係累情報が付与された係累単語を検索結果情報から特定し、この検索単語と当該検索単語の係累単語とを拡張検索単語としてコンテンツ検索部２６に出力する（ステップＳ１８）。なお、本実施形態では、ステップＳ１６のステップＳ１６６で保持した検索結果情報を用いることとしたが、検索単語に係累する係累単語を単語辞書１７２から再度検索する態様としてもよい。

例えば、検索単語として「Ｔ娘。」が入力された場合には、この「Ｔ娘。」の係累情報に基づき、係累単語として「トウキョウ娘。」、「娘。」及び「ＴＫＯ娘。」が読み出されることになる。なお、検索単語に係累属性が存在しない場合には、この検索単語のみをコンテンツ検索部２６に出力するものとする。

続くステップＳ１９において、コンテンツ検索部２６は、単語拡張部２４から入力された拡張検索単語に基づき、この拡張検索単語に含まれた各単語の何れかに関係するコンテンツを、コンテンツ情報記憶部１７１１に記憶された番組表、及び、コンテンツ素材記憶部１７１２に記憶された各コンテンツの付属情報から検索する（ステップＳ１９）。

例えば、検索単語として「Ｔ娘。」、「トウキョウ娘。」、「娘。」及び「ＴＫＯ娘。」が入力された場合には、これら各単語の何れかの文字列が含まれるコンテンツが検索されることになる。

ここで、ステップＳ１８の処理を行わず、検索単語選択部２５で受け付けられた検索単語「Ｔ娘。」のみでコンテンツの検索を行った場合を考える。この場合、図４に示した番組表及び図５に示した付属情報の何れにも「Ｔ娘。」の文字列は含まれないため、検索結果は「該当なし」となる。つまり、「Ｔ娘。」の正式名称である「トウキョウ娘。」が図５の付属情報に登録されているにも関わらず、異なる文字列であるため検索することはできない。

これに対し、ステップＳ１８の処理により、検索単語「Ｔ娘。」の係累単語も含めることで、「Ｔ娘。」の正式名称である「トウキョウ娘。」と、他の別称である「娘。」、「ＴＫＯ娘。」をも検索単語とすることができる。そのため、同一の対象が複数の名称を有するような場合であっても、各名称に基づいて関連するコンテンツを検索することが可能となり、当該対象に関連するコンテンツをより確実に検索することができる。

続くステップＳ２０では、コンテンツ検索部２６が、ステップＳ１９で検索した各コンテンツを選択可能な状態で表示部１３に表示させた後（ステップＳ２０）、ステップＳ１１の処理へと再び戻る。なお、ステップＳ１９の検索処理において、該当するコンテンツが存在しなかった場合には、その旨を報知する情報が表示部１３に表示されるものとする。

図１２は、ステップＳ２０の処理により表示部１３に表示された画面の一例を示した図である。ここでは、「トウキョウ娘。」についての検索結果を示しており、図５のアドレス：ｃ２１５の出演者に「トウキョウ娘。」があることから、このコンテンツのサムネール等関連する情報が表示部１３に表示されている。

図８に戻り、ステップＳ１１において、ステップＳ２０で表示されたコンテンツの一覧から、処理対象のコンテンツを選択する指示信号がコンテンツ選択部２７により受け付けられると（ステップＳ１２；選択）、再生制御部２８は、この選択されたコンテンツがコンテンツ素材記憶部１７１２に記憶されたものか否かを判定する（ステップＳ２１）。

ステップＳ２１において、選択されたコンテンツがコンテンツ素材記憶部１７１２に記憶されていると判断した場合には（ステップＳ２１；Ｙｅｓ）、再生制御部２８は、コンテンツ素材記憶部１７１２から該当するコンテンツを読み出す（ステップＳ２２）。次いで、再生制御部２８は、読み出したコンテンツを再生することで表示部１３に表示させた後（ステップＳ２３）、本処理を終了する。

一方、ステップＳ２１において、選択されたコンテンツがコンテンツ情報記憶部１７１１に記憶されていると判定した場合、即ち、電子番組表データに記述された番組と判断した場合には（ステップＳ２１；Ｎｏ）、再生制御部２８はこの番組の放送日、開始時刻及び終了時刻と、現在時刻とを比較する（ステップＳ２４）。

ここで、選択された番組の放送日、開始時刻及び終了時刻が、現在日時と時系列的に重なると判断した場合、即ち、現在放送中の番組と判断した場合には（ステップＳ２４；Ｙｅｓ）、この番組の放送をコンテンツ受信部２９に受信させ（ステップＳ２５）、受信した番組を表示部１３に表示させた後（ステップＳ２６）、本処理を終了する。

また、ステップＳ２４において、選択された番組の放送日及び開始時刻が、現在日時より未来にあたると判断した場合、即ち、放送予定の番組と判断した場合には（ステップＳ２４；Ｎｏ）、当該番組の録画を予約し（ステップＳ２７）、本処理を終了する。

以上のように、本実施形態によれば、単語辞書に登録された各単語の係累属性に基づいて、音声入力されたキーワードに係累する単語を検索単語に含めることができるため、キーワードが表す名称とその別称とに関連するコンテンツを効率的に検索することができ、ユーザの利便性を向上させることができる。

なお、本実施形態の単語拡張処理（ステップＳ１６）では、単語拡張部２４から入力されたキーワードが正式名称でない場合、即ち、キーワードを表す単語の係累属性に語源を意味する「Ｍ」が含まれない場合であっても検索候補単語に含める態様としたが、これに限らないものとする。

例えば、キーワードが別称であるような場合には、検索候補単語に含めない態様としてもよい。この場合、図１０で説明した単語拡張処理のステップＳ１６７において、ステップＳ１６６で保持した検索結果情報から係累属性に語源を意味する「Ｍ」が含まれた係累単語のみを検索候補単語として保持することで、実現することができる。この態様とした場合、表示部１３に表示される検索候補単語は、図１３のように表される。なお、図１３は、上述した図１１−２と対応する図であって、音声信号「てぃーむす」が入力された場合の表示例を示している。同図に示したように、音声信号「てぃーむす」が入力されたにも関わらず、この音声信号に対応する「Ｔ娘。」は表示されずに、「Ｔ娘。」の正式名称「トウキョウ娘。」のみが表示されることになる。

また、本実施形態では、コンテンツ情報記憶部１７１１及びコンテンツ素材記憶部１７１２から、拡張検索単語に含まれる各単語の何れかに関係するコンテンツを検索する態様としたが、これに限らないものとする。例えば、コンテンツ情報記憶部１７１１又はコンテンツ素材記憶部１７１２の一方のみから該当するコンテンツを検索する態様としてもよい。

［第２の実施形態］
次に、第２の実施形態の検索装置について説明する。なお、上述した第１の実施形態と同様の構成については、同一の符号を付与し、その説明を省略する。

第１の実施形態で説明した構成のうち、コンテンツ情報記憶部１７１１に記憶されるコンテンツは電子番組表データ（ＥＰＧ）であるため、時間経過とともにその内容は随時更新される。また、コンテンツ素材記憶部１７１２に記憶されたコンテンツは、ユーザが録画（又は録音）したものであるため、録画が行われる毎に新たなコンテンツが記憶される。

このように、各コンテンツの内容は時間経過とともに変化することになるため、単語辞書１７２に登録する単語もコンテンツ情報記憶部１７１１及びコンテンツ素材記憶部１７１２の変化に追随させる必要がある。しかし、上述した第１の実施形態では、単語辞書１７２を予め記憶された固定的なものとしたため、このような変化に追随することができず、新たな単語に対応できない可能性がある。

そのため、第２の実施形態では、上記したようなコンテンツ内容の経時変化に追随することが可能な検索装置２について説明する。

まず、図１４を参照して、上述したＣＰＵ１１とＲＯＭ１４又は記憶部１７に記憶されたプログラムとの協働により実現される検索装置２の各機能部について説明する。図１４は、検索装置２の機能的構成を示したブロック図である。

図１４に示したように、検索装置２は、上述した受付部２１、音声認識部２２、音声認識辞書生成部２３、検索単語選択部２５、コンテンツ選択部２７、再生制御部２８、コンテンツ受信部２９、日時計測部３０に加えて、単語辞書登録部３１、単語拡張部３２及びコンテンツ検索部３３を備えている。また、記憶部１７は、単語辞書１７２に代えて単語辞書１７４を記憶している。

単語辞書登録部３１は、コンテンツ情報記憶部１７１１の電子番組表データ、コンテンツ素材記憶部１７１２の付属情報に含まれる各文字列に形態素解析を施すことで単語を抽出し、この抽出した単語を単語辞書１７４に登録する。

ここで、形態素解析とは文字列を形態素（言語で意味を持つ最小単位）に分割する技術である。形態素解析では、「品詞」等の情報を持つ単語リストからなる辞書と、その活用形を定義した情報と、読みの情報（何れも図示せず）とを基に、形態素候補を列挙したラティスと呼ばれるグラフ構造を形成し、その中から、規則或いは統計的処理により、最も可能性の高い候補を単語として抽出する。なお、形態素解析には公知の技術を用いることが可能である。

また、単語辞書登録部３１は、抽出した単語の単語辞書１７４への登録時において、抽出した単語がコンテンツ情報記憶部１７１１或いはコンテンツ素材記憶部１７１２のどちらに記憶されているかを示す存在属性を対応付けて登録する。

図１５は、記憶部１７に記憶された単語辞書１７４の一例を示した図である。同図に示したように、各単語の見出し毎に、「読み」と「係累属性」と「分類属性」と「存在属性」とが関連付けて登録されている。

単語辞書１７４おいて、図６で示した単語辞書１７２との違いは、最後の列にある存在属性のみである。ここで存在属性は、各単語の格納場所を示すものであって、具体的には、見出しで示した単語がコンテンツ記憶部１７１に存在するか、存在するとしたらコンテンツ情報記憶部１７１１とコンテンツ素材記憶部１７１２とのどちらに存在するかを示している。

例えば、「トウキョウ娘」の場合には、存在属性として「ｃ２０２」が登録されている。ここで「ｃ２０２」の「ｃ」は、コンテンツ素材記憶部１７１２に記憶されていることを示している。また、「杉田薫」の場合には、存在属性として「ｅ３８０２」が登録されている。ここで「ｅ３８０２」の「ｅ」は、コンテンツ情報記憶部１７１１に記憶されていることを示している。また、「ｃ」又は「ｅ」に続く文字列（例えば、３８０２）は、この単語が存在するコンテンツのヘッダのアドレス（格納アドレス）を意味している。

一方、「Ｔ娘。」の場合には、存在属性が「ＮＡ」となっている。これは、コンテンツ情報記憶部１７１１、コンテンツ素材記憶部１７１２の何れにも「Ｔ娘。」という単語が存在しないことを意味している。

図１４に戻り、単語拡張部３２は、音声認識部２２から入力されたキーワードの文字列に基づき、キーワードに一致する単語を単語辞書１７４から検索するとともに、この単語に関連付けられた係累属性に基づいて、当該単語に係累する他の単語（係累単語）を単語辞書１７４から検索する。また、単語拡張部３２は、検索した単語（キーワードと係累単語）を、検索候補単語として表示部１３に表示させる。さらに、単語拡張部３２は、検索単語選択部２５から入力された検索単語と、この検索単語に係累する係累単語とを、各単語に関連付けられた存在属性とともに拡張検索単語としてコンテンツ検索部３３に出力する。

コンテンツ検索部３３は、単語拡張部３２から入力された拡張検索単語に含まれる各単語の何れかの文字列を含んだコンテンツを、各単語に関連付けられた存在属性に基づいて、コンテンツ情報記憶部１７１１及びコンテンツ素材記憶部１７１２から検索する。

具体的に、コンテンツ検索部３３は、存在属性によりコンテンツ情報記憶部１７１１に記憶されていると示された単語については、コンテンツ情報記憶部１７１１から検索し、また、存在属性によりコンテンツ素材記憶部１７１２に記憶されていると示された単語については、コンテンツ素材記憶部１７１２から検索する。なお、存在属性が「ＮＡ」の単語については、コンテンツ情報記憶部１７１１及びコンテンツ素材記憶部１７１２中に存在しない単語であるため、当該単語にかかる検索は行われないものとする。

以下、本実施形態の検索装置２の動作について説明する。図１６は、検索装置２によるコンテンツ検索・再生処理の手順を示したフローチャートである。

まず、受付部２１は、入力部１２から指示信号が入力されるまで待機する（ステップＳ３１）。この状態において、入力部１２の検索ボタン１２３が押下されたことを示す指示信号を受け付けたと判断すると（ステップＳ３２；検索）、受付部２１は、表示部１３に検索対象となるキーワードの入力を促す画面を表示させる（ステップＳ３３）。

次いで、受付部２１は、検索ボタン１２３が押下されたことを示す指示情報の入力中に、マイクロフォン１２２に入力された音声の音声信号を受け付けたと判断すると、この音声信号をＡＤ変換し音声認識部２２に出力する（ステップＳ３４）。続く音声認識部２２では、ステップＳ３４でＡＤ変換されたデジタルの音声信号に基づいて音声認識処理を実行する（ステップＳ３５）。ここで、ステップＳ３５の音声認識処理は、図９で説明したステップＳ１５の音声認識処理と同様であるため、説明は省略する。

続いて、単語拡張部３２は、音声認識部２２から入力されたキーワードに基づいて単語拡張処理を実行する（ステップＳ３６）。以下、図１７を参照してステップＳ３６の単語拡張処理を説明する。

図１７は、ステップＳ３６の単語拡張処理の手順を示したフローチャートである。まず、単語拡張部３２は、音声認識部２２から入力されたキーワードのうち一のキーワードを処理対象とすると（ステップＳ３６１１）、このキーワードに一致する単語を単語辞書１７４から検索することで、単語辞書１７４にキーワードが登録されているか否かを判定する（ステップＳ３６１２）。ここで、単語辞書１７４にキーワードと一致する単語が登録されていないと判定した場合（ステップＳ３６１２；Ｎｏ）、単語拡張部３２は、処理対象のキーワードが表す単語を検索候補単語として保持し（ステップＳ３６１５）、ステップＳ３６１９の処理へと移行する。

一方、ステップＳ３６１２において、単語辞書１７４にキーワードと一致する単語が登録されていると判定した場合（ステップＳ３６１２；Ｙｅｓ）、単語拡張部３２は、その単語に係累属性が付与されているか否かを判定する（ステップＳ３６１３）。ここで、検索した単語に係累属性が付与されていないと判定した場合（ステップＳ３６１３；Ｎｏ）、単語拡張部３２は、処理対象のキーワードと一致した単語を、当該単語の存在属性と関連付けた検索結果情報として保持する（ステップＳ３６１４）。次いで、単語拡張部３２は、処理対象のキーワードが表す単語を検索候補単語として保持し（ステップＳ３６１５）、ステップＳ３６１９の処理へと移行する。

また、ステップＳ３６１３において、検索した単語に係累属性が関連付けられていると判定した場合（ステップＳ３６１３；Ｙｅｓ）、単語拡張部３２は、この単語の係累属性に基づいて、当該係累属性の係累情報と共通の係累情報を有する他の単語（係累単語）を単語辞書１７４から検索する（ステップＳ３６１６）。そして、単語拡張部３２は、ステップＳ３６１６で検索した係累単語と、処理対象のキーワードに対応する単語とを、当該各単語の係累属性及び存在属性と関連付けた検索結果情報を保持する（ステップ３６１７）。

ここで、図１５で示した単語辞書１７４を例とし、ステップＳ３６１７で保持された検索結果情報について説明する。処理対象のキーワードが「Ｔ娘。」である場合、単語辞書１７４に「Ｔ娘。」が登録されているため、単語拡張部３２は、係累属性が付与されているか否かの判定を行う。

ここで、単語辞書１７４に登録された「Ｔ娘。」の係累属性は「ｆ１０００Ｄ」であるため、単語拡張部３２は、この係累属性の係累情報と同一の係累情報が付与された係累単語を単語辞書１７４から検索する。この場合、「Ｔ娘。」の係累情報は「ｆ１０００」であるので、この「ｆ１０００」が付与された単語、即ち、「トウキョウ娘。」（ｆ１０００Ｍ）、「娘。」（ｆ１０００Ｄ）、「ＴＫＯ娘。」（ｆ１０００Ｄ）が係累単語として検索される。

ステップＳ３６１７において、単語拡張部３２は、検索した係累単語と、処理対象のキーワードに対応する単語とを、当該各単語の係累属性と存在属性と関連付けて保持する。つまり、「（Ｔ娘。、ｆ１０００Ｄ、ＮＡ）」、「（トウキョウ娘。、ｆ１０００Ｍ、ｃ２０２）」、「（娘。、ｆ１０００Ｄ、ＮＡ）」及び「（ＴＫＯ娘。、ｆ１０００Ｄ、ＮＡ）」が、検索結果情報として保持されることになる。なお、ステップＳ３６１４で保持される検索結果情報には、係累属性が存在しないため、例えば「（チーム、ＮＡ、ｅ１７８）」のような状態で保持されることになる。

続くステップＳ３６１８において、単語拡張部３２は、ステップＳ３６１７で保持した検索結果情報から係累属性に語源を意味する「Ｍ」が含まれた係累単語を、処理対象のキーワードに対応する単語ととともに検索候補単語として保持し（ステップＳ３６１８）、ステップＳ３６１９の処理へと移行する。なお、処理対象のキーワードが係累属性に語源を意味する「Ｍ」が含まれた係累単語と一致するような場合、即ち、処理対象のキーワードが特定の対象の正式名称を表しているような場合には、キーワードに対応する単語のみを検索候補単語として保持するものとする。

続くステップＳ３６１９では、単語拡張部３２が、音声認識部２２から入力された全てのキーワードを処理対象としたか否かを判定し、未処理のキーワードが存在すると判定した場合には（ステップＳ３６１９；Ｎｏ）、ステップＳ３６１１に移行し未処理のキーワードを処理対象とする。

一方、ステップＳ３６１９において、全てのキーワードを処理対象としたと判定した場合には（ステップＳ３６１９；Ｙｅｓ）、単語拡張部３２は、これまでに検索候補単語として保持した単語群を表示部１３に表示させ（ステップＳ３６２０）、ステップＳ３７の処理へと移行する。

図１６に戻り、検索単語選択部２５は、検索候補単語の中から検索単語を指示する指示情報を入力部１２から受け付けると、この検索単語を単語拡張部３２に出力する（ステップＳ３７）。

次いで、単語拡張部３２は、検索単語選択部２５から検索単語が入力されると、この検索単語の係累情報と同一の係累情報が付加された係累単語を検索結果情報から特定し、この検索単語と当該検索単語の係累単語とを対応する存在属性と関連付け、拡張検索単語としてコンテンツ検索部３３に出力する（ステップＳ３８）。なお、本実施形態では、ステップＳ３６のステップＳ３６１７で保持した検索結果情報を用いることとしたが、検索単語について単語辞書１７４から係累単語を再度検索する態様としてもよい。

次に、コンテンツ検索部３３は、単語拡張部３２から入力された拡張検索単語に基づき、この拡張検索単語に含まれる何れかの単語を含んだコンテンツを存在属性に基づいて、コンテンツ情報記憶部１７１１及びコンテンツ素材記憶部１７１２から検索する（ステップＳ３９）。

例えば、単語拡張部３２から拡張検索単語をとして「（Ｔ娘。、ＮＡ）」、「（トウキョウ娘。、ｃ２０２）」、「（娘。、ＮＡ）」及び「（ＴＫＯ娘。、ＮＡ）」が入力されたとすると、コンテンツ検索部３３は、存在情報が「ＮＡ」以外の単語、即ち「（トウキョウ娘。、ｃ２０２）」についてのみ検索を行う。また、コンテンツ検索部３３は、（トウキョウ娘。、ｃ２０２）」の存在属性「ｃ２０２」に基づき、この単語をコンテンツ素材記憶部１７１２から検索する。

なお、単語拡張部３２から、存在属性が関連付けられていない単語が拡張検索単語として入力された場合には、存在情報自体が付与されていない状態、即ち、単語辞書１７４への登録前の単語と考えられる。そのため、コンテンツ検索部３３は、存在属性が関連付けられていない単語と一致する文字列を含んだコンテンツを、コンテンツ情報記憶部１７１１及びコンテンツ素材記憶部１７１２から検索するものとする。

次いで、コンテンツ検索部３３は、ステップＳ３９で検索した各コンテンツを選択可能な状態で表示部１３に表示させ（ステップＳ４０）、ステップＳ３１の処理へと再び戻る。なお、ステップＳ３９の検索処理において、該当するコンテンツが存在しなかった場合には、その旨を報知する情報が表示部１３に表示されるものとする。

ステップＳ３１において、ステップＳ４０で表示されたコンテンツの一覧から、処理対象のコンテンツを選択する指示信号がコンテンツ選択部２７により受け付けられると（ステップＳ３２；選択）、再生制御部２８は、この選択されたコンテンツがコンテンツ素材記憶部１７１２に記憶されたものか否かを判定する（ステップＳ４１）。ここで、コンテンツの記憶場所の判定は、存在属性に基づいて行うこととしてもよい。

ステップＳ４１において、選択されたコンテンツがコンテンツ素材記憶部１７１２に記憶されていると判断した場合には（ステップＳ４１；Ｙｅｓ）、再生制御部２８は、コンテンツ素材記憶部１７１２から該当するコンテンツを読み出す（ステップＳ４２）。次いで、再生制御部２８は、読み出したコンテンツを再生することで表示部１３に表示させた後（ステップＳ４３）、本処理を終了する。

一方、ステップＳ４１において、選択されたコンテンツがコンテンツ情報記憶部１７１１に記憶されていると判定した場合、即ち、電子番組表データに記述された番組と判断した場合には（ステップＳ４１；Ｎｏ）、再生制御部２８はこの番組の放送日、開始時刻及び終了時刻と、現在時刻とを比較する（ステップＳ４４）。

ここで、選択された番組の放送日、開始時刻及び終了時刻が、現在日時と時系列的に重なると判断した場合、即ち、現在放送中の番組と判断した場合には（ステップＳ４４；Ｙｅｓ）、この番組の放送をコンテンツ受信部２９に受信させ（ステップＳ４５）、受信した番組を表示部１３に表示させた後（ステップＳ４６）、本処理を終了する。

また、ステップＳ４４において、選択された番組の放送日及び開始時刻が、現在日時より未来にあたると判断した場合、即ち、放送予定の番組と判断した場合には（ステップＳ４４；Ｎｏ）、当該番組の録画を予約し（ステップＳ４７）、本処理を終了する。

また、本実施形態によれば、各コンテンツに含まれた各単語の存在属性を単語辞書に登録し、この存在属性に基づいてコンテンツの検索を行うため、キーワードが表す名称とその別称とに関連するコンテンツをより効率的に検索することができる。

なお、本実施形態では、図１５に示したように、存在属性に単語が存在するコンテンツのヘッダのアドレスを含めた態様としたが、これに限らないものとする。

例えば、存在属性に、コンテンツ情報記憶部１７１１とコンテンツ素材記憶部１７１２とのどちらに存在するかを示す情報のみを含めた態様としてもよい。具体的には、コンテンツ情報記憶部１７１１に存在する場合には「ｅ」、コンテンツ素材記憶部１７１２に存在する場合には「ｃ」、何れにも存在しない場合には「ＮＡ」とする態様とすることができる。

また、図１５では、存在情報を各見出しについて一つのみ関連付けた態様としたが、これに限らないものとする。例えば、ある単語がコンテンツ情報記憶部１７１１とコンテンツ素材記憶部１７１２との両方に存在する場合もある。このような場合には、二つの存在情報が登録される態様としてもよい。

［第３の実施形態］
次に、第３の実施形態の検索装置について説明する。なお、上述した第１、第２の実施形態と同様の構成については、同一の符号を付与し、その説明を省略する。

上述した第２の実施形態では、単語辞書登録部３１により、コンテンツ情報記憶部１７１１やコンテンツ素材記憶部１７１２に含まれた文字列から、単語辞書１７４に登録する単語を抽出する態様を説明した。この態様では、抽出した単語を単語辞書１７４に登録することは可能であるが、抽出した単語が他の単語と係累関係にあるか否かの判定については、改善の余地がある。

例えば、「東京大学」→「東大」、「アメリカ合衆国」→「米」、「インターカレッジ」→「インカレ」、「コンピュータグラフィックス」→「ＣＧ」等のようなものは、形態素解析に用いる辞書の中に省略語として具備しておくことで対応することは可能である。しかしながら、「トウキョウ娘。」→「Ｔ娘。」、「トウキョウ娘。」→「娘。」、「トウキョウ娘。」→「ＴＫＯ娘。」といった時流とともに変化する別称に追随するためには、ユーザ自身が各単語間の係累関係を設定する必要がある。

そのため、第３の実施形態では、上記した各単語間の係累関係の設定を改善することが可能な検索装置３について説明する。

まず、図１８を参照して、上述したＣＰＵ１１とＲＯＭ１４又は記憶部１７に記憶されたプログラムとの協働により実現される検索装置３の各機能部について説明する。図１８は、検索装置３の機能的構成を示したブロック図である。

図１８に示したように、検索装置３は、上述した受付部２１、音声認識部２２、音声認識辞書生成部２３、検索単語選択部２５、コンテンツ選択部２７、再生制御部２８、コンテンツ受信部２９、日時計測部３０、単語拡張部３２、コンテンツ検索部３３に加えて、単語辞書登録部３４、インターネット接続部３５を備えている。また、インターネット等のネットワークＮを介して、検索装置３と単語辞書マスタサーバ５とが通信可能に接続されている。

ここで、単語辞書マスタサーバ５は、外部装置に情報を提供することが可能なＷｅｂサーバやｆｔｐサーバ等であって、ネットワークＮ上に存在する情報資源である。具体的に、単語辞書マスタサーバ５は、検索装置３からの要求に応じ、自己の装置内に記憶した単語辞書マスタ５１を外部装置（検索装置３）に提供する。ここで、単語辞書マスタ５１は、単語辞書１７４のマスタとなる単語辞書であって、第３者による手動又は後述するバッカス記法を用いた自動制御により、各単語とその別称との関係が所定の時間間隔（例えば、数時間毎）に更新されているものとする。

図１９は、単語辞書マスタ５１の一例を示した図である。図１９に示したように、単語辞書マスタ５１には、各単語の見出し毎に、その単語の「読み」と、「係累属性」と、「分類属性」と、「存在属性」と、が関連付けて記憶されている。各項目の説明は上述したとおりである。なお、図１９の例では、各見出しについて「存在属性」を関連付けた態様を示したが、この「存在属性」を省略した態様としてもよい。また、図１９の例のように「存在属性」を関連付けた場合には、検索装置毎にコンテンツの保存場所は異なるため、「存在属性」に「ＮＡ」を付与しておくことが好ましい。

図１８に戻り、単語辞書登録部３４は、上述した単語辞書登録部３１と同様の機能を有するとともに、インターネット接続部３５を介して単語辞書マスタサーバ５から単語辞書マスタ５１を取得し、この単語辞書マスタ５１と単語辞書１７４とを比較することで単語辞書１７４の内容を更新する。

具体的に、単語辞書登録部３４は、単語辞書マスタ５１の「見出し」、「読み」、「係累属性」、「分類属性」、「存在属性」の各項目について、単語辞書１７４にマージを行うことで単語辞書１７４の内容を更新する。なお、「存在属性」については、単語辞書１７４の登録内容が優先されるものとする。

例えば、単語辞書１７４が、図２０に示した状態であったとする。単語辞書登録部３４は、図１９で示した単語辞書マスタ５１と、図２０の単語辞書１７４と、を比較しその差分を単語辞書１７４に追加・変更することで、図２１に示した単語辞書１７４の状態へと更新する。

また、単語辞書登録部３４は、形態素解析によるコンテンツ情報記憶部１７１１及びコンテンツ素材記憶部１７１２からの単語抽出時に、単語辞書１７４において「存在属性」が「ＮＡ」の単語と一致した単語については、この単語の存在位置を表す文字列を「存在属性」に登録するものとする。

インターネット接続部３５は、通信部１６を介し、ネットワークＮに接続された外部の装置から情報の取得を行う機能部である。具体的には、単語辞書登録部３４からの指示に応じ、ネットワークＮに接続された単語辞書マスタサーバ５から単語辞書マスタ５１を取得する。

また、本実施形態によれば、単語辞書マスタサーバ５から取得した単語辞書マスタ５１に基づいて、単語辞書１７４を更新することができるため、時流とともに呼称や名称が変化するような単語についても、その変化に追随することができる。

なお、単語辞書登録部３４が単語辞書マスタサーバ５から単語辞書マスタ５１を取得するタイミングは、特に問わないものとするが、例えば、１日１回等所定の時間間隔毎に行われることが好ましい。

［第４の実施形態］
次に、第４の実施形態の検索装置について説明する。なお、上述した第１、第２、第３の実施形態と同様の構成については、同一の符号を付与し、その説明を省略する。

上述した第３の実施形態では、単語辞書マスタサーバ５により提供される単語辞書マスタ５１により単語辞書１７４を更新する態様を説明した。第４の実施形態の検索装置４では、検索装置４自体がコンテンツ記憶部１７１に記憶したコンテンツに含まれる各単語間の係累関係を判定し、この判定結果に基づいて単語辞書１７４を更新する態様を説明する。

まず、図２２を参照して、上述したＣＰＵ１１とＲＯＭ１４又は記憶部１７に記憶されたプログラムとの協働により実現される検索装置４の各機能部について説明する。図２２は、検索装置４の機能的構成を示したブロック図である。

図２２に示したように、検索装置４は、上述した受付部２１、音声認識部２２、音声認識辞書生成部２３、検索単語選択部２５、コンテンツ選択部２７、再生制御部２８、コンテンツ受信部２９、日時計測部３０、単語拡張部３２、コンテンツ検索部３３、インターネット接続部３５に加えて、単語辞書登録部３６を備えている。また、記憶部１７は、後述する接続先テーブル１７５及び係累解析ルール１７６を記憶している。また、インターネット等のネットワークＮを介して、検索装置４とＷｅｂサーバ６とが通信可能に接続されている。

ここで、Ｗｅｂサーバ６は、外部装置に情報を提供することが可能なＷｅｂサーバであって、ネットワークＮ上に存在する情報資源である。具体的に、Ｗｅｂサーバ６は、検索装置４からの要求に応じ、自己の装置内に記憶した又は動的に生成したＨＴＭＬファイル等のＷｅｂページ（図示せず）を外部装置（検索装置４）に提供する。なお、ネットワークＮに接続されるＷｅｂサーバ６の個数は、特に問わないものとする。

単語辞書登録部３６は、上述した単語辞書登録部３１と同様の機能を有するとともに、コンテンツ情報記憶部１７１１及びコンテンツ素材記憶部１７１２に含まれた文字列を解析し抽出した単語を基に、この単語に関連したＷｅｂページを、インターネット接続部３５を介してＷｅｂサーバ６から取得する。

なお、Ｗｅｂサイトの中には、ＣＧＮ（Consumer Generated Media）と呼ばれる多数のユーザが知識を共有するためのサイトが存在する。このようなサイトでは、一般的に取り扱う分野に応じて特化した知識が共有されていることが多いため、検索する単語の分野毎に接続先となるＷｅｂサイト（Ｗｅｂサーバ６のＵＲＬ（Uniform Resource Locator））を予め設定しておくことで、検索の精度を高めることができる。

図２３は、検索対象の単語の分野に応じて、接続先となるＷｅｂサーバ６のＵＲＬを設定した接続先テーブル１７５の一例を示した図である。同図において、「分類属性」は単語辞書１７４に含まれる「分類属性」と対応するものであり、分野毎に、第１検索〜第３検索までの３つの接続先となるＷｅｂサーバ６のＵＲＬが登録されている。このような接続先テーブル１７５を記憶部１７に予め記憶しておくことで、検索する単語の分野毎に接続先となるＷｅｂサーバ６を使い分けることができる。

上記の接続先テーブル１７５を用いる場合、単語辞書登録部３６は、単語辞書１７４に登録された単語の「分類属性」に対応するＵＲＬを接続先テーブル１７５から参照し、このＵＲＬのＷｅｂサーバ６に接続することで、この単語に関連したＷｅｂページの検索を行う。例えば、「トウキョウ娘。」については、図２４−１や図２４−２で示したような検索結果（Ｗｅｂページ）を得ることができる。また、「ＤＮＡ」といった略語に対しても図２４−３に示したような検索結果を得ることができる。

なお、単語辞書登録部３６による、検索については「係累属性」が「ＮＡ」の単語についてのみ行われることが好ましい。また、接続先のＷｅｂサーバ６が、検索サイトの場合には、単語辞書登録部３６は、検索対象となる単語（例えば、トウキョウ娘。）を検索キーとして送信するものとする。

また、単語辞書登録部３６は、係累属性解析部３６１を有している。係累属性解析部３６１は、Ｗｅｂサーバ６から得られた検索結果（Ｗｅｂページ）を、例えば図２５に示したような係累解析ルール１７６を用いて解析し、検索対象となった単語に係累する単語やその読みを抽出する。

図２５に示した係累解析ルール１７６は、バッカス記法（ＢＮＦ：Backus-Naur Form）と呼ばれ、構文を記述するための正規表現にしたがって書かれたものである。なお、実際のＷｅｂページは、ＨＴＭＬで記述されているため、ＨＴＭＬのタグも含んだ係累解析ルールを記述すべきであるが、この図では、説明の簡略化のためＨＴＭＬの記述に関連する部分を省略した係累解析ルールを示している。

バッカス記法では、「＜」と「＞」とで囲まれた文字列は構成要素と呼ばれている。また、「：：＝」は、その左辺にある構成要素が右辺にある文字列で構成されていることを示している。例えば、「＜英数字＞」は、「ａ」から「ｚ」の英字、「Ａ」から「Ｚ」の英字、「０」から「９」までの数字の何れかで構成されていることを示している。なお、「｜」は、「または（ＯＲ）」という意味を示すものである。

図２５において、構成要素「係累単語列」は、係累指示語（略称、愛称、通称）と、助詞（が、は、を、も、に、には）と、係累単語から構成されている。図２４−１の例を用いて具体的に説明すると、１行目の「トウキョウ娘。」は名詞であるが、これは検索語（トウキョウ娘。）それ自身である。この場合、図２５で示したルールの「＜検索語列＞：：＝＜検索語＞＜よみ＞｜＜検索語＞＜空白＞＜よみ＞｜＜検索語＞＜かっこはじめ＞＜よみ＞＜かっこおわり＞｜」という記述の「＜検索語＞＜よみ＞」に合致する。これから、「トウキョウ娘。」の＜よみ＞が、「とうきょうむすめ」であることがわかる。

また、図２４−１の２行目は、図２５で示したルールの「＜係累単語列＞：：＝＜係累指示語＞＜助詞＞｛係累単語｝＜句読点＞｜＜係累指示語＞＜助詞＞｛＜係累単語＞＜句読点＞｝｜＜係累指示語＞＜助詞＞｛係累単語｝＜助詞＞＜文字列＞＜句読点＞｜＜係累指示語＞＜助詞＞｛＜係累単語＞＜句読点＞｝＜助詞＞＜文字列＞＜句読点＞｜＜係累指示語＞＜助詞＞＜文字列＞｛係累単語｝＜助詞＞＜文字列＞＜句読点＞｜＜係累指示語＞＜助詞＞＜文字列＞｛＜係累単語＞＜句読点＞｝＜助詞＞＜文字列＞＜句読点＞｜」という記述の「＜係累指示語＞＜助詞＞＜文字列＞｛係累単語｝＜助詞＞＜文字列＞＜句読点＞」に合致する。

つまり、「＜係累指示語＞（通称）＋＜助詞＞（は）＋＜文字列＞（主に）＋（かっこはじめ）（「」＋＜係累単語＞（Ｔ娘。）＋＜よみ＞（＜かっこはじめ＞（（）＋＜よみ＞（てぃーむす）＋＜かっこおわり＞（））＋＜かっこおわり＞（」）＋＜かっこはじめ＞（「）＋＜係累単語＞（ＴＫＯ娘。）＋＜かっこおわり＞（」）＋＜かっこはじめ＞（「）＋＜係累単語＞（娘。）＋＜かっこおわり＞（」）＋＜助詞＞（が）＋＜文字列＞（広く使われている）＋＜句読点＞（。）」と解析される。なお「（」と「）」で囲んだ文字列が、図２４−１の２行目の各文字列を表している。

この解析結果から、「トウキョウ娘。」の係累単語として「Ｔ娘。」、「ＴＫＯ娘。」、「娘。」が抽出される。また、係累単語の読みとして、「Ｔ娘。」に対応する「てぃーむす」が抽出される。

また、係累属性解析部３６１は、係累解析ルール１７６を用いた解析により、Ｗｅｂページから抽出した係累単語やその読みを、単語辞書１７４に登録する。ここで、係累属性解析部３６１は、共通の単語を語源とする係累単語に、同一の係累情報を付与するものとする。なお、語源となる単語が不明な場合には、係累属性に「Ｄ」又は「Ｍ」を含めず、係累情報のみを付与する態様としてもよい。

また、係累属性解析部３６１が、係累単語の抽出先となったＷｅｂサーバ６のＵＲＬを、単語辞書１７４に併せて登録する態様としてもよい。図２６は、単語辞書１７４の他の態様を示した図であって、係累単語の抽出先となったＷｅｂサーバ６のＵＲＬを併せて登録した場合の単語辞書１７７の一例を示した図である。図２６に示したように、単語辞書１７７には各単語の見出し毎に、その単語の「抽出Ｗｅｂ」と「読み」と「係累属性」と「分類属性」と「存在属性」とが関連付けて登録されている。この「抽出Ｗｅｂ」の項目に、係累単語の抽出先となったＷｅｂサーバ６のＵＲＬが登録される。なお、該当するＵＲＬが存在しない場合には、該当なしを意味する「ＮＡ」が登録されるものとする。

また、本実施形態によれば、検索装置４自体がコンテンツ記憶部１７１に記憶したコンテンツに含まれる各単語間の係累関係を特定し、単語辞書１７４を更新することができるため、時流とともに呼称や名称が変化するような単語についても、その変化に追随することができる。

なお、本実施形態では、係累解析ルールとして図２５に示した各ルールを用いた例を説明したが、解析ルールの内容はこの例に限定されるものではない。例えば、電子番組表データ（ＥＰＧ）中のタグやＨＴＭＬのタグを用いるような記述も可能である。また。係累単語については、正式名称の文字数より少なくなる傾向があるため、「係累単語の文字数＜正式名称の文字数」のような文字数に関する制約を規定することも可能である。

また、読みに関しても、読みの文字数が、形態素解析により付記される読みの文字数を上回ることはないため、「抽出された読みの文字数＜形態素解析による読みの文字数」といった文字数に関する制約を規定することも可能である。

以上、発明の実施の形態について説明したが、本発明はこれに限定されるものではなく、本発明の主旨を逸脱しない範囲での種々の変更、置換、追加などが可能である。

なお、上記した実施形態の検索装置で実行されるプログラムは、ＲＯＭ１４や記憶部１７等に予め組み込まれて提供するものとするが、これに限らず、インストール可能な形式又は実行可能な形式のファイルでＣＤ−ＲＯＭ、フレキシブルディスク（ＦＤ）、ＣＤ−Ｒ、ＤＶＤ（Digital Versatile Disk）等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。また、このプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよく、インターネット等のネットワーク経由で提供又は配布するように構成してもよい。

検索装置のハードウェア構成を示した図である。図１に示した入力部の外観構成を示した図である。第１の実施形態に係る検索装置の機能的構成を示した図である。図３に示したコンテンツ情報記憶部に記憶された番組表の一例を示した図である。図３に示したコンテンツ素材記憶部に記憶された付属情報の一例を示した図である。図３に示した単語辞書の一例を示した図である。図３に示した音声認識辞書の一例を示した図である。第１の実施形態に係るコンテンツ検索・再生処理の手順を示したフローチャートである。図８に示した音声認識処理の手順を示したフローチャートである。図８に示した単語拡張処理の手順を示したフローチャートである。表示画面の一例を示した図である。表示画面の一例を示した図である。表示画面の一例を示した図である。表示画面の一例を示した図である。第２の実施形態に係る検索装置の機能的構成を示した図である。図１４に示した単語辞書の一例を示した図である。第２の実施形態に係るコンテンツ検索・再生処理の手順を示したフローチャートである。図１６に示した単語拡張処理の手順を示したフローチャートである。第３の実施形態に係る検索装置の機能的構成を示した図である。図１８に示した単語辞書マスタの一例を示した図である。図１８に示した単語辞書の一例を示した図である。更新後の単語辞書の一例を示した図である。第４の実施形態に係る検索装置の機能的構成を示した図である。図２２に示した接続先テーブルの一例を示した図である。図２２に示したＷｅｂサーバによる検索結果の一例を示した図である。図２２に示したＷｅｂサーバによる検索結果の一例を示した図である。図２２に示したＷｅｂサーバによる検索結果の一例を示した図である。図２２に示した係累解析ルールの一例を示した図である。図２２に示した単語辞書の他の態様を示した図である。

符号の説明

１検索装置
２検索装置
３検索装置
４検索装置
１１ＣＰＵ
１２入力部
１３表示部
１４ＲＯＭ
１５ＲＡＭ
１６通信部
１７記憶部
１７１コンテンツ記憶部
１７１１コンテンツ情報記憶部
１７１２コンテンツ素材記憶部
１７２単語辞書
１７３音声認識辞書
１７４単語辞書
１７５接続先テーブル
１７６係累解析ルール
１７７単語辞書
１８バス
２１受付部
２２音声認識部
２３音声認識辞書生成部
２４単語拡張部
２５検索単語選択部
２６コンテンツ検索部
２７コンテンツ選択部
２８再生制御部
２９コンテンツ受信部
３０日時計測部
３１単語辞書登録部
３２単語拡張部
３３コンテンツ検索部
３４単語辞書登録部
３５インターネット接続部
３６単語辞書登録部
３６１係累属性解析部
５単語辞書マスタサーバ
５１単語辞書マスタ
６Ｗｅｂサーバ

Claims

コンテンツを記憶する複数の第１記憶手段と、
複数の登録単語と、当該登録単語が前記複数の第１記憶手段の何れに存在するかを示す存在属性とを関連付けて登録するとともに、正式名称とその別称とを表す登録単語間にその関係性を示す係累属性を関連付けて登録した単語辞書を記憶する第２記憶手段と、
前記単語辞書に登録された登録単語に関する関連情報を、外部の情報資源から取得する外部通信手段と、
前記関連情報から前記単語辞書内の登録単語と係累関係にある単語を抽出する抽出手段と、
前記抽出手段が抽出した単語に前記登録単語との係累属性を関連付け、新たな登録単語として前記単語辞書に登録する登録手段と、
音声信号の入力を受け付ける音声入力手段と、
前記音声信号に対応する１又は複数の文字列をキーワードとして認識する音声認識手段と、
前記単語辞書から、前記キーワードに対応する登録単語と当該登録単語に係累する登録単語とを検索候補単語として検索する検索候補拡張手段と、
前記検索候補単語に含まれた登録単語のうち、何れかの単語を検索単語とする選択指示を受け付ける検索単語選択手段と、
前記単語辞書に基づいて、前記検索単語に対応する登録単語と、当該検索単語に係累する登録単語とを拡張検索単語に設定する検索単語拡張手段と、
前記拡張検索単語に含まれた登録単語のうち、何れかの登録単語に関係するコンテンツを、当該登録単語に関連付けられた存在属性が示す前記第１記憶手段から検索する検索手段と、
を備えたことを特徴とする検索装置。
前記単語拡張手段は、前記キーワードに一致する登録単語及び当該登録単語に係累する登録単語のうち、正式名称を表す登録単語を前記検索候補単語とすることを特徴とする請求項１に記載の検索装置。
前記登録手段は、前記コンテンツに含まれる各単語を登録単語とし、当該登録単語の前記存在属性と関連付けて前記単語辞書に登録することを特徴とする請求項１又は２に記載の検索装置。
各単語が表す対象の分野と、当該各分野に応じた前記情報資源の存在位置と、を関連付けた接続先テーブルを記憶する第３記憶手段を更に備え、
前記外部通信手段は、前記接続先テーブルに基づいて、前記登録単語が表す対象の分野に対応する前記情報資源の存在位置から、前記関連情報を取得することを特徴とする請求項１に記載の検索装置。
前記第１記憶手段は、コンテンツ素材及び／又はコンテンツ素材に関する情報を記したコンテンツ情報を前記コンテンツとして記憶し、
前記検索手段は、前記拡張検索単語に含まれた単語のうち、何れかの単語を含んだコンテンツを前記第１記憶手段から検索することを特徴とする請求項１に記載の検索装置。
前記抽出手段は、前記関連情報から前記単語辞書内の登録単語と係累関係にある単語と、当該単語の読みとを抽出し、
前記登録手段は、前記抽出手段が抽出した単語及び当該単語の読みに前記登録単語との係累属性を関連付け、新たな登録単語として前記単語辞書に登録することを特徴とする請求項１に記載の検索装置。
コンテンツの検索を行う検索装置で実行される検索方法であって、
前記検索装置は、音声入力手段と、複数の登録単語と当該登録単語が含まれるコンテンツの格納先を示す存在属性とを関連付けて登録するとともに、正式名称とその別称とを表す登録単語間にその関係性を示す係累属性を関連付けて登録した単語辞書を記憶する記憶手段と、を備え、
外部通信手段が、前記単語辞書に登録された登録単語に関する関連情報を、外部の情報資源から取得するステップと、
抽出手段が、前記関連情報から前記単語辞書内の登録単語と係累関係にある単語を抽出するステップと、
登録手段が、前記抽出された単語に前記登録単語との係累属性を関連付け、新たな登録単語として前記単語辞書に登録するステップと、
音声受付手段が、前記音声入力手段を介して入力された音声信号を受け付けるステップと、
音声認識手段が、前記音声信号に対応する１又は複数の文字列をキーワードとして認識するステップと、
検索候補拡張手段が、前記単語辞書から、前記キーワードに対応する登録単語と当該登録単語に係累する登録単語とを検索候補単語として検索するステップと、
検索単語選択手段が、前記検索候補単語に含まれた登録単語のうち、何れかの単語を検索単語とする選択指示を受け付けるステップと、
検索単語拡張手段が、前記単語辞書に基づいて、前記検索単語に対応する登録単語と、当該検索単語に係累する登録単語とを拡張検索単語に設定するステップと、
検索手段が、前記拡張検索単語に含まれた登録単語のうち、何れかの登録単語に関係するコンテンツを、当該登録単語に関連付けられた存在属性が示す格納先から検索するステップと、
を含むことを特徴とする検索方法。
音声入力手段を備えたコンピュータを、
複数の登録単語と、当該登録単語が含まれるコンテンツの格納先を示す存在属性とを関連付けて登録するとともに、正式名称とその別称とを表す登録単語間にその関係性を示す係累属性を関連付けて登録した単語辞書に登録された登録単語に関する関連情報を、外部の情報資源から取得する外部通信手段と、
前記関連情報から前記単語辞書内の登録単語と係累関係にある単語を抽出する抽出手段と、
前記抽出手段が抽出した単語に前記登録単語との係累属性を関連付け、新たな登録単語として前記単語辞書に登録する登録手段と、
前記音声入力手段を介して音声信号を受け付ける受付手段と、
前記音声信号に対応する１又は複数の文字列をキーワードとして認識する音声認識手段と、
前記単語辞書から、前記キーワードに対応する登録単語と当該登録単語に係累する登録単語とを検索候補単語として検索する検索候補拡張手段と、
前記検索候補単語に含まれた登録単語のうち、何れかの単語を検索単語とする選択指示を受け付ける検索単語選択手段と、
前記単語辞書に基づいて、前記検索単語に対応する登録単語と、当該検索単語に係累する登録単語とを拡張検索単語に設定する検索単語拡張手段と、
前記拡張検索単語に含まれた登録単語のうち、何れかの登録単語に関係するコンテンツを、当該登録単語に関連付けられた存在属性が示す格納先から検索する検索手段と、
して機能させることを特徴とする検索プログラム。