WO2006093003A1

WO2006093003A1 - 辞書データ生成装置及び電子機器

Info

Publication number: WO2006093003A1
Application number: PCT/JP2006/303192
Authority: WO
Inventors: Yoshihiro Kawazoe; Takehiko Shioda
Original assignee: Pioneer Corporation
Priority date: 2005-02-28
Filing date: 2006-02-22
Publication date: 2006-09-08
Also published as: US20080126092A1; JP4459267B2; JPWO2006093003A1

Abstract

　音声認識用の辞書データのデータ量を削減しつつ、この辞書データを利用した場合においても、確実な音声認識を実現する。　情報記録再生装置ＲＰは、ＥＰＧデータ中から各番組名を示すテキストデータを取得し、当該取得された各テキストデータから番組表の番組表欄中に表示可能な文字数「Ｎ」の範囲内にてキーワードを設定すると共に、この設定された各キーワードに対応した音声の特徴量を示す特徴量パターンを生成して、当該特徴量パターンを番組名を特定するためのテキストデータと対応付けることにより辞書データを生成する。また、番組表の表示に際しても、キーワード部分については強調表示を行うことにより、ユーザにキーワードの内容を提示するようになっている。

Description

辞書データ生成装置及び電子機器

技術分野

[0001] 本発明は、ユーザにより発話された音声力もユーザの入力コマンドを認識する技術分野に属する。

背景技術

[0002] 従来から、 DVDレコーダやナビゲーシヨン装置といった電子機器の中には、所謂、音声認識装置を搭載し、ユーザが音声を発話することによって各種コマンド (すなわち、電子機器に対する実行命令)の入力を可能とする機能が設けられたものが存在している。この種の音声認識装置においては、各コマンドを示すキーワードに対応した音声の特徴量パターン (例えば、隠れマルコフモデルによって示される特徴量パターン）をデータベース化しておき（以下、このデータを「辞書データ」という。）、この辞書データ内の特徴量パターンと、ユーザの発話音声に対応した特徴量とのマツチングを行って、ユーザの発話音声に対応したコマンドを特定するようになっている。また、近年では、地上デジタル放送や BSデジタル放送等の各種放送フォーマットにおいて空き帯域を用いて放送される EPG (Electric Program Guide)データ中に含まれる番組名等のテキストデータを用いて、上述した辞書データを生成し、この生成された辞書データを用いてユーザの選択した番組を特定する機能が設けられたテレビ受信機も提案されるに至って！/ヽる (特許文献 1参照)。

特許文献 1：特開 2001— 309256号公報

発明の開示

発明が解決しょうとする課題

[0003] ところで、上記特許文献 1に記載の発明にお、ては、 1つの番組名に対して複数のキーワードを設定し、各キーワード毎に音声の特徴量パターンを生成する方法が採用されているため、辞書データの生成に要する処理量が大幅に増加するのみならず、辞書データのデータ量が非常に大きくなつてしま、実用性に乏 U、ものとなって!/、た。一方、辞書データのデータ量を削減する観点力は各コマンドに対して簡易なキ一ワードを割り当て、当該キーワードをユーザに発話させる方法も考えられるが、この方法では、如何なるキーワードを発話した場合に如何なるコマンド入力がなされるのかということを、ユーザが把握できなくなりコマンド入力が不可能となる可能性がある。

[0004] 本願は以上説明した事情に鑑みてなされたものであり、その課題の一例としては、音声認識用の辞書データのデータ量を削減しつつ、この辞書データを利用した場合においても、確実な音声認識を実現する辞書データ生成装置、辞書データ生成方法、及び、電子機器とその制御方法、辞書データ生成プログラム、処理プログラム並びにこれらプログラムを記録した情報記録媒体を提供することを目的とする。

課題を解決するための手段

[0005] 上述した課題を解決するため本願の一つの観点にぉ、て請求項 1に記載の辞書データ生成装置は、ユーザにより発話された音声に基づいてユーザの入力コマンドを認識する音声認識装置において用いられる音声認識用の辞書データを生成するための辞書データ生成装置であって、前記コマンドに対応したテキストデータを取得する取得手段と、前記取得されたテキストデータ力一部の文字列を抽出し、当該文字列をキーワードとして設定する設定手段と、前記設定されたキーワードに対応した音声の特徴量を示す特徴量データを生成すると共に、当該コマンドに対応した処理内容を特定するための内容データを当該特徴量データと対応付けることにより前記辞書データを生成する生成手段と、前記キーワードを表示するための表示装置おいて表示可能な前記キーワードの文字数を特定する特定手段と、を備え、前記設定手段は、前記特定手段によって特定された文字数の範囲内にて前記キーワードを設定することを特徴とする。

[0006] また、本願の他の観点において、請求項 6に記載の電子機器は、ユーザにより発話された音声に基づいてユーザの入力コマンドを認識する音声認識装置を備えた電子機器であって、前記コマンドに対応した文字列の一部に設定されたキーワードに対応した音声の特徴量を示す特徴量データと、前記コマンドに対応した処理内容を特定するための内容データとが対応付けられた辞書データを記録した記録手段と、ュ一ザの発話音声を入力するための入力手段と、前記記録された辞書データに基づいて前記発話音声に対応する入力コマンドを特定する音声認識手段と、前記内容データに基づき、前記特定された入力コマンドに対応する処理を実行する実行手段と、前記辞書データに基づいて、ユーザに発話させるべきキーワードを表示するための表示データを生成し、表示装置に供給する表示制御手段とを具備することを特徴とする。

[0007] また更に、本願の他の観点において請求項 12に記載の辞書データ生成方法は、ユーザにより発話された音声に基づいてユーザの入力コマンドを認識する音声認識装置において用いられる音声認識用の辞書データを生成するための辞書データ生成方法であって、前記コマンドに対応したテキストデータを取得する取得ステップと、前記音声認識用のキーワードを表示するための表示装置おいて表示可能な前記キ一ワードの文字数を特定する特定ステップと、前記取得されたテキストデータの中から前記特定された文字数の範囲内にて一部の文字列を抽出し、当該文字列を前記キーワードとして設定する設定ステップと、前記設定されたキーワードに対応した音声の特徴量を示す特徴量データを生成すると共に、当該コマンドに対応した処理内容を特定するための内容データを前記特徴量データと対応付けることにより前記辞書データを生成する生成ステップと、を具備することを特徴とする。

[0008] 更に、本願の他の観点において請求項 13に記載の電子機器の制御方法は、コマンドに対応した文字列の一部に設定されたキーワードに対応した音声の特徴量を示す特徴量データと、前記コマンドに対応した処理内容を特定するための内容データとが対応付けられた辞書データを用いて、ユーザの発話音声に対応する入力コマンドを認識する音声認識装置を備えた電子機器の制御方法であって、前記辞書データに基づいて、ユーザに発話させるべきキーワードを表示するための表示データを生成し、表示装置に供給する表示ステップと、前記表示装置に表示された画像に従つて、ユーザの発話音声が入力された場合に、前記辞書データに基づいて当該発話音声に対応する入力コマンドを特定する音声認識ステップと、前記内容データに基づき、前記特定された入力コマンドに対応する処理を実行する実行ステップとを具備することを特徴とする。

[0009] 更にまた、本願の他の観点において請求項 14に記載の辞書データ生成プログラムは、ユーザにより発話された音声に基づいてユーザの入力コマンドを認識する音声認識装置において用いられる音声認識用の辞書データをコンピュータにより生成するための辞書データ生成プログラムであって、前記コンピュータを、前記コマンドに対応したテキストデータを取得する取得手段、前記音声認識用のキーワードを表示するための表示装置おいて表示可能な前記キーワードの文字数を特定する特定手段、前記取得された各テキストデータの中から前記特定された文字数の範囲内にて一部の文字列を抽出し、当該文字列を前記キーワードとして設定する設定手段、前記設定されたキーワードに対応した音声の特徴量を示す特徴量データを生成すると共に、当該コマンドに対応した処理内容を特定するための内容データを前記特徴量データと対応付けることにより前記辞書データを生成する生成手段、として機能させることを特徴とする。

[0010] また、本願の他の観点において請求項 15に記載の処理プログラムは、コマンドに対応した文字列の一部に設定されたキーワードに対応した音声の特徴量を示す特徴量データと、前記コマンドに対応した処理内容を特定するための内容データとが対応付けられた辞書データを記録した記録手段と、前記辞書データを用いて、ユーザの発話音声に対応する入力コマンドを認識する音声認識装置と、を備えたコンビュータにおいて処理を実行するための処理プログラムであって、前記コンピュータを、前記辞書データに基づいて、ユーザに発話させるべきキーワードを表示するための表示データを生成し、表示装置に供給する表示手段、前記表示装置に表示された画像に従って、ユーザの発話音声が入力された場合に、前記辞書データに基づいて当該発話音声に対応する入力コマンドを特定する音声認識手段、前記内容データに基づき、前記特定された入力コマンドに対応する処理を実行する実行手段、として機能させることを特徴とする。

[0011] また更に、本願の他の観点において請求項 16に記載のコンピュータに読み取り可能な情報記録媒体は、請求項 14に記載の辞書データ生成プログラムが記録されたことを特徴とする。

[0012] 更に、本願の他の観点において請求項 17に記載のコンピュータに読み取り可能な情報記録媒体は、請求項 15に記載の処理プログラムが記録されたことを特徴とする図面の簡単な説明

[0013] [図 1]実施形態における情報記録再生装置 RPの構成を示すブロック図である。

[図 2]同実施形態においてモニタ MNに表示される番組表の表示欄と、当該表示欄に表示可能な文字数との関係を示す概念図である。

[図 3]同実施形態においてシステム制御部 17が番組表を表示する際に実行する処理を示すフローチャートである。

[図 4]変形例 2においてシステム制御部 17が番組表を表示する際に実行する処理を示すフローチャートである。

符号の説明

[0014] RP- · ·情報記録再生装置

11 · •TV受信部

12· •信号処理部

13 · •EPGデータ処理部

14· •DVDドライブ

is'ハードディスク

le- ，復号処理部

17· •システム制御部

18 · •音声認識部

19 · '操作部

20· •記録制御部

21 · •再生制御部

22· •ROM/RAM

発明を実施するための最良の形態

「11実施形

[1. 11実施形態の構成

以下、本実施形態にかかる情報記録再生装置 RPの構成を示すブロック図である図 1を参照しつつ本願の実施の形態について説明する。なお、以下に説明する実施の形態は、データの記録および読み出しが行なわれるハードディスクドライブ (以下、「HDD」という。）及び DVDドライブを備えた、所謂、ハードディスク ZDVDレコーダに対して本願を適用した場合の実施の形態である。また、以下において、「放送番組」とは放送波を介して各放送局カゝら提供されるコンテンツを示すものとする。

[0016] まず、同図に示すように本実施形態に力かる情報記録再生装置 RPは、 TV受信部 11と、信号処理部 12と、 EPGデータ処理部 13と、 DVDドライブ 14と、 HDD15と、復号処理部 16と、システム制御部 17と、音声認識部 18と、操作部 19と、記録制御部 20と、再生制御部 21と、 ROMZRAM22と、これら各要素を相互に接続するバス 2 3を有し、大別して以下の機能を実現するようになって!/、る。

(a)地上アナログ放送や地上デジタル放送等に対応した放送波を TV受信部 11にて受信して放送番組に対応したコンテンツデータを DVD及びノヽードディスク 151に記録する一方、 DVD及びノヽードディスク 151に記録されたコンテンツデータを再生する記録再生機能。

(b) TV受信部 11により受信された放送波に含まれる EPGデータを抽出して当該 EP Gデータに基づ、てモニタ MNに番組表を表示させる番組表表示機能。

[0017] ここで、本実施形態に特徴的な事項として、この情報記録再生装置 RPは上記番組表の表示に先立ち、表示対象となる EPGデータから番組名を示すテキストデータを抽出して、当該番組名をキーワード (音声認識用）とする音声認識用の辞書データ（具体的には、各キーワードと、当該キーワードに対応した特徴量パターンが対応づけられたデータ）を生成すると共に、この辞書データを用いて音声認識を行うことにより、ユーザが発話した音声に対応する番組名を特定して、放送番組の録画予約のための処理を実行するようになっている（「特許請求の範囲」における「コマンド」は、例えば、力かる処理の実行命令に対応している。 ) o

[0018] なお、上記特徴量パターンの具体的な内容に関しては任意であるが、説明の具体化のため本実施形態において「特徴量パターン」と呼ぶときは対象となるキーワードに対応した HMM (隠れマルコフモデルにより定義される音声の遷移状態を表現した統計的信号モデル）により示される音声の特徴量のパターンを示すデータを意味するものとする。また、辞書データの具体的な生成方法についても任意であるが、本実施形態においては番組名に対応したテキストデータに対して形態素解析 (すなわち、自然言語で書かれた文を品詞 (読み仮名を含む。以下、同様。）等の形態素の列に分割する処理)を行い、当該番組名を複数の品詞に分割すると共に当該番組名に対応した特徴量パターンを生成して辞書データを生成するものとし、他の方法を採用した例については変形例の項にて説明することとする。

[0019] ここで、力かる機能の実現に際して留意すべき点が 2つある。

[0020] まず 1つには、 EPGデータに含まれる番組名の中には形態素解析が不可能なものが存在する可能性があり、かかる事態が発生した場合、当該番組名に対応する特徴量パターンが生成できず、当該番組名の音声認識が不可能となってしまうと言うことである。このような事態が発生すると、 1つの番組表中に音声認識が可能な番組名と不可能な番組名が混在することとなり、何らの手当も行わな、場合にはユーザの利便性が低下する結果を招来する。従って、ユーザの利便性向上を図る観点からは番組表の表示に際して音声認識が可能な番組名と不可能な番組名とを区別して表示することが望まし!/ヽこととなる。

[0021] もう 1点は、番組表を表示しょうとする場合、各時間帯に対応した番組表示欄のスぺースに限りがあるということである。従って、番組名が長い場合には当該番組名の全てを表示欄中に表示できなくなる可能性が生じてしまう（例えば、図 2参照)。かかる場合に、番組名の全文をキーワードとして特徴量パターンを生成してしまうと、ユーザは番組名全文 (すなわち、音声認識用のキーワード)を番組表力拾い出せず、何と発話すれば良いのか分力もないという事態を招来しかねない。また、 1つの番組名に対して複数のキーワードを設定しておけば、ユーザが一部のみ発声した場合でも番組名を特定することは可能となるが、この方法では、辞書データのデータ量が膨大となってしまう。

[0022] 以上の観点から、本実施形態においては、（a)音声認識に用いることが可能なキーワード部分を番組表中にぉヽて強調表示する一方、 (b)番組表の番組表示欄に番組名を全文表示できな、番組名に関しては表示可能な文字数の範囲内にぉ、て音声認識用のキーワードを作成し、当該キーワード部分のみを強調表示する方法を採用し、もって、ユーザがキーワードを正しく発話する際の利便性を確保することとした [0023] 例えば、図 2に示す例において、表示欄 S1〜S3に 5文字までの番組名表示が可能である場合を想定する。この例の場合、例えば、「參▲の町 (4文字)」なる番組名は表示欄中に全文表示が可能であるため、情報記録再生装置 RPは、この番組名の全文をキーワードとして用いて、特徴量パターンを生成し、当該番組名全体を番組表中において強調表示する。一方、「參參家の晩餐（6文字)」のように番組名の全文が表示欄中に表示しきれない場合、情報記録再生装置 RPは、「參參家の晩餐」なる番組名を構成する品詞 (すなわち、形態要素）中、最後の「晩餐」なる品詞を削除した、「參參家の」なる文字列をキーワードに設定し、当該キーワードに対応する特徴量パターンを生成すると共に、番組表の表示に際しても、「參參家の」の部分のみ強調表示する。更に、「ん S—o⁷¹力」のように品詞として成立していない場合や、番組名に未知の固有名詞が含まれる場合、或いは、番組名が文法に従っていない単語列の場合、形態素解析ができず特徴量パターンを生成することが不可能となるため、情報記録再生装置 RPは、強調表示を一切行うことなく当該番組名を表示して音声認識が不可能であることをユーザに提示する。

[0024] なお、番糸且表にぉ、てキーワード部分を強調表示する方法にっ、ては任意であり、例えば、（表示方法 1)当該キーワード部分のみ文字の色を変えるようにしても良ぐ (表示方法 2)当該部分の文字フォントを変えるようにしても良ぐ更には (表示方法 3) 文字を太線にて表示するようにしても良ぐ（表示方法 4)文字サイズを変えても良い。また、（表示方法 5)当該キーワード部分に下線を引くようにしても良ぐ（表示方法 6) 枠で囲ったり、或いは、（表示方法 7)点滅表示させても良ぐ（表示方法 8)反転表示するようにしても良い。

[0025] 以下、かかる機能を実現するための本実施形態に力かる情報記録再生装置 RPの具体的な構成について説明することとする。

[0026] まず、 TV受信部 11は、地上アナログ放送等のアナログ放送及び地上デジタル放送、 C¾ (Communication Satellite)放、 BS (Broadcasting Satellite)アンタノレ奴等のデジタル放送のチューナであり、アンテナ ATを介して放送波を受信する。そして、 TV受信部 11は、例えば、受信対象となる放送波がアナログ方式によるものの場合、当該放送波を TV用の映像信号および音声信号 (以下、「TV信号」という。）に復調して信号処理部 12及び EPGデータ処理部 13に供給する。これに対して受信対象となる放送波がデジタル方式によるものの場合、 TV受信部 11は当該受信した放送波に含まれるトランスポートストリームを抽出して信号処理部 12及び EPGデータ処理部 1 3に供給する。

[0027] 信号処理部 12は、記録制御部 20による制御の下、 TV受信部 11から供給される信号に対して所定の信号処理を施す。例えば、 TV受信部 11からアナログ放送に対応した TV信号が供給された場合、信号処理部 12は、当該 TV信号に対して所定の信号処理及び AZD変換を施して、所定形式のデジタルデータ（すなわち、コンテンツデータ）に変換する。この際、信号処理部 12は、当該デジタルデータを、例えば、 M PEG (Moving Picture Coding Experts Group)形式に圧縮してプログラムストリームを生成し、この生成されたプログラムストリームを DVDドライブ 14、 HDD15、或いは、復号処理部 16に供給する。これに対して、 TV受信部 11からデジタル放送に対応したトランスポートストリームが供給された場合、信号処理部 12は、当該ストリームに含まれるコンテンツデータをプログラムストリームに変換した後、 DVDドライブ 14、 HDD 15、或いは、復号処理部 16に供給する。

[0028] EPGデータ処理部 13は、システム制御部 17による制御の下、 TV受信部 11から供給される信号に含まれる EPGデータを抽出し、この抽出した EPGデータを HDD15 に供給する。例えば、アナログ放送に対応した TV信号が供給された場合、 EPGデータ処理部 13は当該供給された TV信号の VBIに含まれる EPGデータを抽出して H DD15に供給する。また、デジタル放送に対応したトランスポートストリームが供給された場合、 EPGデータ処理部 13は、当該ストリーム中に含まれている EPGデータを抽出して、 HDD15に供給する。

[0029] DVDドライブ 14は、装着された DVDに対するデータの記録及び再生を行ヽ、 HD D15は、ハードディスク 151に対するデータの記録及び再生を行う。この HDD15のハードディスク 151内には、放送番組に対応したコンテンツデータを記録するためのコンテンツデータ記録領域 151aが設けられると共に、 EPGデータ処理部 13から供給される EPGデータを記録するための EPGデータ記録領域 15 lbや情報記録再生装置 RPにおいて生成された辞書データを記録するための辞書データ記録領域 151 cが設けられている。

[0030] 次いで、復号処理部 16は、例えば、信号処理部 12から供給され、 DVDおよびハードディスク 151から読み出されたプログラムストリーム形式のコンテンツデータを音声データと映像データに分離すると共に、これらの各データをデコードする。そして、復号処理部 16は、このデコードされたコンテンツデータを NTSC形式の信号に変換し、当該変換された映像信号及び音声信号を映像信号出力端子 T1および音声信号出力端子 T2を介してモニタ MNに出力する。なお、モニタ MNにデコーダ等が搭載されている場合には信号処理部 15においてデコード等を行う必要はなぐコンテンッデータをそのままモニタに出力すれば良い。

[0031] システム制御部 17は、主として CPU (Central Processing Unit)により構成されると共に、キー入力ポート等の各種入出力ポートを含み、情報記録再生装置 RPの全体的な機能を統括的に制御する。かかる制御に際して、システム制御部 17は、 RO MZRAM22に記録されている制御情報や制御プログラムを利用すると共に当該 R OMZRAM22をワークエリアとして利用する。

[0032] 例えば、このシステム制御部 17は操作部 19に対する入力操作に応じて、記録制御部 20及び再生制御部 21を制御し、 DVD或、はハードディスク 151に対するデータの記録及び再生を行わせる。

[0033] また、例えば、システム制御部 17は所定のタイミングにて EPGデータ処理部 13を制御して、放送波に含まれている EPGデータを抽出させ、当該抽出された EPGデータを用いて EPGデータ記録領域 151bに記録された EPGデータを更新させる。なお、 EPGデータの更新のタイミングは任意であり、例えば、毎日、所定の時刻に EPGデータが放送される環境下においては、当該時刻を ROMZRAM21に記録しておき、当該時刻に EPGデータを更新するようにしても良、。

[0034] 更に、このシステム制御部 17は、 EPGデータ記録領域 15 lbに記録された EPGデータに基づく番組表表示に先立って、上述した音声認識用の辞書データを生成し、当該生成した辞書データを辞書データ記録領域 151cに記録すると共に、 EPGデータに基づく番組表表示に際しては、当該番組表中においてキーワード部分を強調表示させる。力かる辞書データの生成機能を実現するため、本実施形態においてシステム制御部 17には、形態素解析用データベース（以下、「データベース」を「DB」という。） 171と、サブワード特徴量 DB172とが設けられている。なお、両 DB171及び 172は、物理的には、ハードディスク 151内に所定の記録領域を設けることにより実現するようにすれば良い。

[0035] ここで、この形態素解析 DB171は、 EPGデータ力も抽出されたテキストデータに対して形態素解析を行うためのデータが格納された DBであり、例えば、品詞分解及び各品詞に対して振り仮名を割り当てるための国語辞書に対応したデータ等が格納されている。これに対して、サブワード特徴量 DB172は、例えば、各音節や各音素、或いは、複数の音節及び音素の組み合わせにより表現される音声の単位 (以下、「サブワード」という。）毎に、当該サブワードに対応する HMMの特徴量パターンを格納した DBとなっている。

[0036] 本実施形態にぉ、て辞書データを生成する場合、システム制御部 17は、形態素解析 DB171に格納されたデータを用いて、各番組名に対応したテキストデータに対する形態素解析を実行すると共に、当該処理により得られた番組名を構成する各サブワードに対応した特徴量パターンをサブワード特徴量 DB172から読み出す。そして、当該読み出した特徴量パターンを組み合わせることにより、番組名（或いは、その一部）に対応した特徴量パターンを生成することとなる。なお、システム制御部 17により生成されてハードディスク 151内に保存された辞書データを消去するタイミングにつ Vヽては任意である力この辞書データは EPGデータの更新等に伴って利用できなくなるものであることから、本実施形態においては番組表の表示時に毎回辞書データを生成すると共に、番組表の表示完了時にハードディスク 151に記録されて、る辞書データを削除するものとして説明を行う。

[0037] 次いで、音声認識部 18には、ユーザが発話した音声を集音するためのマイクロフォン MCが設けられて!/、る。このマイクロフォン MCにユーザの発話音声が入力されると、音声認識部 18は、予め定められた時間間隔毎に当該音声の特徴量パターンを抽出し、当該パターンと辞書データ内の特徴量パターンとのマッチングの割合 (すなわち、類似度)を算出する。そして、音声認識部 18は、入力音声の全てにおける類似度を積算し、この積算された類似度が最も高いキーワード (すなわち、番組名、或いは、その一部）を認識結果としてシステム制御部 17に出力することとなる。この結果、システム制御部 17においては、当該番組名に基づき EPGデータが検索され、録画対象となる放送番組が特定されることとなる。

[0038] なお、音声認識部 18にお、て採用する具体的な音声認識手法にっ、ては任意である。例えば、キーワードスポッティング (すなわち、音声認識用のキーワードに対して不要語を付けた場合でもキーワード部分を抽出して、音声認識を行う手法)ゃ大語彙連続音声認識 (デイクテーシヨン）といった、従来から用いられている手法を採用すれば、ユーザが余計な言葉 (以下、「不要語」という。）を付けてキーワードを発話した場合 (例えば、番組名の一部にっ、てキーワードが設定されて、るにもかかわらず、ユーザが番組名を当初カゝら知っていて、番組名の全文を発話した場合等）においても、確実にユーザの発話音声に含まれるキーワードを抽出して音声認識を実現することが可能となる。

[0039] 操作部 19は、数字キー等の各種キーを有するリモートコントロール装置及び当該リモートコントロール装置から送信された信号を受光する受光部等を有し、ユーザの人力操作に対応した制御信号をバス 23を介してシステム制御部 17に出力する。記録制御部 20は、システム制御部 17による制御の下、 DVD或いはハードディスク 151に対するコンテンツデータの記録を制御し、再生制御部 21は、システム制御部 17による制御の下、 DVD或いはハードディスク 151に記録されたコンテンツデータの再生を制御する。

[0040] [1. 2Ί実施形態の動作

次いで、図 3を参照しつつ本実施形態に力かる情報記録再生装置 RPの動作について説明する。なお、 DVD或いはハードディスク 151に対するコンテンツデータの記録動作及び再生動作については従来のハードディスク ZDVDレコーダと異なるところが無いため、以下においては情報記録再生装置 RPにおいて番組表表示時に実行される処理について説明することとする。また、以下の説明においては、既にハードディスク 151の EPGデータ記録領域に EPGデータが記録されているものとして説明を行う。

[0041] まず、情報記録再生装置 RPの電源がオンの状態において、ユーザが操作部 18の図示せぬリモコン装置に対して番組表の表示を行う旨の入力操作を行う。すると、情報記録再生装置 RPにお、ては、この入力操作をトリガとしてシステム制御部 17が図 3に示す処理を開始する。

[0042] この処理において、まず、システム制御部 17は、 HDD15に対して制御信号を出力して、表示対象となる番組表に対応した EPGデータを EPGデータ記録部 15 lbから読み出させると共に (ステップ S1)、この読み出された EPGデータをサーチして当該 EPGデータ中に含まれる番組名に対応したテキストデータを抽出する (ステップ S2) 。次いで、システム制御部 17は、この抽出したテキストデータ中にひらがな及びカタカナ以外の文字が含まれて、る力否かを判定し (ステップ S3)、この判定にぉ、て「n o」と判定すると、当該番組名の全文字数が番組表の表示欄中に表示可能な文字数「N」を越えているか否かを判定する状態となる (ステップ S4)。なお、この際、表示可能な文字数「N」を特定する方法は任意であり、例えば、表示可能文字数を示すデータを ROMZRAM22に予め記録しておき、当該データに基づいて「N」を特定する構成を採用しても良い。

[0043] そして、この判定において、「no」と判定した場合、すなわち、当該テキストデータに対応した文字列の全てを番組表の表示欄に表示可能な場合、システム制御部 17は、当該テキストデータに含まれている各仮名文字に対応した特徴量パターンをサブヮード特徴量 DB172から読み出して、当該文字列（すなわち、キーワードとなる番組名 )に対応した特徴量パターンを生成し、当該特徴量パターンとキーワード部分に対応したテキストデータ (すなわち、番組名の全部、或いは、その一部に対応したテキストデータ）を対応付けて ROMZRAM22に記憶する（ステップ S5)。なお、この特徴量ノターンと対応付けられたテキストデータは、音声認識時に入力コマンド (本実施形態においては奥が予約）を特定するために用いられ、例えば、「特許請求の範囲」における「内容データ」に対応することとなる。

[0044] かかるステップ S5の終了後、システム制御部 17は当該番組表中の全番組名に対応した特徴量パターンの生成が完了した力否かを判定する状態となり (ステップ S6) 、この判定において「yes」を判定すると処理をステップ S 11に移行させる一方、「no」と判定すると処理をステップ S2にリターンさせる。 [0045] 一方、（1)ステップ S3において「yes」と判定した場合、すなわち、番組名に対応した文字列中にひらがな及びカタカナ以外の文字が含まれて!/、る場合、 (2)ステップ S 4において「yes」と判定した場合、には何れの場合においても、システム制御部 17は、処理をステップ S7に移行させ、 EPGデータカゝら抽出された番組名に対応したテキストデータに対して、形態素解析を行う (ステップ S7)。この際、システム制御部 17は、形態素解析 DB171に格納されているデータに基づいて、当該テキストデータに対応した文字列を品詞単位に分解すると共に、この分解された各品詞に対応した読み仮名を決定する処理を実行する。

[0046] ここで、上述のように番組名に対応した文字列が品詞として成立して!/ヽな、場合 ( 例えば、上記図 2「ん $ か」）や番組名が文法に従っていないような場合等には、当該テキストデータに対応する文字列の形態素解析を行うことが不可能となってくる。そこで、システム制御部 17は、ステップ S8において、ステップ S7における形態素解祈が成功した力否かを判定し、失敗したものと判定した場合には（「no」）、ステップ S 9、 S10及びステップ S5の処理を実行することなぐ処理をステップ S6に進め、辞書データの生成が完了した力否かを判定する状態となる。

[0047] これに対して、ステップ S8にお、て形態素解析が成功したものと判定した場合、システム制御部 17は、当該番組名が表示可能文字数「N」を越えてヽるカゝ否かを判定する状態となる (ステップ S9)。例えば、上記図 2に示す例の場合、番組表の表示欄には 5文字表示可能であるため、「參▲の町」なる番糸且名は全文字の表示が可能となつている。かかる場合に、システム制御部 17は、ステップ S9において「yes」と判定し、サブワード特徴量 DB 172に格納されて、るデータに基づ、て当該番組名の読み仮名に対応した特徴量パターンを生成し、当該特徴量パターンとキーワード部分に対応したテキストデータを対応付けて ROMZRAM22に格納して (ステップ S5)、ステツプ S6の処理を実行する。

[0048] 一方、上記図 2に示す例における「參參家の晩餐」なる番組名のように表示欄中に、全文字を表示しきれない場合、システム制御部 17は、ステップ S9において、当該番組名の文字数が表示可能文字数「N」を越えているものと判定し（「yes」）、当該番組名中の最後の品詞 (すなわち、「晩餐」）に対応した仮名部分を仮名文字列力ゝら削除して (ステップ S 10)、再度、ステップ S9の処理を実行する。そして、システム制御部 17は、このステップ S9及び S10の処理を繰り返すことにより、順次、番組名を構成する品詞を削除していき、品詞削除後の番組名が表示可能文字数「N」以下となった時点でステップ S9における判定が「yes」となって、処理がステップ S5、 S6と移行することとなる。

[0049] その後、システム制御部 17は、同様の処理を繰り返し、読み出された EPGデータに含まれる全番組名に対応したテキストデータについてステップ S2〜S10の処理を繰り返し、全番組名に対応したテキストデータ及び特徴量パターンが ROMZRAM 22に格納された状態となると、ステップ S6において「yes」と判定し、処理をステップ S 11〖こ移行させる。このステップ S 11において、システム制御部 17は、 ROMZRAM 22に格納されている特徴量パターンと、キーワード部分に対応したテキストデータに基づき辞書データを生成し、当該生成した辞書データをノ、ードディスク 151の辞書データ記録領域 151cに記録する。

[0050] 次に、システム制御部 17は、 EPGデータに基づいて番組表表示用のデータを生成し、当該生成したデータを復号処理部 16に供給する (ステップ S 12)。この際、システム制御部 17は、辞書データ中のキーワード部分に対応したテキストデータを抽出し、当該テキストデータに対応した番組名中、キーワード部分に対応した文字列のみが強調表示されるように番組表表示用のデータを生成する。この結果、モニタ MNには、例えば、図 2に例示したように、音声認識用のキーワード部分のみが強調表示された状態となり、ユーザは、この番組表においてどの文字列に対応した音声を発話すれば良いのかを把握することが可能となるのである。そして、番組表の表示処理が完了すると、システム制御部 17は、ユーザによって番組名を指定する音声入力がなされた力否かを判定する状態となり（ステップ S13)、この判定において「no」と判定すると、表示を終了する力否かを判定する状態となる (ステップ S 14)。そして、このステップ S 14において、「yes」と判定するとハードディスク 151に記録された辞書データを削除して (ステップ S15)、処理を終了する一方、「no」と判定すると、再度、処理をステツプ S 13にリターンすることにより、ユーザの入力操作を待機する状態となる。

[0051] このようにして、システム制御部 17が入力待機状態に移行すると、これに併せて、音声認識部 19はユーザによる発話音声の入力を待機する状態となる。そして、この状態においてユーザがマイク MCに対して、例えば、「參參家の」なるキーワードを発話入力すると、音声認識部 18は当該入力された音声と辞書データ内の特徴量バターンとのマッチング処理を行う。そして、このマッチング処理により入力音声と類似度の高い特徴量パターンを特定すると共に、当該特徴量パターンと対応付けて記述されたキーワード部分のテキストデータを抽出し、当該抽出したテキストデータをシステム制御部 17に出力する。

[0052] 一方、音声認識部 19からテキストデータが供給されると、システム制御部 17においては、ステップ S13における判定が「yes」に変化し、放送番組の録画予約のための処理が実行された後（ステップ S 16)、処理がステップ S 14に移行する。このステップ S 16にお、てシステム制御部 17は、音声認識部 19から供給されたテキストデータに基づ、て EPGデータを検索し、当該 EPGデータ中において当該テキストデータに対応する番組名を対応付けて記述された放送チャネル及び放送時刻を示すデータを抽出する。そして、システム制御部 17は、この抽出したデータを ROMZRAM22に記憶すると共に、当該日時になると記録制御部 20に対して録画 chを示す制御信号を出力する。記録制御部 20は、このようにして供給される制御信号に基づいて TV受信部 11の受信帯域を予約されて、るチャネルに同調するように変更させると共に、 D VDドライブ 14或いは HDD15におけるデータ記録を開始させ、録画予約された放送番組に対応するコンテンツデータを、順次、 DVD或いはハードディスク 151に記録さ ·¾：るのである。

[0053] このようにして、本実施形態にかかる情報記録再生装置 RPは、 EPGデータ中から各番組名を示すテキストデータを取得し、当該取得された各テキストデータから番組表の番組表欄中に表示可能な文字数「N」の範囲内にてキーワードを設定すると共に、この設定された各キーワードに対応した音声の特徴量を示す特徴量パターンを生成して、当該特徴量パターンを番組名を特定するためのテキストデータと対応付けることにより辞書データを生成する構成となっている。この構成により、番組名の一部をキーワードとしつつ辞書データが生成されるため、音声認識用の辞書データのデータ量の削減が可能となる。また、力かる生成に際しては、番組表表示欄に表示可能な文字数の範囲内にてキーワードが設定されるため、キーワードの発話内容を確実に番組表表示欄内に表示させ、もって、この辞書データを利用した際における音声認識を確実なものとすることが可能となる。

[0054] 更に、上記実施形態にお!ヽては、番組名に対応したテキストデータから一部分を抽出する際に、表示可能文字数「もとなるまで、順次、最後尾から所定数の品詞を削除する構成となっているため、より確実にキーワードの文字数を削減でき、確実な音声認識を実現することが可能となる。

[0055] 更にまた、上記実施形態にお!、ては、番組表表示時に当該番組表にぉ、てキーヮードを表示しているため、ユーザは、番組表を視認することで、自身の発話すべきキ一ワードを確実に認識することが可能となり、もって、ユーザの利便性確保及び音声認識の確実性の向上に寄与することが可能となる。

[0056] 特に、本実施形態においては、上述した表示方法 1〜8のように強調表示を行う構成を採用してヽるので、番組表表示欄にキーワード部分以外の文字を含む番組名が表示される場合であっても、ユーザに対して発話すべきキーワードを確実に提示することが可能となる。

[0057] なお、本実施形態にお!、ては、ハードディスク ZDVDレコーダである情報記録再生装置 RPに本願を適用した場合を例に説明したが、 PDPや液晶パネル、更には有機 EL (Electro Luminescent)パネル等を搭載したテレビ受像器、或いは、パーソナルコンピュータやカーナビゲーシヨン装置等の電子機器に対しても適用可能である。

[0058] また、上記実施形態にお!、ては、 EPGデータを用いて辞書データを生成する構成を採用したが、辞書データを生成する際に用いるデータの種別は任意であり、テキストデータを含むものであれば、どのようなデータであっても応用可能である。例えば、 WWW (World Wide Web)上の各ページ（例えば、チケット予約を行うホームページ等）に対応した HTML (Hyper Text Markup Language)データやレストランのメニューを示すデータにより辞書データ生成するようにしても良い。更に、宅配用の DBに基づ、て辞書データを作成すれば、宅配の配送を電話等にぉ、て受け付ける際に用いられる音声認識装置に応用することも可能である。

[0059] また更に、上記実施形態にお!、ては、ユーザの発話音声に基づ!、て放送番組の録画予約を行う構成について説明したが、ユーザの発話音声に基づいて実行する処理内容 (すなわち、実行コマンドに対応した処理の内容）については任意であり、例えば、受信チャネルの切換等を実行させるようにすることも可能である。

[0060] 更に、上記実施形態においては、 1つの番組名に対して 1つのキーワードを設定し

、当該キーワードに対応する特徴量パターンを 1つ生成する構成を採用していた。しかし、 1つの番組名に対して複数のキーワードを設定し、各キーワード毎に特徴量パターンを生成するようにしても良い。例えば、上記図 2に示した「參參家の晩餐」なる番組名の場合、「參參」、「參參家」及び「參參家の」なる 3つのキーワードを設定し、各キーワード毎に特徴量パターンを生成するようにする。力かる方法を採用することにより、ユーザの発話揺れに対応することが可能となり、もって音声認識の精度を向上させることが可會となる。

[0061] 更にまた、上記実施形態においては、番組表の表示時に表示欄における表示文字数に制限があることを前提として説明を行ったが、表示文字数に制限のない場合であっても、上記と同様に番組名の一部をキーワードとして設定して特徴量パターンを生成することによって、番組名の全てをユーザに発話させることなく音声認識を行い、番組の録画予約等を行うことが可能となり、もって、ユーザの利便性を向上させることが可能となる。

[0062] また、上記実施形態にお!、ては、キーワード部分以外をも含む形態にて番糸且名を表示する構成を採用した力番糸且表中にはキーワードのみを表示するようにすることも可能である。

[0063] また、上記実施形態においては、 DVDドライブ 14及び HDD 15の双方を搭載した情報記録再生装置 RPを例に説明したが、 DVD 14或、は HDD 15の何れか一方のみを搭載した情報記録再生装置 RPにつ!ヽても、上記実施形態と同様の処理を実行することが可能である。但し、 HDD15を搭載しない電子機器の場合、形態素解析 D B171やサブワード特徴量 DB172、更には、 EPGデータの記録領域を別個設けることが必要となるためフラッシュメモリを設ける力或いは、 DVDドライブ 14に DVD-R Wを装着し、これらの記録媒体上に上記各データを記録しておくことが必要となる。

[0064] また更に、本実施形態においては、 EPGデータをノヽードディスク 151内に記録する方法を採用したが、 EPGデータが常に放送される環境が実現される場合には、リアルタイムにて EPGデータを取得し、当該 EPGデータに基づ!/、て辞書データを生成するようにしても良い。

[0065] 更に、上記実施形態においては番組表の表示に際して、その都度、辞書データを生成し、当該辞書データを用いて音声認識を行う構成を採用していた力 ¾PGデータの受信時に当該 EPGデータに対応する辞書データを生成しておき、この辞書データを用いて番組録画等の処理を実行するようにしても良、。

[0066] 更にまた、上記実施形態にお!、ては、情報記録再生装置 RPにお!、て音声認識用のキーワードを設定する構成を採用していたが、 EPGデータ生成時に形態素解析を行!ヽ、 EPGデータ中に始めからキーワードの内容を示すデータを記述して放送を行う構成としても良い。この場合、情報記録再生装置 RPにおいては、当該キーワードに基づいて特徴量パターンを生成し、当該特徴量パターンと、 EPGデータに含まれて V、るキーワードを示すデータ及び番組名のテキストデータに基づ、て辞書データを生成するようにすれば良い。

[0067] また、上記実施形態にお!、ては、番組名に基づ!/、て音声認識用のキーワードを抽出する際に、単に形態素解析 DB171に格納された国語辞書に対応したデータに基づヽて読み仮名を割り当て、当該読み仮名に基づ!/ヽて特徴量パターンを生成する方法を採用していた。しかし、映画の題名等の中には、「口口マン 2」というような題名が多ぐこの場合、この「2」の部分が「ツー」と発音すべき力「二」と発音すべきかがュ一ザに把握できない場合も生じうる。従って、力かる場合には、この「2」を除いてキーワードを決定するようにすれば良、。

[0068] また更に、上記実施形態においては、情報記録装置 RPにて辞書データを生成し、当該辞書データを用いて番組表表示を行う構成を採用していたが、辞書データの生成処理、或いは、番組表の表示処理の動作を規定するプログラムが記録された記録媒体と、それを読み取るコンピュータと、を備え、このコンピュータで当該プログラムを読み込むことによって上述と同様の処理動作を実行するようにしても良、。

[0069] [1. 3Ί実施形態の栾形例

(1)麵列 1 上記実施形態における方法を採用した場合、表示可能文字数「N」の値によっては、複数の番組に対して同一のキーワードが設定される場合が想定される。例えば、表示可能文字数「N」を 5文字とした場合、「ニュース參參參（參參參は品詞)」と、「ニュース▲▲▲(▲▲▲は品詞）」の双方に対して、「ニュース」なるキーワードが設定されてしまう (もちろん、「N」の値を充分に大きくすれば、このような事態が発生する可能は、限りなく「0」に近い値となるため、このような方法を採用する必要性はない。 ) oこのような事態が発生した場合の対策方法としては、次のような方法を採用することが可能である。

[0070] <対策方法 1 >

この対策方法は、キーワードに変更を加えることなぐ音声入力時に当該キーワードに対応する番組名の候補を表示してユーザに選択させる方法である。例えば、上記例の場合、「ニュース參參參」と「ニュース▲▲▲」の双方に対して同一のキーワード（「ニュース」）を設定する。そして、ユーザが「ニュース」なる音声を発話した場合、このキーワードに基づ、て「ニュース參參參」と「ニュース▲▲▲」の双方を抽出すると共に、選択候補として両者をモニタ MNに表示させ、当該表示に従ってユーザが選択した放送番組を録画対象として選択する。

[0071] <対策方法 2>

この対策方法は、両番糸且名間においてキーワード上の際が生じるまで、キーワードとして設定する文字数を延長する方法である。例えば、上記のような例の場合、「ニュース參參參」と「ニュース▲▲▲」が、各放送番組に対応したキーワードということになる。但し、この方法を採用した場合、キーワードの全文が番組表示欄中に表示できなくなつてしまうため、本対策方法を採用する場合、当該番組名の全文が表示欄中に表示できるようにフォントサイズを小さくして、これら番組名を表示させる方法を採用することが必要となる。

[0072] (2)変形例 2

上記実施形態にぉ、ては、（a)番組名中にひらがな及びカタカナ以外の文字列が含まれて、る場合（図 3ステップ S3「yes」 )や、（b)番組名が表示可能文字数「N」を越えて、る場合 (ステップ S4 fyesj )に形態素解析を実行する手法を用いて、たが、これらの判断ステップを設けることなぐ全番組名に対して一律に形態素解析を行い

(ステップ S7)、ステップ S5及びステップ S8〜S10の処理を実行するようにしても良い。

[0073] また、上記実施形態においては、キーワード設定時に条件を設定しない構成を採用していたが、例えば、キーワードの最後尾の品詞が助詞以外 (例えば、名詞や動詞)で終わるという条件を設定し、当該条件の設定内容を ROMZRAM22に記録しておくようにしても良い（以下、この設定条件を示すデータを「条件データ」という。 ) o

[0074] 図 4に、上記条件を設定し、且つ、全ての番組名に対して一律に形態素解析を行う手法を採用した場合における処理内容を示す。同図に示すように、カゝかる方法を採用した場合、上記図 3におけるステップ S1及び S2の処理を実行した後、ステップ S7 〜S 10の処理が実行されることとなる。また、このステップ S 10の後に、抽出されたキ一ワードが設定条件の内容に合致するか否か、具体的には、最後尾の品詞が助詞になっているか否かを条件データに基づいて判定し (ステップ S100)、「yes」と判定するとステップ S 10にリターンし、当該助詞を削除して、再度ステップ S 100の処理を繰り返すこととなる。この処理が実行されると、例えば、上記図 2に示す「參參家の」のようなキーワードについては、助詞（「の」）で終了しているため、この「の」が削除され「參參家」がキーワードとして設定されることとなる。

[0075] その後、このステップ S9、 S10、 SIOOの処理が繰り返されて、キーワードが表示可能文字数「N」以下となった時点で、上記図 3のステップ S5、 S6、及びステップ Sl l 〜ステップ SI 6の処理が実行されることとなる。

[0076] (3)変形例 3

上記実施形態においては、番組名に対応したテキストデータに対して形態素解析を施すことにより、番組名を複数の品詞に分割してキーワードを設定し、特徴量バターンを生成する手法を採用していた。しかし、形態素解析以外の手法を用いてキーワードを設定することも可能である。例えば、次のような手法を採用することも可能である。

[0077] まず、以下の手法により、番組名の中から所定数の文字列を抽出する。

(a)番組名に漢字が含まれてヽな、場合 (i)先頭から N文字を抽出する、或いは、

(ii)先頭力 N文字、後ろ力 M文字を抽出して、結合する。

(b)番組名の漢字が含まれて、る場合

(i) 2文字以上連続した漢字を抽出する、或いは、

(ii)ひらがなの直前、或いは、直後の 2文字以上の連続した漢字を抽出する。

[0078] 次いで、この抽出した文字列中に漢字が含まれている場合、国語辞典或いは漢和辞典の DB (形態素解析 DB171に換えて設ける）中から当該漢字の読みを抽出する

。そして、取得された仮名文字に対応する特徴量パターンをサブワード特徴量 DB1

71に格納されたデータに基づいて生成するのである。力かる方法を採用すれば、形態素解析を行うことなぐ番組名に対応したテキストデータを品詞に分解して特徴量パターンを生成することが可能となる。

[0079] (4)栾形例 4

上記実施形態においては、キーワードの意味内容については一切加味することなくキーワードを設定する構成を採用していた。しかし、番組名中の一部を抽出した結果、例えば、当該抽出後のキーワードが放送禁止用語等の不適切な用語に一致するような場合も想定される。このような場合、当該キーワード中の最後の品詞を削除する等の方法により、キーワードの内容を変更するようにしても良い。

Claims

請求の範囲

[1] ユーザにより発話された音声に基づいてユーザの入力コマンドを認識する音声認識装置において用いられる音声認識用の辞書データを生成するための辞書データ生成装置であって、

前記コマンドに対応したテキストデータを取得する取得手段と、

前記取得されたテキストデータから一部の文字列を抽出し、当該文字列をキーヮードとして設定する設定手段と、

前記設定されたキーワードに対応した音声の特徴量を示す特徴量データを生成すると共に、当該コマンドに対応した処理内容を特定するための内容データを当該特徴量データと対応付けることにより前記辞書データを生成する生成手段と、

前記キーワードを表示するための表示装置おいて表示可能な前記キーワードの文字数を特定する特定手段と、を備え、

前記設定手段は、前記特定手段によって特定された文字数の範囲内にて前記キ一ワードを設定することを特徴とする辞書データ生成装置。

[2] 放送番組の番組表を表示するための電子番組表情報を受信する受信手段を更に備え、

前記取得手段は、前記受信手段によって受信された前記電子番組表情報から各放送番組の番組名を示すテキストデータを取得し、

前記設定手段は、当該テキストデータから一部の文字列を抽出することにより番組名の一部をキーワードとして設定することを特徴とする請求項 1に記載の辞書データ生成装置。

[3] 前記設定手段は、前記テキストデータに対応した文字列における最後尾から所定数の品詞を削除することにより、前記テキストデータから一部の文字列を抽出することを特徴とする請求項 1に記載の辞書データ生成装置。

[4] 前記設定手段が前記キーワードを設定する際おける、文字列の抽出条件を示す条件データを記録した条件データ記録手段を更に備え、

前記設定手段は、前記特定手段により特定された文字数及び前記条件データの双方に基づき前記テキストデータ力一部の文字列を抽出することを特徴とする請求項 1に記載の辞書データ生成装置。

[5] 前記設定手段は、前記キーワードを設定する際に、当該設定するキーワードと同一の文字列力もなるキーワードが他のコマンドに対応して設定されて、る場合には、キ一ワードとして設定する文字数を増加させることを特徴とする請求項 1に記載の辞書データ生成装置。

[6] ユーザにより発話された音声に基づいてユーザの入力コマンドを認識する音声認識装置を備えた電子機器であって、

前記コマンドに対応した文字列の一部に設定されたキーワードに対応した音声の特徴量を示す特徴量データと、前記コマンドに対応した処理内容を特定するための内容データとが対応付けられた辞書データを記録した記録手段と、

ユーザの発話音声を入力するための入力手段と、

前記記録された辞書データに基づいて前記発話音声に対応する入力コマンドを特定する音声認識手段と、

前記内容データに基づき、前記特定された入力コマンドに対応する処理を実行する実行手段と、

前記辞書データに基づいて、ユーザに発話させるべきキーワードを表示するための表示データを生成し、表示装置に供給する表示制御手段と

を具備することを特徴とする電子機器。

[7] 前記表示制御手段は、前記コマンドに対応した文字列の一部であって、少なくとも前記キーワードを含む文字列を表示するための表示データを生成する際に、当該文字列の中に含まれる前記キーワードに対応する文字部分のみを強調表示させることを特徴とする請求項 6に記載の電子機器。

[8] 前記表示制御手段は、前記強調表示を行うに際して、

(a)前記キーワード部分のみ文字の色を変えて表示させる、

(b)当該キーワード部分の文字フォントを変えて表示させる、

(c)当該キーワード部分の文字を太線にて表示させる、

(d)当該キーワード部分の文字サイズを変えて表示させる、

(e)当該キーワード部分の文字を枠で囲って表示させる、 (f)当該キーワード部分の文字を点滅表示させる、

(g)当該キーワード部分の文字を反転表示させる、

という手法の少なくとも何れか 1つの手法により前記強調表示を行うことを特徴とする請求項 7に記載の電子機器。

[9] 放送番組の番組表を表示するための電子番組表情報を受信する受信手段を更に備え、

前記記録手段には、前記放送番組を指定するコマンドに対応した内容データと、当該番組名に対応した文字列の一部に設定されたキーワードに対応する前記特徴量データとが対応付けられた前記辞書データが記録されており、

前記表示制御手段は、前記受信された電子番組表情報に基づ!、て前記番組表を前記表示装置に表示させると共に、当該表示に際して、前記辞書データに基づいて、ユーザに発話させるべきキーワード部分を強調表示させることを特徴とする請求項

7又は 8に記載の電子機器。

[10] 前記放送番組に対応したコンテンツデータを記録するためのコンテンツデータ記録手段を更に備え、

前記受信手段は、前記電子番組表情報と共に前記コンテンツデータを受信し、前記実行手段は、前記特定された入力コマンドに対応した内容データにより指定される前記放送番組に対応する放送チャネル及び放送時刻の少なくとも一方を前記電子番組表情報カゝら抽出すると共に、 (a)当該放送番組に対応した前記コンテンツデータの録画予約を行い、或いは、（b)前記受信手段における受信チャネルの切換を行う、ことを特徴とする請求項 9に記載の電子機器。

[11] 前記表示制御手段は、前記音声認識手段によって特定された入力コマンドが複数存在する場合に、何れの実行コマンドを実行すべきかをユーザに選択させるための選択画像を前記表示装置に表示させる選択画面表示制御手段を更に備えることを特徴とする請求項 6に記載の電子機器。

[12] ユーザにより発話された音声に基づいてユーザの入力コマンドを認識する音声認識装置において用いられる音声認識用の辞書データを生成するための辞書データ生成方法であって、前記コマンドに対応したテキストデータを取得する取得ステップと、前記音声認識用のキーワードを表示するための表示装置おいて表示可能な前記キーワードの文字数を特定する特定ステップと、

前記取得されたテキストデータの中から前記特定された文字数の範囲内にて一部の文字列を抽出し、当該文字列を前記キーワードとして設定する設定ステップと、前記設定されたキーワードに対応した音声の特徴量を示す特徴量データを生成すると共に、当該コマンドに対応した処理内容を特定するための内容データを前記特徴量データと対応付けることにより前記辞書データを生成する生成ステップと、を具備することを特徴とする辞書データ生成方法。

[13] コマンドに対応した文字列の一部に設定されたキーワードに対応した音声の特徴量を示す特徴量データと、前記コマンドに対応した処理内容を特定するための内容データとが対応付けられた辞書データを用いて、ユーザの発話音声に対応する入力コマンドを認識する音声認識装置を備えた電子機器の制御方法であって、

前記辞書データに基づいて、ユーザに発話させるべきキーワードを表示するための表示データを生成し、表示装置に供給する表示ステップと、

前記表示装置に表示された画像に従って、ユーザの発話音声が入力された場合に、前記辞書データに基づいて当該発話音声に対応する入力コマンドを特定する音声認識ステップと、

前記内容データに基づき、前記特定された入力コマンドに対応する処理を実行する実行ステップと、

を具備することを特徴とする電子機器の制御方法。

[14] ユーザにより発話された音声に基づいてユーザの入力コマンドを認識する音声認識装置において用いられる音声認識用の辞書データをコンピュータにより生成するための辞書データ生成プログラムであって、

前記コンピュータを、

前記コマンドに対応したテキストデータを取得する取得手段、

前記音声認識用のキーワードを表示するための表示装置おいて表示可能な前記キーワードの文字数を特定する特定手段、前記取得された各テキストデータの中から前記特定された文字数の範囲内にて一部の文字列を抽出し、当該文字列を前記キーワードとして設定する設定手段、前記設定されたキーワードに対応した音声の特徴量を示す特徴量データを生成すると共に、当該コマンドに対応した処理内容を特定するための内容データを前記特徴量データと対応付けることにより前記辞書データを生成する生成手段、

として機能させることを特徴とする辞書データ生成プログラム。

[15] コマンドに対応した文字列の一部に設定されたキーワードに対応した音声の特徴量を示す特徴量データと、前記コマンドに対応した処理内容を特定するための内容データとが対応付けられた辞書データを記録した記録手段と、前記辞書データを用いて、ユーザの発話音声に対応する入力コマンドを認識する音声認識装置と、を備えたコンピュータにおいて処理を実行するための処理プログラムであって、

前記コンピュータを、

前記辞書データに基づいて、ユーザに発話させるべきキーワードを表示するための表示データを生成し、表示装置に供給する表示手段、

前記表示装置に表示された画像に従って、ユーザの発話音声が入力された場合に、前記辞書データに基づいて当該発話音声に対応する入力コマンドを特定する音声認識手段、

前記内容データに基づき、前記特定された入力コマンドに対応する処理を実行する実行手段、

として機能させることを特徴とする処理プログラム。

[16] 請求項 14に記載の辞書データ生成プログラムが記録されたことを特徴とするコンビユータに読み取り可能な情報記録媒体。

[17] 請求項 15に記載の処理プログラムが記録されたことを特徴とするコンピュータに読み取り可能な情報記録媒体。