JP2001282285A

JP2001282285A - 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置

Info

Publication number: JP2001282285A
Application number: JP2000097336A
Authority: JP
Inventors: Keiko Morii; 景子森井; Takehiko Shida; 武彦志田; Takeo Oono; 剛男大野
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2000-03-31
Filing date: 2000-03-31
Publication date: 2001-10-12
Anticipated expiration: 2020-03-31
Also published as: JP3525855B2

Abstract

(57)【要約】【課題】本発明は、ユーザーの嗜好に合わせて認識対
象語彙を少ないユーザ操作で絞り込むことにより、音声
認識性能を向上を図ることを目的とする。【解決手段】嗜好選択情報入力部１５、番号決定部１
６、嗜好情報記憶部３を設け、前記嗜好選択情報入力部
１５からの入力に基づいて前記番号決定部１６で決定さ
れた嗜好番号に該当する前記嗜好情報記憶部に記憶され
る嗜好情報を基に、認識対象語彙作成部５において認識
対象候補語彙記憶部４からユーザーの嗜好を反映した認
識対象語彙を作成し、音声入力部１から入力される音声
と認識対象語彙の音声認識スコアを認識部６において計
算し、認識結果が決定する。また嗜好情報は、電子番組
ガイドから作成され、認識結果は接続されているセット
トップボックス８に番組指定信号が出力される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、認識対象語彙の選
択にユーザーの嗜好を反映させる音声認識方法及び音声
認識装置、並びにそれを用いた番組指定装置に関わる。

【０００２】

【従来の技術】認識対象語彙を動的に作成する従来技術
としては、例えば特開平７−３１９４９４号公報に音声
認識の対象となる複数の単語を予め定義された複数のジ
ャンルに分けて記憶し、予め認識させるジャンルの辞書
ファイルを辞書メモリに展開しておくというものであ
る。

【０００３】図５に従来の音声認識装置の構成図を示
し、以下に説明する。音声認識を開始する前に、音声認
識の対象となる複数の単語を予め定義された複数のジャ
ンルに分けて単語セット５０として記憶し、辞書生成部
５１により複数の単語セット５０を音声特徴を抽出して
辞書ファイル５２にに記憶させ、音声入力の前に辞書ロ
ード部５３は辞書ロード指示部５４の指示された辞書フ
ァイル５２を辞書メモリ５５にロードする。

【０００４】マイクロホン５６から入力された音声は、
音声特徴抽出部５７により音声特徴が抽出され、比較照
合部５８は入力音声された音声特徴と辞書メモリ５５か
らの音声特徴とを比較照合して入力音声に対する単語を
認識結果として出力するものである。

【０００５】

【発明が解決しようとする課題】しかしながら、これら
の従来技術を用いても認識対象語彙は、予め定めたジャ
ンルに従って作成されるためにユーザの意図としたもの
とは限らず、さらに定められたジャンルが変わるたびに
辞書ファイルをロードを繰り返すことが必要となり、ユ
ーザーの意図に合った音声認識結果を得るためにはユー
ザー操作が増えるなどの課題があった。

【０００６】本発明は、ユーザーの嗜好に合わせて認識
対象語彙を少ないユーザ操作で絞り込むことにより、音
声認識性能を向上を図ることを目的とする。

【０００７】

【課題を解決するための手段】この課題を解決するため
に本発明は、音声認識の対象とすべき全単語を格納した
認識対象候補語彙から予め取得したユーザーの嗜好情報
に基づいた認識対象語彙を予め作成し、入力される音声
と認識対象語彙とから単語を認識することを特徴とする
方法を取るものである。

【０００８】また、本発明は、ユーザーの発声する音声
を装置に入力するための音声入力部と、ユーザーの嗜好
情報を選択するための情報を入力するための嗜好選択情
報入力部と、ユーザーの嗜好情報を示す嗜好番号を決定
する番号決定部と、一つまたは複数の嗜好情報を保持す
る嗜好情報記憶部と、音声認識の対象とすべき全単語を
格納する認識対象候補語彙記憶部と、前記嗜好情報記憶
部に格納されている嗜好情報を嗜好番号に応じて参照
し、前記認識対象候補語彙記憶部に記憶される認識対象
候補語彙から、参照する嗜好情報に基づいて認識対象語
彙を作成する認識対象語彙作成部と、前記音声入力部か
ら入力される音声と前記認識対象語彙作成部において作
成された認識対象語彙との音声認識スコアの計算を行う
認識部と、前記認識部において計算されたスコアに基づ
いて認識結果を決定する認識結果決定部とを備えるもの
である。

【０００９】これにより、ユーザーの意図する語を含む
認識対象語彙が選ばれ、従来例よりも誤りが少なく、よ
り多くの場合にユーザーの意図する結果を出力すること
ができる音声認識方法及び音声認識装置を提供すること
ができる。

【００１０】

【発明の実施の形態】本発明の請求項１に記載の発明
は、音声認識の対象とすべき全単語を格納した認識対象
候補語彙から予め取得したユーザーの嗜好情報に基づい
た認識対象語彙を予め作成し、入力される音声と認識対
象語彙とから単語を認識することを特徴とするもので、
ユーザーの嗜好に合わせて認識対象語彙を絞り込むこと
により音声認識性能を向上させるという作用を有する。
また、認識対象候補となりうる全語彙を対象に音声認識
を行うよりも処理が簡便で早くなる方法である。

【００１１】請求項２に記載の発明は、請求項１記載の
音声認識方法において、ユーザーの嗜好情報は、電子番
組ガイドから好きまたは嫌いの少なくとも一つを用いて
学習することにより生成することを特徴とするもので、
本発明の嗜好情報の学習に関わるものであり、好きまた
は嫌いの単純択一を使用することにより、ユーザーに負
担をかけずに嗜好を学習することができるという作用を
有する。さらに、好きまたは嫌いを利用した学習を用い
ることにより、音声操作の即動性、取り扱いの簡便性を
損なうことなく嗜好情報を学習することができる。

【００１２】請求項３に記載の発明は、請求項１または
２記載の音声認識方法において、予め取得したユーザー
の嗜好情報に基づいた認識対象語彙の嗜好得点と、音声
認識によって得られる距離とを使用して認識結果を決定
することを特徴とするもので、音声認識のスコアに嗜好
の得点も加味することにより、ユーザーがより発声しそ
うな内容に重みをつけて結果を出力して、ユーザーの全
く意図しない結果を出現させるケースを大幅に低減する
と同時に、意図する結果を高い確率で出現させるという
作用を有する。

【００１３】請求項４記載の発明は、音声認識の対象と
すべき全単語からユーザーの嗜好に合わせた認識対象単
語を絞り込んで音声認識を行う認識装置であって、ユー
ザーの発声する音声を入力する音声入力部と、ユーザー
の嗜好を示す嗜好番号を決定するための情報を入力する
嗜好選択情報入力部と、前記嗜好選択情報入力部からの
入力を受けて現在使っているユーザーのための嗜好番号
を決定する番号決定部と、一つまたは複数の嗜好情報を
保持する嗜好情報記憶部と、音声認識の対象とすべき全
単語を格納する認識対象候補語彙記憶部と、前記嗜好情
報記憶部に格納されている嗜好情報を嗜好番号によって
選択し、選択された嗜好情報に基づいて前記認識対象候
補語彙記憶部に記憶される認識対象候補語彙から認識対
象語彙を作成する認識対象語彙作成部と、前記音声入力
部から入力される音声と前記認識対象語彙作成部におい
て作成された認識対象語彙との認識スコア計算を行う認
識部と、前記認識部において計算された認識スコアに基
づいて認識結果を決定し出力する認識結果決定部とを備
えたもので、ユーザーの嗜好に合わせて認識対象語彙を
絞り込むことにより音声認識性能を向上させるという作
用を有する。

【００１４】請求項５記載の発明は、請求項４記載の音
声認識装置において、番号決定部は、嗜好選択情報入力
部からの入力がユーザー識別記号であって、前記番号決
定部に対してユーザー番号を出力することを特徴とする
もので、１つまたは複数の嗜好情報から認識対象語彙選
択に使用する嗜好情報を選択することにより、ユーザー
の嗜好に合わせて認識対象語彙を絞り込むことにより音
声認識性能を向上させるという作用を有する。

【００１５】請求項６に記載の発明は、請求項４記載の
音声認識装置において、番号決定部への嗜好選択情報入
力部からの入力が時間であって、前記番号決定部に対し
て、時間帯番号を出力することを特徴とするもので、複
数の嗜好情報を選択する際に時間情報を利用することに
より、ユーザーの当該時間帯の嗜好に合わせて認識対象
語彙を絞り込むことにより音声認識性能を向上させると
いう作用を有する。

【００１６】請求項７に記載の発明は、ユーザーの発声
する音声を入力する音声入力部と、ユーザーの嗜好を示
す嗜好番号を決定するための情報を入力する嗜好選択情
報入力部と、複数の音響テンプレートを記憶する音響テ
ンプレート記憶部と、前記音声入力部から入力される規
定語音声と前記音響テンプレート記憶部に記憶される全
ての音響テンプレートとの音声認識スコアを計算して最
も高いスコアを与える音響テンプレートを選択する音響
テンプレート選択部と、前記音響テンプレート記憶部に
記憶される音響テンプレートと前記嗜好情報記憶部に記
憶される嗜好情報の対応関係を記憶して選択された音響
テンプレートから嗜好番号を決定する番号決定部と、一
つまたは複数の嗜好情報を保持する嗜好情報記憶部と、
音声認識の対象とすべき全単語を格納する認識対象候補
語彙記憶部と、前記嗜好情報記憶部に格納されている嗜
好情報を嗜好番号によって選択し、選択された嗜好情報
に基づいて前記認識対象候補語彙記憶部に記憶される認
識対象候補語彙から認識対象語彙を作成する認識対象語
彙作成部と、前記音声入力部から入力される音声と前記
認識対象語彙作成部において作成された認識対象語彙と
の認識スコア計算を行う認識部と、前記認識部において
計算された認識スコアに基づいて認識結果を決定し出力
する認識結果決定部とを備えたもので、１つまたは複数
の嗜好情報を選択する際に、ユーザーの発声を用いて発
声に最も近い音響テンプレートを選択し、音響テンプレ
ートとの対応関係を基に嗜好情報を選択することによ
り、自動的にユーザーの嗜好を選択し、ユーザーの嗜好
に合わせて認識対象語彙を絞り込むことにより音声認識
性能を向上させるという作用を有する。

【００１７】請求項８に記載の発明は、請求項７記載の
音声認識装置において、前記音響テンプレート選択部で
複数の音響テンプレートを選択し、前記番号決定部にお
いて複数の嗜好番号を決定して、前記認識対象語彙作成
部において複数の嗜好情報の内容を統合し、前記認識対
象候補語彙記憶部に記憶される認識対象候補語彙から認
識対象語彙を作成することを特徴とするもので、中間的
な発声が入力された場合に、ユーザーの発声に比較的近
い複数の音響テンプレートを選択して各テンプレートに
対する音声認識スコアによる重みも計算することによ
り、ユーザーの嗜好により合致した認識対象語彙を絞り
込みが行われ、音声認識性能を向上させるという作用を
有する。

【００１８】請求項９に記載の発明は、請求項４記載の
音声認識装置において、前記認識対象語彙作成部におい
て選択された嗜好情報を入力として認識対象語彙につい
て嗜好重みを付与し、嗜好重みを得点化する嗜好得点作
成部を備え、前記認識部において計算された音声認識ス
コアと前記嗜好得点作成部において作成された嗜好得点
を入力として認識結果を決定する認識結果決定部を備え
ることを特徴とするもので、嗜好情報から作成した嗜好
得点も加味して認識結果を決定することにより、ユーザ
ーの嗜好に合わせて認識対象語彙を絞り込みかつにより
音声認識性能を向上させるという作用を有する。

【００１９】請求項１０に記載の発明は、請求項４から
７のいずれかに記載の音声認識装置をデジタルテレビ放
送や、オン・デ・マンド映画／カラオケ配信サービス
を利用する時の番組指定装置に適用したもので、ユーザ
の嗜好にあった番組選択ができるという作用を有する。

【００２０】請求項１１に記載の発明は、請求項１０記
載の番組指定装置において、ユーザーの嗜好情報は、電
子番組ガイドから好きまたは嫌いにより選択する学習方
法により生成することを特徴とするもので、好きまたは
嫌いの択一選択を嗜好情報の学習に使うことにより、容
易にユーザの嗜好にあった学習ができるという作用を有
する。

【００２１】請求項１２に記載の発明は、請求項９記載
の番組指定装置において、ユーザーの嗜好情報は電子番
組ガイドで提供されれる、時間帯、ジャンル、出演者も
しくは出演グループ名、番組名、番組内容、テーマ、音
楽、内容キーワード、ユーザー名、の少なくとも１つを
構成要素として持つことを特徴とするもので、嗜好情報
の内容を指定していすることにより、よりユーザの嗜好
にあった番組選択ができるという作用を有する。

【００２２】請求項１３に記載の発明は、請求項1０か
ら１２のいずれかに記載の番組指定装置において、番組
の嗜好情報を学習する際に、番組の視聴側による中断
時、番組の配信側による中断時、もしくは番組終了時に
嗜好の入力を促すことを特徴とするもので、装置がユー
ザーから嗜好情報を学習する際に、番組の切れ目などを
狙って、積極的に嗜好を尋ねることにより、よりユーザ
の嗜好にあった番組選択ができるという作用を有する。

【００２３】以下に、本発明の実施の形態について図を
用いて説明する。

【００２４】（実施の形態１）図１に本発明の実施の形
態１における番組指定装置のブロック構成図を示す。

【００２５】図１において、１はユーザーの音声を入力
する音声入力部、２は嗜好情報を作成する嗜好情報作成
部、３は嗜好情報作成部２で作成された嗜好情報を保持
する嗜好情報記憶部、４は音声認識の対象語彙となりう
る全ての語彙を記憶している認識対象候補語彙記憶部、
５は認識対象候補語彙記憶部４に記憶されている認識対
象語彙の中から嗜好にあった語彙を選択してユーザーの
嗜好に合わせた認識対象語彙辞書を作成する認識対象語
彙作成部、６は音声入力部１から入力された音声と認識
対象語彙作成部５から認識対象語彙との音声認識スコア
を計算する認識部、７は認識部６で得られた認識得点は
最終的に出力する認識結果決定部、８は認識結果決定部
７で決まった信号を受けて、次の受信要求項目を決定す
るセットトップボックス、９はテレビ放送や電子番組ガ
イドを送信するデジタルテレビ放送、１０は映画やカラ
オケ等の配信サービスを行うでオン・デ・マンド映画／
カラオケ配信サービス、１１はビデオ、１２はディスプ
レイモニタ、１５は嗜好情報記憶部３に記憶される嗜好
情報が複数の場合にその中から嗜好情報を選択するため
の情報を入力する嗜好選択情報入力部、１６は嗜好選択
情報入力部１５からの入力を受けて嗜好番号を出力する
番号決定部である。

【００２６】上記のように構成された番組選択装置の動
作について、以下に説明する。まず最初に、セットトッ
プボックス８は常時電源が投入されており、１日に１
度、オン・デ・マンド映画／カラオケ配信サービス１０
から受信可能な番組名及び番組に関する情報を受信し
て、前記セットトップボックス８の内部に記憶すると同
時に、番組名については認識対象候補語彙記憶部４に送
るものとします。

【００２７】嗜好選択情報入力部１５へ入力される嗜好
選択情報は、ユーザーが装置に付随するリモコンのボタ
ンで入力するユーザー番号、もしくは内蔵の時計から出
力される時刻情報であって、嗜好情報記憶部３に複数記
憶される嗜好情報を選択するための情報である。

【００２８】番号決定部１６は、前記嗜好選択情報入力
部１５へ入力される嗜好選択情報を基に、（表１）、
（表２）に示した表に沿って、前記嗜好選択情報入力部
１５からの入力を受けて嗜好番号を出力する。

【００２９】

【表１】

【００３０】

【表２】

【００３１】なお、前記嗜好情報記憶部３に記憶されて
いる嗜好情報が１つの場合でも実施の形態の効果に変わ
りはなく、前記嗜好情報記憶部３に記憶されている嗜好
情報が１つの場合には前記嗜好選択情報入力部１５は入
力にかかわらず常に同一信号を出しつづけている。

【００３２】認識対象語彙作成部５は、前記番号決定部
１６からの嗜好番号を基に嗜好情報記憶部３から嗜好情
報を引き出し、認識対象候補語彙記憶部４に記憶されて
いる認識対象語彙の中から嗜好にあった語彙を選択して
ユーザーの嗜好に合わせた認識対象語彙辞書を作成す
る。認識対象語彙作成部５では、嗜好情報記憶部３に格
納される嗜好情報から語に対して点数付けを行い、点数
閾値を用いて閾値よりも点数が高い語を選択する。

【００３３】なお、語数を予め決めておいて、上位の方
から決まった語数を選ぶ場合でも同様の効果が得られ
る。

【００３４】こうして準備されている装置に対して、ユ
ーザーはオン・デ・マンド映画／カラオケ配信サービス
１０から選択したい番組名を音声で音声入力部１より指
定する。

【００３５】認識部６は、音声入力部１から入力された
音声に対して、選択作成されたユーザーの嗜好に合わせ
た認識対象語彙辞書に対して音声認識を実施し、音声認
識スコアを計算する。認識結果決定部７は、認識部６で
得られた認識得点を受け、最終的に出力する信号が決め
る。

【００３６】セットトップボックス８は、認識結果決定
部７で決まった信号を受けて、次の受信要求項目を決定
する。ここでは、セットトップボックス８はオン・デ・
マンド映画／カラオケ配信サービス１０に対して受信要
求を出す、もしくは受信した画像や音声をディスプレイ
モニタ１２に送る役割を果たしている。

【００３７】この構成により、オン・デ・マンド映画／
カラオケ配信サービス１０の配信可能なメニューが例え
数百万番組あった場合でも、ユーザーの嗜好に合わせて
音声認識対象語彙を絞り込んだ音声認識装置を使用し
て、受信要求する番組を音声選択することにより、対象
語彙を絞り込まない番組選択システムと比較して、短時
間のうちに、言い直しなく受信要求番組を選択すること
ができる。

【００３８】なお、認識対象候補語彙記憶部４に記憶さ
れる認識対象語彙がデジタルテレビ放送９から送信され
る電子番組ガイドであって、セットトップボックス８が
外部から受信する番組情報が、デジタルテレビ放送９で
放送される電子番組ガイドであって、要求を出す対象が
ビデオ１１で、出す要求内容が録画予約であっても同様
の効果が得られる。

【００３９】嗜好情報作成部２での学習方法は、ユーザ
ーの好き・嫌いの入力を用いた情報フィルタを使用する
もので、例えば特開平９−２８８６８３号公報の学習方
法が知られている。以下に嗜好情報作成部２での学習方
法について、嗜好学習の流れ図を図２に示し以下に説明
する。

【００４０】S01はユーザーの音声入力ステップ、S02は
ユーザー音声の認識スコア計算を行う認識ステップ、S0
3はスコア比較を行う認識結果決定ステップ、S04は決ま
った認識結果に沿って番組を視聴する番組視聴ステッ
プ、S05は視聴している番組について、ユーザーからの
嗜好反応を判断する嗜好判定ステップ、S06は判定され
た内容に沿って嗜好を学習する嗜好学習ステップであ
る。

【００４１】S01でユーザーによる音声入力が行われ、S
02で音声認識が行われる。S03で音声認識の結果が決定
され、S04ではS03で決定された番組を視聴する。S05で
は番組を視聴しているユーザーの行動に応じた嗜好の判
定を行う。すなわち、10分が経過する前にチャンネルを
変えたら、当該番組はユーザーが気に入らなかったもの
と判断して、当該番組の(表３)の電子番組ガイドに付与
された語に「嫌い」の符号をつけて嗜好学習ステップS0
6に渡す。

【００４２】

【表３】

【００４３】例えば、10分を経過しても視聴しつづけて
いるようならば、当該番組はユーザーが気に入ったと判
断して、当該番組の(表３)の電子番組ガイドに付与され
た語に「好き」の符号をつけて嗜好学習ステップS06に
渡す。嗜好学習ステップS06では嗜好判断ステップS05で
判断された内容に沿って、嗜好を学習する。

【００４４】なお、番組の中のコマーシャルやニュース
などの割り込み別放送など最初の中断時もしくは、チャ
ンネルを変更する、番組が終るなどの視聴終了時に、セ
ットトップボックス側から「ただいまの番組は如何でし
たか？好き、嫌いのどちらかでお答えください。」と問
い掛けて、（表３）の電子番組ガイドに付与された語に
ついて得られた回答情報「好き」もしくは「嫌い」１件
として嗜好情報作成部２に送る方法でも同様の効果が得
られる。

【００４５】（実施の形態２）図３に本発明の実施の形
態２における番組指定装置のブロック構成図を示す。実
施の形態２で説明する番組指定装置は、実施の形態１の
番組指定装置を部分的に変更したものであり、実施の形
態１の構成と異なる部分について説明する。

【００４６】嗜好情報記憶部３には、複数の嗜好情報が
記憶されている。嗜好情報記憶部３に記憶されている嗜
好情報が複数であるために、どの嗜好情報を選択するか
を決めるために、音響テンプレート記憶部１３に記憶さ
れている複数の音響テンプレートから、音声入力部１か
ら入力されるユーザーの発声に近いものを音響テンプレ
ート選択部１４で選択する。

【００４７】実施の形態２の装置の場合、音響テンプレ
ートを選択するための発声は、「番組」という言葉にな
っている。音響テンプレート選択部１４は「番組」とい
う決まった言葉を待ち受けていて、正確に発声されたと
いう前提の基でユーザーの発声と一番近い音響テンプレ
ートを選択する。音響テンプレート選択部１４では、一
単語認識処理を全ての音響テンプレートに対して行い、
一番スコアが高かったものを選択する。こうして選択さ
れた音響テンプレート番号は、番号決定部１６におい
て、（表４）で関連付けられた嗜好情報の番号決定に使
われる。

【００４８】

【表４】

【００４９】番号決定部１６で決まった嗜好情報番号
は、認識対象語彙作成部５に送られて、嗜好情報記憶部
３に記憶されている複数の嗜好情報から引き出す嗜好情
報を指定する。

【００５０】なお、番号決定部１６において嗜好番号を
決定するための情報は、音響テンプレート選択部１４で
決められる音響テンプレート番号ではなくて、嗜好選択
情報入力部１５から入力される構成とし、嗜好情報入力
部１５でユーザーの顔画像を用いてユーザー番号を判定
して番号決定部１６へ送り、（表２）に基づいて嗜好番
号を決定しても同様の効果が得られる。

【００５１】また、番号決定部１６において嗜好番号を
決定するための情報は、音響テンプレート選択部１４で
決められる音響テンプレート番号ではなくて、嗜好選択
情報入力部１５から入力される構成とし、嗜好選択情報
入力部１５への入力を内蔵の時計から得られる時刻とし
て、前記嗜好選択情報入力部１５において時間帯番号を
判定、判定された時間帯番号を番号決定部１６に送り
（表２）に基づいて嗜好番号を決定しても同様の効果が
得られる。

【００５２】（実施の形態３）図３に本発明の実施の形
態３における番組指定装置のブロック構成図を示す。実
施の形態３で説明する番組指定装置は、実施の形態１の
番組指定装置を部分的に変更したものであり、実施の形
態１と異なる部分について説明する。

【００５３】ユーザーの発声は、音声入力部１から装置
に入力され、認識部６で音声認識処理を行って、認識得
点が認識結果決定部７に送られる。実施の形態１と異な
るのは、ここで認識結果を決定するための材料が音声認
識による認識得点だけではなくて、ユーザーの嗜好情報
から決定される嗜好得点も加味して決められることであ
る。

【００５４】認識部６で音声認識に使われる語彙は、認
識対象語彙作成部５において、認識対象候補語彙記憶部
４に記憶される全ての語の中から、嗜好情報記憶部３に
記憶されている嗜好情報に基づいて語に得点をつけて点
数閾値よりも上位の語が選択される。選択時に付与した
嗜好情報に基づく得点のうち、認識対象語彙に選ばれた
語の得点については嗜好得点計算部１７において、各語
の点数からあらかじめ点数閾値としていた数値を引き去
って、最低嗜好得点が０となるように計算しなおし、認
識結果決定部７へ送る。

【００５５】認識結果決定部７では、認識部６から受け
取った音声認識の認識得点と、嗜好得点計算部１８から
受け取った嗜好得点とを合算した上で、一番得点が高い
ものを最終結果としてセットトップボックス８へ出力す
る。

【００５６】なお、嗜好得点計算部１８において、嗜好
得点から一定値を引き去る処理を行う代わりに、正規化
処理を行っても、同様の効果が得られる。

【００５７】

【発明の効果】本発明によれば、声認識の対象とすべき
全単語を格納した認識対象候補語彙から予め取得したユ
ーザーの嗜好情報に基づいた認識対象語彙を予め作成
し、入力される音声と認識対象語彙とから単語を認識す
ることを特徴とするもので、ユーザーの嗜好に合わせて
認識対象語彙を少ないユーザ操作で絞り込むことによ
り、音声認識性能を向上させるという有利な効果が得ら
れる。

【００５８】また、番組指定装置に適用した場合は、ユ
ーザの嗜好にあった番組選択ができるという有利な効果
が得られる。

【図面の簡単な説明】

【図１】本発明の実施の形態１における番組選択装置の
ブロック構成図

【図２】実施の形態１の嗜好学習の流れ図

【図３】本発明の実施の形態２における番組選択装置の
ブロック構成図

【図４】本発明の実施の形態３における番組選択装置の
ブロック構成図

【図５】従来の音声認識装置のブロック構成図

【符号の説明】

１音声入力部２嗜好情報作成部３嗜好情報記憶部４認識対象候補語彙記憶部５認識対象語彙作成部６認識部７認識結果決定部８セットトップボックス９デジタルテレビ放送１０オン・デ・マンド映画／カラオケ配信サービス１１ビデオ１２ディスプレイモニター１３音響テンプレート記憶部１４音響テンプレート選択部１５嗜好選択情報入力部１６番号決定部１７嗜好得点計算部

───────────────────────────────────────────────────── フロントページの続き (72)発明者大野剛男神奈川県川崎市多摩区東三田３丁目10番１号松下技研株式会社内Ｆターム(参考） 5C018 HA10 5C025 AA23 CB08 DA01 DA05 5C061 BB07 5D015 GG01 KK01 9A001 BB04 DD11 FF03 HH17 JJ75 KK62

Claims

【特許請求の範囲】

【請求項１】音声認識の対象とすべき全単語を格納し
た認識対象候補語彙から予め取得したユーザーの嗜好情
報に基づいた認識対象語彙を予め作成し、入力される音
声と認識対象語彙とから単語を認識することを特徴とす
る音声認識方法。
【請求項２】ユーザーの嗜好情報は、電子番組ガイド
から好きまたは嫌いの少なくとも一つを用いて学習する
ことにより生成することを特徴とする請求項１記載の音
声認識方法。
【請求項３】予め取得したユーザーの嗜好情報に基づ
いた認識対象語彙の嗜好得点と、音声認識によって得ら
れる距離とを使用して認識結果を決定することを特徴と
する請求項１または２記載の音声認識方法。
【請求項４】ユーザーの発声する音声を入力する音声
入力部と、ユーザーの嗜好を示す嗜好番号を決定するた
めの情報を入力する嗜好選択情報入力部と、前記嗜好選
択情報入力部からの入力を受けて現在使っているユーザ
ーのための嗜好番号を決定する番号決定部と、一つまた
は複数の嗜好情報を保持する嗜好情報記憶部と、音声認
識の対象とすべき全単語を格納する認識対象候補語彙記
憶部と、前記嗜好情報記憶部に格納されている嗜好情報
を嗜好番号によって選択し、選択された嗜好情報に基づ
いて前記認識対象候補語彙記憶部に記憶される認識対象
候補語彙から認識対象語彙を作成する認識対象語彙作成
部と、前記音声入力部から入力される音声と前記認識対
象語彙作成部において作成された認識対象語彙との認識
スコア計算を行う認識部と、前記認識部において計算さ
れた認識スコアに基づいて認識結果を決定し出力する認
識結果決定部とを備えることを特徴とする音声認識装
置。
【請求項５】番号決定部は、嗜好選択情報入力部から
の入力がユーザー識別記号であって、前記番号決定部に
対してユーザー番号を出力することを特徴とする請求項
４記載の音声認識装置。
【請求項６】番号決定部は、嗜好選択情報入力部から
の入力が時間であって、前記番号決定部に対して、時間
帯番号を出力することを特徴とする請求項４記載の音声
認識装置。
【請求項７】ユーザーの発声する音声を入力する音声
入力部と、ユーザーの嗜好を示す嗜好番号を決定するた
めの情報を入力する嗜好選択情報入力部と、複数の音響
テンプレートを記憶する音響テンプレート記憶部と、前
記音声入力部から入力される規定語音声と前記音響テン
プレート記憶部に記憶される全ての音響テンプレートと
の音声認識スコアを計算して最も高いスコアを与える音
響テンプレートを選択する音響テンプレート選択部と、
前記音響テンプレート記憶部に記憶される音響テンプレ
ートと前記嗜好情報記憶部に記憶される嗜好情報の対応
関係を記憶して選択された音響テンプレートから嗜好番
号を決定する番号決定部、一つまたは複数の嗜好情報を
保持する嗜好情報記憶部と、音声認識の対象とすべき全
単語を格納する認識対象候補語彙記憶部と、前記嗜好情
報記憶部に格納されている嗜好情報を嗜好番号によって
選択し、選択された嗜好情報に基づいて前記認識対象候
補語彙記憶部に記憶される認識対象候補語彙から認識対
象語彙を作成する認識対象語彙作成部と、前記音声入力
部から入力される音声と前記認識対象語彙作成部におい
て作成された認識対象語彙との認識スコア計算を行う認
識部と、前記認識部において計算された認識スコアに基
づいて認識結果を決定し出力する認識結果決定部とを備
えることを特徴とする音声認識装置。
【請求項８】前記音響テンプレート選択部で複数の音
響テンプレートを選択し、前記番号決定部において複数
の嗜好番号を決定して、前記認識対象語彙作成部におい
て複数の嗜好情報の内容を統合し、前記認識対象候補語
彙記憶部に記憶される認識対象候補語彙から認識対象語
彙を作成することを特徴とする請求項７記載の音声認識
装置。
【請求項９】前記認識対象語彙作成部において、選択
された嗜好情報を入力として認識対象語彙について嗜好
重みを付与し、嗜好重みを得点化する嗜好得点作成部を
備え、前記認識部において計算された音声認識スコアと
前記嗜好得点作成部において作成された嗜好得点を入力
として認識結果を決定する認識結果決定部を備えること
を特徴とする請求項４記載の音声認識装置。
【請求項１０】請求項４から７のいずれかに記載の音
声認識装置を用いて、番組指定をすることを特徴とする
番組指定装置。
【請求項１１】ユーザーの嗜好情報は、電子番組ガイ
ドから好きまたは嫌いにより選択する学習方法により生
成することを特徴とする請求項１０記載の番組指定装
置。
【請求項１２】ユーザーの嗜好情報は電子番組ガイド
で提供されれる、時間帯、ジャンル、出演者もしくは出
演グループ名、番組名、番組内容、テーマ、音楽、内容
キーワード、ユーザー名、の少なくとも１つを構成要素
として持つことを特徴とする請求項９記載の番組指定装
置。
【請求項１３】番組の嗜好情報を学習する際に、番組
の視聴側による中断時、番組の配信側による中断時、も
しくは番組終了時に嗜好の入力を促すことを特徴とする
請求項1０から１２のいずれかに記載の番組指定装置。