JP2001282285A - 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置 - Google Patents

音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置

Info

Publication number
JP2001282285A
JP2001282285A JP2000097336A JP2000097336A JP2001282285A JP 2001282285 A JP2001282285 A JP 2001282285A JP 2000097336 A JP2000097336 A JP 2000097336A JP 2000097336 A JP2000097336 A JP 2000097336A JP 2001282285 A JP2001282285 A JP 2001282285A
Authority
JP
Japan
Prior art keywords
preference
recognition
unit
vocabulary
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000097336A
Other languages
English (en)
Other versions
JP3525855B2 (ja
JP2001282285A5 (ja
Inventor
Keiko Morii
景子 森井
Takehiko Shida
武彦 志田
Takeo Oono
剛男 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000097336A priority Critical patent/JP3525855B2/ja
Publication of JP2001282285A publication Critical patent/JP2001282285A/ja
Application granted granted Critical
Publication of JP3525855B2 publication Critical patent/JP3525855B2/ja
Publication of JP2001282285A5 publication Critical patent/JP2001282285A5/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

(57)【要約】 【課題】 本発明は、ユーザーの嗜好に合わせて認識対
象語彙を少ないユーザ操作で絞り込むことにより、音声
認識性能を向上を図ることを目的とする。 【解決手段】 嗜好選択情報入力部15、番号決定部1
6、嗜好情報記憶部3を設け、前記嗜好選択情報入力部
15からの入力に基づいて前記番号決定部16で決定さ
れた嗜好番号に該当する前記嗜好情報記憶部に記憶され
る嗜好情報を基に、認識対象語彙作成部5において認識
対象候補語彙記憶部4からユーザーの嗜好を反映した認
識対象語彙を作成し、音声入力部1から入力される音声
と認識対象語彙の音声認識スコアを認識部6において計
算し、認識結果が決定する。また嗜好情報は、電子番組
ガイドから作成され、認識結果は接続されているセット
トップボックス8に番組指定信号が出力される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、認識対象語彙の選
択にユーザーの嗜好を反映させる音声認識方法及び音声
認識装置、並びにそれを用いた番組指定装置に関わる。
【0002】
【従来の技術】認識対象語彙を動的に作成する従来技術
としては、例えば特開平7−319494号公報に音声
認識の対象となる複数の単語を予め定義された複数のジ
ャンルに分けて記憶し、予め認識させるジャンルの辞書
ファイルを辞書メモリに展開しておくというものであ
る。
【0003】図5に従来の音声認識装置の構成図を示
し、以下に説明する。音声認識を開始する前に、音声認
識の対象となる複数の単語を予め定義された複数のジャ
ンルに分けて単語セット50として記憶し、辞書生成部
51により複数の単語セット50を音声特徴を抽出して
辞書ファイル52にに記憶させ、音声入力の前に辞書ロ
ード部53は辞書ロード指示部54の指示された辞書フ
ァイル52を辞書メモリ55にロードする。
【0004】マイクロホン56から入力された音声は、
音声特徴抽出部57により音声特徴が抽出され、比較照
合部58は入力音声された音声特徴と辞書メモリ55か
らの音声特徴とを比較照合して入力音声に対する単語を
認識結果として出力するものである。
【0005】
【発明が解決しようとする課題】しかしながら、これら
の従来技術を用いても認識対象語彙は、予め定めたジャ
ンルに従って作成されるためにユーザの意図としたもの
とは限らず、さらに定められたジャンルが変わるたびに
辞書ファイルをロードを繰り返すことが必要となり、ユ
ーザーの意図に合った音声認識結果を得るためにはユー
ザー操作が増えるなどの課題があった。
【0006】本発明は、ユーザーの嗜好に合わせて認識
対象語彙を少ないユーザ操作で絞り込むことにより、音
声認識性能を向上を図ることを目的とする。
【0007】
【課題を解決するための手段】この課題を解決するため
に本発明は、音声認識の対象とすべき全単語を格納した
認識対象候補語彙から予め取得したユーザーの嗜好情報
に基づいた認識対象語彙を予め作成し、入力される音声
と認識対象語彙とから単語を認識することを特徴とする
方法を取るものである。
【0008】また、本発明は、ユーザーの発声する音声
を装置に入力するための音声入力部と、ユーザーの嗜好
情報を選択するための情報を入力するための嗜好選択情
報入力部と、ユーザーの嗜好情報を示す嗜好番号を決定
する番号決定部と、一つまたは複数の嗜好情報を保持す
る嗜好情報記憶部と、音声認識の対象とすべき全単語を
格納する認識対象候補語彙記憶部と、前記嗜好情報記憶
部に格納されている嗜好情報を嗜好番号に応じて参照
し、前記認識対象候補語彙記憶部に記憶される認識対象
候補語彙から、参照する嗜好情報に基づいて認識対象語
彙を作成する認識対象語彙作成部と、前記音声入力部か
ら入力される音声と前記認識対象語彙作成部において作
成された認識対象語彙との音声認識スコアの計算を行う
認識部と、前記認識部において計算されたスコアに基づ
いて認識結果を決定する認識結果決定部とを備えるもの
である。
【0009】これにより、ユーザーの意図する語を含む
認識対象語彙が選ばれ、従来例よりも誤りが少なく、よ
り多くの場合にユーザーの意図する結果を出力すること
ができる音声認識方法及び音声認識装置を提供すること
ができる。
【0010】
【発明の実施の形態】本発明の請求項1に記載の発明
は、音声認識の対象とすべき全単語を格納した認識対象
候補語彙から予め取得したユーザーの嗜好情報に基づい
た認識対象語彙を予め作成し、入力される音声と認識対
象語彙とから単語を認識することを特徴とするもので、
ユーザーの嗜好に合わせて認識対象語彙を絞り込むこと
により音声認識性能を向上させるという作用を有する。
また、認識対象候補となりうる全語彙を対象に音声認識
を行うよりも処理が簡便で早くなる方法である。
【0011】請求項2に記載の発明は、請求項1記載の
音声認識方法において、ユーザーの嗜好情報は、電子番
組ガイドから好きまたは嫌いの少なくとも一つを用いて
学習することにより生成することを特徴とするもので、
本発明の嗜好情報の学習に関わるものであり、好きまた
は嫌いの単純択一を使用することにより、ユーザーに負
担をかけずに嗜好を学習することができるという作用を
有する。さらに、好きまたは嫌いを利用した学習を用い
ることにより、音声操作の即動性、取り扱いの簡便性を
損なうことなく嗜好情報を学習することができる。
【0012】請求項3に記載の発明は、請求項1または
2記載の音声認識方法において、予め取得したユーザー
の嗜好情報に基づいた認識対象語彙の嗜好得点と、音声
認識によって得られる距離とを使用して認識結果を決定
することを特徴とするもので、音声認識のスコアに嗜好
の得点も加味することにより、ユーザーがより発声しそ
うな内容に重みをつけて結果を出力して、ユーザーの全
く意図しない結果を出現させるケースを大幅に低減する
と同時に、意図する結果を高い確率で出現させるという
作用を有する。
【0013】請求項4記載の発明は、音声認識の対象と
すべき全単語からユーザーの嗜好に合わせた認識対象単
語を絞り込んで音声認識を行う認識装置であって、ユー
ザーの発声する音声を入力する音声入力部と、ユーザー
の嗜好を示す嗜好番号を決定するための情報を入力する
嗜好選択情報入力部と、前記嗜好選択情報入力部からの
入力を受けて現在使っているユーザーのための嗜好番号
を決定する番号決定部と、一つまたは複数の嗜好情報を
保持する嗜好情報記憶部と、音声認識の対象とすべき全
単語を格納する認識対象候補語彙記憶部と、前記嗜好情
報記憶部に格納されている嗜好情報を嗜好番号によって
選択し、選択された嗜好情報に基づいて前記認識対象候
補語彙記憶部に記憶される認識対象候補語彙から認識対
象語彙を作成する認識対象語彙作成部と、前記音声入力
部から入力される音声と前記認識対象語彙作成部におい
て作成された認識対象語彙との認識スコア計算を行う認
識部と、前記認識部において計算された認識スコアに基
づいて認識結果を決定し出力する認識結果決定部とを備
えたもので、ユーザーの嗜好に合わせて認識対象語彙を
絞り込むことにより音声認識性能を向上させるという作
用を有する。
【0014】請求項5記載の発明は、請求項4記載の音
声認識装置において、番号決定部は、嗜好選択情報入力
部からの入力がユーザー識別記号であって、前記番号決
定部に対してユーザー番号を出力することを特徴とする
もので、1つまたは複数の嗜好情報から認識対象語彙選
択に使用する嗜好情報を選択することにより、ユーザー
の嗜好に合わせて認識対象語彙を絞り込むことにより音
声認識性能を向上させるという作用を有する。
【0015】請求項6に記載の発明は、請求項4記載の
音声認識装置において、番号決定部への嗜好選択情報入
力部からの入力が時間であって、前記番号決定部に対し
て、時間帯番号を出力することを特徴とするもので、複
数の嗜好情報を選択する際に時間情報を利用することに
より、ユーザーの当該時間帯の嗜好に合わせて認識対象
語彙を絞り込むことにより音声認識性能を向上させると
いう作用を有する。
【0016】請求項7に記載の発明は、ユーザーの発声
する音声を入力する音声入力部と、ユーザーの嗜好を示
す嗜好番号を決定するための情報を入力する嗜好選択情
報入力部と、複数の音響テンプレートを記憶する音響テ
ンプレート記憶部と、前記音声入力部から入力される規
定語音声と前記音響テンプレート記憶部に記憶される全
ての音響テンプレートとの音声認識スコアを計算して最
も高いスコアを与える音響テンプレートを選択する音響
テンプレート選択部と、前記音響テンプレート記憶部に
記憶される音響テンプレートと前記嗜好情報記憶部に記
憶される嗜好情報の対応関係を記憶して選択された音響
テンプレートから嗜好番号を決定する番号決定部と、一
つまたは複数の嗜好情報を保持する嗜好情報記憶部と、
音声認識の対象とすべき全単語を格納する認識対象候補
語彙記憶部と、前記嗜好情報記憶部に格納されている嗜
好情報を嗜好番号によって選択し、選択された嗜好情報
に基づいて前記認識対象候補語彙記憶部に記憶される認
識対象候補語彙から認識対象語彙を作成する認識対象語
彙作成部と、前記音声入力部から入力される音声と前記
認識対象語彙作成部において作成された認識対象語彙と
の認識スコア計算を行う認識部と、前記認識部において
計算された認識スコアに基づいて認識結果を決定し出力
する認識結果決定部とを備えたもので、1つまたは複数
の嗜好情報を選択する際に、ユーザーの発声を用いて発
声に最も近い音響テンプレートを選択し、音響テンプレ
ートとの対応関係を基に嗜好情報を選択することによ
り、自動的にユーザーの嗜好を選択し、ユーザーの嗜好
に合わせて認識対象語彙を絞り込むことにより音声認識
性能を向上させるという作用を有する。
【0017】請求項8に記載の発明は、請求項7記載の
音声認識装置において、前記音響テンプレート選択部で
複数の音響テンプレートを選択し、前記番号決定部にお
いて複数の嗜好番号を決定して、前記認識対象語彙作成
部において複数の嗜好情報の内容を統合し、前記認識対
象候補語彙記憶部に記憶される認識対象候補語彙から認
識対象語彙を作成することを特徴とするもので、中間的
な発声が入力された場合に、ユーザーの発声に比較的近
い複数の音響テンプレートを選択して各テンプレートに
対する音声認識スコアによる重みも計算することによ
り、ユーザーの嗜好により合致した認識対象語彙を絞り
込みが行われ、音声認識性能を向上させるという作用を
有する。
【0018】請求項9に記載の発明は、請求項4記載の
音声認識装置において、前記認識対象語彙作成部におい
て選択された嗜好情報を入力として認識対象語彙につい
て嗜好重みを付与し、嗜好重みを得点化する嗜好得点作
成部を備え、前記認識部において計算された音声認識ス
コアと前記嗜好得点作成部において作成された嗜好得点
を入力として認識結果を決定する認識結果決定部を備え
ることを特徴とするもので、嗜好情報から作成した嗜好
得点も加味して認識結果を決定することにより、ユーザ
ーの嗜好に合わせて認識対象語彙を絞り込みかつにより
音声認識性能を向上させるという作用を有する。
【0019】請求項10に記載の発明は、請求項4から
7のいずれかに記載の音声認識装置をデジタルテレビ放
送や、オン・デ・マンド 映画/カラオケ配信サービス
を利用する時の番組指定装置に適用したもので、ユーザ
の嗜好にあった番組選択ができるという作用を有する。
【0020】請求項11に記載の発明は、請求項10記
載の番組指定装置において、ユーザーの嗜好情報は、電
子番組ガイドから好きまたは嫌いにより選択する学習方
法により生成することを特徴とするもので、好きまたは
嫌いの択一選択を嗜好情報の学習に使うことにより、容
易にユーザの嗜好にあった学習ができるという作用を有
する。
【0021】請求項12に記載の発明は、請求項9記載
の番組指定装置において、ユーザーの嗜好情報は電子番
組ガイドで提供されれる、時間帯、ジャンル、出演者も
しくは出演グループ名、番組名、番組内容、テーマ、音
楽、内容キーワード、ユーザー名、の少なくとも1つを
構成要素として持つことを特徴とするもので、嗜好情報
の内容を指定していすることにより、よりユーザの嗜好
にあった番組選択ができるという作用を有する。
【0022】請求項13に記載の発明は、請求項10か
ら12のいずれかに記載の番組指定装置において、番組
の嗜好情報を学習する際に、番組の視聴側による中断
時、番組の配信側による中断時、もしくは番組終了時に
嗜好の入力を促すことを特徴とするもので、装置がユー
ザーから嗜好情報を学習する際に、番組の切れ目などを
狙って、積極的に嗜好を尋ねることにより、よりユーザ
の嗜好にあった番組選択ができるという作用を有する。
【0023】以下に、本発明の実施の形態について図を
用いて説明する。
【0024】(実施の形態1)図1に本発明の実施の形
態1における番組指定装置のブロック構成図を示す。
【0025】図1において、1はユーザーの音声を入力
する音声入力部、2は嗜好情報を作成する嗜好情報作成
部、3は嗜好情報作成部2で作成された嗜好情報を保持
する嗜好情報記憶部、4は音声認識の対象語彙となりう
る全ての語彙を記憶している認識対象候補語彙記憶部、
5は認識対象候補語彙記憶部4に記憶されている認識対
象語彙の中から嗜好にあった語彙を選択してユーザーの
嗜好に合わせた認識対象語彙辞書を作成する認識対象語
彙作成部、6は音声入力部1から入力された音声と認識
対象語彙作成部5から認識対象語彙との音声認識スコア
を計算する認識部、7は認識部6で得られた認識得点は
最終的に出力する認識結果決定部、8は認識結果決定部
7で決まった信号を受けて、次の受信要求項目を決定す
るセットトップボックス、9はテレビ放送や電子番組ガ
イドを送信するデジタルテレビ放送、10は映画やカラ
オケ等の配信サービスを行うでオン・デ・マンド映画/
カラオケ配信サービス、11はビデオ、12はディスプ
レイモニタ、15は嗜好情報記憶部3に記憶される嗜好
情報が複数の場合にその中から嗜好情報を選択するため
の情報を入力する嗜好選択情報入力部、16は嗜好選択
情報入力部15からの入力を受けて嗜好番号を出力する
番号決定部である。
【0026】上記のように構成された番組選択装置の動
作について、以下に説明する。まず最初に、セットトッ
プボックス8は常時電源が投入されており、1日に1
度、オン・デ・マンド映画/カラオケ配信サービス10
から受信可能な番組名及び番組に関する情報を受信し
て、前記セットトップボックス8の内部に記憶すると同
時に、番組名については認識対象候補語彙記憶部4に送
るものとします。
【0027】嗜好選択情報入力部15へ入力される嗜好
選択情報は、ユーザーが装置に付随するリモコンのボタ
ンで入力するユーザー番号、もしくは内蔵の時計から出
力される時刻情報であって、嗜好情報記憶部3に複数記
憶される嗜好情報を選択するための情報である。
【0028】番号決定部16は、前記嗜好選択情報入力
部15へ入力される嗜好選択情報を基に、(表1)、
(表2)に示した表に沿って、前記嗜好選択情報入力部
15からの入力を受けて嗜好番号を出力する。
【0029】
【表1】
【0030】
【表2】
【0031】なお、前記嗜好情報記憶部3に記憶されて
いる嗜好情報が1つの場合でも実施の形態の効果に変わ
りはなく、前記嗜好情報記憶部3に記憶されている嗜好
情報が1つの場合には前記嗜好選択情報入力部15は入
力にかかわらず常に同一信号を出しつづけている。
【0032】認識対象語彙作成部5は、前記番号決定部
16からの嗜好番号を基に嗜好情報記憶部3から嗜好情
報を引き出し、認識対象候補語彙記憶部4に記憶されて
いる認識対象語彙の中から嗜好にあった語彙を選択して
ユーザーの嗜好に合わせた認識対象語彙辞書を作成す
る。認識対象語彙作成部5では、嗜好情報記憶部3に格
納される嗜好情報から語に対して点数付けを行い、点数
閾値を用いて閾値よりも点数が高い語を選択する。
【0033】なお、語数を予め決めておいて、上位の方
から決まった語数を選ぶ場合でも同様の効果が得られ
る。
【0034】こうして準備されている装置に対して、ユ
ーザーはオン・デ・マンド映画/カラオケ配信サービス
10から選択したい番組名を音声で音声入力部1より指
定する。
【0035】認識部6は、音声入力部1から入力された
音声に対して、選択作成されたユーザーの嗜好に合わせ
た認識対象語彙辞書に対して音声認識を実施し、音声認
識スコアを計算する。認識結果決定部7は、認識部6で
得られた認識得点を受け、最終的に出力する信号が決め
る。
【0036】セットトップボックス8は、認識結果決定
部7で決まった信号を受けて、次の受信要求項目を決定
する。ここでは、セットトップボックス8はオン・デ・
マンド映画/カラオケ配信サービス10に対して受信要
求を出す、もしくは受信した画像や音声をディスプレイ
モニタ12に送る役割を果たしている。
【0037】この構成により、オン・デ・マンド映画/
カラオケ配信サービス10の配信可能なメニューが例え
数百万番組あった場合でも、ユーザーの嗜好に合わせて
音声認識対象語彙を絞り込んだ音声認識装置を使用し
て、受信要求する番組を音声選択することにより、対象
語彙を絞り込まない番組選択システムと比較して、短時
間のうちに、言い直しなく受信要求番組を選択すること
ができる。
【0038】なお、認識対象候補語彙記憶部4に記憶さ
れる認識対象語彙がデジタルテレビ放送9から送信され
る電子番組ガイドであって、セットトップボックス8が
外部から受信する番組情報が、デジタルテレビ放送9で
放送される電子番組ガイドであって、要求を出す対象が
ビデオ11で、出す要求内容が録画予約であっても同様
の効果が得られる。
【0039】嗜好情報作成部2での学習方法は、ユーザ
ーの好き・嫌いの入力を用いた情報フィルタを使用する
もので、例えば特開平9−288683号公報の学習方
法が知られている。以下に嗜好情報作成部2での学習方
法について、嗜好学習の流れ図を図2に示し以下に説明
する。
【0040】S01はユーザーの音声入力ステップ、S02は
ユーザー音声の認識スコア計算を行う認識ステップ、S0
3はスコア比較を行う認識結果決定ステップ、S04は決ま
った認識結果に沿って番組を視聴する番組視聴ステッ
プ、S05は視聴している番組について、ユーザーからの
嗜好反応を判断する嗜好判定ステップ、S06は判定され
た内容に沿って嗜好を学習する嗜好学習ステップであ
る。
【0041】S01でユーザーによる音声入力が行われ、S
02で音声認識が行われる。S03で音声認識の結果が決定
され、S04ではS03で決定された番組を視聴する。S05で
は番組を視聴しているユーザーの行動に応じた嗜好の判
定を行う。すなわち、10分が経過する前にチャンネルを
変えたら、当該番組はユーザーが気に入らなかったもの
と判断して、当該番組の(表3)の電子番組ガイドに付与
された語に「嫌い」の符号をつけて嗜好学習ステップS0
6に渡す。
【0042】
【表3】
【0043】例えば、10分を経過しても視聴しつづけて
いるようならば、当該番組はユーザーが気に入ったと判
断して、当該番組の(表3)の電子番組ガイドに付与され
た語に「好き」の符号をつけて嗜好学習ステップS06に
渡す。嗜好学習ステップS06では嗜好判断ステップS05で
判断された内容に沿って、嗜好を学習する。
【0044】なお、番組の中のコマーシャルやニュース
などの割り込み別放送など最初の中断時もしくは、チャ
ンネルを変更する、番組が終るなどの視聴終了時に、セ
ットトップボックス側から「ただいまの番組は如何でし
たか?好き、嫌いのどちらかでお答えください。」と問
い掛けて、(表3)の電子番組ガイドに付与された語に
ついて得られた回答情報「好き」もしくは「嫌い」1件
として嗜好情報作成部2に送る方法でも同様の効果が得
られる。
【0045】(実施の形態2)図3に本発明の実施の形
態2における番組指定装置のブロック構成図を示す。実
施の形態2で説明する番組指定装置は、実施の形態1の
番組指定装置を部分的に変更したものであり、実施の形
態1の構成と異なる部分について説明する。
【0046】嗜好情報記憶部3には、複数の嗜好情報が
記憶されている。嗜好情報記憶部3に記憶されている嗜
好情報が複数であるために、どの嗜好情報を選択するか
を決めるために、音響テンプレート記憶部13に記憶さ
れている複数の音響テンプレートから、音声入力部1か
ら入力されるユーザーの発声に近いものを音響テンプレ
ート選択部14で選択する。
【0047】実施の形態2の装置の場合、音響テンプレ
ートを選択するための発声は、「番組」という言葉にな
っている。音響テンプレート選択部14は「番組」とい
う決まった言葉を待ち受けていて、正確に発声されたと
いう前提の基でユーザーの発声と一番近い音響テンプレ
ートを選択する。音響テンプレート選択部14では、一
単語認識処理を全ての音響テンプレートに対して行い、
一番スコアが高かったものを選択する。こうして選択さ
れた音響テンプレート番号は、番号決定部16におい
て、(表4)で関連付けられた嗜好情報の番号決定に使
われる。
【0048】
【表4】
【0049】番号決定部16で決まった嗜好情報番号
は、認識対象語彙作成部5に送られて、嗜好情報記憶部
3に記憶されている複数の嗜好情報から引き出す嗜好情
報を指定する。
【0050】なお、番号決定部16において嗜好番号を
決定するための情報は、音響テンプレート選択部14で
決められる音響テンプレート番号ではなくて、嗜好選択
情報入力部15から入力される構成とし、嗜好情報入力
部15でユーザーの顔画像を用いてユーザー番号を判定
して番号決定部16へ送り、(表2)に基づいて嗜好番
号を決定しても同様の効果が得られる。
【0051】また、番号決定部16において嗜好番号を
決定するための情報は、音響テンプレート選択部14で
決められる音響テンプレート番号ではなくて、嗜好選択
情報入力部15から入力される構成とし、嗜好選択情報
入力部15への入力を内蔵の時計から得られる時刻とし
て、前記嗜好選択情報入力部15において時間帯番号を
判定、判定された時間帯番号を番号決定部16に送り
(表2)に基づいて嗜好番号を決定しても同様の効果が
得られる。
【0052】(実施の形態3)図3に本発明の実施の形
態3における番組指定装置のブロック構成図を示す。実
施の形態3で説明する番組指定装置は、実施の形態1の
番組指定装置を部分的に変更したものであり、実施の形
態1と異なる部分について説明する。
【0053】ユーザーの発声は、音声入力部1から装置
に入力され、認識部6で音声認識処理を行って、認識得
点が認識結果決定部7に送られる。実施の形態1と異な
るのは、ここで認識結果を決定するための材料が音声認
識による認識得点だけではなくて、ユーザーの嗜好情報
から決定される嗜好得点も加味して決められることであ
る。
【0054】認識部6で音声認識に使われる語彙は、認
識対象語彙作成部5において、認識対象候補語彙記憶部
4に記憶される全ての語の中から、嗜好情報記憶部3に
記憶されている嗜好情報に基づいて語に得点をつけて点
数閾値よりも上位の語が選択される。選択時に付与した
嗜好情報に基づく得点のうち、認識対象語彙に選ばれた
語の得点については嗜好得点計算部17において、各語
の点数からあらかじめ点数閾値としていた数値を引き去
って、最低嗜好得点が0となるように計算しなおし、認
識結果決定部7へ送る。
【0055】認識結果決定部7では、認識部6から受け
取った音声認識の認識得点と、嗜好得点計算部18から
受け取った嗜好得点とを合算した上で、一番得点が高い
ものを最終結果としてセットトップボックス8へ出力す
る。
【0056】なお、嗜好得点計算部18において、嗜好
得点から一定値を引き去る処理を行う代わりに、正規化
処理を行っても、同様の効果が得られる。
【0057】
【発明の効果】本発明によれば、声認識の対象とすべき
全単語を格納した認識対象候補語彙から予め取得したユ
ーザーの嗜好情報に基づいた認識対象語彙を予め作成
し、入力される音声と認識対象語彙とから単語を認識す
ることを特徴とするもので、ユーザーの嗜好に合わせて
認識対象語彙を少ないユーザ操作で絞り込むことによ
り、音声認識性能を向上させるという有利な効果が得ら
れる。
【0058】また、番組指定装置に適用した場合は、ユ
ーザの嗜好にあった番組選択ができるという有利な効果
が得られる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における番組選択装置の
ブロック構成図
【図2】実施の形態1の嗜好学習の流れ図
【図3】本発明の実施の形態2における番組選択装置の
ブロック構成図
【図4】本発明の実施の形態3における番組選択装置の
ブロック構成図
【図5】従来の音声認識装置のブロック構成図
【符号の説明】
1 音声入力部 2 嗜好情報作成部 3 嗜好情報記憶部 4 認識対象候補語彙記憶部 5 認識対象語彙作成部 6 認識部 7 認識結果決定部 8 セットトップボックス 9 デジタルテレビ放送 10 オン・デ・マンド 映画/カラオケ配信サービス 11 ビデオ 12 ディスプレイモニター 13 音響テンプレート記憶部 14 音響テンプレート選択部 15 嗜好選択情報入力部 16 番号決定部 17 嗜好得点計算部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 大野 剛男 神奈川県川崎市多摩区東三田3丁目10番1 号 松下技研株式会社内 Fターム(参考) 5C018 HA10 5C025 AA23 CB08 DA01 DA05 5C061 BB07 5D015 GG01 KK01 9A001 BB04 DD11 FF03 HH17 JJ75 KK62

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 音声認識の対象とすべき全単語を格納し
    た認識対象候補語彙から予め取得したユーザーの嗜好情
    報に基づいた認識対象語彙を予め作成し、入力される音
    声と認識対象語彙とから単語を認識することを特徴とす
    る音声認識方法。
  2. 【請求項2】 ユーザーの嗜好情報は、電子番組ガイド
    から好きまたは嫌いの少なくとも一つを用いて学習する
    ことにより生成することを特徴とする請求項1記載の音
    声認識方法。
  3. 【請求項3】 予め取得したユーザーの嗜好情報に基づ
    いた認識対象語彙の嗜好得点と、音声認識によって得ら
    れる距離とを使用して認識結果を決定することを特徴と
    する請求項1または2記載の音声認識方法。
  4. 【請求項4】 ユーザーの発声する音声を入力する音声
    入力部と、ユーザーの嗜好を示す嗜好番号を決定するた
    めの情報を入力する嗜好選択情報入力部と、前記嗜好選
    択情報入力部からの入力を受けて現在使っているユーザ
    ーのための嗜好番号を決定する番号決定部と、一つまた
    は複数の嗜好情報を保持する嗜好情報記憶部と、音声認
    識の対象とすべき全単語を格納する認識対象候補語彙記
    憶部と、前記嗜好情報記憶部に格納されている嗜好情報
    を嗜好番号によって選択し、選択された嗜好情報に基づ
    いて前記認識対象候補語彙記憶部に記憶される認識対象
    候補語彙から認識対象語彙を作成する認識対象語彙作成
    部と、前記音声入力部から入力される音声と前記認識対
    象語彙作成部において作成された認識対象語彙との認識
    スコア計算を行う認識部と、前記認識部において計算さ
    れた認識スコアに基づいて認識結果を決定し出力する認
    識結果決定部とを備えることを特徴とする音声認識装
    置。
  5. 【請求項5】 番号決定部は、嗜好選択情報入力部から
    の入力がユーザー識別記号であって、前記番号決定部に
    対してユーザー番号を出力することを特徴とする請求項
    4記載の音声認識装置。
  6. 【請求項6】 番号決定部は、嗜好選択情報入力部から
    の入力が時間であって、前記番号決定部に対して、時間
    帯番号を出力することを特徴とする請求項4記載の音声
    認識装置。
  7. 【請求項7】 ユーザーの発声する音声を入力する音声
    入力部と、ユーザーの嗜好を示す嗜好番号を決定するた
    めの情報を入力する嗜好選択情報入力部と、複数の音響
    テンプレートを記憶する音響テンプレート記憶部と、前
    記音声入力部から入力される規定語音声と前記音響テン
    プレート記憶部に記憶される全ての音響テンプレートと
    の音声認識スコアを計算して最も高いスコアを与える音
    響テンプレートを選択する音響テンプレート選択部と、
    前記音響テンプレート記憶部に記憶される音響テンプレ
    ートと前記嗜好情報記憶部に記憶される嗜好情報の対応
    関係を記憶して選択された音響テンプレートから嗜好番
    号を決定する番号決定部、一つまたは複数の嗜好情報を
    保持する嗜好情報記憶部と、音声認識の対象とすべき全
    単語を格納する認識対象候補語彙記憶部と、前記嗜好情
    報記憶部に格納されている嗜好情報を嗜好番号によって
    選択し、選択された嗜好情報に基づいて前記認識対象候
    補語彙記憶部に記憶される認識対象候補語彙から認識対
    象語彙を作成する認識対象語彙作成部と、前記音声入力
    部から入力される音声と前記認識対象語彙作成部におい
    て作成された認識対象語彙との認識スコア計算を行う認
    識部と、前記認識部において計算された認識スコアに基
    づいて認識結果を決定し出力する認識結果決定部とを備
    えることを特徴とする音声認識装置。
  8. 【請求項8】 前記音響テンプレート選択部で複数の音
    響テンプレートを選択し、前記番号決定部において複数
    の嗜好番号を決定して、前記認識対象語彙作成部におい
    て複数の嗜好情報の内容を統合し、前記認識対象候補語
    彙記憶部に記憶される認識対象候補語彙から認識対象語
    彙を作成することを特徴とする請求項7記載の音声認識
    装置。
  9. 【請求項9】 前記認識対象語彙作成部において、選択
    された嗜好情報を入力として認識対象語彙について嗜好
    重みを付与し、嗜好重みを得点化する嗜好得点作成部を
    備え、前記認識部において計算された音声認識スコアと
    前記嗜好得点作成部において作成された嗜好得点を入力
    として認識結果を決定する認識結果決定部を備えること
    を特徴とする請求項4記載の音声認識装置。
  10. 【請求項10】 請求項4から7のいずれかに記載の音
    声認識装置を用いて、番組指定をすることを特徴とする
    番組指定装置。
  11. 【請求項11】 ユーザーの嗜好情報は、電子番組ガイ
    ドから好きまたは嫌いにより選択する学習方法により生
    成することを特徴とする請求項10記載の番組指定装
    置。
  12. 【請求項12】 ユーザーの嗜好情報は電子番組ガイド
    で提供されれる、時間帯、ジャンル、出演者もしくは出
    演グループ名、番組名、番組内容、テーマ、音楽、内容
    キーワード、ユーザー名、の少なくとも1つを構成要素
    として持つことを特徴とする請求項9記載の番組指定装
    置。
  13. 【請求項13】 番組の嗜好情報を学習する際に、番組
    の視聴側による中断時、番組の配信側による中断時、も
    しくは番組終了時に嗜好の入力を促すことを特徴とする
    請求項10から12のいずれかに記載の番組指定装置。
JP2000097336A 2000-03-31 2000-03-31 音声認識方法及び音声認識装置 Expired - Lifetime JP3525855B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000097336A JP3525855B2 (ja) 2000-03-31 2000-03-31 音声認識方法及び音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000097336A JP3525855B2 (ja) 2000-03-31 2000-03-31 音声認識方法及び音声認識装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003337213A Division JP2004120767A (ja) 2003-09-29 2003-09-29 番組指定方法及び番組指定装置

Publications (3)

Publication Number Publication Date
JP2001282285A true JP2001282285A (ja) 2001-10-12
JP3525855B2 JP3525855B2 (ja) 2004-05-10
JP2001282285A5 JP2001282285A5 (ja) 2004-08-19

Family

ID=18611970

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000097336A Expired - Lifetime JP3525855B2 (ja) 2000-03-31 2000-03-31 音声認識方法及び音声認識装置

Country Status (1)

Country Link
JP (1) JP3525855B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004054246A1 (ja) * 2002-12-12 2004-06-24 Sony Corporation 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP2010085522A (ja) * 2008-09-30 2010-04-15 Kddi Corp 音声認識処理機能を用いたコンテンツ検索装置、プログラム及び方法
WO2010116785A1 (ja) * 2009-04-06 2010-10-14 三菱電機株式会社 検索装置
JP2013068783A (ja) * 2011-09-22 2013-04-18 Toshiba Corp 音声認識装置、音声認識方法およびプログラム
CN107454511A (zh) * 2012-08-31 2017-12-08 杜比实验室特许公司 用于使声音从观看屏幕或显示表面反射的扬声器

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113614713A (zh) * 2021-06-29 2021-11-05 华为技术有限公司 一种人机交互方法及装置、设备及车辆

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62262898A (ja) * 1986-05-09 1987-11-14 株式会社リコー 音声認識装置
JPH07319494A (ja) * 1994-05-23 1995-12-08 Nec Robotics Eng Ltd 大語彙音声認識装置
JPH09288683A (ja) * 1995-09-04 1997-11-04 Matsushita Electric Ind Co Ltd 情報フィルタ装置及び情報フィルタリング方法
JPH09292896A (ja) * 1996-04-24 1997-11-11 Denso Corp 車両用ナビゲーション装置
JPH11305790A (ja) * 1998-04-23 1999-11-05 Denso Corp 音声認識装置
WO2000011571A1 (en) * 1998-08-24 2000-03-02 Bcl Computers, Inc. Adaptive natural language interface
WO2000049599A1 (fr) * 1999-02-19 2000-08-24 Sony Corporation Traducteur de sons vocaux, procede de traduction de sons vocaux et support d'enregistrement sur lequel est enregistre un programme de commande de traduction de sons vocaux
JP2001142481A (ja) * 1999-08-26 2001-05-25 Matsushita Electric Ind Co Ltd 音声/ビデオ装置用の制御システム及び音声/ビデオ構成を制御するための統合アクセスシステム
JP2001169269A (ja) * 1999-08-26 2001-06-22 Matsushita Electric Ind Co Ltd インターネット上でテレビジョンに関連した情報にアクセスするためのシステム及び方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62262898A (ja) * 1986-05-09 1987-11-14 株式会社リコー 音声認識装置
JPH07319494A (ja) * 1994-05-23 1995-12-08 Nec Robotics Eng Ltd 大語彙音声認識装置
JPH09288683A (ja) * 1995-09-04 1997-11-04 Matsushita Electric Ind Co Ltd 情報フィルタ装置及び情報フィルタリング方法
JPH09292896A (ja) * 1996-04-24 1997-11-11 Denso Corp 車両用ナビゲーション装置
JPH11305790A (ja) * 1998-04-23 1999-11-05 Denso Corp 音声認識装置
WO2000011571A1 (en) * 1998-08-24 2000-03-02 Bcl Computers, Inc. Adaptive natural language interface
WO2000049599A1 (fr) * 1999-02-19 2000-08-24 Sony Corporation Traducteur de sons vocaux, procede de traduction de sons vocaux et support d'enregistrement sur lequel est enregistre un programme de commande de traduction de sons vocaux
JP2001142481A (ja) * 1999-08-26 2001-05-25 Matsushita Electric Ind Co Ltd 音声/ビデオ装置用の制御システム及び音声/ビデオ構成を制御するための統合アクセスシステム
JP2001169269A (ja) * 1999-08-26 2001-06-22 Matsushita Electric Ind Co Ltd インターネット上でテレビジョンに関連した情報にアクセスするためのシステム及び方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101007839B1 (ko) * 2002-12-12 2011-01-13 소니 주식회사 정보 처리 장치 및 정보 처리 방법, 기록 매체, 및프로그램
US7577645B2 (en) 2002-12-12 2009-08-18 Sony Corporation Information processing device and information processing method, recording medium, and computer program
US7587382B2 (en) 2002-12-12 2009-09-08 Sony Corporation Information processing apparatus and information processing method, recording medium, and program
CN100566387C (zh) * 2002-12-12 2009-12-02 索尼株式会社 信息处理设备和信息处理方法,记录介质及程序
KR101029740B1 (ko) 2002-12-12 2011-04-19 소니 주식회사 정보 처리 장치 및 정보 처리 방법 및 기록 매체
WO2004054246A1 (ja) * 2002-12-12 2004-06-24 Sony Corporation 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP2010085522A (ja) * 2008-09-30 2010-04-15 Kddi Corp 音声認識処理機能を用いたコンテンツ検索装置、プログラム及び方法
WO2010116785A1 (ja) * 2009-04-06 2010-10-14 三菱電機株式会社 検索装置
JP5300974B2 (ja) * 2009-04-06 2013-09-25 三菱電機株式会社 検索装置
US8983847B2 (en) 2011-09-22 2015-03-17 Kabushiki Kaisha Toshiba Voice recognition apparatus, method, and computer program product
JP2013068783A (ja) * 2011-09-22 2013-04-18 Toshiba Corp 音声認識装置、音声認識方法およびプログラム
CN107454511A (zh) * 2012-08-31 2017-12-08 杜比实验室特许公司 用于使声音从观看屏幕或显示表面反射的扬声器
US11277703B2 (en) 2012-08-31 2022-03-15 Dolby Laboratories Licensing Corporation Speaker for reflecting sound off viewing screen or display surface
CN107454511B (zh) * 2012-08-31 2024-04-05 杜比实验室特许公司 用于使声音从观看屏幕或显示表面反射的扬声器

Also Published As

Publication number Publication date
JP3525855B2 (ja) 2004-05-10

Similar Documents

Publication Publication Date Title
US11798528B2 (en) Systems and methods for providing notifications within a media asset without breaking immersion
US6324512B1 (en) System and method for allowing family members to access TV contents and program media recorder over telephone or internet
CN108063969B (zh) 显示设备、控制显示设备的方法、服务器以及控制服务器的方法
JP3554262B2 (ja) テレビジョン及びマルチメディアの検索及び要求に対して自然言語のモダリティーを可能にする汎用遠隔制御
US6480819B1 (en) Automatic search of audio channels by matching viewer-spoken words against closed-caption/audio content for interactive television
US7519534B2 (en) Speech controlled access to content on a presentation medium
US7437290B2 (en) Automatic censorship of audio data for broadcast
US20070118382A1 (en) Information processing apparatus and information processing method
US8260108B2 (en) Recording and reproduction apparatus and recording and reproduction method
CN111433845A (zh) 在会话的上下文中推荐内容的方法和系统
JP4869268B2 (ja) 音響モデル学習装置およびプログラム
JP5149107B2 (ja) 音響処理装置およびプログラム
KR20050023941A (ko) 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법
JP2001103402A (ja) 記録されたテレビジョン放送についての情報を記憶するための機構
JP2002320159A (ja) 番組推薦システムおよび番組推薦方法
JP3799280B2 (ja) 対話システムおよびその制御方法
EP1079615A2 (en) System for identifying and adapting a TV-user profile by means of speech technology
JP2000250575A (ja) 双方向性テレビ受像機を自動的に選局するための音声理解装置およびその方法
JPWO2003030150A1 (ja) 会話装置、会話親機装置、会話子機装置、会話制御方法、および会話制御プログラム
WO2019155717A1 (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
US20030191629A1 (en) Interface apparatus and task control method for assisting in the operation of a device using recognition technology
JP2001282285A (ja) 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置
JP6772916B2 (ja) 対話装置および対話方法
JP7131077B2 (ja) 会話装置、ロボット、会話装置制御方法及びプログラム
JP2001282285A5 (ja)

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20031210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040209

R151 Written notification of patent or utility model registration

Ref document number: 3525855

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080227

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090227

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100227

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100227

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110227

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120227

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140227

Year of fee payment: 10

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term