JP2001282285A - 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置 - Google Patents
音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置Info
- Publication number
- JP2001282285A JP2001282285A JP2000097336A JP2000097336A JP2001282285A JP 2001282285 A JP2001282285 A JP 2001282285A JP 2000097336 A JP2000097336 A JP 2000097336A JP 2000097336 A JP2000097336 A JP 2000097336A JP 2001282285 A JP2001282285 A JP 2001282285A
- Authority
- JP
- Japan
- Prior art keywords
- preference
- recognition
- unit
- vocabulary
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
象語彙を少ないユーザ操作で絞り込むことにより、音声
認識性能を向上を図ることを目的とする。 【解決手段】 嗜好選択情報入力部15、番号決定部1
6、嗜好情報記憶部3を設け、前記嗜好選択情報入力部
15からの入力に基づいて前記番号決定部16で決定さ
れた嗜好番号に該当する前記嗜好情報記憶部に記憶され
る嗜好情報を基に、認識対象語彙作成部5において認識
対象候補語彙記憶部4からユーザーの嗜好を反映した認
識対象語彙を作成し、音声入力部1から入力される音声
と認識対象語彙の音声認識スコアを認識部6において計
算し、認識結果が決定する。また嗜好情報は、電子番組
ガイドから作成され、認識結果は接続されているセット
トップボックス8に番組指定信号が出力される。
Description
択にユーザーの嗜好を反映させる音声認識方法及び音声
認識装置、並びにそれを用いた番組指定装置に関わる。
としては、例えば特開平7−319494号公報に音声
認識の対象となる複数の単語を予め定義された複数のジ
ャンルに分けて記憶し、予め認識させるジャンルの辞書
ファイルを辞書メモリに展開しておくというものであ
る。
し、以下に説明する。音声認識を開始する前に、音声認
識の対象となる複数の単語を予め定義された複数のジャ
ンルに分けて単語セット50として記憶し、辞書生成部
51により複数の単語セット50を音声特徴を抽出して
辞書ファイル52にに記憶させ、音声入力の前に辞書ロ
ード部53は辞書ロード指示部54の指示された辞書フ
ァイル52を辞書メモリ55にロードする。
音声特徴抽出部57により音声特徴が抽出され、比較照
合部58は入力音声された音声特徴と辞書メモリ55か
らの音声特徴とを比較照合して入力音声に対する単語を
認識結果として出力するものである。
の従来技術を用いても認識対象語彙は、予め定めたジャ
ンルに従って作成されるためにユーザの意図としたもの
とは限らず、さらに定められたジャンルが変わるたびに
辞書ファイルをロードを繰り返すことが必要となり、ユ
ーザーの意図に合った音声認識結果を得るためにはユー
ザー操作が増えるなどの課題があった。
対象語彙を少ないユーザ操作で絞り込むことにより、音
声認識性能を向上を図ることを目的とする。
に本発明は、音声認識の対象とすべき全単語を格納した
認識対象候補語彙から予め取得したユーザーの嗜好情報
に基づいた認識対象語彙を予め作成し、入力される音声
と認識対象語彙とから単語を認識することを特徴とする
方法を取るものである。
を装置に入力するための音声入力部と、ユーザーの嗜好
情報を選択するための情報を入力するための嗜好選択情
報入力部と、ユーザーの嗜好情報を示す嗜好番号を決定
する番号決定部と、一つまたは複数の嗜好情報を保持す
る嗜好情報記憶部と、音声認識の対象とすべき全単語を
格納する認識対象候補語彙記憶部と、前記嗜好情報記憶
部に格納されている嗜好情報を嗜好番号に応じて参照
し、前記認識対象候補語彙記憶部に記憶される認識対象
候補語彙から、参照する嗜好情報に基づいて認識対象語
彙を作成する認識対象語彙作成部と、前記音声入力部か
ら入力される音声と前記認識対象語彙作成部において作
成された認識対象語彙との音声認識スコアの計算を行う
認識部と、前記認識部において計算されたスコアに基づ
いて認識結果を決定する認識結果決定部とを備えるもの
である。
認識対象語彙が選ばれ、従来例よりも誤りが少なく、よ
り多くの場合にユーザーの意図する結果を出力すること
ができる音声認識方法及び音声認識装置を提供すること
ができる。
は、音声認識の対象とすべき全単語を格納した認識対象
候補語彙から予め取得したユーザーの嗜好情報に基づい
た認識対象語彙を予め作成し、入力される音声と認識対
象語彙とから単語を認識することを特徴とするもので、
ユーザーの嗜好に合わせて認識対象語彙を絞り込むこと
により音声認識性能を向上させるという作用を有する。
また、認識対象候補となりうる全語彙を対象に音声認識
を行うよりも処理が簡便で早くなる方法である。
音声認識方法において、ユーザーの嗜好情報は、電子番
組ガイドから好きまたは嫌いの少なくとも一つを用いて
学習することにより生成することを特徴とするもので、
本発明の嗜好情報の学習に関わるものであり、好きまた
は嫌いの単純択一を使用することにより、ユーザーに負
担をかけずに嗜好を学習することができるという作用を
有する。さらに、好きまたは嫌いを利用した学習を用い
ることにより、音声操作の即動性、取り扱いの簡便性を
損なうことなく嗜好情報を学習することができる。
2記載の音声認識方法において、予め取得したユーザー
の嗜好情報に基づいた認識対象語彙の嗜好得点と、音声
認識によって得られる距離とを使用して認識結果を決定
することを特徴とするもので、音声認識のスコアに嗜好
の得点も加味することにより、ユーザーがより発声しそ
うな内容に重みをつけて結果を出力して、ユーザーの全
く意図しない結果を出現させるケースを大幅に低減する
と同時に、意図する結果を高い確率で出現させるという
作用を有する。
すべき全単語からユーザーの嗜好に合わせた認識対象単
語を絞り込んで音声認識を行う認識装置であって、ユー
ザーの発声する音声を入力する音声入力部と、ユーザー
の嗜好を示す嗜好番号を決定するための情報を入力する
嗜好選択情報入力部と、前記嗜好選択情報入力部からの
入力を受けて現在使っているユーザーのための嗜好番号
を決定する番号決定部と、一つまたは複数の嗜好情報を
保持する嗜好情報記憶部と、音声認識の対象とすべき全
単語を格納する認識対象候補語彙記憶部と、前記嗜好情
報記憶部に格納されている嗜好情報を嗜好番号によって
選択し、選択された嗜好情報に基づいて前記認識対象候
補語彙記憶部に記憶される認識対象候補語彙から認識対
象語彙を作成する認識対象語彙作成部と、前記音声入力
部から入力される音声と前記認識対象語彙作成部におい
て作成された認識対象語彙との認識スコア計算を行う認
識部と、前記認識部において計算された認識スコアに基
づいて認識結果を決定し出力する認識結果決定部とを備
えたもので、ユーザーの嗜好に合わせて認識対象語彙を
絞り込むことにより音声認識性能を向上させるという作
用を有する。
声認識装置において、番号決定部は、嗜好選択情報入力
部からの入力がユーザー識別記号であって、前記番号決
定部に対してユーザー番号を出力することを特徴とする
もので、1つまたは複数の嗜好情報から認識対象語彙選
択に使用する嗜好情報を選択することにより、ユーザー
の嗜好に合わせて認識対象語彙を絞り込むことにより音
声認識性能を向上させるという作用を有する。
音声認識装置において、番号決定部への嗜好選択情報入
力部からの入力が時間であって、前記番号決定部に対し
て、時間帯番号を出力することを特徴とするもので、複
数の嗜好情報を選択する際に時間情報を利用することに
より、ユーザーの当該時間帯の嗜好に合わせて認識対象
語彙を絞り込むことにより音声認識性能を向上させると
いう作用を有する。
する音声を入力する音声入力部と、ユーザーの嗜好を示
す嗜好番号を決定するための情報を入力する嗜好選択情
報入力部と、複数の音響テンプレートを記憶する音響テ
ンプレート記憶部と、前記音声入力部から入力される規
定語音声と前記音響テンプレート記憶部に記憶される全
ての音響テンプレートとの音声認識スコアを計算して最
も高いスコアを与える音響テンプレートを選択する音響
テンプレート選択部と、前記音響テンプレート記憶部に
記憶される音響テンプレートと前記嗜好情報記憶部に記
憶される嗜好情報の対応関係を記憶して選択された音響
テンプレートから嗜好番号を決定する番号決定部と、一
つまたは複数の嗜好情報を保持する嗜好情報記憶部と、
音声認識の対象とすべき全単語を格納する認識対象候補
語彙記憶部と、前記嗜好情報記憶部に格納されている嗜
好情報を嗜好番号によって選択し、選択された嗜好情報
に基づいて前記認識対象候補語彙記憶部に記憶される認
識対象候補語彙から認識対象語彙を作成する認識対象語
彙作成部と、前記音声入力部から入力される音声と前記
認識対象語彙作成部において作成された認識対象語彙と
の認識スコア計算を行う認識部と、前記認識部において
計算された認識スコアに基づいて認識結果を決定し出力
する認識結果決定部とを備えたもので、1つまたは複数
の嗜好情報を選択する際に、ユーザーの発声を用いて発
声に最も近い音響テンプレートを選択し、音響テンプレ
ートとの対応関係を基に嗜好情報を選択することによ
り、自動的にユーザーの嗜好を選択し、ユーザーの嗜好
に合わせて認識対象語彙を絞り込むことにより音声認識
性能を向上させるという作用を有する。
音声認識装置において、前記音響テンプレート選択部で
複数の音響テンプレートを選択し、前記番号決定部にお
いて複数の嗜好番号を決定して、前記認識対象語彙作成
部において複数の嗜好情報の内容を統合し、前記認識対
象候補語彙記憶部に記憶される認識対象候補語彙から認
識対象語彙を作成することを特徴とするもので、中間的
な発声が入力された場合に、ユーザーの発声に比較的近
い複数の音響テンプレートを選択して各テンプレートに
対する音声認識スコアによる重みも計算することによ
り、ユーザーの嗜好により合致した認識対象語彙を絞り
込みが行われ、音声認識性能を向上させるという作用を
有する。
音声認識装置において、前記認識対象語彙作成部におい
て選択された嗜好情報を入力として認識対象語彙につい
て嗜好重みを付与し、嗜好重みを得点化する嗜好得点作
成部を備え、前記認識部において計算された音声認識ス
コアと前記嗜好得点作成部において作成された嗜好得点
を入力として認識結果を決定する認識結果決定部を備え
ることを特徴とするもので、嗜好情報から作成した嗜好
得点も加味して認識結果を決定することにより、ユーザ
ーの嗜好に合わせて認識対象語彙を絞り込みかつにより
音声認識性能を向上させるという作用を有する。
7のいずれかに記載の音声認識装置をデジタルテレビ放
送や、オン・デ・マンド 映画/カラオケ配信サービス
を利用する時の番組指定装置に適用したもので、ユーザ
の嗜好にあった番組選択ができるという作用を有する。
載の番組指定装置において、ユーザーの嗜好情報は、電
子番組ガイドから好きまたは嫌いにより選択する学習方
法により生成することを特徴とするもので、好きまたは
嫌いの択一選択を嗜好情報の学習に使うことにより、容
易にユーザの嗜好にあった学習ができるという作用を有
する。
の番組指定装置において、ユーザーの嗜好情報は電子番
組ガイドで提供されれる、時間帯、ジャンル、出演者も
しくは出演グループ名、番組名、番組内容、テーマ、音
楽、内容キーワード、ユーザー名、の少なくとも1つを
構成要素として持つことを特徴とするもので、嗜好情報
の内容を指定していすることにより、よりユーザの嗜好
にあった番組選択ができるという作用を有する。
ら12のいずれかに記載の番組指定装置において、番組
の嗜好情報を学習する際に、番組の視聴側による中断
時、番組の配信側による中断時、もしくは番組終了時に
嗜好の入力を促すことを特徴とするもので、装置がユー
ザーから嗜好情報を学習する際に、番組の切れ目などを
狙って、積極的に嗜好を尋ねることにより、よりユーザ
の嗜好にあった番組選択ができるという作用を有する。
用いて説明する。
態1における番組指定装置のブロック構成図を示す。
する音声入力部、2は嗜好情報を作成する嗜好情報作成
部、3は嗜好情報作成部2で作成された嗜好情報を保持
する嗜好情報記憶部、4は音声認識の対象語彙となりう
る全ての語彙を記憶している認識対象候補語彙記憶部、
5は認識対象候補語彙記憶部4に記憶されている認識対
象語彙の中から嗜好にあった語彙を選択してユーザーの
嗜好に合わせた認識対象語彙辞書を作成する認識対象語
彙作成部、6は音声入力部1から入力された音声と認識
対象語彙作成部5から認識対象語彙との音声認識スコア
を計算する認識部、7は認識部6で得られた認識得点は
最終的に出力する認識結果決定部、8は認識結果決定部
7で決まった信号を受けて、次の受信要求項目を決定す
るセットトップボックス、9はテレビ放送や電子番組ガ
イドを送信するデジタルテレビ放送、10は映画やカラ
オケ等の配信サービスを行うでオン・デ・マンド映画/
カラオケ配信サービス、11はビデオ、12はディスプ
レイモニタ、15は嗜好情報記憶部3に記憶される嗜好
情報が複数の場合にその中から嗜好情報を選択するため
の情報を入力する嗜好選択情報入力部、16は嗜好選択
情報入力部15からの入力を受けて嗜好番号を出力する
番号決定部である。
作について、以下に説明する。まず最初に、セットトッ
プボックス8は常時電源が投入されており、1日に1
度、オン・デ・マンド映画/カラオケ配信サービス10
から受信可能な番組名及び番組に関する情報を受信し
て、前記セットトップボックス8の内部に記憶すると同
時に、番組名については認識対象候補語彙記憶部4に送
るものとします。
選択情報は、ユーザーが装置に付随するリモコンのボタ
ンで入力するユーザー番号、もしくは内蔵の時計から出
力される時刻情報であって、嗜好情報記憶部3に複数記
憶される嗜好情報を選択するための情報である。
部15へ入力される嗜好選択情報を基に、(表1)、
(表2)に示した表に沿って、前記嗜好選択情報入力部
15からの入力を受けて嗜好番号を出力する。
いる嗜好情報が1つの場合でも実施の形態の効果に変わ
りはなく、前記嗜好情報記憶部3に記憶されている嗜好
情報が1つの場合には前記嗜好選択情報入力部15は入
力にかかわらず常に同一信号を出しつづけている。
16からの嗜好番号を基に嗜好情報記憶部3から嗜好情
報を引き出し、認識対象候補語彙記憶部4に記憶されて
いる認識対象語彙の中から嗜好にあった語彙を選択して
ユーザーの嗜好に合わせた認識対象語彙辞書を作成す
る。認識対象語彙作成部5では、嗜好情報記憶部3に格
納される嗜好情報から語に対して点数付けを行い、点数
閾値を用いて閾値よりも点数が高い語を選択する。
から決まった語数を選ぶ場合でも同様の効果が得られ
る。
ーザーはオン・デ・マンド映画/カラオケ配信サービス
10から選択したい番組名を音声で音声入力部1より指
定する。
音声に対して、選択作成されたユーザーの嗜好に合わせ
た認識対象語彙辞書に対して音声認識を実施し、音声認
識スコアを計算する。認識結果決定部7は、認識部6で
得られた認識得点を受け、最終的に出力する信号が決め
る。
部7で決まった信号を受けて、次の受信要求項目を決定
する。ここでは、セットトップボックス8はオン・デ・
マンド映画/カラオケ配信サービス10に対して受信要
求を出す、もしくは受信した画像や音声をディスプレイ
モニタ12に送る役割を果たしている。
カラオケ配信サービス10の配信可能なメニューが例え
数百万番組あった場合でも、ユーザーの嗜好に合わせて
音声認識対象語彙を絞り込んだ音声認識装置を使用し
て、受信要求する番組を音声選択することにより、対象
語彙を絞り込まない番組選択システムと比較して、短時
間のうちに、言い直しなく受信要求番組を選択すること
ができる。
れる認識対象語彙がデジタルテレビ放送9から送信され
る電子番組ガイドであって、セットトップボックス8が
外部から受信する番組情報が、デジタルテレビ放送9で
放送される電子番組ガイドであって、要求を出す対象が
ビデオ11で、出す要求内容が録画予約であっても同様
の効果が得られる。
ーの好き・嫌いの入力を用いた情報フィルタを使用する
もので、例えば特開平9−288683号公報の学習方
法が知られている。以下に嗜好情報作成部2での学習方
法について、嗜好学習の流れ図を図2に示し以下に説明
する。
ユーザー音声の認識スコア計算を行う認識ステップ、S0
3はスコア比較を行う認識結果決定ステップ、S04は決ま
った認識結果に沿って番組を視聴する番組視聴ステッ
プ、S05は視聴している番組について、ユーザーからの
嗜好反応を判断する嗜好判定ステップ、S06は判定され
た内容に沿って嗜好を学習する嗜好学習ステップであ
る。
02で音声認識が行われる。S03で音声認識の結果が決定
され、S04ではS03で決定された番組を視聴する。S05で
は番組を視聴しているユーザーの行動に応じた嗜好の判
定を行う。すなわち、10分が経過する前にチャンネルを
変えたら、当該番組はユーザーが気に入らなかったもの
と判断して、当該番組の(表3)の電子番組ガイドに付与
された語に「嫌い」の符号をつけて嗜好学習ステップS0
6に渡す。
いるようならば、当該番組はユーザーが気に入ったと判
断して、当該番組の(表3)の電子番組ガイドに付与され
た語に「好き」の符号をつけて嗜好学習ステップS06に
渡す。嗜好学習ステップS06では嗜好判断ステップS05で
判断された内容に沿って、嗜好を学習する。
などの割り込み別放送など最初の中断時もしくは、チャ
ンネルを変更する、番組が終るなどの視聴終了時に、セ
ットトップボックス側から「ただいまの番組は如何でし
たか?好き、嫌いのどちらかでお答えください。」と問
い掛けて、(表3)の電子番組ガイドに付与された語に
ついて得られた回答情報「好き」もしくは「嫌い」1件
として嗜好情報作成部2に送る方法でも同様の効果が得
られる。
態2における番組指定装置のブロック構成図を示す。実
施の形態2で説明する番組指定装置は、実施の形態1の
番組指定装置を部分的に変更したものであり、実施の形
態1の構成と異なる部分について説明する。
記憶されている。嗜好情報記憶部3に記憶されている嗜
好情報が複数であるために、どの嗜好情報を選択するか
を決めるために、音響テンプレート記憶部13に記憶さ
れている複数の音響テンプレートから、音声入力部1か
ら入力されるユーザーの発声に近いものを音響テンプレ
ート選択部14で選択する。
ートを選択するための発声は、「番組」という言葉にな
っている。音響テンプレート選択部14は「番組」とい
う決まった言葉を待ち受けていて、正確に発声されたと
いう前提の基でユーザーの発声と一番近い音響テンプレ
ートを選択する。音響テンプレート選択部14では、一
単語認識処理を全ての音響テンプレートに対して行い、
一番スコアが高かったものを選択する。こうして選択さ
れた音響テンプレート番号は、番号決定部16におい
て、(表4)で関連付けられた嗜好情報の番号決定に使
われる。
は、認識対象語彙作成部5に送られて、嗜好情報記憶部
3に記憶されている複数の嗜好情報から引き出す嗜好情
報を指定する。
決定するための情報は、音響テンプレート選択部14で
決められる音響テンプレート番号ではなくて、嗜好選択
情報入力部15から入力される構成とし、嗜好情報入力
部15でユーザーの顔画像を用いてユーザー番号を判定
して番号決定部16へ送り、(表2)に基づいて嗜好番
号を決定しても同様の効果が得られる。
決定するための情報は、音響テンプレート選択部14で
決められる音響テンプレート番号ではなくて、嗜好選択
情報入力部15から入力される構成とし、嗜好選択情報
入力部15への入力を内蔵の時計から得られる時刻とし
て、前記嗜好選択情報入力部15において時間帯番号を
判定、判定された時間帯番号を番号決定部16に送り
(表2)に基づいて嗜好番号を決定しても同様の効果が
得られる。
態3における番組指定装置のブロック構成図を示す。実
施の形態3で説明する番組指定装置は、実施の形態1の
番組指定装置を部分的に変更したものであり、実施の形
態1と異なる部分について説明する。
に入力され、認識部6で音声認識処理を行って、認識得
点が認識結果決定部7に送られる。実施の形態1と異な
るのは、ここで認識結果を決定するための材料が音声認
識による認識得点だけではなくて、ユーザーの嗜好情報
から決定される嗜好得点も加味して決められることであ
る。
識対象語彙作成部5において、認識対象候補語彙記憶部
4に記憶される全ての語の中から、嗜好情報記憶部3に
記憶されている嗜好情報に基づいて語に得点をつけて点
数閾値よりも上位の語が選択される。選択時に付与した
嗜好情報に基づく得点のうち、認識対象語彙に選ばれた
語の得点については嗜好得点計算部17において、各語
の点数からあらかじめ点数閾値としていた数値を引き去
って、最低嗜好得点が0となるように計算しなおし、認
識結果決定部7へ送る。
取った音声認識の認識得点と、嗜好得点計算部18から
受け取った嗜好得点とを合算した上で、一番得点が高い
ものを最終結果としてセットトップボックス8へ出力す
る。
得点から一定値を引き去る処理を行う代わりに、正規化
処理を行っても、同様の効果が得られる。
全単語を格納した認識対象候補語彙から予め取得したユ
ーザーの嗜好情報に基づいた認識対象語彙を予め作成
し、入力される音声と認識対象語彙とから単語を認識す
ることを特徴とするもので、ユーザーの嗜好に合わせて
認識対象語彙を少ないユーザ操作で絞り込むことによ
り、音声認識性能を向上させるという有利な効果が得ら
れる。
ーザの嗜好にあった番組選択ができるという有利な効果
が得られる。
ブロック構成図
ブロック構成図
ブロック構成図
Claims (13)
- 【請求項1】 音声認識の対象とすべき全単語を格納し
た認識対象候補語彙から予め取得したユーザーの嗜好情
報に基づいた認識対象語彙を予め作成し、入力される音
声と認識対象語彙とから単語を認識することを特徴とす
る音声認識方法。 - 【請求項2】 ユーザーの嗜好情報は、電子番組ガイド
から好きまたは嫌いの少なくとも一つを用いて学習する
ことにより生成することを特徴とする請求項1記載の音
声認識方法。 - 【請求項3】 予め取得したユーザーの嗜好情報に基づ
いた認識対象語彙の嗜好得点と、音声認識によって得ら
れる距離とを使用して認識結果を決定することを特徴と
する請求項1または2記載の音声認識方法。 - 【請求項4】 ユーザーの発声する音声を入力する音声
入力部と、ユーザーの嗜好を示す嗜好番号を決定するた
めの情報を入力する嗜好選択情報入力部と、前記嗜好選
択情報入力部からの入力を受けて現在使っているユーザ
ーのための嗜好番号を決定する番号決定部と、一つまた
は複数の嗜好情報を保持する嗜好情報記憶部と、音声認
識の対象とすべき全単語を格納する認識対象候補語彙記
憶部と、前記嗜好情報記憶部に格納されている嗜好情報
を嗜好番号によって選択し、選択された嗜好情報に基づ
いて前記認識対象候補語彙記憶部に記憶される認識対象
候補語彙から認識対象語彙を作成する認識対象語彙作成
部と、前記音声入力部から入力される音声と前記認識対
象語彙作成部において作成された認識対象語彙との認識
スコア計算を行う認識部と、前記認識部において計算さ
れた認識スコアに基づいて認識結果を決定し出力する認
識結果決定部とを備えることを特徴とする音声認識装
置。 - 【請求項5】 番号決定部は、嗜好選択情報入力部から
の入力がユーザー識別記号であって、前記番号決定部に
対してユーザー番号を出力することを特徴とする請求項
4記載の音声認識装置。 - 【請求項6】 番号決定部は、嗜好選択情報入力部から
の入力が時間であって、前記番号決定部に対して、時間
帯番号を出力することを特徴とする請求項4記載の音声
認識装置。 - 【請求項7】 ユーザーの発声する音声を入力する音声
入力部と、ユーザーの嗜好を示す嗜好番号を決定するた
めの情報を入力する嗜好選択情報入力部と、複数の音響
テンプレートを記憶する音響テンプレート記憶部と、前
記音声入力部から入力される規定語音声と前記音響テン
プレート記憶部に記憶される全ての音響テンプレートと
の音声認識スコアを計算して最も高いスコアを与える音
響テンプレートを選択する音響テンプレート選択部と、
前記音響テンプレート記憶部に記憶される音響テンプレ
ートと前記嗜好情報記憶部に記憶される嗜好情報の対応
関係を記憶して選択された音響テンプレートから嗜好番
号を決定する番号決定部、一つまたは複数の嗜好情報を
保持する嗜好情報記憶部と、音声認識の対象とすべき全
単語を格納する認識対象候補語彙記憶部と、前記嗜好情
報記憶部に格納されている嗜好情報を嗜好番号によって
選択し、選択された嗜好情報に基づいて前記認識対象候
補語彙記憶部に記憶される認識対象候補語彙から認識対
象語彙を作成する認識対象語彙作成部と、前記音声入力
部から入力される音声と前記認識対象語彙作成部におい
て作成された認識対象語彙との認識スコア計算を行う認
識部と、前記認識部において計算された認識スコアに基
づいて認識結果を決定し出力する認識結果決定部とを備
えることを特徴とする音声認識装置。 - 【請求項8】 前記音響テンプレート選択部で複数の音
響テンプレートを選択し、前記番号決定部において複数
の嗜好番号を決定して、前記認識対象語彙作成部におい
て複数の嗜好情報の内容を統合し、前記認識対象候補語
彙記憶部に記憶される認識対象候補語彙から認識対象語
彙を作成することを特徴とする請求項7記載の音声認識
装置。 - 【請求項9】 前記認識対象語彙作成部において、選択
された嗜好情報を入力として認識対象語彙について嗜好
重みを付与し、嗜好重みを得点化する嗜好得点作成部を
備え、前記認識部において計算された音声認識スコアと
前記嗜好得点作成部において作成された嗜好得点を入力
として認識結果を決定する認識結果決定部を備えること
を特徴とする請求項4記載の音声認識装置。 - 【請求項10】 請求項4から7のいずれかに記載の音
声認識装置を用いて、番組指定をすることを特徴とする
番組指定装置。 - 【請求項11】 ユーザーの嗜好情報は、電子番組ガイ
ドから好きまたは嫌いにより選択する学習方法により生
成することを特徴とする請求項10記載の番組指定装
置。 - 【請求項12】 ユーザーの嗜好情報は電子番組ガイド
で提供されれる、時間帯、ジャンル、出演者もしくは出
演グループ名、番組名、番組内容、テーマ、音楽、内容
キーワード、ユーザー名、の少なくとも1つを構成要素
として持つことを特徴とする請求項9記載の番組指定装
置。 - 【請求項13】 番組の嗜好情報を学習する際に、番組
の視聴側による中断時、番組の配信側による中断時、も
しくは番組終了時に嗜好の入力を促すことを特徴とする
請求項10から12のいずれかに記載の番組指定装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000097336A JP3525855B2 (ja) | 2000-03-31 | 2000-03-31 | 音声認識方法及び音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000097336A JP3525855B2 (ja) | 2000-03-31 | 2000-03-31 | 音声認識方法及び音声認識装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003337213A Division JP2004120767A (ja) | 2003-09-29 | 2003-09-29 | 番組指定方法及び番組指定装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001282285A true JP2001282285A (ja) | 2001-10-12 |
JP3525855B2 JP3525855B2 (ja) | 2004-05-10 |
JP2001282285A5 JP2001282285A5 (ja) | 2004-08-19 |
Family
ID=18611970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000097336A Expired - Lifetime JP3525855B2 (ja) | 2000-03-31 | 2000-03-31 | 音声認識方法及び音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3525855B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004054246A1 (ja) * | 2002-12-12 | 2004-06-24 | Sony Corporation | 情報処理装置および情報処理方法、記録媒体、並びにプログラム |
JP2010085522A (ja) * | 2008-09-30 | 2010-04-15 | Kddi Corp | 音声認識処理機能を用いたコンテンツ検索装置、プログラム及び方法 |
WO2010116785A1 (ja) * | 2009-04-06 | 2010-10-14 | 三菱電機株式会社 | 検索装置 |
JP2013068783A (ja) * | 2011-09-22 | 2013-04-18 | Toshiba Corp | 音声認識装置、音声認識方法およびプログラム |
CN107454511A (zh) * | 2012-08-31 | 2017-12-08 | 杜比实验室特许公司 | 用于使声音从观看屏幕或显示表面反射的扬声器 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113614713A (zh) * | 2021-06-29 | 2021-11-05 | 华为技术有限公司 | 一种人机交互方法及装置、设备及车辆 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62262898A (ja) * | 1986-05-09 | 1987-11-14 | 株式会社リコー | 音声認識装置 |
JPH07319494A (ja) * | 1994-05-23 | 1995-12-08 | Nec Robotics Eng Ltd | 大語彙音声認識装置 |
JPH09288683A (ja) * | 1995-09-04 | 1997-11-04 | Matsushita Electric Ind Co Ltd | 情報フィルタ装置及び情報フィルタリング方法 |
JPH09292896A (ja) * | 1996-04-24 | 1997-11-11 | Denso Corp | 車両用ナビゲーション装置 |
JPH11305790A (ja) * | 1998-04-23 | 1999-11-05 | Denso Corp | 音声認識装置 |
WO2000011571A1 (en) * | 1998-08-24 | 2000-03-02 | Bcl Computers, Inc. | Adaptive natural language interface |
WO2000049599A1 (fr) * | 1999-02-19 | 2000-08-24 | Sony Corporation | Traducteur de sons vocaux, procede de traduction de sons vocaux et support d'enregistrement sur lequel est enregistre un programme de commande de traduction de sons vocaux |
JP2001142481A (ja) * | 1999-08-26 | 2001-05-25 | Matsushita Electric Ind Co Ltd | 音声/ビデオ装置用の制御システム及び音声/ビデオ構成を制御するための統合アクセスシステム |
JP2001169269A (ja) * | 1999-08-26 | 2001-06-22 | Matsushita Electric Ind Co Ltd | インターネット上でテレビジョンに関連した情報にアクセスするためのシステム及び方法 |
-
2000
- 2000-03-31 JP JP2000097336A patent/JP3525855B2/ja not_active Expired - Lifetime
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62262898A (ja) * | 1986-05-09 | 1987-11-14 | 株式会社リコー | 音声認識装置 |
JPH07319494A (ja) * | 1994-05-23 | 1995-12-08 | Nec Robotics Eng Ltd | 大語彙音声認識装置 |
JPH09288683A (ja) * | 1995-09-04 | 1997-11-04 | Matsushita Electric Ind Co Ltd | 情報フィルタ装置及び情報フィルタリング方法 |
JPH09292896A (ja) * | 1996-04-24 | 1997-11-11 | Denso Corp | 車両用ナビゲーション装置 |
JPH11305790A (ja) * | 1998-04-23 | 1999-11-05 | Denso Corp | 音声認識装置 |
WO2000011571A1 (en) * | 1998-08-24 | 2000-03-02 | Bcl Computers, Inc. | Adaptive natural language interface |
WO2000049599A1 (fr) * | 1999-02-19 | 2000-08-24 | Sony Corporation | Traducteur de sons vocaux, procede de traduction de sons vocaux et support d'enregistrement sur lequel est enregistre un programme de commande de traduction de sons vocaux |
JP2001142481A (ja) * | 1999-08-26 | 2001-05-25 | Matsushita Electric Ind Co Ltd | 音声/ビデオ装置用の制御システム及び音声/ビデオ構成を制御するための統合アクセスシステム |
JP2001169269A (ja) * | 1999-08-26 | 2001-06-22 | Matsushita Electric Ind Co Ltd | インターネット上でテレビジョンに関連した情報にアクセスするためのシステム及び方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101007839B1 (ko) * | 2002-12-12 | 2011-01-13 | 소니 주식회사 | 정보 처리 장치 및 정보 처리 방법, 기록 매체, 및프로그램 |
US7577645B2 (en) | 2002-12-12 | 2009-08-18 | Sony Corporation | Information processing device and information processing method, recording medium, and computer program |
US7587382B2 (en) | 2002-12-12 | 2009-09-08 | Sony Corporation | Information processing apparatus and information processing method, recording medium, and program |
CN100566387C (zh) * | 2002-12-12 | 2009-12-02 | 索尼株式会社 | 信息处理设备和信息处理方法,记录介质及程序 |
KR101029740B1 (ko) | 2002-12-12 | 2011-04-19 | 소니 주식회사 | 정보 처리 장치 및 정보 처리 방법 및 기록 매체 |
WO2004054246A1 (ja) * | 2002-12-12 | 2004-06-24 | Sony Corporation | 情報処理装置および情報処理方法、記録媒体、並びにプログラム |
JP2010085522A (ja) * | 2008-09-30 | 2010-04-15 | Kddi Corp | 音声認識処理機能を用いたコンテンツ検索装置、プログラム及び方法 |
WO2010116785A1 (ja) * | 2009-04-06 | 2010-10-14 | 三菱電機株式会社 | 検索装置 |
JP5300974B2 (ja) * | 2009-04-06 | 2013-09-25 | 三菱電機株式会社 | 検索装置 |
US8983847B2 (en) | 2011-09-22 | 2015-03-17 | Kabushiki Kaisha Toshiba | Voice recognition apparatus, method, and computer program product |
JP2013068783A (ja) * | 2011-09-22 | 2013-04-18 | Toshiba Corp | 音声認識装置、音声認識方法およびプログラム |
CN107454511A (zh) * | 2012-08-31 | 2017-12-08 | 杜比实验室特许公司 | 用于使声音从观看屏幕或显示表面反射的扬声器 |
US11277703B2 (en) | 2012-08-31 | 2022-03-15 | Dolby Laboratories Licensing Corporation | Speaker for reflecting sound off viewing screen or display surface |
CN107454511B (zh) * | 2012-08-31 | 2024-04-05 | 杜比实验室特许公司 | 用于使声音从观看屏幕或显示表面反射的扬声器 |
Also Published As
Publication number | Publication date |
---|---|
JP3525855B2 (ja) | 2004-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11798528B2 (en) | Systems and methods for providing notifications within a media asset without breaking immersion | |
US6324512B1 (en) | System and method for allowing family members to access TV contents and program media recorder over telephone or internet | |
CN108063969B (zh) | 显示设备、控制显示设备的方法、服务器以及控制服务器的方法 | |
JP3554262B2 (ja) | テレビジョン及びマルチメディアの検索及び要求に対して自然言語のモダリティーを可能にする汎用遠隔制御 | |
US6480819B1 (en) | Automatic search of audio channels by matching viewer-spoken words against closed-caption/audio content for interactive television | |
US7519534B2 (en) | Speech controlled access to content on a presentation medium | |
US7437290B2 (en) | Automatic censorship of audio data for broadcast | |
US20070118382A1 (en) | Information processing apparatus and information processing method | |
US8260108B2 (en) | Recording and reproduction apparatus and recording and reproduction method | |
CN111433845A (zh) | 在会话的上下文中推荐内容的方法和系统 | |
JP4869268B2 (ja) | 音響モデル学習装置およびプログラム | |
JP5149107B2 (ja) | 音響処理装置およびプログラム | |
KR20050023941A (ko) | 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법 | |
JP2001103402A (ja) | 記録されたテレビジョン放送についての情報を記憶するための機構 | |
JP2002320159A (ja) | 番組推薦システムおよび番組推薦方法 | |
JP3799280B2 (ja) | 対話システムおよびその制御方法 | |
EP1079615A2 (en) | System for identifying and adapting a TV-user profile by means of speech technology | |
JP2000250575A (ja) | 双方向性テレビ受像機を自動的に選局するための音声理解装置およびその方法 | |
JPWO2003030150A1 (ja) | 会話装置、会話親機装置、会話子機装置、会話制御方法、および会話制御プログラム | |
WO2019155717A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
US20030191629A1 (en) | Interface apparatus and task control method for assisting in the operation of a device using recognition technology | |
JP2001282285A (ja) | 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置 | |
JP6772916B2 (ja) | 対話装置および対話方法 | |
JP7131077B2 (ja) | 会話装置、ロボット、会話装置制御方法及びプログラム | |
JP2001282285A5 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20031210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040209 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 3525855 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080227 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090227 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100227 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100227 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110227 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140227 Year of fee payment: 10 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |