JP2004120767A - 番組指定方法及び番組指定装置 - Google Patents
番組指定方法及び番組指定装置 Download PDFInfo
- Publication number
- JP2004120767A JP2004120767A JP2003337213A JP2003337213A JP2004120767A JP 2004120767 A JP2004120767 A JP 2004120767A JP 2003337213 A JP2003337213 A JP 2003337213A JP 2003337213 A JP2003337213 A JP 2003337213A JP 2004120767 A JP2004120767 A JP 2004120767A
- Authority
- JP
- Japan
- Prior art keywords
- program
- user
- recognition
- recognition target
- preference information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Circuits Of Receivers In General (AREA)
Abstract
【課題】本発明は、ユーザーの嗜好に合わせて認識対象語彙を少ないユーザー操作で絞り込むことにより、音声認識性能の向上を図ることを目的とする。
【解決手段】嗜好選択情報入力部15、番号決定部16、嗜好情報記憶部3を設け、前記嗜好選択情報入力部15からの入力に基づいて前記番号決定部16で決定された嗜好番号に該当する前記嗜好情報記憶部に記憶される嗜好情報を基に、認識対象語彙作成部5において認識対象候補語彙記憶部4からユーザーの嗜好を反映した認識対象語彙を作成し、音声入力部1から入力される音声と認識対象語彙の音声認識スコアを認識部6において計算し、認識結果が決定する。また嗜好情報は、電子番組ガイドから作成され、認識結果は接続されているセットトップボックス8に番組指定信号が出力される。
【選択図】図1
【解決手段】嗜好選択情報入力部15、番号決定部16、嗜好情報記憶部3を設け、前記嗜好選択情報入力部15からの入力に基づいて前記番号決定部16で決定された嗜好番号に該当する前記嗜好情報記憶部に記憶される嗜好情報を基に、認識対象語彙作成部5において認識対象候補語彙記憶部4からユーザーの嗜好を反映した認識対象語彙を作成し、音声入力部1から入力される音声と認識対象語彙の音声認識スコアを認識部6において計算し、認識結果が決定する。また嗜好情報は、電子番組ガイドから作成され、認識結果は接続されているセットトップボックス8に番組指定信号が出力される。
【選択図】図1
Description
本発明は、認識対象語彙の選択にユーザーの嗜好を反映させる音声認識により番組を指定する番組指定方法及び番組指定装置に関する。
認識対象語彙を動的に作成する従来技術としては、例えば特許文献1に音声認識の対象となる複数の単語を予め定義された複数のジャンルに分けて記憶し、予め認識させるジャンルの辞書ファイルを辞書メモリに展開しておくというものである。
図5に従来の音声認識装置の構成図を示し、以下に説明する。
音声認識を開始する前に、音声認識の対象となる複数の単語を予め定義された複数のジャンルに分けて単語セット50として記憶し、辞書生成部51により複数の単語セット50を音声特徴を抽出して辞書ファイル52に記憶させ、音声入力の前に辞書ロード部53は辞書ロード指示部54の指示された辞書ファイル52を辞書メモリ55にロードする。
マイクロホン56から入力された音声は、音声特徴抽出部57により音声特徴が抽出され、比較照合部58は入力音声された音声特徴と辞書メモリ55からの音声特徴とを比較照合して入力音声に対する単語を認識結果として出力するものである。
また、従来の音声認識による番組指定装置としては、例えば特許文献2に記載されているようなものがあった。従来の番組指定装置は、番組カテゴリ表から音声認識により選択されたカテゴリを検出したり、詳細な放送番組案内情報から音声認識により番組を選局したりする手段を備えている。
特開平7−319494号公報(第4−6頁、第1図)
特開平9−322086号公報(第4−5頁、第1図)
しかしながら、これらの従来技術を用いても認識対象語彙は、予め定めたジャンルに従って作成されるためにユーザーの意図としたものとは限らず、さらに定められたジャンルが変わるたびに辞書ファイルをロードを繰り返すことが必要となり、ユーザーの意図に合った音声認識結果を得るためにはユーザー操作が増えるなどの課題があった。
本発明は、ユーザーの嗜好に合わせて認識対象語彙を少ないユーザ操作で絞り込むことにより、音声認識性能を向上を図り、よりユーザーの嗜好にあった番組選択ができることを目的とする。
この課題を解決するために本発明は、音声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を予め作成し、入力される音声と前記ユーザーの嗜好情報に基づいた認識対象語彙とから単語を認識し、前記認識した単語を用いてユーザーの要求する番組を選択することを特徴とする方法を取るものである。
また、本発明は、音声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を作成する認識対象語彙作成部と、
前記ユーザーの嗜好情報に基づいた認識対象語彙の嗜好得点を算出する嗜好得点計算部と、ユーザーの発声する音声と前記ユーザーの嗜好情報に基づいた認識対象語彙とから単語の認識得点を計算する認識部と、前記嗜好得点と前記認識得点とを使用して、認識結果を決定し出力する認識結果決定部と、前記認識決定部の認識結果を用いてユーザーの要求する番組を選択する要求信号を出力するセットトップボックスと、を備えるものである。
前記ユーザーの嗜好情報に基づいた認識対象語彙の嗜好得点を算出する嗜好得点計算部と、ユーザーの発声する音声と前記ユーザーの嗜好情報に基づいた認識対象語彙とから単語の認識得点を計算する認識部と、前記嗜好得点と前記認識得点とを使用して、認識結果を決定し出力する認識結果決定部と、前記認識決定部の認識結果を用いてユーザーの要求する番組を選択する要求信号を出力するセットトップボックスと、を備えるものである。
これにより、ユーザーの意図する語を含む認識対象語彙が選ばれ、従来例よりも誤りが少なく、より多くの場合にユーザーの意図する結果を出力し、よりユーザーの嗜好にあった番組選択ができる番組指定方法及び番組指定装置を提供することができる。
本発明によれば、音声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を予め作成し、入力される音声と認識対象語彙とから単語を認識することを特徴とするもので、ユーザーの嗜好に合わせて認識対象語彙を少ないユーザー操作で絞り込むことにより、音声認識性能を向上させるという有利な効果が得られる。
また、番組指定装置に適用した場合は、ユーザーの嗜好にあった番組選択ができるという有利な効果が得られる。
本発明の請求項1に記載の発明は、音声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を予め作成し、入力される音声と前記認識対象語彙とから単語を認識し、前記認識した単語を用いてユーザーの要求する番組を選択することを特徴とするもので、ユーザーの嗜好に合わせて認識対象語彙を絞り込むことにより音声認識性能を向上させて、ユーザーの嗜好にあった番組が選択できるという作用を有する。また、認識対象候補となりうる全語彙を対象に音声認識を行うよりも処理が簡便で早くなる方法である。
請求項2に記載の発明は、入力された音声と音声認識の対象の単語である認識対象語彙とから前記単語を認識する音声認識によって得られる認識得点と、予め取得したユーザーの嗜好情報に基づいた前記認識対象語彙の嗜好得点と、予め取得したユーザーの嗜好情報に基づいた前記認識対象語彙の嗜好得点とを使用して、認識結果を決定し、前記認識結果を用いてユーザーの要求する番組を選択することを特徴とするもので、音声認識の認識得点に嗜好得点も加味することにより、ユーザーがより発声しそうな内容に重みをつけて結果を出力して、ユーザーの全く意図しない結果を出現させるケースを大幅に低減すると同時に、意図する結果を高い確率で出現させ、ユーザーの嗜好にあった番組が選択できるという作用を有する。
請求項3に記載の発明は、請求項1又は2記載の番組指定方法において、前記ユーザーの嗜好情報が、ユーザーが入力するユーザー識別記号、ユーザーの発声、ユーザーを識別する画像又はユーザーの発声が入力される時刻の少なくとも一つの情報を用いて選択されるものであることを特徴とするもので、嗜好情報を選択する際にユーザーが入力するユーザー識別記号、ユーザーの発声、ユーザーを識別する画像又はユーザーの発声が入力される時刻の少なくとも1つを利用することにより、ユーザーの嗜好に合わせて認識対象語彙を絞り込むことにより音声認識性能を向上させた番組指定方法を提供できるという作用を有する。
請求項4に記載の発明は、請求項1から3のいずれかに記載の番組指定方法において、前記ユーザーの嗜好情報が、予め定めた同一番組の連続視聴時間が経過した場合、視聴側
により番組を中断する場合、配信側により番組を中断する場合又は番組が終了した場合に学習することを特徴とするもので、ユーザーから嗜好情報を学習する際に、番組の切れ目などを狙って、積極的に嗜好を尋ねることにより、よりユーザの嗜好にあった番組選択ができるという作用を有する。
により番組を中断する場合、配信側により番組を中断する場合又は番組が終了した場合に学習することを特徴とするもので、ユーザーから嗜好情報を学習する際に、番組の切れ目などを狙って、積極的に嗜好を尋ねることにより、よりユーザの嗜好にあった番組選択ができるという作用を有する。
請求項5に記載の発明は、請求項1から4のいずれかに記載の番組指定方法において、前記ユーザーの嗜好情報が、番組の視聴履歴を用いて学習した情報であることを特徴とするもので、番組の視聴履歴を嗜好情報の学習に使うことにより、容易にユーザーの嗜好にあった学習ができるという作用を有する。
請求項6に記載の発明は、請求項5記載の番組指定方法において、前記番組の視聴履歴が、電子番組ガイドで提供される時間帯、ジャンル、出演者、出演グループ名、番組名、番組内容、テーマ、音楽、内容キーワード、ユーザー名の少なくとも1つを構成要素として持つ情報であることを特徴とするもので、嗜好情報の内容を指定して学習することにより、よりユーザーの嗜好にあった番組選択ができるという作用を有する。
請求項7に記載の発明は、音声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を作成する認識対象語彙作成部と、ユーザーの発声する音声と前記ユーザーの嗜好情報に基づいた認識対象語彙とから単語を認識する認識部と、前記認識した単語を用いてユーザーの要求する番組を選択する要求信号を出力するセットトップボックスとを含むことを特徴とするもので、ユーザーの嗜好に基づいて認識対象語彙を絞り込むことにより音声認識性能を向上させ、ユーザーの嗜好にあった番組が選択できるという作用を有する。
請求項8に記載の発明は、音声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を作成する認識対象語彙作成部と、前記ユーザーの嗜好情報に基づいた前記認識対象語彙の嗜好得点を算出する嗜好得点計算部と、ユーザーの発声する音声と前記ユーザーの嗜好情報に基づいた認識対象語彙とから単語の認識得点を計算する認識部と、前記嗜好得点と前記認識得点とを使用して、認識結果を決定し出力する認識結果決定部と、前記認識決定部の認識結果を用いてユーザーの要求する番組を選択する要求信号を出力するセットトップボックスとを含むことを特徴とするもので、嗜好情報を選択する際に、ユーザーの嗜好情報に基づいて認識対象語彙の嗜好得点を算出し、入力音声との対応関係を基に単語の認識得点を算出することにより、ユーザーの全く意図しない結果を出現させるケースを大幅に低減すると同時に、意図する結果を高い確率で出現させ、ユーザーの嗜好にあった番組が選択できるという作用を有する。
請求項9に記載の発明は、請求項7又は8記載の番組指定装置において、ユーザーの嗜好情報が、ユーザーが入力するユーザー識別記号、ユーザーの発声、ユーザーを認識する画像又はユーザーの発声が入力される時刻の少なくとも一つ情報を用いて選択されるものであることを特徴とするもので、嗜好情報を選択する際にユーザーが入力するユーザー識別記号、ユーザーの発声、ユーザーの画像又は前記ユーザーの嗜好情報を選択する時間の少なくとも1つを利用することにより、ユーザーの嗜好に合わせて認識対象語彙を絞り込むことにより音声認識性能を向上させ、ユーザーの嗜好にあった番組が選択できるという作用を有する。
請求項10に記載の発明は、請求項7ないし9のいずれかに記載の番組指定装置において、予め定めた同一番組の連続視聴時間が経過した場合、視聴側により番組が中断する場合、配信側により番組が中断する場合又は番組が終了した場合に、ユーザーの嗜好情報を学習する嗜好情報作成部を更に含むことを特徴とするもので、装置がユーザーから嗜好情
報を学習する際に、番組の切れ目などを狙って、積極的に嗜好を尋ねることにより、よりユーザーの嗜好にあった番組選択ができるという作用を有する。
報を学習する際に、番組の切れ目などを狙って、積極的に嗜好を尋ねることにより、よりユーザーの嗜好にあった番組選択ができるという作用を有する。
請求項11に記載の発明は、請求項7ないし10のいずれかに記載の番組指定装置において、ユーザーの嗜好情報が、番組の視聴履歴を用いて学習した情報であることを特徴とするもので、番組の視聴履歴を用いて学習した情報に使うことにより、容易にユーザーの嗜好にあった学習ができるという作用を有する。
請求項12に記載の発明は、請求項7ないし11のいずれかに記載の番組指定装置において、番組の視聴履歴が、電子番組ガイドで提供される時間帯、ジャンル、出演者、出演グループ名、番組名、番組内容、テーマ、音楽、内容キーワード、ユーザー名の少なくとも1つを構成要素として持つ情報であることを特徴とするもので、嗜好情報の内容を指定して学習することにより、よりユーザーの嗜好にあった番組選択ができるという作用を有する。
以下に、本発明の実施の形態について図を用いて説明する。
(実施の形態1)
図1に本発明の実施の形態1における番組指定装置のブロック構成図を示す。
図1に本発明の実施の形態1における番組指定装置のブロック構成図を示す。
図1において、1はユーザーの音声を入力する音声入力部、2は嗜好情報を作成する嗜好情報作成部、3は嗜好情報作成部2で作成された嗜好情報を保持する嗜好情報記憶部、4は音声認識の対象語彙となりうる全ての語彙を記憶している認識対象候補語彙記憶部、5は認識対象候補語彙記憶部4に記憶されている認識対象語彙の中から嗜好にあった語彙を選択してユーザーの嗜好に合わせた認識対象語彙辞書を作成する認識対象語彙作成部、6は音声入力部1から入力された音声と認識対象語彙作成部5から認識対象語彙との音声認識スコアを計算する認識部、7は認識部6で得られた認識得点は最終的に出力する認識結果決定部、8は認識結果決定部7で決まった信号を受けて、次の受信要求項目を決定するセットトップボックス、9はテレビ放送や電子番組ガイドを送信するデジタルテレビ放送、10は映画やカラオケ等の配信サービスを行うでオン・デ・マンド映画/カラオケ配信サービス、11はビデオ、12はディスプレイモニタ、15は嗜好情報記憶部3に記憶される嗜好情報が複数の場合にその中から嗜好情報を選択するための情報を入力する嗜好選択情報入力部、16は嗜好選択情報入力部15からの入力を受けて嗜好番号を出力する番号決定部である。
上記のように構成された番組選択装置の動作について、以下に説明する。
まず最初に、セットトップボックス8は常時電源が投入されており、1日に1度、オン・デ・マンド映画/カラオケ配信サービス10から受信可能な番組名及び番組に関する情報を受信して、前記セットトップボックス8の内部に記憶すると同時に、番組名については認識対象候補語彙記憶部4に送るものとします。
嗜好選択情報入力部15へ入力される嗜好選択情報は、ユーザーが装置に付随するリモコンのボタンで入力するユーザー番号、もしくは内蔵の時計から出力される時刻情報であって、嗜好情報記憶部3に複数記憶される嗜好情報を選択するための情報である。
番号決定部16は、前記嗜好選択情報入力部15へ入力される嗜好選択情報を基に、(表1)、(表2)に示した表に沿って、前記嗜好選択情報入力部15からの入力を受けて嗜好番号を出力する。
なお、前記嗜好情報記憶部3に記憶されている嗜好情報が1つの場合でも実施の形態の効果に変わりはなく、前記嗜好情報記憶部3に記憶されている嗜好情報が1つの場合には前記嗜好選択情報入力部15は入力にかかわらず常に同一信号を出しつづけている。
認識対象語彙作成部5は、前記番号決定部16からの嗜好番号を基に嗜好情報記憶部3から嗜好情報を引き出し、認識対象候補語彙記憶部4に記憶されている認識対象語彙の中から嗜好にあった語彙を選択してユーザーの嗜好に合わせた認識対象語彙辞書を作成する。認識対象語彙作成部5では、嗜好情報記憶部3に格納される嗜好情報から語に対して点数付けを行い、点数閾値を用いて閾値よりも点数が高い語を選択する。
なお、語数を予め決めておいて、上位の方から決まった語数を選ぶ場合でも同様の効果が得られる。
こうして準備されている装置に対して、ユーザーはオン・デ・マンド映画/カラオケ配信サービス10から選択したい番組名を音声で音声入力部1より指定する。
認識部6は、音声入力部1から入力された音声に対して、選択作成されたユーザーの嗜好に合わせた認識対象語彙辞書に対して音声認識を実施し、音声認識スコアを計算する。認識結果決定部7は、認識部6で得られた認識得点を受け、最終的に出力する信号が決める。
セットトップボックス8は、認識結果決定部7で決まった信号を受けて、次の受信要求項目を決定する。ここでは、セットトップボックス8はオン・デ・マンド映画/カラオケ配信サービス10に対して受信要求を出す、もしくは受信した画像や音声をディスプレイモニタ12に送る役割を果たしている。
この構成により、オン・デ・マンド映画/カラオケ配信サービス10の配信可能なメニューが例え数百万番組あった場合でも、ユーザーの嗜好に合わせて音声認識対象語彙を絞り込んだ音声認識装置を使用して、受信要求する番組を音声選択することにより、対象語彙を絞り込まない番組選択システムと比較して、短時間のうちに、言い直しなく受信要求
番組を選択することができる。
番組を選択することができる。
なお、認識対象候補語彙記憶部4に記憶される認識対象語彙がデジタルテレビ放送9から送信される電子番組ガイドであって、セットトップボックス8が外部から受信する番組情報が、デジタルテレビ放送9で放送される電子番組ガイドであって、要求を出す対象がビデオ11で、出す要求内容が録画予約であっても同様の効果が得られる。
嗜好情報作成部2での学習方法は、ユーザーの好き・嫌いの入力を用いた情報フィルタを使用するもので、例えば特開平9−288683号公報の学習方法が知られている。以下に嗜好情報作成部2での学習方法について、嗜好学習の流れ図を図2に示し以下に説明する。
S01はユーザーの音声入力ステップ、S02はユーザー音声の認識スコア計算を行う認識ステップ、S03はスコア比較を行う認識結果決定ステップ、S04は決まった認識結果に沿って番組を視聴する番組視聴ステップ、S05は視聴している番組について、ユーザーからの嗜好反応を判断する嗜好判定ステップ、S06は判定された内容に沿って嗜好を学習する嗜好学習ステップである。
S01でユーザーによる音声入力が行われ、S02で音声認識が行われる。S03で音声認識の結果が決定され、S04ではS03で決定された番組を視聴する。S05では番組を視聴しているユーザーの行動に応じた嗜好の判定を行う。すなわち、10分が経過する前にチャンネルを変えたら、当該番組はユーザーが気に入らなかったものと判断して、当該番組の(表3)の電子番組ガイドに付与された語に「嫌い」の符号をつけて嗜好学習ステップS06に渡す。
例えば、10分を経過しても視聴しつづけているようならば、当該番組はユーザーが気に入ったと判断して、当該番組の(表3)の電子番組ガイドに付与された語に「好き」の符号をつけて嗜好学習ステップS06に渡す。嗜好学習ステップS06では嗜好判断ステップS05で判断された内容に沿って、嗜好を学習する。
なお、番組の中のコマーシャルやニュースなどの割り込み別放送など最初の中断時もしくは、チャンネルを変更する、番組が終るなどの視聴終了時に、セットトップボックス側から「ただいまの番組は如何でしたか?好き、嫌いのどちらかでお答えください。」と問い掛けて、(表3)の電子番組ガイドに付与された語について得られた回答情報「好き」もしくは「嫌い」1件として嗜好情報作成部2に送る方法でも同様の効果が得られる。
(実施の形態2)
図3に本発明の実施の形態2における番組指定装置のブロック構成図を示す。実施の形態2で説明する番組指定装置は、実施の形態1の番組指定装置を部分的に変更したものであり、実施の形態1の構成と異なる部分について説明する。
図3に本発明の実施の形態2における番組指定装置のブロック構成図を示す。実施の形態2で説明する番組指定装置は、実施の形態1の番組指定装置を部分的に変更したものであり、実施の形態1の構成と異なる部分について説明する。
嗜好情報記憶部3には、複数の嗜好情報が記憶されている。嗜好情報記憶部3に記憶されている嗜好情報が複数であるために、どの嗜好情報を選択するかを決めるために、音響テンプレート記憶部13に記憶されている複数の音響テンプレートから、音声入力部1から入力されるユーザーの発声に近いものを音響テンプレート選択部14で選択する。
実施の形態2の装置の場合、音響テンプレートを選択するための発声は、「番組」という言葉になっている。音響テンプレート選択部14は「番組」という決まった言葉を待ち受けていて、正確に発声されたという前提の基でユーザーの発声と一番近い音響テンプレートを選択する。音響テンプレート選択部14では、一単語認識処理を全ての音響テンプレートに対して行い、一番スコアが高かったものを選択する。こうして選択された音響テンプレート番号は、番号決定部16において、(表4)で関連付けられた嗜好情報の番号決定に使われる。
番号決定部16で決まった嗜好情報番号は、認識対象語彙作成部5に送られて、嗜好情報記憶部3に記憶されている複数の嗜好情報から引き出す嗜好情報を指定する。
なお、番号決定部16において嗜好番号を決定するための情報は、音響テンプレート選択部14で決められる音響テンプレート番号ではなくて、嗜好選択情報入力部15から入力される構成とし、嗜好情報入力部15でユーザーの顔画像を用いてユーザー番号を判定して番号決定部16へ送り、(表2)に基づいて嗜好番号を決定しても同様の効果が得られる。
また、番号決定部16において嗜好番号を決定するための情報は、音響テンプレート選択部14で決められる音響テンプレート番号ではなくて、嗜好選択情報入力部15から入力される構成とし、嗜好選択情報入力部15への入力を内蔵の時計から得られる時刻として、前記嗜好選択情報入力部15において時間帯番号を判定、判定された時間帯番号を番号決定部16に送り(表2)に基づいて嗜好番号を決定しても同様の効果が得られる。
(実施の形態3)
図4に本発明の実施の形態3における番組指定装置のブロック構成図を示す。実施の形態3で説明する番組指定装置は、実施の形態1の番組指定装置を部分的に変更したものであり、実施の形態1と異なる部分について説明する。
図4に本発明の実施の形態3における番組指定装置のブロック構成図を示す。実施の形態3で説明する番組指定装置は、実施の形態1の番組指定装置を部分的に変更したものであり、実施の形態1と異なる部分について説明する。
ユーザーの発声は、音声入力部1から装置に入力され、認識部6で音声認識処理を行って、認識得点が認識結果決定部7に送られる。実施の形態1と異なるのは、ここで認識結果を決定するための材料が音声認識による認識得点だけではなくて、ユーザーの嗜好情報から決定される嗜好得点も加味して決められることである。
認識部6で音声認識に使われる語彙は、認識対象語彙作成部5において、認識対象候補語彙記憶部4に記憶される全ての語の中から、嗜好情報記憶部3に記憶されている嗜好情報に基づいて語に得点をつけて点数閾値よりも上位の語が選択される。選択時に付与した嗜好情報に基づく得点のうち、認識対象語彙に選ばれた語の得点については嗜好得点計算部17において、各語の点数からあらかじめ点数閾値としていた数値を引き去って、最低嗜好得点が0となるように計算しなおし、認識結果決定部7へ送る。
認識結果決定部7では、認識部6から受け取った音声認識の認識得点と、嗜好得点計算部18から受け取った嗜好得点とを合算した上で、一番得点が高いものを最終結果としてセットトップボックス8へ出力する。
なお、嗜好得点計算部18において、嗜好得点から一定値を引き去る処理を行う代わりに、正規化処理を行っても、同様の効果が得られる。
以上のように、本発明にかかる番組指定方法及び番組指定装置は、声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を予め作成し、入力される音声と認識対象語彙とから単語を認識することを特徴とするもので、ユーザーの嗜好に合わせて認識対象語彙を少ないユーザ操作で絞り込むことにより、音声認識性能を向上させるという有利な効果が得られ、認識対象語彙の選択にユーザーの嗜好を反映させる番組指定方法及び番組指定装置等として有用である。
1 音声入力部
2 嗜好情報作成部
3 嗜好情報記憶部
4 認識対象候補語彙記憶部
5 認識対象語彙作成部
6 認識部
7 認識結果決定部
8 セットトップボックス
9 デジタルテレビ放送
10 オン・デ・マンド 映画/カラオケ配信サービス
11 ビデオ
12 ディスプレイモニター
13 音響テンプレート記憶部
14 音響テンプレート選択部
15 嗜好選択情報入力部
16 番号決定部
17 嗜好得点計算部
2 嗜好情報作成部
3 嗜好情報記憶部
4 認識対象候補語彙記憶部
5 認識対象語彙作成部
6 認識部
7 認識結果決定部
8 セットトップボックス
9 デジタルテレビ放送
10 オン・デ・マンド 映画/カラオケ配信サービス
11 ビデオ
12 ディスプレイモニター
13 音響テンプレート記憶部
14 音響テンプレート選択部
15 嗜好選択情報入力部
16 番号決定部
17 嗜好得点計算部
Claims (14)
- 音声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を作成し、入力される音声と前記ユーザーの嗜好情報に基づいた認識対象語彙とから単語を認識し、前記認識した単語を用いてユーザーの要求する番組を選択する番組指定方法。
- 入力された音声と音声認識の対象の単語である認識対象語彙とから前記単語を認識する音声認識によって得られる認識得点と、予め取得したユーザーの嗜好情報に基づいた前記認識対象語彙の嗜好得点とを使用して、認識結果を決定し、前記認識結果を用いてユーザーの要求する番組を選択する番組指定方法。
- 前記ユーザーの嗜好情報は、ユーザーが入力するユーザー識別記号、ユーザーの発声、ユーザーを識別する画像又はユーザーの発声が入力される時刻の少なくとも一つの情報を用いて選択されるものである請求項1又は請求項2記載の番組指定方法。
- 前記ユーザーの嗜好情報は、予め定めた同一番組の連続視聴時間が経過した場合、視聴側により番組を中断する場合、配信側により番組を中断する場合又は番組が終了した場合に学習するものである請求項1ないし請求項3のいずれか記載の番組指定方法。
- 前記ユーザーの嗜好情報は、番組の視聴履歴を用いて学習した情報である請求項1ないし請求項4のいずれか記載の番組指定方法。
- 前記番組の視聴履歴は、電子番組ガイドで提供される時間帯、ジャンル、出演者、出演グループ名、番組名、番組内容、テーマ、音楽、内容キーワード、ユーザー名の少なくとも1つを構成要素として持つ情報である請求項5記載の番組指定方法。
- 音声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を作成する認識対象語彙作成部と、ユーザーの発声する音声と前記ユーザーの嗜好情報に基づいた認識対象語彙とから単語を認識する認識部と、前記認識した単語を用いてユーザーの要求する番組を選択する要求信号を出力するセットトップボックスと、を含む番組指定装置。
- 音声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を作成する認識対象語彙作成部と、前記ユーザーの嗜好情報に基づいた認識対象語彙の嗜好得点を算出する嗜好得点計算部と、ユーザーの発声する音声と前記ユーザーの嗜好情報に基づいた認識対象語彙とから単語の認識得点を計算する認識部と、前記嗜好得点と前記認識得点とを使用して、認識結果を決定し出力する認識結果決定部と、前記認識決定部の認識結果を用いてユーザーの要求する番組を選択する要求信号を出力するセットトップボックスと、を含む番組指定装置。
- 前記ユーザーの嗜好情報は、ユーザーが入力するユーザー識別記号、ユーザーの発声、ユーザーを認識する画像又は前記ユーザーの発声が入力される時刻の少なくとも一つの情報を用いて選択されるものである請求項7又は請求項8記載の番組指定装置。
- 予め定めた同一番組の連続視聴時間が経過した場合、視聴側により番組が中断する場合、配信側により番組が中断する場合又は番組が終了した場合に、前記ユーザーの嗜好情報を学習する嗜好情報作成部を更に含む請求項7ないし請求項9のいずれか記載の番組指定装置。
- 前記ユーザーの嗜好情報は、番組の視聴履歴を用いて学習した情報である請求項7ないし請求項10のいずれか記載の番組指定装置。
- 番組の視聴履歴は、電子番組ガイドで提供される時間帯、ジャンル、出演者、出演グループ名、番組名、番組内容、テーマ、音楽、内容キーワード、ユーザー名の少なくとも1つを構成要素として持つ情報である請求項7ないし請求項11のいずれか記載の番組指定装置。
- 音声認識の対象とすべき全単語を格納した認識対象候補語彙から予め取得したユーザーの嗜好情報に基づいた認識対象語彙を作成し、入力される音声と前記ユーザーの嗜好情報に基づいた認識対象語彙とから単語を認識し、前記認識した単語を用いてユーザーの要求する番組を選択する番組指定方法をコンピュータに実行させるためのプログラム。
- 入力された音声と音声認識の対象の単語である認識対象語彙とから前記単語を認識する音声認識によって得られる認識得点と、予め取得したユーザーの嗜好情報に基づいた前記認識対象語彙の嗜好得点とを使用して、認識結果を決定し、前記認識結果を用いてユーザーの要求する番組を選択する番組指定方法をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003337213A JP2004120767A (ja) | 2003-09-29 | 2003-09-29 | 番組指定方法及び番組指定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003337213A JP2004120767A (ja) | 2003-09-29 | 2003-09-29 | 番組指定方法及び番組指定装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000097336A Division JP3525855B2 (ja) | 2000-03-31 | 2000-03-31 | 音声認識方法及び音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004120767A true JP2004120767A (ja) | 2004-04-15 |
Family
ID=32290790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003337213A Pending JP2004120767A (ja) | 2003-09-29 | 2003-09-29 | 番組指定方法及び番組指定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004120767A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009025753A (ja) * | 2007-07-23 | 2009-02-05 | Sony Corp | 音声認識装置及び音声認識方法 |
JP2010067153A (ja) * | 2008-09-12 | 2010-03-25 | Casio Comput Co Ltd | 路線検索装置および路線検索プログラム |
-
2003
- 2003-09-29 JP JP2003337213A patent/JP2004120767A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009025753A (ja) * | 2007-07-23 | 2009-02-05 | Sony Corp | 音声認識装置及び音声認識方法 |
JP2010067153A (ja) * | 2008-09-12 | 2010-03-25 | Casio Comput Co Ltd | 路線検索装置および路線検索プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11798528B2 (en) | Systems and methods for providing notifications within a media asset without breaking immersion | |
CN108391149B (zh) | 显示设备、控制显示设备的方法、服务器以及控制服务器的方法 | |
US11024312B2 (en) | Apparatus, system, and method for generating voice recognition guide by transmitting voice signal data to a voice recognition server which contains voice recognition guide information to send back to the voice recognition apparatus | |
US10586536B2 (en) | Display device and operating method therefor | |
JP4024678B2 (ja) | トランスクリプト情報のシンタックスに基づく番組分類方法および装置 | |
US20140006022A1 (en) | Display apparatus, method for controlling display apparatus, and interactive system | |
JP4869268B2 (ja) | 音響モデル学習装置およびプログラム | |
JP5149107B2 (ja) | 音響処理装置およびプログラム | |
KR20050023941A (ko) | 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법 | |
JP3799280B2 (ja) | 対話システムおよびその制御方法 | |
JP2001142481A (ja) | 音声/ビデオ装置用の制御システム及び音声/ビデオ構成を制御するための統合アクセスシステム | |
US9832526B2 (en) | Smart playback method for TV programs and associated control device | |
CA3185271A1 (en) | Voice identification for optimizing voice search results | |
JP4601306B2 (ja) | 情報検索装置、情報検索方法、およびプログラム | |
JP3525855B2 (ja) | 音声認識方法及び音声認識装置 | |
JP7131077B2 (ja) | 会話装置、ロボット、会話装置制御方法及びプログラム | |
JP2004120767A (ja) | 番組指定方法及び番組指定装置 | |
JP5912729B2 (ja) | 音声認識装置、音声認識プログラム、及び音声認識方法 | |
JP2001282285A5 (ja) | ||
JP4166616B2 (ja) | 嗜好情報利用型データ検索装置 | |
US20230267934A1 (en) | Display apparatus and operating method thereof | |
JP7229906B2 (ja) | コマンド制御装置、制御方法および制御プログラム | |
Mocanu et al. | Automatic subtitle synchronization and positioning system dedicated to deaf and hearing impaired people | |
JP4949310B2 (ja) | 音響処理装置およびプログラム | |
KR20230126109A (ko) | 디스플레이 장치 및 그 동작 방법 |