JP2001359010A - 放送方法および放送システム - Google Patents

放送方法および放送システム

Info

Publication number
JP2001359010A
JP2001359010A JP2000181315A JP2000181315A JP2001359010A JP 2001359010 A JP2001359010 A JP 2001359010A JP 2000181315 A JP2000181315 A JP 2000181315A JP 2000181315 A JP2000181315 A JP 2000181315A JP 2001359010 A JP2001359010 A JP 2001359010A
Authority
JP
Japan
Prior art keywords
program
additional information
data
unit
pronunciation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000181315A
Other languages
English (en)
Other versions
JP2001359010A5 (ja
Inventor
Nobuyuki Hiruma
伸行 比留間
Takayuki Ito
崇之 伊藤
Kazuaki Komine
一晃 小峯
Tomoyuki Inoue
友幸 井上
Hiroki Onishi
宏樹 大西
Takeshi Yumura
武 湯村
Naoyuki Yoda
直之 余田
Kazuyoshi Okura
計美 大倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Sanyo Electric Co Ltd
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Sanyo Electric Co Ltd, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2000181315A priority Critical patent/JP2001359010A/ja
Publication of JP2001359010A publication Critical patent/JP2001359010A/ja
Publication of JP2001359010A5 publication Critical patent/JP2001359010A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • Television Systems (AREA)

Abstract

(57)【要約】 【課題】 音声による操作の利便性、メモリコスト、シ
ステム運用メリットのすべてで有用な受像機と放送技術
が今後とくに求められる。 【解決手段】 EPG検出部120は放送波と別の通信
形式で付加情報62を取得し、その中から電子番組案内
EPGを抽出する。EPGの中の表示用データ130は
画面に出力され、解析用データ132および音声認識の
ための発音データ136と番組のリンク情報134が解
析テーブル110に格納される。音声認識部108はユ
ーザの発声を発音テーブル106に照らし、番組ごとに
設けられた複数の発音を含む発音グループ140を特定
し、番組同定部112が発音グループ140を解析テー
ブル110に照らして番組を同定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、放送方法および
放送システムに関する。この発明は特に、音声認識機能
を有する受像機で受信される放送波を送信する放送方法
と、その方法を実施する放送システムに関する。
【0002】
【従来の技術】いわゆるマルチメディア時代の本格化に
伴い、近年めざましい進展を遂げている情報通信、画像
・音声処理などの技術を基礎に、ユーザ、すなわち一般
需要者に提供されるサービスが高度化し、また多岐にわ
たるようになった。テレビジョン放送のデジタル化や高
画質化により、ユーザは非常に鮮明な映像を多数のチャ
ネルから選択できるようになった。
【0003】サービスの多様化に伴い、よりユーザフレ
ンドリーなマンマシンインタフェイスの重要性が高まっ
ている。人間の直観に沿うインタフェイスを提供しない
と、ユーザが機能の洪水にのみこまれる事態を招く。C
PUパワーの高まりを受け、ハイレベルな音声認識技術
が実用レベルに到達した今日、家電その他の製品に音声
認識機能を組み込んでユーザ操作の利便性を高める取組
がなされている。
【0004】特開平9−186943号公報には、音声
認識機能を備えたテレビジョン受信装置(以下、従来装
置という)が開示されている。この従来装置は、テレビ
ジョン放送電波に重畳された音声認識辞書更新データを
抽出し、これをもとに音声認識辞書の単語を更新する。
このことにより、番組の名称などを最新の状態で保持す
ることができ、従来装置の運用開始以降に企画された番
組についても音声認識率を高めるというものである。そ
の他の効果として、適宜更新を行うことで、音声認識辞
書の容量を抑制できる旨が述べられている。
【0005】
【発明が解決しようとする課題】第1の課題として、従
来装置は放送電波に重畳された音声認識辞書更新データ
を抽出するため、ユーザが音声認識辞書更新データの受
信タイミングを逃すと、しばらくは古いデータをもとに
音声認識を行う必要がある。
【0006】第2の課題として、従来装置は、更新動作
によって音声認識辞書の容量を抑制するが、それでも音
声認識辞書自体は当然にある程度汎用性をもって実装さ
れているので、容量低減にもある程度の限界がある。
【0007】本発明はこれらの課題に鑑みてなされたも
ので、その目的は、音声認識機能の効用を改善するこ
と、その際、既存の放送インフラとの親和性を維持する
ことにある。別の目的は、音声認識のために必要なメモ
リ容量を抑制しつつ、より高い音声認識率を実現するこ
とにある。さらに別の目的は、音声認識機能の改善に関
連するサービスをより円滑に実現することにある。
【0008】
【課題を解決するための手段】本発明において想定可能
な受像機は、放送波とは別の伝送形式にて送信される信
号を受信する通信部と、前記受信した信号から付加情報
を検出する付加情報検出部と、ユーザの音声を認識する
音声認識部と、前記音声認識部によって参照される発音
テーブルと、前記検出された付加情報に含まれる発音デ
ータを前記発音テーブルに登録する登録部とを含む。
【0009】「受像機」はなんらかの形で映像または画
像を受信する機能を有すればよく、テレビジョン受像機
のほか、通常のコンピュータ端末、携帯電話その他のモ
バイル機器、カーナビゲーション装置など、その形は本
質問題ではない。「別の伝送形式」は、電気、光、磁気
など、無線、有線を問わず、各種通信方式を含む。
【0010】「発音データ」は音声認識語彙データとも
よばれ、ユーザの発する音声の読みまたは発音を示すデ
ータである。「発音テーブル」は発音データを格納する
ものであるが、必ずしも従来一般に考えられる音声認識
用辞書のように汎用性を考えて多数のデータを保持して
いる必要はない。
【0011】小容量の発音テーブルで機能できるための
技術として、発音データの構造に改良を加えている。た
とえば、発音データは認識すべき単語と音声レベルで対
応している必要はなく、「イタリアセリエAの試合」と
いう番組を認識するために、「さっかー」「いたりあり
ーぐ」という概念のレベルで番組に対応していてもよ
い。また、発音データが単語と音声レベルで対応してい
る場合であっても、形態素へ分解することにより、「い
たりあ」「せりえ」など、ユーザが発する可能性のある
複数の発音をこの番組に対応する発音データとして保持
してもよい。さらに発音データは、認識すべき単語に関
連する情報に対応してもよい。たとえば、イタリアセリ
エAに所属する著名選手の名前に対応してもよい。こう
した配慮の結果、汎用性の高い辞書の必要性が薄くな
る。
【0012】この受像機では、放送波とは別に通信部が
設けられている。したがって、放送波の受信とは関係の
ないタイミングで付加情報を受信することができる。こ
のため、放送局側は従来どおり放送波を送信すればよ
く、インフラの変更は不要である。一方、受像機側は、
任意のタイミング、たとえばユーザが要求を出したタイ
ミングで付加情報を得ることができる。付加情報は付加
情報検出部で検出され、その中に含まれる発音データが
発音テーブルに登録される。したがって、音声認識部に
よる音声認識処理にはユーザが望む最新の発音データが
登録されている。
【0013】本発明のある形態は、放送の方法に関す
る。この方法は、受像機に送信すべき付加情報を生成す
る工程と、前記受像機に表示すべき映像信号および前記
付加情報を放送波に乗せて送信する工程とを含む。前記
付加情報は、異なる受像機の間で予め統一されたデータ
形式に従っている。
【0014】付加情報は以下の状態で生成される。付加
情報はまず、電子番組案内とそれに対応する発音データ
およびそれらのリンク情報を含む。さらに、電子番組案
内は、前記受像機に表示されるべき表示用データと、前
記受像機にて前記発音データをもとになされる音声認識
の結果番組を同定するために供される解析用データとを
含む。
【0015】この方法によれば、まず付加情報のデータ
形式が互換性をもつため、いろいろな受像機で受信およ
び利用することができ、システム全体の運用効率が高
い。また、前記のリンク情報の存在により、発音データ
から電子番組案内に含まれる番組の同定がダイレクトに
行われる。従来一般的な音声認識では、発音された可能
性の高い単語を辞書から選択する過程を経るが、本方法
では、発音された可能性の高い単語が直接番組にリンク
されている。したがって、非常に容量の小さな発音デー
タが辞書を代用し、メモリ等システムリソースの利用効
率、音声認識率、処理時間の面で有利である。
【0016】本発明の別の形態は、放送システムに関す
る。このシステムは、放送局と、その放送局から放送波
を受ける受像機を含む。放送局は、異なる受像機の間で
予め統一されたデータ形式に従い、それらの受像機に送
信すべき付加情報を生成する付加情報生成部と、前記生
成した付加情報を映像信号とともに放送波として送信す
る送信部を含む。一方、前記受像機は、ユーザの音声を
認識する音声認識部と、受信した放送波に含まれる前記
付加情報の中から電子番組案内を検出するEPG検出部
と、前記電子番組案内に対応する発音データを検出する
発音検出部と、前記電子番組案内と前記発音データとの
リンク情報を記録する解析テーブルと、前記音声認識部
における認識結果を前記解析テーブルに照合することに
よって番組を同定する番組同定部とを含む。この構成に
よれば、既述のごとく、システムの運用効率が高く、ま
たリンク情報の提供により、受像機側のコスト低減と機
能向上に寄与する。
【0017】本発明のさらに別の形態も放送システムに
関する。このシステムはサービスセンタを含む。このサ
ービスセンタは、付加情報生成部と、生成した付加情報
を受像機に送信する付加情報送信部とを含む。一方、受
像機は、サービスセンタから送信される信号を受信する
通信部と、前記受信した信号から付加情報を検出する付
加情報検出部と、ユーザの音声を認識する音声認識部
と、前記音声認識部によって参照される発音テーブル
と、前記検出された付加情報に含まれる発音データを前
記発音テーブルに登録する登録部とを含む。
【0018】このシステムでは、付加情報に関する業務
をサービスセンタが代行する。したがって、放送局は従
来どおりの方法で番組を放送すればよい。一方、受像機
はユーザの望むタイミングで付加情報を受信できる。ま
た、サービスセンタは複数の放送局の番組情報をもとに
付加情報を生成する機能をもってもよく、その場合、さ
らにシステム全体の運用効率が高まる。
【0019】本発明のさらに別の形態も放送システムで
ある。このシステムは番組放送装置と、その番組を享受
する番組受信装置を含み、前記番組送信装置から送信さ
れる番組に対する付加情報を生成するサービスセンタが
設けられている。このサービスセンタは、前記番組に関
する電子番組案内とそれに含まれる番組情報の発音デー
タを番組受信装置に送信する。一方、番組受信装置は、
前記発音データを用いてユーザの音声から前記電子番組
案内に含まれる番組を同定する。
【0020】
【発明の実施の形態】[実施の形態1]図1は、実施の
形態1に係る放送技術にて利用可能なテレビジョン受像
機10の構成を示す。このテレビジョン受像機10は主
に、放送波から映像と音声を再生出力するテレビジョン
受像機の一般的機能と、電子番組案内(Electronic Pro
gram Guide、以下「EPG」と略記する)の表示、番組
の選択などを音声認識をベースに行う付加的機能を有す
る。なお、一般的機能はアナログ、デジタル、ハイブリ
ッドいずれの方式でもよいし、地上放送、衛星放送な
ど、放送の方式も問わない。図1では、デジタル放送受
像機を考える。
【0021】一般的機能のための構成は以下のとおりで
ある。まず、放送波70はアンテナ12を介してチュー
ナ14へ与えられる。チューナ14はユーザが選んだチ
ャネルを含むトランスポンダを選択し、QPSK復調を
施す。復調で得られた複数のトランスポートポケットを
含むストリームはパケット分離部16へ送られる。パケ
ット分離部16はデマルチプレクサであり、所望のチャ
ネルに対応するパケットを分離して映像・音声デコーダ
18へ出力する。映像・音声デコーダ18は、例えばM
PEGデコーダであり、入力されたパケットを復号し、
音声データを音声信号処理部20へ、映像データを映像
信号処理部26へそれぞれ出力する。音声信号処理部2
0は入力された音声データに所定の処理を施し、最終的
に音声が音声信号出力部22を経てスピーカ24へ出力
される。映像信号処理部26は入力された映像データに
所定の処理を施し、処理後のデータを合成部28へ出力
する。合成部28は、映像信号処理部26から入力した
データと後述するOSD部44から入力したデータとを
合成し、合成後のデータをNTSCエンコーダ30へ出
力する。NTSCエンコーダ30でビデオ信号に変換さ
れた映像信号はCRT32へ出力され、表示される。な
お、映像データ、音声データとも、デジタル信号のまま
テレビジョン受像機10から外部の任意の機器へ出力し
てもよい。
【0022】一方、付加的機能のための構成は以下のと
おりである。主制御部36は、テレビジョン受像機10
全体を統括的に制御する。主制御部36は、CPU38
と、システムの起動に必要なプログラム等が格納された
ROM40と、プログラムエリアまたはワークエリアと
して利用されるDRAM42を含む。後述の音声認識に
関する各種テーブルは、図示しない二次記憶装置に保存
され、適宜DRAM42にロードされてもよいし、RO
M40がEEPROM(電気的消去およびプログラム可
能なROM)やFLASHメモリなどで構成されるとき
は、そのリザーブエリアに記録されてもよいし、電池で
バックアップされたSRAM(図示せず)があるとき
は、それに記録されてもよい。VRAM46は、映像・
音声デコーダ18における映像信号の復号の際にフレー
ムメモリとして利用されるほか、OSD部44へ画像デ
ータを送る際にバッファとして利用される。
【0023】通信部34は、放送波とは異なる通信形式
をサポートする。ここでは、通常の回線を介した電気通
信機能をもつモデムおよび通信プログラムを含むとす
る。ただし、通信部34は、たとえばUSB、RS−2
32C、イーサネット(登録商標)などの仕様に応じた
プロトコル変換機能を備えてもよく、その形式自体は本
質問題ではない。
【0024】主制御部36はユーザの指示に従い、通信
部34に対して付加情報、とくにEPGの送信要求60
を指示する。通信部34で受信された付加情報62は主
制御部36へ送られる。ユーザの指示は、マイクロフォ
ン54を介して音声で入力されるほか、リモコン(図示
せず)からの信号を受けたリモコン受光部48を介して
入力される。
【0025】メディアI/F回路50は、ICカード5
6、図示しないフロッピー(登録商標)ディスク、M
O、CD−ROMその他の記録媒体からデータやプログ
ラムを主制御部36へ読み込む。読み込まれるデータの
例として、オフラインで提供されるEPG、発音データ
などがある。プログラムの例として、テレビジョン受像
機10が受信した信号から付加情報を検出する機能と、
音声認識の際に参照される発音テーブルを生成する機能
と、検出された付加情報に含まれる発音データを発音テ
ーブルに登録する機能とを含むものや、これに加えて、
EPGに対応する発音データを検出する機能を含むもの
がある。実施の形態1では、付加情報は放送局とは別に
設けられたサービスセンタ(図示せず)から送られるも
のとする。
【0026】時計IC52は、音声認識をもとにチャネ
ルの切替や録画を行うために主制御部36へ時刻を通知
する。OSD部44は、主制御部36から入力されたデ
ータ、とくにEPGを映像信号処理部26から与えられ
た映像データにスーパーインポーズするか、またはそれ
らの一方を選択して出力する。
【0027】図2は、主制御部36の内部構成を示す。
図1における主制御部36はコンポーネント単位で表現
されたが、図2は機能ブロックを示す。したがって、図
2の各構成要素は、通常は図1のCPU38とDRAM
42にロードされたプログラムを中心に実現されるが、
その実現方法にいろいろな変形例があることは、当業者
には理解されるところである。
【0028】付加情報要求部100は、ユーザの指示に
したがい、サービスセンタに付加情報62を送信するよ
う要求60を出す。付加情報62とは、主に前述の付加
的機能に関係する情報で、ユーザに対するサービスの充
実を図るものである。ただし、ユーザは付加情報62と
いう形で意識しておらず、たとえば単に「EPG送付」
という形で要求を出す。EPGを含む付加情報62の構
成は図3で後述する。
【0029】付加情報検出部102は、サービスセンタ
から通信部34を介して取得された付加情報62を検出
する。付加情報検出部102はEPG検出部120を含
み、EPG検出部120は付加情報62に含まれるEP
Gを検出する。EPGの構成は図4で後述する。EPG
のデータは、CRT32における視認を目的とするデー
タ(以下「表示用データ」という)と、音声認識からユ
ーザの望む番組を同定するために利用されるデータ(以
下「解析用データ」という)を含む。分離抽出部122
はこれらのデータを分離した後、表示用データ130を
OSD部44へ出力し、解析用データ132を解析テー
ブル110へ格納する。表示用データ130の画面イメ
ージは図5で後述する。
【0030】付加情報検出部102はさらに、発音検出
部124を含む。発音検出部124は付加情報62の中
からEPGに対応する発音データ136と、EPGと発
音データ136のリンク情報134を検出する。発音デ
ータ136は、EPGに含まれる番組ごとにユーザが発
声するであろう単語の読みに関するもので、図6にて後
述するごとく、番組ごとに複数の発音の可能性をそれぞ
れG1、G2…のようにグループ化して割り当ててい
る。リンク情報134は解析テーブル110へ格納され
る。登録部104は、発音検出部124から送られた発
音データ136を発音テーブル106へ登録する。
【0031】音声認識部108は、マイクロフォン54
で集音したユーザの声のデータを発音テーブル106に
照らし、ユーザが発した音声が含まれると判断できる前
述のグループ(以下「発音グループ140」という)を
特定してこれを番組同定部112へ通知する。番組同定
部112は、発音グループ140をサーチキーとして解
析テーブル110に検索を掛けることでユーザの意図し
た番組を同定する。同定の結果は確認部114へ通知さ
れる。確認部114は、OSD部44を介してその番組
を画面上でハイライト表示することにより、ユーザに確
認をとる。ユーザはハイライト表示された番組が自分の
意図したものであれば、リモコンを通して確認部114
へ同意の通知を返す。確認は音声で実施してもよく、テ
レビジョン受像機10とユーザ間の相互作用的な方法で
確認がなされる。
【0032】確認部114は同意された番組の情報を予
約設定部116へ通知する。予約設定部116は時計I
C52から時刻を参照しており、ユーザの所望する番組
がすでに放送中でればチューナ14へ指令を出し、チャ
ネル切替を行う。ユーザの所望する番組が後に放送され
るものであれば、チャネル切替予約を設定し、その時刻
になればチューナ14へ指令を出す。
【0033】図3は、付加情報62のデータフォーマッ
トを示す。付加情報62は、EPG180とリンク情報
134を含み、EPG180はさらに、表示用データ1
30、解析用データ132および発音データ136を一
体に含んでいる。
【0034】図4は、EPG180のファイルの内容を
概念的に示している。EPG180は、例えばHTML
やXMLなどのマークアップ言語で記述されており、そ
の実体は表示用データ130、解析用データ132およ
び発音データ136を識別記号、すなわちタグで区別可
能な状態で埋め込んだ単一のテキストファイルである。
同図左欄の「L1:」等は説明のためのテキストライン
番号であり、実際のファイルには記述されていない。
【0035】同図のごとくEPG180には、<番組>
タグと</番組>タグで囲まれるL1〜19に番組に関
する情報が記述され、その中に番組のコード「P5」
(L2)、チャネル(L3)、番組名(L4〜5)とそ
の発音(L6〜11)、番組のジャンル(L12)とし
て「スポーツ」とその発音(L13)、同じく番組のジ
ャンル(L14)として「サッカー」とその発音(L1
5)、番組の日付(L16)、番組の開始時刻と継続時
間(L17〜18)が記述されている。番組のコード
「P5」は番組を特定する際、インデックスとして利用
される。
【0036】以上のラインのうち、<発音>タグと</
発音>タグで囲まれる部分が図3の発音データ136に
当たり、それら以外が番組を特定するために利用される
解析用データ132に相当する。これらのテキストライ
ンは、OSD部44における画像の合成に影響しないよ
う、表示用のタグと重ならない配慮がされている。マー
クアップ言語のブラウジング機能は、主制御部36に実
装してもよいし、OSD部44に実装してもよい。な
お、L1〜19のテキストはひとつの番組について生成
されるものであり、実際には複数の番組のテキストがE
PG180の中に繰り返し記述される。
【0037】複数の番組に関するテキストに引き続き、
Lx以降のテキストラインに、図3の表示用データ13
0に相当するデータが記述されている。この部分には、
ユーザに見やすい形でEPGを表示するためのタグおよ
びテキストが並んでいる。そうしたタグの例として、画
面の一部に静止画や動画を取り込むもの、背景画を取り
込むもの、フォントやその色を指定するもの、テキスト
の表示位置や改行を指定するものなどがある。
【0038】図5は、図4に記述された表示用データ1
30に従ってCRT32に表示されたEPGを示す。E
PGは番組表1300と、補助領域1302および画像
枠1304を含む。ここでは番組表1300は、3つの
チャネルとそれらの17時から3時間の番組、たとえぱ
NHKハイビジョンの「おかあさんといっしょ」「今日
の料理」、BS1の「サッカーワールドカップフランス
大会ハイライト」などが示されている。これら以外のチ
ャネルを表示したいときは「右の番組」または「左の番
組」を指示し、20時以降の番組を知りたいときは「次
の番組」を指示することにより、必要な箇所が表示され
る。番組表1300に示される各番組には、先のEPG
180において、それぞれ番組コードP1〜P7がユー
ザからは見えない形で割り振られている。
【0039】補助領域1302は、ユーザの操作を容易
にする補助ウインドウである。ここでは、検索の方法な
どの他、確認ボタン1306が設けられている。画像枠
1304は、番組の内容紹介を動画で小さく紹介するウ
インドウである。ここには、ユーザが音声で予約した番
組の紹介映像が流れる構成としてもよい。
【0040】図6は、発音テーブル106の内容を示
す。発音テーブル106は、番組ごとにひとつずつ設け
られたG1、G2…などの発音グループ140と、それ
らの各グループに属する発音データ136を含む。たと
えば、発音グループG5は番組「サッカーワールドカッ
プフランス大会ハイライト」に対応するもので、図4の
発音タグにしたがって、その番組を指定する際にユーザ
が発するであろう発音データが「さっかー」「わーるど
かっぷ」「ふらんすたいかい」「はいらいと」と格納さ
れている。長い番組名はユーザが省略して発声する可能
性に配慮されている。音声認識部108は、実際にユー
ザが発したことばから発音グループ140を特定し、こ
れを番組同定部112へ伝える。
【0041】図7は、解析用データ132およびリンク
情報134によって構成される解析テーブル110を示
す。解析テーブル110は、EPG180から分離抽出
部122によって抽出された解析用データ132と、付
加情報62から発音検出部124によって抽出されたリ
ンク情報134を記入することで形成される。リンク情
報134は、コード160と発音グループ140の対応
を1:1に記述する情報で、たとえば、 「P1−G1,P2−G2,...,Pn−Gn」 のような形で付加情報62に盛り込まれている。このリ
ンク情報134が図7では各番組コードPiに各発音グ
ループGiを並べることで明示されている。
【0042】解析テーブル110の中で、発音グループ
140以外の部分は、解析用データ132を番組名16
2、チャネル164、時刻168、その他170の各項
目に並べ替えることで生成される。その他170には、
番組のジャンルのほか、出演者、ロケ地、講評など、ユ
ーザが検索の際利用できそうな情報を盛り込む。番組同
定部112は、音声認識部108から通知される発音グ
ループ140をサーチキーとして解析テーブル110を
検索し、コード160を同定して番組の情報を得る。
【0043】なお、ここで留意すべきことは、たとえば
「ニュース」のように、同一チャネルでも複数回放送さ
れる番組の存在である。その場合、「Pm,Pn−G
j」のように、ひとつの発音グループ140が複数のコ
ード160に対応するため、番組同定部112は複数の
候補を確認部114に通知し、確認部114がユーザに
選択させる。または、ユーザが発声した時刻により近い
時刻のニュースを第1の候補としてユーザに確認しても
よい。当然ながら、複数の候補のうち、すでに放送が終
了しているものは候補から落としてもよい。
【0044】確認部114による番組の確認には、既述
のハイライト表示のほか、ブリンク、反転表示、背景色
変換などの強調表示のほか、音声による通知も可能であ
る。また、番組同定部112で同定された番組が図5で
表示された範囲に入っていないとき、「右の番組」等の
番組表1300の移動処理を行い、その番組を表示させ
てもよい。番組の候補が複数存在するとき、番組表13
00の行または列のうち候補に関係のないものを削除す
ることで、同一画面に複数の候補を表示してもよい。別
の方法として、複数の候補をまとめて表示する新たなウ
インドウを生成してもよい。候補が複数存在する場合、
ユーザが過去に選択した番組の優先度を上げて表示して
もよく、そうした学習機能を設けてもよい。これらの方
法は、確認部114の機能として実装することができ
る。
【0045】図8は、音声認識から番組を同定する準備
として、テレビジョン受像機10がなすべき処理の手順
をまとめたフローチャートである。同図のごとく、ユー
ザの指示にしたがい、付加情報要求部100から付加情
報62の要求60が出される(S10)。つづいて、サ
ービスセンタから送信された付加情報62が受信され
(S12)、EPG検出部120によるEPGの検出動
作が開始され(S14)、EPGがあれば(S16の
Y)、分離抽出部122による表示用データ130と解
析用データ132の分離が行われる(S20)。つぎ
に、発音検出部124によって発音データ136とリン
ク情報134が検出され(S22)、発音テーブル10
6と解析テーブル110が生成され(S24)、処理を
終える。以上の処理により、番組の音声認識に必要なデ
ータがテレビジョン受像機10内に実装される。なお、
S16において、付加情報62にEPGが含まれていな
い場合(S16のN)、そのEPGの内容にしたがった
別の処理が行われ(S18)、処理を終了する。
【0046】図9は、実際に音声認識から番組を同定す
る手順を示すフローチャートである。同図のごとく、ま
ずユーザが発した声をマイクロフォン54で取得し(S
50)、これが発音テーブル106に含まれるかどうか
音声認識部108で解析する(S52)。含まれないと
判断されたとき(S52のN)、図8の処理(S10〜
S24)をユーザの許可にしたがって、または自動的に
実行し、しかる後、再度音声認識を実施する。同図では
認識できるまで図8の処理を繰り返すことになるが、図
8の処理は1回だけ実行し、その後でもまだ認識ができ
ない場合、後述のS66のエラー処理に移行してもよ
い。
【0047】音声認識部108でユーザの発声が発音テ
ーブル106に存在すると判断されたとき(S52の
Y)、発音グループ140が同定され(S56)、その
結果を受けた番組同定部112が解析テーブル110を
参照して(S58)、番組を同定する(S60)。つづ
いて、確認部114からユーザへの確認要請が出され
(S64)、ユーザが同意した場合(S64のY)、予
約等の処理を実施する(S68)。ユーザが同意しない
場合(S64のN)、ユーザにリモコンを用いた番組の
直接指定を要請し、またはユーザに再度発声を促すなど
のエラー処理を行う(S66)。
【0048】以上、実施の形態1によれば、ユーザの求
めるタイミングで付加情報62を取得でき、また汎用的
な音声認識辞書を設けなくとも効率的にユーザの求める
番組を同定することができる。また、放送局側のインフ
ラを変更する必要がない。さらに、表示されたEPG上
で最新かつ整合性のある選択が可能な状態にテレビジョ
ン受像機10を保つことができ、ユーザの利便性を高め
ることができる。
【0049】[実施の形態2]実施の形態1では、テレ
ビジョン受像機10が放送波70と別の経路で付加情報
62を取得した。実施の形態2の放送技術にて利用可能
なテレビジョン受像機10は、同一の経路、すなわち放
送波70に多重化された付加情報62を取得する。付加
情報62は、映像データを格納するパケット内の所定の
領域に組み込まれる。アナログ放送の場合は垂直帰線期
間などに重畳させることができる。付加情報62が放送
波70に乗せられているため、実施の形態2ではサービ
スセンタを仮定しない。放送波70は多数のテレビジョ
ン受像機10における受信を前提とし、したがって付加
情報62を放送波70に多重化するデータフォーマット
は、いろいろな機器メーカのいろいろな型番のテレビジ
ョン受像機10において標準化され、複数の放送局で採
用されることが望ましい。
【0050】図10は、実施の形態2に係る放送技術に
て利用可能なテレビジョン受像機10の構成を示す。こ
のテレビジョン受像機10は実施の形態1において説明
したテレビジョン受像機10と異なり、通信部34を有
さない。そのため付加情報62を別の箇所、ここではパ
ケット分離部16の出力から検出する。図11は、主制
御部36の内部構成を示す。実施の形態1にて説明した
主制御部36と比較し、通信部34の削除に伴い、付加
情報要求部100が削除されている。その他の点は実施
の形態1同様のため、説明を略す。
【0051】以上、実施の形態2においても汎用的な音
声認識辞書を設けなくとも効率的にユーザの求める番組
を同定することができ、また多数のテレビジョン受像機
10に共通化された付加情報62の伝送の採用によっ
て、比較的低コストで放送の付加価値を高めることがで
きる。
【0052】[実施の形態3]図12は、実施の形態3
に係る放送システム200である。放送システム200
は、番組送信装置である放送局202と、番組受信装置
である複数のテレビジョン受像機10を含む。テレビジ
ョン受像機10は、実施の形態2にて説明した装置であ
る。
【0053】放送局202は、番組情報をもとに付加情
報62を生成する付加情報生成部212と、放送すべき
映像、音声を符号化する映像・音声エンコーダ210を
もつ。信号合成部206は、符号化データと付加情報6
2を合成する。送信部204は、合成された信号を放送
波70に乗せて送信する。合成条件設定部208は、信
号合成部206における合成の条件を設定する。付加情
報62を符号化データに合成する条件として、例えば
「一定時間ごと」「番組が切り替わるたび」「常時」な
どのタイミングを設定する。一方、テレビジョン受像機
10は、アンテナ12を介して付加情報62を含む放送
波70を受信し、実施の形態2の手順で処理を行う。
【0054】付加情報生成部212において参照される
番組情報のフォーマットは予め決められていることが望
ましく、その場合デジタルデータの形で番組情報を入力
することにより、付加情報62を効率的に生成すること
ができる。以上、実施の形態3によれば、実施の形態2
の利点を放送システム全体で活かすことができる。
【0055】[実施の形態4]図13は、実施の形態4
に係る放送システム200である。放送システム200
は、番組送信装置である放送局202と、番組受信装置
である複数のテレビジョン受像機10と、さらにサービ
スセンタ300を含む。テレビジョン受像機10は、実
施の形態1にて説明した装置である。サービスセンタ3
00は、テレビジョン受像機10を製造したメーカ、放
送局202、またはそれらで組織するコンソーシアムな
どで運用してもよいし、第三者機関に委ねてもよい。
【0056】放送局202は、一般的な放送局同様の構
成で、放送すべき映像、音声を符号化する映像・音声エ
ンコーダ210と、符号化データを送信する送信部20
4を含む。放送局202は、番組情報をデジタルデータ
の形で生成し、これをサービスセンタ300へ送信する
サービスセンタインタフェイス部(図示せず)をさらに
備えてもよい。
【0057】サービスセンタ300は、実施の形態2の
放送局202から付加情報62の生成と送信を切り離し
てサービスする。付加情報生成部212は、放送局20
2から番組情報を受信し、付加情報62を生成する。付
加情報62は付加情報送信部302へ転送される。要求
受付部304は、テレビジョン受像機10から付加情報
62に対する要求60を受信する。要求60の受信がト
リガとなり、付加情報送信部302からテレビジョン受
像機10へ付加情報62が送信される。以降、テレビジ
ョン受像機10における処理は既述のとおりである。以
上、実施の形態4によれば、実施の形態1の利点を放送
システム全体で活かすことができる。サービスセンタ3
00がより多数の放送局202の番組をカバーすること
により、ユーザは一貫性と統一性のあるサービスを享受
することができ、かつシステム全体の運用コストを抑え
ることができる。
【0058】[実施の形態5]図14は、実施の形態1
にて説明したテレビジョン受像機10をホームネットワ
ーク420に接続して利用するホームエレクトロニクス
システム400の構成を示す。ホームネットワーク42
0には、テレビジョン受像機10のほかに、番組を録画
する録画装置410と、ホームサーバ402が接続され
ている。
【0059】テレビジョン受像機10は、番組同定部1
12で同定した番組に関する情報を通信部34経由で一
旦ホームサーバ402へ送る。ホームサーバ402は、
この情報を録画装置410における録画予約のためのコ
マンドへ変換し、当該コマンドを録画装置410へ送信
する。録画装置410の通信部412は、送信されたコ
マンドを受信し、録画設定部414がこのコマンドに基
づいて録画の予約を行う。
【0060】以上、このホームエレクトロニクスシステ
ム400によれば、実施の形態1の利点を複数の機器に
よって統合的に実現される機能に導入することができ
る。なお、ホームネットワーク420には当然別の機器
が接続されてもよい。ホームサーバ402は必須ではな
く、テレビジョン受像機10と録画装置410がピアト
ゥピアに接続されてもよい。
【0061】以上、本発明をいくつかの実施の形態をも
とに説明した。これらの実施の形態は例示であり、それ
らの各構成要素や各処理プロセスの組合せにいろいろな
変形例が可能なこと、またそうした変形例も本発明の範
囲にあることは当業者に理解されるところである。たと
えば、図2の主制御部36の内部構成の組合せは非常に
自由度が高く、付加情報要求部100を付加情報検出部
102の中に設けたり、EPG検出部120と発音検出
部124を一体化したり、リンク情報134の抽出を発
音検出部124の代わりに分離抽出部122で行うな
ど、あえて説明するまでもなく、いろいろな可能性があ
る。図1において主制御部36をいずれの部分に設定す
るかについても、当然にいろいろな変形がある。
【0062】本発明は当然ながらテレビジョン受像機以
外の装置に適用でき、そうしたものも本発明の範囲にあ
る。たとえば、本発明をパーソナルコンピュータに適用
する場合、アンテナ12からCRT32およびスピーカ
24に至る経路、すなわち実施の形態1において「一般
的機能」とした部分をパーソナルコンピュータの表示処
理系、音声処理系回路および制御プログラムに置き換え
ればよい。携帯電話その他の機器への適用も同様であ
る。
【0063】図3で述べた付加情報62のEPG180
は、表示用データ130、解析用データ132および発
音データ136を一体にもつものであったが、これにも
設計の自由度がある。たとえば、表示用データ130と
解析用データ132だけを一体にもち、発音データ13
6を別ファイルで送ってもよいし、逆にリンク情報13
4もEPG180に一体化してもよいし、その他いろい
ろな組合せがある。いずれの場合も、ファイルサイズや
サービスの形態などの諸要素に鑑みた運用をなせばよ
い。
【0064】図4のEPG180の構成にもいろいろな
例がある。当然、EPG180はテキストファイルでな
くてもよいし、意味をなすデータブロックであれば差し
支えない。
【0065】図8では、付加情報62に対する要求60
があったことを契機として付加情報62の送信がなされ
たが、付加情報62の送信は要求60があったときに加
え、または要求60の有無と関係なく一定時間間隔など
で行ってもよい。
【0066】図10では、付加情報62をパケット分離
部16の出力から検出したが、これも映像・音声デコー
ダ18の出力など他の箇所において検出してもよい。
【0067】
【発明の効果】本発明によれば、受像機に関連する音声
認識機能の効用を改善することができる。また、音声認
識に必要なメモリ容量を抑制しつつ、高い音声認識率を
実現するができる。さらに、ユーザの利便性とシステム
運用効率がともに高い放送サービスが実現する。
【図面の簡単な説明】
【図1】 実施の形態1に係る放送技術に利用可能なテ
レビジョン受像機の構成図である。
【図2】 図1の主制御部の内部構成図である。
【図3】 付加情報のデータ構成図である。
【図4】 EPGファイルの概念図である。
【図5】 画面に表示されたEPGの外観図である。
【図6】 発音テーブルの構成図である。
【図7】 解析テーブルの構成図である。
【図8】 音声認識の準備手順を示すフローチャートで
ある。
【図9】 音声認識の手順を示すフローチャートであ
る。
【図10】 実施の形態2に係る放送技術に利用可能な
テレビジョン受像機の構成図である。
【図11】 図10の主制御部の内部構成図である。
【図12】 実施の形態3に係る放送システムの構成図
である。
【図13】 実施の形態4に係る放送システムの構成図
である。
【図14】 実施の形態5に係るホームエレクトロニク
スシステムの構成図である。
【符号の説明】
34 通信部、 36 主制御部、 62 付加情報、
100 付加情報要求部、 102 付加情報検出
部、 104 登録部、 106 発音テーブル、 1
08 音声認識部、 110 解析テーブル、 112
番組同定部、114 確認部、 120 EPG検出
部、 122 分離抽出部、 124発音検出部、 1
30 表示用データ、 132 解析用データ、 13
4 リンク情報、 136 発音データ、 140 発
音グループ、 180 EPG、 200 放送システ
ム、 202 放送局、 204 送信部、 212付
加情報生成部、 300 サービスセンタ、 302
付加情報送信部、 400 ホームエレクトロニクスシ
ステム。
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 5/44 G10L 3/00 571A 7/025 H04N 7/08 A 7/03 7/035 (72)発明者 伊藤 崇之 東京都世田谷区砧一丁目10番11号 日本放 送協会放送技術研究所内 (72)発明者 小峯 一晃 東京都世田谷区砧一丁目10番11号 日本放 送協会放送技術研究所内 (72)発明者 井上 友幸 東京都渋谷区神南二丁目2番1号 日本放 送協会 放送センター内 (72)発明者 大西 宏樹 大阪府守口市京阪本通2丁目5番5号 三 洋電機株式会社内 (72)発明者 湯村 武 大阪府守口市京阪本通2丁目5番5号 三 洋電機株式会社内 (72)発明者 余田 直之 大阪府守口市京阪本通2丁目5番5号 三 洋電機株式会社内 (72)発明者 大倉 計美 大阪府守口市京阪本通2丁目5番5号 三 洋電機株式会社内 Fターム(参考) 5C025 CA09 CA20 CB10 DA05 5C063 EB32 EB33 EB41 EB50 5D015 GG03 KK01 KK02 LL05

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 異なる受像機の間で予め統一されたデー
    タ形式に従い、それらの受像機に送信すべき付加情報を
    生成する工程と、 前記受像機に表示すべき映像信号および前記付加情報を
    放送波に乗せて送信する工程とを含み、 前記付加情報は、それが電子番組案内、前記電子番組案
    内に対応する発音データおよびそれらのリンク情報を含
    み、かつ前記電子番組案内が、前記受像機に表示される
    べき表示用データと、前記受像機にて前記発音データを
    もとになされる音声認識の結果番組を同定するために供
    される解析用データとを含むよう生成されることを特徴
    とする放送方法。
  2. 【請求項2】 前記電子番組案内は、単一のデータブロ
    ックに含まれ、かつ当該データブロックの中に前記表示
    用データと解析用データが識別記号をもとに分離可能な
    状態で埋め込まれていることを特徴とする請求項1に記
    載の放送方法。
  3. 【請求項3】 放送局と、その放送局から放送波を受け
    る受像機を含む放送システムにおいて、 前記放送局は、 異なる受像機の間で予め統一されたデータ形式に従い、
    それらの受像機に送信すべき付加情報を生成する付加情
    報生成部と、 前記生成した付加情報を映像信号とともに放送波として
    送信する送信部を含み、 前記受像機は、 ユーザの音声を認識する音声認識部と、 受信した放送波に含まれる前記付加情報から電子番組案
    内を検出するEPG検出部と、 前記付加情報から前記電子番組案内に対応する発音デー
    タを検出する発音検出部と、 前記電子番組案内と前記発音データとのリンク情報を記
    録する解析テーブルと、 前記音声認識部における認識結果を前記解析テーブルに
    照合することによって番組を同定する番組同定部と、 を含むことを特徴とする放送システム。
  4. 【請求項4】 放送局と、その放送局から放送波を受け
    る受像機を含む放送システムにおいて、 この放送システムはサービスセンタを含み、 このサービスセンタは、 前記受像機にて利用されるべき付加情報を生成する付加
    情報生成部と、 前記生成した付加情報を前記受像機に送信する付加情報
    送信部とを含み、 前記受像機は、 前記サービスセンタから送信される信号を受信する通信
    部と、 前記受信した信号から付加情報を検出する付加情報検出
    部と、 ユーザの音声を認識する音声認識部と、 前記音声認識部によって参照される発音テーブルと、 前記検出された付加情報に含まれる発音データを前記発
    音テーブルに登録する登録部と、 を含むことを特徴とする放送システム。
  5. 【請求項5】 番組送信装置と、その番組を享受する番
    組受信装置を含む放送システムにおいて、 前記番組送信装置から送信される番組に対する付加情報
    を生成するサービスセンタを設け、 このサービスセンタは、前記付加情報として前記番組に
    関する電子番組案内とそれに含まれる番組情報の発音デ
    ータを前記番組受信装置に送信し、 前記番組受信装置は、前記発音データを用いてユーザの
    音声から前記電子番組案内に含まれる番組を同定するこ
    とを特徴とする放送システム。
JP2000181315A 2000-06-16 2000-06-16 放送方法および放送システム Pending JP2001359010A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000181315A JP2001359010A (ja) 2000-06-16 2000-06-16 放送方法および放送システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000181315A JP2001359010A (ja) 2000-06-16 2000-06-16 放送方法および放送システム

Publications (2)

Publication Number Publication Date
JP2001359010A true JP2001359010A (ja) 2001-12-26
JP2001359010A5 JP2001359010A5 (ja) 2005-10-06

Family

ID=18682265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000181315A Pending JP2001359010A (ja) 2000-06-16 2000-06-16 放送方法および放送システム

Country Status (1)

Country Link
JP (1) JP2001359010A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002041081A (ja) * 2000-07-28 2002-02-08 Sharp Corp 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体
JP2004295102A (ja) * 2003-03-13 2004-10-21 Matsushita Electric Ind Co Ltd 音声認識辞書作成装置及び情報検索装置
JP2005151195A (ja) * 2003-11-17 2005-06-09 Casio Comput Co Ltd デジタル放送受像装置およびプログラム
JP2005277955A (ja) * 2004-03-25 2005-10-06 Sharp Corp 記録装置、記録システム及び遠隔操作機
JP2009258293A (ja) * 2008-04-15 2009-11-05 Mitsubishi Electric Corp 音声認識語彙辞書作成装置
WO2015045039A1 (ja) * 2013-09-25 2015-04-02 株式会社東芝 方法、電子機器およびプログラム
JP2022034708A (ja) * 2020-08-19 2022-03-04 Tvs Regza株式会社 受信装置、および、受信装置のプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002041081A (ja) * 2000-07-28 2002-02-08 Sharp Corp 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体
JP2004295102A (ja) * 2003-03-13 2004-10-21 Matsushita Electric Ind Co Ltd 音声認識辞書作成装置及び情報検索装置
JP4601306B2 (ja) * 2003-03-13 2010-12-22 パナソニック株式会社 情報検索装置、情報検索方法、およびプログラム
JP2005151195A (ja) * 2003-11-17 2005-06-09 Casio Comput Co Ltd デジタル放送受像装置およびプログラム
JP2005277955A (ja) * 2004-03-25 2005-10-06 Sharp Corp 記録装置、記録システム及び遠隔操作機
JP2009258293A (ja) * 2008-04-15 2009-11-05 Mitsubishi Electric Corp 音声認識語彙辞書作成装置
WO2015045039A1 (ja) * 2013-09-25 2015-04-02 株式会社東芝 方法、電子機器およびプログラム
JP5902359B2 (ja) * 2013-09-25 2016-04-13 株式会社東芝 方法、電子機器およびプログラム
JP2022034708A (ja) * 2020-08-19 2022-03-04 Tvs Regza株式会社 受信装置、および、受信装置のプログラム
JP7316983B2 (ja) 2020-08-19 2023-07-28 Tvs Regza株式会社 受信装置、および、受信装置のプログラム

Similar Documents

Publication Publication Date Title
CN103517119B (zh) 显示设备、控制显示设备的方法、服务器以及控制服务器的方法
JP4459267B2 (ja) 辞書データ生成装置及び電子機器
JP4410929B2 (ja) 情報出力制御装置及び情報出力制御方法
EP1031964A2 (en) Automatic search of audio channels by matching viewer-spoken words against closed-caption text or audio content for interactive television
CN103916704A (zh) 对话型接口设备及其控制方法
US10114813B2 (en) Mobile terminal and control method thereof
US9516363B2 (en) System, video display apparatus, content server, and information terminal device
JP5132600B2 (ja) 番組関連情報活用システムおよび番組関連情報活用方法
JP2004056226A (ja) ディジタル放送受信装置
MXPA06007796A (es) Programa y alertas de datos y corrientes de datos auxiliares en un sistema de difusion de canales multiples.
JP2001359010A (ja) 放送方法および放送システム
JP2000244838A (ja) 番組選択装置及び番組選択方法
RU2450344C2 (ru) Устройство и метод формирования потока данных и устройство и метод считывания потока данных
JP5023803B2 (ja) 情報処理装置、情報処理方法、並びにプログラム
WO2007086683A1 (en) System and method to provide multi-modal epg service on dmb/dab broadcasting system using extended epg xml with voice tag
JP5649769B2 (ja) 放送受信装置
JP4987556B2 (ja) キーワード設定方法
KR102307330B1 (ko) 수신 장치 및 수신 방법
CN101600078B (zh) 在显示设备中提供手册的方法和设备
JPH10271481A (ja) 双方向放送システム
US8700598B2 (en) Manual search method and image display device using the same
JP2003219332A (ja) 番組予約装置及びその方法、プログラム
JP5110521B2 (ja) 字幕付映像再生装置及びプログラム
WO2013080866A1 (ja) 情報処理システム及び情報処理方法
KR20050009168A (ko) 음성 전자 프로그램 안내 정보 송/수신 장치 및 그 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050530

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050530

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071016

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080226