JP2009130411A - 字幕監視装置及び字幕監視プログラム - Google Patents
字幕監視装置及び字幕監視プログラム Download PDFInfo
- Publication number
- JP2009130411A JP2009130411A JP2007300103A JP2007300103A JP2009130411A JP 2009130411 A JP2009130411 A JP 2009130411A JP 2007300103 A JP2007300103 A JP 2007300103A JP 2007300103 A JP2007300103 A JP 2007300103A JP 2009130411 A JP2009130411 A JP 2009130411A
- Authority
- JP
- Japan
- Prior art keywords
- text
- subtitle
- broadcast program
- line
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/04—Diagnosis, testing or measuring for television systems or their details for receivers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N2017/008—Diagnosis, testing or measuring for television systems or their details for television teletext
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Studio Circuits (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【解決手段】字幕監視装置1は、放送番組信号から音声信号と字幕信号と電子番組表情報とを分離させる放送番組受信手段10と、音声信号を音声認識して音声テキストを生成する音声認識手段20と、行単位音声テキストを形態素解析する音声テキスト形態素解析手段30と、字幕信号を復号して字幕テキストを生成する字幕復号手段40と、行単位字幕テキストを形態素解析する字幕テキスト形態素解析手段50と、行単位で、行単位音声テキストと行単位字幕テキストとの一致率を算出し、その一致率に基づいて警告を出力するテキスト比較手段60と、を備える。
【選択図】図1
Description
[字幕監視装置の構成]
図1を参照して、字幕監視装置の構成について説明する。図1は、本発明の第1実施形態に係る字幕監視装置のブロック図である。字幕監視装置1は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)及びHDD(Hard Disk Drive)から構成される。また、字幕監視装置1は、放送されている放送番組の内容に字幕が対応していることを、人手をかけずに監視する機能を実現するために、放送番組受信手段10と、音声認識手段20と、音声テキスト形態素解析手段30と、字幕復号手段40と、字幕テキスト形態素解析手段50と、テキスト比較手段60と、を備える。
図3を参照して、字幕監視装置の動作について説明する(適宜図1参照)。図3は、図1の字幕監視装置の動作を示すフローチャートである。まず、字幕監視装置1は、放送番組受信手段10によって、放送番組信号を受信すると共に、放送番組信号から音声信号と字幕信号と電子番組表情報とを分離させる(ステップS1)。
[字幕監視装置の構成]
図4を参照して、字幕監視装置の構成について説明する。図4は、本発明の第2実施形態に係る字幕監視装置のブロック図である。字幕監視装置1Bは、ビデオテープ又はサーバのHDD等の記録媒体に録画された放送番組の内容に字幕が対応していることを、人手をかけずに監視する機能を実現するために、音声信号分離手段70と、音声認識手段20Bと、音声テキスト形態素解析手段30と、字幕復号手段40Bと、字幕テキスト形態素解析手段50と、テキスト比較手段60Bと、を備える。
図5を参照して、字幕監視装置の動作について説明する(適宜図4参照)。図5は、図4の字幕監視装置の動作を示すフローチャートである。まず、字幕監視装置1Bは、音声信号分離手段70によって、放送番組信号を受信すると共に、放送番組信号から音声信号を分離させる(ステップS11)。
10 放送番組受信手段
20,20B 音声認識手段
30 音声テキスト形態素解析手段
40,40B 字幕復号手段
50 字幕テキスト形態素解析手段
60,60B テキスト比較手段
70 音声信号分離手段
Claims (8)
- 放送されている放送番組の内容に字幕が対応していることを、前記放送番組に対応する電子番組表情報を用いて監視する字幕監視装置であって、
放送番組信号を受信すると共に、当該放送番組信号から音声信号と字幕信号と前記電子番組表情報とを分離させる放送番組受信手段と、
前記放送番組受信手段が分離させた前記音声信号を音声認識して音声テキストを生成すると共に、前記放送番組の開始時間からの前記音声テキストの相対的な開始時間と前記音声テキストの時間長とを含む音声時間情報を生成する音声認識手段と、
前記音声認識手段が生成した前記テキストに前記音声認識手段が生成した前記音声時間情報に基づいた行開始時間が付与された行単位音声テキストを、形態素に分割する音声テキスト形態素解析手段と、
前記放送番組受信手段が分離させた前記字幕信号を復号して字幕テキストを生成すると共に、前記字幕テキストの行区切り毎の相対的な開始時間を示す字幕時間情報を生成する字幕復号手段と、
前記字幕復号手段が生成した前記字幕テキストに前記字幕復号手段が生成した前記字幕時間情報に基づいた行開始時間が付与された行単位字幕テキストを、形態素に分割する字幕テキスト形態素解析手段と、
前記放送番組受信手段が分離させた前記電子番組表情報に字幕情報が含まれる場合には、行単位で、前記音声テキスト形態素解析手段が生成した前記行単位音声テキストの前記形態素及び前記行開始時間と、前記字幕テキスト形態素解析手段が生成した前記行単位字幕テキストの前記形態素及び前記行開始時間とを比較して一致率を算出し、算出した前記一致率が予め設定した閾値以下で予め設定された行数以上連続したときに警告を出力するテキスト比較手段と、
を備えることを特徴とする字幕監視装置。 - 前記放送番組受信手段は、前記電子番組表情報から前記放送番組のジャンルを取得し、
前記音声認識手段は、予め登録された複数の言語モデルから、前記放送番組受信手段が取得した前記放送番組のジャンルに対応した言語モデルを選択すると共に、選択した前記言語モデルを用いて、前記音声信号を音声認識して前記音声テキストを生成することを特徴とする請求項1に記載の字幕監視装置。 - 前記テキスト比較手段は、前記電子番組表情報に含まれる前記放送番組のジャンル毎に前記行数を設定すると共に、前記算出した一致率が前記閾値以下で、前記放送番組のジャンル毎に設定した行数以上連続したときに警告を出力することを特徴とする請求項2に記載の字幕監視装置。
- 録画された放送番組の内容に字幕が対応していることを、前記放送番組に対応する放送番組送出情報を用いて監視する字幕監視装置であって、
放送番組信号を受信すると共に、当該放送番組信号から音声信号を分離させる音声信号分離手段と、
前記音声信号分離手段が分離させた前記音声信号を音声認識して音声テキストを生成すると共に、前記放送番組の開始時間からの前記音声テキストの相対的な開始時間と前記音声テキストの時間長とを含む音声時間情報を生成する音声認識手段と、
前記音声認識手段が生成した前記テキストに前記音声認識手段が生成した前記音声時間情報に基づいた行開始時間が付与された行単位音声テキストを、形態素に分割する音声テキスト形態素解析手段と、
字幕信号を受信し、当該字幕信号を復号して字幕テキストを生成すると共に、前記字幕テキストの行区切り毎の相対的な開始時間を示す字幕時間情報を生成する字幕復号手段と、
前記字幕復号手段が生成した前記字幕テキストに前記字幕復号手段が生成した前記字幕時間情報に基づいた行開始時間が付与された行単位字幕テキストを、形態素に分割する字幕テキスト形態素解析手段と、
前記放送番組送出情報を受信すると共に、当該放送番組送出情報に字幕情報が含まれる場合には、行単位に、前記音声テキスト形態素解析手段が生成した前記行単位音声テキストの前記形態素及び前記行開始時間と、前記字幕テキスト形態素解析手段が生成した前記行単位字幕テキストの前記形態素及び前記行開始時間とを比較して一致率を算出し、算出した前記一致率が予め設定した閾値以下で予め設定された行数以上連続したときに警告を出力するテキスト比較手段と、
を備えることを特徴とする字幕監視装置。 - 前記音声認識手段は、予め登録された複数の言語モデルから、前記放送番組送出情報に含まれる前記放送番組のジャンルに対応した言語モデルを選択すると共に、選択した前記言語モデルを用いて、前記音声信号を音声認識して前記音声テキストを生成することを特徴とする請求項4に記載の字幕監視装置。
- 前記テキスト比較手段は、前記放送番組送出情報に含まれる前記放送番組のジャンル毎に前記行数を設定すると共に、前記算出した一致率が前記閾値以下で、前記放送番組のジャンル毎に設定した行数以上連続したときに警告を出力することを特徴とする請求項5に記載の字幕監視装置。
- 放送されている放送番組の内容に字幕が対応していることを、前記放送番組に対応する電子番組表情報を用いて監視するために、コンピュータを、
放送番組信号を受信すると共に、当該放送番組信号から音声信号と字幕信号と前記電子番組表情報とを分離させる放送番組受信手段、
前記放送番組受信手段が分離させた前記音声信号を音声認識して音声テキストを生成すると共に、前記放送番組の開始時間からの前記音声テキストの相対的な開始時間と前記音声テキストの時間長とを含む音声時間情報を生成する音声認識手段、
前記音声認識手段が生成した前記テキストに前記音声認識手段が生成した前記音声時間情報に基づいた行開始時間が付与された行単位音声テキストを、形態素に分割する音声テキスト形態素解析手段、
前記放送番組受信手段が分離させた前記字幕信号を復号して字幕テキストを生成すると共に、前記字幕テキストの行区切り毎の相対的な開始時間を示す字幕時間情報を生成する字幕復号手段、
前記字幕復号手段が生成した前記字幕テキストに前記字幕復号手段が生成した前記字幕時間情報に基づいた行開始時間が付与された行単位字幕テキストを、形態素に分割する字幕テキスト形態素解析手段、
前記放送番組受信手段が分離させた前記電子番組表情報に字幕情報が含まれる場合には、行単位で、前記音声テキスト形態素解析手段が生成した前記行単位音声テキストの前記形態素及び前記行開始時間と、前記字幕テキスト形態素解析手段が生成した前記行単位字幕テキストの前記形態素及び前記行開始時間とを比較して一致率を算出し、算出した前記一致率が予め設定した閾値以下で予め設定された行数以上連続したときに警告を出力するテキスト比較手段、
として機能させることを特徴とする字幕監視プログラム。 - 録画された放送番組の内容に字幕が対応していることを、前記放送番組に対応する放送番組送出情報を用いて監視するために、コンピュータを、
放送番組信号を受信すると共に、当該放送番組信号から音声信号を分離させる音声信号分離手段、
前記音声信号分離手段が分離させた前記音声信号を音声認識して音声テキストを生成すると共に、前記放送番組の開始時間からの前記音声テキストの相対的な開始時間と前記音声テキストの時間長とを含む音声時間情報を生成する音声認識手段、
前記音声認識手段が生成した前記テキストに前記音声認識手段が生成した前記音声時間情報に基づいた行開始時間が付与された行単位音声テキストを、形態素に分割する音声テキスト形態素解析手段、
字幕信号を受信し、当該字幕信号を復号して字幕テキストを生成すると共に、前記字幕テキストの行区切り毎の相対的な開始時間を示す字幕時間情報を生成する字幕復号手段、
前記字幕復号手段が生成した前記字幕テキストに前記字幕復号手段が生成した前記字幕時間情報に基づいた行開始時間が付与された行単位字幕テキストを、形態素に分割する字幕テキスト形態素解析手段、
前記放送番組送出情報を受信すると共に、当該放送番組送出情報に字幕情報が含まれる場合には、行単位に、前記音声テキスト形態素解析手段が生成した前記行単位音声テキストの前記形態素及び前記行開始時間と、前記字幕テキスト形態素解析手段が生成した前記行単位字幕テキストの前記形態素及び前記行開始時間とを比較して一致率を算出し、算出した前記一致率が予め設定した閾値以下で予め設定された行数以上連続したときに警告を出力するテキスト比較手段、
として機能させることを特徴とする字幕監視プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007300103A JP5022193B2 (ja) | 2007-11-20 | 2007-11-20 | 字幕監視装置及び字幕監視プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007300103A JP5022193B2 (ja) | 2007-11-20 | 2007-11-20 | 字幕監視装置及び字幕監視プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009130411A true JP2009130411A (ja) | 2009-06-11 |
JP5022193B2 JP5022193B2 (ja) | 2012-09-12 |
Family
ID=40820945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007300103A Expired - Fee Related JP5022193B2 (ja) | 2007-11-20 | 2007-11-20 | 字幕監視装置及び字幕監視プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5022193B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011071770A (ja) * | 2009-09-25 | 2011-04-07 | Sharp Corp | 表示制御装置、表示制御装置の制御方法、制御プログラムおよび記録媒体 |
KR20190071206A (ko) * | 2017-12-14 | 2019-06-24 | 현대자동차주식회사 | 멀티미디어 장치 및 이를 포함하는 차량, 멀티미디어 장치의 방송 청취 방법 |
WO2021157192A1 (ja) * | 2020-02-04 | 2021-08-12 | ソニーグループ株式会社 | 制御装置及び制御方法、コンピュータプログラム、並びにコンテンツ再生システム |
JP7481894B2 (ja) | 2020-05-11 | 2024-05-13 | 日本放送協会 | 発話音声テキスト生成装置、発話音声テキスト生成プログラムおよび発話音声テキスト生成方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11285032A (ja) * | 1998-03-31 | 1999-10-15 | Toshiba Corp | 文字放送監視システム、このシステムに使用される文字放送素材制作装置及び文字放送監視装置 |
JP2005045503A (ja) * | 2003-07-28 | 2005-02-17 | Toshiba Corp | 字幕信号処理装置、字幕信号処理方法及び字幕信号処理プログラム |
-
2007
- 2007-11-20 JP JP2007300103A patent/JP5022193B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11285032A (ja) * | 1998-03-31 | 1999-10-15 | Toshiba Corp | 文字放送監視システム、このシステムに使用される文字放送素材制作装置及び文字放送監視装置 |
JP2005045503A (ja) * | 2003-07-28 | 2005-02-17 | Toshiba Corp | 字幕信号処理装置、字幕信号処理方法及び字幕信号処理プログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011071770A (ja) * | 2009-09-25 | 2011-04-07 | Sharp Corp | 表示制御装置、表示制御装置の制御方法、制御プログラムおよび記録媒体 |
KR20190071206A (ko) * | 2017-12-14 | 2019-06-24 | 현대자동차주식회사 | 멀티미디어 장치 및 이를 포함하는 차량, 멀티미디어 장치의 방송 청취 방법 |
KR102435750B1 (ko) * | 2017-12-14 | 2022-08-25 | 현대자동차주식회사 | 멀티미디어 장치 및 이를 포함하는 차량, 멀티미디어 장치의 방송 청취 방법 |
WO2021157192A1 (ja) * | 2020-02-04 | 2021-08-12 | ソニーグループ株式会社 | 制御装置及び制御方法、コンピュータプログラム、並びにコンテンツ再生システム |
JP7481894B2 (ja) | 2020-05-11 | 2024-05-13 | 日本放送協会 | 発話音声テキスト生成装置、発話音声テキスト生成プログラムおよび発話音声テキスト生成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5022193B2 (ja) | 2012-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7013273B2 (en) | Speech recognition based captioning system | |
US6490553B2 (en) | Apparatus and method for controlling rate of playback of audio data | |
US7676373B2 (en) | Displaying text of speech in synchronization with the speech | |
CN105516651B (zh) | 用于在成像设备中提供组合摘要的方法和设备 | |
US9066046B2 (en) | Method and apparatus for controlling play of an audio signal | |
JP4635891B2 (ja) | 情報処理装置および方法、並びにプログラム | |
US20080195386A1 (en) | Method and a Device For Performing an Automatic Dubbing on a Multimedia Signal | |
JP5022193B2 (ja) | 字幕監視装置及び字幕監視プログラム | |
Federico et al. | An automatic caption alignment mechanism for off-the-shelf speech recognition technologies | |
JP4712812B2 (ja) | 記録再生装置 | |
JP2008252322A (ja) | 要約提示装置及び要約提示方法 | |
JP3998187B2 (ja) | コンテンツ解説データ生成装置、その方法及びそのプログラム、並びに、コンテンツ解説データ提示装置、その方法及びそのプログラム | |
JP2004289530A (ja) | 記録再生装置 | |
JP4359069B2 (ja) | 要約生成装置及びそのプログラム | |
JP5132504B2 (ja) | 情報記録再生装置及び情報記録再生方法 | |
KR102160117B1 (ko) | 장애인을 위한 실시간 방송 컨텐츠 제작 시스템 | |
JP4500957B2 (ja) | 字幕制作システム | |
JP5074941B2 (ja) | 字幕出力装置、字幕出力方法、及びプログラム | |
EP2642408A1 (en) | Information processing apparatus and information processing method | |
JP4854030B2 (ja) | 映像分類装置および受信装置 | |
KR20150055921A (ko) | 동영상 재생 제어 방법 및 장치 | |
JP7481894B2 (ja) | 発話音声テキスト生成装置、発話音声テキスト生成プログラムおよび発話音声テキスト生成方法 | |
US20230028897A1 (en) | System and method for caption validation and sync error correction | |
JP2005341138A (ja) | 映像要約方法及びプログラム及びそのプログラムを格納した記憶媒体 | |
WO2004100164A1 (en) | Voice script system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100310 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120516 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120522 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120615 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5022193 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150622 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |