JP5074941B2 - 字幕出力装置、字幕出力方法、及びプログラム - Google Patents
字幕出力装置、字幕出力方法、及びプログラム Download PDFInfo
- Publication number
- JP5074941B2 JP5074941B2 JP2008021656A JP2008021656A JP5074941B2 JP 5074941 B2 JP5074941 B2 JP 5074941B2 JP 2008021656 A JP2008021656 A JP 2008021656A JP 2008021656 A JP2008021656 A JP 2008021656A JP 5074941 B2 JP5074941 B2 JP 5074941B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- utterance
- recognition result
- section
- subtitle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 36
- 238000012790 confirmation Methods 0.000 claims description 11
- 238000012795 verification Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 5
- 230000003111 delayed effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 206010011224 Cough Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Description
まず、本発明の第1の目的に対応する第1の実施の形態について説明する。第1の実施の形態における字幕出力システムの全体構成は図1に示したものと同じである。また、テキスト格納部4に格納されるテキストにおける各区間テキストは、テレビ番組の出演者が読む順番に沿って並べられているものとし、テレビ番組の出演者は、テキストの内容以外の発話は行わないものとする。
本実施の形態における字幕決定部5の機能構成を図5に示す。図5に示すように、本実施の形態における字幕決定部5は、認識結果取得部51、照合範囲決定部52、テキスト終端判定部53、照合部54、字幕出力部55を有する。
次に、本実施の形態における字幕決定部5の処理の詳細を図6のフローチャートを参照して説明する。
次に、本発明の第2の目的に対応する第2の実施の形態について説明する。第2の実施の形態における字幕出力システムの全体構成は図1に示したものと同じである。また、テキスト格納部4に格納されるテキストにおける各区間テキストは、テレビ番組の出演者が読む順番に沿って並べられているものとし、テレビ番組の出演者は、テキストの内容以外の発話は行わないものとする。
次に、本実施の形態における字幕決定部5の機能構成を図8に示す。図8に示すように、本実施の形態における字幕決定部5は、認識結果取得部71、発話開始判断部72、テキスト取得部73、発話位置確認部74、及び字幕出力部75を有する。
次に、本実施の形態における字幕決定部5の処理の詳細を図9のフローチャートを参照して説明する。なお、図9のフローチャートのステップ11の開始時点は、全体の発話の開始時点、もしくはある区間テキストが字幕として送出された後に、その区間テキストに対応する発話が終了し、次の発話が開始される時点である。
2 音声入力部
3 音声認識部
4 テキスト格納部
5 字幕決定部
6 字幕送出部
51 認識結果取得部
52 照合範囲決定部
53 テキスト終端判定部
54 照合部
55 字幕出力部
71 認識結果取得部
72 発話開始判断部
73 テキスト取得部
74 発話位置確認部
75 字幕出力部
Claims (9)
- 番組放送用に予め用意されたテキストに基づき発せられる発話音声に対応した字幕を出力する字幕出力装置であって、
前記テキストを格納するテキスト格納手段と、
前記発話音声に対する音声認識結果を取得する音声認識結果取得手段と、
前記音声認識結果と前記テキストとを照合するためのテキスト照合区間として、前記音声認識結果の長さに基づき当該音声認識結果の長さよりも長い区間を決定するテキスト照合区間決定手段と、
前記テキスト照合区間内に前記番組の中断を示す情報があるか否かを判定する番組中断情報判定手段と、
前記テキスト照合区間内に前記番組の中断を示す情報があると判定された場合に、前記中断前のテキストのうち字幕として未出力であるテキストを字幕として出力する字幕出力手段と
を備えたことを特徴とする字幕出力装置。 - 前記テキスト照合区間内に前記番組の中断を示す情報がないと判定された場合には、前記字幕出力手段は、前記音声認識結果と前記テキスト照合区間におけるテキストとを照合することにより、前記音声認識結果に対応する区間テキストを決定し、当該区間テキストの終了より前のテキストであって字幕として未出力のテキストを字幕として出力することを特徴とする請求項1に記載の字幕出力装置。
- 前記字幕出力手段は、前記音声認識結果の前記区間テキストに対する認識率を算出し、当該認識率が所定の閾値未満である場合には、前記音声認識結果に対応する時点での字幕の出力を行わないことを特徴とする請求項2に記載の字幕出力装置。
- 番組放送用に予め用意されたテキストに基づき発せられる発話音声に対応した字幕を出力する字幕出力装置であって、
所定の方法で区切られた複数の区間テキストを含むテキストを格納するテキスト格納手段と、
前記発話音声に対する音声認識結果を取得する音声認識結果取得手段と、
発話の進行により順次取得される前記音声認識結果と前記テキストとを順次照合することにより、発話に対応する前記テキスト内の位置を確認する発話位置確認手段と、
前記発話位置確認手段により前記テキストの中のある区間テキストに対応する発話が終了したと判定された後に、発話が開始されたか否かを判断する発話開始判断手段と、
前記発話開始判断手段により発話が開始されたと判断された場合に、前記ある区間テキストの次の区間テキストを字幕として出力する字幕出力手段と
を備えたことを特徴とする字幕出力装置。 - 前記発話開始判断手段は、発話の進行により順次取得される前記音声認識結果に基づき、予め定めた長さの発話を検出した場合に、発話が開始されたと判断することを特徴とする請求項4に記載の字幕出力装置。
- 番組放送用に予め用意されたテキストに基づき発せられる発話音声に対応した字幕を出力するための字幕出力装置が実行する字幕出力方法であって、
前記発話音声に対する音声認識結果を取得する音声認識結果取得ステップと、
前記音声認識結果と、前記字幕出力装置のテキスト格納手段が格納する前記テキストとを照合するためのテキスト照合区間として、前記音声認識結果の長さに基づき当該音声認識結果の長さよりも長い区間を決定するテキスト照合区間決定ステップと、
前記テキスト照合区間内に前記番組の中断を示す情報があるか否かを判定する番組中断情報判定ステップと、
前記テキスト照合区間内に前記番組の中断を示す情報があると判定された場合に、前記中断前のテキストのうち字幕として未出力であるテキストを字幕として出力する字幕出力ステップと
を有することを特徴とする字幕出力方法。 - 番組放送用に予め用意されたテキストに基づき発せられる発話音声に対応した字幕を出力する字幕出力装置であって、所定の方法で区切られた複数の区間テキストを含むテキストを格納するテキスト格納手段を備えた字幕出力装置が実行する字幕出力方法であって、
前記発話音声に対する音声認識結果を取得する音声認識結果取得ステップと、
発話の進行により順次取得される前記音声認識結果と前記テキストとを順次照合することにより、発話に対応する前記テキスト内の位置を確認する発話位置確認ステップと、
前記発話位置確認ステップにより前記テキストの中のある区間テキストに対応する発話が終了したと判定された後に、発話が開始されたか否かを判断する発話開始判断ステップと、
前記発話開始判断ステップにより発話が開始されたと判断された場合に、前記ある区間テキストの次の区間テキストを字幕として出力する字幕出力ステップと
を有することを特徴とする字幕出力方法。 - コンピュータを、番組放送用に予め用意されたテキストに基づき発せられる発話音声に対応した字幕を出力する字幕出力装置として機能させるプログラムであって、コンピュータを、
前記発話音声に対する音声認識結果を取得する音声認識結果取得手段、
前記音声認識結果と、前記コンピュータの記憶手段に格納される前記テキストとを照合するためのテキスト照合区間として、前記音声認識結果の長さに基づき当該音声認識結果の長さよりも長い区間を決定するテキスト照合区間決定手段、
前記テキスト照合区間内に前記番組の中断を示す情報があるか否かを判定する番組中断情報判定手段、
前記テキスト照合区間内に前記番組の中断を示す情報があると判定された場合に、前記中断前のテキストのうち字幕として未出力であるテキストを字幕として出力する字幕出力手段、
として機能させるプログラム。 - 所定の方法で区切られた複数の区間テキストを含む、番組放送用に予め用意されたテキストを格納する記憶手段を備えたコンピュータを、前記テキストに基づき発せられる発話音声に対応した字幕を出力する字幕出力装置として機能させるプログラムであって、コンピュータを、
前記発話音声に対する音声認識結果を取得する音声認識結果取得手段、
発話の進行により順次取得される前記音声認識結果と前記テキストとを順次照合することにより、発話に対応する前記テキスト内の位置を確認する発話位置確認手段、
前記発話位置確認手段により前記テキストの中のある区間テキストに対応する発話が終了したと判定された後に、発話が開始されたか否かを判断する発話開始判断手段、
前記発話開始判断手段により発話が開始されたと判断された場合に、前記ある区間テキストの次の区間テキストを字幕として出力する字幕出力手段、
として機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008021656A JP5074941B2 (ja) | 2008-01-31 | 2008-01-31 | 字幕出力装置、字幕出力方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008021656A JP5074941B2 (ja) | 2008-01-31 | 2008-01-31 | 字幕出力装置、字幕出力方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009182859A JP2009182859A (ja) | 2009-08-13 |
JP5074941B2 true JP5074941B2 (ja) | 2012-11-14 |
Family
ID=41036444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008021656A Active JP5074941B2 (ja) | 2008-01-31 | 2008-01-31 | 字幕出力装置、字幕出力方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5074941B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5500980B2 (ja) * | 2009-12-28 | 2014-05-21 | クラリオン株式会社 | テレビ受信装置、テレビ受信装置の制御方法及び制御プログラム |
JP7216771B2 (ja) * | 2021-06-09 | 2023-02-01 | 西日本電信電話株式会社 | 台本へのメタデータ付与装置、方法、およびプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3873926B2 (ja) * | 2003-05-16 | 2007-01-31 | 日本電気株式会社 | 字幕挿入方法、字幕挿入システム、および字幕挿入プログラム |
JP4113059B2 (ja) * | 2003-07-28 | 2008-07-02 | 株式会社東芝 | 字幕信号処理装置、字幕信号処理方法及び字幕信号処理プログラム |
JP3884016B2 (ja) * | 2004-02-13 | 2007-02-21 | ダイキン工業株式会社 | 情報処理装置および情報処理方法、プログラム、並びに、情報処理システム |
JP4079096B2 (ja) * | 2004-02-18 | 2008-04-23 | 日本電信電話株式会社 | 映像音声とシナリオとの整合状態の修正支援方法及び整合修正支援装置及び整合修正プログラム |
-
2008
- 2008-01-31 JP JP2008021656A patent/JP5074941B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009182859A (ja) | 2009-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110085261B (zh) | 一种发音纠正方法、装置、设备以及计算机可读存储介质 | |
US6442518B1 (en) | Method for refining time alignments of closed captions | |
US8954329B2 (en) | Methods and apparatus for acoustic disambiguation by insertion of disambiguating textual information | |
US11900932B2 (en) | Determining a system utterance with connective and content portions from a user utterance | |
JP5246948B2 (ja) | 字幕ずれ補正装置、再生装置および放送装置 | |
JP5787780B2 (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
US20080270134A1 (en) | Hybrid-captioning system | |
WO2008050649A1 (fr) | Système, procédé et programme de récapitulation de contenu | |
WO2009122779A1 (ja) | テキストデータ処理装置、方法、プログラムが格納された記録媒体 | |
JP2011002656A (ja) | 音声認識結果修正候補検出装置、音声書き起こし支援装置、方法及びプログラム | |
US20160314116A1 (en) | Interpretation apparatus and method | |
CN105931641B (zh) | 字幕数据生成方法和装置 | |
JP2010157241A (ja) | Ocr結果を補正するための方法、システム、及びコンピュータ読み取り可能な記録媒体 | |
JP2004343488A (ja) | 字幕挿入方法、字幕挿入システム、および字幕挿入プログラム | |
JP5074941B2 (ja) | 字幕出力装置、字幕出力方法、及びプログラム | |
JP5273844B2 (ja) | 字幕ずれ推定装置、字幕ずれ補正装置、再生装置および放送装置 | |
JP4538618B2 (ja) | 字幕番組制作システムにおける表示単位字幕文の自動生成方法 | |
JP4210723B2 (ja) | 自動字幕番組制作システム | |
JP6322125B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JP5022193B2 (ja) | 字幕監視装置及び字幕監視プログラム | |
JP5243886B2 (ja) | 字幕出力装置、字幕出力方法及びプログラム | |
KR101705228B1 (ko) | 전자문서생성장치 및 그 동작 방법 | |
JP4140744B2 (ja) | 字幕文テキストの自動分割方法 | |
JP4595098B2 (ja) | 字幕送出タイミング検出装置 | |
CN110428668B (zh) | 一种数据提取方法、装置、计算机系统及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120807 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120824 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5074941 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150831 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |