JP6268131B2 - 字幕制作装置および字幕制作方法 - Google Patents
字幕制作装置および字幕制作方法 Download PDFInfo
- Publication number
- JP6268131B2 JP6268131B2 JP2015162801A JP2015162801A JP6268131B2 JP 6268131 B2 JP6268131 B2 JP 6268131B2 JP 2015162801 A JP2015162801 A JP 2015162801A JP 2015162801 A JP2015162801 A JP 2015162801A JP 6268131 B2 JP6268131 B2 JP 6268131B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- subtitle
- text
- audio
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
Claims (3)
- 対象音声または対象音声を復唱したリスピーク音声を音声認識してテキストに変換するとともに音声認識された前記対象音声または音声認識された前記リスピーク音声を音声ファイルとして記録し、音声認識単位ごとに前記音声ファイルにおいて当該音声認識単位が発声される開始位置と終了位置を音声再生情報として記録する音声認識部と、
音声認識後のテキストを分割処理して字幕テキストを生成する分割処理部と、
分割処理された字幕テキストを時系列管理し、複数の修正者に順次分配するために複数の修正者の各々が担当する担当字幕テキストを決定する字幕時系列管理部と、
前記字幕時系列管理部から分配される複数の修正者の各々が担当する担当字幕テキストを受け取り、複数の修正者の各々により修正された担当字幕テキストを非同期で出力する複数の修正部と、
前記複数の修正部から非同期で供給される修正後の担当字幕テキストの順序を入れ替えて最終的な字幕を送出する送出順序制御部と、
対象音声を所定の時間だけ遅延させた遅延音声を出力する遅延部と、
前記音声再生情報にもとづいて前記複数の修正者の各々が担当する前記担当字幕テキストの文字列と同期させて、前記対象音声/前記リスピーク音声を記録した音声ファイルを再生する音声再生部と、
前記担当字幕テキストの修正を担当する前記複数の修正者の各々からの指示により、前記遅延部により出力される遅延音声または前記音声再生部により出力される音声ファイルを再生した前記担当字幕テキストの文字列と同期した対象音声/リスピーク音声のいずれかを切り替えて前記複数の修正者の各々が着用するヘッドホンに提供する切替部とを備え、
前記切替部は、1回目は前記遅延音声を前記ヘッドホンに出力し、2回目以降は音声ファイルを再生した前記担当字幕テキストの文字列と同期した前記対象音声/前記リスピーク音声を前記ヘッドホンに出力することを特徴とする字幕制作装置。 - 前記切替部は、対象音声から字幕テキストが生成されるまでにかかる時間に応じた所定の時間だけ対象音声を遅延させた最初の遅延音声を、字幕テキストの修正者からの指示によらずに自動的に出力することを特徴とする請求項1に記載の字幕制作装置。
- 対象音声または対象音声を復唱したリスピーク音声を音声認識してテキストに変換するとともに音声認識された前記対象音声または音声認識された前記リスピーク音声を音声ファイルとして記録し、音声認識単位ごとに前記音声ファイルにおいて当該音声認識単位が発声される開始位置と終了位置を音声再生情報として記録する音声認識ステップと、
音声認識後のテキストを分割処理して字幕テキストを生成する分割処理ステップと、
分割処理された字幕テキストを時系列管理し、複数の修正者に順次分配するために複数の修正者の各々が担当する担当字幕テキストを決定する字幕時系列管理ステップと、
前記字幕時系列管理ステップから分配される複数の修正者の各々が担当する担当字幕テキストを受け取り、複数の修正者の各々により修正された担当字幕テキストを非同期で出力する複数の修正ステップと、
前記複数の修正ステップから非同期で供給される修正後の担当字幕テキストの順序を入れ替えて最終的な字幕を送出する送出順序制御ステップと、
対象音声を所定の時間だけ遅延させた遅延音声を出力する遅延ステップと、
前記音声再生情報にもとづいて前記複数の修正者の各々が担当する前記担当字幕テキストの文字列と同期させて、前記対象音声/前記リスピーク音声を記録した音声ファイルを再生する音声再生ステップと、
前記担当字幕テキストの修正を担当する前記複数の修正者の各々からの指示により、前記遅延ステップにより出力される遅延音声または前記音声再生ステップにより出力される音声ファイルを再生した前記担当字幕テキストの文字列と同期した対象音声/リスピーク音声のいずれかを切り替えて前記複数の修正者の各々が着用するヘッドホンに提供する切替ステップとを備え、
前記切替ステップは、1回目は前記遅延音声を前記ヘッドホンに出力し、2回目以降は音声ファイルを再生した前記担当字幕テキストの文字列と同期した前記対象音声/前記リスピーク音声を前記ヘッドホンに出力することを特徴とする字幕制作装置によって実行される字幕制作方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015162801A JP6268131B2 (ja) | 2015-08-20 | 2015-08-20 | 字幕制作装置および字幕制作方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015162801A JP6268131B2 (ja) | 2015-08-20 | 2015-08-20 | 字幕制作装置および字幕制作方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017247280A Division JP6485977B2 (ja) | 2017-12-25 | 2017-12-25 | 字幕制作装置および字幕制作方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017040806A JP2017040806A (ja) | 2017-02-23 |
JP6268131B2 true JP6268131B2 (ja) | 2018-01-24 |
Family
ID=58202908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015162801A Active JP6268131B2 (ja) | 2015-08-20 | 2015-08-20 | 字幕制作装置および字幕制作方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6268131B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109495792A (zh) * | 2018-11-30 | 2019-03-19 | 北京字节跳动网络技术有限公司 | 一种视频的字幕添加方法、装置、电子设备及可读介质 |
KR102185183B1 (ko) * | 2019-04-24 | 2020-12-01 | 주식회사 한국스테노 | 방송 자막 제작 시스템 |
KR102135643B1 (ko) * | 2019-09-04 | 2020-07-20 | (주) 소프트기획 | 음성인식 엔진을 이용한 실시간 지능형 자막화 서비스 제공 시스템 |
CN113066498B (zh) * | 2021-03-23 | 2022-12-30 | 上海掌门科技有限公司 | 信息处理方法、设备和介质 |
JP7288530B1 (ja) | 2022-03-09 | 2023-06-07 | 陸 荒川 | システムおよびプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3969570B2 (ja) * | 2002-02-18 | 2007-09-05 | 独立行政法人情報通信研究機構 | 逐次自動字幕制作処理システム |
JP3986015B2 (ja) * | 2003-01-27 | 2007-10-03 | 日本放送協会 | 音声認識誤り修正装置、音声認識誤り修正方法および音声認識誤り修正プログラム |
JP3859612B2 (ja) * | 2003-04-10 | 2006-12-20 | 株式会社アドバンスト・メディア | 会議録音・書き起こしシステム |
-
2015
- 2015-08-20 JP JP2015162801A patent/JP6268131B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017040806A (ja) | 2017-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6268131B2 (ja) | 字幕制作装置および字幕制作方法 | |
US10930300B2 (en) | Automated transcript generation from multi-channel audio | |
US20060285654A1 (en) | System and method for performing automatic dubbing on an audio-visual stream | |
US6500006B2 (en) | Learning and entertainment device, method and system and storage media thereof | |
CA2477697C (en) | Methods and apparatus for use in sound replacement with automatic synchronization to images | |
TWI470588B (zh) | 用於對失聰者將口語轉譯成手語的系統 | |
JP6485977B2 (ja) | 字幕制作装置および字幕制作方法 | |
KR100240637B1 (ko) | 다중매체와의 연동을 위한 텍스트/음성변환 구현방법 및 그 장치 | |
US20120105719A1 (en) | Speech substitution of a real-time multimedia presentation | |
CA3065364C (en) | System and method for providing descriptive video | |
WO2018216729A1 (ja) | 音声ガイド生成装置、音声ガイド生成方法及び放送システム | |
JP2008546016A (ja) | マルチメディア信号で自動的なダビングを実行する方法及び装置 | |
US20150098018A1 (en) | Techniques for live-writing and editing closed captions | |
EP3224834B1 (en) | Apparatus and method for generating visual content from an audio signal | |
JP4594908B2 (ja) | 解説付加音声生成装置及び解説付加音声生成プログラム | |
Huwiler | A Narratology of Audio Art: Telling Stories by Sound¹ | |
KR101944365B1 (ko) | 콘텐츠 싱크 생성 방법, 그 장치 및 이를 위한 인터페이스 모듈 | |
JP5727777B2 (ja) | 会議支援装置および会議支援方法 | |
Simon et al. | MPEG-H Audio for Improving Accessibility in Broadcasting and Streaming | |
Trmal et al. | Online TV captioning of Czech parliamentary sessions | |
KR102463283B1 (ko) | 청각 장애인 및 비장애인 겸용 영상 콘텐츠 자동 번역 시스템 | |
JP2008154258A (ja) | 動画再生装置、動画再生方法及びそのコンピュータ・プログラム | |
JPH11212438A (ja) | 学習装置、発音練習装置、その方法および記録媒体 | |
JP2004240920A (ja) | 校正システム | |
Faria et al. | An Overview of Audio Technologies, Immersion and Personalization Features envisaged for the TV3. 0 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170523 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170912 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6268131 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |