JP2019062332A - 表示態様決定装置、表示装置、表示態様決定方法及びプログラム - Google Patents
表示態様決定装置、表示装置、表示態様決定方法及びプログラム Download PDFInfo
- Publication number
- JP2019062332A JP2019062332A JP2017184414A JP2017184414A JP2019062332A JP 2019062332 A JP2019062332 A JP 2019062332A JP 2017184414 A JP2017184414 A JP 2017184414A JP 2017184414 A JP2017184414 A JP 2017184414A JP 2019062332 A JP2019062332 A JP 2019062332A
- Authority
- JP
- Japan
- Prior art keywords
- display
- word
- video
- unit
- video data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 27
- 238000010586 diagram Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 9
- 230000003111 delayed effect Effects 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Studio Circuits (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
Description
図1は、第一実施形態に係る表示システムの構成例を示すブロック図である。表示システム1は、映像に含まれる音声の単語ごとの使用頻度に応じて単語の表示態様を決定する。表示システム1は、データベース管理装置10と、表示態様決定装置20と、表示装置30とを備える。
図10、図11を参照しながら、本実施形態に係る表示システム1について説明する。図10は、第二実施形態に係る表示システムが生成・表示する字幕の表示タイミングの一例を説明する図である。図11は、第二実施形態に係る表示システムの表示装置が行う処理の一例を示すフローチャートである。表示システム1は、基本的な構成は第一実施形態の表示システム1と同様である。以下の説明においては、表示システム1と同様の構成要素には、同一の符号または対応する符号を付し、その詳細な説明は省略する。本実施形態の表示システム1は、表示装置30の字幕生成部34における処理が、第一実施形態と異なる。
図12、図13を参照しながら、本実施形態に係る表示システム1について説明する。図12は、第三実施形態に係る表示システムが生成・表示する字幕の表示タイミングの一例を説明する図である。図13は、第三実施形態に係る表示システムの表示装置が行う処理の一例を示すフローチャートである。表示システム1は、基本的な構成は第一実施形態と第二実施形態の表示システム1と同様である。本実施形態の表示システム1は、表示装置30の字幕生成部34における処理が、第一実施形態と第二実施形態と異なる。
10 データベース管理装置
11 通信部
12 単語使用頻度データベース(データベース)
13 データベース生成部
20 表示態様決定装置
21 通信部
22 映像データ取得部
23 音声認識処理部
24 データベース参照部
25 決定部
30 表示装置
31 通信部
32 表示部
33 表示用映像データ取得部
34 字幕生成部
35 表示制御部
Claims (7)
- 音声を含む映像の映像データを取得する映像データ取得部と、
単語ごとの使用頻度を示す使用頻度情報を記憶した単語使用頻度データベースを参照するデータベース参照部と、
前記映像データ取得部が取得した前記映像データと前記データベース参照部が参照した前記使用頻度情報とに基づいて、前記映像に含まれる前記音声を表すテキストデータに含まれる単語ごとの使用頻度を取得し、前記使用頻度に応じて前記単語の表示態様を決定する決定部と、
を備えることを特徴とする表示態様決定装置。 - 前記映像データ取得部が取得した前記映像に含まれる前記音声を認識して、前記音声を表すテキストデータを生成する音声認識処理部、
を備え、
前記決定部は、前記音声認識処理部が生成した前記テキストデータと前記データベース参照部が参照した前記使用頻度情報とに基づいて、前記テキストデータに含まれる単語ごとの使用頻度を取得し、前記使用頻度に応じて前記単語の表示態様を決定する、
請求項1に記載の表示態様決定装置。 - 前記表示態様は、前記単語の表示時間と前記単語の表示色と前記単語の表示の大きさと前記単語の表示速度との少なくともいずれかである、
請求項1または2に記載の表示態様決定装置。 - 前記表示態様は、前記単語の表示時間であり、
前記決定部は、前記使用頻度が低い前記単語の表示時間が、前記使用頻度が高い前記単語の表示時間より長くなるように決定する、
請求項3に記載の表示態様決定装置。 - 音声を含む表示用映像の表示用映像データと、前記表示用映像に含まれる音声を表すテキストデータとを取得する表示用映像データ取得部と、
前記表示用映像データ取得部が取得した前記テキストデータに基づいて、字幕の字幕データを生成する字幕生成部と、
前記表示用映像データ取得部が取得した前記表示用映像データと前記字幕生成部が生成した前記字幕データとを表示する表示部と、
前記表示用映像データ取得部が取得した前記表示用映像データと前記字幕生成部が生成した前記字幕データとを前記表示部が表示するように制御する表示制御部と、
を備え、
前記表示制御部は、単語ごとの使用頻度を示す使用頻度情報を記憶した単語使用頻度データベースに基づいて、前記字幕データに含まれる単語ごとの使用頻度に応じて表示態様を変えた字幕を前記表示部が表示するように制御する、
ことを特徴とする表示装置。 - 音声を含む映像の映像データを取得する映像データ取得ステップと、
単語ごとの使用頻度を示す使用頻度情報を記憶した単語使用頻度データベースを参照するデータベース参照ステップと、
前記映像データ取得ステップによって取得した前記映像データと前記データベース参照ステップによって参照した前記使用頻度情報とに基づいて、前記映像に含まれる前記音声を表すテキストデータに含まれる単語ごとの使用頻度を取得し、前記使用頻度に応じて前記単語の表示態様を決定する決定ステップと、
を含むことを特徴とする表示態様決定方法。 - 音声を含む映像の映像データを取得する映像データ取得ステップと、
単語ごとの使用頻度を示す使用頻度情報を記憶した単語使用頻度データベースを参照するデータベース参照ステップと、
前記映像データ取得ステップによって取得した前記映像データと前記データベース参照ステップによって参照した前記使用頻度情報とに基づいて、前記映像に含まれる前記音声を表すテキストデータに含まれる単語ごとの使用頻度を取得し、前記使用頻度に応じて前記単語の表示態様を決定する決定ステップと、
をコンピュータに実行させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017184414A JP6946898B2 (ja) | 2017-09-26 | 2017-09-26 | 表示態様決定装置、表示装置、表示態様決定方法及びプログラム |
US15/996,574 US10477136B2 (en) | 2017-09-26 | 2018-06-04 | Display mode determining device, display, display mode determining method, and non-transitory storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017184414A JP6946898B2 (ja) | 2017-09-26 | 2017-09-26 | 表示態様決定装置、表示装置、表示態様決定方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019062332A true JP2019062332A (ja) | 2019-04-18 |
JP6946898B2 JP6946898B2 (ja) | 2021-10-13 |
Family
ID=65806902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017184414A Active JP6946898B2 (ja) | 2017-09-26 | 2017-09-26 | 表示態様決定装置、表示装置、表示態様決定方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10477136B2 (ja) |
JP (1) | JP6946898B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020178262A (ja) * | 2019-04-19 | 2020-10-29 | 日本放送協会 | 生字幕整形処理装置及びプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108428446B (zh) * | 2018-03-06 | 2020-12-25 | 北京百度网讯科技有限公司 | 语音识别方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007111162A1 (ja) * | 2006-03-24 | 2007-10-04 | Nec Corporation | テキスト表示装置、テキスト表示方法およびプログラム |
JP2008048204A (ja) * | 2006-08-17 | 2008-02-28 | Fuji Xerox Co Ltd | 情報処理装置、情報処理システム及び情報処理プログラム |
US20170011024A1 (en) * | 2014-02-04 | 2017-01-12 | Nigel Henry CANNINGS | System and method for contextualising a stream of unstructured text representative of spoken word |
WO2017056387A1 (ja) * | 2015-09-29 | 2017-04-06 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6130968A (en) * | 1997-10-03 | 2000-10-10 | Mcian; Peter | Method of enhancing the readability of rapidly displayed text |
US20020133521A1 (en) * | 2001-03-15 | 2002-09-19 | Campbell Gregory A. | System and method for text delivery |
US20090066722A1 (en) * | 2005-08-29 | 2009-03-12 | Kriger Joshua F | System, Device, and Method for Conveying Information Using Enhanced Rapid Serial Presentation |
JP2015018079A (ja) | 2013-07-10 | 2015-01-29 | 船井電機株式会社 | 字幕音声生成装置 |
US20170316708A1 (en) * | 2016-04-29 | 2017-11-02 | Rovi Guides, Inc. | Systems and methods for providing word definitions based on user exposure |
-
2017
- 2017-09-26 JP JP2017184414A patent/JP6946898B2/ja active Active
-
2018
- 2018-06-04 US US15/996,574 patent/US10477136B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007111162A1 (ja) * | 2006-03-24 | 2007-10-04 | Nec Corporation | テキスト表示装置、テキスト表示方法およびプログラム |
JP2008048204A (ja) * | 2006-08-17 | 2008-02-28 | Fuji Xerox Co Ltd | 情報処理装置、情報処理システム及び情報処理プログラム |
US20170011024A1 (en) * | 2014-02-04 | 2017-01-12 | Nigel Henry CANNINGS | System and method for contextualising a stream of unstructured text representative of spoken word |
WO2017056387A1 (ja) * | 2015-09-29 | 2017-04-06 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020178262A (ja) * | 2019-04-19 | 2020-10-29 | 日本放送協会 | 生字幕整形処理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6946898B2 (ja) | 2021-10-13 |
US10477136B2 (en) | 2019-11-12 |
US20190098249A1 (en) | 2019-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10123095B2 (en) | Dynamic summaries for media content | |
ES2719586T3 (es) | Creación de puntos de referencia en un flujo multimedia con reconocimiento de contenido automatizado | |
US20190335229A1 (en) | Video data generation method, computer device, and storage medium | |
US10965982B2 (en) | Method and apparatus for synchronously playing image and audio | |
WO2012086356A1 (ja) | ファイルフォーマット、サーバ、電子コミックのビューワ装置および電子コミック生成装置 | |
CN110781328A (zh) | 基于语音识别的视频生成方法、系统、装置和存储介质 | |
CN112437353B (zh) | 视频处理方法、视频处理装置、电子设备和可读存储介质 | |
US20200021774A1 (en) | Systems and Methods for Generating a Video Clip and Associated Closed-Captioning Data | |
CN111885416B (zh) | 一种音视频的修正方法、装置、介质及计算设备 | |
CN113035199A (zh) | 音频处理方法、装置、设备及可读存储介质 | |
JP2019062332A (ja) | 表示態様決定装置、表示装置、表示態様決定方法及びプログラム | |
US20180069914A1 (en) | Enhancing digital media with supplemental contextually relevant content | |
JP2014120032A (ja) | 文字認識装置および文字認識方法並びに文字認識プログラム | |
CN111984891A (zh) | 页面展示方法、装置、电子设备和存储介质 | |
US9697632B2 (en) | Information processing apparatus, information processing method, and program | |
US20130073934A1 (en) | Image display apparatus, image display method, and computer readable medium | |
US20230107968A1 (en) | Systems and methods for replaying a content item | |
WO2021057908A1 (zh) | 即时译文显示方法、装置、移动终端和计算机存储介质 | |
KR101039668B1 (ko) | 텍스트데이터 기반의 얼굴 애니메이션 출력방법 및 그 시스템 | |
US9253436B2 (en) | Video playback device, video playback method, non-transitory storage medium having stored thereon video playback program, video playback control device, video playback control method and non-transitory storage medium having stored thereon video playback control program | |
CN111556372A (zh) | 为视音频节目实时添加字幕的方法和装置 | |
WO2019069997A1 (ja) | 情報処理装置、画面出力方法及びプログラム | |
JP6528484B2 (ja) | 画像処理装置、アニメーション生成方法及びプログラム | |
CN114494951B (zh) | 视频处理方法、装置、电子设备和存储介质 | |
CN113312516B (zh) | 一种视频处理方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200330 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210817 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210830 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6946898 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |