JP2023529571A - オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器 - Google Patents
オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器 Download PDFInfo
- Publication number
- JP2023529571A JP2023529571A JP2022571224A JP2022571224A JP2023529571A JP 2023529571 A JP2023529571 A JP 2023529571A JP 2022571224 A JP2022571224 A JP 2022571224A JP 2022571224 A JP2022571224 A JP 2022571224A JP 2023529571 A JP2023529571 A JP 2023529571A
- Authority
- JP
- Japan
- Prior art keywords
- page
- text
- audio
- playback
- identifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000013507 mapping Methods 0.000 claims description 135
- 238000004590 computer program Methods 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 12
- 238000013519 translation Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 abstract description 7
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000001737 promoting effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/11—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/44—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- User Interface Of Digital Computer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
Description
本出願は、2020年11月26日に提出された、名称が「オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器」であり、出願番号が第202011355859.6号である中国特許出願について優先権を主張するものであり、同出願の開示の全ては、本出願に参照として取り込まれている。
展示インタフェース上で表示された第1のページが第2のページに更新されたことに応答して、前記第2のページがマルチメディアコンテンツを含むか否かを決定することであって、ただし、前記第1のページが表示されながら、前記第1のページにおけるテキストに対応するオーディオが再生されることと、
前記第2のページが前記マルチメディアコンテンツを含み、かつ前記マルチメディアコンテンツが無音再生状態である場合、前記オーディオを再生し続けるように制御することと、
前記マルチメディアコンテンツの再生が停止したときの前記オーディオの第1の再生識別子を決定し、前記第1の再生識別子に基づいて対応する目標テキストを決定することと、
前記展示インタフェース上で、前記第2のページを、前記目標テキストを含む第3のページに更新することと、を含む、オーディオとテキストとの同期方法を提供する。
展示インタフェース上で表示された第1のページが第2のページに更新されたことに応答して、前記第2のページがマルチメディアコンテンツを含むか否かを決定するための第1の決定モジュールであって、ただし、前記第1のページが表示されながら、前記第1のページにおけるテキストに対応するオーディオが再生される第1の決定モジュールと、
前記第2のページが前記マルチメディアコンテンツを含み、かつ前記マルチメディアコンテンツが無音再生状態である場合、前記オーディオを再生し続けるように制御する制御モジュールと、
前記マルチメディアコンテンツの再生が停止したときの前記オーディオの第1の再生識別子を決定し、前記第1の再生識別子に基づいて対応する目標テキストを決定する第2の決定モジュールと、
前記展示インタフェース上で、前記第2のページを、前記目標テキストを含む第3のページに更新する更新モジュールと、を含む、オーディオとテキストとの同期装置を提供する。
コンピュータプログラムが記憶された記憶装置と、
前記記憶装置における前記コンピュータプログラムを実行して、本開示の第1の側面に記載の方法を実現させる処理装置と、を含む、電子機器を提供する。
Claims (14)
- オーディオとテキストとの同期方法であって、
展示インタフェース上で表示された第1のページが第2のページに更新されたことに応答して、前記第2のページがマルチメディアコンテンツを含むか否かを決定するステップであり、前記第1のページが表示されながら、前記第1のページにおけるテキストに対応するオーディオが再生される、ステップと、
前記第2のページが前記マルチメディアコンテンツを含み、かつ、前記マルチメディアコンテンツが無音再生状態である場合に、前記オーディオを再生し続けるように制御するステップと、
前記マルチメディアコンテンツの再生が停止したときの前記オーディオの第1の再生識別子を決定し、前記第1の再生識別子に基づいて、対応する目標テキストを決定するステップと、
前記展示インタフェース上で、前記第2のページを、前記目標テキストを含む第3のページに更新するステップと、
を含む、方法。 - 前記第1の再生識別子は、再生時間識別子を含み、
前記第1の再生識別子に基づいて対応する目標テキストを決定するステップは、
予め設定された第1のマッピング関係で、前記再生時間識別子にマッチする第1のマッピングレコードを決定するステップであり、
前記第1のマッピング関係は、少なくとも1つのマッピングレコードを含み、
前記マッピングレコードは、テキストとオーディオ再生時間範囲との対応関係を含み、
前記再生時間識別子は、前記第1のマッピングレコードにおける再生時間範囲に属する、
ステップと、
前記第1のマッピングレコードに基づいて、前記目標テキストを決定するステップと、
を含む、請求項1に記載の方法。 - 前記オーディオは、少なくとも1つのオーディオファイルを含み、
前記第1の再生識別子は、再生時間識別子及びオーディオ識別子を含み、
前記第1の再生識別子に基づいて対応する目標テキストを決定するステップは、
予め設定された第2のマッピング関係で、前記オーディオ識別子にマッチする第2のマッピングレコードを決定するステップであり、
前記第2のマッピング関係は、少なくとも1つのマッピングレコードを含み、
前記マッピングレコードは、オーディオファイルと、段落分けテキストとの対応関係を含み、
前記オーディオ識別子によって示される目標オーディオファイルは、前記第2のマッピングレコードにおけるオーディオファイルである、
ステップと、
前記第2のマッピングレコードに基づいて、目標の段落分けテキストを決定するステップと、
予め設定された第3のマッピング関係で、前記再生時間識別子にマッチする第3のマッピングレコードを決定するステップであり、
前記第3のマッピング関係は、少なくとも1つのマッピングレコードを含み、
前記マッピングレコードは、前記目標の段落分けテキストにおけるテキストと、前記目標オーディオファイルの再生時間範囲との対応関係を含み、
前記再生時間識別子は、前記第3のマッピングレコードにおける再生時間範囲に属する、
ステップと、
前記第3のマッピングレコードに基づいて、前記目標の段落分けテキストにおける前記目標テキストを決定するステップと、
を含む、請求項1に記載の方法。 - 前記方法は、さらに、
前記展示インタフェース上で前記第1のページが展示されているときの前記オーディオの第2の再生識別子に基づいて、前記第2の再生識別子に対応する第1のテキストを決定するステップと、
前記第1のテキストにおける末尾の所定数の要素が、前記展示インタフェースの目標領域内に展示されているか否かを決定するステップと、
前記第1のテキストにおける末尾の所定数の要素が前記目標領域内に展示されていない場合に、前記第1のテキストにおける前記目標領域内に展示されている要素と、前記第1のテキストに含まれる要素との目標割合を決定するステップと、
前記第2の再生識別子と前記目標割合とに基づいて、前記第1のページを前記第2のページに更新するか否かを決定するステップと、
を含む、請求項1~3のいずれか1項に記載の方法。 - 前記方法は、さらに、
前記展示インタフェース内に前記第1のテキストにおける要素が展示されているか否かを決定するステップ、を含み、
前記第1のテキストにおける末尾の所定数の要素が前記展示インタフェースの目標領域内に展示されているか否かを決定するステップは、
前記展示インタフェース内に前記第1のテキストにおけるいずれかの要素が展示されている場合に、
前記第1のテキストにおける末尾の所定数の要素が、前記目標領域内に展示されているか否かを決定するステップ、
を含む、
請求項4に記載の方法。 - 前記方法は、さらに、
前記第2のページが前記マルチメディアコンテンツを含み、かつ、前記マルチメディアコンテンツが再生状態にない場合に、
前記マルチメディアコンテンツを前記展示インタフェース上で所定時間再生するように制御するステップ、
を含む、
請求項1~5のいずれか1項に記載の方法。 - 前記方法は、さらに、
前記第2のページが前記マルチメディアコンテンツを含み、ページめくり指令を受信した場合に、
前記展示インタフェース上で、前記第2のページを、前記ページめくり指令によって指示された第2のテキストを含む第4のページに更新するステップ、
を含む、
請求項1~5のいずれか1項に記載の方法。 - 前記展示インタフェース上で、前記第2のページを第3のページに更新するステップは、
前記展示インタフェース上で、ページめくりアニメーション、オーバーレイアニメーション、平行移動アニメーションのいずれか1つを含む、予め設定されたページめくり効果に従って、前記第2のページを前記第3のページに置き換えるステップ、または、
前記展示インタフェース上で、予め設定された速度で、前記第2のページから前記第3のページにスクロールするステップ、
を含む、
請求項1~7のいずれか1項に記載の方法。 - 前記第1のページが表示されながら、前記第1のページにおけるテキストに対応するオーディオが再生されるステップは、
前記展示インタフェース上で前記第1のページが展示されているときの前記オーディオの第3の再生識別子に基づいて、前記第3の再生識別子に対応する第3のテキストを決定するステップと、
前記展示インタフェース上で、ハイライト表示、下線表示、太字表示のうちの少なくとも1つを含む、予め設定された表示パターンで前記第3のテキストをマーキングするステップと、
を含む、
請求項1~8のいずれか1項に記載の方法。 - 請求項1~9のいずれか1項に記載の方法を実行するためのモジュールを含む、
オーディオとテキストとの同期装置。 - 処理装置によって実行されると、請求項1~9のいずれか1項に記載の方法を実現させるコンピュータプログラムが記憶された、非一時的なコンピュータ読取可能な媒体。
- コンピュータプログラムが記憶された記憶装置と、
前記記憶装置における前記コンピュータプログラムを実行して、請求項1~9のいずれか1項に記載の方法を実現させる処理装置と、
を含む、電子機器。 - 処理装置によって実行されると、請求項1~9のいずれか1項に記載の方法を実施させる、コンピュータプログラム。
- 処理装置によって実行されると、請求項1~9のいずれか1項に記載の方法を実施させるコンピュータプログラムが記憶された、コンピュータプログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011355859.6 | 2020-11-26 | ||
CN202011355859.6A CN112397104B (zh) | 2020-11-26 | 2020-11-26 | 音频与文本的同步方法、装置、可读介质和电子设备 |
PCT/CN2021/127303 WO2022111206A1 (zh) | 2020-11-26 | 2021-10-29 | 音频与文本的同步方法、装置、可读介质和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023529571A true JP2023529571A (ja) | 2023-07-11 |
JP7548678B2 JP7548678B2 (ja) | 2024-09-10 |
Family
ID=74605312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022571224A Active JP7548678B2 (ja) | 2020-11-26 | 2021-10-29 | オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230229382A1 (ja) |
JP (1) | JP7548678B2 (ja) |
CN (1) | CN112397104B (ja) |
WO (1) | WO2022111206A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113096635B (zh) * | 2021-03-31 | 2024-01-09 | 抖音视界有限公司 | 一种音频和文本的同步方法、装置、设备以及介质 |
CN113259740A (zh) * | 2021-05-19 | 2021-08-13 | 北京字跳网络技术有限公司 | 一种多媒体处理方法、装置、设备及介质 |
CN113778307B (zh) * | 2021-09-27 | 2023-09-19 | 口碑(上海)信息技术有限公司 | 一种信息交互方法及装置 |
CN115062168B (zh) * | 2022-06-28 | 2024-10-25 | 北京字跳网络技术有限公司 | 媒体内容展示方法、装置、设备及存储介质 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2146878A1 (en) * | 1992-10-30 | 1994-05-11 | Roy J. Mankovitz | Apparatus and methods for music and lyrics broadcasting |
US20020002458A1 (en) * | 1997-10-22 | 2002-01-03 | David E. Owen | System and method for representing complex information auditorially |
AU7041000A (en) * | 1999-09-07 | 2001-04-10 | Kyu Jin Park | Advertising method using digital file and using telephone receiver for digital motion picture advertisement |
KR100716973B1 (ko) * | 2004-02-21 | 2007-05-10 | 삼성전자주식회사 | Av 데이터에 동기된 텍스트 서브 타이틀 데이터를기록한 정보저장매체, 재생방법 및 장치 |
CN100559368C (zh) * | 2004-07-14 | 2009-11-11 | 华南理工大学 | 可听文本的自动制作和播放的方法 |
JP5018352B2 (ja) | 2007-09-04 | 2012-09-05 | 大日本印刷株式会社 | 書籍コンテンツに広告を挿入配信するサーバ装置 |
CN101383937A (zh) * | 2007-09-06 | 2009-03-11 | 华为技术有限公司 | 播放视频广告和文字信息的方法、系统、服务器和终端 |
US8290777B1 (en) * | 2009-06-12 | 2012-10-16 | Amazon Technologies, Inc. | Synchronizing the playing and displaying of digital content |
EP2524325A2 (en) * | 2010-01-11 | 2012-11-21 | Apple Inc. | Electronic text manipulation and display |
US20120036429A1 (en) * | 2010-05-07 | 2012-02-09 | For-Side.Com Co., Ltd. | Electronic book system and content server |
JP5463385B2 (ja) | 2011-06-03 | 2014-04-09 | アップル インコーポレイテッド | テキストデータとオーディオデータとの間のマッピングの自動作成 |
JP5477410B2 (ja) * | 2012-03-21 | 2014-04-23 | ヤマハ株式会社 | 音楽コンテンツ表示装置及びプログラム |
CN102842326B (zh) * | 2012-07-11 | 2015-11-04 | 杭州联汇数字科技有限公司 | 一种视音频及图文同步播放方法 |
US9099089B2 (en) * | 2012-08-02 | 2015-08-04 | Audible, Inc. | Identifying corresponding regions of content |
US9940307B2 (en) * | 2012-12-31 | 2018-04-10 | Adobe Systems Incorporated | Augmenting text with multimedia assets |
US9558787B2 (en) | 2014-01-29 | 2017-01-31 | Google Inc. | Media application backgrounding |
CN105763925A (zh) * | 2014-12-17 | 2016-07-13 | 珠海金山办公软件有限公司 | 演示文稿视频录制方法及装置 |
US20180032305A1 (en) * | 2016-07-29 | 2018-02-01 | Paul Charles Cameron | Systems and methods for automatic-creation of soundtracks for text |
WO2018078463A1 (en) * | 2016-10-24 | 2018-05-03 | Sony Mobile Communications Inc | Methods, computer program products and devices for automatically synchronizing an audio track with a plurality of pages |
CN106777099A (zh) * | 2016-12-14 | 2017-05-31 | 掌阅科技股份有限公司 | 业务语音数据的处理方法、装置及终端设备 |
CN108512874A (zh) * | 2017-02-27 | 2018-09-07 | 上海谦问万答吧云计算科技有限公司 | 一种在线答疑数据的同步方法及装置 |
US10671251B2 (en) * | 2017-12-22 | 2020-06-02 | Arbordale Publishing, LLC | Interactive eReader interface generation based on synchronization of textual and audial descriptors |
CN108462892B (zh) * | 2018-03-26 | 2019-08-06 | 百度在线网络技术(北京)有限公司 | 图像和音频同步播放的处理方法及设备 |
CN109766305A (zh) * | 2018-12-11 | 2019-05-17 | 中新金桥数字科技(北京)有限公司 | 基于Android系统的Epub电子书文本与音视频对照阅读方法及系统 |
CN109889859A (zh) * | 2019-03-11 | 2019-06-14 | 杭州雅顾科技有限公司 | 一种直播视频与文档翻页的同步方法 |
CN110677689A (zh) * | 2019-09-29 | 2020-01-10 | 杭州当虹科技股份有限公司 | 一种基于用户视角的vr视频广告无缝插播方法 |
CN114501106A (zh) * | 2020-08-04 | 2022-05-13 | 腾讯科技(深圳)有限公司 | 一种文稿显示控制方法、装置、电子设备和存储介质 |
-
2020
- 2020-11-26 CN CN202011355859.6A patent/CN112397104B/zh active Active
-
2021
- 2021-10-29 US US17/928,573 patent/US20230229382A1/en active Pending
- 2021-10-29 WO PCT/CN2021/127303 patent/WO2022111206A1/zh active Application Filing
- 2021-10-29 JP JP2022571224A patent/JP7548678B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP7548678B2 (ja) | 2024-09-10 |
WO2022111206A1 (zh) | 2022-06-02 |
CN112397104A (zh) | 2021-02-23 |
CN112397104B (zh) | 2022-03-29 |
US20230229382A1 (en) | 2023-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7548678B2 (ja) | オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器 | |
WO2022042593A1 (zh) | 字幕编辑方法、装置和电子设备 | |
US11836180B2 (en) | System and management of semantic indicators during document presentations | |
WO2023051297A1 (zh) | 信息显示方法、装置、电子设备和存储介质 | |
US20120240036A1 (en) | E-Book Reading Location Indicator | |
US11423112B2 (en) | Document input content processing method and apparatus, electronic device, and storage medium | |
WO2014154097A1 (en) | Automatic page content reading-aloud method and device thereof | |
JP2024528439A (ja) | コンテンツ表示方法、装置、機器及び媒体 | |
WO2023035835A1 (zh) | 一种信息展示方法、装置、设备及介质 | |
JP2023549903A (ja) | マルチメディアのインタラクション方法、情報インタラクション方法、装置、機器及び媒体 | |
CN112102841A (zh) | 一种音频编辑方法、装置和用于音频编辑的装置 | |
JP2024525192A (ja) | オーディオ処理方法、装置、電子機器及び記憶媒体 | |
CN108491178B (zh) | 信息浏览方法、浏览器和服务器 | |
CN111125480A (zh) | 背景音乐的播放方法、设备、客户端装置及电子设备 | |
JP7541201B2 (ja) | 情報返信方法、装置、電子機器、コンピュータ記憶媒体及び製品 | |
WO2022252920A1 (zh) | 应用程序的页面显示方法、装置和电子设备 | |
CN115269920A (zh) | 交互方法、装置、电子设备和存储介质 | |
CN113238688B (zh) | 表格展示方法、装置、设备及介质 | |
CN110381356B (zh) | 音视频生成方法、装置、电子设备及可读介质 | |
US20140297285A1 (en) | Automatic page content reading-aloud method and device thereof | |
CN112530472B (zh) | 音频与文本的同步方法、装置、可读介质和电子设备 | |
CN111209503A (zh) | 网页中弹窗的处理方法、装置、电子设备、及存储介质 | |
US20140101284A1 (en) | System and method for customization of web content | |
KR100676621B1 (ko) | 이동통신 단말기의 브라우저에서 지원되지 않는 이미지 및태그 처리를 위한 웹 문서 변환 방법 | |
JP2024521940A (ja) | マルチメディア処理方法、装置、デバイスおよび媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240104 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240422 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240730 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240827 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7548678 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |