JP2023529571A - オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器 - Google Patents

オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器 Download PDF

Info

Publication number
JP2023529571A
JP2023529571A JP2022571224A JP2022571224A JP2023529571A JP 2023529571 A JP2023529571 A JP 2023529571A JP 2022571224 A JP2022571224 A JP 2022571224A JP 2022571224 A JP2022571224 A JP 2022571224A JP 2023529571 A JP2023529571 A JP 2023529571A
Authority
JP
Japan
Prior art keywords
page
text
audio
playback
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022571224A
Other languages
English (en)
Other versions
JP7548678B2 (ja
Inventor
ヂャン,ウェイウェイ
チェン,ドンユー
ヤン,ファポン
ヂォン,ジャフォン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of JP2023529571A publication Critical patent/JP2023529571A/ja
Application granted granted Critical
Publication of JP7548678B2 publication Critical patent/JP7548678B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/44Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

本開示は、オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器に関し、電子情報技術分野に関する。該方法は、展示インタフェースに表示された第1のページが第2のページに更新されたことに応答して、第2のページがマルチメディアコンテンツを含むか否かを決定するステップであり、第1のページが表示されながら、第1のページにおけるテキストに対応するオーディオが再生されることと、第2のページがマルチメディアコンテンツを含み、かつ、マルチメディアコンテンツが無音再生状態である場合に、オーディオを再生し続けるように制御することと、マルチメディアコンテンツの再生が停止したときのオーディオの第1の再生識別子を決定し、第1の再生識別子に基づいて、対応する目標テキストを決定することと、展示インタフェース上で、第2のページを、目標テキストを含む第3のページに更新することと、を含む。本開示は、ページめくり後に展示される第2のページに含まれるマルチメディアコンテンツを認識し、オーディオの再生と展示インタフェース上で展示されるコンテンツを制御することによって、マルチメディアコンテンツを正常に展示した上で、オーディオとテキストとの同期を保持することができる。【選択図】図1

Description

本開示は、電子情報技術分野に関し、具体的には、オーディオとテキストとの同期方法、装置、読取可能な媒体、及び電子機器に関する。
関連出願の相互参照
本出願は、2020年11月26日に提出された、名称が「オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器」であり、出願番号が第202011355859.6号である中国特許出願について優先権を主張するものであり、同出願の開示の全ては、本出願に参照として取り込まれている。
電子情報技術分野では、スマート端末の日常生活における普及が進むにつれて、ユーザは、いつでもどこでもスマート端末上の閲覧ソフトウェアで閲覧することができる。しかしながら、多くの使用シーンでは、単に閲覧だけではユーザのニーズを満たすことができない。ユーザが小説を閲覧している間に、該小説に対応するオーディオを加えて同期再生することで、ユーザは、読みながら聞き、視覚と聴覚の二次元で小説の情報を取得することができ、ユーザの閲覧体験を向上させる。小説には、一般的に、マルチメディアコンテンツ(例えば、プロモーションコンテンツ、アンケートなど)が挿入されているため、これらのマルチメディアコンテンツは、オーディオと小説との同期を妨げる。
この発明の概要は、構想を簡単な形で紹介するために提供され、これら構想は、後の発明を実施するための形態で詳細に記述される。この発明の概要は、権利化しようとする技術案のキーポイントとなる特徴又は必須な特徴を標識することを意図するものではなく、権利化しようとする技術案の範囲を制限することも意図していない。
第1の側面によれば、本開示は、
展示インタフェース上で表示された第1のページが第2のページに更新されたことに応答して、前記第2のページがマルチメディアコンテンツを含むか否かを決定することであって、ただし、前記第1のページが表示されながら、前記第1のページにおけるテキストに対応するオーディオが再生されることと、
前記第2のページが前記マルチメディアコンテンツを含み、かつ前記マルチメディアコンテンツが無音再生状態である場合、前記オーディオを再生し続けるように制御することと、
前記マルチメディアコンテンツの再生が停止したときの前記オーディオの第1の再生識別子を決定し、前記第1の再生識別子に基づいて対応する目標テキストを決定することと、
前記展示インタフェース上で、前記第2のページを、前記目標テキストを含む第3のページに更新することと、を含む、オーディオとテキストとの同期方法を提供する。
第2の側面によれば、本開示は、
展示インタフェース上で表示された第1のページが第2のページに更新されたことに応答して、前記第2のページがマルチメディアコンテンツを含むか否かを決定するための第1の決定モジュールであって、ただし、前記第1のページが表示されながら、前記第1のページにおけるテキストに対応するオーディオが再生される第1の決定モジュールと、
前記第2のページが前記マルチメディアコンテンツを含み、かつ前記マルチメディアコンテンツが無音再生状態である場合、前記オーディオを再生し続けるように制御する制御モジュールと、
前記マルチメディアコンテンツの再生が停止したときの前記オーディオの第1の再生識別子を決定し、前記第1の再生識別子に基づいて対応する目標テキストを決定する第2の決定モジュールと、
前記展示インタフェース上で、前記第2のページを、前記目標テキストを含む第3のページに更新する更新モジュールと、を含む、オーディオとテキストとの同期装置を提供する。
第3の側面によれば、本開示は、処理装置によって実行されると、本開示の第1の側面に記載の方法を実現させるコンピュータプログラムが記憶された、コンピュータ読取可能な媒体を提供する。
第4の側面によれば、本開示は、
コンピュータプログラムが記憶された記憶装置と、
前記記憶装置における前記コンピュータプログラムを実行して、本開示の第1の側面に記載の方法を実現させる処理装置と、を含む、電子機器を提供する。
上記の技術案によれば、本開示は、展示インタフェース上で表示された第1のページが第2のページに更新されたシーンにおいて、まず、第2のページがマルチメディアコンテンツを含むか否かを決定する。ここで、展示インタフェース上で、第1のページが表示されながら、第1のページにおけるテキストに対応するオーディオが再生される。その後、第2のページがマルチメディアコンテンツを含み、かつマルチメディアコンテンツが無音再生状態である場合、オーディオを再生し続けるように制御し、さらに、マルチメディアコンテンツの再生が停止したときのオーディオの第1の再生識別子を決定し、第1の再生識別子に基づいて、対応する目標テキストを決定し、最後に、展示インタフェース上で、第2のページを、目標テキストを含む、第3のページに更新する。本開示は、ページめくり後に展示される第2のページに含まれるマルチメディアコンテンツを認識し、オーディオの再生と展示インタフェース上で展示されるコンテンツを制御することによって、マルチメディアコンテンツを正常に展示した上で、オーディオとテキストとの同期を保持することができる。
本開示の他の特徴及び利点は、後の発明を実施するための形態の部分で詳細に説明される。
本開示の各実施例の上記及び他の特徴、利点、並びに、態様は、添付図面を結び付けながら、以下の発明を実施するための形態を参照することで、より明らかとなる。全ての添付図面において、同一又は類似する要素を同一又は類似する符号で示している。添付図面は、概略的なものであり、原本及び要素は、必ずしも縮尺通りに描かれていないことが理解されたい。
例示的な実施例による、オーディオとテキストとの同期方法のフローチャートである。 例示的な実施例による、展示インタフェースの概略図である。 例示的な実施例による、別のオーディオとテキストとの同期方法のフローチャートである。 例示的な実施例による、別のオーディオとテキストとの同期方法のフローチャートである。 例示的な実施例による、別のオーディオとテキストとの同期方法のフローチャートである。 例示的な実施例による、別のオーディオとテキストとの同期方法のフローチャートである。 例示的な実施例による、別のオーディオとテキストとの同期方法のフローチャートである。 例示的な実施例による、別のオーディオとテキストとの同期方法のフローチャートである。 例示的な実施例による、展示インタフェースの概略図である。 例示的な実施例による、オーディオとテキストとの同期装置のブロック図である。 例示的な実施例による、別のオーディオとテキストとの同期装置のブロック図である。 例示的な実施例による、別のオーディオとテキストとの同期装置のブロック図である。 例示的な実施例による、別のオーディオとテキストとの同期装置のブロック図である。 例示的な実施例による、電子機器のブロック図である。
以下では、添付図面を参照しながら、本開示の実施例をより詳細に記述する。添付図面においては、本開示のいくつかの実施例が示されるが、本開示を各種の形態で実現することができ、ここで記述された実施例に限定されると解釈されるべきではないことを理解されたい。逆に、これらの実施例は、本開示をより徹底的且つ完全に理解するために提供される。本開示の添付図面及び実施例は、例示的なものに過ぎず、本開示の保護範囲を制限するものではないことを理解されたい。
本開示の方法の実施形態に記載された各ステップは、異なる順序で実行されてもよく、且つ/又は、並行して実行されてもよいことが理解されたい。さらに、方法の実施形態は、追加のステップを含んでもよく、且つ/又は、示されたステップの実行を省略してもよい。本開示の範囲は、この点において制限されない。
本明細書で使用される「含む」という用語及びその変形は、開放式な包括であり、即ち、「~を含むが、それらに限らない」を意味する。「~に基づいて」という用語は、「少なくとも部分的に基づいて」を意味する。「一実施例」という用語は、「少なくとも1つの実施例」を意味し、「別の実施例」という用語は、「少なくとも1つの別の実施例」を意味し、「いくつかの実施例」という用語は、「少なくともいくつかの実施例」を意味する。他の用語の関連定義は、以下の記述において与えられる。
なお、本開示で記載された「第1の」、「第2の」などの概念は、単に異なる装置、モジュール、又は、ユニットを区別するためのものであり、これらの装置、モジュール、又は、ユニットによって実行される機能の順序又は相互依存関係を限定するためのものではない。
なお、本開示で記載された「1つの」、「複数の」の修飾は、模式的なものであり、制限性のあるものではない。特別な説明がない限り、「1つ又は複数」と理解されるべきであることが、当業者にとっては自明である。
本開示の実施形態における複数の装置間でやりとりされるメッセージ又は情報の名称は、説明的なものに過ぎず、これらメッセージ又は情報の範囲を制限するものではない。
図1は、例示的な実施例によるオーディオとテキストとの同期方法のフローチャートである。図1に示すように、この方法は、以下のようなステップを含み得る。
ステップ101:展示インタフェース上で表示された第1のページが第2のページに更新されたことに応答して、第2のページがマルチメディアコンテンツを含むか否かを決定する。ここで、第1のページが表示されながら、第1のページにおけるテキストに対応するオーディオが再生される。
例えば、ユーザは、端末機器にインストールされた閲覧ソフトウェアによって文書を閲覧することができる。文書は、テキストを含んでもよいし、マルチメディアコンテンツをさらに含んでもよい。マルチメディアコンテンツは、例えば、画像、ビデオ、オーディオなどのフォーマットであってもよいし、画像、ビデオ、オーディオなどのフォーマットの組み合わせであってもよい。閲覧ソフトウェアは、文書におけるコンテンツを端末機器の展示インタフェース(例えば、ディスプレイ)上で展示できるとともに、端末機器の再生装置(例えば、スピーカ)を介して、文書に含まれるテキストに対応するオーディオを再生することができる。理解できるように、閲覧ソフトウェアは、展示インタフェース上で展示されるコンテンツを制御するリーダーと、再生装置を制御してオーディオを再生するプレーヤーという2つの部分を含む。展示インタフェースがある時刻で展示するコンテンツは、1つのページとして捉えることができる。該ページは、テキストを含んでもよいし、マルチメディアコンテンツを含んでもよい。ただし、ユーザが閲覧している文書は、一冊の電子ブック(例えば、小説)であってもよいし、他のタイプの文書、例えば、ニュース、公式アカウント記事、ブログなどであってもよい。文書は、任意のフォーマット、例えば、.txt、.chm(英語:Compiled HTML Help file)、.pdf(英語:Portable Document Format)、.epub(英語:Electronic Publication)、.mobiなどのフォーマットであってもよい。本開示は、これについて具体的に限定しない。文書に含まれるテキストは、例えば、小説における1つ又は複数の章節であってもよいし、1つ又は複数の段落であってもよいし、1つ又は複数のセンテンスであってもよい。それに応じて、文書に含まれたテキストに対応するオーディオは、例えば、TTS(英語:Text To Speech、日本語:テキストから音声へ)サービスによってテキストを変換して得られたオーディオファイルであってもよいし、テキストに基づいて録音されたオーディオファイルであってもよい。オーディオは、任意のフォーマットのファイル、例えばMP3、.WAV、.WMA(英語:Windows Media Audio)、.AMR(英語:Adaptive Multi-Rate)などのフォーマットのファイルであってもよい。本開示はこれについて具体的に限定しない。
展示インタフェース上で第1のページが展示されるとき、第1のページにおけるテキストに対応するオーディオも再生され得る。これにより、ユーザは、読みながら聞くことができる。オーディオの再生識別子がページをめくる必要があることを示し、又は、ユーザがページめくり指令をトリガーする場合、展示インタフェース上で表示される第1のページを第2のページに更新し得る(即ち、ページめくり操作を実行する)。第2のページに含まれるコンテンツは、ユーザが閲覧している文書のうち、第1のページに含まれるテキストに隣接し、かつ、第1のページに含まれたテキストの後に位置するコンテンツであってもよいし、閲覧ソフトウェアが第1のページの後に挿入したコンテンツであってもよい。第2のページに含まれるコンテンツは、テキストであってもよいし、マルチメディアコンテンツであってもよい。
ここで、マルチメディアコンテンツは、ユーザが閲覧を意図していないコンテンツとして捉えることができ、例えば、プロモーションコンテンツ、アンケート、ギフティングコンテンツ、コメントコンテンツなどであり、オーディオとテキストとの同期を妨げる。従って、ページめくり操作(即ち、第1のページを第2のページに更新する)に対して、第2のページがマルチメディアコンテンツを含むか否かを判断することができる。例えば、展示インタフェースに展示された第1のページは、図2の(a)に示すように、第1のページにおけるテキストに対応するオーディオが「ありがとうございます」まで再生された場合、展示インタフェース上で表示された第1のページが第2のページに更新される。第2のページは、図2の(b)に示す通りである。第2のページは、ギフティングコンテンツ(即ち、マルチメディアコンテンツ)を含む。
ステップ102:第2のページがマルチメディアコンテンツを含み、かつマルチメディアコンテンツが無音再生状態である場合、オーディオを再生し続けるように制御する。
例示的に、第2のページがマルチメディアコンテンツを含まない(即ち、第2のページに含まれるのがテキストである)と判断された場合、オーディオを再生し続けるように制御してもよい。このとき、オーディオと、第2のページに含まれるテキストとの同期を保持する。第2のページがマルチメディアコンテンツを含むと判断された場合、マルチメディアコンテンツの再生状態をさらに判断し、マルチメディアコンテンツの再生状態に基づいて、オーディオの再生を制御することができる。再生状態は、無音再生状態と有音再生状態とに分けることができる。マルチメディアコンテンツの再生状態が有音再生状態である場合、ユーザがマルチメディアコンテンツにおける音声を聞き取れるように、オーディオの再生を一時停止するように制御し、マルチメディアコンテンツの再生が完了した後、オーディオの再生を再開してもよい。マルチメディアコンテンツの再生状態が無音再生状態である場合、オーディオを再生し続けるように制御してもよい。この場合、ユーザがオーディオにより情報を取得することに影響することがない。ここで、マルチメディアコンテンツの再生状態が無音再生状態であることは、マルチメディアコンテンツ自体が音声を含まない(例えば、マルチメディアコンテンツがコメントコンテンツである)シーン1と、マルチメディアコンテンツが音声を含むが、閲覧ソフトウェアにおける設定に基づいてマルチメディアコンテンツに含まれる音声を再生しないシーン2という2つのシーンに分けることができる。
ステップ103:マルチメディアコンテンツの再生が停止したときのオーディオの第1の再生識別子を決定する。
ステップ104:第1の再生識別子に基づいて、対応する目標テキストを決定する。
例示的に、マルチメディアコンテンツの再生中に、オーディオは再生され続ける。このとき、展示インタフェース上でオーディオに対応するテキストが展示されず、オーディオとテキストが同期されていない。従って、マルチメディアコンテンツの再生が停止したときに、このときのオーディオの第1の再生識別子を取得して、対応する目標テキストを決定することができる。第1の再生識別子は、オーディオのこの時再生されている1つ又は複数のオーディオフレームとして捉えてもよいし、オーディオのこの時の再生進行度として捉えてもよく、さらに、複数のオーディオファイルのうち、どのオーディオファイルが再生されているかとして捉えてもよい。ここで、マルチメディアコンテンツの再生が停止したことは、マルチメディアコンテンツの再生が完了したこと、又は、マルチメディアコンテンツが予め設定された時間(例えば、30s)で展示されたこと、さらに、ユーザが予め設定された操作を行ってマルチメディアコンテンツをオフにしたこと、として捉えることができる。
その後、第1の再生識別子と、予め確立されたオーディオの再生識別子とテキストとの間のマッピング関係に基づいて、第1の再生識別子に対応する目標テキストを決定してもよい。具体的には、オーディオの再生識別子とテキストとの間のマッピング関係を予め確立してもよい。マッピング関係には、複数のマッピングレコードが格納されており、各マッピングレコードには、テキストと再生識別子との対応関係が含まれる。そして、マッピング関係から第1の再生識別子にマッチするマッピングレコードを見出して、該マッピングレコードに基づいて、目標テキストを決定する。目標テキストは、ユーザが閲覧している文書における、第1の再生識別子にマッチするテキストとして捉えることができる。即ち、第1の再生識別子によって示されるオーディオフレームまで再生される際に、オーディオフレームに含まれる音声コンテンツが、目標テキストに含まれる文字コンテンツに対応する。
ステップ105:展示インタフェース上で、第2のページを、目標テキストを含む第3のページに更新する。
例示的に、目標テキストを決定した後、展示インタフェース上で表示された第2のページを、目標テキストを含む第3のページに更新してもよい。上記プロセスにおいてオーディオが常に再生されているので、オーディオが第1の再生識別子によって示されるオーディオフレームまで再生されると、展示インタフェース上で、第1の再生識別子に対応する目標テキストが表示される。これにより、オーディオと目標テキストとの同期が保持される。このように、ユーザがマルチメディアコンテンツを閲覧した後、オーディオは、依然として展示インタフェース上で表示された第3のページと同期を保持することができる。それにより、ユーザは、引き続き読みながら聞くことができ、ユーザの閲覧体験を向上させる。
以上の通り、本開示は、展示インタフェース上で表示された第1のページが第2のページに更新されたシーンでは、まず、第2のページがマルチメディアコンテンツを含むか否かを決定する。ここで、展示インタフェースで、第1のページが表示されながら、第1のページにおけるテキストに対応するオーディオが再生される。その後、第2のページがマルチメディアコンテンツを含み、かつ、マルチメディアコンテンツが無音再生状態である場合、オーディオを再生し続けるように制御してもよい。次に、マルチメディアコンテンツの再生が停止したときのオーディオの第1の再生識別子を決定し、第1の再生識別子に基づいて、対応する目標テキストを決定する。最後に、展示インタフェース上で、第2のページを、目標テキストを含む第3のページに更新する。本開示は、ページめくり後に展示される第2のページに含まれる、マルチメディアコンテンツを認識し、オーディオの再生と展示インタフェース上で、展示されるコンテンツを制御することによって、マルチメディアコンテンツを正常に展示した上で、オーディオとテキストとの同期を保持することができる。
図3は、例示的な実施例による、別のオーディオとテキストとの同期方法のフローチャートである。図3に示すように、第1の再生識別子は、再生時間識別子を含み、ステップ104は、以下のようなステップを含み得る。
ステップ1041:予め設定された第1のマッピング関係で、再生時間識別子にマッチする第1のマッピングレコードを決定する。そのうち、第1のマッピング関係は、少なくとも1つのマッピングレコードを含み、マッピングレコードは、テキストとオーディオ再生時間範囲との対応関係を含み、再生時間識別子は、第1のマッピングレコードにおける再生時間範囲に属する。
ステップ1042:第1のマッピングレコードに基づいて、目標テキストを決定する。
あるシーンでは、第1の再生識別子は、オーディオが、どのオーディオフレームまで再生されたか、又は、どの時刻まで再生されたかを示す再生時間識別子を含んでもよい。それに応じて、第1の再生識別子に対応する目標テキストを決定するために、まず、オーディオ再生時間範囲とテキストとが対応している第1のマッピング関係を取得してもよい。第1のマッピング関係には、複数のマッピングレコードが格納されており、各マッピングレコードには、テキストとオーディオ再生時間範囲との対応関係が含まれる。
ここで、テキストは、ユーザが閲覧している文書のうちの1つ又は複数の文であってもよいし、1つ又は複数の段落、若しくは1つ又は複数の章節であってもよい。テキストは、例えば、文識別子で示されてもよいし、段落識別子で示されてもよいし、章節識別子で示されてもよい。それに応じて、再生時間範囲は、相応なテキストに対応するオーディオの開始終了時刻を示すためのものであり、例えば、フレーム番号範囲であってもよいし、時間範囲であってもよい。例えば、1つのマッピングレコードに含まれる再生時間範囲が5s~20sであり、対応するテキストの文識別子が0x57ADである場合、該マッピングレコードは、オーディオが第5s~第20sまで再生されるとき、対応するのは、文識別子が0x57ADであるテキストであることを示す。又は、別のマッピングレコードに含まれる再生時間範囲が35フレーム~80フレームであり、対応するテキストの段落識別子が0106である場合、該マッピングレコードは、オーディオが第35フレーム~第80フレームまで再生される時、対応するのは、段落識別子が0106であるテキストであることを示す。その後、第1のマッピング関係から再生時間識別子が再生時間範囲に属する第1のマッピングレコードをルックアップする。それにより、第1のマッピングレコードにおけるテキストを目標テキストとする。
なお、第1のマッピング関係は、予め確立されてサーバに記憶されている。端末機器がオーディオを再生する際に、サーバから第1のマッピング関係を取得することができる。第1のマッピング関係は、TTSサービスを利用してテキストを変換してオーディオを得る際に得られてもよいし、オーディオにおける各オーディオフレームに含まれる音声コンテンツと、テキストにおける文字コンテンツとの対応関係から得られてもよい。
図4は、例示的な実施例による、別のオーディオとテキストとの同期方法のフローチャートである。図4に示すように、オーディオは、少なくとも1つのオーディオファイルを含み、第1の再生識別子は、再生時間識別子とオーディオ識別子とを含み、それに応じて、ステップ104は、以下のようなステップを含み得る。
ステップ1043:予め設定された第2のマッピング関係で、オーディオ識別子にマッチする第2のマッピングレコードを決定する。第2のマッピング関係は、少なくとも1つのマッピングレコードを含み、マッピングレコードは、オーディオファイルと、段落分けテキストとの対応関係を含み、オーディオ識別子によって示される目標オーディオファイルは、第2のマッピングレコードにおけるオーディオファイルである。
ステップ1044:第2のマッピングレコードに基づいて、目標の段落分けテキストを決定する。
別のシーンでは、オーディオは、少なくとも1つのオーディオファイルを含んでもよい。それに応じて、第1の再生識別子は、オーディオがどのオーディオフレームまで再生されたか、又は、どの時刻まで再生されたかを示す再生時間識別子と、オーディオ識別子とを含んでもよい。オーディオ識別子は、現在再生されているのが、少なくとも1つのオーディオファイルのうちのどのオーディオファイルであるか、を示すためのものである。
第1の再生識別子に対応する目標テキストを決定するために、まず、オーディオファイルと段落分けテキストとが対応する第2のマッピング関係を取得してもよい。第2のマッピング関係には、複数のマッピングレコードが格納されており、各マッピングレコードには、段落分けテキストとオーディオファイルとの対応関係が含まれる。ここで、段落分けテキストは、ユーザが閲覧している文書における1つ又は複数の章節として捉えてもよいし(それに応じて、テキストは、章節における段落又は文として捉えることができる)、1つ又は複数の段落として捉えてもよい(それに応じて、テキストは、章節における文として捉えることができる)。段落分けテキストは、章節識別子で示されてもよいし、段落識別子で示されてもよい。例えば、1つのマッピングレコードに含まれるオーディオファイルのオーディオ識別子がa1であり、対応する段落分けテキストの章節識別子が0x1005である場合、該マッピングレコードは、オーディオファイルa1が再生されるとき、対応するのは、章節識別子が0x1005である段落分けテキストであることを示す。また、例えば、1つのマッピングレコードに含まれるオーディオファイルのオーディオ識別子がb1であり、対応する段落分けテキストの段落識別子が0xAA00である場合、該マッピングレコードは、オーディオファイルb1が再生されるとき、対応するのは、段落識別子が0xAA00である段落分けテキストであることを示す。その後、第2のマッピング関係から第2のマッピングレコードをルックアップしてもよい。第2のマッピングレコードにおけるオーディオファイルは、第1の再生識別子に含まれるオーディオ識別子が示す目標オーディオファイルと同じである。それにより、第2のマッピングレコードにおける段落分けテキストを目標の段落分けテキストとする。
ステップ1045:予め設定された第3のマッピング関係で、再生時間識別子にマッチする第3のマッピングレコードを決定する。第3のマッピング関係は、少なくとも1つのマッピングレコードを含み、マッピングレコードは、目標の段落分けテキストにおけるテキストと、目標オーディオファイルの再生時間範囲との対応関係を含み、再生時間識別子は、第3のマッピングレコードにおける再生時間範囲に属する。
ステップ1046:第3のマッピングレコードに基づいて、目標の段落分けテキストにおける目標テキストを決定する。
例示的に、目標の段落分けテキストを決定した後、目標の段落分けテキストのうちのテキストと、目標オーディオファイルの再生時間範囲とが対応する第3のマッピング関係を取得してもよい。第3のマッピング関係には、複数のマッピングレコードが格納されており、各マッピングレコードには、目標の段落分けテキストのうちのテキストと、目標オーディオファイルの再生時間範囲との対応関係が含まれる。
目標の段落分けテキストが、ユーザが閲覧している文書における1つの章節である場合、テキストは、目標の段落分けテキストにおける1つの段落であってもよい。目標の段落分けテキストが、ユーザが閲覧している文書における1つの段落である場合、テキストは、目標の段落分けテキストにおける1つの文であってもよい。それに応じて、再生時間範囲は、相応なテキストに対応するオーディオの開始終了時刻を示すためのものであり、例えば、フレーム番号範囲であってもよいし、時間範囲であってもよい。例えば、1つのマッピングレコードに含まれる目標オーディオファイルの再生時間範囲が100s~250sであり、対応する目標の段落分けテキストの文識別子が0x281Dである場合、該マッピングレコードは、オーディオが目標オーディオファイルの第100s~第250sまで再生されるとき、対応するのは、目標の段落分けテキストの文識別子が0x281Dであるテキストであることを示す。その後、第3のマッピング関係から、第1の再生識別子に含まれる再生時間識別子が再生時間範囲に属する第3のマッピングレコードをルックアップする。それにより、第3のマッピングレコードにおけるテキストを目標テキストとする。
なお、第2のマッピング関係、第3のマッピング関係は、いずれも予め確立されてサーバに記憶されている。端末機器がオーディオを再生する際に、サーバから第2のマッピング関係、第3のマッピング関係を取得することができる。第2のマッピング関係、第3のマッピング関係は、TTSサービスを利用してテキストを変換してオーディオを得る際に得られてもよいし、オーディオにおける各オーディオフレームに含まれる音声コンテンツと、テキストにおける文字コンテンツとの対応関係から得られてもよい。
図5は、例示的な実施例による、別のオーディオとテキストとの同期方法のフローチャートである。図5に示すように、この方法は、以下のようなステップをさらに含み得る。
ステップ106:展示インタフェース上で第1のページが展示されているときのオーディオの第2の再生識別子に基づいて、第2の再生識別子に対応する第1のテキストを決定する。
ステップ107:第1のテキストにおける末尾の所定数の要素が、展示インタフェースの目標領域内に展示されているか否かを決定する。
例えば、展示インタフェース上で第1のページが展示されるとき、第1のページにおけるテキストに対応するオーディオが同時に再生される。これにより、ユーザは読みながら聞くことができる。オーディオの現在の第2の再生識別子に基づいて、第2の再生識別子に対応する第1のテキストを決定してもよい。第1のテキストを決定する方式は、図3、図4に示される目標テキストを決定する方式と同様であるため、ここではこれ以上説明しない。その後、第1のテキストが展示インタフェースの目標領域内に完全に展示されているか否かを決定してもよい。展示インタフェースでテキストを展示するとき、ページをまたぐ現象がしばしば起こる。つまり、テキストは、展示インタフェースの目標領域内に一度に完全に展示されることができない。よって、オーディオの第2の再生識別子に基づいて、対応するテキストを決定する場合では、ページを正確にめくることが困難であり、オーディオとテキストとの同期を保持することが困難である。このため、現在時刻で、第1のテキストが、展示インタフェースの目標領域内に完全に展示されているか否かを判断する必要がある。第1のテキストは、1つ又は複数の要素を含んでもよい。要素は、第1のテキストを構成する最小単位として捉えることができる。第1のテキストが文又は段落である場合、要素は、1つの字(又は、1つの単語)であってもよい。ここで、目標領域は、例えば、展示インタフェースにおいて最後のテキストが存在する領域であってもよいし、予め指定された領域(例えば、展示インタフェースの中部領域、上部領域、下部領域など)であってもよい。
第1のテキストが目標領域内に完全に展示されていることは、現在時刻で、第1のテキストを構成する要素が全て目標領域内に展示されていることを示す。第1のテキストが目標領域内に完全に展示されていないことは、3つのシーンに分けることができる。シーン1:第1のテキストにおける先頭の所定数の要素が、目標領域内に展示されていない。シーン2:第1のテキストにおける末尾の所定数の要素が、目標領域内に展示されていない。シーン3:第1のテキストにおける先頭の所定数の要素、末尾の所定数の要素が、いずれも目標領域内に展示されていない。ここで、所定数は、例えば、1又は2であってもよいし、他の数値であってもよい。本開示は、これについて具体的に限定しない。オーディオとテキストとの同期を保持するためには、シーン2及びシーン3で、ページめくり操作を実行する適当な時刻を決定する必要がある。従って、第1のテキストにおける末尾の所定数の要素が、目標領域内に展示されているか否かを判断することができる。
ステップ108:第1のテキストにおける末尾の所定数の要素が、目標領域内に展示されていない場合、第1のテキストにおける目標領域内に展示されている要素と、第1のテキストに含まれる要素との目標割合を決定する。
ステップ109:第2の再生識別子と目標割合とに基づいて、第1のページを第2のページに更新するか否かを決定する。
例示的に、第1のテキストにおける末尾の所定数の要素が目標領域内に展示されていない場合、第1のテキストが、目標領域内に完全に展示されていないことを示す。このとき、第1のテキストのうち目標領域内に展示される要素と、第1のテキストに含まれる要素との比、即ち、目標割合を決定することができる。目標割合は、目標領域内に展示されている要素の数の、第1のテキストを構成する全ての要素の合計数に占める割合として捉えてもよく、目標領域内に展示されている要素の面積の、第1のテキストの全ての要素の合計面積に占める割合として捉えてもよく、目標領域内に展示されている要素のバイト数の、第1のテキストの全ての要素の合計バイト数に占める割合として捉えてもよい。例えば、第1のテキストが、
Figure 2023529571000002
(日本語:これはサンプルテキストです)という文である場合、第1のテキストのうち
Figure 2023529571000003
(日本語:これはサンプル)のみが目標領域内に展示されており、即ち、第1のテキストの最後の3つの要素
Figure 2023529571000004
(日本語:テキストです)は、目標領域内に展示されていない。このとき、第1のテキストのうち、目標領域内に展示されている要素の数の、第1のテキストの全ての要素の合計数に占める目標割合は、5/8である。最後に、第2の再生識別子と目標割合とに基づいて、第1のページを第2のページに更新するか否かを決定してもよい。
具体的には、オーディオのうち各要素に対応する音声を再生する速度が同じであると考えられる。すると、第2の再生識別子に基づいて、オーディオが第1のテキストのどの要素まで再生されたかを決定することができる。第2の再生識別子に基づいて、オーディオが再生された元素が、第1のテキストのうち目標領域内に展示されている最後の要素に対応すると決定された場合、第1のページを第2のページに更新することができる。第2の再生識別子に基づいて、オーディオが再生された元素が、第1のテキストのうち目標領域内に展示されている最後の要素に対応しないと決定された場合、第1のページを第2のページに更新することなく、オーディオを再生し続けることができる。
図6は、例示的な実施例による、別のオーディオとテキストとの同期方法のフローチャートである。図6に示すように、この方法は、以下のようなステップをさらに含み得る。
ステップ110:展示インタフェース内に第1のテキストにおける要素が展示されているか否かを決定する。
それに応じて、ステップ107は、以下のようであってもよい。
展示インタフェース内に第1のテキストにおけるいずれかの要素が展示されている場合、第1のテキストにおける末尾の所定数の要素が目標領域内に展示されているか否かを決定する。
一つの実現シーンでは、第1のテキストを決定した後、さらに、第1のページに第1のテキストが含まれているか否かを判断してもよい。つまり、第1のページとオーディオが同期しているか否かを判断する。ユーザが閲覧している際に、手動でページをめくることがあることに起因して、オーディオと、展示インタフェース上で展示されるページとが同期しない。例えば、オーディオの現在の再生識別子が、文識別子が0x330であるテキストに対応し、第1のページに文識別子が0x330であるテキストが含まれ、その後、ユーザが手動でページを前へ2回めくる場合、展示インタフェースに展示されているページには、文識別子が0x330であるテキストが含まれず、展示インタフェースに展示されているページとオーディオとが同期しなくなる。
具体的には、まず、展示インタフェース内に第1のテキストにおけるいずれかの要素が展示されているか否かを決定してよい。第1のテキストにおけるいずれかの要素も、展示インタフェース内に展示されていない場合、このときオーディオとテキストとが同期していないことを示す。このとき、オーディオを再生し続けるように制御し、展示インタフェース上で元のページを展示し続けてもよい(即ち、ページめくり操作を実行しない)。第1のテキストにおける1つ又は複数の要素が展示インタフェース内に展示されている場合、このときオーディオとテキストとが同期していることを示し、第1のテキストにおける末尾の所定数の要素が、目標領域内に展示されているか否か、をさらに決定してもよい。
図7は、例示的な実施例による、別のオーディオとテキストの同期方法のフローチャートである。図7に示すように、この方法は、以下のようなステップをさらに含み得る。
ステップ111:第2のページがマルチメディアコンテンツを含み、かつ、マルチメディアコンテンツが再生状態にない場合、マルチメディアコンテンツを展示インタフェース上で所定時間再生するように制御する。
1つの応用シーンでは、第2のページがマルチメディアコンテンツを含み、かつ、マルチメディアコンテンツが再生状態にない場合、マルチメディアコンテンツを展示インタフェース上で所定時間(例えば、3sであってよい)再生するように制御してもよい。所定時間後、マルチメディアコンテンツの再生を停止してもよい。
別の応用シーンでは、第2のページがマルチメディアコンテンツを含み、かつ、マルチメディアコンテンツが再生状態にない場合、マルチメディアコンテンツに対するトリガー指令を受信したか否かを判断してもよい。トリガー指令は、ユーザがマルチメディアコンテンツを閲覧した後、マルチメディアコンテンツをクリックして出す指令として捉えることができる。例えば、マルチメディアコンテンツが、プロモーションコンテンツであり、ユーザが、該プロモーションコンテンツに興味を有し、さらに、了解したい場合、該プロモーションコンテンツをクリックする。トリガー指令を受信した後、マルチメディアコンテンツに含まれるジャンプリンクに従って、対応するマルチメディアファイルを取得し、マルチメディアコンテンツを展示インタフェース上で所定時間再生するように制御してもよい。ここで、マルチメディアファイルは、テキストファイル、ピクチャファイル、ビデオファイル、オーディオファイルなど、であってもよいし、上記複数のファイルの組み合わせであってもよい。ジャンプリンクは、マルチメディアファイルを取得することができるアドレス、例えば、URL(英語:Uniform Resource Locator、ユニフォームリソースロケータ)アドレスであってもよい。
図8は、例示的な実施例による、別のオーディオとテキストとの同期方法のフローチャートである。図8に示すように、この方法は、以下のようなステップをさらに含み得る。
ステップ112:第2のページがマルチメディアコンテンツを含み、ページめくり指令を受信した場合、展示インタフェース上で、第2のページを、ページめくり指令によって指示された第2のテキストを含む、第4のページに更新する。
さらに別の応用シーンでは、第2のページがマルチメディアコンテンツを含み、ページめくり指令を受信した場合、展示インタフェース上でのマルチメディアコンテンツの再生を停止し、第2のページを、ページめくり指令によって指示された第2のテキストを含む、第4のページに更新してもよい。例えば、第2のページに含まれるマルチメディアコンテンツが、コメントコンテンツであり、ユーザが、該コメントコンテンツに興味を持たず、展示インタフェース上の「ページをめくる」ボタンをクリックしてページめくり指令を出すと、コメントコンテンツの再生を停止し、第2のページを第4のページに更新してもよい。第2のテキストは、例えば、ユーザが閲覧している文書のうち、第1のページに含まれるテキストに隣接し、かつ、第1のページに含まれたテキストの後に位置するテキストであってもよい。
さらに、マルチメディアコンテンツの展示属性に応じて、ページめくり指令に応答するか否かを決定してもよい。展示属性は、マルチメディアコンテンツが強制的な展示であるか否かを示すためのものである。例えば、マルチメディアコンテンツの展示属性が強制的な展示である場合、予め設定された強制展示時間(例えば、5s)内に、ユーザが展示インタフェース上の「ページめくり」ボタンをクリックして、ページめくり指令を出しても、端末機器は、ページめくり指令に応答しない。即ち、第2のページを第4のページに更新しない。マルチメディアコンテンツの展示属性が強制的な展示でない場合、ユーザが展示インタフェース上の「ページめくり」ボタンをクリックしてページめくり指令を出すと、端末機器は、ページめくり指令に応答する。即ち、第2のページを第4のページに更新する。
なお、上記実施例におけるページめくり操作(即ち、第1のページを第2のページに更新し、第2のページを第3のページに更新し、第2のページを第4のページに更新する、など)は、横方向ページめくり操作又はスクロールページめくり操作を含んでもよい。
それに応じて、ページめくり操作が横方向ページめくり操作である場合、ステップ105の実現方式は、以下のようであってもよい。
展示インタフェース上で、ページめくりアニメーション、オーバーレイアニメーション、平行移動アニメーションのいずれか1つを含む、予め設定されたページめくり効果に従って、第2のページを第3のページに置き換える。
ページめくり操作がスクロールページめくり操作である場合、ステップ105の実現方式は、以下のようであってもよい。
展示インタフェース上で、予め設定された速度で、第2のページから第3のページにスクロールする。
例示的に、ページめくり操作が横方向ページめくり操作である場合、ページめくり操作が実行される度に、展示インタフェース上で、現在のコンテンツから次に展示されるページに切り替わることとして捉えることができる。切り替わる途中で、様々な予め設定されたページめくり効果、例えば、ページめくりアニメーション、オーバーレイアニメーション、平行移動アニメーション、などを付加することができる。ここで、ページめくりアニメーションは、用紙を実際にめくる効果を展示することができるアニメーションとして捉えることができ、オーバーレイアニメーションは、一枚の用紙が他の用紙にオーバーレイする効果を展示することができるアニメーションとして捉えることができ、平行移動アニメーションは、一枚の用紙が他の用紙から離れる効果を展示することができるアニメーションとして捉えることができる。予め設定されたページめくり効果は、他のアニメーションであってもよい。本開示は、これについて具体的に限定しない。それに応じて、ステップ105において、展示インタフェース上で、予め設定されたページめくり効果に従って、第2のページを第3のページに置き換えてもよい。つまり、第2のページから第3のページへ切り替える途中で、予め設定されたページめくり効果を付加してもよい。
ページめくり操作がスクロールページめくり操作である場合、ページめくり操作が実行される度に、展示インタフェース上で、現在のコンテンツから徐々にスクロールし、次に展示されるページにスクロールすることとして捉えることができる。スクロールする途中で、予め設定された速度(例えば、3行/秒)で、下へ所定時間(例えば、5s)スクロールしてもよいし、予め設定された速度で、下へ指定位置までスクロールしてもよい。それに応じて、ステップ105において、展示インタフェース上、で予め設定された速度で、第2のページから第3のページにスクロールしてもよい。つまり、予め設定された速度で、展示インタフェースが第3のページを完全に展示できるまで、スクロールページめくり操作を実行する。
上記実施例において、第1のページが表示されながら、第1のページにおけるテキストに対応するオーディオが再生されることの実現方式は、以下のようなステップを含んでもよい。
ステップ1)展示インタフェース上で第1のページが展示されているときのオーディオの第3の再生識別子に基づいて、第3の再生識別子に対応する第3のテキストを決定する。
ステップ2)展示インタフェース上で、ハイライト表示、下線表示、太字表示のうち少なくとも1つを含む、予め設定された表示パターンで、第3のテキストをマーキングする。
例えば、展示インタフェース上で第1のページが展示されるとき、第1のページにおけるテキストに対応するオーディオが、同時に再生される。これにより、ユーザは、読みながら聞くことができる。オーディオの現在の第3の再生識別子に基づいて、第3の再生識別子に対応する第3のテキストを決定してもよい。第3のテキストを決定する方式は、図3、図4に示される、目標テキストを決定する方式と同様であるため、ここでは、これ以上説明しない。ユーザが、第3の再生識別子に対応する第3のテキストを直観的に閲覧することができるように、予め設定された表示パターンで第3のテキストをマーキングしてもよい。ここで、予め設定された表示パターンは、ハイライト表示、下線表示、太字表示のうち少なくとも1つを含む。例えば、展示インタフェースで展示されている第1のページに、第3のテキストが、
Figure 2023529571000005
(日本語:これはサンプルテキストです)である場合に、ハイライト表示で第3のテキストをマーキングしてもよい。効果は、図9に示すようである。
以上の通り、本開示は、展示インタフェース上で表示された第1のページが第2のページに更新された場合、まず、第2のページがマルチメディアコンテンツを含むか否かを決定する。ここで、展示インタフェースで、第1のページが表示されながら、第1のページにおけるテキストに対応するオーディオが再生される。その後、第2のページがマルチメディアコンテンツを含み、かつ、マルチメディアコンテンツが無音再生状態である場合、オーディオを再生し続けるように制御してもよい。次に、マルチメディアコンテンツの再生が停止したときのオーディオの第1の再生識別子を決定し、第1の再生識別子に基づいて、対応する目標テキストを決定する。最後に、展示インタフェース上で、第2のページを、目標テキストを含む、第3のページに更新する。本開示は、ページめくり後に展示される第2のページに含まれる、マルチメディアコンテンツを認識し、オーディオの再生と展示インタフェース上で展示されるコンテンツを制御することによって、マルチメディアコンテンツを正常に展示した上で、オーディオとテキストとの同期を保持することができる。
図10は、例示的な実施例による、オーディオとテキストとの同期装置のブロック図である。図10に示すように、この装置200は、以下のようなモジュールを含む。
展示インタフェース上で表示された第1のページが第2のページに更新されたことに応答して、第2のページがマルチメディアコンテンツを含むか否かを決定する、第1の決定モジュール201。ここで、第1のページが表示されながら、第1のページにおけるテキストに対応するオーディオが再生される。
第2のページがマルチメディアコンテンツを含み、かつ、マルチメディアコンテンツが無音再生状態である場合、オーディオを再生し続けるように制御する、制御モジュール202。
マルチメディアコンテンツの再生が停止したときのオーディオの第1の再生識別子を決定し、第1の再生識別子に基づいて、対応する目標テキストを決定する、第2の決定モジュール203。
展示インタフェース上で、第2のページを、目標テキストを含む第3のページに更新する、更新モジュール204。
1つの応用シーンでは、第1の再生識別子は、再生時間識別子を含み、第2の決定モジュール203は、以下のようなステップを実行するために使用され得る。
ステップ1)予め設定された第1のマッピング関係で、再生時間識別子にマッチする第1のマッピングレコードを決定する。そのうち、第1のマッピング関係は、少なくとも1つのマッピングレコードを含み、マッピングレコードは、テキストとオーディオ再生時間範囲との対応関係を含み、再生時間識別子は、第1のマッピングレコードにおける再生時間範囲に属する。
ステップ2)第1のマッピングレコードに基づいて、目標テキストを決定する。
別の応用シーンでは、オーディオは、少なくとも1つのオーディオファイルを含み、第1の再生識別子は、再生時間識別子とオーディオ識別子とを含み、第2の決定モジュール203は、以下のようなステップを実行するために使用され得る。
ステップ3)予め設定された第2のマッピング関係で、オーディオ識別子にマッチする第2のマッピングレコードを決定する。第2のマッピング関係は、少なくとも1つのマッピングレコードを含み、マッピングレコードは、オーディオファイルと、段落分けテキストとの対応関係を含み、オーディオ識別子によって示される目標オーディオファイルは、第2のマッピングレコードにおけるオーディオファイルである。
ステップ4)第2のマッピングレコードに基づいて、目標章節を決定する。
ステップ5)予め設定された第3のマッピング関係で、再生時間識別子にマッチする第3のマッピングレコードを決定する。第3のマッピング関係は、少なくとも1つのマッピングレコードを含み、マッピングレコードは、目標の段落分けテキストにおけるテキストと、目標オーディオファイルの再生時間範囲との対応関係を含み、再生時間識別子は、第3のマッピングレコードにおける再生時間範囲に属する。
ステップ6)第3のマッピングレコードに基づいて、段落分けテキストにおける目標テキストを決定する。
図11は、例示的な実施例による、別のオーディオとテキストとの同期装置のブロック図である。図11に示すように、この装置200は、以下のようなモジュールをさらに含む。
展示インタフェース上で第1のページが展示されているときのオーディオの第2の再生識別子に基づいて、第2の再生識別子に対応する第1のテキストを決定し、第1のテキストにおける末尾の所定数の要素が展示インタフェースの目標領域内に展示されているか否かを決定する、第3の決定モジュール205。
第1のテキストにおける末尾の所定数の要素が目標領域内に展示されていない場合、第1のテキストにおける目標領域内に展示される要素と、第1のテキストに含まれる要素との目標割合を決定し、第2の再生識別子と目標割合とに基づいて、第1のページを第2のページに更新するか否かを決定する、第4の決定モジュール206。
1つの応用シーンでは、第3の決定モジュール205は、以下のようなことを実行するために使用され得る。
展示インタフェース内に第1のテキストにおける要素が展示されているか否かを決定する。展示インタフェース内に第1のテキストにおけるいずれかの要素が展示されている場合、第1のテキストにおける末尾の所定数の要素が、目標領域内に展示されているか否かを決定する。
別の応用シーンでは、制御モジュール202は、さらに、以下のようなことを実行するために使用され得る。
第2のページがマルチメディアコンテンツを含み、かつ、マルチメディアコンテンツが再生状態にない場合、マルチメディアコンテンツを、展示インタフェース上で所定時間再生するように制御する。
また別の応用シーンでは、制御モジュール202は、さらに、以下のようなことを実行するために使用され得る。
第2のページがマルチメディアコンテンツを含み、ページめくり指令を受信した場合、展示インタフェース上で、第2のページを、ページめくり指令によって指示された第2のテキストを含む第4のページに更新する。
図12は、例示的な実施例による、別のオーディオとテキストとの同期装置のブロック図である。図12に示すように、更新モジュール204は、以下のようなモジュールを含んでもよい。
展示インタフェース上で、ページめくりアニメーション、オーバーレイアニメーション、平行移動アニメーションのいずれか1つを含む、予め設定されたページめくり効果に従って、第2のページを第3のページに置き換える、第1の更新サブモジュール2041。
展示インタフェース上で、予め設定された速度で、第2のページから第3のページにスクロールする、第2の更新サブモジュール2042。
図13は、例示的な実施例による、別のオーディオとテキストとの同期装置のブロック図である。図13に示すように、この装置200は、以下のようなモジュールをさらに含んでもよい。
展示インタフェース上で第1のページが展示されているときのオーディオの第3の再生識別子に基づいて、第3の再生識別子に対応する第3のテキストを決定する、マーキングモジュール207。展示インタフェース上で、ハイライト表示、下線表示、太字表示のうち少なくとも1つを含む予、め設定された表示パターンで、第3のテキストをマーキングする。
上記実施例における装置について、各モジュールが動作を実行する具体的な方式は、該方法に関する実施例において詳細に説明されており、ここでは、詳細に説明しない。
以上の通り、本開示は、展示インタフェース上で表示された第1のページが、第2のページに更新されたシーンで、まず、第2のページが、マルチメディアコンテンツを含むか否かを決定する。ここで、展示インタフェースで、第1のページが表示されながら、第1のページにおけるテキストに対応するオーディオが再生される。その後、第2のページがマルチメディアコンテンツを含み、かつ、マルチメディアコンテンツが無音再生状態である場合、オーディオを再生し続けるように制御してもよい。次に、マルチメディアコンテンツの再生が停止したときのオーディオの第1の再生識別子を決定し、第1の再生識別子に基づいて、対応する目標テキストを決定する。最後に、展示インタフェース上で、第2のページを、目標テキストを含む第3のページに更新する。本開示は、ページめくり後に展示される第2のページに含まれるマルチメディアコンテンツを認識し、オーディオの再生と展示インタフェース上で展示されるコンテンツを制御することによって、マルチメディアコンテンツを正常に展示した上で、オーディオとテキストとの同期を保持することができる。
以下、本開示の実施例を実現することに適合する電子機器(例えば、上記オーディオとテキストとの同期方法の実行主体)300の構造模式図を示す図14を参照する。本開示の実施例中の端末機器は、例えば、携帯電話、ノートパソコン、デジタル放送受信機、PDA(パーソナルデジタルアシスタント)、PAD(タブレット)、PMP(可搬式マルチメディア再生機)、車載端末(例えば、車載ナビゲーション端末)などの携帯端末、及び、例えば、デジタルTV、デスクトップコンピュータなどの固定端末を含み得るが、それらに限定されない。図14に示された電子機器は、一例に過ぎず、本開示の実施例の機能及び使用範囲に何の制限も加えない。
図14に示すように、電子機器300は、処理装置(例えば、中央処理装置、グラフィックプロセッサー、など)301を含んでもよく、それはリードオンリーメモリ(ROM)302に記憶されたプログラム、又は、記憶装置308からランダムアクセスメモリ(RAM)303にロードされたプログラムによって各種の適切な動作及び処理を実行することができる。RAM303には、電子機器300の操作に必要な各種のプログラムやデータがさらに格納されている。処理装置301、ROM302、及びRAM303は、バス304を介して、相互に接続される。入力/出力(I/O)インタフェース305も、また、バス304に接続される。
一般的には、例えばタッチスクリーン、タッチパネル、キーボード、マウス、カメラヘッド、マイクロホン、加速度計、ジャイロ、などを含む入力装置306と、例えば、液晶ディスプレイ(LCD)、スピーカ、発振器、などを含む出力装置307と、例えば、磁気テープ、ハードディスク、などを含む記憶装置308と、通信装置309とが、I/Oインタフェース305に接続されていてもよい。通信装置309は、電子機器300が他のデバイスと無線又は有線通信してデータを交換することを可能にする。図14には、各種の装置を備えた電子機器300が示されているが、示された装置の全てを実施したり、具備したりすることを要求する意図がないことを理解されたい。それ以上又はそれ以下の装置を代替的に実施したり、具備したりすることが可能である。
特に、本開示の実施例によれば、上述したフローチャートを参照して記載されたプロセスは、コンピュータソフトウェアプログラムとして実現できる。例えば、本開示の実施例は、コンピュータプログラム製品を含み、それは、非一時的なコンピュータ読取可能な媒体に搭載されたコンピュータプログラムを含み、該コンピュータプログラムは、フローチャートに示す方法を実行するためのプログラムコードを含む。このような実施例では、該コンピュータプログラムは、通信装置309によってネットワークからダウンロード及びインストールされ、又は、記憶装置308からインストールされ、又は、ROM302からインストールされ得る。処理装置301によって該コンピュータプログラムが実行されると、本開示の実施例の方法で限定された上記機能を実行する。
なお、本開示における上記コンピュータ読取可能な媒体は、コンピュータ読取可能な信号媒体、コンピュータ読取可能な記憶媒体、又は、それらの任意の組み合わせであってもよい。コンピュータ読取可能な記憶媒体は、例えば、電気、磁気、光、電磁、赤外線、又は半導体のシステム、装置、又はデバイス、或いはそれらの任意の組み合わせであってもよいが、それらに限定されない。コンピュータ読取可能な記憶媒体は、より具体的な例として、1つ又は複数の導線を有する電気接続、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、携帯型コンパクトディスクリードオンリーメモリ(CD-ROM)、光記憶装置、磁気記憶装置、又は、それらの任意の適切な組み合わせを含んでもよいが、それらに限定されない。本開示では、コンピュータ読取可能な記憶媒体は、プログラムを含むか、記憶する、いかなる有形媒体であってもよく、該プログラムは、コマンド実行システム、装置、又はデバイスに使用されるか、それらと組み合わせて使用されることが可能である。本開示では、コンピュータ読取可能な信号媒体は、ベースバンドで伝播されるデータ信号又は搬送波の一部として伝播されるデータ信号を含んでもよく、その中にコンピュータ読取可能なプログラムコードを搭載している。このように、伝播されるデータ信号は、多種の形式を採用してもよく、電磁信号、光信号、又はそれらの任意の適切な組み合わせを含むが、それらに限定されない。コンピュータ読取可能な信号媒体は、更にコンピュータ読取可能な記憶媒体以外の任意のコンピュータ読取可能な媒体であってもよく、該コンピュータ読取可能な信号媒体は、コマンド実行システム、装置、又はデバイスに使用されるか、それらと組み合わせて使用されるプログラムを送信、伝播、又は伝送することができる。コンピュータ読取可能な媒体に含まれるプログラムコードは、任意の適切な媒体で伝送可能であり、電線、光ケーブル、RF(ラジオ周波数)など、又は、それらの任意の適切な組み合わせを含んでもよいが、それらに限定されない。
いくつかの実施形態において、端末機器、サーバは、HTTP(HyperText Transfer Protocol、ハイパーテキスト転送プロトコル)などの任意の現在既知の、又は、将来開発されるネットワークプロトコルを用いて通信することができ、任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)と相互接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク(「LAN」)、広域ネットワーク(「WAN」)、国際ネットワーク(例えば、インターネット)、及び、エンドツーエンドネットワーク(例えば、ad hocエンドツーエンドネットワーク)、並びに、現在既知の、又は、将来開発される任意のネットワークを含む。
上記コンピュータ読取可能な媒体は、上記電子機器に含まれるものであってもよいし、該電子機器に実装されていない単独したものであってもよい。
上記コンピュータ読取可能な媒体は、1つ又は複数のプログラムを担持しており、上記1つ又は複数のプログラムが、該電子機器によって実行されると、該電子機器に、展示インタフェースに表示された第1のページが第2のページに更新されたことに応答して、前記第2のページがマルチメディアコンテンツを含むか否かを決定することであって、ただし、前記第1のページが表示されながら、前記第1のページにおけるテキストに対応するオーディオが再生されることと、前記第2のページが前記マルチメディアコンテンツを含み、かつ、前記マルチメディアコンテンツが無音再生状態である場合、前記オーディオを再生し続けるように制御することと、前記マルチメディアコンテンツの再生が停止したときの前記オーディオの第1の再生識別子を決定し、前記第1の再生識別子に基づいて、対応する目標テキストを決定することと、前記展示インタフェース上で、前記第2のページを、前記目標テキストを含む第3のページに更新することと、を実行させる。
本開示の操作を実行するためのコンピュータプログラムコードは、1種又は多種のプログラミング言語、又はそれらの組み合わせを用いて書くことが可能であり、上記プログラミング言語は、オブジェクト指向のプログラミング言語、例えば、Java(登録商標)、Smalltalk(登録商標)、C++を含み、更に、一般の手続き型プログラミング言語、例えば「C」言語、又は、類似的なプログラミング言語を含むが、それらに限定されない。プログラムコードは、完全にユーザコンピュータで実行されたり、部分的にユーザコンピュータで実行されたり、独立したソフトウェアパッケージとして実行されたり、一部がユーザコンピュータで実行され、一部がリモートコンピュータで実行されたり、完全にリモートコンピュータ又はサーバで実行されたりすることができる。リモートコンピュータに係る場合に、リモートコンピュータは、ローカルエリアネットワーク(LAN)又は広域ネットワーク(WAN)を含む、任意のネットワークによって、ユーザコンピュータに接続でき、又は、外部コンピュータに接続できる(例えば、インターネットサービスプロバイダーを用いてインターネット経由で接続する)。
添付図面のうちフローチャート及びブロック図は、本開示の各種の実施例に係るシステム、方法、及びコンピュータプログラム製品の実現可能なシステムアーキテクチャ、機能、及び動作を示す。この点では、フローチャート又はブロック図における各ブロックは、1つのモジュール、プログラムセグメント、又はコードの一部分を代表することができ、該モジュール、プログラムセグメント、又はコードの一部分は、所定の論理機能を実現するための1つ又は複数の実行可能命令を含む。なお、いくつかの置換としての実現では、ブロックに表記される機能は、図面に付したものと異なる順序で実現してもよい。例えば、二つの連続的に示されたブロックは、実質的に同時に実行してもよく、逆の順序で実行してもよく、それは係る機能による。なお、ブロック図及び/又はフローチャートにおける各ブロック、及び、ブロック図、及び/又は、フローチャートにおけるブロックの組み合わせは、所定の機能又は操作を実行するハードウェアに基づく専用システムによって実現してもよいし、又は、専用ハードウェアとコンピュータ命令との組み合わせによって実現してもよいことに注意すべきである。
本開示の実施例に係るモジュールは、ソフトウェアで実現してもよいし、ハードウェアで実現してもよい。ここで、モジュールの名称は、該モジュール自身を限定しない場合がある。例えば、第1の決定モジュールは、「ページがマルチメディアコンテンツを含むか否かを決定するモジュール」と記述してもよい。
本明細書で上述された機能は、少なくとも部分的に、1つ又は複数のハードウェア論理構成要素によって実行され得る。例えば、使用可能な例示的なハードウェア論理構成要素は、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、コンプレックスプログラマブル論理装置(CPLD)、などを含むが、それらに限定されない。
本開示において、機器読取可能な媒体は、有形媒体であってもよく、コマンド実行システム、装置、又はデバイスによって使用され、又は、コマンド実行システム、装置、又はデバイスと組み合わせて使用されるプログラムを含み、又は、記憶することができる。機器読取可能な媒体は、機器読取可能な信号媒体又は機器読取可能な記憶媒体であり得る。機器読取可能な媒体は、電子的、磁気的、光学的、電磁的、赤外線、又は、半導体システム、装置、もしくはデバイス、又は、上記の任意の好適な組み合わせを含み得るが、それらに限定されない。機器読取可能な記憶媒体のより具体的な例は、1つ又は複数の配線に基づく電気接続、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、携帯型コンパクトディスクリードオンリーメモリ(CD-ROM)、光記憶装置、磁気記憶装置、又は、それらの任意の適切な組み合わせを含む。
本開示の1つ又は複数の実施例によれば、例1では、展示インタフェース上で表示された第1のページが第2のページに更新されたことに応答して、前記第2のページがマルチメディアコンテンツを含むか否かを決定することであって、ただし、前記第1のページが表示されながら、前記第1のページにおけるテキストに対応するオーディオが再生されることと、前記第2のページが前記マルチメディアコンテンツを含み、かつ、前記マルチメディアコンテンツが無音再生状態である場合、前記オーディオを再生し続けるように制御することと、前記マルチメディアコンテンツの再生が停止したときの前記オーディオの第1の再生識別子を決定し、前記第1の再生識別子に基づいて、対応する目標テキストを決定することと、前記展示インタフェース上で、前記第2のページを、前記目標テキストを含む第3のページに更新することと、を含むオーディオとテキストとの同期方法を提供する。
本開示の1つ又は複数の実施例によれば、例2では、前記第1の再生識別子は、再生時間識別子を含み、前述した、前記第1の再生識別子に基づいて、対応する目標テキストを決定することは、予め設定された第1のマッピング関係で、前記再生時間識別子にマッチする第1のマッピングレコードを決定することであって、前記第1のマッピング関係は、少なくとも1つのマッピングレコードを含み、前記マッピングレコードは、テキストとオーディオ再生時間範囲との対応関係を含み、前記再生時間識別子は、前記第1のマッピングレコードにおける再生時間範囲に属することと、前記第1のマッピングレコードに基づいて、前記目標テキストを決定することと、を含む例1に記載の方法を提供する。
本開示の1つ又は複数の実施例によれば、例3では、前記オーディオは、少なくとも1つのオーディオファイルを含み、前記第1の再生識別子は、再生時間識別子及びオーディオ識別子を含み、前述した、前記第1の再生識別子に基づいて、対応する目標テキストを決定することは、予め設定された第2のマッピング関係で、前記オーディオ識別子にマッチする第2のマッピングレコードを決定することであって、前記第2のマッピング関係は、少なくとも1つのマッピングレコードを含み、前記マッピングレコードは、オーディオファイルと、段落分けテキストとの対応関係を含み、前記オーディオ識別子によって示される目標オーディオファイルは、前記第2のマッピングレコードにおけるオーディオファイルであることと、前記第2のマッピングレコードに基づいて、目標の段落分けテキストを決定することと、予め設定された第3のマッピング関係で、前記再生時間識別子にマッチする第3のマッピングレコードを決定することであって、前記第3のマッピング関係は、少なくとも1つのマッピングレコードを含み、前記マッピングレコードは、前記目標の段落分けテキストにおけるテキストと前記目標オーディオファイルの再生時間範囲との対応関係を含み、前記再生時間識別子は、前記第3のマッピングレコードにおける再生時間範囲に属することと、前記第3のマッピングレコードに基づいて、前記目標の段落分けテキストにおける前記目標テキストを決定することと、を含む例1に記載の方法を提供する。
本開示の1つ又は複数の実施例によれば、例4では、前記展示インタフェース上で前記第1のページが展示されているときの前記オーディオの第2の再生識別子に基づいて、前記第2の再生識別子に対応する第1のテキストを決定することと、前記第1のテキストにおける末尾の所定数の要素が、前記展示インタフェースの目標領域内に展示されているか否かを決定することと、前記第1のテキストにおける末尾の所定数の要素が、前記目標領域内に展示されていない場合、前記第1のテキストにおける前記目標領域内に展示される要素と、前記第1のテキストに含まれる要素との目標割合を決定することと、前記第2の再生識別子と前記目標割合とに基づいて、前記第1のページを前記第2のページに更新するか否かを決定することと、をさらに含む、例1~3に記載の方法を提供する。
本開示の1つ又は複数の実施例によれば、例5では、前記展示インタフェース内に前記第1のテキストにおける要素が展示されているか否かを決定することを、さらに含み、前述した、前記第1のテキストにおける末尾の所定数の要素が、前記展示インタフェースの目標領域内に展示されているか否かを決定することは、前記展示インタフェース内に前記第1のテキストにおけるいずれかの要素が展示されている場合、前記第1のテキストにおける末尾の所定数の要素が、前記目標領域内に展示されているか否かを決定することを含む、例4に記載の方法を提供する。
本開示の1つ又は複数の実施例によれば、例6では、前記第2のページが前記マルチメディアコンテンツを含み、かつ、前記マルチメディアコンテンツが再生状態にない場合、前記マルチメディアコンテンツを前記展示インタフェース上で所定時間再生するように制御することを、さらに含む、例1~5に記載の方法を提供する。
本開示の1つ又は複数の実施例によれば、例7では、前記第2のページが前記マルチメディアコンテンツを含み、ページめくり指令を受信した場合、前記展示インタフェース上で、前記第2のページを、前記ページめくり指令によって指示された第2のテキストを含む、第4のページに更新すること、をさらに含む、例1~5に記載の方法を提供する。
本開示の1つ又は複数の実施例によれば、例8では、前述した、前記展示インタフェース上で、前記第2のページを第3のページに更新することは、前記展示インタフェース上で、ページめくりアニメーション、オーバーレイアニメーション、平行移動アニメーションのいずれか1つを含む予め設定されたページめくり効果に従って、前記第2のページを前記第3のページに置き換えること、又は、前記展示インタフェース上で、予め設定された速度で、前記第2のページから前記第3のページにスクロールすること、を含む、例1~7に記載の方法を提供する。
本開示の1つ又は複数の実施例によれば、例9では、前述した、前記第1のページが表示されながら、前記第1のページにおけるテキストに対応するオーディオが再生されることは、具体的に、前記展示インタフェース上で前記第1のページが展示されているときの前記オーディオの第3の再生識別子に基づいて、前記第3の再生識別子に対応する第3のテキストを決定することと、前記展示インタフェース上で、ハイライト表示、下線表示、太字表示のうちの少なくとも1つを含む、予め設定された表示パターンで前記第3のテキストをマーキングすることと、を含む、例1~8に記載の方法を提供する。
本開示の1つ又は複数の実施例によれば、例10では、例1~9に記載の方法を実行するためのモジュールを含む、オーディオとテキストとの同期装置を提供する。
本開示の1つ又は複数の実施例によれば、例11では、処理装置によって実行されると、例1~9に記載の方法を実現させるコンピュータプログラムが記憶された、非一時的なコンピュータ読取可能な媒体を提供する。
本開示の1つ又は複数の実施例によれば、例12では、コンピュータプログラムが記憶された記憶装置と、前記記憶装置における前記コンピュータプログラムを実行して、例1~9に記載の方法を実現させる処理装置とを含む、電子機器を提供する。
本開示の1つ又は複数の実施例によれば、例13では、処理装置によって実行されると、例1~9に記載の方法を実現させる、コンピュータプログラムを提供する。
本開示の1つ又は複数の実施例によれば、例14では、処理装置によって実行されると、例1~9に記載の方法を実現させる、コンピュータプログラムが記憶されたコンピュータプログラム製品を提供する。
上述したのは本開示の好ましい実施例及び適用する技術原理の説明に過ぎない。本開示に係る開示の範囲は、上記技術的特徴の特定組合による技術案に限定されるものではなく、上記開示の構想を逸脱することなく、上記技術的特徴又はそれと同等な特徴を任意に組み合わせて形成した他の技術案をも含むべきであることが、当業者に自明である。例えば、上記特徴と本開示に開示された(それらに限定されない)類似的な機能を有する技術的特徴とを、互いに取り替えて、形成した技術案をも含む。
また、各操作は、特定の順序で記述されているが、これは、そのような操作が、示されているその特定の順序で、又は、順次的な順序で実行されることを求めている、と理解されるべきではない。所定の環境では、マルチタスクと並行処理が有利であり得る。同様に、若干の具体的な実現の詳細が、上記の記述に含まれているが、それらは、本開示の範囲を限定するものとして解釈されるべきではない。単一の実施例に関連して記載されている特定の特徴は、単一の実施例と組み合わせても実装可能である。逆に、単一の実施例に関連して記載されている様々な特徴は、また、複数の実施例で、別々に、又は、何らかの適切なサブコンビネーションで、実装可能である。
本主題は、構造的特徴及び/又は方法論理動作と特定した言語で記述されたが、添付の特許請求の範囲に限定された主題は、必ずしも上記で記述された特定の特徴又は動作に限定されないことを理解されたい。むしろ、上述された特定の特徴及び動作は、特許請求の範囲を実現する例示的な形態に過ぎない。上記実施例における装置について、各モジュールが動作を実行する具体的な方式は、該方法に関する実施例において詳細に説明されており、ここでは詳細に説明しない。

Claims (14)

  1. オーディオとテキストとの同期方法であって、
    展示インタフェース上で表示された第1のページが第2のページに更新されたことに応答して、前記第2のページがマルチメディアコンテンツを含むか否かを決定するステップであり、前記第1のページが表示されながら、前記第1のページにおけるテキストに対応するオーディオが再生される、ステップと、
    前記第2のページが前記マルチメディアコンテンツを含み、かつ、前記マルチメディアコンテンツが無音再生状態である場合に、前記オーディオを再生し続けるように制御するステップと、
    前記マルチメディアコンテンツの再生が停止したときの前記オーディオの第1の再生識別子を決定し、前記第1の再生識別子に基づいて、対応する目標テキストを決定するステップと、
    前記展示インタフェース上で、前記第2のページを、前記目標テキストを含む第3のページに更新するステップと、
    を含む、方法。
  2. 前記第1の再生識別子は、再生時間識別子を含み、
    前記第1の再生識別子に基づいて対応する目標テキストを決定するステップは、
    予め設定された第1のマッピング関係で、前記再生時間識別子にマッチする第1のマッピングレコードを決定するステップであり、
    前記第1のマッピング関係は、少なくとも1つのマッピングレコードを含み、
    前記マッピングレコードは、テキストとオーディオ再生時間範囲との対応関係を含み、
    前記再生時間識別子は、前記第1のマッピングレコードにおける再生時間範囲に属する、
    ステップと、
    前記第1のマッピングレコードに基づいて、前記目標テキストを決定するステップと、
    を含む、請求項1に記載の方法。
  3. 前記オーディオは、少なくとも1つのオーディオファイルを含み、
    前記第1の再生識別子は、再生時間識別子及びオーディオ識別子を含み、
    前記第1の再生識別子に基づいて対応する目標テキストを決定するステップは、
    予め設定された第2のマッピング関係で、前記オーディオ識別子にマッチする第2のマッピングレコードを決定するステップであり、
    前記第2のマッピング関係は、少なくとも1つのマッピングレコードを含み、
    前記マッピングレコードは、オーディオファイルと、段落分けテキストとの対応関係を含み、
    前記オーディオ識別子によって示される目標オーディオファイルは、前記第2のマッピングレコードにおけるオーディオファイルである、
    ステップと、
    前記第2のマッピングレコードに基づいて、目標の段落分けテキストを決定するステップと、
    予め設定された第3のマッピング関係で、前記再生時間識別子にマッチする第3のマッピングレコードを決定するステップであり、
    前記第3のマッピング関係は、少なくとも1つのマッピングレコードを含み、
    前記マッピングレコードは、前記目標の段落分けテキストにおけるテキストと、前記目標オーディオファイルの再生時間範囲との対応関係を含み、
    前記再生時間識別子は、前記第3のマッピングレコードにおける再生時間範囲に属する、
    ステップと、
    前記第3のマッピングレコードに基づいて、前記目標の段落分けテキストにおける前記目標テキストを決定するステップと、
    を含む、請求項1に記載の方法。
  4. 前記方法は、さらに、
    前記展示インタフェース上で前記第1のページが展示されているときの前記オーディオの第2の再生識別子に基づいて、前記第2の再生識別子に対応する第1のテキストを決定するステップと、
    前記第1のテキストにおける末尾の所定数の要素が、前記展示インタフェースの目標領域内に展示されているか否かを決定するステップと、
    前記第1のテキストにおける末尾の所定数の要素が前記目標領域内に展示されていない場合に、前記第1のテキストにおける前記目標領域内に展示されている要素と、前記第1のテキストに含まれる要素との目標割合を決定するステップと、
    前記第2の再生識別子と前記目標割合とに基づいて、前記第1のページを前記第2のページに更新するか否かを決定するステップと、
    を含む、請求項1~3のいずれか1項に記載の方法。
  5. 前記方法は、さらに、
    前記展示インタフェース内に前記第1のテキストにおける要素が展示されているか否かを決定するステップ、を含み、
    前記第1のテキストにおける末尾の所定数の要素が前記展示インタフェースの目標領域内に展示されているか否かを決定するステップは、
    前記展示インタフェース内に前記第1のテキストにおけるいずれかの要素が展示されている場合に、
    前記第1のテキストにおける末尾の所定数の要素が、前記目標領域内に展示されているか否かを決定するステップ、
    を含む、
    請求項4に記載の方法。
  6. 前記方法は、さらに、
    前記第2のページが前記マルチメディアコンテンツを含み、かつ、前記マルチメディアコンテンツが再生状態にない場合に、
    前記マルチメディアコンテンツを前記展示インタフェース上で所定時間再生するように制御するステップ、
    を含む、
    請求項1~5のいずれか1項に記載の方法。
  7. 前記方法は、さらに、
    前記第2のページが前記マルチメディアコンテンツを含み、ページめくり指令を受信した場合に、
    前記展示インタフェース上で、前記第2のページを、前記ページめくり指令によって指示された第2のテキストを含む第4のページに更新するステップ、
    を含む、
    請求項1~5のいずれか1項に記載の方法。
  8. 前記展示インタフェース上で、前記第2のページを第3のページに更新するステップは、
    前記展示インタフェース上で、ページめくりアニメーション、オーバーレイアニメーション、平行移動アニメーションのいずれか1つを含む、予め設定されたページめくり効果に従って、前記第2のページを前記第3のページに置き換えるステップ、または、
    前記展示インタフェース上で、予め設定された速度で、前記第2のページから前記第3のページにスクロールするステップ、
    を含む、
    請求項1~7のいずれか1項に記載の方法。
  9. 前記第1のページが表示されながら、前記第1のページにおけるテキストに対応するオーディオが再生されるステップは、
    前記展示インタフェース上で前記第1のページが展示されているときの前記オーディオの第3の再生識別子に基づいて、前記第3の再生識別子に対応する第3のテキストを決定するステップと、
    前記展示インタフェース上で、ハイライト表示、下線表示、太字表示のうちの少なくとも1つを含む、予め設定された表示パターンで前記第3のテキストをマーキングするステップと、
    を含む、
    請求項1~8のいずれか1項に記載の方法。
  10. 請求項1~9のいずれか1項に記載の方法を実行するためのモジュールを含む、
    オーディオとテキストとの同期装置。
  11. 処理装置によって実行されると、請求項1~9のいずれか1項に記載の方法を実現させるコンピュータプログラムが記憶された、非一時的なコンピュータ読取可能な媒体。
  12. コンピュータプログラムが記憶された記憶装置と、
    前記記憶装置における前記コンピュータプログラムを実行して、請求項1~9のいずれか1項に記載の方法を実現させる処理装置と、
    を含む、電子機器。
  13. 処理装置によって実行されると、請求項1~9のいずれか1項に記載の方法を実施させる、コンピュータプログラム。
  14. 処理装置によって実行されると、請求項1~9のいずれか1項に記載の方法を実施させるコンピュータプログラムが記憶された、コンピュータプログラム製品。
JP2022571224A 2020-11-26 2021-10-29 オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器 Active JP7548678B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202011355859.6 2020-11-26
CN202011355859.6A CN112397104B (zh) 2020-11-26 2020-11-26 音频与文本的同步方法、装置、可读介质和电子设备
PCT/CN2021/127303 WO2022111206A1 (zh) 2020-11-26 2021-10-29 音频与文本的同步方法、装置、可读介质和电子设备

Publications (2)

Publication Number Publication Date
JP2023529571A true JP2023529571A (ja) 2023-07-11
JP7548678B2 JP7548678B2 (ja) 2024-09-10

Family

ID=74605312

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022571224A Active JP7548678B2 (ja) 2020-11-26 2021-10-29 オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器

Country Status (4)

Country Link
US (1) US20230229382A1 (ja)
JP (1) JP7548678B2 (ja)
CN (1) CN112397104B (ja)
WO (1) WO2022111206A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113096635B (zh) * 2021-03-31 2024-01-09 抖音视界有限公司 一种音频和文本的同步方法、装置、设备以及介质
CN113259740A (zh) * 2021-05-19 2021-08-13 北京字跳网络技术有限公司 一种多媒体处理方法、装置、设备及介质
CN113778307B (zh) * 2021-09-27 2023-09-19 口碑(上海)信息技术有限公司 一种信息交互方法及装置
CN115062168B (zh) * 2022-06-28 2024-10-25 北京字跳网络技术有限公司 媒体内容展示方法、装置、设备及存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2146878A1 (en) * 1992-10-30 1994-05-11 Roy J. Mankovitz Apparatus and methods for music and lyrics broadcasting
US20020002458A1 (en) * 1997-10-22 2002-01-03 David E. Owen System and method for representing complex information auditorially
AU7041000A (en) * 1999-09-07 2001-04-10 Kyu Jin Park Advertising method using digital file and using telephone receiver for digital motion picture advertisement
KR100716973B1 (ko) * 2004-02-21 2007-05-10 삼성전자주식회사 Av 데이터에 동기된 텍스트 서브 타이틀 데이터를기록한 정보저장매체, 재생방법 및 장치
CN100559368C (zh) * 2004-07-14 2009-11-11 华南理工大学 可听文本的自动制作和播放的方法
JP5018352B2 (ja) 2007-09-04 2012-09-05 大日本印刷株式会社 書籍コンテンツに広告を挿入配信するサーバ装置
CN101383937A (zh) * 2007-09-06 2009-03-11 华为技术有限公司 播放视频广告和文字信息的方法、系统、服务器和终端
US8290777B1 (en) * 2009-06-12 2012-10-16 Amazon Technologies, Inc. Synchronizing the playing and displaying of digital content
EP2524325A2 (en) * 2010-01-11 2012-11-21 Apple Inc. Electronic text manipulation and display
US20120036429A1 (en) * 2010-05-07 2012-02-09 For-Side.Com Co., Ltd. Electronic book system and content server
JP5463385B2 (ja) 2011-06-03 2014-04-09 アップル インコーポレイテッド テキストデータとオーディオデータとの間のマッピングの自動作成
JP5477410B2 (ja) * 2012-03-21 2014-04-23 ヤマハ株式会社 音楽コンテンツ表示装置及びプログラム
CN102842326B (zh) * 2012-07-11 2015-11-04 杭州联汇数字科技有限公司 一种视音频及图文同步播放方法
US9099089B2 (en) * 2012-08-02 2015-08-04 Audible, Inc. Identifying corresponding regions of content
US9940307B2 (en) * 2012-12-31 2018-04-10 Adobe Systems Incorporated Augmenting text with multimedia assets
US9558787B2 (en) 2014-01-29 2017-01-31 Google Inc. Media application backgrounding
CN105763925A (zh) * 2014-12-17 2016-07-13 珠海金山办公软件有限公司 演示文稿视频录制方法及装置
US20180032305A1 (en) * 2016-07-29 2018-02-01 Paul Charles Cameron Systems and methods for automatic-creation of soundtracks for text
WO2018078463A1 (en) * 2016-10-24 2018-05-03 Sony Mobile Communications Inc Methods, computer program products and devices for automatically synchronizing an audio track with a plurality of pages
CN106777099A (zh) * 2016-12-14 2017-05-31 掌阅科技股份有限公司 业务语音数据的处理方法、装置及终端设备
CN108512874A (zh) * 2017-02-27 2018-09-07 上海谦问万答吧云计算科技有限公司 一种在线答疑数据的同步方法及装置
US10671251B2 (en) * 2017-12-22 2020-06-02 Arbordale Publishing, LLC Interactive eReader interface generation based on synchronization of textual and audial descriptors
CN108462892B (zh) * 2018-03-26 2019-08-06 百度在线网络技术(北京)有限公司 图像和音频同步播放的处理方法及设备
CN109766305A (zh) * 2018-12-11 2019-05-17 中新金桥数字科技(北京)有限公司 基于Android系统的Epub电子书文本与音视频对照阅读方法及系统
CN109889859A (zh) * 2019-03-11 2019-06-14 杭州雅顾科技有限公司 一种直播视频与文档翻页的同步方法
CN110677689A (zh) * 2019-09-29 2020-01-10 杭州当虹科技股份有限公司 一种基于用户视角的vr视频广告无缝插播方法
CN114501106A (zh) * 2020-08-04 2022-05-13 腾讯科技(深圳)有限公司 一种文稿显示控制方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
JP7548678B2 (ja) 2024-09-10
WO2022111206A1 (zh) 2022-06-02
CN112397104A (zh) 2021-02-23
CN112397104B (zh) 2022-03-29
US20230229382A1 (en) 2023-07-20

Similar Documents

Publication Publication Date Title
JP7548678B2 (ja) オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器
WO2022042593A1 (zh) 字幕编辑方法、装置和电子设备
US11836180B2 (en) System and management of semantic indicators during document presentations
WO2023051297A1 (zh) 信息显示方法、装置、电子设备和存储介质
US20120240036A1 (en) E-Book Reading Location Indicator
US11423112B2 (en) Document input content processing method and apparatus, electronic device, and storage medium
WO2014154097A1 (en) Automatic page content reading-aloud method and device thereof
JP2024528439A (ja) コンテンツ表示方法、装置、機器及び媒体
WO2023035835A1 (zh) 一种信息展示方法、装置、设备及介质
JP2023549903A (ja) マルチメディアのインタラクション方法、情報インタラクション方法、装置、機器及び媒体
CN112102841A (zh) 一种音频编辑方法、装置和用于音频编辑的装置
JP2024525192A (ja) オーディオ処理方法、装置、電子機器及び記憶媒体
CN108491178B (zh) 信息浏览方法、浏览器和服务器
CN111125480A (zh) 背景音乐的播放方法、设备、客户端装置及电子设备
JP7541201B2 (ja) 情報返信方法、装置、電子機器、コンピュータ記憶媒体及び製品
WO2022252920A1 (zh) 应用程序的页面显示方法、装置和电子设备
CN115269920A (zh) 交互方法、装置、电子设备和存储介质
CN113238688B (zh) 表格展示方法、装置、设备及介质
CN110381356B (zh) 音视频生成方法、装置、电子设备及可读介质
US20140297285A1 (en) Automatic page content reading-aloud method and device thereof
CN112530472B (zh) 音频与文本的同步方法、装置、可读介质和电子设备
CN111209503A (zh) 网页中弹窗的处理方法、装置、电子设备、及存储介质
US20140101284A1 (en) System and method for customization of web content
KR100676621B1 (ko) 이동통신 단말기의 브라우저에서 지원되지 않는 이미지 및태그 처리를 위한 웹 문서 변환 방법
JP2024521940A (ja) マルチメディア処理方法、装置、デバイスおよび媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240827

R150 Certificate of patent or registration of utility model

Ref document number: 7548678

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150