JP2023515392A - 情報処理方法、システム、装置、電子機器及び記憶媒体 - Google Patents
情報処理方法、システム、装置、電子機器及び記憶媒体 Download PDFInfo
- Publication number
- JP2023515392A JP2023515392A JP2022549101A JP2022549101A JP2023515392A JP 2023515392 A JP2023515392 A JP 2023515392A JP 2022549101 A JP2022549101 A JP 2022549101A JP 2022549101 A JP2022549101 A JP 2022549101A JP 2023515392 A JP2023515392 A JP 2023515392A
- Authority
- JP
- Japan
- Prior art keywords
- content
- sentence
- identifier
- local
- sentence identifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 133
- 238000003672 processing method Methods 0.000 title claims abstract description 83
- 238000006243 chemical reaction Methods 0.000 claims abstract description 249
- 238000000034 method Methods 0.000 claims abstract description 131
- 230000008569 process Effects 0.000 claims abstract description 68
- 230000003993 interaction Effects 0.000 claims description 59
- 230000006854 communication Effects 0.000 claims description 54
- 238000004891 communication Methods 0.000 claims description 52
- 238000004590 computer program Methods 0.000 claims description 39
- 230000004044 response Effects 0.000 claims description 29
- 238000012512 characterization method Methods 0.000 claims description 17
- 101150054987 ChAT gene Proteins 0.000 claims description 9
- 101100203187 Mus musculus Sh2d3c gene Proteins 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 20
- 230000003287 optical effect Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 6
- 230000000717 retained effect Effects 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 239000013307 optical fiber Substances 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 2
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 2
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000004020 conductor Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/458—Scheduling content for creating a personalised stream, e.g. by combining a locally stored advertisement with an incoming stream; Updating operations, e.g. for OS modules ; time-related management operations
- H04N21/4586—Content update operation triggered locally, e.g. by comparing the version of software modules in a DVB carousel to the version stored locally
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/485—End-user interface for client configuration
- H04N21/4856—End-user interface for client configuration for language selection, e.g. for the menu or subtitles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Information Transfer Between Computers (AREA)
- Machine Translation (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
サービスサーバにより送信された文字内容及び前記文字内容の文識別子を受信するステップと、
ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新するステップと、を含む。
サービスサーバからの第1の文字内容及び前記第1の文字内容の第1の文識別子を受信するステップと、
前記第1の文字内容を表示するステップと、
前記サービスサーバからの第2の文字内容及び前記第2の文字内容の第2の文識別子を受信するステップと、
前記第2の文識別子が前記第1の文識別子と同じである場合、前記第1の文字内容を更新するように前記第2の文字内容を表示するステップと、を含む。
クライアント端末により送信された字幕オン要求のキャラクタリゼーションに応答してオーディオデータを引き出し、前記オーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を取得し、及び前記現在変換待ちのオーディオデータの変化に基づいて前記文字内容の文識別子を更新するためのサービスサーバと、
前記サービスサーバにより送信された前記文字内容及び前記文字内容の文識別子を受信し、ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新するための前記クライアント端末と、を含む。
サービスサーバにより送信された文字内容及び前記文字内容の文識別子を受信するための受信モジュールと、
ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新するための表示モジュールと、を含む。
1つ又は複数のプロセッサと、
1つ又は複数のプログラムを記憶するための記憶装置とを含み、
前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサによって実行されるとき、前記1つ又は複数のプロセッサに本開示の実施例のいずれか1つに記載の情報処理方法を実現させる。
図1は、本開示の実施例1による情報処理方法のフローチャートであり、本開示の実施例は、クライアント端末がリアルタイムインタラクションシーンで字幕表示を行う場合に特に適用され、この方法は、情報処理装置によって実行されてもよく、この装置は、ソフトウェア及び/又はハードウェアの形式で実現されてもよく、この装置は、電子機器に配置され、例えばスマート携帯電話、タブレットパソコン、ノートパソコン又はディスクコンピュータなどの電子機器に配置されてもよい。
図2は、本開示の実施例2による情報処理方法のフローチャートである。本実施例は、上記実施例による各情報処理方法の選択的な技術案と組み合わせてもよい。本実施例による情報処理方法では、クライアント端末は、サービスサーバにより送信された文字内容及び文字内容の文識別子を受信すると同時に、サービスサーバにより送信された文識別子に対応する内容バージョン順番を受信することができ、そして文識別子及びその対応する内容バージョン順番を利用して文字内容の字幕表示を行うことができ、配列順位が前である文字内容がネットワーク遅延などの原因により後にクライアント端末に送信される時、配列順位が前である文字内容を利用して配列順位が後ろである文字内容を更新することによる字幕更新エラーの状況を効果的に回避することができる。
図3は、本開示の実施例3による情報処理方法のフローチャートである。本実施例は、上記実施例による各情報処理方法の選択的な技術案と組み合わせてもよい。本実施例による情報処理方法は、受信された文字内容と文識別子が少なくとも2組である場合の字幕動的表示方法を最適化しており、複数の字幕を同時に動的に更新することを実現することができ、さらに字幕表示効果を向上させる。
図4は、本開示の実施例4による情報処理システムの構造概略図である。本実施例による情報処理システムは、サービスサーバとクライアント端末との間の相互協力により、リアルタイムインタラクションシーンで、サービスサーバがインタラクションオーディオデータの引き出し、オーディオデータ変換の文字内容の取得及び文字内容に対応する文識別子の生成を実現することができ、クライアント端末は、受信されたサービスサーバにより送信された文字内容と文識別子に基づいて字幕内容の動的更新表示を行う。本開示の実施例による情報処理システムにおいて、本開示の任意の実施例による情報処理方法と同じ発明構想に属し、開示されていない技術詳細は、上記実施例を参照することができ、且つ上記実施例と同じである有益な効果に達することができる。
クライアント端末420により送信された字幕オン要求のキャラクタリゼーションに応答してオーディオデータを引き出し、オーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を取得し、及び現在変換待ちのオーディオデータの変化に基づいて文字内容の文識別子を更新するためのサービスサーバ410と、
サービスサーバ410により送信された文字内容及び文字内容の文識別子を受信し、ローカル文識別子を読み取り、受信された文識別子がローカル文識別子と同じである場合、文字内容を利用して既に表示されたローカル文識別子に対応する字幕内容を更新するためのクライアント端末420と、を含む。
それに応じて、クライアント端末は、ローカル文識別子に対応するローカル内容バージョン順番を読み取り、受信された文識別子がローカル文識別子と同じであり、受信された内容バージョン順番がローカル内容バージョン順番の後に並んでいる場合、文字内容を利用して既に表示されたローカル文識別子とローカル内容バージョン順番に対応する字幕内容を置き換え、受信された内容バージョン順番を利用してローカル文識別子に対応するローカル内容バージョン順番を更新するためにさらに用いられる。
本実施例は、上記実施例による情報処理システムの各選択的な技術案と組み合わせてもよい。本実施例による情報処理システムは、文字内容と文識別子が少なくとも2組である場合の字幕動的表示を最適化しており、クライアント端末が複数の字幕を同時に動的に更新することを実現することができ、さらに字幕表示効果を向上させる。
字幕オン要求のキャラクタリゼーションに応答して少なくとも2つのオーディオデータを引き出し、少なくとも2つのオーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を取得し、及び少なくとも2つの現在変換待ちのオーディオデータの変化に基づいて文字内容の文識別子を更新するために用いられ、
それに応じて、クライアント端末は、
受信された文字内容と文識別子が少なくとも2組である場合、ローカル文識別子を読み取り、受信された少なくとも2つの文識別子のうち、ローカル文識別子と同じである文識別子が存在しているか否かを判断し、
もしそうであれば、同じ文識別子に対応する文字内容を利用して既に表示されたローカル文識別子に対応する字幕内容を置き換え、異なる文識別子に対応する文字内容を新たな字幕内容として表示し、
もしそうでなければ、受信された少なくとも2つの文字内容をそれぞれ新たな少なくとも2つの字幕内容として表示し、
受信された少なくとも2つの文識別子をいずれも新たなローカル文識別子とするために用いられる。
図5は、本開示の実施例6による情報処理システムの構造概略図である。本実施例は、上記実施例による情報処理システムにおける各選択的な技術案と組み合わせてもよい。本実施例による情報処理システムは、ストリーミング通信を行うクライアント端末によりアップロードされたオーディオデータを受信するためのストリーミングサーバをさらに含んでもよく、それに応じて、サービスサーバは、具体的に、クライアント端末により送信された字幕オン要求のキャラクタリゼーションに応答して、ストリーミングサーバからオーディオデータを引き出すために用いられる。本実施例による情報処理システムは、サービスサーバにより送信されたオーディオデータを受信し、オーディオデータの現在変換待ちのオーディオデータを決定し、現在変換待ちのオーディオデータの文字変換過程における文字内容をフィードバックするためのリアルタイム音声変換ツールをさらに含んでもよく、それに応じて、サービスサーバは、具体的に、リアルタイム音声変換ツールによりフィードバックされたオーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を受信するために用いられる。ストリーミングサーバによって、各クライアント端末によりアップロードされたオーディオデータに対する記憶を実現することができ、リアルタイム音声変換ツールによって、オーディオデータを文字内容にリアルタイムで変換して中間変換結果を出力することを実現することができる。
ストリーミングサーバ510は、ストリーミング通信を行うクライアント端末520によりアップロードされたオーディオデータを受信することに用いられ、
サービスサーバ530は、クライアント端末520により送信された字幕オン要求のキャラクタリゼーションに応答して、ストリーミングサーバ510からオーディオデータを引き出すことに用いられ、
リアルタイム音声変換ツール540は、サービスサーバ530により送信されたオーディオデータを受信し、オーディオデータの現在変換待ちのオーディオデータを決定し、現在変換待ちのオーディオデータの文字変換過程における文字内容をフィードバックすることに用いられ、
サービスサーバ530は、さらに、リアルタイム音声変換ツールによりフィードバックされたオーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を受信し、及び現在変換待ちのオーディオデータの変化に基づいて文字内容の文識別子を更新することに用いられ、
クライアント端末520は、サービスサーバ530により送信された文字内容及び文字内容の文識別子を受信し、ローカル文識別子を読み取り、受信された文識別子がローカル文識別子と同じである場合、文字内容を利用して既に表示されたローカル文識別子に対応する字幕内容を更新することに用いられる。
本実施例による情報処理方法は、
サービスサーバからの第1の文字内容及び第1の文字内容の第1の文識別子を受信するステップと、
第1の文字内容を表示するステップと、
サービスサーバからの第2の文字内容及び第2の文字内容の第2の文識別子を受信するステップと、
第2の文識別子が第1の文識別子と同じである場合、第2の文字内容を表示して第1の文字内容を更新するステップと、を含む。
サービスサーバからの第1の文識別子に対応する第1の内容バージョン順番を受信するステップをさらに含み、
サービスサーバからの第2の文字内容及び第2の文字内容の第2の文識別子を受信するステップと同時に、
サービスサーバからの第2の文識別子に対応する第2の内容バージョン順番を受信するステップをさらに含み、
それに応じて、第2の文識別子が第1の文識別子と同じである場合、第2の文字内容を表示して第1の文字内容を更新するステップは、
第2の文識別子が第1の文識別子と同じであり、且つ第2の内容バージョン順番が第1の内容バージョン順番の後に並んでいる場合、第2の文字内容を表示して第1の文字内容を更新するステップを含む。
サービスサーバからの文字内容に対して字幕表示を行うための第1の表示コントロールに第1の文字内容を表示するステップを含む。
第1の表示コントロールに第2の文字内容を表示して第1の文字内容を置き換えるステップを含む。
第1の表示コントロールに、第1の文字内容と第2の文字内容の区分内容に基づいて更新された文字内容を表示するステップを含む。
第2の文識別子が第1の文識別子と異なる場合、サービスサーバからの文字内容を表示するための第2の表示コントロールに第2の文字内容を表示するステップをさらに含む。
サービスサーバに字幕オン要求を送信するステップをさらに含む。
図6は、本開示の実施例8による情報処理装置の構造概略図である。本実施例による情報処理装置は、クライアント端末に適用され、クライアント端末がリアルタイムインタラクションシーンで字幕表示を行う場合に特に適用される。
サービスサーバにより送信された文字内容及び文字内容の文識別子を受信するための受信モジュール610と、
ローカル文識別子を読み取り、受信された文識別子がローカル文識別子と同じである場合、文字内容を利用して既に表示されたローカル文識別子に対応する字幕内容を更新するための表示モジュール620と、を含む。
それに応じて、表示モジュールは、具体的に、
ローカル文識別子と、ローカル文識別子に対応するローカル内容バージョン順番とを読み取り、
受信された文識別子がローカル文識別子と同じであり、受信された内容バージョン順番がローカル内容バージョン順番の後に並んでいる場合、文字内容を利用して既に表示されたローカル文識別子とローカル内容バージョン順番に対応する字幕内容を更新し、
受信された内容バージョン順番を利用してローカル文識別子に対応するローカル内容バージョン順番を更新するために用いられる。
ローカル文識別子を読み取り、受信された少なくとも2つの文識別子のうち、ローカル文識別子と同じである文識別子が存在しているか否かを判断し、
もしそうであれば、同じ文識別子に対応する文字内容を利用して既に表示されたローカル文識別子に対応する字幕内容を更新し、異なる文識別子に対応する文字内容を新たな字幕内容として表示し、
もしそうでなければ、受信された少なくとも2つの文字内容をそれぞれ新たな少なくとも2つの字幕内容として表示し、
受信された少なくとも2つの文識別子をいずれも新たなローカル文識別子とするために用いられる。
以下、図7を参照すると、それは、本開示の実施例を実現するのに適する電子機器(例えば図7における端末機器又はサーバ)700の構造概略図を示す。本開示の実施例における端末機器は、例えば携帯電話、ノートパソコン、デジタルブロードキャスト受信器、PDA(パーソナルデジタルアシスタント)、PAD(タブレットパソコン)、PMP(携帯型マルチメディアプレイヤー)、車載端末(例えば車載ナビゲーション端末)などの移動端末及び、例えばデジタルTV、デスクトップコンピュータなどの固定端末を含んでもよいが、それらに限らない。図7に示される電子機器は、一例に過ぎず、本開示の実施例の機能と使用範囲に任意の制限を与えるべきではない。
本開示の実施例は、コンピュータ記憶媒体を提供し、コンピュータプログラムが記憶されており、このプログラムがプロセッサによって実行される時、上記実施例による情報処理方法を実現させる。
サービスサーバにより送信された文字内容及び文字内容の文識別子を受信させ、
ローカル文識別子を読み取り、受信された文識別子がローカル文識別子と同じである場合、文字内容を利用して既に表示されたローカル文識別子に対応する字幕内容を更新させる。
本開示の実施例は、コンピュータプログラム製品をさらに提供し、それは、コンピュータ可読媒体に載せられているコンピュータプログラムを含み、このコンピュータプログラムがプロセッサによって実行されるとき、上記実施例による情報処理方法が実現される。
本開示の実施例は、コンピュータプログラムをさらに提供し、それが電子機器で実行される時、上記実施例による情報処理方法を実現させる。
サービスサーバにより送信された文字内容及び前記文字内容の文識別子を受信するステップと、
ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新するステップと、を含む。
選択的に、サービスサーバにより送信された文字内容及び前記文字内容の文識別子を受信する前記ステップと同時に、
サービスサーバにより送信された前記文識別子に対応する内容バージョン順番を受信するステップをさらに含み、
それに応じて、ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新する前記ステップは、
ローカル文識別子と、前記ローカル文識別子に対応するローカル内容バージョン順番とを読み取るステップと、
受信された文識別子が前記ローカル文識別子と同じであり、受信された内容バージョン順番が前記ローカル内容バージョン順番の後に並んでいる場合、前記文字内容を利用して既に表示された前記ローカル文識別子と、前記ローカル内容バージョン順番に対応する字幕内容とを更新するステップと、
受信された内容バージョン順番を利用してローカル文識別子に対応するローカル内容バージョン順番を更新するステップと、を含む。
受信された文識別子が前記ローカル文識別子と異なる場合、前記文字内容を新たな字幕内容として表示し、受信された文識別子を利用してローカル文識別子を更新するステップをさらに含む。
選択的に、受信された文字内容と文識別子が少なくとも2組である場合、ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新する前記ステップは、
ローカル文識別子を読み取り、受信された少なくとも2つの文識別子のうち、前記ローカル文識別子と同じである文識別子が存在しているか否かを判断するステップと、
もしそうであれば、同じ文識別子に対応する文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新し、異なる文識別子に対応する文字内容を新たな字幕内容として表示するステップと、
もしそうでなければ、受信された少なくとも2つの文字内容をそれぞれ新たな少なくとも2つの字幕内容として表示するステップと、
受信された少なくとも2つの文識別子をいずれも新たなローカル文識別子とするステップと、を含む。
選択的に、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新する前記ステップは、
前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を置き換えるステップを含む。
選択的に、前記クライアント端末は、リアルタイムインタラクションアプリケーションのクライアント端末であり、且つ前記リアルタイムインタラクションアプリケーションは、インスタントメッセンジャーアプリケーションと、マルチメディア会議アプリケーションと、ビデオライブアプリケーションと、グループチャットインタラクションアプリケーションとのうちの少なくとも1つを含む。
サービスサーバにより送信された文字内容及び前記文字内容の文識別子を受信するステップと、
ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新するステップと、を含む。
サービスサーバからの第1の文字内容及び前記第1の文字内容の第1の文識別子を受信するステップと、
前記第1の文字内容を表示するステップと、
前記サービスサーバからの第2の文字内容及び前記第2の文字内容の第2の文識別子を受信するステップと、
前記第2の文識別子が前記第1の文識別子と同じである場合、前記第1の文字内容を更新するように前記第2の文字内容を表示するステップと、を含む。
クライアント端末により送信された字幕オン要求に応答してオーディオデータを引き出し、前記オーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を取得し、及び前記現在変換待ちのオーディオデータの変化に基づいて前記文字内容の文識別子を更新するためのサービスサーバと、
前記サービスサーバにより送信された前記文字内容及び前記文字内容の文識別子を受信し、ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新するための前記クライアント端末と、を含む。
サービスサーバにより送信された文字内容及び前記文字内容の文識別子を受信するための受信モジュールと、
ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新するための表示モジュールと、を含む。
1つ又は複数のプロセッサと、
1つ又は複数のプログラムを記憶するための記憶装置とを含み、
前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサによって実行されるとき、前記1つ又は複数のプロセッサに本開示の実施例のいずれか1つに記載の情報処理方法を実現させる。
図1は、本開示の実施例1による情報処理方法のフローチャートであり、本開示の実施例は、クライアント端末がリアルタイムインタラクションシーンで字幕表示を行う場合に特に適用され、この方法は、情報処理装置によって実行されてもよく、この装置は、ソフトウェア及び/又はハードウェアの形式で実現されてもよく、この装置は、電子機器に配置され、例えばスマート携帯電話、タブレットパソコン、ノートパソコン又はディスクコンピュータなどの電子機器に配置されてもよい。
図2は、本開示の実施例2による情報処理方法のフローチャートである。本実施例は、上記実施例による各情報処理方法の選択的な技術案と組み合わせてもよい。本実施例による情報処理方法では、クライアント端末は、サービスサーバにより送信された文字内容及び文字内容の文識別子を受信すると同時に、サービスサーバにより送信された文識別子に対応する内容バージョン順番を受信することができ、そして文識別子及びその対応する内容バージョン順番を利用して文字内容の字幕表示を行うことができ、配列順位が前である文字内容がネットワーク遅延などの原因により後にクライアント端末に送信される時、配列順位が前である文字内容を利用して配列順位が後ろである文字内容を更新することによる字幕更新エラーの状況を効果的に回避することができる。
図3は、本開示の実施例3による情報処理方法のフローチャートである。本実施例は、上記実施例による各情報処理方法の選択的な技術案と組み合わせてもよい。本実施例による情報処理方法は、受信された文字内容と文識別子が少なくとも2組である場合の字幕動的表示方法を最適化しており、複数の字幕を同時に動的に更新することを実現することができ、さらに字幕表示効果を向上させる。
図4は、本開示の実施例4による情報処理システムの構造概略図である。本実施例による情報処理システムは、サービスサーバとクライアント端末との間の相互協力により、リアルタイムインタラクションシーンで、サービスサーバがインタラクションオーディオデータの引き出し、オーディオデータ変換の文字内容の取得及び文字内容に対応する文識別子の生成を実現することができ、クライアント端末は、受信されたサービスサーバにより送信された文字内容と文識別子に基づいて字幕内容の動的更新表示を行う。本開示の実施例による情報処理システムにおいて、本開示の任意の実施例による情報処理方法と同じ発明構想に属し、開示されていない技術詳細は、上記実施例を参照することができ、且つ上記実施例と同じである有益な効果に達することができる。
クライアント端末420により送信された字幕オン要求に応答してオーディオデータを引き出し、オーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を取得し、及び現在変換待ちのオーディオデータの変化に基づいて文字内容の文識別子を更新するためのサービスサーバ410と、
サービスサーバ410により送信された文字内容及び文字内容の文識別子を受信し、ローカル文識別子を読み取り、受信された文識別子がローカル文識別子と同じである場合、文字内容を利用して既に表示されたローカル文識別子に対応する字幕内容を更新するためのクライアント端末420と、を含む。
それに応じて、クライアント端末は、ローカル文識別子に対応するローカル内容バージョン順番を読み取り、受信された文識別子がローカル文識別子と同じであり、受信された内容バージョン順番がローカル内容バージョン順番の後に並んでいる場合、文字内容を利用して既に表示されたローカル文識別子とローカル内容バージョン順番に対応する字幕内容を置き換え、受信された内容バージョン順番を利用してローカル文識別子に対応するローカル内容バージョン順番を更新するためにさらに用いられる。
本実施例は、上記実施例による情報処理システムの各選択的な技術案と組み合わせてもよい。本実施例による情報処理システムは、文字内容と文識別子が少なくとも2組である場合の字幕動的表示を最適化しており、クライアント端末が複数の字幕を同時に動的に更新することを実現することができ、さらに字幕表示効果を向上させる。
字幕オン要求に応答して少なくとも2つのオーディオデータを引き出し、少なくとも2つのオーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を取得し、及び少なくとも2つの現在変換待ちのオーディオデータの変化に基づいて文字内容の文識別子を更新するために用いられ、
それに応じて、クライアント端末は、
受信された文字内容と文識別子が少なくとも2組である場合、ローカル文識別子を読み取り、受信された少なくとも2つの文識別子のうち、ローカル文識別子と同じである文識別子が存在しているか否かを判断し、
もしそうであれば、同じ文識別子に対応する文字内容を利用して既に表示されたローカル文識別子に対応する字幕内容を置き換え、異なる文識別子に対応する文字内容を新たな字幕内容として表示し、
もしそうでなければ、受信された少なくとも2つの文字内容をそれぞれ新たな少なくとも2つの字幕内容として表示し、
受信された少なくとも2つの文識別子をいずれも新たなローカル文識別子とするために用いられる。
図5は、本開示の実施例6による情報処理システムの構造概略図である。本実施例は、上記実施例による情報処理システムにおける各選択的な技術案と組み合わせてもよい。本実施例による情報処理システムは、ストリーミング通信を行うクライアント端末によりアップロードされたオーディオデータを受信するためのストリーミングサーバをさらに含んでもよく、それに応じて、サービスサーバは、具体的に、クライアント端末により送信された字幕オン要求に応答して、ストリーミングサーバからオーディオデータを引き出すために用いられる。本実施例による情報処理システムは、サービスサーバにより送信されたオーディオデータを受信し、オーディオデータの現在変換待ちのオーディオデータを決定し、現在変換待ちのオーディオデータの文字変換過程における文字内容をフィードバックするためのリアルタイム音声変換ツールをさらに含んでもよく、それに応じて、サービスサーバは、具体的に、リアルタイム音声変換ツールによりフィードバックされたオーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を受信するために用いられる。ストリーミングサーバによって、各クライアント端末によりアップロードされたオーディオデータに対する記憶を実現することができ、リアルタイム音声変換ツールによって、オーディオデータを文字内容にリアルタイムで変換して中間変換結果を出力することを実現することができる。
ストリーミングサーバ510は、ストリーミング通信を行うクライアント端末520によりアップロードされたオーディオデータを受信することに用いられ、
サービスサーバ530は、クライアント端末520により送信された字幕オン要求に応答して、ストリーミングサーバ510からオーディオデータを引き出すことに用いられ、
リアルタイム音声変換ツール540は、サービスサーバ530により送信されたオーディオデータを受信し、オーディオデータの現在変換待ちのオーディオデータを決定し、現在変換待ちのオーディオデータの文字変換過程における文字内容をフィードバックすることに用いられ、
サービスサーバ530は、さらに、リアルタイム音声変換ツール540によりフィードバックされたオーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を受信し、及び現在変換待ちのオーディオデータの変化に基づいて文字内容の文識別子を更新することに用いられ、
クライアント端末520は、サービスサーバ530により送信された文字内容及び文字内容の文識別子を受信し、ローカル文識別子を読み取り、受信された文識別子がローカル文識別子と同じである場合、文字内容を利用して既に表示されたローカル文識別子に対応する字幕内容を更新することに用いられる。
本実施例による情報処理方法は、
サービスサーバからの第1の文字内容及び第1の文字内容の第1の文識別子を受信するステップと、
第1の文字内容を表示するステップと、
サービスサーバからの第2の文字内容及び第2の文字内容の第2の文識別子を受信するステップと、
第2の文識別子が第1の文識別子と同じである場合、第2の文字内容を表示して第1の文字内容を更新するステップと、を含む。
サービスサーバからの第1の文識別子に対応する第1の内容バージョン順番を受信するステップをさらに含み、
サービスサーバからの第2の文字内容及び第2の文字内容の第2の文識別子を受信するステップと同時に、
サービスサーバからの第2の文識別子に対応する第2の内容バージョン順番を受信するステップをさらに含み、
それに応じて、第2の文識別子が第1の文識別子と同じである場合、第2の文字内容を表示して第1の文字内容を更新するステップは、
第2の文識別子が第1の文識別子と同じであり、且つ第2の内容バージョン順番が第1の内容バージョン順番の後に並んでいる場合、第2の文字内容を表示して第1の文字内容を更新するステップを含む。
サービスサーバからの文字内容に対して字幕表示を行うための第1の表示コントロールに第1の文字内容を表示するステップを含む。
第1の表示コントロールに第2の文字内容を表示して第1の文字内容を置き換えるステップを含む。
第1の表示コントロールに、第1の文字内容と第2の文字内容の区分内容に基づいて更新された文字内容を表示するステップを含む。
第2の文識別子が第1の文識別子と異なる場合、サービスサーバからの文字内容を表示するための第2の表示コントロールに第2の文字内容を表示するステップをさらに含む。
サービスサーバに字幕オン要求を送信するステップをさらに含む。
図6は、本開示の実施例8による情報処理装置の構造概略図である。本実施例による情報処理装置は、クライアント端末に適用され、クライアント端末がリアルタイムインタラクションシーンで字幕表示を行う場合に特に適用される。
サービスサーバにより送信された文字内容及び文字内容の文識別子を受信するための受信モジュール610と、
ローカル文識別子を読み取り、受信された文識別子がローカル文識別子と同じである場合、文字内容を利用して既に表示されたローカル文識別子に対応する字幕内容を更新するための表示モジュール620と、を含む。
それに応じて、表示モジュールは、具体的に、
ローカル文識別子と、ローカル文識別子に対応するローカル内容バージョン順番とを読み取り、
受信された文識別子がローカル文識別子と同じであり、受信された内容バージョン順番がローカル内容バージョン順番の後に並んでいる場合、文字内容を利用して既に表示されたローカル文識別子とローカル内容バージョン順番に対応する字幕内容を更新し、
受信された内容バージョン順番を利用してローカル文識別子に対応するローカル内容バージョン順番を更新するために用いられる。
ローカル文識別子を読み取り、受信された少なくとも2つの文識別子のうち、ローカル文識別子と同じである文識別子が存在しているか否かを判断し、
もしそうであれば、同じ文識別子に対応する文字内容を利用して既に表示されたローカル文識別子に対応する字幕内容を更新し、異なる文識別子に対応する文字内容を新たな字幕内容として表示し、
もしそうでなければ、受信された少なくとも2つの文字内容をそれぞれ新たな少なくとも2つの字幕内容として表示し、
受信された少なくとも2つの文識別子をいずれも新たなローカル文識別子とするために用いられる。
以下、図7を参照すると、それは、本開示の実施例を実現するのに適する電子機器(例えば図7における端末機器又はサーバ)700の構造概略図を示す。本開示の実施例における端末機器は、例えば携帯電話、ノートパソコン、デジタルブロードキャスト受信器、PDA(パーソナルデジタルアシスタント)、PAD(タブレットパソコン)、PMP(携帯型マルチメディアプレイヤー)、車載端末(例えば車載ナビゲーション端末)などの移動端末及び、例えばデジタルTV、デスクトップコンピュータなどの固定端末を含んでもよいが、それらに限らない。図7に示される電子機器は、一例に過ぎず、本開示の実施例の機能と使用範囲に任意の制限を与えるべきではない。
本開示の実施例は、コンピュータ記憶媒体を提供し、コンピュータプログラムが記憶されており、このプログラムがプロセッサによって実行される時、上記実施例による情報処理方法を実現させる。
サービスサーバにより送信された文字内容及び文字内容の文識別子を受信させ、
ローカル文識別子を読み取り、受信された文識別子がローカル文識別子と同じである場合、文字内容を利用して既に表示されたローカル文識別子に対応する字幕内容を更新させる。
本開示の実施例は、コンピュータプログラム製品をさらに提供し、それは、コンピュータ可読媒体に載せられているコンピュータプログラムを含み、このコンピュータプログラムがプロセッサによって実行されるとき、上記実施例による情報処理方法が実現される。
本開示の実施例は、コンピュータプログラムをさらに提供し、それが電子機器で実行される時、上記実施例による情報処理方法を実現させる。
サービスサーバにより送信された文字内容及び前記文字内容の文識別子を受信するステップと、
ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新するステップと、を含む。
選択的に、サービスサーバにより送信された文字内容及び前記文字内容の文識別子を受信する前記ステップと同時に、
サービスサーバにより送信された前記文識別子に対応する内容バージョン順番を受信するステップをさらに含み、
それに応じて、ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新する前記ステップは、
ローカル文識別子と、前記ローカル文識別子に対応するローカル内容バージョン順番とを読み取るステップと、
受信された文識別子が前記ローカル文識別子と同じであり、受信された内容バージョン順番が前記ローカル内容バージョン順番の後に並んでいる場合、前記文字内容を利用して既に表示された前記ローカル文識別子と、前記ローカル内容バージョン順番に対応する字幕内容とを更新するステップと、
受信された内容バージョン順番を利用してローカル文識別子に対応するローカル内容バージョン順番を更新するステップと、を含む。
受信された文識別子が前記ローカル文識別子と異なる場合、前記文字内容を新たな字幕内容として表示し、受信された文識別子を利用してローカル文識別子を更新するステップをさらに含む。
選択的に、受信された文字内容と文識別子が少なくとも2組である場合、ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新する前記ステップは、
ローカル文識別子を読み取り、受信された少なくとも2つの文識別子のうち、前記ローカル文識別子と同じである文識別子が存在しているか否かを判断するステップと、
もしそうであれば、同じ文識別子に対応する文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新し、異なる文識別子に対応する文字内容を新たな字幕内容として表示するステップと、
もしそうでなければ、受信された少なくとも2つの文字内容をそれぞれ新たな少なくとも2つの字幕内容として表示するステップと、
受信された少なくとも2つの文識別子をいずれも新たなローカル文識別子とするステップと、を含む。
選択的に、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新する前記ステップは、
前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を置き換えるステップを含む。
選択的に、前記クライアント端末は、リアルタイムインタラクションアプリケーションのクライアント端末であり、且つ前記リアルタイムインタラクションアプリケーションは、インスタントメッセンジャーアプリケーションと、マルチメディア会議アプリケーションと、ビデオライブアプリケーションと、グループチャットインタラクションアプリケーションとのうちの少なくとも1つを含む。
Claims (29)
- クライアント端末に適用される情報処理方法であって、
サービスサーバにより送信された文字内容及び前記文字内容の文識別子を受信するステップと、
ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新するステップと、を含む、ことを特徴とする情報処理方法。 - サービスサーバにより送信された文字内容及び前記文字内容の文識別子を受信する前記ステップと同時に、
サービスサーバにより送信された前記文識別子に対応する内容バージョン順番を受信するステップをさらに含み、
それに応じて、ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新する前記ステップは、
ローカル文識別子と、前記ローカル文識別子に対応するローカル内容バージョン順番とを読み取るステップと、
受信された文識別子が前記ローカル文識別子と同じであり、受信された内容バージョン順番が前記ローカル内容バージョン順番の後に並んでいる場合、前記文字内容を利用して既に表示された前記ローカル文識別子と、前記ローカル内容バージョン順番に対応する字幕内容とを更新するステップと、
受信された内容バージョン順番を利用してローカル文識別子に対応するローカル内容バージョン順番を更新するステップと、を含む、ことを特徴とする請求項1に記載の方法。 - 受信された文識別子が前記ローカル文識別子と異なる場合、前記文字内容を新たな字幕内容として表示し、受信された文識別子を利用してローカル文識別子を更新するステップをさらに含む、ことを特徴とする請求項1又は2に記載の方法。
- 受信された文字内容と文識別子が少なくとも2組である場合、ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新する前記ステップは、
ローカル文識別子を読み取り、受信された少なくとも2つの文識別子のうち、前記ローカル文識別子と同じである文識別子が存在しているか否かを判断するステップと、
もしそうであれば、同じ文識別子に対応する文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新し、異なる文識別子に対応する文字内容を新たな字幕内容として表示するステップと、
もしそうでなければ、受信された少なくとも2つの文字内容をそれぞれ新たな少なくとも2つの字幕内容として表示するステップと、
受信された少なくとも2つの文識別子をいずれも新たなローカル文識別子とするステップと、を含む、ことを特徴とする請求項1から3のいずれか1項に記載の方法。 - 前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新する前記ステップは、
前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を置き換えるステップを含む、ことを特徴とする請求項1から4のいずれか1項に記載の方法。 - 前記クライアント端末は、リアルタイムインタラクションアプリケーションのクライアント端末であり、且つ前記リアルタイムインタラクションアプリケーションは、インスタントメッセンジャーアプリケーションと、マルチメディア会議アプリケーションと、ビデオライブアプリケーションと、グループチャットインタラクションアプリケーションとのうちの少なくとも1つを含む、ことを特徴とする請求項1から5のいずれか1項に記載の方法。
- 情報処理システムであって、
クライアント端末により送信された字幕オン要求のキャラクタリゼーションに応答してオーディオデータを引き出し、前記オーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を取得し、及び前記現在変換待ちのオーディオデータの変化に基づいて前記文字内容の文識別子を更新するためのサービスサーバと、
前記サービスサーバにより送信された前記文字内容及び前記文字内容の文識別子を受信し、ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新するための前記クライアント端末と、を含む、ことを特徴とする情報処理システム。 - 前記サービスサーバは、具体的に、
現在変換待ちのオーディオデータが、文字変換が完了したときに、前記文識別子の更新マークを設置し、
新たな現在変換待ちのオーディオデータの文字変換過程における文字内容を取得したとき、前記更新マークに基づいて前記文識別子を更新し、前記文識別子の更新が完了したときに前記更新マークをキャンセルするために用いられる、ことを特徴とする請求項7に記載のシステム。 - 前記サービスサーバは、
前記文字内容の前記現在変換待ちのオーディオデータの文字変換過程における変換手順に基づき、前記文識別子に対応する内容バージョン順番を生成するためにさらに用いられ、
それに応じて、前記クライアント端末は、
前記ローカル文識別子に対応するローカル内容バージョン順番を読み取り、
受信された文識別子が前記ローカル文識別子と同じであり、受信された内容バージョン順番が前記ローカル内容バージョン順番の後に並んでいる場合、前記文字内容を利用して既に表示された前記ローカル文識別子と前記ローカル内容バージョン順番に対応する字幕内容を置き換え、
受信された内容バージョン順番を利用してローカル文識別子に対応するローカル内容バージョン順番を更新するためにさらに用いられる、ことを特徴とする請求項7又は8に記載のシステム。 - 前記クライアント端末は、
受信された文識別子が前記ローカル文識別子と異なる場合、前記文字内容を新たな字幕内容として表示し、受信された文識別子を利用してローカル文識別子を更新するためにさらに用いられる、ことを特徴とする請求項7から9のいずれか1項に記載のシステム。 - 前記サービスサーバは、
前記字幕オン要求のキャラクタリゼーションに応答して少なくとも2つのオーディオデータを引き出し、前記少なくとも2つのオーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を取得し、及び少なくとも2つの現在変換待ちのオーディオデータの変化に基づいて文字内容の文識別子を更新するためにさらに用いられ、
それに応じて、前記クライアント端末は、
受信された文字内容と文識別子が少なくとも2組である場合、ローカル文識別子を読み取り、受信された少なくとも2つの文識別子のうち、前記ローカル文識別子と同じである文識別子が存在しているか否かを判断し、
もしそうであれば、同じ文識別子に対応する文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を置き換え、異なる文識別子に対応する文字内容を新たな字幕内容として表示し、
もしそうでなければ、受信された少なくとも2つの文字内容をそれぞれ新たな少なくとも2つの字幕内容として表示し、
受信された少なくとも2つの文識別子をいずれも新たなローカル文識別子とするためにさらに用いられる、ことを特徴とする請求項7から10のいずれか1項に記載のシステム。 - 前記字幕オン要求には、要求字幕言語の種類が付帯されており、
それに応じて、前記サービスサーバは、
前記要求字幕言語の種類に基づいて取得された文字内容を翻訳し、翻訳済みの文字内容を前記クライアント端末に送信するためにさらに用いられる、ことを特徴とする請求項7から11のいずれか1項に記載のシステム。 - 前記字幕オン要求には、第1の身分識別子が付帯されており、
それに応じて、前記サービスサーバは、具体的に、
前記クライアント端末、及び前記第1の身分識別子と通信関係を確立する第2の身分識別子に対応するクライアント端末によりアップロードされたオーディオデータを引き出し、及び引き出されたオーディオデータの身分識別子を取得するために用いられ、
それに応じて、前記クライアント端末は、具体的に、
前記サービスサーバにより送信された身分識別子を受信し、前記字幕内容を表示すると同時に前記身分識別子を表示するために用いられる、ことを特徴とする請求項7から12のいずれか1項に記載のシステム。 - ストリーミング通信を行うクライアント端末によりアップロードされたオーディオデータを受信するためのストリーミングサーバをさらに含み、
それに応じて、前記サービスサーバは、具体的に、
クライアント端末により送信された字幕オン要求のキャラクタリゼーションに応答して、前記ストリーミングサーバからオーディオデータを引き出すために用いられる、ことを特徴とする請求項7から13のいずれか1項に記載のシステム。 - 前記サービスサーバにより送信されたオーディオデータを受信し、前記オーディオデータの現在変換待ちのオーディオデータを決定し、前記現在変換待ちのオーディオデータの文字変換過程における文字内容をフィードバックするためのリアルタイム音声変換ツールをさらに含み、
それに応じて、前記サービスサーバは、具体的に、
前記リアルタイム音声変換ツールによりフィードバックされた前記オーディオデータのうち、現在変換待ちのオーディオデータの文字変換過程における文字内容を受信するために用いられる、ことを特徴とする請求項7から14のいずれか1項に記載のシステム。 - クライアント端末に適用される情報処理装置であって、
サービスサーバにより送信された文字内容及び前記文字内容の文識別子を受信するための受信モジュールと、
ローカル文識別子を読み取り、受信された文識別子が前記ローカル文識別子と同じである場合、前記文字内容を利用して既に表示された前記ローカル文識別子に対応する字幕内容を更新するための表示モジュールと、を含む、ことを特徴とする情報処理装置。 - 情報処理方法であって、
サービスサーバからの第1の文字内容及び前記第1の文字内容の第1の文識別子を受信するステップと、
前記第1の文字内容を表示するステップと、
前記サービスサーバからの第2の文字内容及び前記第2の文字内容の第2の文識別子を受信するステップと、
前記第2の文識別子が前記第1の文識別子と同じである場合、前記第2の文字内容を表示して前記第1の文字内容を更新するステップと、を含む、情報処理方法。 - サービスサーバからの第1の文字内容及び前記第1の文字内容の第1の文識別子を受信するステップと同時に、
前記サービスサーバからの前記第1の文識別子に対応する第1の内容バージョン順番を受信するステップをさらに含み、
サービスサーバからの第2の文字内容及び前記第2の文字内容の第2の文識別子を受信するステップと同時に、
前記サービスサーバからの前記第2の文識別子に対応する第2の内容バージョン順番を受信するステップをさらに含み、
それに応じて、前記第2の文識別子が前記第1の文識別子と同じである場合、前記第2の文字内容を表示して前記第1の文字内容を更新する前記ステップは、
前記第2の文識別子が前記第1の文識別子と同じであり、且つ前記第2の内容バージョン順番が前記第1の内容バージョン順番の後に並んでいる場合、前記第2の文字内容を表示して前記第1の文字内容を更新するステップを含む、ことを特徴とする請求項17に記載の方法。 - 前記第1の文字内容を表示する前記ステップは、
前記サービスサーバからの文字内容に対して字幕表示を行うための第1の表示コントロールに前記第1の文字内容を表示するステップを含む、ことを特徴とする請求項17又は18に記載の方法。 - 前記第2の文字内容を表示して前記第1の文字内容を更新する前記ステップは、
前記第1の表示コントロールに前記第2の文字内容を表示して前記第1の文字内容を置き換えるステップを含む、ことを特徴とする請求項19に記載の方法。 - 前記第2の文字内容を表示して前記第1の文字内容を更新する前記ステップは、
前記第1の表示コントロールに、前記第1の文字内容と前記第2の文字内容の区分内容に基づいて更新された文字内容を表示するステップを含む、ことを特徴とする請求項19に記載の方法。 - 前記方法は、
前記第2の文識別子が前記第1の文識別子と異なる場合、前記サービスサーバからの文字内容を表示するための第2の表示コントロールに前記第2の文字内容を表示するステップをさらに含む、ことを特徴とする請求項19から21のいずれか1項に記載の方法。 - サービスサーバからの第1の文字内容及び前記第1の文字内容の第1の文識別子を受信する前記ステップの前に、前記方法は、
前記サービスサーバに字幕オン要求を送信するステップをさらに含む、ことを特徴とする請求項17から22のいずれか1項に記載の方法。 - 前記字幕オン要求は、前記クライアント端末をキャラクタリゼーションする身分識別子又は前記クライアント端末が位置する場所をキャラクタリゼーションする識別子を含む、ことを特徴とする請求項23に記載の方法。
- 前記字幕オン要求は、前記文字内容の言語の種類情報を含む、ことを特徴とする請求項23又は24に記載の方法。
- 電子機器であって、
1つ又は複数のプロセッサと、
1つ又は複数のプログラムを記憶するための記憶装置とを含み、
前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサによって実行されるとき、前記1つ又は複数のプロセッサに請求項1から6又は17から25のいずれか1項に記載の情報処理方法を実現させる、ことを特徴とする電子機器。 - コンピュータで実行可能な命令を含む記憶媒体であって、前記コンピュータで実行可能な命令は、コンピュータのプロセッサによって実行されるとき、請求項1から6又は17から25のいずれか1項に記載の情報処理方法を実行するために用いられる、記憶媒体。
- コンピュータプログラム製品であって、コンピュータ可読記憶媒体に載せられるコンピュータプログラムを含み、前記コンピュータプログラムがプロセッサによって実行されるとき、請求項1から6又は17から25のいずれか1項に記載の情報処理方法が実行される、コンピュータプログラム製品。
- コンピュータプログラムであって、前記コンピュータプログラムが電子機器で実行されるとき、前記電子機器に請求項1から6又は17から25のいずれか1項に記載の情報処理方法を実行させる、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010518278.3 | 2020-06-09 | ||
CN202010518278.3A CN111711853B (zh) | 2020-06-09 | 2020-06-09 | 一种信息处理方法、系统、装置、电子设备及存储介质 |
PCT/CN2021/098533 WO2021249323A1 (zh) | 2020-06-09 | 2021-06-07 | 一种信息处理方法、系统、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023515392A true JP2023515392A (ja) | 2023-04-13 |
JP7448672B2 JP7448672B2 (ja) | 2024-03-12 |
Family
ID=72538975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022549101A Active JP7448672B2 (ja) | 2020-06-09 | 2021-06-07 | 情報処理方法、システム、装置、電子機器及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11900945B2 (ja) |
EP (1) | EP4164232A4 (ja) |
JP (1) | JP7448672B2 (ja) |
CN (2) | CN114205665B (ja) |
WO (1) | WO2021249323A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114205665B (zh) | 2020-06-09 | 2023-05-09 | 抖音视界有限公司 | 一种信息处理方法、装置、电子设备及存储介质 |
CN112164392A (zh) * | 2020-11-13 | 2021-01-01 | 北京百度网讯科技有限公司 | 确定显示的识别文本的方法、装置、设备以及存储介质 |
CN112669847A (zh) * | 2020-12-03 | 2021-04-16 | 安徽宝信信息科技有限公司 | 一种可用于会议记录自动编辑整理的智慧屏 |
CN112651475B (zh) * | 2021-01-06 | 2022-09-23 | 北京字节跳动网络技术有限公司 | 二维码显示方法、装置、设备及介质 |
CN114143591A (zh) * | 2021-11-26 | 2022-03-04 | 网易(杭州)网络有限公司 | 字幕显示的方法、装置、终端和机器可读存储介质 |
Family Cites Families (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU4200600A (en) * | 1999-09-16 | 2001-04-17 | Enounce, Incorporated | Method and apparatus to determine and use audience affinity and aptitude |
CN100354930C (zh) * | 2004-11-01 | 2007-12-12 | 英业达股份有限公司 | 语音显示系统及方法 |
DE102005054978A1 (de) * | 2005-11-16 | 2007-05-24 | Deutsche Thomson-Brandt Gmbh | Verfahren zum Aktualisieren eines Datensatzes sowie Vorrichtung zur Durchführung des Verfahrens |
WO2007119893A1 (en) * | 2006-04-18 | 2007-10-25 | Inka Entworks, Inc. | Method of providing caption information and system thereof |
WO2008148102A1 (en) * | 2007-05-25 | 2008-12-04 | Tigerfish | Method and system for rapid transcription |
JP2010074482A (ja) | 2008-09-18 | 2010-04-02 | Toshiba Corp | 外国語放送編集システム、翻訳サーバおよび翻訳支援方法 |
CN101374307B (zh) * | 2008-09-26 | 2012-08-22 | 北京大学 | 一种移动设备中更新数字内容信息的方法及装置 |
CA2770361C (en) * | 2009-08-07 | 2018-01-30 | Access Innovation Media Pty Ltd | System and method for real time text streaming |
US8379801B2 (en) * | 2009-11-24 | 2013-02-19 | Sorenson Communications, Inc. | Methods and systems related to text caption error correction |
EP2339576B1 (en) * | 2009-12-23 | 2019-08-07 | Google LLC | Multi-modal input on an electronic device |
US8825488B2 (en) | 2010-04-12 | 2014-09-02 | Adobe Systems Incorporated | Method and apparatus for time synchronized script metadata |
US9536567B2 (en) * | 2011-09-02 | 2017-01-03 | Nexidia Inc. | Transcript re-sync |
US9704111B1 (en) * | 2011-09-27 | 2017-07-11 | 3Play Media, Inc. | Electronic transcription job market |
CN103888597B (zh) * | 2012-12-21 | 2016-12-28 | 联想(北京)有限公司 | 一种通信方法、装置及电子设备 |
WO2014113071A1 (en) | 2013-01-15 | 2014-07-24 | Viki, Inc. | System and method for captioning media |
WO2014191054A1 (en) * | 2013-05-31 | 2014-12-04 | Longsand Limited | Processing of audio data |
US10331661B2 (en) * | 2013-10-23 | 2019-06-25 | At&T Intellectual Property I, L.P. | Video content search using captioning data |
CN104050160B (zh) * | 2014-03-12 | 2017-04-05 | 北京紫冬锐意语音科技有限公司 | 一种机器与人工翻译相融合的口语翻译方法和装置 |
US20160026962A1 (en) * | 2014-07-28 | 2016-01-28 | Bank Of America Corporation | Chat analyzer |
WO2016066377A1 (en) * | 2014-10-30 | 2016-05-06 | Econiq Limited | A recording system for generating a transcript of a dialogue |
US9886423B2 (en) | 2015-06-19 | 2018-02-06 | International Business Machines Corporation | Reconciliation of transcripts |
CN105827499B (zh) * | 2015-07-30 | 2019-12-03 | 南京步步高通信科技有限公司 | 一种已发送信息的修改方法、电子设备及应用服务器 |
US9672867B2 (en) * | 2015-08-05 | 2017-06-06 | International Business Machines Corporation | Automated creation and maintenance of video-based documentation |
US10332506B2 (en) * | 2015-09-02 | 2019-06-25 | Oath Inc. | Computerized system and method for formatted transcription of multimedia content |
US9787819B2 (en) * | 2015-09-18 | 2017-10-10 | Microsoft Technology Licensing, Llc | Transcription of spoken communications |
CN105513586A (zh) * | 2015-12-18 | 2016-04-20 | 百度在线网络技术(北京)有限公司 | 语音识别结果的显示方法和装置 |
CN105931641B (zh) * | 2016-05-25 | 2020-11-10 | 腾讯科技(深圳)有限公司 | 字幕数据生成方法和装置 |
KR101861006B1 (ko) * | 2016-08-18 | 2018-05-28 | 주식회사 하이퍼커넥트 | 통역 장치 및 방법 |
CN106412678A (zh) * | 2016-09-14 | 2017-02-15 | 安徽声讯信息技术有限公司 | 一种视频新闻实时转写存储方法及系统 |
CN106340291A (zh) * | 2016-09-27 | 2017-01-18 | 广东小天才科技有限公司 | 一种双语字幕制作方法及系统 |
US10657834B2 (en) * | 2017-01-20 | 2020-05-19 | Coursera, Inc. | Smart bookmarks |
CN108538284A (zh) * | 2017-03-06 | 2018-09-14 | 北京搜狗科技发展有限公司 | 同声翻译结果的展现方法及装置、同声翻译方法及装置 |
WO2019029783A1 (en) * | 2017-08-07 | 2019-02-14 | Sonova Ag | AUTOMATIC AUDIO TRANSCRIPTION ONLINE FOR HEARING AID USERS |
US10762060B1 (en) * | 2017-10-18 | 2020-09-01 | Comake, Inc. | Electronic file management |
CN109936665A (zh) * | 2017-12-18 | 2019-06-25 | 镇江智宸电子有限公司 | 一种通信方法、装置及电子设备 |
CN108259971A (zh) * | 2018-01-31 | 2018-07-06 | 百度在线网络技术(北京)有限公司 | 字幕添加方法、装置、服务器及存储介质 |
US10459620B2 (en) | 2018-02-09 | 2019-10-29 | Nedelco, Inc. | Caption rate control |
US11100164B2 (en) * | 2018-06-12 | 2021-08-24 | Verizon Media Inc. | Displaying videos based upon selectable inputs associated with tags |
US20200051582A1 (en) * | 2018-08-08 | 2020-02-13 | Comcast Cable Communications, Llc | Generating and/or Displaying Synchronized Captions |
JP7096732B2 (ja) | 2018-08-09 | 2022-07-06 | 日本放送協会 | コンテンツ配信装置及びプログラム |
SG10201901335VA (en) * | 2019-02-15 | 2020-09-29 | Wika Media Pte Ltd | Device and method for facilitating a provision of a content |
US11347379B1 (en) * | 2019-04-22 | 2022-05-31 | Audible, Inc. | Captions for audio content |
CN110379406B (zh) * | 2019-06-14 | 2021-12-07 | 北京字节跳动网络技术有限公司 | 语音评论转换方法、系统、介质和电子设备 |
EP3984023A1 (en) * | 2019-06-14 | 2022-04-20 | Cedat 85 S.r.l. | Apparatus for processing an audio signal for the generation of a multimedia file with speech transcription |
CN110415706A (zh) * | 2019-08-08 | 2019-11-05 | 常州市小先信息技术有限公司 | 一种在视频通话中实时叠加字幕的技术及其应用 |
US10917607B1 (en) | 2019-10-14 | 2021-02-09 | Facebook Technologies, Llc | Editing text in video captions |
US11410644B2 (en) * | 2019-10-18 | 2022-08-09 | Invoca, Inc. | Generating training datasets for a supervised learning topic model from outputs of a discovery topic model |
US11715466B2 (en) * | 2019-11-21 | 2023-08-01 | Rovi Guides, Inc. | Systems and methods for local interpretation of voice queries |
US20210224319A1 (en) * | 2019-12-28 | 2021-07-22 | Ben Avi Ingel | Artificially generating audio data from textual information and rhythm information |
US11159590B1 (en) * | 2020-04-10 | 2021-10-26 | Microsoft Technology Licensing, Llc | Content recognition while screen sharing |
US11790916B2 (en) * | 2020-05-04 | 2023-10-17 | Rovi Guides, Inc. | Speech-to-text system |
US11532308B2 (en) | 2020-05-04 | 2022-12-20 | Rovi Guides, Inc. | Speech-to-text system |
CN114205665B (zh) * | 2020-06-09 | 2023-05-09 | 抖音视界有限公司 | 一种信息处理方法、装置、电子设备及存储介质 |
CN112511910A (zh) * | 2020-11-23 | 2021-03-16 | 浪潮天元通信信息系统有限公司 | 实时字幕的处理方法和装置 |
-
2020
- 2020-06-09 CN CN202111491495.9A patent/CN114205665B/zh active Active
- 2020-06-09 CN CN202010518278.3A patent/CN111711853B/zh active Active
-
2021
- 2021-06-07 EP EP21821814.7A patent/EP4164232A4/en active Pending
- 2021-06-07 JP JP2022549101A patent/JP7448672B2/ja active Active
- 2021-06-07 WO PCT/CN2021/098533 patent/WO2021249323A1/zh unknown
-
2022
- 2022-03-21 US US17/699,551 patent/US11900945B2/en active Active
-
2023
- 2023-10-31 US US18/499,001 patent/US20240062762A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN111711853B (zh) | 2022-02-01 |
US11900945B2 (en) | 2024-02-13 |
JP7448672B2 (ja) | 2024-03-12 |
US20220215841A1 (en) | 2022-07-07 |
WO2021249323A1 (zh) | 2021-12-16 |
CN111711853A (zh) | 2020-09-25 |
CN114205665A (zh) | 2022-03-18 |
CN114205665B (zh) | 2023-05-09 |
US20240062762A1 (en) | 2024-02-22 |
EP4164232A1 (en) | 2023-04-12 |
EP4164232A4 (en) | 2023-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023515392A (ja) | 情報処理方法、システム、装置、電子機器及び記憶媒体 | |
US20210243045A1 (en) | Online document sharing method and apparatus, electronic device, and storage medium | |
US20240155092A1 (en) | Interactive information processing method, device and medium | |
WO2020078300A1 (zh) | 一种终端投屏的控制方法和终端 | |
CN111064987B (zh) | 信息展示方法、装置及电子设备 | |
CN112073307B (zh) | 邮件处理方法、装置、电子设备及计算机可读介质 | |
WO2023029904A1 (zh) | 文本内容匹配方法、装置、电子设备及存储介质 | |
CN113889113A (zh) | 分句方法、装置、存储介质及电子设备 | |
CN113157153A (zh) | 内容分享方法、装置、电子设备及计算机可读存储介质 | |
CN112601102A (zh) | 同声传译字幕的确定方法、装置、电子设备及存储介质 | |
CN114554238A (zh) | 直播语音同传方法、装置、介质及电子设备 | |
CN113992926B (zh) | 界面显示方法、装置、电子设备和存储介质 | |
CN108337556B (zh) | 用于播放影音文件的方法和装置 | |
WO2021103741A1 (zh) | 内容处理方法、装置、计算机设备及存储介质 | |
KR101351264B1 (ko) | 음성인식 기반의 메시징 통역서비스 제공 시스템 및 그 방법 | |
CN113886612A (zh) | 一种多媒体浏览方法、装置、设备及介质 | |
US20210358475A1 (en) | Interpretation system, server apparatus, distribution method, and storage medium | |
CN113299285A (zh) | 设备控制方法、装置、电子设备及计算机可读存储介质 | |
CN113891108A (zh) | 字幕优化方法、装置、电子设备和存储介质 | |
CN115086753A (zh) | 直播视频流的处理方法、装置、电子设备和存储介质 | |
CN114125358A (zh) | 云会议字幕显示方法、系统、装置、电子设备和存储介质 | |
JP2023536992A (ja) | ターゲットコンテンツの検索方法、装置、電子機器および記憶媒体 | |
CN115150631A (zh) | 字幕处理方法、装置、电子设备和存储介质 | |
CN115474065B (zh) | 一种字幕处理方法、装置、电子设备和存储介质 | |
CN114267358B (zh) | 音频处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220822 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220822 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230912 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240229 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7448672 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |