JP2023522469A - ビデオ翻訳方法、装置、記憶媒体及び電子機器 - Google Patents
ビデオ翻訳方法、装置、記憶媒体及び電子機器 Download PDFInfo
- Publication number
- JP2023522469A JP2023522469A JP2022564506A JP2022564506A JP2023522469A JP 2023522469 A JP2023522469 A JP 2023522469A JP 2022564506 A JP2022564506 A JP 2022564506A JP 2022564506 A JP2022564506 A JP 2022564506A JP 2023522469 A JP2023522469 A JP 2023522469A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- text
- user
- proposal
- clause
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 433
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000014616 translation Effects 0.000 claims abstract description 432
- 230000002123 temporal effect Effects 0.000 claims abstract description 43
- 238000012790 confirmation Methods 0.000 claims abstract description 40
- 230000004044 response Effects 0.000 claims abstract description 34
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 40
- 238000010586 diagram Methods 0.000 description 12
- 230000008901 benefit Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/57—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234336—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by media transcoding, e.g. video is transformed into a slideshow of still pictures or audio is converted into text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4312—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440236—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Machine Translation (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
本出願は、2020年06月23日付けで中国国家知識産権局に提出され、出願番号が202010583177.4であり、出願名称が「ビデオ翻訳方法、装置、記憶媒体及び電子機器」である中国特許出願に基づく優先権を主張し、その全内容を援用により本出願に組み込む。
本開示は、機械翻訳の分野に関し、特に、ビデオ翻訳方法、装置、記憶媒体及び電子機器に関する。
翻訳対象となるビデオの音声をテキストに変換するステップと、
前記テキストと、前記テキストの第1の時間情報、第2の時間情報、及び参照翻訳とを提示するステップであって、前記第1の時間情報が、前記ビデオにおける前記テキストの開始時間であり、前記第2の時間情報が、前記ビデオにおける前記テキストの終了時間であるステップと、
ユーザーによる前記テキスト又は前記参照翻訳の操作に応答して、前記ユーザーが翻訳を入力することをサポートする編集領域を提示するステップと、
前記編集領域での前記ユーザーによる入力に従って、前記参照翻訳からの翻訳提案を提供するステップと、を含み、
前記ユーザーによる前記翻訳提案の確認操作を検出した場合、前記翻訳提案を翻訳結果として前記編集領域に表示し、
前記ユーザーの前記翻訳提案に対する非確認操作を検出した場合、前記ユーザーによって入力された、前記翻訳提案とは異なる翻訳を受信し、前記ユーザーによって入力された前記翻訳を前記翻訳結果として前記編集領域に表示し、前記ユーザーによって入力された前記翻訳に基づいて、翻訳領域における参照翻訳を更新する。
翻訳対象となるビデオの音声をテキストに変換するための変換モジュールと、
前記テキストと、前記テキストの第1の時間情報、第2の時間情報、及び参照翻訳とを提示し、さらに、前記ユーザーによる前記テキスト又は前記参照翻訳の操作に応答して、前記ユーザーが翻訳を入力することをサポートする編集領域を提示するための提示モジュールであって、前記第1の時間情報が、前記ビデオにおける前記テキストの開始時間であり、前記第2の時間情報が、前記ビデオにおける前記テキストの終了時間である提示モジュールと、
前記編集領域でのユーザーによる入力に従って、前記参照翻訳からの翻訳提案を提供するための提案モジュールと、を含み、
前記提示モジュールはさらに、前記ユーザーによる前記翻訳提案の確認操作を検出した場合、前記翻訳提案を翻訳結果として前記編集領域に表示し、前記ユーザーの前記翻訳提案に対する非確認操作を検出した場合、前記ユーザーによって入力された、前記翻訳提案とは異なる翻訳を受信し、前記ユーザーによって入力された前記翻訳を前記翻訳結果として前記編集領域に表示し、前記ユーザーによって入力された前記翻訳に基づいて、翻訳領域における参照翻訳を更新する。
コンピュータプログラムが記憶された記憶装置と、
前記記憶装置における前記コンピュータプログラムを実行して、本開示の第1の態様に記載の方法のステップを実現するための処理装置と、を含む。
S11:翻訳対象となるビデオの音声をテキストに変換する。
(外1)
という1段のテキストコンテンツについて、当該テキストコンテンツの時間軸情報は「00:00:15―00:00:18」であり、第1の時間情報は00:00:15であり、第2の時間情報は00:00:18であり、ユーザーは当該テキストコンテンツを
(外2)
及び
(外3)
という2つの節に分割する場合、編集前のテキストの長さ及び編集後の各節のテキストの長さに基づいて、各節に時間軸を設定し、例えば、元の時間軸を同じ長さの2つの段に分割し、
(外4)
という1番目のサブ段の時間軸を「00:00:15―00:00:16」に設定し、
(外5)
という2番目のサブ段の時間軸情報を「00:00:17―00:00:18」に設定する。
ユーザーがテキストコンテンツに対して翻訳を行う際に、翻訳領域に表示される参照翻訳を参照して、編集領域内で入力し(ここで、入力は、例えば字母や単語のキー入力などの文字の入力を含み、編集領域のクリックなどのボタン操作入力も含む)、参照翻訳からの翻訳提案を提供することができる。
(外6)
であり、その参照翻訳は「Some cities continue to rise with the advantage of the perfect high―speed rail network」である場合、ユーザーが編集領域をクリックしたり、編集領域に文字「S」を入力したりした後、参照翻訳からの翻訳提案「Some」(又は「Some cities continue to rise」などのより粗粒度の翻訳提案)を提供することができる。
(外7)
の参照翻訳は、「Some cities continue to rise with the advantage of the perfect high―speed rail network.」であり、ユーザーの編集領域に対するクリック入力操作を受信した後、参照翻訳からの翻訳提案「Some」を提供し、ユーザーによる確認操作に基づいて、翻訳提案「Some」を翻訳結果として編集領域に表示し、ユーザーに次の翻訳提案「cities」を引き続いて提供する。翻訳提案「with」を提供する際に、ユーザーから翻訳提案とは異なる入力「b」を受信した場合、ユーザーによって入力された翻訳に基づいて、参照翻訳を「Some cities continue to rise because of the advantage of the perfect high―speedrail network.」に更新し、ユーザーに翻訳提案「because」を提供する。
(外8)
であり、対応する翻訳提案は「Some cities continue to rise with the advantage of a perfect Qualcomm network.」であり、ユーザーが編集領域に入力した翻訳結果は、「Some cities continue to rise b」であり、翻訳提案とは異なる翻訳は「b」であり、この場合、参照翻訳を「Some cities continue to rise because of the advantage of a perfect Qualcomm network.」に更新することができる。しかし、当該文のテキストコンテンツは、雑音、音声発話者のアクセントなどの要素による誤認識テキストである可能性があり、ユーザーは、その元のテキストが
(外9)
であることを発見した場合、テキストコンテンツにおける
(外10)
を
(外11)
に編集し、この場合、更新後の参照翻訳は「Some cities continue to rise because of the advantage of the perfect high―speed rail network.」になり、更新後の参照翻訳からの翻訳提案をユーザーに提供する。
(外12)
であり、編集後のテキストコンテンツは、
(外13)
である場合、編集後のテキストコンテンツにおいて、各文字の時間軸情報はいずれも元の9/11にリセットされ、続いて、ユーザーが区切り、マージなどの操作をする場合、各文字の時間軸情報に基づいて、節又はマージされたサブ段の時間軸情報が決定される。
翻訳対象となるビデオの音声をテキストに変換するための変換モジュール410と、
前記テキストと、前記テキストの第1の時間情報、第2の時間情報、及び参照翻訳とを提示し、さらに、ユーザーによる前記テキスト又は前記参照翻訳の操作に応答して、前記ユーザーが翻訳を入力することをサポートする編集領域を提示するための提示モジュール420であって、前記第1の時間情報が、前記ビデオにおける前記テキストの開始時間であり、前記第2の時間情報が、前記ビデオにおける前記テキストの終了時間である提示モジュール420と、
前記編集領域でのユーザーによる入力に従って、前記参照翻訳からの翻訳提案を提供するための提案モジュール430と、を含み、
前記提示モジュール420はさらに、前記ユーザーによる前記翻訳提案の確認操作を検出した場合、前記翻訳提案を翻訳結果として前記編集領域に表示し、前記ユーザーの前記翻訳提案に対する非確認操作を検出した場合、前記ユーザーによって入力された、前記翻訳提案とは異なる翻訳を受信し、前記ユーザーによって入力された前記翻訳を前記翻訳結果として前記編集領域に表示し、ユーザーによって入力された前記翻訳に基づいて、翻訳領域における参照翻訳を更新する。任意選択で、前記提示モジュール420はさらに、前記テキストの、前記ビデオにおける対応する時点情報及び/又は画面フレームに基づいて、前記テキストを区切って、複数の節テキストを取得し、各前記節テキストに対して、前記節テキストと、前記節テキストの第1の時間情報、第2の時間情報及び参照翻訳とを提示する。
又は、上記のコンピュータ可読媒体には1つ又は複数のプログラムが担持され、上記1つ又は複数のプログラムは当該電子機器によって実行されるときに、当該電子機器に、少なくとも2つのインターネットプロトコルアドレスを含むノード評価要求を受信するステップと、前記少なくとも2つのインターネットプロトコルアドレスから、インターネットプロトコルアドレスを選択するステップと、選択されたインターネットプロトコルアドレスを返信するステップであって、受信されたインターネットプロトコルアドレスが、コンテンツ配信ネットワークにおけるエッジノードを指示するステップと、を実行させる。
Claims (10)
- ビデオ翻訳方法であって、
翻訳対象となるビデオの音声をテキストに変換するステップと、
前記テキストと、前記テキストの第1の時間情報、第2の時間情報、及び参照翻訳とを提示するステップであって、前記第1の時間情報は、前記ビデオにおける前記テキストの開始時間であり、前記第2の時間情報は、前記ビデオにおける前記テキストの終了時間であるステップと、
ユーザーによる前記テキスト又は前記参照翻訳の操作に応答して、前記ユーザーが翻訳を入力することをサポートする編集領域を提示するステップと、
前記編集領域での前記ユーザーによる入力に従って、前記参照翻訳からの翻訳提案を提供するステップと、を含み、
前記ユーザーによる前記翻訳提案の確認操作を検出した場合、前記翻訳提案を翻訳結果として前記編集領域に表示し、及び、前記翻訳提案に対する前記ユーザーの非確認操作を検出した場合、前記ユーザーによって入力された前記翻訳提案とは異なる翻訳を受信し、前記ユーザーによって入力された前記翻訳を前記翻訳結果として前記編集領域に表示し、前記ユーザーによって入力された前記翻訳に基づいて、翻訳領域における参照翻訳を更新することを特徴とする方法。 - 前記テキストと、前記テキストの第1の時間情報、第2の時間情報、及び参照翻訳とを提示する前記ステップは、
前記テキストの、前記ビデオにおける対応する時点情報及び/又は画面フレームに基づいて、前記テキストを区切って、複数の節テキストを取得するステップと、
各前記節テキストに対して、前記節テキストと、前記節テキストの第1の時間情報、第2の時間情報及び参照翻訳とを提示するステップと、を含むことを特徴とする請求項1に記載の方法。 - 前記テキストは複数の節テキストを含み、各前記節テキストは異なる領域に提示され、前記方法は、
前記ユーザーが前記節テキストを分割することをサポートする分割機能バーを提示するステップと、
前記ユーザーによる前記節テキストのいずれか1つに対する分割操作に応答して、前記節テキストを少なくとも2つの節サブテキストに分割し、各前記節サブテキストについて、前記節サブテキストと、前記節サブテキストの第1の時間情報、第2の時間情報及び前記節サブテキストの参照翻訳とを関連付けて表示するステップと、をさらに含むことを特徴とする請求項1に記載の方法。 - 前記テキストは、複数の節テキストを含み、各前記節テキストは異なる領域に提示され、前記方法は、
前記ユーザーが前記節テキストをマージすることをサポートするマージ機能バーを提示するステップと、
前記ユーザーによる任意の隣接する2つの節テキストに対するマージ操作に応答して、前記隣接する2つの節テキストを1段の新たな節テキストにマージし、前記新たな節テキストについて、前記新たな節テキストと、前記新たな節テキストの第1の時間情報、第2の時間情報及び前記新たな節テキストの参照翻訳とを関連付けて表示するステップと、をさらに含むことを特徴とする請求項1に記載の方法。 - 前記テキストは、複数の節テキストを含み、各前記節テキストは、異なる領域に提示され、前記方法は、
前記ユーザーが前記節テキストに対応する音声を再生することをサポートする再生機能バーを提示するステップと、
前記ユーザーによる前記再生機能バーの操作に応答して、前記節テキストに対応する音声を再生するステップと、をさらに含むことを特徴とする請求項1から4のいずれか1項に記載の方法。 - 前記参照翻訳からの翻訳提案を提供する前記ステップは、
入力された翻訳とは異なる表示形態で前記翻訳提案を前記編集領域に表示するステップを含み、
前記ユーザーにおる前記翻訳提案の確認操作に応答して、前記翻訳提案を翻訳結果として前記編集領域に表示する前記ステップは、
前記ユーザーによる前記翻訳提案の確認操作に応答して、入力された翻訳と同じ表示形態で翻訳結果としての前記翻訳提案を前記編集領域内に表示するステップを含むことを特徴とする請求項1から4のいずれか1項に記載の方法。 - 前記ユーザーによる前記翻訳提案の確認操作に応答して、前記翻訳提案を翻訳結果として前記編集領域に表示する前記ステップは、
ユーザーによるショートカットキーのトリガー操作に応答して、前記翻訳提案を翻訳結果として前記編集領域に表示するステップを含むことを特徴とする請求項1から4のいずれか1項に記載の方法。 - ビデオ翻訳装置であって、
翻訳対象となるビデオの音声をテキストに変換するための変換モジュールと、
前記テキストと、前記テキストの第1の時間情報、第2の時間情報、及び参照翻訳とを提示し、さらに、ユーザーによる前記テキスト又は前記参照翻訳の操作に応答して、前記ユーザーが翻訳を入力することをサポートする編集領域を提示するための提示モジュールであって、前記第1の時間情報が、前記ビデオにおける前記テキストの開始時間であり、前記第2の時間情報が、前記ビデオにおける前記テキストの終了時間である提示モジュールと、
前記編集領域でのユーザーによる入力に従って、前記参照翻訳からの翻訳提案を提供するための提案モジュールと、を含み、
前記提示モジュールはさらに、前記ユーザーによる前記翻訳提案の確認操作を検出した場合、前記翻訳提案を翻訳結果として前記編集領域に表示し、及び、前記翻訳提案に対する前記ユーザーの非確認操作を検出した場合、前記ユーザーによって入力された前記翻訳提案とは異なる翻訳を受信し、前記ユーザーによって入力された前記翻訳を前記翻訳結果として前記編集領域に表示し、前記ユーザーによって入力された前記翻訳に基づいて、翻訳領域における参照翻訳を更新することを特徴とする装置。 - コンピュータプログラムが記憶されたコンピュータ可読媒体であって、当該プログラムが処理装置によって実行されるときに、請求項1から7のいずれか1項に記載の方法のステップを実現することを特徴とするコンピュータ可読媒体。
- 電子機器であって、
コンピュータプログラムが記憶された記憶装置と、
前記記憶装置における前記コンピュータプログラムを実行して、請求項1から7のいずれか1項に記載の方法のステップを実現する処理装置と、を含むことを特徴とする電子機器。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010583177.4 | 2020-06-23 | ||
CN202010583177.4A CN111753558B (zh) | 2020-06-23 | 2020-06-23 | 视频翻译方法和装置、存储介质和电子设备 |
PCT/CN2021/101388 WO2021259221A1 (zh) | 2020-06-23 | 2021-06-22 | 视频翻译方法和装置、存储介质和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023522469A true JP2023522469A (ja) | 2023-05-30 |
Family
ID=72676904
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022564506A Pending JP2023522469A (ja) | 2020-06-23 | 2021-06-22 | ビデオ翻訳方法、装置、記憶媒体及び電子機器 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11763103B2 (ja) |
EP (1) | EP4170543A4 (ja) |
JP (1) | JP2023522469A (ja) |
KR (1) | KR20220127361A (ja) |
CN (1) | CN111753558B (ja) |
WO (1) | WO2021259221A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111753558B (zh) | 2020-06-23 | 2022-03-04 | 北京字节跳动网络技术有限公司 | 视频翻译方法和装置、存储介质和电子设备 |
KR20230124420A (ko) * | 2022-02-18 | 2023-08-25 | 에이아이링고 주식회사 | 번역된 콘텐츠의 편집 인터페이스 제공 방법 및 컴퓨터 프로그램 |
CN114596882B (zh) * | 2022-03-09 | 2024-02-02 | 云学堂信息科技(江苏)有限公司 | 一种可实现对课程内容快速定位的剪辑方法 |
WO2023212920A1 (zh) * | 2022-05-06 | 2023-11-09 | 湖南师范大学 | 一种基于自建模板的多模态快速转写及标注系统 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6549911B2 (en) * | 1998-11-02 | 2003-04-15 | Survivors Of The Shoah Visual History Foundation | Method and apparatus for cataloguing multimedia data |
US6782384B2 (en) * | 2000-10-04 | 2004-08-24 | Idiom Merger Sub, Inc. | Method of and system for splitting and/or merging content to facilitate content processing |
US7035804B2 (en) * | 2001-04-26 | 2006-04-25 | Stenograph, L.L.C. | Systems and methods for automated audio transcription, translation, and transfer |
US7111044B2 (en) * | 2002-07-17 | 2006-09-19 | Fastmobile, Inc. | Method and system for displaying group chat sessions on wireless mobile terminals |
WO2009038209A1 (ja) * | 2007-09-20 | 2009-03-26 | Nec Corporation | 機械翻訳システム、機械翻訳方法及び機械翻訳プログラム |
US8843359B2 (en) * | 2009-02-27 | 2014-09-23 | Andrew Nelthropp Lauder | Language translation employing a combination of machine and human translations |
US20100332214A1 (en) * | 2009-06-30 | 2010-12-30 | Shpalter Shahar | System and method for network transmision of subtitles |
US20110246172A1 (en) * | 2010-03-30 | 2011-10-06 | Polycom, Inc. | Method and System for Adding Translation in a Videoconference |
GB2502944A (en) * | 2012-03-30 | 2013-12-18 | Jpal Ltd | Segmentation and transcription of speech |
US9696881B2 (en) * | 2013-01-15 | 2017-07-04 | Viki, Inc. | System and method for captioning media |
US9183198B2 (en) * | 2013-03-19 | 2015-11-10 | International Business Machines Corporation | Customizable and low-latency interactive computer-aided translation |
CN103226947B (zh) * | 2013-03-27 | 2016-08-17 | 广东欧珀移动通信有限公司 | 一种基于移动终端的音频处理方法及装置 |
WO2014198035A1 (en) * | 2013-06-13 | 2014-12-18 | Google Inc. | Techniques for user identification of and translation of media |
US20150042771A1 (en) * | 2013-08-07 | 2015-02-12 | United Video Properties, Inc. | Methods and systems for presenting supplemental content in media assets |
JP6327848B2 (ja) * | 2013-12-20 | 2018-05-23 | 株式会社東芝 | コミュニケーション支援装置、コミュニケーション支援方法およびプログラム |
US10169313B2 (en) * | 2014-12-04 | 2019-01-01 | Sap Se | In-context editing of text for elements of a graphical user interface |
US9772816B1 (en) * | 2014-12-22 | 2017-09-26 | Google Inc. | Transcription and tagging system |
CN104731776B (zh) * | 2015-03-27 | 2017-12-26 | 百度在线网络技术(北京)有限公司 | 翻译信息的提供方法及系统 |
JP6470097B2 (ja) * | 2015-04-22 | 2019-02-13 | 株式会社東芝 | 通訳装置、方法およびプログラム |
JP6471074B2 (ja) * | 2015-09-30 | 2019-02-13 | 株式会社東芝 | 機械翻訳装置、方法及びプログラム |
US9558182B1 (en) * | 2016-01-08 | 2017-01-31 | International Business Machines Corporation | Smart terminology marker system for a language translation system |
KR102495517B1 (ko) * | 2016-01-26 | 2023-02-03 | 삼성전자 주식회사 | 전자 장치, 전자 장치의 음성 인식 방법 |
JP2017151768A (ja) * | 2016-02-25 | 2017-08-31 | 富士ゼロックス株式会社 | 翻訳プログラム及び情報処理装置 |
CN105828101B (zh) * | 2016-03-29 | 2019-03-08 | 北京小米移动软件有限公司 | 生成字幕文件的方法及装置 |
CN107885729B (zh) * | 2017-09-25 | 2021-05-11 | 沈阳航空航天大学 | 基于双语片段的交互式机器翻译方法 |
CN107943797A (zh) * | 2017-11-22 | 2018-04-20 | 语联网(武汉)信息技术有限公司 | 一种全原文参考的在线翻译系统 |
CN108259965B (zh) * | 2018-03-31 | 2020-05-12 | 湖南广播电视台广播传媒中心 | 一种视频剪辑方法和剪辑系统 |
US11636273B2 (en) * | 2019-06-14 | 2023-04-25 | Netflix, Inc. | Machine-assisted translation for subtitle localization |
CN110489763B (zh) * | 2019-07-18 | 2023-03-10 | 深圳市轱辘车联数据技术有限公司 | 一种视频翻译方法及装置 |
US11301644B2 (en) * | 2019-12-03 | 2022-04-12 | Trint Limited | Generating and editing media |
US11580312B2 (en) * | 2020-03-16 | 2023-02-14 | Servicenow, Inc. | Machine translation of chat sessions |
US11545156B2 (en) * | 2020-05-27 | 2023-01-03 | Microsoft Technology Licensing, Llc | Automated meeting minutes generation service |
CN111753558B (zh) * | 2020-06-23 | 2022-03-04 | 北京字节跳动网络技术有限公司 | 视频翻译方法和装置、存储介质和电子设备 |
-
2020
- 2020-06-23 CN CN202010583177.4A patent/CN111753558B/zh active Active
-
2021
- 2021-06-22 JP JP2022564506A patent/JP2023522469A/ja active Pending
- 2021-06-22 EP EP21830302.2A patent/EP4170543A4/en active Pending
- 2021-06-22 WO PCT/CN2021/101388 patent/WO2021259221A1/zh unknown
- 2021-06-22 KR KR1020227030540A patent/KR20220127361A/ko unknown
-
2022
- 2022-08-10 US US17/818,969 patent/US11763103B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP4170543A4 (en) | 2023-10-25 |
US20220383000A1 (en) | 2022-12-01 |
EP4170543A1 (en) | 2023-04-26 |
KR20220127361A (ko) | 2022-09-19 |
CN111753558B (zh) | 2022-03-04 |
CN111753558A (zh) | 2020-10-09 |
WO2021259221A1 (zh) | 2021-12-30 |
US11763103B2 (en) | 2023-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023522469A (ja) | ビデオ翻訳方法、装置、記憶媒体及び電子機器 | |
US20240155092A1 (en) | Interactive information processing method, device and medium | |
US11580314B2 (en) | Document translation method and apparatus, storage medium, and electronic device | |
CN110969012B (zh) | 文本纠错方法、装置、存储介质及电子设备 | |
CN110389807B (zh) | 一种界面翻译方法、装置、电子设备及存储介质 | |
CN111970577A (zh) | 字幕编辑方法、装置和电子设备 | |
CN111339788B (zh) | 交互式机器翻译方法、装置、设备和介质 | |
CN113010698B (zh) | 多媒体的交互方法、信息交互方法、装置、设备及介质 | |
CN111898388A (zh) | 视频字幕翻译编辑方法、装置、电子设备及存储介质 | |
CN113778419B (zh) | 多媒体数据的生成方法、装置、可读介质及电子设备 | |
CN111860000A (zh) | 文本翻译编辑方法、装置、电子设备及存储介质 | |
CN108491178B (zh) | 信息浏览方法、浏览器和服务器 | |
CN112380365A (zh) | 一种多媒体的字幕交互方法、装置、设备及介质 | |
CN113886612A (zh) | 一种多媒体浏览方法、装置、设备及介质 | |
US20240079002A1 (en) | Minutes of meeting processing method and apparatus, device, and medium | |
CN112530472B (zh) | 音频与文本的同步方法、装置、可读介质和电子设备 | |
CN112163103A (zh) | 搜索目标内容的方法、装置、电子设备及存储介质 | |
CN113221514A (zh) | 文本处理方法、装置、电子设备和存储介质 | |
CN113132789B (zh) | 一种多媒体的交互方法、装置、设备及介质 | |
US20230140442A1 (en) | Method for searching target content, and electronic device and storage medium | |
CN111104016B (zh) | 提供翻译结果的方法及设备 | |
WO2021161908A1 (ja) | 情報処理装置及び情報処理方法 | |
CN115357160B (zh) | 文档内容点选方法、装置、电子设备、介质和程序产品 | |
CN111523330A (zh) | 用于生成文本的方法、装置、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221024 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221024 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240403 |