JP6150405B2 - メディアにキャプションを付けるシステム及び方法 - Google Patents
メディアにキャプションを付けるシステム及び方法 Download PDFInfo
- Publication number
- JP6150405B2 JP6150405B2 JP2015552622A JP2015552622A JP6150405B2 JP 6150405 B2 JP6150405 B2 JP 6150405B2 JP 2015552622 A JP2015552622 A JP 2015552622A JP 2015552622 A JP2015552622 A JP 2015552622A JP 6150405 B2 JP6150405 B2 JP 6150405B2
- Authority
- JP
- Japan
- Prior art keywords
- caption
- media
- annotation
- user
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G2340/00—Aspects of display data processing
- G09G2340/12—Overlay of images, i.e. displayed pixel being the result of switching between the corresponding input pixels
- G09G2340/125—Overlay of images, i.e. displayed pixel being the result of switching between the corresponding input pixels wherein one of the images is motion video
Description
[0019] 図1に示すように、メディアキャプションを生成するシステムは、キャプションストリームインターフェース114に制御可能に結合されたメディアプレーヤ112を含むメディアインターフェース110を含んでもよい。このシステムは、容易かつ効果的なインターフェースを形成してメディアファイルに関するキャプションを翻訳するように機能する。システムは、複数のアカウント実体の参加を通じてメディアファイルに多言語で字幕を付けるのに通常は使用される。メディアプレーヤ112でのメディアの再生は、キャプションストリームインターフェース114と協働して行われることが好ましい。システムは、1以上のセットのキャプションを生成することが好ましく、各キャプションは、異なる言語のものであることが好ましい。キャプションのセットは、(例えば図1に示すように)メディアから生成されてもよく、又は、(例えば図2に示すように)別のキャプションセットから生成(例えば翻訳)されてもよい。初期のキャプションは、メディアと組み合わせた参照として使用され、少なくとも第2セットのキャプションに関する翻訳/キャプションを収集する。システムは、複数アカウントのオンラインプラットフォーム130を通じて字幕付けを可能にすることが好ましい。オンラインプラットフォームは、ウェブサイト又は他の適切なアプリケーションを通じてアクセス可能なネットワークアクセス可能サービスであることが好ましい。複数のユーザが字幕付けに参加することができるようにすることによって、メディアに字幕付けすることの品質、効率及びスケールを向上させることができる。システムは、映像ストリーミングプラットフォームで実施されてもよい。通常のアプリケーションでは、映像ストリーミングプラットフォームは、多数の映像及び世界的に又は文化的に多様な視聴率を有することが可能であり、従って、多様な視聴者に対してアピールするために多数の映像の現地語化/翻訳を必要とする。従業員、ボランティア、たまたま視聴している視聴者、かなりの言語知識を有する視聴者、限られた言語知識しか有しない視聴者がすべて、メディアのキャプション付け及び/又は翻訳に参加することができる。好適な一実施形態では、キャプションストリームインターフェース114は、通常の映像プレーヤの選択可能な動作モードとして構成されてもよい。映像を観ている時、視聴者は、キャプションストリームインターフェース114を選択的に起動させることができ、かつ、メディアの全部又は一部の翻訳に寄与することができる。
[0028] 図6、図7及び図9に示すように、メディアに共同でキャプションを付ける方法は、メディアセグメントに関するキャプションとしての第1注釈を第1ユーザから受信するステップS100と、メディアセグメントに関するキャプションとしての第2注釈を第2ユーザから受信するステップS200と、メディアセグメントに関するキャプションをユーザに提示するステップS300と、を含む。第1及び第2注釈は、同一の言語のものであることが好ましく、メディアセグメントに関するキャプションは、メディアセグメントに関する第1言語のキャプションであることが好ましい。方法は、追加的に、メディアセグメントを定義するセグメントパラメータを第3ユーザから受信することを含んでもよい。方法は、キャプションの共同創作及び改善を可能にする。メディアキャプション付け(字幕付け)及び/又はメディア分割の困難な仕事をクラウドソーシングすることによって、この方法は、消費者のためのキャプションを迅速に生成する方法を提供する。さらに、生成されたキャプションは、オンラインキャプション付けサービスのユーザが簡単に査読して任意の誤ったキャプションを編集することができるため、高品質なキャプションになる傾向にある。
[0070] 方法は、追加的に、多言語でキャプションを生成するステップを含んでもよい。多言語でキャプションを生成するステップは、図12Aに示すように、様々なユーザアカウントから異なる言語のキャプション(例えば、音声からの直接翻訳)を受信するステップ、第1言語のキャプションを第2言語に自動的に翻訳するステップ、図12Bに示すように、第1言語のキャプションの第2言語への手動の翻訳を容易にするステップ、又は、多言語でのキャプション生成の任意の他の適切な方法を含んでもよい。第2言語は、第1言語とは異なる言語であることが好ましい。複数のユーザが所定のメディアセグメントに関する様々な言語のキャプションを同時に作成すること及び/又は複数のメディアセグメントにわたって様々な言語のキャプションを作成することを可能にすることによって、多言語でキャプションを生成するステップが、異なる言語のキャプションセットを同時に生成することを可能にする。
[0079] 方法は、追加的に、図13及び図15に示すように、メディアをセグメント化するステップを含んでもよく、メディアのセグメント化は、ユーザのためのメディアセグメントをキャプションに提供するように機能する。メディアは、自動的に、半自動的に又はユーザによって手動でセグメント化されてもよい。データを手動でセグメント化するユーザは、第1又は第2ユーザとは異なるユーザ(例えば、第3、第4又は第5ユーザ)であることが好ましいが、代替的に、任意の適切なユーザであってもよい。セグメントは、ユーザデバイス又はユーザアカウントから受信されることが好ましいが、代替的に、セグメント化するユーザに関連付けられた任意の適切なコンストラクト(construct)から受信されてもよい。メディアセグメント化は、メディアの同一のピースに関するメディアキャプション付けと実質的に同時に実行されてもよく、定義されたメディアセグメントは、ユーザが、識別後に(例えば、メディアの残りの部分がセグメント化されない間でも)キャプション付けをするために実質的に即座に利用可能であることが好ましい。
Claims (15)
- 映像及び音声を有するストリーミングされたメディアにキャプションを付ける方法であって、前記方法は、
第1のユーザアカウントに関連した第1デバイスに、遠隔メディアリポジトリから前記メディアをストリーミングするステップと、
前記第1デバイスで、前記メディアのタイムラインに沿った前記音声の視覚表示をレンダリングするステップと、
第1タイムスタンプ及び第2タイムスタンプで境界を付けられたメディアセグメントを定義するセグメントパラメータを、前記第1のユーザアカウントから受信するステップと、
前記第1タイムスタンプ及び前記第2タイムスタンプに関連付けられたキャプションを備えるキャプションファイルを生成するステップと、
定義された前記メディアセグメントに関連する第1の注釈を、前記第1のユーザアカウントから受信するステップと、
前記キャプションファイルを編集するステップであって、前記第1タイムスタンプ及び第2タイムスタンプに関連するキャプション用の注釈のバージョンとして、受信した前記第1の注釈を保存することを含むステップと、
第2のユーザアカウントに関連した第2デバイスに、前記遠隔メディアリポジトリから前記メディアをストリーミングするステップと、
定義された前記メディアセグメントの前記第1タイムスタンプ及び前記第2タイムスタンプに対応するアイコンを有する前記音声の視覚表示をレンダリングするステップと、
定義された前記メディアセグメントに関連する第2の注釈を、前記第2のユーザアカウントから受信するステップと、
前記キャプションファイルを編集するステップであって、前記第1タイムスタンプ及び第2タイムスタンプに関連するキャプション用の注釈のバージョンとして、受信した前記第2の注釈を保存することを含むステップと、
表示される前記キャプションの現在のバージョンとして、前記第1の注釈および前記第2の注釈の一方を自動的に選択するステップと、
第3のユーザアカウントに関連した第3デバイスに前記メディアをストリーミングするステップと、
前記第1および第2のタイムスタンプの間の映像フレームにわたる定義された前記メディアセグメント用に、選択された前記注釈を前記第3デバイスでレンダリングするステップと、を含む方法。 - 前記第1または第2の注釈を受信するステップは、
定義された前記メディアセグメントの選択を受信するステップと、
選択された前記メディアセグメントに関連付けられたキャプション入力フィールドで前記第1または第2の注釈を受信するステップと、を含む、請求項1に記載の方法。 - 前記キャプション入力フィールドが、選択された前記メディアセグメント内の映像フレームに関連付けられたテキスト入力を含む、請求項2に記載の方法。
- 前記第2のユーザアカウントから境界変更を受信するステップと、変更された前記境界に対応したタイムスタンプを有する前記キャプションファイル内の前記キャプションを更新するステップと、をさらに含む、請求項1に記載の方法。
- 第3及び第4タイムスタンプによって境界を付けられた第2メディアセグメントを定義するセグメントパラメータを前記第2のユーザアカウントから受信するステップと、新たなキャプションに関連付けられた前記第3及び前記第4タイムスタンプを前記キャプションファイルに追加するステップと、をさらに含む、請求項1に記載の方法。
- 前記メディアセグメントを定義するセグメントパラメータを受信するステップは、前記視覚表示のセグメントの選択を受信するステップを含む、請求項1に記載の方法。
- 前記視覚表示のセグメントの選択を受信するステップは、
前記第1タイムスタンプで入力を受信するステップと、
前記第1タイムスタンプから始まる前記映像及び前記音声を再生するステップと、
前記入力の解除を検出して、前記入力が解除された前記タイムスタンプに前記第2タイムスタンプを設定するステップであって、前記入力は、映像及び音声の再生中に維持される、設定するステップと、を含む、請求項6に記載の方法。 - 前記入力が、前記音声の前記視覚表示の位置のカーソル選択である、請求項7に記載の方法。
- 前記キャプションファイルが前記遠隔メディアリポジトリに記憶される、請求項1に記載の方法。
- 請求項1に記載の方法において、前記第1および第2の注釈の一方を自動的に選択するステップが、前記第1および第2の注釈を、定義された前記メディアセグメントの音声についての自動的な機械翻訳と比較して、当該機械翻訳と似ている方の注釈を選択するステップを含むことを特徴とする方法。
- 請求項1に記載の方法において、前記第1および第2の注釈の一方を自動的に選択するステップが、
前記第1および第2の注釈を、定義された前記メディアセグメントの音声についての自動的な機械翻訳と比較するステップと、
規定の閾値を超える前記機械翻訳との類似度を有する1以上の注釈を選択するステップ、または規定の閾値を超える前記機械翻訳との相違を有する1以上の注釈を削除するステップと、を含み、
規定の閾値を超える前記機械翻訳との類似性を有する1以上の注釈を選択するステップに対応して、当該1以上の注釈が反復してまたは無作為に選択されて提示されることを特徴とする方法。 - 請求項11に記載の方法において、前記機械翻訳との類似度が、語句の共通、単語の類似度、または文法の類似度によって決定され、前記機械翻訳との相違が、語句の相違、単語の相違、または文法の相違によって決定されることを特徴とする方法。
- 請求項1に記載の方法において、前記第1および第2の注釈の一方を自動的に選択するステップが、最も共通して生じている構成要素を決定するステップと、当該共通して生じている構成要素から第3の注釈を生成するステップと、を含むことを特徴とする方法。
- 請求項1に記載の方法において、前記第1および第2の注釈の一方を自動的に選択するステップが、
キャプションをリクエストしている複数のユーザに、前記第1および第2の注釈を無作為に提示するステップと、
提示された前記注釈に対する注釈品質指標を各ユーザから受信するステップと、
受信した前記注釈品質指標に基づいて、前記第1および第2の注釈に関するランクを計算するステップと、
前記第1および第2の注釈のうち、定義された前記メディアセグメントに対する最も高いランキングのキャプションを有する方を選択するステップと、を含むことを特徴とする方法。 - 請求項1に記載の方法において、前記第1および第2の注釈の一方を自動的に選択するステップが、
キャプションをリクエストしている複数のユーザに、前記第1および第2の注釈を無作為に提示するステップと、
提示された前記注釈に対する注釈品質指標を各ユーザから受信するステップと、
受信した前記注釈品質指標に基づいて、前記第1および第2の注釈に関するランクを計算するステップと、
規定の閾値を超えるランクを有する1以上の注釈を選択するステップと、を含み、
規定の閾値を超えるランクを有する1以上の注釈を選択するステップに対応して、当該1以上の注釈が反復してまたは無作為に選択されて提示されることを特徴とする方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361752816P | 2013-01-15 | 2013-01-15 | |
US61/752,816 | 2013-01-15 | ||
US201361754926P | 2013-01-21 | 2013-01-21 | |
US61/754,926 | 2013-01-21 | ||
PCT/US2013/055573 WO2014113071A1 (en) | 2013-01-15 | 2013-08-19 | System and method for captioning media |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016509408A JP2016509408A (ja) | 2016-03-24 |
JP6150405B2 true JP6150405B2 (ja) | 2017-06-21 |
Family
ID=51164858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015552622A Active JP6150405B2 (ja) | 2013-01-15 | 2013-08-19 | メディアにキャプションを付けるシステム及び方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US8848109B2 (ja) |
EP (1) | EP2946279B1 (ja) |
JP (1) | JP6150405B2 (ja) |
ES (1) | ES2762328T3 (ja) |
WO (1) | WO2014113071A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11170257B2 (en) | 2018-10-15 | 2021-11-09 | Ancestry.Com Operations Inc. | Image captioning with weakly-supervised attention penalty |
Families Citing this family (92)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8972257B2 (en) * | 2010-06-02 | 2015-03-03 | Yahoo! Inc. | Systems and methods to present voice message information to a user of a computing device |
US20140127653A1 (en) * | 2011-07-11 | 2014-05-08 | Moshe Link | Language-learning system |
US9508169B2 (en) * | 2012-09-14 | 2016-11-29 | Google Inc. | Method and apparatus for contextually varying amounts of imagery on a map |
EP2946279B1 (en) | 2013-01-15 | 2019-10-16 | Viki, Inc. | System and method for captioning media |
JP1527512S (ja) * | 2013-02-22 | 2015-06-29 | ||
US9471334B2 (en) * | 2013-03-08 | 2016-10-18 | Intel Corporation | Content presentation with enhanced closed caption and/or skip back |
CL2013001365E1 (es) * | 2013-03-13 | 2013-11-15 | Samsung Electronics Co Ltd | Dibujo industrial aplicable a la pantalla de un dispositivo de comunicacion movil, conformado por un rectangulo horizontal que cercano a su lado superior presenta una barra horizontal rectangular que en su primer cuarto a la izquierda esta pigmentado y con un circulo sobrepuesto. |
US20140272820A1 (en) * | 2013-03-15 | 2014-09-18 | Media Mouth Inc. | Language learning environment |
USD757762S1 (en) * | 2013-04-05 | 2016-05-31 | Thales Avionics, Inc. | Display screen or portion thereof with graphical user interface |
USD769271S1 (en) * | 2013-04-05 | 2016-10-18 | Thales Avionics, Inc. | Display screen or portion thereof with graphical user interface |
US9361353B1 (en) * | 2013-06-27 | 2016-06-07 | Amazon Technologies, Inc. | Crowd sourced digital content processing |
USD752078S1 (en) * | 2013-10-03 | 2016-03-22 | Thales Avionics, Inc. | Display screen or portion thereof with graphical user interface |
KR102256291B1 (ko) * | 2013-11-15 | 2021-05-27 | 삼성전자 주식회사 | 번역 상황을 인지하고 번역 기능을 수행하는 방법 및 이를 구현하는 전자장치 |
US9830376B2 (en) * | 2013-11-20 | 2017-11-28 | International Business Machines Corporation | Language tag management on international data storage |
KR20150107382A (ko) * | 2014-03-14 | 2015-09-23 | 삼성전자주식회사 | 전자장치 및 전자장치의 콘텐츠 표시방법 |
US9477657B2 (en) * | 2014-06-11 | 2016-10-25 | Verizon Patent And Licensing Inc. | Real time multi-language voice translation |
US9571870B1 (en) * | 2014-07-15 | 2017-02-14 | Netflix, Inc. | Automatic detection of preferences for subtitles and dubbing |
US10638082B2 (en) * | 2014-08-28 | 2020-04-28 | Gregory A. Pearson, Inc. | Systems and methods for picture-in-picture video conference functionality |
USD851118S1 (en) | 2014-09-02 | 2019-06-11 | Samsung Electronics Co., Ltd. | Display screen or portion thereof with graphical user interface |
FR3025926B1 (fr) | 2014-09-17 | 2018-11-02 | France Brevets | Procede de controle de la vitesse d'affichage des sous-titres |
US9998518B2 (en) * | 2014-09-18 | 2018-06-12 | Multipop Llc | Media platform for adding synchronized content to media with a duration |
US9852759B2 (en) * | 2014-10-25 | 2017-12-26 | Yieldmo, Inc. | Methods for serving interactive content to a user |
US10460745B2 (en) | 2015-01-15 | 2019-10-29 | Huawei Technologies Co., Ltd. | Audio content segmentation method and apparatus |
US10893336B2 (en) * | 2015-02-06 | 2021-01-12 | Arris Enterprises Llc | Customized captioning for client device |
US9886633B2 (en) * | 2015-02-23 | 2018-02-06 | Vivint, Inc. | Techniques for identifying and indexing distinguishing features in a video feed |
US10133538B2 (en) * | 2015-03-27 | 2018-11-20 | Sri International | Semi-supervised speaker diarization |
US10529383B2 (en) * | 2015-04-09 | 2020-01-07 | Avid Technology, Inc. | Methods and systems for processing synchronous data tracks in a media editing system |
US10025474B2 (en) * | 2015-06-03 | 2018-07-17 | Ricoh Company, Ltd. | Information processing apparatus, system, and method, and recording medium |
US10021156B2 (en) | 2015-06-24 | 2018-07-10 | Spotify Ab | Method and an electronic device for performing playback and sharing of streamed media |
US10671234B2 (en) * | 2015-06-24 | 2020-06-02 | Spotify Ab | Method and an electronic device for performing playback of streamed media including related media content |
KR101789221B1 (ko) * | 2015-07-16 | 2017-10-23 | 네이버 주식회사 | 동영상 제공 장치, 동영상 제공 방법, 및 컴퓨터 프로그램 |
WO2017062961A1 (en) * | 2015-10-09 | 2017-04-13 | Plugg Music Inc. | Methods and systems for interactive multimedia creation |
JP6559542B2 (ja) * | 2015-11-05 | 2019-08-14 | シャープ株式会社 | 受信装置、受信方法およびプログラム |
CA3005479A1 (en) | 2015-11-20 | 2017-05-26 | Genetec Inc. | Media streaming |
CA3005476C (en) | 2015-11-20 | 2024-03-05 | Genetec Inc. | Secure layered encryption of data streams |
US9805030B2 (en) * | 2016-01-21 | 2017-10-31 | Language Line Services, Inc. | Configuration for dynamically displaying language interpretation/translation modalities |
JP6555553B2 (ja) * | 2016-03-25 | 2019-08-07 | パナソニックIpマネジメント株式会社 | 翻訳装置 |
US10490209B2 (en) * | 2016-05-02 | 2019-11-26 | Google Llc | Automatic determination of timing windows for speech captions in an audio stream |
US10417022B2 (en) | 2016-06-16 | 2019-09-17 | International Business Machines Corporation | Online video playback analysis and assistance |
WO2017217612A1 (ko) * | 2016-06-17 | 2017-12-21 | 주식회사 사이 | 원터치를 이용한 동영상 컨텐츠의 자막 생성 및 공유 방법 |
US10944806B2 (en) | 2016-06-22 | 2021-03-09 | The Directv Group, Inc. | Method to insert program boundaries in linear video for adaptive bitrate streaming |
US10692497B1 (en) * | 2016-11-01 | 2020-06-23 | Scott Muske | Synchronized captioning system and methods for synchronizing captioning with scripted live performances |
CN107122430B (zh) * | 2017-04-14 | 2020-09-04 | 阿里巴巴(中国)有限公司 | 搜索结果显示方法及装置 |
KR101924634B1 (ko) * | 2017-06-07 | 2018-12-04 | 네이버 주식회사 | 콘텐츠 제공 서버, 콘텐츠 제공 단말 및 콘텐츠 제공 방법 |
US10652622B2 (en) | 2017-06-27 | 2020-05-12 | At&T Intellectual Property I, L.P. | Method and apparatus for providing content based upon a selected language |
US10176846B1 (en) * | 2017-07-20 | 2019-01-08 | Rovi Guides, Inc. | Systems and methods for determining playback points in media assets |
US10681343B2 (en) | 2017-09-15 | 2020-06-09 | At&T Intellectual Property I, L.P. | Digital closed caption corruption reporting |
US11856315B2 (en) * | 2017-09-29 | 2023-12-26 | Apple Inc. | Media editing application with anchored timeline for captions and subtitles |
CN107770598B (zh) * | 2017-10-12 | 2020-06-30 | 维沃移动通信有限公司 | 一种同步播放的检测方法、移动终端 |
US10299008B1 (en) | 2017-11-21 | 2019-05-21 | International Business Machines Corporation | Smart closed caption positioning system for video content |
CN108156480B (zh) * | 2017-12-27 | 2022-01-04 | 腾讯科技(深圳)有限公司 | 一种视频字幕生成的方法、相关装置及系统 |
US11270071B2 (en) * | 2017-12-28 | 2022-03-08 | Comcast Cable Communications, Llc | Language-based content recommendations using closed captions |
EP3759935A1 (en) * | 2018-02-26 | 2021-01-06 | Google LLC | Automated voice translation dubbing for prerecorded videos |
US10728623B2 (en) | 2018-06-06 | 2020-07-28 | Home Box Office, Inc. | Editing timed-text elements |
CN108650543A (zh) * | 2018-06-20 | 2018-10-12 | 北京优酷科技有限公司 | 视频的字幕编辑方法及装置 |
CN108924599A (zh) * | 2018-06-29 | 2018-11-30 | 北京优酷科技有限公司 | 视频字幕显示方法及装置 |
CN108924636A (zh) * | 2018-06-29 | 2018-11-30 | 北京优酷科技有限公司 | 字幕显示方法及装置 |
CN109151609B (zh) * | 2018-09-25 | 2021-01-26 | 海信视像科技股份有限公司 | 一种兼容不同平台的字幕展示方法及其装置 |
US11423920B2 (en) * | 2018-09-28 | 2022-08-23 | Rovi Guides, Inc. | Methods and systems for suppressing vocal tracks |
US11361168B2 (en) * | 2018-10-16 | 2022-06-14 | Rovi Guides, Inc. | Systems and methods for replaying content dialogue in an alternate language |
US11024291B2 (en) | 2018-11-21 | 2021-06-01 | Sri International | Real-time class recognition for an audio stream |
US11342002B1 (en) * | 2018-12-05 | 2022-05-24 | Amazon Technologies, Inc. | Caption timestamp predictor |
US11347379B1 (en) | 2019-04-22 | 2022-05-31 | Audible, Inc. | Captions for audio content |
US11463507B1 (en) * | 2019-04-22 | 2022-10-04 | Audible, Inc. | Systems for generating captions for audio content |
US11205445B1 (en) * | 2019-06-10 | 2021-12-21 | Amazon Technologies, Inc. | Language agnostic automated voice activity detection |
US11636273B2 (en) * | 2019-06-14 | 2023-04-25 | Netflix, Inc. | Machine-assisted translation for subtitle localization |
JP7434762B2 (ja) | 2019-09-10 | 2024-02-21 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置およびプログラム |
US11500226B1 (en) * | 2019-09-26 | 2022-11-15 | Scott Phillip Muske | Viewing area management for smart glasses |
US11301644B2 (en) * | 2019-12-03 | 2022-04-12 | Trint Limited | Generating and editing media |
US11551013B1 (en) * | 2020-03-02 | 2023-01-10 | Amazon Technologies, Inc. | Automated quality assessment of translations |
CN111464876B (zh) * | 2020-03-31 | 2022-04-29 | 安徽听见科技有限公司 | 翻译文本字幕流式展示方法、装置以及设备 |
TWI800729B (zh) * | 2020-05-21 | 2023-05-01 | 七法股份有限公司 | 具便利使用功能之法學資料呈現系統及方法 |
US11776578B2 (en) * | 2020-06-02 | 2023-10-03 | Trapelo Corp. | Automatic modification of values of content elements in a video |
CN114205665B (zh) | 2020-06-09 | 2023-05-09 | 抖音视界有限公司 | 一种信息处理方法、装置、电子设备及存储介质 |
CN111753558B (zh) * | 2020-06-23 | 2022-03-04 | 北京字节跳动网络技术有限公司 | 视频翻译方法和装置、存储介质和电子设备 |
JP2022033624A (ja) * | 2020-08-17 | 2022-03-02 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
US11501074B2 (en) * | 2020-08-27 | 2022-11-15 | Capital One Services, Llc | Representing confidence in natural language processing |
CN112104896B (zh) * | 2020-08-31 | 2023-04-07 | 火星语盟(深圳)科技有限公司 | 字幕编辑方法、终端、服务器、系统及存储介质 |
US11625928B1 (en) * | 2020-09-01 | 2023-04-11 | Amazon Technologies, Inc. | Language agnostic drift correction |
USD965015S1 (en) * | 2020-09-28 | 2022-09-27 | Samsung Electronics Co., Ltd. | Display screen or portion thereof with transitional graphical user interface |
USD965016S1 (en) * | 2020-09-28 | 2022-09-27 | Samsung Electronics Co., Ltd. | Display screen or portion thereof with transitional graphical user interface |
GB2600933B (en) * | 2020-11-11 | 2023-06-28 | Sony Interactive Entertainment Inc | Apparatus and method for analysis of audio recordings |
CN113010698B (zh) * | 2020-11-18 | 2023-03-10 | 北京字跳网络技术有限公司 | 多媒体的交互方法、信息交互方法、装置、设备及介质 |
CN112748576B (zh) * | 2020-12-09 | 2023-01-10 | 博泰车联网科技(上海)股份有限公司 | Hud显示方法及显示系统、车辆、介质 |
US11553255B2 (en) | 2021-03-10 | 2023-01-10 | Sony Interactive Entertainment LLC | Systems and methods for real time fact checking during stream viewing |
US11546669B2 (en) * | 2021-03-10 | 2023-01-03 | Sony Interactive Entertainment LLC | Systems and methods for stream viewing with experts |
US20220303636A1 (en) * | 2021-03-22 | 2022-09-22 | Arris Enterprises Llc | Providing dynamic media captioning and augmented/virtual reality feedback in home network environments |
US20220366153A1 (en) * | 2021-05-12 | 2022-11-17 | Microsoft Technology Licensing, Llc | Automated script generation and audio-visual presentations |
US11934438B2 (en) | 2021-06-28 | 2024-03-19 | Rovi Guides, Inc. | Subtitle rendering based on the reading pace |
US20220414132A1 (en) * | 2021-06-28 | 2022-12-29 | Rovi Guides, Inc. | Subtitle rendering based on the reading pace |
US20230153547A1 (en) * | 2021-11-12 | 2023-05-18 | Ogoul Technology Co. W.L.L. | System for accurate video speech translation technique and synchronisation with the duration of the speech |
CN114143592B (zh) * | 2021-11-30 | 2023-10-27 | 抖音视界有限公司 | 视频处理方法、视频处理装置和计算机可读存储介质 |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2001288469A1 (en) | 2000-08-28 | 2002-03-13 | Emotion, Inc. | Method and apparatus for digital media management, retrieval, and collaboration |
US7747434B2 (en) * | 2000-10-24 | 2010-06-29 | Speech Conversion Technologies, Inc. | Integrated speech recognition, closed captioning, and translation system and method |
JP2005129971A (ja) * | 2002-01-28 | 2005-05-19 | Telecommunication Advancement Organization Of Japan | 半自動型字幕番組制作システム |
US7739584B2 (en) | 2002-08-08 | 2010-06-15 | Zane Vella | Electronic messaging synchronized to media presentation |
US8566887B2 (en) * | 2005-12-09 | 2013-10-22 | Time Warner Cable Enterprises Llc | Caption data delivery apparatus and methods |
US7954049B2 (en) * | 2006-05-15 | 2011-05-31 | Microsoft Corporation | Annotating multimedia files along a timeline |
US20080129865A1 (en) * | 2006-11-05 | 2008-06-05 | Sean Joseph Leonard | System and Methods for Rapid Subtitling |
US7559017B2 (en) * | 2006-12-22 | 2009-07-07 | Google Inc. | Annotation framework for video |
US8468149B1 (en) * | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US20090037263A1 (en) | 2007-07-30 | 2009-02-05 | Yahoo! Inc. | System for the insertion and control of advertisements in video |
US8271260B2 (en) * | 2007-12-05 | 2012-09-18 | Facebook, Inc. | Community translation on a social network |
GB0801429D0 (en) | 2008-01-25 | 2008-03-05 | Decisive Media Ltd | Media Annotation system, method and media player |
WO2009097492A1 (en) | 2008-01-30 | 2009-08-06 | Azuki Systems, Inc. | Media navigation system |
US8112702B2 (en) * | 2008-02-19 | 2012-02-07 | Google Inc. | Annotating video intervals |
GB0804164D0 (en) * | 2008-03-06 | 2009-01-07 | Software Hothouse Ltd | Enhancements to unified communications and messaging systems |
US20090265212A1 (en) | 2008-04-17 | 2009-10-22 | David Hyman | Advertising in a streaming media environment |
WO2010005743A2 (en) | 2008-06-16 | 2010-01-14 | View2Gether Inc. | Contextual advertising using video metadata and analysis |
US9390169B2 (en) * | 2008-06-28 | 2016-07-12 | Apple Inc. | Annotation of movies |
WO2010035249A1 (en) | 2008-09-24 | 2010-04-01 | France Telecom | Content classification utilizing a reduced description palette to simplify content analysis |
US8330864B2 (en) | 2008-11-02 | 2012-12-11 | Xorbit, Inc. | Multi-lingual transmission and delay of closed caption content through a delivery system |
US8185431B2 (en) | 2008-11-13 | 2012-05-22 | Kwabena Benoni Abboa-Offei | System and method for forecasting and pairing advertising with popular web-based media |
JP2010157961A (ja) * | 2009-01-05 | 2010-07-15 | Kadokawa Marketing Co Ltd | 字幕作成システム及びプログラム |
US8769396B2 (en) * | 2009-06-05 | 2014-07-01 | Microsoft Corporation | Calibration and annotation of video content |
US8572488B2 (en) * | 2010-03-29 | 2013-10-29 | Avid Technology, Inc. | Spot dialog editor |
US20120017153A1 (en) * | 2010-07-15 | 2012-01-19 | Ken Matsuda | Dynamic video editing |
WO2012030965A2 (en) * | 2010-08-31 | 2012-03-08 | Fox Entertainment Group, Inc. | Localized media content editing |
US8386299B2 (en) | 2010-09-02 | 2013-02-26 | Sony Mobile Communications Ab | System and method for dynamically pricing electronic advertisements |
US20120158492A1 (en) | 2010-12-16 | 2012-06-21 | Yahoo! Inc. | Method and system for attention based advertisement insertion |
US8526782B2 (en) | 2010-12-22 | 2013-09-03 | Coincident.Tv, Inc. | Switched annotations in playing audiovisual works |
JP2012165313A (ja) * | 2011-02-09 | 2012-08-30 | Sony Corp | 編集装置及び方法、並びにプログラム |
WO2012129336A1 (en) | 2011-03-21 | 2012-09-27 | Vincita Networks, Inc. | Methods, systems, and media for managing conversations relating to content |
JP6114492B2 (ja) * | 2011-05-26 | 2017-04-12 | ヤマハ株式会社 | データ処理装置およびプログラム |
US8744237B2 (en) | 2011-06-20 | 2014-06-03 | Microsoft Corporation | Providing video presentation commentary |
US9066145B2 (en) | 2011-06-30 | 2015-06-23 | Hulu, LLC | Commenting correlated to temporal point of video data |
US9354763B2 (en) * | 2011-09-26 | 2016-05-31 | The University Of North Carolina At Charlotte | Multi-modal collaborative web-based video annotation system |
US8494838B2 (en) | 2011-11-10 | 2013-07-23 | Globili Llc | Systems, methods and apparatus for dynamic content management and delivery |
US20130308922A1 (en) * | 2012-05-15 | 2013-11-21 | Microsoft Corporation | Enhanced video discovery and productivity through accessibility |
WO2014062941A1 (en) * | 2012-10-17 | 2014-04-24 | Proz.Com | Method and apparatus to facilitate high-quality translation of texts by multiple translators |
US20140143218A1 (en) * | 2012-11-20 | 2014-05-22 | Apple Inc. | Method for Crowd Sourced Multimedia Captioning for Video Content |
EP2946279B1 (en) | 2013-01-15 | 2019-10-16 | Viki, Inc. | System and method for captioning media |
US20140337126A1 (en) | 2013-05-08 | 2014-11-13 | Viki, Inc. | Timed comments for media |
US20140376887A1 (en) * | 2013-06-24 | 2014-12-25 | Adobe Systems Incorporated | Mobile device video selection and edit |
-
2013
- 2013-08-19 EP EP13871995.0A patent/EP2946279B1/en active Active
- 2013-08-19 WO PCT/US2013/055573 patent/WO2014113071A1/en active Application Filing
- 2013-08-19 US US13/970,066 patent/US8848109B2/en active Active
- 2013-08-19 US US13/970,034 patent/US9696881B2/en active Active
- 2013-08-19 ES ES13871995T patent/ES2762328T3/es active Active
- 2013-08-19 JP JP2015552622A patent/JP6150405B2/ja active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11170257B2 (en) | 2018-10-15 | 2021-11-09 | Ancestry.Com Operations Inc. | Image captioning with weakly-supervised attention penalty |
US11775838B2 (en) | 2018-10-15 | 2023-10-03 | Ancestry.Com Operations Inc. | Image captioning with weakly-supervised attention penalty |
Also Published As
Publication number | Publication date |
---|---|
EP2946279B1 (en) | 2019-10-16 |
US8848109B2 (en) | 2014-09-30 |
JP2016509408A (ja) | 2016-03-24 |
EP2946279A1 (en) | 2015-11-25 |
US20140201631A1 (en) | 2014-07-17 |
WO2014113071A1 (en) | 2014-07-24 |
EP2946279A4 (en) | 2016-08-24 |
US9696881B2 (en) | 2017-07-04 |
US20140198252A1 (en) | 2014-07-17 |
ES2762328T3 (es) | 2020-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6150405B2 (ja) | メディアにキャプションを付けるシステム及び方法 | |
US11301644B2 (en) | Generating and editing media | |
US11868965B2 (en) | System and method for interview training with time-matched feedback | |
CN104246750B (zh) | 抄录语音 | |
KR101700076B1 (ko) | 텍스트 데이터와 오디오 데이터 간의 맵핑 자동 생성 | |
US20150319510A1 (en) | Interactive viewing experiences by detecting on-screen text | |
Shin et al. | Visual transcripts: lecture notes from blackboard-style lecture videos | |
US20050081159A1 (en) | User interface for creating viewing and temporally positioning annotations for media content | |
KR20200118894A (ko) | 미리 레코딩된 비디오들에 대한 자동화된 보이스 번역 더빙 | |
JP6217645B2 (ja) | 情報処理装置、再生状態制御方法及びプログラム | |
US20200126583A1 (en) | Discovering highlights in transcribed source material for rapid multimedia production | |
US20230071845A1 (en) | Interactive viewing experiences by detecting on-screen text | |
CN101950578A (zh) | 一种视频信息添加方法及装置、视频信息显示方法及装置 | |
CN109348145B (zh) | 基于字幕生成关联弹幕的方法及设备、计算机可读介质 | |
CN103488661A (zh) | 音视频文件注释系统 | |
US11190471B2 (en) | Methods, systems, and media for identifying and presenting video objects linked to a source video | |
CN102572601B (zh) | 一种视频信息显示方法及装置 | |
KR102414993B1 (ko) | 연관 정보 제공 방법 및 시스템 | |
US20230254350A1 (en) | Methods, systems, and media for presenting user comments containing timed references in synchronization with a media content item | |
US20240087557A1 (en) | Generating dubbed audio from a video-based source | |
EP2979227B1 (en) | Interactive viewing experiences by detecting on-screen text | |
CN114339414A (zh) | 直播交互方法、装置、存储介质、电子设备 | |
KR20100014031A (ko) | 멀티미디어 파일에서 원하는 부분만 쉽고 빠르게 정확히추출하여 u-컨텐츠 만드는 장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160816 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170519 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6150405 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |