JP2012074961A - Video shooting device and method of adding captions to audio - Google Patents
Video shooting device and method of adding captions to audio Download PDFInfo
- Publication number
- JP2012074961A JP2012074961A JP2010218946A JP2010218946A JP2012074961A JP 2012074961 A JP2012074961 A JP 2012074961A JP 2010218946 A JP2010218946 A JP 2010218946A JP 2010218946 A JP2010218946 A JP 2010218946A JP 2012074961 A JP2012074961 A JP 2012074961A
- Authority
- JP
- Japan
- Prior art keywords
- text
- data
- moving image
- text data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
Abstract
Description
本発明は、動画撮影装置、音声字幕化方法に関する。 The present invention relates to a moving image photographing apparatus and an audio subtitle conversion method.
テレビなどでは、よく出演者のコメントなどが字幕として表示される。 On TV and the like, comments of performers are often displayed as subtitles.
しかし、一般ユーザが、デジタルカメラ、携帯電話機などの動画撮影機能が搭載された動画撮影装置で撮影した動画に字幕を合成するためには、パソコンなどを使用して字幕を追加する必要があり、非常に煩わしい作業が必要であった。 However, in order for a general user to add subtitles to a video shot by a video shooting device equipped with a video shooting function such as a digital camera or a mobile phone, it is necessary to add subtitles using a personal computer or the like. Very troublesome work was necessary.
そこで、最近は、動画撮影装置において、動画撮影時に集音した音声データをテキストデータに変換し、変換したテキストデータを字幕として動画データに合成する技術が提案されている(例えば、特許文献1,2,3)。 Therefore, recently, a technique for converting audio data collected during moving image shooting into text data in a moving image shooting apparatus and synthesizing the converted text data as moving image data has been proposed (for example, Patent Document 1). 2, 3).
しかし、特許文献1,2,3に記載の技術では、音声データが日本語であるか、その他の言語であるかを特に言及しておらず、そのために、英語で話している人の音声データはそのまま英語のテキストデータに変換されると考えられる。 However, the techniques described in Patent Literatures 1, 2, and 3 do not particularly mention whether the voice data is in Japanese or another language, and therefore, voice data of a person who speaks in English. Is considered to be converted into English text data.
そうすると、英語が苦手なユーザにとっては、せっかく音声データを字幕化しても、字幕の内容がわからず、非常に不便であるという問題がある。したがって、ユーザ所望の言語で音声を字幕化できれば、便宜が良いと考えられる。 Then, for users who are not good at English, there is a problem that even if the audio data is converted into subtitles, the contents of the subtitles are not understood and it is very inconvenient. Therefore, it is considered convenient if the audio can be captioned in the language desired by the user.
そこで、本発明の目的は、上述した課題を解決し、ユーザ所望の言語で音声を字幕化することができる動画撮影装置、音声字幕化方法を提供することにある。 Accordingly, an object of the present invention is to solve the above-described problems and provide a moving image shooting apparatus and a voice captioning method capable of captioning voice in a user-desired language.
本発明の動画撮影装置は、
被写体を動画で撮影するカメラ部と、
前記カメラ部による動画の撮影時における被写体周辺の音声を集音するマイクと、
前記マイクにより集音された音声の音声データをテキストデータに変換する音声テキスト化部と、
前記音声テキスト化部により変換されたテキストデータのうち所定の言語以外の他言語のテキストデータを、前記所定の言語のテキストデータに翻訳するテキスト翻訳部と、
前記音声テキスト化部により変換された前記所定の言語のテキストデータおよび前記テキスト翻訳部により翻訳された前記所定の言語のテキストデータを、前記カメラ部により撮影された動画の動画データに字幕として合成する動画テキスト合成部と、を有する。
The moving image photographing apparatus of the present invention is
A camera unit that shoots the subject as a movie,
A microphone that collects sound around the subject at the time of shooting a video by the camera unit;
A voice text converting unit that converts voice data of voice collected by the microphone into text data;
A text translation unit that translates text data of a language other than a predetermined language out of the text data converted by the speech text unit into the text data of the predetermined language;
The text data of the predetermined language converted by the voice text unit and the text data of the predetermined language translated by the text translation unit are combined as subtitles with the moving image data of the video shot by the camera unit. A moving image text composition unit.
本発明の音声字幕化方法は、
動画撮影装置による音声字幕化方法であって、
被写体を動画で撮影するステップと、
前記動画の撮影時における被写体周辺の音声を集音するステップと、
前記集音された音声の音声データをテキストデータに変換するステップと、
前記変換されたテキストデータのうち所定の言語以外の他言語のテキストデータを、前記所定の言語のテキストデータに翻訳するステップと、
前記変換された前記所定の言語のテキストデータおよび前記翻訳された前記所定の言語のテキストデータを、前記撮影された動画の動画データに字幕として合成するステップと、を有する。
The audio subtitle conversion method of the present invention
An audio subtitle method by a video shooting device,
Shooting a subject with a video,
Collecting sound around the subject at the time of shooting the video;
Converting voice data of the collected voice into text data;
Translating text data of a language other than a predetermined language out of the converted text data into text data of the predetermined language;
Synthesizing the converted text data in the predetermined language and the translated text data in the predetermined language as subtitles with the moving image data of the captured moving image.
本発明は以上のように構成されているため、ユーザは、所望の言語で音声を字幕化することができるという効果が得られる。 Since the present invention is configured as described above, it is possible to obtain an effect that the user can convert audio into a desired language.
以下に、本発明を実施するための形態について図面を参照して説明する。
(1)第1の実施形態
図1は、本発明の第1の実施形態の動画撮影装置の構成を示すブロック図である。
EMBODIMENT OF THE INVENTION Below, the form for implementing this invention is demonstrated with reference to drawings.
(1) First Embodiment FIG. 1 is a block diagram illustrating a configuration of a moving image shooting apparatus according to a first embodiment of the present invention.
図1に示すように、本実施形態の動画撮影装置は、制御部101と、操作部102と、動画撮影部103と、記憶部106と、音声テキスト化部107と、テキスト翻訳部108と、テキスト編集部109と、動画テキスト合成部110と、ディスプレイ111と、スピーカ112と、を有している。
As shown in FIG. 1, the moving image shooting apparatus of the present embodiment includes a
制御部101は、本動画撮影装置内の構成要素を制御して各種の処理を実行する。
The
操作部102は、ユーザによる各種の操作が行われる。
The
動画撮影部103は、カメラ部104およびマイク105を含む。
The moving
カメラ部104は、被写体を動画で撮影する。
The
マイク105は、カメラ部104による動画撮影時に、被写体周辺の音声を集音する。
The
記憶部106は、各種のデータが格納される。
The
音声テキスト化部107は、マイク105により集音された音声の音声データを音声認識してテキストデータに変換する。
The voice
テキスト翻訳部108は、音声テキスト化部107により変換されたテキストデータのうち所定の言語(例えば、日本語)以外の他言語(例えば、英語)のテキストデータを、所定の言語のテキストデータに翻訳する。
The
テキスト編集部109は、音声テキスト化部107により変換された所定の言語のテキストデータおよびテキスト翻訳部108により翻訳された所定の言語のテキストデータを編集する。
The
動画テキスト合成部110は、音声テキスト化部107により変換された所定の言語のテキストデータおよびテキスト翻訳部108により翻訳された所定の言語のテキストデータを、カメラ部104により撮影された動画の動画データに字幕として合成する。
The moving image
なお、動画テキスト合成部110は、テキスト編集部109によりテキストデータの編集が行われていた場合は、編集後のテキストデータを動画データに合成する。
If the
ディスプレイ111は、カメラ部104により撮影された動画データおよびその動画データに字幕として合成された所定の言語のテキストデータを表示する表示部である。
The
スピーカ112は、マイク105により集音された音声の音声データを音声出力する。
The
以下、本実施形態の動画撮影装置の動作について説明する。以下では、ユーザにより操作部102を介して、所定の言語が日本語に設定されているものとして説明する。
Hereinafter, the operation of the moving image shooting apparatus of the present embodiment will be described. In the following description, it is assumed that the predetermined language is set to Japanese via the
まず、動画撮影時の動作について、図2を参照して説明する。 First, the operation at the time of moving image shooting will be described with reference to FIG.
図2に示すように、動画撮影部103は、動画撮影を開始すると(ステップA101)、記憶部106に対して、「同期データ(撮影開始からの経過時間等の、同期を取るのに必要なデータ。以下、同じ)」がそれぞれ付加された「動画データ(カメラ部104により撮影された動画のデータ。以下、同じ)」および「音声データ(マイク105により動画撮影時に集音された音声のデータ。以下、同じ)」の書き込み依頼を行い(ステップA102)、記憶部106は、「同期データ」がそれぞれ付加された「動画データ」および「音声データ」を書き込む(ステップA103)。
As shown in FIG. 2, when the moving
動画撮影部103は、動画撮影を終了すると(ステップA104)、その旨を音声テキスト化部107に通知する(ステップA105)。
When the moving
音声テキスト化部107は、動画撮影部103から撮影終了の通知を受けると、記憶部106に対して、「同期データ」が付加された「音声データ」の読み出し依頼を行い(ステップA106)、記憶部106は、「同期データ」が付加された「音声データ」を読み出し、音声テキスト化部107に引き渡す(ステップA107)。
When receiving the notification of the end of shooting from the moving
音声テキスト化部107は、記憶部106から「同期データ」が付加された「音声データ」が引き渡されると、「音声データ」を音声認識して「テキストデータ」に変換し(ステップA108)、「同期データ」が付加された「テキストデータ」をテキスト翻訳部108に引き渡す(ステップA109)。なお、音声データを音声認識してテキストデータに変換する技術はすでに幾つか知られており、そのいずれもが本実施形態では使用可能である。
When the “speech data” to which “synchronization data” is added is delivered from the
テキスト翻訳部108は、音声テキスト化部107から「同期データ」が付加された「テキストデータ」が引き渡されると、「テキストデータ」の中で日本語以外の他言語で記述された部分を、日本語へ翻訳する(ステップA110)。なお、翻訳技術はすでに幾つか知られており、そのいずれもが本実施形態では使用可能である。
When the “text data” to which “synchronization data” is added is delivered from the speech
このとき、「テキストデータ」の中の他言語を全て日本語に翻訳する必要はなく、例えば、「テキストデータ」を、文単位で区切り、区切った文中に日本語が全く含まれていない場合(すなわち、その文が全て日本語以外の他言語で構成されている場合)に、その文を“日本語以外の他言語で記述された部分”として扱い、その文のみを日本語へ翻訳すればよい。なお、テキストデータを文単位で区切る技術はすでに幾つか知られており、そのいずれもが本実施形態では使用可能である。 At this time, it is not necessary to translate all other languages in the “text data” into Japanese. For example, when “text data” is delimited in sentence units, and the delimited sentence does not contain Japanese at all ( That is, if the sentence is composed entirely of a language other than Japanese), treat the sentence as “a part written in a language other than Japanese” and translate only that sentence into Japanese. Good. Several techniques for dividing text data into sentences are already known, and any of them can be used in the present embodiment.
そして、テキスト翻訳部108は、記憶部106に対して、「同期データ」が付加された翻訳後の「テキストデータ」の書き込み依頼を行い(ステップA111)、記憶部106は、「同期データ」が付加された翻訳後の「テキストデータ」を書き込み(ステップA112)、処理を終了する。このとき、テキスト翻訳部108は、「テキストデータ」のうち翻訳を行わなかった部分については、音声テキスト化部107から引き渡されたものをそのまま記憶部106に引き渡す。
Then, the
次に、テキストデータの編集時の動作について、図3を参照して説明する。 Next, the operation at the time of editing text data will be described with reference to FIG.
図3に示すように、テキスト編集部109は、記憶部106に格納された「テキストデータ」を編集する場合、記憶部106に対して、「同期データ」が付加された「テキストデータ」の読み出し依頼を行い(ステップB101)、記憶部106は、「同期データ」が付加された「テキストデータ」を読み出し、テキスト編集部109に引き渡す(ステップB102)。
As shown in FIG. 3, when editing the “text data” stored in the
テキスト編集部109は、記憶部106から「同期データ」が付加された「テキストデータ」が引き渡されると、「テキストデータ」を編集し(ステップB103)、記憶部106に対して、「同期データ」が付加された編集後の「テキストデータ」の書き込み依頼を行い(ステップB104)、記憶部106は、「同期データ」が付加された編集後の「テキストデータ」を書き込み(ステップB105)、処理を終了する。
When the “text data” to which “synchronization data” is added is delivered from the
次に、動画再生時の動作について、図4を参照して説明する。 Next, the operation at the time of moving image reproduction will be described with reference to FIG.
図4に示すように、動画テキスト合成部110は、動画を再生する場合、記憶部106に対して、「同期データ」がそれぞれ付加された「音声データ」、「動画データ」、および「テキストデータ」の読み出し依頼を行い(ステップC101)、記憶部106は、「同期データ」がそれぞれ付加された「音声データ」、「動画データ」、および「テキストデータ」を読み出し、動画テキスト合成部110に引き渡す(ステップC102)。
As shown in FIG. 4, when reproducing a moving image, the moving image
動画テキスト合成部110は、記憶部106から「同期データ」がそれぞれ付加された「音声データ」、「動画データ」、および「テキストデータ」が引き渡されると、「同期データ」を基に、「テキストデータ」を字幕として「動画データ」に合成して「字幕付き動画データ」を生成し、「字幕付き動画データ」をディスプレイ111に表示するとともに、「同期データ」を基に、「音声データ」を、「字幕付き動画データ」と同期させて、スピーカ112から音声出力する(ステップC103)。
When the “speech data”, “moving image data”, and “text data” to which “synchronization data” has been added are delivered from the
なお、動画テキスト合成部110は、「字幕付き動画データ」を記憶部106に格納する場合は、記憶部106に対して、「同期データ」が付加された「字幕付き動画データ」の書き込み依頼を行い(ステップC104)、記憶部106は、「同期データ」が付加された「字幕付き動画データ」を書き込み(ステップC105)、処理を終了する。
(2)第2の実施形態
本実施形態の動画撮影装置は、第1の実施形態と比較して、構成自体は同様であるが、動作が異なる。
In addition, when storing the “moving image data with subtitles” in the
(2) Second Embodiment The moving image capturing apparatus according to the present embodiment is similar in structure to the first embodiment but operates differently.
すなわち、第1の実施形態においては、動画再生時に、音声データをテキスト化した字幕をディスプレイ111に表示していたのに対して、本実施形態においては、動画撮影時に、音声データをテキスト化した字幕をディスプレイ111のプレビュー画面に表示する。
That is, in the first embodiment, the subtitles in which the audio data is converted into text are displayed on the
以下、本実施形態の動画撮影装置の動画撮影時の動作について、図5を参照して説明する。以下では、ユーザにより操作部102を介して、所定の言語が日本語に設定されているものとして説明する。
Hereinafter, the operation at the time of moving image shooting of the moving image shooting apparatus of the present embodiment will be described with reference to FIG. In the following description, it is assumed that the predetermined language is set to Japanese via the
図5に示すように、動画撮影部103は、動画撮影を開始すると(ステップD101)、記憶部106に対して、「同期データ」がそれぞれ付加された「動画データ」および「音声データ」の書き込み依頼を行い(ステップD102)、記憶部106は、「同期データ」がそれぞれ付加された「動画データ」および「音声データ」を書き込む(ステップD103)。
As shown in FIG. 5, when the moving
また、動画撮影部103は、記憶部106に対して上記の書き込み依頼を行うと同時に、「同期データ」が付加された「音声データ」を、音声テキスト化部107に引き渡す(ステップD104)。
In addition, the moving
音声テキスト化部107は、動画撮影部103から「同期データ」が付加された「音声データ」が引き渡されると、「音声データ」を「テキストデータ」に変換し(ステップD105)、「同期データ」が付加された「テキストデータ」をテキスト翻訳部108に引き渡す(ステップD106)。
When the “speech data” to which “synchronization data” is added is delivered from the moving
テキスト翻訳部108は、音声テキスト化部107から「同期データ」が付加された「テキストデータ」が引き渡されると、「テキストデータ」の中で日本語以外の他言語で記述された部分を、日本語へ翻訳し(ステップD107)、翻訳後の「テキストデータ」を動画テキスト合成部110に引き渡す(ステップD108)。このとき、テキスト翻訳部108は、「テキストデータ」のうち翻訳を行わなかった部分については、音声テキスト化部107から引き渡されたものをそのまま動画テキスト合成部110に引き渡す。
When the “text data” to which “synchronization data” is added is delivered from the speech
動画テキスト合成部110は、テキスト翻訳部108から「テキストデータ」が引き渡されると、「テキストデータ」を字幕として「動画データ」に合成し、ディスプレイ111のプレビュー画面に表示する(ステップD109)。このとき、「音声データ」は、動画テキスト合成部110を経由せずに、スピーカ112から音声出力されることになる。
When the “text data” is delivered from the
また、テキスト翻訳部108は、動画テキスト合成部110に対して翻訳後の「テキストデータ」を引き渡すと同時に、記憶部106に対して、「同期データ」が付加された翻訳後の「テキストデータ」の書き込み依頼を行い(ステップD110)、記憶部106は、「同期データ」が付加された翻訳後の「テキストデータ」を書き込む(ステップD111)。このとき、テキスト翻訳部108は、「テキストデータ」のうち翻訳を行わなかった部分については、音声テキスト化部107から引き渡されたものをそのまま記憶部106に引き渡す。
Further, the
その後、動画撮影部103による動画撮影が終了すると(ステップD112)、処理を終了する。
Thereafter, when the moving image shooting by the moving
なお、本実施形態においては、テキストデータの編集時の動作と動画再生時の動作については、第1の実施形態と同様であるため、説明を省略する(それぞれ図3、図4を参照)。
(3)他の実施形態
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されものでない。本発明の構成や詳細には、本発明の範囲内で当業者が理解し得る様々な変更をすることができる。
In the present embodiment, the operation at the time of editing text data and the operation at the time of reproducing a moving image are the same as those in the first embodiment, and thus description thereof is omitted (see FIGS. 3 and 4 respectively).
(3) Other Embodiments Although the present invention has been described above with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
例えば、第1および第2の実施形態において、動画データおよびテキストデータをディスプレイ111に表示する際には、ディスプレイ111の表示画面全体に動画データを表示し、その動画データ上にテキストデータを重ね合わせて表示してもよい。または、ディスプレイ111の表示画面を2画面に分割し、一方の画面に、動画データを表示し、他方の画面に、テキストデータを表示してもよい。
For example, in the first and second embodiments, when moving image data and text data are displayed on the
また、第1および第2の実施形態において、テキストデータをディスプレイ111に表示する際には、音声テキスト化部107により変換された時点ですでに日本語であったテキストデータと、テキスト翻訳部108により日本語に翻訳されたテキストデータと、を異なる色やフォントで表示してもよい。
In the first and second embodiments, when text data is displayed on the
また、第1および第2の実施形態においては、所定の言語を日本語とし、日本語以外の言語で話している人の音声データを日本語のテキストデータに変換する例を示したが、所定の言語を他の言語とすることも当然に可能である。例えば、所定の言語を英語とした場合は、英語以外の言語で話している人の音声データを英語のテキストデータに変換することができる。 In the first and second embodiments, an example has been described in which the predetermined language is Japanese and the speech data of a person speaking in a language other than Japanese is converted into Japanese text data. Of course, other languages can be used. For example, when the predetermined language is English, voice data of a person speaking in a language other than English can be converted into English text data.
上述したように本発明の動画撮像装置においては、動画撮影時に集音された音声データをテキストデータに変換し、そのテキストデータのうち所定の言語以外の他言語のテキストデータを所定の言語のテキストデータに翻訳した上で、そのテキストデータを動画データに字幕として合成する。 As described above, in the moving image capturing apparatus of the present invention, voice data collected at the time of moving image shooting is converted into text data, and text data in a language other than a predetermined language among the text data is converted into text in a predetermined language. After being translated into data, the text data is combined with moving image data as subtitles.
そのため、音声データのうち所定の言語以外の他言語の音声データは、所定の言語のテキストデータに翻訳された上で動画データに合成される。 Therefore, voice data in a language other than the predetermined language among the voice data is translated into text data in a predetermined language and then synthesized into moving image data.
したがって、ユーザは、所望の言語を上記の所定の言語に設定することにより、所望の言語で音声を字幕化することができるという効果が得られる。 Therefore, the user can set the desired language as the predetermined language, thereby obtaining the effect that the audio can be subtitled in the desired language.
本発明は、動画撮影機能が搭載されたビデオカメラ、デジタルカメラ、携帯電話機、PHS(Personal Handyphone System)、PDA(Personal Digital Assistant)等の動画撮影装置に適用可能である。 The present invention can be applied to a moving image shooting apparatus such as a video camera, a digital camera, a mobile phone, a PHS (Personal Handyphone System), a PDA (Personal Digital Assistant) equipped with a moving image shooting function.
101 制御部
102 操作部
103 動画撮影部
104 カメラ部
105 マイク
106 記憶部
107 音声テキスト化部
108 テキスト翻訳部
109 テキスト編集部
110 動画テキスト合成部
111 ディスプレイ
112 スピーカ
DESCRIPTION OF
Claims (7)
前記カメラ部による動画の撮影時における被写体周辺の音声を集音するマイクと、
前記マイクにより集音された音声の音声データをテキストデータに変換する音声テキスト化部と、
前記音声テキスト化部により変換されたテキストデータのうち所定の言語以外の他言語のテキストデータを、前記所定の言語のテキストデータに翻訳するテキスト翻訳部と、
前記音声テキスト化部により変換された前記所定の言語のテキストデータおよび前記テキスト翻訳部により翻訳された前記所定の言語のテキストデータを、前記カメラ部により撮影された動画の動画データに字幕として合成する動画テキスト合成部と、を有する動画撮影装置。 A camera unit that shoots the subject as a movie,
A microphone that collects sound around the subject at the time of shooting a video by the camera unit;
A voice text converting unit that converts voice data of voice collected by the microphone into text data;
A text translation unit that translates text data of a language other than a predetermined language out of the text data converted by the speech text unit into the text data of the predetermined language;
The text data of the predetermined language converted by the voice text unit and the text data of the predetermined language translated by the text translation unit are combined as subtitles with the moving image data of the video shot by the camera unit. A moving image photographing device comprising: a moving image text synthesizing unit;
前記カメラ部により撮影された動画の再生時に、前記所定の言語のテキストデータを前記動画データに字幕として合成し、前記動画データおよび前記所定の言語のテキストデータを表示する、請求項1に記載の動画撮影装置。 The moving image text synthesis unit
The text data of the predetermined language is synthesized as subtitles with the video data when the video shot by the camera unit is played back, and the video data and the text data of the predetermined language are displayed. Movie shooting device.
前記カメラ部による動画の撮影時に、前記所定の言語のテキストデータを前記動画データに字幕として合成し、前記動画データおよび前記所定の言語のテキストデータをプレビュー画面に表示する、請求項1に記載の動画撮影装置。 The moving image text synthesis unit
The text data of the predetermined language is combined with the video data as subtitles when capturing a video by the camera unit, and the video data and the text data of the predetermined language are displayed on a preview screen. Movie shooting device.
前記動画データおよび前記所定の言語のテキストデータを表示する際、
表示画面を2画面に分割し、
一方の画面に、前記動画データを表示し、
他方の画面に、前記所定の言語のテキストデータを表示する、請求項2または3に記載の動画撮影装置。 The moving image text synthesis unit
When displaying the moving image data and the text data of the predetermined language,
Divide the display screen into two screens,
Display the video data on one screen,
The moving image photographing apparatus according to claim 2 or 3, wherein text data of the predetermined language is displayed on the other screen.
前記動画データおよび前記所定の言語のテキストデータを表示する際、
前記音声テキスト化部により変換された前記所定の言語のテキストデータと、前記翻訳部により翻訳された前記所定の言語のテキストデータと、を異なる色で表示する、請求項2から4のいずれか1項に記載の動画撮影装置。 The moving image text synthesis unit
When displaying the moving image data and the text data of the predetermined language,
The text data of the predetermined language converted by the speech text conversion unit and the text data of the predetermined language translated by the translation unit are displayed in different colors. The moving image photographing device according to the item.
前記動画データおよび前記所定の言語のテキストデータを表示する際、
前記音声テキスト化部により変換された前記所定の言語のテキストデータと、前記翻訳部により翻訳された前記所定の言語のテキストデータと、を異なるフォントで表示する、請求項2から5のいずれか1項に記載の動画撮影装置。 The moving image text synthesis unit
When displaying the moving image data and the text data of the predetermined language,
The text data of the predetermined language converted by the speech text conversion unit and the text data of the predetermined language translated by the translation unit are displayed in different fonts. The moving image photographing device according to the item.
被写体を動画で撮影するステップと、
前記動画の撮影時における被写体周辺の音声を集音するステップと、
前記集音された音声の音声データをテキストデータに変換するステップと、
前記変換されたテキストデータのうち所定の言語以外の他言語のテキストデータを、前記所定の言語のテキストデータに翻訳するステップと、
前記変換された前記所定の言語のテキストデータおよび前記翻訳された前記所定の言語のテキストデータを、前記撮影された動画の動画データに字幕として合成するステップと、を有する音声字幕化方法。 An audio subtitle method by a video shooting device,
Shooting a subject with a video,
Collecting sound around the subject at the time of shooting the video;
Converting voice data of the collected voice into text data;
Translating text data of a language other than a predetermined language out of the converted text data into text data of the predetermined language;
Synthesizing the converted text data of the predetermined language and the translated text data of the predetermined language as subtitles with the video data of the captured moving image.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010218946A JP2012074961A (en) | 2010-09-29 | 2010-09-29 | Video shooting device and method of adding captions to audio |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010218946A JP2012074961A (en) | 2010-09-29 | 2010-09-29 | Video shooting device and method of adding captions to audio |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012074961A true JP2012074961A (en) | 2012-04-12 |
Family
ID=46170706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010218946A Withdrawn JP2012074961A (en) | 2010-09-29 | 2010-09-29 | Video shooting device and method of adding captions to audio |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012074961A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112261489A (en) * | 2020-10-20 | 2021-01-22 | 北京字节跳动网络技术有限公司 | Method, device, terminal and storage medium for generating video |
-
2010
- 2010-09-29 JP JP2010218946A patent/JP2012074961A/en not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112261489A (en) * | 2020-10-20 | 2021-01-22 | 北京字节跳动网络技术有限公司 | Method, device, terminal and storage medium for generating video |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010219692A (en) | Image capturing apparatus and camera | |
JP4777180B2 (en) | Imaging apparatus and control method thereof | |
JP2004201282A (en) | Photographing device and photographing method | |
JP2007027990A (en) | Apparatus and method, and program for generating caption from moving picture data, and storage medium | |
JP2012109901A (en) | Data presentation device | |
JP2008199671A (en) | Imaging device and program | |
WO2013024704A1 (en) | Image-processing device, method, and program | |
JP2012100216A (en) | Camera and moving image capturing program | |
JP2016091057A (en) | Electronic device | |
JP4696921B2 (en) | Image processing apparatus, still image generation method, program, and storage medium | |
JP5604916B2 (en) | Image processing apparatus and program | |
JP2008160232A (en) | Video audio reproducing apparatus | |
JP2007228453A (en) | Imaging apparatus, reproduction device, program, and storage medium | |
JP2007026090A (en) | Video preparation device | |
JP4595832B2 (en) | Imaging apparatus, program, and storage medium | |
JP2012074961A (en) | Video shooting device and method of adding captions to audio | |
JP2008160620A (en) | Image processing apparatus and imaging apparatus | |
KR100775187B1 (en) | Thumbnail recording method and terminal using the same | |
JP4599630B2 (en) | Video data processing apparatus with audio, video data processing method with audio, and video data processing program with audio | |
JP2012105234A (en) | Subtitle generation and distribution system, subtitle generation and distribution method, and program | |
JP2007266661A (en) | Imaging apparatus, information processor, and imaging display system | |
JP2003348410A (en) | Camera for permitting voice input | |
JP2008228014A (en) | Video conference system, conference video processing method, program and recording medium | |
JP2004120279A (en) | Device and method for editing moving image text, and editing program | |
KR20130101707A (en) | Photographing apparatus, electronic apparatus, method for generation of video, and method for display of thumbnail |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130814 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20140407 |