JP6528484B2 - 画像処理装置、アニメーション生成方法及びプログラム - Google Patents
画像処理装置、アニメーション生成方法及びプログラム Download PDFInfo
- Publication number
- JP6528484B2 JP6528484B2 JP2015054396A JP2015054396A JP6528484B2 JP 6528484 B2 JP6528484 B2 JP 6528484B2 JP 2015054396 A JP2015054396 A JP 2015054396A JP 2015054396 A JP2015054396 A JP 2015054396A JP 6528484 B2 JP6528484 B2 JP 6528484B2
- Authority
- JP
- Japan
- Prior art keywords
- volume
- start volume
- word
- data
- predetermined threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Description
このような状況に対応するため、従来は、アニメーションを生成する作業者が音声データを耳で聞きながら、オーディオ編集ソフトウェアを用いて、手動で音量を調整していた。具体的には、音声データの単語の最初の部分の音量を上げることで、この最初の部分で確実に口が開くようにしている。この音量調整作業は、クリッピング(音割れ)等に気を配る必要があるため、一定のスキルを必要とする。
音声データから開始音量を検出する開始音量検出手段と、
前記検出された開始音量と所定の閾値とを比較する比較手段と、
前記比較手段により比較された前記開始音量が前記所定の閾値よりも小さい場合、前記音声データの前記開始音量に対応する音声部分の口の開き量が、前記開始音量に対応する口の開き量より大きくなるように、前記音声データに応じて顔画像に含まれる口を動かすアニメーションを生成する生成手段と、
を備える。
図1は、本実施の形態に係る画像処理装置10の機能的構成を示すブロック図である。
画像処理装置10は、制御部11と、操作部12と、表示部13と、音声出力部14と、通信部15と、メモリ16と、記憶部17と、を備え、各部はバス18を介して接続されている。画像処理装置10は、映像加工が可能な演算装置であり、パーソナルコンピュータやワークステーション等により構成される。
音声データAは、人が発した音声を録音して得られたデータであり、リップシンクさせたいキャラクターの音声として用いられる。音声データAとしては、音声以外の音(ノイズ、BGM等)が含まれていないものを想定している。
顔画像データBは、リップシンクさせたいキャラクターの顔を含む画像のデータであり、2次元の静止画データ、又は、3次元のポリゴンデータを想定している。
具体的には、制御部11は、開始音量が所定の閾値より小さい場合に、音声データAの開始音量に対応する音声部分の口の開き量を、開始音量に対応する口の開き量より大きくする。
更に、制御部11は、開始音量が所定の閾値より小さい場合に、音声データAの開始音量に対応する音声部分の口の開き量を、所定の閾値以上の音量に対応する口の開き量に変更することとしてもよい。
次に、画像処理装置10の動作について説明する。
図2は、画像処理装置10において実行されるアニメーション生成処理を示すフローチャートである。アニメーション生成処理は、操作部12によりアニメーションの生成に使用する音声データA及び顔画像データBが指定され、アニメーションの生成が指示された際に行われる処理であって、制御部11と記憶部17に記憶されているアニメーション生成プログラムPとの協働によるソフトウェア処理によって実現される。
なお、拗音(「きょ」等)については、かな2文字で表されるが、拗音を1単位として開始時間及び終了時間を記録することとしてもよい。また、長音(「とー」等)についても、長音を1単位として開始時間及び終了時間を記録することとしてもよい。
また、制御部11は、「経済」という単語の終了時間として、文字管理テーブルT1に記録されている「い」という文字(「経済」の最後の文字)の終了時間を取得する。
リップシンクアニメーションは、音声データAに応じてキャラクターの顔画像に含まれる口を動かす動画を生成する画像処理技術である。例えば、制御部11は、音声データAを解析して母音を取得し、母音に応じた口の形状とするとともに、音量に応じて口の開き量を調整する。
以上で、アニメーション生成処理が終了する。
まず、制御部11は、単語データ群Eに含まれる最初の単語を処理対象に設定する(ステップS11)。
例えば、制御部11は、処理対象単語の開始音量に対応する音声部分の口の開き量を、所定の閾値以上の音量に対応する口の開き量に変更する。
なお、制御部11は、処理対象単語の開始位置以外の音声部分については、通常のリップシンクアニメーションエンジンを利用して口の形状データを生成する。
処理対象単語が単語データ群Eに含まれる最後の単語でない場合には(ステップS16;NO)、制御部11は、単語データ群Eに含まれる次の単語を処理対象に設定し(ステップS17)、ステップS12〜ステップS16の処理を繰り返す。
以上で、リップシンクアニメーション生成処理が終了する。
また、音声データAの言語としては、日本語に限定されるものではなく、外国語であってもよい。
以下に、この出願の願書に最初に添付した特許請求の範囲に記載した発明を付記する。付記に記載した請求項の項番は、この出願の願書に最初に添付した特許請求の範囲の通りである。
〔付記〕
<請求項1>
音声データから開始音量を検出する開始音量検出手段と、
前記検出された開始音量と所定の閾値とを比較する比較手段と、
前記比較手段による比較結果に基づいて、前記音声データに応じて顔画像に含まれる口を動かすアニメーションを生成する生成手段と、
を備える画像処理装置。
<請求項2>
前記生成手段は、前記開始音量が前記所定の閾値より小さい場合に、前記音声データの前記開始音量に対応する音声部分の口の開き量を、前記開始音量に対応する口の開き量より大きくする請求項1に記載の画像処理装置。
<請求項3>
前記生成手段は、前記開始音量が前記所定の閾値より小さい場合に、前記音声データの前記開始音量に対応する音声部分の口の開き量を、前記所定の閾値以上の音量に対応する口の開き量に変更する請求項2に記載の画像処理装置。
<請求項4>
前記音声データから単語を検出する単語検出手段を更に備え、
前記開始音量検出手段は、前記単語検出手段により検出された単語毎に、前記音声データから当該単語の開始音量を検出する請求項1〜3のいずれか一項に記載の画像処理装置。
<請求項5>
音声データから開始音量を検出する開始音量検出工程と、
前記検出された開始音量と所定の閾値とを比較する比較工程と、
前記比較工程における比較結果に基づいて、前記音声データに応じて顔画像に含まれる口を動かすアニメーションを生成する生成工程と、
を含むアニメーション生成方法。
<請求項6>
コンピュータを、
音声データから開始音量を検出する開始音量検出手段、
前記検出された開始音量と所定の閾値とを比較する比較手段、
前記比較手段による比較結果に基づいて、前記音声データに応じて顔画像に含まれる口を動かすアニメーションを生成する生成手段、
として機能させるためのプログラム。
11 制御部
12 操作部
13 表示部
14 音声出力部
15 通信部
16 メモリ
17 記憶部
A 音声データ
B 顔画像データ
C 映像データ
D テキストデータ
E 単語データ群
P アニメーション生成プログラム
T1 文字管理テーブル
T2 単語管理テーブル
Claims (6)
- 音声データから開始音量を検出する開始音量検出手段と、
前記検出された開始音量と所定の閾値とを比較する比較手段と、
前記比較手段により比較された前記開始音量が前記所定の閾値よりも小さい場合、前記音声データの前記開始音量に対応する音声部分の口の開き量が、前記開始音量に対応する口の開き量より大きくなるように、前記音声データに応じて顔画像に含まれる口を動かすアニメーションを生成する生成手段と、
を備える画像処理装置。 - 前記生成手段は、前記開始音量が前記所定の閾値より小さい場合に、前記音声データの前記開始音量に対応する音声部分の口の開き量を、前記所定の閾値以上の音量に対応する口の開き量に変更する請求項1に記載の画像処理装置。
- 前記音声データから単語を検出する単語検出手段を更に備え、
前記開始音量検出手段は、前記単語検出手段により検出された単語毎に、前記音声データから当該単語の開始音量を検出する請求項1又は2に記載の画像処理装置。 - 前記単語検出手段により検出された単語の平均音量に基づいて前記所定の閾値を設定する閾値設定手段を更に備える請求項3に記載の画像処理装置。
- 音声データから開始音量を検出する開始音量検出工程と、
前記検出された開始音量と所定の閾値とを比較する比較工程と、
前記比較工程により比較された前記開始音量が前記所定の閾値よりも小さい場合、前記音声データの前記開始音量に対応する音声部分の口の開き量が、前記開始音量に対応する口の開き量より大きくなるように、前記音声データに応じて顔画像に含まれる口を動かすアニメーションを生成する生成工程と、
を含むアニメーション生成方法。 - コンピュータを、
音声データから開始音量を検出する開始音量検出手段、
前記検出された開始音量と所定の閾値とを比較する比較手段、
前記比較手段により比較された前記開始音量が前記所定の閾値よりも小さい場合、前記音声データの前記開始音量に対応する音声部分の口の開き量が、前記開始音量に対応する口の開き量より大きくなるように、前記音声データに応じて顔画像に含まれる口を動かすアニメーションを生成する生成手段、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015054396A JP6528484B2 (ja) | 2015-03-18 | 2015-03-18 | 画像処理装置、アニメーション生成方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015054396A JP6528484B2 (ja) | 2015-03-18 | 2015-03-18 | 画像処理装置、アニメーション生成方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016173790A JP2016173790A (ja) | 2016-09-29 |
JP2016173790A5 JP2016173790A5 (ja) | 2018-04-19 |
JP6528484B2 true JP6528484B2 (ja) | 2019-06-12 |
Family
ID=57008982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015054396A Active JP6528484B2 (ja) | 2015-03-18 | 2015-03-18 | 画像処理装置、アニメーション生成方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6528484B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109064532B (zh) * | 2018-06-11 | 2024-01-12 | 深圳市卡扑动漫设计有限公司 | 动画角色自动口型生成方法及装置 |
-
2015
- 2015-03-18 JP JP2015054396A patent/JP6528484B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016173790A (ja) | 2016-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8924216B2 (en) | System and method for synchronizing sound and manually transcribed text | |
US10304439B2 (en) | Image processing device, animation display method and computer readable medium | |
US11281707B2 (en) | System, summarization apparatus, summarization system, and method of controlling summarization apparatus, for acquiring summary information | |
JP4930564B2 (ja) | 画像表示装置及び方法並びにプログラム | |
JP2016062196A (ja) | 会議情報蓄積装置、方法およびプログラム | |
JP2005228178A (ja) | 書き起こしテキスト作成支援システムおよびプログラム | |
JP5899743B2 (ja) | 画像表示装置及び画像表示プログラム | |
US8553855B2 (en) | Conference support apparatus and conference support method | |
JP6528484B2 (ja) | 画像処理装置、アニメーション生成方法及びプログラム | |
US20150051911A1 (en) | Method for dividing letter sequences into pronunciation units, method for representing tones of letter sequences using same, and storage medium storing video data representing the tones of letter sequences | |
JP2014067148A (ja) | 手書き文書処理装置、方法およびプログラム | |
US10477136B2 (en) | Display mode determining device, display, display mode determining method, and non-transitory storage medium | |
JP5907231B1 (ja) | 入力情報支援装置、入力情報支援方法および入力情報支援プログラム | |
JP2009260718A (ja) | 画像再生装置及び画像再生処理プログラム | |
JP2013005423A (ja) | 映像再生装置、映像再生方法およびプログラム | |
US20230093165A1 (en) | Information processing apparatus, information processing method, and program | |
JP2024505988A (ja) | シーン説明の再生制御 | |
KR101832464B1 (ko) | 동영상 제공 장치, 동영상 제공 방법, 및 컴퓨터 프로그램 | |
JP6296193B2 (ja) | 入力情報支援装置、入力情報支援方法および入力情報支援プログラム | |
JP6535999B2 (ja) | 言語学習装置、言語学習方法及びプログラム | |
JP6112239B2 (ja) | 入力情報支援装置、入力情報支援方法および入力情報支援プログラム | |
JPWO2016067348A1 (ja) | プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置 | |
JP5993243B2 (ja) | 映像処理装置及びプログラム | |
JP2016119107A (ja) | 入力情報支援装置、入力情報支援方法および入力情報支援プログラム | |
JP2005208163A (ja) | プレゼンテーション支援装置、プレゼンテーション支援方法及び制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180309 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190409 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190429 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6528484 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |