JP7700951B2 - 画像変換装置、方法およびプログラム - Google Patents
画像変換装置、方法およびプログラム Download PDFInfo
- Publication number
- JP7700951B2 JP7700951B2 JP2024502365A JP2024502365A JP7700951B2 JP 7700951 B2 JP7700951 B2 JP 7700951B2 JP 2024502365 A JP2024502365 A JP 2024502365A JP 2024502365 A JP2024502365 A JP 2024502365A JP 7700951 B2 JP7700951 B2 JP 7700951B2
- Authority
- JP
- Japan
- Prior art keywords
- face
- image
- facial
- converted
- facial expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
Description
以下、図面を参照して、この発明に係わる一実施形態を説明する。
(構成例)
図1は、この発明の一実施形態に係る画像変換装置の構成の一例を示すブロック図である。
図1に示される例では、この発明の一実施形態に係る画像変換装置100は、画像取得部11、特徴点認識部12、顔角度算出部13、表示割合算出部14、変換表情入力部15、変化量格納部16、変化量補正部17、表情変換部18、及び画像出力部19を有する。
また、変化量補正部17は、変換表情入力部15から入力された変換表情で示される変換したい先の表情に応じた変化量を変化量格納部16から読み出す。
変化量補正部17は、これら入力した特徴点、顔角度、及び表示割合に基づいて、変換したい先の表情における変化量を後述する式によって補正した変化量を算出し、この算出した変化量のデータを表情変換部18に出力する。
画像変換装置100は、例えば、パーソナルコンピュータ(Personal computer)、スマートホン(smart phone)、サーバコンピュータ(server computer)、などのコンピュータにより構成される。画像変換装置100は、図2に示すように、CPU(Central Processing Unit)等のハードウェアプロセッサ(hardware processor)(単にプロセッサと称することがある)111Aを有する。なお、CPUは、マルチコア(multi-core)及びマルチスレッド(multithread)のものを用いることで、同時に複数の情報処理を実行することができる。また、プロセッサ111Aは、複数のCPUを備えていても良い。そして、画像変換装置100では、このプロセッサ111Aに対し、プログラムメモリ(program memory)111Bと、データメモリ(data memory)112と、通信インタフェース114と、入出力インタフェース113とが、バス(bus)115を介して接続される。
データメモリ112には、上記の変化量格納部16に格納される変換量が格納され得る。
また、データメモリ112には、プロセッサ111Aが動作途中で発生する種々の中間データが記憶され得る。
次に、画像変換装置100の動作を説明する。
図6は、画像変換装置100による画像変換処理動作の一例を示すフローチャートである。画像変換装置100のプロセッサ111Aは、プログラムメモリ111Bに記憶された画像変換プログラムを読み出して実行することで、このフローチャートに示す画像変換装置100としての動作を開始する。プロセッサ111Aでの画像変換プログラムの実行は、入力デバイス200から、入出力インタフェース113を介して、あるいは、通信インタフェース114を介して、画像変換の実施を指示されることで開始される。
具体的には、プロセッサ111Aは、顔が正面に向いているときの顔パーツの特徴点の3次元位置(P_3d)を予め計測して、これをデータメモリ112に保持する。
プロセッサ111Aは、顔画像の顔パーツの現在の特徴点の2次元位置(P’_2d)を取得する。
プロセッサ111Aは、上記3次元位置(P_3d)を回転または移動したときの顔パーツの特徴点の2次元位置(P_2d)を算出する。
プロセッサ111Aは、例えばopencvのProjectPoints2関数(例えばhttp://opencv.jp/opencv-2svn/py/camera_calibration_and_3d_reconstruction.html#projectpoints2を参照)などを利用して、上記各2次元位置を算出する。
プロセッサ111Aは、この二乗和Dを最小化するような角度(および移動量)を大域的最適化(global optimization)により求める。
「Joseph Redmon, et al., “YOLOv3: An Incremental Improvement”, arXiv preprint, arXiv:1804.02767, 2018.」
プロセッサ111Aは、上記分割した各grid cellに対して、B個の物体のBounding Boxを推定する。プロセッサ111Aは、1つのBounding Boxにつき、Bounding Boxの座標値、幅、高さ(x, y, w, h)と、そのBounding Boxが物体である信頼度(confidence)スコアでなる、計5つの値を出力する(図8の(b)参照)。
ΔPnew=ΔP・(1-H)・a/А …式(1)
式(1)の左辺ΔPnewは、表情変換の減衰させた、すなわち補正後の変化量であり、右辺のΔPは表情変換の補正前の変化量である。
なお、この例に限らず、例えば、許容される精度の範囲内で、(1)正面からの顔の角度aおよび認識ができる限界の顔の角度Aとの比率a/Аと、(2)顔全体の領域に対する顔が隠れている領域の割合Hと、の一方に基づいて補正後の変化量が算出されてもよい。
従って、一実施形態に係る画像変換装置100は、顔の角度が変わったり、顔の一部が隠れたりすることにより、特徴点の認識ができなかったとしても、自然でないタイミングで表情変換が止まることが無くなり、顔画像の表情を自然に変換することができる。
なお、この発明は上記一実施形態に限定されるものではない。
例えば、以上で説明した各処理の流れは、説明した手順に限定されるものではなく、いくつかのステップの順序が入れ替えられても良いし、いくつかのステップが同時並行で実施されても良い。
11…画像取得部
12…特徴点認識部
13…顔角度算出部
14…表示割合算出部
15…変換表情入力部
16…変化量格納部
17…変化量補正部
18…表情変換部
19…画像出力部
111A…プロセッサ
111B…プログラムメモリ
112…データメモリ
113…入出力インタフェース
114…通信インタフェース
115…バス
200…入力デバイス
300…出力デバイス
Claims (6)
- 人の顔が含まれる画像から認識された顔パーツの特徴点を認識する特徴点認識部と、
前記画像における顔が正面から認識できなくなる限界の角度に対する、正面からの前記顔の角度の比率と、前記顔の全体の領域に対する前記顔が物体で隠れている領域が除かれた領域の割合に基づいて、前記認識された顔の表情を変換するべき変換表情に変換するときの、前記変換表情に応じた前記顔パーツの特徴点のそれぞれについての変形量を表す変化量を補正する変化量補正部と、
前記補正した変化量により前記特徴点を変形することで前記人の顔の表情を変換した変換画像を得る表情変換部と、
を具備する、画像変換装置。 - 前記変化量補正部は、
前記画像における顔が正面から認識できなくなる限界の角度に対する、正面からの前記顔の角度の比率と、前記顔の全体の面積に対する前記顔が物体で隠れている面積を除いた面積の割合を、前記顔パーツの特徴点のそれぞれについての所定の変化量に乗じることで、前記変化量を補正する、
請求項1に記載の画像変換装置。 - 前記顔が正面を向いているときの前記顔パーツの特徴点の3次元位置を回転または移動したときの前記顔パーツの特徴点の2次元位置を算出し、前記算出した2次元位置と、現在の前記顔パーツの特徴点の2次元位置との距離の二乗和が最小になる角度を前記正面からの前記顔の角度として算出する、
請求項1に記載の画像変換装置。 - 前記変換するべき変換表情ごとに、前記特徴点それぞれについての変形量を表す変化量が予め記憶される記憶装置と、
前記変換するべき変換表情を入力する変換表情入力部と、
を更に具備し、
前記変化量補正部は、
前記入力された変換表情に応じた前記変化量を前記記憶装置から読み出し、この読み出した変化量を補正する、
請求項1乃至3の何れか1項に記載の画像変換装置。 - 人の顔の画像における表情を変換する画像変換装置により行われる方法であって、
前記画像変換装置の特徴点認識部により、人の顔が含まれる画像から認識された顔パーツの特徴点を認識することと、
前記画像変換装置の変化量補正部により、前記画像における顔が正面から認識できなくなる限界の角度に対する、正面からの前記顔の角度の比率と、前記顔の全体の領域に対する前記顔が物体で隠れている領域が除かれた領域の割合に基づいて、前記認識された顔の表情を変換するべき変換表情に変換するときの、前記変換表情に応じた前記顔パーツの特徴点のそれぞれについての変形量を表す変化量を補正することと、
前記画像変換装置の表情変換部により、前記補正した変化量により前記特徴点を変形することで前記人の顔の表情を変換した変換画像を得ることと、
を具備する画像変換方法。 - 請求項1乃至4のいずれか1項に記載の画像変換装置の各部としてプロセッサを機能させる画像変換処理プログラム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2022/007870 WO2023162132A1 (ja) | 2022-02-25 | 2022-02-25 | 画像変換装置、方法およびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2023162132A1 JPWO2023162132A1 (ja) | 2023-08-31 |
| JP7700951B2 true JP7700951B2 (ja) | 2025-07-01 |
Family
ID=87765082
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024502365A Active JP7700951B2 (ja) | 2022-02-25 | 2022-02-25 | 画像変換装置、方法およびプログラム |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7700951B2 (ja) |
| WO (1) | WO2023162132A1 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2025203464A1 (ja) * | 2024-03-28 | 2025-10-02 | Ntt株式会社 | 画像処理装置、およびプログラム |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005215763A (ja) | 2004-01-27 | 2005-08-11 | Konica Minolta Photo Imaging Inc | 画像処理方法、画像処理装置及びプログラム |
| JP2011060038A (ja) | 2009-09-10 | 2011-03-24 | Seiko Epson Corp | 画像処理装置 |
| CN112766063A (zh) | 2020-12-31 | 2021-05-07 | 沈阳康泰电子科技股份有限公司 | 基于位移补偿的微表情拟合方法和系统 |
| JP2021077376A (ja) | 2019-11-07 | 2021-05-20 | ハイパーコネクト インコーポレイテッド | 画像変換装置及び方法、並びにコンピュータ読み取り可能な記録媒体 |
-
2022
- 2022-02-25 JP JP2024502365A patent/JP7700951B2/ja active Active
- 2022-02-25 WO PCT/JP2022/007870 patent/WO2023162132A1/ja not_active Ceased
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005215763A (ja) | 2004-01-27 | 2005-08-11 | Konica Minolta Photo Imaging Inc | 画像処理方法、画像処理装置及びプログラム |
| JP2011060038A (ja) | 2009-09-10 | 2011-03-24 | Seiko Epson Corp | 画像処理装置 |
| JP2021077376A (ja) | 2019-11-07 | 2021-05-20 | ハイパーコネクト インコーポレイテッド | 画像変換装置及び方法、並びにコンピュータ読み取り可能な記録媒体 |
| CN112766063A (zh) | 2020-12-31 | 2021-05-07 | 沈阳康泰电子科技股份有限公司 | 基于位移补偿的微表情拟合方法和系统 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2023162132A1 (ja) | 2023-08-31 |
| WO2023162132A1 (ja) | 2023-08-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11915514B2 (en) | Method and apparatus for detecting facial key points, computer device, and storage medium | |
| JP6798183B2 (ja) | 画像解析装置、画像解析方法およびプログラム | |
| US9443325B2 (en) | Image processing apparatus, image processing method, and computer program | |
| CN109241810B (zh) | 虚拟角色图像的构建方法及装置、存储介质 | |
| KR102344373B1 (ko) | 특징맵 생성방법 및 특징맵 생성장치 | |
| JP7149124B2 (ja) | 画像オブジェクト抽出装置及びプログラム | |
| CN114830177A (zh) | 电子设备和用于控制该电子设备的方法 | |
| WO2021098545A1 (zh) | 一种姿势确定方法、装置、设备、存储介质、芯片及产品 | |
| CN115471863A (zh) | 三维姿态的获取方法、模型训练方法和相关设备 | |
| CN112464860A (zh) | 手势识别方法、装置、计算机设备及存储介质 | |
| KR20240159462A (ko) | 쿼리 이미지 내의 타겟 객체의 자세를 결정하는 방법 및 그 방법을 수행하는 전자 장치 | |
| JP7700951B2 (ja) | 画像変換装置、方法およびプログラム | |
| CN110287764A (zh) | 姿势预测方法、装置、计算机设备和存储介质 | |
| JP2023079211A (ja) | イメージ処理装置及び方法 | |
| KR20230078502A (ko) | 이미지 처리 장치 및 방법 | |
| KR102593247B1 (ko) | 컴퓨터 단층 촬영의 기하 보정 방법 및 기하 보정 장치 | |
| US20250118102A1 (en) | Query deformation for landmark annotation correction | |
| CN116758205B (zh) | 数据处理方法、装置、设备及介质 | |
| US20250218222A1 (en) | Systems and methods for automatic hand gesture recognition | |
| JP2017122993A (ja) | 画像処理装置、画像処理方法及びプログラム | |
| CN113643348B (zh) | 一种人脸属性分析方法及装置 | |
| JP7704288B2 (ja) | 画像変換装置、画像変換方法及び画像変換プログラム | |
| US20250118025A1 (en) | Flexible 3d landmark detection | |
| CN116403269B (zh) | 一种遮挡人脸解析方法、系统、设备及计算机存储介质 | |
| US20250095190A1 (en) | Method, computing device, and recording medium for detecting object in real time based on lidar point cloud |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240604 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250212 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250409 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250520 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250602 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7700951 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |