JP2010192956A - 撮像装置および話し手認識方法 - Google Patents
撮像装置および話し手認識方法 Download PDFInfo
- Publication number
- JP2010192956A JP2010192956A JP2009032303A JP2009032303A JP2010192956A JP 2010192956 A JP2010192956 A JP 2010192956A JP 2009032303 A JP2009032303 A JP 2009032303A JP 2009032303 A JP2009032303 A JP 2009032303A JP 2010192956 A JP2010192956 A JP 2010192956A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- image
- person
- features
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】 本発明の撮像装置(11〜32)は、画像解析手段(11)と、音声解析手段(11)と、話し手認識手段(11)を備え、画像解析手段は、連続的に取得される画像から人物の顔領域中の口唇領域を検出すると共に、その口唇領域のデータから口唇動作の特徴を抽出する。また、音声解析手段は、画像と同期して取得される音声データから音声の特徴を抽出する。そして、話し手認識手段は、画像解析手段により抽出された口唇動作の特徴と、音声解析手段により抽出された音声の特徴とに基づき、画像に写る複数の人物から話し手となる人物を認識する。
【選択図】 図1
Description
なお、上記では、デジタルカメラが、認識した話し手(特に、その顔の部分)に合焦させるようにAF動作を行い、また、話し手(特に、その顔の部分)が適正露出となるようにAE動作を行うことを説明した。しかし、それだけでなく、認識した話し手(特に、その顔の部分)を動画撮影中の画角から外れない範囲でズームアップ(拡大)するようにしてもよい。なお、話し手(特に、その顔の部分)のズームアップは、光学系のズーム調節により行ってもよいし、画像処理(解像度変換)による電子ズームにより行っても良い。
以上、本実施形態のデジタルカメラでは、動画撮影時に、連続的に取得され、バッファメモリ13に蓄積された所定時間分の画像データから、被写体(人物)の顔領域中の口唇領域が検出されると共に、その口唇領域のデータから口唇の動き(口唇動作)の特徴が抽出される。
なお、上述したデジタルカメラの動作に係るプログラムのうち、特に、ステップ102〜ステップ104の処理については、コンピュータなどの外部処理装置に実行させてもよい。その場合、必要なプログラムがCD−ROM等のコンピュータ読み取り可能な記憶媒体やインターネット等の通信網などを介して外部処理装置へインストールされる。
Claims (10)
- 連続的に取得される画像から人物の顔領域中の口唇領域を検出すると共に、前記口唇領域のデータから口唇動作の特徴を抽出する画像解析手段と、
前記画像と同期して取得される音声データから音声の特徴を抽出する音声解析手段と、
前記画像解析手段により抽出された口唇動作の特徴と、前記音声解析手段により抽出された音声の特徴とに基づき、前記画像に写る複数の人物から話し手となる人物を認識する話し手認識手段と
を備えることを特徴とする撮像装置。 - 請求項1に記載の撮像装置において、
前記話し手認識手段は、前記口唇動作の特徴と前記音声の特徴とに基づきスコア情報を求め、前記複数の人物のうち前記スコア情報の値が最も高い人物を話し手となる人物として認識する
ことを特徴とする撮像装置。 - 請求項2に記載の撮像装置において、
前記話し手認識手段は、前記口唇動作の特徴から求めた開口のタイミングと、前記音声の特徴から求めたアクセントのタイミングとの一致度を、前記スコア情報として求める
ことを特徴とする撮像装置。 - 請求項1ないし請求項3の何れか一項に記載の撮像装置において、
前記話し手認識手段が認識した話し手となる人物に合焦させるように光学系の焦点調節を行う制御手段を更に備える
ことを特徴とする撮像装置。 - 請求項1ないし請求項4の何れか一項に記載の撮像装置において、
前記制御手段は、前記話し手認識手段が認識した話し手となる人物が適正露出となるように露出条件を決定する
ことを特徴とする撮像装置。 - 請求項1ないし請求項5の何れか一項に記載の撮像装置において、
前記制御手段は、前記話し手認識手段が認識した話し手となる人物の像を拡大させるようにズーム調節を行う
ことを特徴とする撮像装置。 - 請求項1ないし請求項6の何れか一項に記載の撮像装置において、
前記画像を表示する表示手段を有し、
前記制御手段は、前記画像に写る前記話し手認識手段が認識した話し手となる人物の顔の部分に、話し手であることを示す情報を重畳させると共に、その重畳後の画像を前記表示手段に表示させる
ことを特徴とする撮像装置。 - 連続的に取得される画像から人物の顔領域中の口唇領域を検出すると共に、前記口唇領域のデータから口唇動作の特徴を抽出する画像解析手順と、
前記画像と同期して取得される音声データから音声の特徴を抽出する音声解析手順と、
前記画像解析手順により抽出された口唇動作の特徴と、前記音声解析手順により抽出された音声の特徴とに基づき、前記画像に写る複数の人物から話し手となる人物を認識する話し手認識手順と
を備えることを特徴とする話し手認識方法。 - 請求項8に記載の話し手認識方法において、
前記話し手認識手順は、前記口唇動作の特徴と前記音声の特徴とに基づきスコア情報を求め、前記複数の人物のうち前記スコア情報の値が最も高い人物を話し手となる人物として認識する
ことを特徴とする話し手認識方法。 - 請求項9に記載の話し手認識方法において、
前記話し手認識手順は、前記口唇動作の特徴から求めた開口のタイミングと、前記音声の特徴から求めたアクセントのタイミングとの一致度を、前記スコア情報として求める
ことを特徴とする話し手認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009032303A JP2010192956A (ja) | 2009-02-16 | 2009-02-16 | 撮像装置および話し手認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009032303A JP2010192956A (ja) | 2009-02-16 | 2009-02-16 | 撮像装置および話し手認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010192956A true JP2010192956A (ja) | 2010-09-02 |
Family
ID=42818567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009032303A Pending JP2010192956A (ja) | 2009-02-16 | 2009-02-16 | 撮像装置および話し手認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010192956A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013007851A (ja) * | 2011-06-23 | 2013-01-10 | Nikon Corp | 撮像装置 |
JP2013172411A (ja) * | 2012-02-22 | 2013-09-02 | Nec Corp | 音声認識システム、音声認識方法および音声認識プログラム |
KR20150028589A (ko) * | 2013-09-06 | 2015-03-16 | 에스케이텔레콤 주식회사 | 객체 정보 제공 장치 및 방법 |
US10264210B2 (en) | 2015-08-03 | 2019-04-16 | Ricoh Company, Ltd. | Video processing apparatus, method, and system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004056286A (ja) * | 2002-07-17 | 2004-02-19 | Fuji Photo Film Co Ltd | 画像表示方法 |
JP2007266793A (ja) * | 2006-03-28 | 2007-10-11 | Casio Comput Co Ltd | 画像加工装置 |
-
2009
- 2009-02-16 JP JP2009032303A patent/JP2010192956A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004056286A (ja) * | 2002-07-17 | 2004-02-19 | Fuji Photo Film Co Ltd | 画像表示方法 |
JP2007266793A (ja) * | 2006-03-28 | 2007-10-11 | Casio Comput Co Ltd | 画像加工装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013007851A (ja) * | 2011-06-23 | 2013-01-10 | Nikon Corp | 撮像装置 |
JP2013172411A (ja) * | 2012-02-22 | 2013-09-02 | Nec Corp | 音声認識システム、音声認識方法および音声認識プログラム |
KR20150028589A (ko) * | 2013-09-06 | 2015-03-16 | 에스케이텔레콤 주식회사 | 객체 정보 제공 장치 및 방법 |
KR102097781B1 (ko) * | 2013-09-06 | 2020-05-29 | 에스케이 텔레콤주식회사 | 객체 정보 제공 장치 및 방법 |
US10264210B2 (en) | 2015-08-03 | 2019-04-16 | Ricoh Company, Ltd. | Video processing apparatus, method, and system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7916182B2 (en) | Imaging device and method which performs face recognition during a timer delay | |
KR100821801B1 (ko) | 촬상장치 및 오토포커스 제어방법 | |
US8000558B2 (en) | Thumbnail generating apparatus and image shooting apparatus | |
JP4980982B2 (ja) | 撮像装置、撮像方法、合焦制御方法及びプログラム | |
US20130016245A1 (en) | Imaging apparatus | |
JP4637045B2 (ja) | 撮像装置 | |
JP4824586B2 (ja) | 撮像装置 | |
KR101710626B1 (ko) | 디지털 촬영 장치 및 이의 제어 방법 | |
JP2009065577A (ja) | 撮像装置および撮像方法 | |
KR101728042B1 (ko) | 디지털 촬영 장치 및 이의 제어 방법 | |
US9277134B2 (en) | Image pickup apparatus and image pickup method | |
JP2008139683A (ja) | 撮像装置及びオートフォーカス制御方法 | |
JP4586707B2 (ja) | 画像処理装置、電子カメラおよび画像処理プログラム | |
KR101665175B1 (ko) | 화상 취득 장치, 화상 취득 방법 및 기록매체 | |
KR20120080376A (ko) | 디지털 영상 촬영 장치 및 이의 제어 방법 | |
JP2010192956A (ja) | 撮像装置および話し手認識方法 | |
JP4998122B2 (ja) | 撮像装置及びそのプログラム | |
JP2010050784A (ja) | デジタルカメラ | |
JP2011107550A (ja) | 撮像装置 | |
JP2008205953A (ja) | 撮像装置、及び画像再生装置 | |
JP4871664B2 (ja) | 撮像装置及び撮像装置の制御方法 | |
JP2011119934A (ja) | 画像撮影装置及び画像撮影方法 | |
JP2008172395A (ja) | 撮像装置、画像処理装置、方法およびプログラム | |
JP2002277730A (ja) | 電子カメラの自動焦点制御方法、装置及びプログラム | |
JP2009077066A (ja) | 撮像装置の画像取り込み方法とその方法を用いる撮像装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130409 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130521 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130611 |