JP2019154575A - 個人識別装置および特徴収集装置 - Google Patents
個人識別装置および特徴収集装置 Download PDFInfo
- Publication number
- JP2019154575A JP2019154575A JP2018042204A JP2018042204A JP2019154575A JP 2019154575 A JP2019154575 A JP 2019154575A JP 2018042204 A JP2018042204 A JP 2018042204A JP 2018042204 A JP2018042204 A JP 2018042204A JP 2019154575 A JP2019154575 A JP 2019154575A
- Authority
- JP
- Japan
- Prior art keywords
- identification
- person
- voice
- identifying
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004044 response Effects 0.000 claims abstract description 38
- 238000001514 detection method Methods 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims description 38
- 230000003542 behavioural effect Effects 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 10
- 230000001815 facial effect Effects 0.000 claims description 8
- 238000003384 imaging method Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 13
- 230000036544 posture Effects 0.000 description 12
- 230000006399 behavior Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 238000005452 bending Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000000746 body region Anatomy 0.000 description 2
- 238000010411 cooking Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 210000003423 ankle Anatomy 0.000 description 1
- 210000001508 eye Anatomy 0.000 description 1
- 210000000245 forearm Anatomy 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 210000001624 hip Anatomy 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/117—Identification of persons
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/117—Identification of persons
- A61B5/1171—Identification of persons based on the shapes or appearances of their bodies or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
Abstract
Description
声の波形解析により得られる音響特徴量や、自然言語解析により得られる単語や文章の特徴量に基づく識別手段を採用できるが、入力音声に基づく識別であればその他の手法を採用してもよい。人物識別手段は、第1識別手段による識別結果(以下、第1識別結果)と、第2識別手段による識別結果(以下、第2識別結果)に基づいて、検出された人物を識別する。
であるので、より直接的に人物が誰であるかを確認するような内容の音声出力を行って、その応答から人物が誰であるか識別するとよい。
本発明の適用例について説明する。個人の人体特徴や行動特徴を収集する際には、収集している対象の人物が誰であるのかを特定する必要がある。画像に基づく個人識別手法として顔認識があるが、必ずしも顔が撮影できるとは限らないので精度のよい識別が行えない場合がある。また、人体特徴や行動特徴に基づく識別も可能であるが、人体特徴や行動特徴による識別のための特徴収集において、人体特徴や行動特徴に基づく識別に全面的に頼ることは現実的ではない。
違するか、識別信頼度が低い場合には、2回目の発話内容を、1回目の発話と比較してより直接的に人物を確認する内容とするとよい。2回目は応答の内容(自然言語解析による意味解釈)によって人物を識別できるので、信頼度の高い識別結果が得られることが期待される。
本発明の第1の実施形態は、人物を撮影して得られる人体特徴や行動特徴を収集する特徴収集装置であり、家庭用のコミュニケーションロボット1(以下、単にロボット1とも称する)に搭載される。特徴収集装置は、個人識別の学習用にこれらの特徴を収集する。
図2は、ロボット1の構成を示す図である。ロボット1は、特徴収集装置100、カメラ200、スピーカ300、およびマイク400を備える。なお、ロボット1は、CPUなどのプロセッサ(演算装置)と、主記憶装置、補助記憶装置、通信装置などを有しており、プロセッサがプログラムを実行することで特徴収集装置100の各処理が実行される。
を受け取ったりしてもよい。
別装置110(人物識別部113)によって特定された人物と関連付けて照合用データベースなどの記憶部に登録する。特徴登録部130が登録を行うタイミングは任意であってよいが、例えば、人物識別部113による識別が信頼度高く行えたタイミングや、人物の追跡が完了したタイミングであってもよい。
図3は、特徴収集装置100が行う特徴収集処理の全体的流れを示すフローチャートである。以下、図3を参照しながら本実施形態における特徴収集処理について説明する。なお、このフローチャートは本実施形態における特徴収集処理を概念的に説明するものであり、実施形態においてこのフローチャートの通りの処理が実装される必要はないことに留意されたい。
(1)時間
例えば、人体検出から所定時間(例えば10分)経過後に1回目の発話を行い、それ以降所定の間隔で発話を行う。
(2)データ量
例えば、あらかじめ定められたデータ量(例えば100回分のデータ)の特徴が取得されたら発話を行う。
(3)行動停止
検出人物の行動に一定時間変化がない場合。例えば、ソファーに座ってテレビを見始めた後に一定時間経過した場合が相当する。
(4)撮像範囲外への移動
検出人物が撮影範囲外に移動することが予測される場合。例えば、検出人物が現在の部
屋から他の部屋へ移動・外出した場合が相当する。
(5)発話のしやすい状況
ロボットが検出人物と対話を行うのに適した状況に達した場合。例えば、検出人物とロボットが向かい合っており(ロボットが検出人物の顔を検出でき)、かつ、検出人物とロボットの間の距離が所定距離(例えば3メートル)以内のとき。
(6)識別信頼度が低い場合
人物識別部113は、第1識別部1131と第2識別部1133の両方の識別結果を用いて最終的な識別結果を確定する。そこで、第1識別部1131による識別信頼度が閾値TH1以上であれば、その結果を人物識別部113の識別結果として確定し、識別信頼度が閾値TH1未満であれば、第2識別部1133による識別を行うために発話を行うようにしてもよい。あるいは、第1識別部1131と第2識別部1133の両方の識別結果を考慮した上で識別信頼度が閾値TH1未満となる場合に、さらに第2識別部1133による識別を行うために発話を行うようにしてもよい。
を発話内容とする。第1識別部1131の識別結果が「母」である場合には、発話制御部1132は、例えば「お母さん、台所で何してるの?」を発話内容として決定する。
本実施形態によれば、画像に基づく個人識別と音声に基づく個人識別を行い、両方を総合して最終的な識別結果を得られるため、精度のよい識別が行える。特に、画像だけからは精度のよい識別が行えない場合に、システム発話を行ってユーザからの音声応答を取得して音声に基づく識別を行うことで、精度のよい識別を可能としている。さらに、画像に基づく識別結果が信頼できない場合のみに発話を行ったり、画像に基づく識別信頼度に応じて発話内容を決定したりすることで、ユーザが煩わしさを感じることを最小限にできる。
第1の実施形態では、図4に示すように識別信頼度に応じて発話内容を決定している。しかしながら、ユーザから音声による応答が得られれば、少なくとも音響特徴に基づく識別ができることと、1回の対話で複数回の発話が可能であることを考慮して、本実施形態では、発話内容の決定処理を第1の実施形態から変更する。以下、第1の実施形態との相違点について主に説明する。
であるかを確認する内容として決定する。いまの場合は、例えば、「台所にいるのはお母さんじゃないの?」という発話内容を採用できる。あるいは、第1の実施形態の信頼度が中レベルまたは低レベルの時と同様に、検出人物の呼称を含む発話内容(例:「お母さん、そこで何してるの?」)や、誰であるかを直接問い合わせる発話内容(例:「台所にいるのは誰ですか?」)を2回目の発話内容として決定してもよい。
上述した各実施形態は、本発明の例示に過ぎない。本発明は上記の具体的な形態に限定されることはなく、その技術的思想の範囲内で種々の変形が可能である。
音声を出力する音声出力手段(14,114)と、
出力音声に応答する音声を取得する音声入力手段(15,115)と、
画像入力手段(11,111)と、
前記画像入力手段に入力される動画像から、人物を検出する検出手段(12,112)と、
前記検出手段によって検出された人物を識別する人物識別手段(13,113)と、
を備え、
前記人物識別手段は、
前記動画像に基づいて前記人物を識別する第1識別手段(131,1131)と、
出力音声への応答として得られる入力音声に基づいて前記人物を識別する第2識別手段(133,1133)と、を有し、
前記第1識別手段による識別結果である第1識別結果と前記第2識別手段による識別結果である第2識別結果に基づいて、前記人物を識別する、
ことを特徴とする、個人識別装置。
13:人物識別部 131:第1識別部 133:第2識別部
14:音声出力部 15:音声入力部
100:特徴収集装置
110:個人識別装置 111:画像入力部 112:人体検出部
113:人物識別部 1131:第1識別部 1132:発話制御部
1133:第2識別部 1134:人体特定部
114:音声出力部 115:音声入力部
120:特徴取得部 130:特徴登録部
200:カメラ 300:スピーカ 400:マイク
Claims (15)
- 音声を出力する音声出力手段と、
出力音声に応答する音声を取得する音声入力手段と、
画像入力手段と、
前記画像入力手段に入力される動画像から、人物を検出する検出手段と、
前記検出手段によって検出された人物を識別する人物識別手段と、
を備え、
前記人物識別手段は、
前記動画像に基づいて前記人物を識別する第1識別手段と、
出力音声への応答として得られる入力音声に基づいて前記人物を識別する第2識別手段と、を有し、
前記第1識別手段による識別結果である第1識別結果と前記第2識別手段による識別結果である第2識別結果に基づいて、前記人物を識別する、
ことを特徴とする、個人識別装置。 - 前記人物識別手段は、前記第1識別手段による信頼度が第1閾値未満の場合に、前記音声出力手段からの音声出力と、前記第2識別手段による識別とを行って、前記第1識別結果と前記第2識別結果とに基づいて前記人物を識別する、
請求項1に記載の個人識別装置。 - 前記人物識別手段は、前記第1識別手段による信頼度が前記第1閾値以上の場合は、前記第1識別結果を、前記人物の識別結果とする、
請求項2に記載の個人識別装置。 - 前記音声出力手段からの出力音声の出力は所定のタイミングで行われ、
前記所定のタイミングは、
前記人物の識別信頼度が閾値未満となったタイミング、
前記人物が検出されたタイミングから第1の所定時間が経過したタイミング、
前記人物の時間変化が略無い状態が第2の所定時間継続したタイミング、
前記人物が撮像範囲外へ出るタイミング、
前記個人識別装置と前記人物の間の距離が所定距離以下になったタイミングで、
の少なくとも何れかである、
請求項1から3のいずれか1項に記載の個人識別装置。 - 前記人物識別手段は、前記第1識別手段による信頼度に応じて、前記出力音声の内容を決定する、
請求項1から4のいずれか1項に記載の個人識別装置。 - 前記人物識別手段は、前記信頼度が第2閾値未満の場合は、前記第1識別結果の人物の呼称を含む内容、または、前記人物が誰であるかを問い合わせる内容を、前記出力音声の内容として決定する、
請求項5に記載の個人識別装置。 - 前記人物識別手段は、前記第1識別結果と前記第2識別結果が一致しない場合には、新たに出力音声を出力して当該新たな出力音声に応答する入力音声に基づいて前記第2識別手段による識別を行い、
新たな出力音声の内容は、前回の出力音声の内容と比較してより直接的に前記人物を確認する内容である、
請求項1から6のいずれか1項に記載の個人識別装置。 - 前記第2識別手段は、前記入力音声を用いた波形解析と言語解析の少なくとも一方を行うことにより、前記人物を識別する、
請求項1から7のいずれか1項に記載の個人識別装置。 - 前記第1識別手段は、前記動画像から得られる、顔特徴、人体特徴、および行動特徴の少なくともいずれかに基づいて、前記人物を識別する、
請求項1から8のいずれか1項に記載の個人識別装置。 - 請求項1から9のいずれか1項に記載の個人識別装置と、
前記画像入力手段に入力される動画像から、前記検出された人物の人体または行動に関する特徴の少なくともいずれかを取得する特徴取得手段と、
前記特徴取得手段によって取得された特徴を、前記人物識別手段によって識別された人物とを関連付けて登録する特徴登録手段と、
を備える、特徴収集装置。 - コンピュータによって実行される個人識別方法であって、
動画像から人物を検出する検出ステップと、
前記動画像に基づいて前記人物を識別する第1識別ステップと、
音声を出力する音声出力ステップと、
出力音声に応答する音声を取得する音声入力ステップと、
出力音声への応答として得られる入力音声に基づいて前記人物を識別する第2識別ステップと、
前記第1識別ステップにおける識別結果である第1識別結果と前記第2識別ステップにおける識別結果である第2識別結果に基づいて、前記人物を識別する、第3識別ステップと、
を含む、個人識別方法。 - 前記第1識別ステップにおける信頼度が第1閾値未満の場合に、前記音声出力ステップ、前記音声入力ステップ、前記第2識別ステップを行う、
請求項11に記載の個人識別方法。 - 前記第1識別ステップにおける信頼度が前記第1閾値以上の場合は、前記第3識別ステップでは、前記第1識別結果を前記人物の識別結果とする、
請求項12に記載の個人識別方法。 - 前記音声出力ステップでは、前記第1識別ステップにおける信頼度に応じ内容の音声を出力する、
請求項11から13のいずれか1項に記載の個人識別方法。 - 請求項11から14のいずれか1項に記載の方法の各ステップを実行するためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018042204A JP6819633B2 (ja) | 2018-03-08 | 2018-03-08 | 個人識別装置および特徴収集装置 |
PCT/JP2019/001488 WO2019171780A1 (ja) | 2018-03-08 | 2019-01-18 | 個人識別装置および特徴収集装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018042204A JP6819633B2 (ja) | 2018-03-08 | 2018-03-08 | 個人識別装置および特徴収集装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019154575A true JP2019154575A (ja) | 2019-09-19 |
JP6819633B2 JP6819633B2 (ja) | 2021-01-27 |
Family
ID=67845907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018042204A Active JP6819633B2 (ja) | 2018-03-08 | 2018-03-08 | 個人識別装置および特徴収集装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6819633B2 (ja) |
WO (1) | WO2019171780A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7430087B2 (ja) | 2020-03-24 | 2024-02-09 | 株式会社フジタ | 発話制御装置 |
JP7451130B2 (ja) | 2019-10-07 | 2024-03-18 | キヤノン株式会社 | 制御装置、制御システム、制御方法、及びプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7283571B2 (ja) * | 2019-11-11 | 2023-05-30 | 日本電気株式会社 | 人物状態検出装置、人物状態検出方法及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005182159A (ja) * | 2003-12-16 | 2005-07-07 | Nec Corp | 個人認証方式及び個人認証方法 |
JP2007156688A (ja) * | 2005-12-02 | 2007-06-21 | Mitsubishi Heavy Ind Ltd | ユーザ認証装置およびその方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4365189B2 (ja) * | 2003-02-05 | 2009-11-18 | 富士フイルム株式会社 | 認証装置 |
-
2018
- 2018-03-08 JP JP2018042204A patent/JP6819633B2/ja active Active
-
2019
- 2019-01-18 WO PCT/JP2019/001488 patent/WO2019171780A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005182159A (ja) * | 2003-12-16 | 2005-07-07 | Nec Corp | 個人認証方式及び個人認証方法 |
JP2007156688A (ja) * | 2005-12-02 | 2007-06-21 | Mitsubishi Heavy Ind Ltd | ユーザ認証装置およびその方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7451130B2 (ja) | 2019-10-07 | 2024-03-18 | キヤノン株式会社 | 制御装置、制御システム、制御方法、及びプログラム |
JP7430087B2 (ja) | 2020-03-24 | 2024-02-09 | 株式会社フジタ | 発話制御装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2019171780A1 (ja) | 2019-09-12 |
JP6819633B2 (ja) | 2021-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109475294B (zh) | 用于治疗精神障碍的移动和可穿戴视频捕捉和反馈平台 | |
JP4462339B2 (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム | |
CN107799126B (zh) | 基于有监督机器学习的语音端点检测方法及装置 | |
US20110224978A1 (en) | Information processing device, information processing method and program | |
Kessous et al. | Multimodal emotion recognition in speech-based interaction using facial expression, body gesture and acoustic analysis | |
KR101749100B1 (ko) | 디바이스 제어를 위한 제스처/음향 융합 인식 시스템 및 방법 | |
JP2002182680A (ja) | 操作指示装置 | |
US20150331490A1 (en) | Voice recognition device, voice recognition method, and program | |
US20200279561A1 (en) | Determining input for speech processing engine | |
JP2009031951A (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム | |
WO2019171780A1 (ja) | 個人識別装置および特徴収集装置 | |
JP4730404B2 (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム | |
WO2020214844A1 (en) | Identifying input for speech recognition engine | |
WO2018163555A1 (ja) | 画像処理装置、画像処理方法、及び画像処理プログラム | |
JP2013104938A (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
US20120035927A1 (en) | Information Processing Apparatus, Information Processing Method, and Program | |
JP2010165305A (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
WO2012020591A1 (ja) | 個体識別システム、特徴量特定装置、特徴量特定方法および記録媒体 | |
KR20200085696A (ko) | 사람의 감성 상태를 결정하기 위하여 영상을 처리하는 감성인식 방법 | |
CN111326152A (zh) | 语音控制方法及装置 | |
Ponce-López et al. | Multi-modal social signal analysis for predicting agreement in conversation settings | |
JP4730812B2 (ja) | 個人認証装置、個人認証処理方法、そのためのプログラム及び記録媒体 | |
CN110221693A (zh) | 一种基于人机交互的智能零售终端操作系统 | |
US11682389B2 (en) | Voice conversation system, control system for voice conversation system, and control program, and control method | |
WO2021166811A1 (ja) | 情報処理装置および行動モード設定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200305 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6819633 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |