JP2020038433A - 画像解析装置、画像解析方法、およびプログラム - Google Patents
画像解析装置、画像解析方法、およびプログラム Download PDFInfo
- Publication number
- JP2020038433A JP2020038433A JP2018164409A JP2018164409A JP2020038433A JP 2020038433 A JP2020038433 A JP 2020038433A JP 2018164409 A JP2018164409 A JP 2018164409A JP 2018164409 A JP2018164409 A JP 2018164409A JP 2020038433 A JP2020038433 A JP 2020038433A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- image
- utterance
- sight
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
画像解析装置は、一以上のプロセッサにより実現される。画像解析装置は、1以上の人物が撮像された1以上の画像と、その画像における発話者および発話内容を取得し、その取得した情報に基づいて、発話相手(発話者が話しかけている相手)を推測する。なお、画像は動画であってもよい。また、画像には、撮像日時情報や地理情報等が付随していてもよい。
[全体構成]
図1は、第1実施形態の画像解析装置100の使用環境および構成の一例を示す図である。画像解析装置100は、ネットワークNWを介して依頼元端末200と通信する。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、プロバイダ端末、無線通信網、無線基地局、専用回線などを含む。依頼元端末200は、例えば、通信機能などを有するコンピュータ装置である。通信機能は、NIC(Network Interface Card)などのネットワークカード、無線通信モジュールなどにより実現される。
図2は、視線先位置推定部132の視線先位置推定方法について説明する図である。図3に示す視線先位置推定方法は、例えば、以下の4段階の手順により実現される。なお、下記の手順(a)と手順(b)は並行して行われてもよいし、いずれか一方の処理の終了後に他方の処理が実施されてもよい。
(a)物標検出
(b)被写体人物頭部・瞳位置分析
(c)視線演算
(d)視線先位置(グリッド)推定
視線先位置推定部132は、被写体の人物、および被写体の人物の視線の先に当たる物標の候補を、画像(以下、画像xi)内の視線先位置推定対象である被写体の人物の映り込む部分を除いた画像全体から検出する。物標とは、視線を誘引される可能性がある物体・人物・生物等の対象物をいう。
視線先位置推定部132は、被写体の人物の顔の向きや瞳の位置に基づいて、視線の方向を推定する。視線先位置推定部132は、視線の方向の推定のため、畳み込みニューラルネットワークなどを利用した導出器2を用いて、画像xiから顕著性マップS(xi)とは別の空間マップである、サイズD×Dの視線マスクマップG(xh,xp)を導出する。導出器2は、導出器1と同様に、予め機械学習によって生成されたものである。xpは、画像xi内での被写体の人物の頭の位置または瞳の位置を示すパラメータ(例えば、座標)である。またxhは、xpの導出によって得られた画像xi内での被写体の人物の頭の位置、または瞳の位置を拡大処理した際の拡大程度を表す画像パラメータである。
視線先位置推定部132は、手順(a)の物標の検出結果である顕著性マップS(xi)、および(b)の視線の方向の分析結果である視線マスクマップG(xh,xp)に基づいて、被写体の人物の方向を演算し、被写体の視線先位置を推定する。ここで、被写体の人物が複数存在する場合には、瞳の位置が推定できるすべての人物の視線先位置を推定してもよいし、発話者推定部130がすでに発話者を推定している場合にはその人物の視線先位置を推定してもよい。
視線先位置推定部132は、手順(c)の演算結果に基づいて、被写体の人物の視線先位置y(ハット)を推定する。視線先位置推定部132は、被写体の人物の視線先位置y(ハット)の推定のため、視線マスクマップG(xh,xp)のみを用いてもよいし、視線マスクマップG(xh,xp)の導出とは異なる演算モデルを用いて演算を実施し、複数の演算結果を統合することで被写体の人物の視線先位置である領域(グリッド)を推定してもよい。
発話内容推測部140による発話内容の推測処理は、例えば、以下の2段階の手順により実現される。
(e)画像全体分析
(f)発話内容推測
発話内容推測部140は、例えば、画像xiに映り込む人物、物標、背景等の物標を分析する。発話内容推測部140は、特徴量導出部120の導出結果を用いて物標を分析してもよい。
発話内容推測部140は、例えば、手順(e)で分析された物標を示す単語や、それらから連想される単語に基づいて、発話者の発話しそうな文章を構成することで、発話者の発話内容を推測する。
発話相手推測部150は、例えば、視線先位置推定部132によって発話者の視線先位置が推定されていない場合、発話内容推測部140により推測された発話内容に基づいて、発話相手を推測する。
図6は、画像解析装置100による推測処理の流れの一例を示すフローチャートである。まず、取得部110は、依頼元端末200より画像xiを取得し、特徴量導出部120に出力する(S100)。次に、特徴量導出部120は、画像xiの特徴量を導出する(S102)。次に、視線先位置推定部132は、画像xiにおける発話者を推測し、発話者の視線先位置を推定する(S104)。次に、発話内容推測部140は、発話内容を推測する(S106)。次に、発話相手推測部150は、発話相手を推測する(S108)。次に、出力部160は、推測結果を依頼元端末200に出力する(S110)。以上、本フローチャートの処理の説明を終了する。
図7は、第2の実施形態の画像解析装置100Aの概要図である。画像解析装置100Aは、第1の実施形態の画像解析装置100と比較して、関連挙動推測部180をさらに備える点が異なる。したがって、以下では関連挙動推測部180を中心に説明する。
図8は、画像解析装置100Aによる推測処理の流れの一例を示す図である。図8に示すフローチャートは、図6のフローチャートにS112が追加されたものである。したがって、以下ではS112について説明する。
Claims (6)
- 発話者が含まれる画像と、前記発話者の発話内容の予測結果とを取得する取得部と、
前記画像および前記発話内容の予測結果に基づいて、前記発話者が発話する対象の発話相手を推定する発話相手推測部と、
を備える画像解析装置。 - 前記画像に含まれる物標および/または前記発話者以外の人物に対する前記発話者の視線の先の位置を推定する視線先位置推定部をさらに備え、
前記発話相手推測部は、前記画像および前記位置の推定結果に基づいて、前記発話者の発話内容を予測する、
請求項1に記載の画像解析装置。 - 前記発話相手推測部は、前記発話者の視線の先の位置が推定されており、且つ前記位置に人物が存在する場合、発話者の視線先位置の人物を、前記発話相手である可能性が高いものとして推測する、
請求項1または2に記載の画像解析装置。 - 前記発話相手推測部は、前記発話相手の推測結果と、前記発話者の視線の先の位置に存在する物標とを照合することで、前記発話相手の推測精度を検証する、
請求項1からの3のいずれか一項に記載の画像解析装置。 - コンピュータが、
発話者が含まれる画像と、前記発話者の発話内容の予測結果とを取得し、
前記画像および前記発話内容の予測結果に基づいて、前記発話者が発話する対象の発話相手を推定する、
画像解析方法。 - コンピュータに、
発話者が含まれる画像と、前記発話者の発話内容の予測結果とを取得させ、
前記画像および前記発話内容の予測結果に基づいて、前記発話者が発話する対象の発話相手を推定させる、
プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018164409A JP2020038433A (ja) | 2018-09-03 | 2018-09-03 | 画像解析装置、画像解析方法、およびプログラム |
JP2022075171A JP7354344B2 (ja) | 2018-09-03 | 2022-04-28 | 画像解析装置、画像解析方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018164409A JP2020038433A (ja) | 2018-09-03 | 2018-09-03 | 画像解析装置、画像解析方法、およびプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022075171A Division JP7354344B2 (ja) | 2018-09-03 | 2022-04-28 | 画像解析装置、画像解析方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020038433A true JP2020038433A (ja) | 2020-03-12 |
Family
ID=69737959
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018164409A Pending JP2020038433A (ja) | 2018-09-03 | 2018-09-03 | 画像解析装置、画像解析方法、およびプログラム |
JP2022075171A Active JP7354344B2 (ja) | 2018-09-03 | 2022-04-28 | 画像解析装置、画像解析方法、およびプログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022075171A Active JP7354344B2 (ja) | 2018-09-03 | 2022-04-28 | 画像解析装置、画像解析方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP2020038433A (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011108055A (ja) * | 2009-11-19 | 2011-06-02 | Nippon Telegr & Teleph Corp <Ntt> | 対話システム、対話方法、対話プログラム |
US20130120522A1 (en) * | 2011-11-16 | 2013-05-16 | Cisco Technology, Inc. | System and method for alerting a participant in a video conference |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006127353A (ja) * | 2004-11-01 | 2006-05-18 | Advanced Telecommunication Research Institute International | 会話参与手続き認識装置および会話参与手続き認識システム |
JP4804801B2 (ja) * | 2005-06-03 | 2011-11-02 | 日本電信電話株式会社 | 会話構造推定方法、プログラム、および記録媒体 |
-
2018
- 2018-09-03 JP JP2018164409A patent/JP2020038433A/ja active Pending
-
2022
- 2022-04-28 JP JP2022075171A patent/JP7354344B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011108055A (ja) * | 2009-11-19 | 2011-06-02 | Nippon Telegr & Teleph Corp <Ntt> | 対話システム、対話方法、対話プログラム |
US20130120522A1 (en) * | 2011-11-16 | 2013-05-16 | Cisco Technology, Inc. | System and method for alerting a participant in a video conference |
Also Published As
Publication number | Publication date |
---|---|
JP2022106887A (ja) | 2022-07-20 |
JP7354344B2 (ja) | 2023-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Write-a-speaker: Text-based emotional and rhythmic talking-head generation | |
JP6467965B2 (ja) | 感情推定装置及び感情推定方法 | |
US12027062B2 (en) | Communication skill evaluation system, communication skill evaluation device and communication skill evaluation method | |
CN107911643B (zh) | 一种视频通信中展现场景特效的方法和装置 | |
KR20140129171A (ko) | 비디오 화상회의 동안 참가자의 외모 수정 | |
KR102167760B1 (ko) | 수어동작 인식 처리절차 및 움직임 추적 Pre-trained 모델을 이용한 수어동작 분석 알고리즘 시스템 | |
US20140145936A1 (en) | Method and system for 3d gesture behavior recognition | |
JP7118697B2 (ja) | 注視点推定処理装置、注視点推定モデル生成装置、注視点推定処理システム、注視点推定処理方法、プログラム、および注視点推定モデル | |
WO2021196721A1 (zh) | 一种舱内环境的调整方法及装置 | |
KR102148151B1 (ko) | 디지털 커뮤니케이션 네트워크에 기반한 지능형 채팅 | |
JP2018032164A (ja) | 面接システム | |
KR101913811B1 (ko) | 얼굴 표현 및 심리 상태 파악과 보상을 위한 얼굴 정보 분석 방법 및 얼굴 정보 분석 장치 | |
JP5349238B2 (ja) | 表情認識装置、人物間感情推定装置、表情認識方法、人物間感情推定方法、及びプログラム | |
CN111108508A (zh) | 脸部情感识别方法、智能装置和计算机可读存储介质 | |
JP7370050B2 (ja) | 読唇装置及び読唇方法 | |
JP2020038432A (ja) | 画像解析装置、画像解析方法、およびプログラム | |
Żarkowski | Identification-driven emotion recognition system for a social robot | |
JP7354344B2 (ja) | 画像解析装置、画像解析方法、およびプログラム | |
TWI667054B (zh) | 飛行器飛行控制方法、裝置、飛行器及系統 | |
JP2018060374A (ja) | 情報処理装置、評価システムおよびプログラム | |
TWI620076B (zh) | 人體動作的分析系統 | |
Gervasi et al. | A method for predicting words by interpreting labial movements | |
Kumano et al. | Recognizing communicative facial expressions for discovering interpersonal emotions in group meetings | |
JP5485044B2 (ja) | 表情学習装置、表情認識装置、表情学習方法、表情認識方法、表情学習プログラム及び表情認識プログラム | |
JP5931021B2 (ja) | 対人認知傾向モデル学習装置、対人認知状態推定装置、対人認知傾向モデル学習方法、対人認知状態推定方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20181003 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200915 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211202 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220428 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220428 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220512 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220517 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20220610 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20220614 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220802 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220913 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20221011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221212 |
|
C302 | Record of communication |
Free format text: JAPANESE INTERMEDIATE CODE: C302 Effective date: 20221213 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20221223 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20230328 |