JP7041093B2 - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JP7041093B2 JP7041093B2 JP2019088449A JP2019088449A JP7041093B2 JP 7041093 B2 JP7041093 B2 JP 7041093B2 JP 2019088449 A JP2019088449 A JP 2019088449A JP 2019088449 A JP2019088449 A JP 2019088449A JP 7041093 B2 JP7041093 B2 JP 7041093B2
- Authority
- JP
- Japan
- Prior art keywords
- feature amount
- feature
- learning model
- event
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
実施の形態に係る情報処理装置は、会議や講演等、発話を軸とするインタラクションを記録したマルチモーダルデータを入力とし、そのマルチモーダルデータが、インタラクションにおいてあらかじめ定義された事象を含むデータであるか否かを示す情報を出力する。このため、実施の形態に係る情報処理装置は、インタラクションで発生した事象と、そのときのマルチモーダルデータとのセットを教師データとして機械学習を実行することにより、マルチモーダルデータを入力とし、事象を出力とする機械学習モデルを生成する。
図2は、実施の形態に係る情報処理装置1の機能構成を模式的に示す図である。情報処理装置1は、記憶部2と制御部3とを備える。図2において、矢印は主なデータの流れを示しており、図2に示していないデータの流れがあってもよい。図2において、各機能ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図2に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。
図6は、実施の形態に係る情報処理装置1が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1が起動したときに開始する。
以上説明したように、実施の形態に係る情報処理装置1によれば、機械学習モデルの出力結果の根拠を提示することができる技術を提供できる。これにより、例えばブレインストーミングなどのインタラクションにおける活性度推定において、「活性化している」という推定結果が言語行動の同調に基づくものなのか、身体動作の同調に基づくものなのか、という「根拠」をユーザに理解しやすい形で提示することができる。
上記では、学習モデルが、会議や講演等、発話を軸とするインタラクションを記録したマルチモーダルデータを入力とし、そのマルチモーダルデータが、インタラクションにおいてあらかじめ定義された事象を含むデータであるか否かを示す情報を出力する場合について説明した。しかしながら、情報処理装置1が処理対象とする学習モデルは上記に限られない。学習モデルが入力に応じて複数の異なる事象を出力するものであり、異なる事象間に距離を定義可能であればどのような学習モデルであってもよい。
2・・・記憶部
3・・・制御部
30・・・学習データ取得部
31・・・特徴量抽出部
32・・・学習部
33・・・特徴量選択部
34・・・部分特徴量生成部
35・・・距離算出部
36・・・通知部
37・・・特徴量分類部
Claims (7)
- 情報処理装置であって、
事象を観測して得られたマルチモーダルデータと、前記事象において定義された複数の注目事象とを含む学習データを取得する学習データ取得部と、
前記マルチモーダルデータから複数の異なる特徴量を抽出する特徴量抽出部と、
前記特徴量抽出部が抽出したすべての特徴量を入力したときに、当該特徴量が前記複数の注目事象のうちのいずれの注目事象に関するマルチモーダルデータから抽出されたかを出力する基準学習モデルを生成する学習部と、
前記複数の特徴量から1又は複数の特徴量を選択する特徴量選択部と、
前記複数の特徴量から前記特徴量選択部が選択した特徴量を除いた特徴量である部分特徴量群を生成する部分特徴量生成部と、を備え、
前記学習部は、前記部分特徴量群を構成する特徴量を入力したときに、当該特徴量が前記複数の注目事象のうちどの注目事象に関するマルチモーダルデータから抽出されたかを示す指標を出力する参照用学習モデルを生成し、
前記情報処理装置は、
前記複数の注目事象それぞれの間の距離を定めるためにあらかじめ定義された概念体系に基づいて、前記基準学習モデルが出力した指標が示す注目事象と、前記参照用学習モデルが出力した指標が示す注目事象との距離を算出する距離算出部と、
前記距離と、前記特徴量選択部が選択した特徴量を示す情報とを通知する通知部と、
をさらに備える情報処理装置。 - 前記特徴量選択部は、複数の異なるパターンで前記特徴量を選択し、
前記部分特徴量生成部は、前記特徴量選択部が選択した複数の異なるパターンの特徴量それぞれを前記複数の特徴量から除いた複数の異なる部分特徴量群を生成し、
前記学習部は、前記複数の異なる部分特徴量群を用いて複数の異なる参照用学習モデルを生成し、
前記距離算出部は、前記基準学習モデルが出力した注目事象と、前記複数の異なる参照用学習モデルが出力した注目事象それぞれとの距離を算出し、
前記通知部は、前記距離算出部が算出した距離それぞれと、前記特徴量選択部が選択した複数の異なるパターンの特徴量それぞれとを対応づけて通知する、
請求項1に記載の情報処理装置。 - 前記特徴量選択部は、前記基準学習モデルが出力した注目事象との距離が最長となる注目事象を出力した参照用学習モデルの生成に用いた部分特徴量群から除外されている特徴量が2以上の特徴量を含む場合、当該除外されている特徴量から1又は複数の特徴量を再度選択し、
前記部分特徴量生成部は、前記特徴量抽出部が抽出したすべての特徴量から前記特徴量選択部が再度選択した特徴量を除いた部分特徴量群を生成し、
前記学習部は、前記部分特徴量群を構成する特徴量を入力したときに、当該特徴量が前記複数の注目事象のうちどの注目事象に関するマルチモーダルデータから抽出されたかを示す指標を出力する参照用学習モデルを生成する、
請求項2に記載の情報処理装置。 - 前記マルチモーダルデータを構成するデータの入力ソース毎に複数の異なる特徴量を分類する特徴量分類部をさらに備え、
前記特徴量選択部は、前記特徴量分類部が分類した特徴量を単位として特徴量を選択する、
請求項1から3のいずれか1項に記載の情報処理装置。 - 前記概念体系は、前記事象において定義された複数の注目事象に関する木構造で表現されており、
前記距離算出部は、前記基準学習モデルが出力した指標が示す注目事象と、前記参照用学習モデルが出力した指標が示す注目事象とのそれぞれの注目事象に対応する前記木構造の位置に基づいて、前記距離を算出する、
請求項1から4のいずれか1項に記載の情報処理装置。 - プロセッサが、
事象を観測して得られたマルチモーダルデータと、前記事象において定義された複数の注目事象とを含む学習データを取得するステップと、
前記マルチモーダルデータから複数の異なる特徴量を抽出するステップと、
抽出したすべての前記特徴量を入力したときに、当該特徴量が前記複数の注目事象のうちのいずれの注目事象に関するマルチモーダルデータから抽出されたかを出力する基準学習モデルを生成するステップと、
前記複数の特徴量から1又は複数の特徴量を選択するステップと、
選択した前記特徴量を前記複数の特徴量から除いた特徴量である部分特徴量群を生成するステップと、
前記部分特徴量群を構成する特徴量を入力したときに、当該特徴量が前記複数の注目事象のうちどの注目事象に関するマルチモーダルデータから抽出されたかを示す指標を出力する参照用学習モデルを生成するステップと、
前記複数の注目事象それぞれの間の距離を定めるためにあらかじめ定義された概念体系に基づいて、前記基準学習モデルが出力した指標が示す注目事象と、前記参照用学習モデルが出力した指標が示す注目事象との距離を算出するステップと、
前記距離と、前記特徴量を選択するステップで選択された特徴量を示す情報とを通知するステップと、
を実行する情報処理方法。 - コンピュータに、
事象を観測して得られたマルチモーダルデータと、前記事象において定義された複数の注目事象とを含む学習データを取得する機能と、
前記マルチモーダルデータから複数の異なる特徴量を抽出する機能と、
抽出したすべての前記特徴量を入力したときに、当該特徴量が前記複数の注目事象のうちのいずれの注目事象に関するマルチモーダルデータから抽出されたかを出力する基準学習モデルを生成する機能と、
前記複数の特徴量から1又は複数の特徴量を選択する機能と、
選択した前記特徴量を前記複数の特徴量から除いた特徴量である部分特徴量群を生成する機能と、
前記部分特徴量群を構成する特徴量を入力したときに、当該特徴量が前記複数の注目事象のうちどの注目事象に関するマルチモーダルデータから抽出されたかを示す指標を出力する参照用学習モデルを生成する機能と、
前記複数の注目事象それぞれの間の距離を定めるためにあらかじめ定義された概念体系に基づいて、前記基準学習モデルが出力した指標が示す注目事象と、前記参照用学習モデルが出力した指標が示す注目事象との距離を算出する機能と、
前記距離と、前記特徴量を選択する機能が選択した特徴量を示す情報とを通知する機能と、
を実現させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019088449A JP7041093B2 (ja) | 2019-05-08 | 2019-05-08 | 情報処理装置、情報処理方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019088449A JP7041093B2 (ja) | 2019-05-08 | 2019-05-08 | 情報処理装置、情報処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020184212A JP2020184212A (ja) | 2020-11-12 |
JP7041093B2 true JP7041093B2 (ja) | 2022-03-23 |
Family
ID=73044594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019088449A Active JP7041093B2 (ja) | 2019-05-08 | 2019-05-08 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7041093B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019142597A1 (ja) | 2018-01-19 | 2019-07-25 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
-
2019
- 2019-05-08 JP JP2019088449A patent/JP7041093B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019142597A1 (ja) | 2018-01-19 | 2019-07-25 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
張 翔,マイクロブログにおいて論争化する議論の予測,第11回データ工学と情報マネジメントに関するフォーラム (第17回日本データベース学会年次大会) [online] ,日本,2019年03月06日,Internet<URL:http://db-event.jpn.org/deim2019/post/papers/452.pdf>,特に「6.2実験結果」を参照 |
Also Published As
Publication number | Publication date |
---|---|
JP2020184212A (ja) | 2020-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Khalid et al. | Evaluation of an audio-video multimodal deepfake dataset using unimodal and multimodal detectors | |
US10755463B1 (en) | Audio-based face tracking and lip syncing for natural facial animation and lip movement | |
US10685236B2 (en) | Multi-model techniques to generate video metadata | |
JP2008262046A (ja) | 会議可視化システム、会議可視化方法、及び集計処理サーバ | |
CN116484318B (zh) | 一种演讲训练反馈方法、装置及存储介质 | |
CN112969065B (zh) | 一种评估视频会议质量的方法、装置及计算机可读介质 | |
US20210298647A1 (en) | Automatically aiding individuals with developing auditory attention abilities | |
CN106205611A (zh) | 一种基于多模态历史响应结果的人机交互方法及系统 | |
JP2019149057A (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
CN115225829A (zh) | 一种视频生成方法及装置、计算机可读存储介质 | |
KR20170107868A (ko) | 사용자 맥락, 추천 음악, 이용 행태로 구성된 데이터베이스를 활용한 음악 콘텐츠 추천 방법 및 시스템 | |
JP2019016267A (ja) | ライフログ活用システム、方法及びプログラム | |
TWI823055B (zh) | 電子資源推送方法及系統 | |
Maj et al. | Cross-modal perception for customer service | |
JP7041093B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
Hou et al. | AI-based soundscape analysis: Jointly identifying sound sources and predicting annoyance | |
US20230049015A1 (en) | Selecting and Reporting Objects Based on Events | |
Ouhaichi et al. | Mbox: Designing a flexible iot multimodal learning analytics system | |
JP6997733B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
Shevchyk et al. | Privacy preserving synthetic respiratory sounds for class incremental learning | |
Brambilla et al. | Measurements and Techniques in Soundscape Research | |
CN115910047B (zh) | 数据处理方法、模型训练方法、关键词检测方法及设备 | |
US20210350819A1 (en) | Techniques for training a multitask learning model to assess perceived audio quality | |
CN114399821B (zh) | 策略推荐方法、装置、存储介质 | |
WO2023238721A1 (ja) | 情報作成方法、及び情報作成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210303 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220310 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7041093 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |