JP6920361B2 - 判定装置、判定方法、及びプログラム - Google Patents
判定装置、判定方法、及びプログラム Download PDFInfo
- Publication number
- JP6920361B2 JP6920361B2 JP2019034701A JP2019034701A JP6920361B2 JP 6920361 B2 JP6920361 B2 JP 6920361B2 JP 2019034701 A JP2019034701 A JP 2019034701A JP 2019034701 A JP2019034701 A JP 2019034701A JP 6920361 B2 JP6920361 B2 JP 6920361B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- feature amount
- data
- sensor
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 18
- 238000000605 extraction Methods 0.000 claims description 63
- 239000000284 extract Substances 0.000 claims description 27
- 230000008878 coupling Effects 0.000 claims description 23
- 238000010168 coupling process Methods 0.000 claims description 23
- 238000005859 coupling reaction Methods 0.000 claims description 23
- 230000006835 compression Effects 0.000 description 27
- 238000007906 compression Methods 0.000 description 27
- 238000013528 artificial neural network Methods 0.000 description 21
- 238000007781 pre-processing Methods 0.000 description 19
- 239000013598 vector Substances 0.000 description 16
- 230000001360 synchronised effect Effects 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Landscapes
- Time Recorders, Dirve Recorders, Access Control (AREA)
- Studio Devices (AREA)
Description
映像データから映像特徴量を抽出する映像特徴抽出部と、
センサデータからセンサ特徴量を抽出するセンサ特徴抽出部と、
前記音声特徴量、前記映像特徴量、及び前記センサ特徴量に基づいて、所定の事象の有無を判定する判定部とを備える判定装置であって、
前記判定部は、
前記音声特徴量、前記映像特徴量、及び前記センサ特徴量のうちの2つの特徴量を結合する第1特徴結合部と、
前記第1特徴結合部により結合された特徴量から、ある時刻のデータがそれ以前の時刻のデータの影響を受けているような時系列データの特徴量である時系列特徴量を抽出する時系列特徴抽出部と、
前記時系列特徴抽出部から出力された時系列特徴量と、前記音声特徴量、前記映像特徴量、及び前記センサ特徴量のうちの前記2つの特徴量以外の特徴量とを結合する第2特徴結合部と、
前記第2特徴結合部により結合された特徴量から、判定結果となる特徴量を抽出する特徴抽出部と
を備える判定装置が提供される。
図1に、本発明の実施の形態における判定装置100の機能構成例を示す。図1に示すように、判定装置100は、音声前処理部101、映像前処理部102、センサ前処理部103、音声特徴量抽出ネットワーク部104、映像特徴量抽出ネットワーク部105、センサ特徴量抽出ネットワーク部106、音声特徴圧縮部107、映像特徴圧縮部108、センサ特徴圧縮部109、映像/センサ特徴結合部110、時系列特徴モデリング部111、映像/センサ/音声特徴結合部112、非時系列特徴モデリング部113、及び出力部114を有する。各部の機能の概要は下記のとおりである。
判定装置100は、例えば、コンピュータに、本実施の形態で説明する処理内容を記述したプログラムを実行させることにより実現可能である。なお、コンピュータとプログラムで実現できる点は、後述する図3〜図5で説明する判定装置についても同様である。
ここでは、図1に示す判定装置100の動作の一例として、自動車に搭載されたマイク、カメラ、センサにより収集された音声データ、映像データ、センサデータに基づいて、危険運転かどうかを判定する動作について説明する。ここでのセンサデータは、例えば、その自動車の速度、及び加速度である。なお、「マイク、カメラ、センサにより収集された音声データ、映像データ、センサデータ」は、例えば、ドライブレコーダーで収集されたデータである。
多数の自動車から集められた多数の(「音声データ、映像データ、センサデータ」と正解ラベル)を用意する。ここでは、1個の「音声データ、映像データ、センサデータ」が、所定時間長分のデータを格納したファイルであってもよい。正解ラベルは、当該ファイル毎に付されていてもよいし、ファイル中の、より細かい時間単位のデータに付されていてもよい。
次に、判定フェーズにおける判定装置100の動作を説明する。なお、入力から出力までの判定装置100の動作は、学習フェーズと判定フェーズとで同じである。ただし、判定フェーズでは、最適なパラメータがセットされているので、出力部114が正解を出す可能性が高くなっている。
上記の例では、映像データとセンサデータについては、同期したデータを特徴量抽出ネットワーク部に与えることができ、音声データについては、映像データ及びセンサデータと同期したデータを特徴量抽出ネットワーク部に与えることができないため、図1に示すように、音声の特徴量については、時系列特徴モデリング部111を通さずに、映像/センサ/音声特徴結合部112において、映像・センサデータの時系列特徴量と結合することとしている。
図1に示すように音声の非時系列性を考慮した構成における本発明に係る技術の評価結果について説明する。
以上説明したように、本実施の形態では、映像・音声・センサ全てのモダリティ情報を統合的に用いることにより、精度良く危険運転シーンの判別を行うことができる。
(第1項)
音声データから音声特徴量を抽出する音声特徴抽出部と、
映像データから映像特徴量を抽出する映像特徴抽出部と、
センサデータからセンサ特徴量を抽出するセンサ特徴抽出部と、
前記音声特徴量、前記映像特徴量、及び前記センサ特徴量に基づいて、所定の事象の有無を判定する判定部と
を備える判定装置。
(第2項)
前記判定部は、
前記音声特徴量、前記映像特徴量、及び前記センサ特徴量のうちの2つの特徴量を結合する第1特徴結合部と、
前記第1特徴結合部により結合された特徴量から時系列特徴量を抽出する時系列特徴抽出部と、
前記時系列特徴抽出部から出力された時系列特徴量と、前記音声特徴量、前記映像特徴量、及び前記センサ特徴量のうちの前記2つの特徴量以外の特徴量とを結合する第2特徴結合部と、
前記第2特徴結合部により結合された特徴量から、判定結果となる特徴量を抽出する特徴抽出部と
を備える第1項に記載の判定装置。
(第3項)
前記判定部は、
前記音声特徴量、前記映像特徴量、及び前記センサ特徴量を結合する結合部と、
前記結合部により結合された特徴量から、判定結果となる時系列特徴量を抽出する時系列特徴抽出部と
を備える第1項に記載の判定装置。
(第4項)
判定装置が実行する判定方法であって、
音声データから音声特徴量を抽出する音声特徴抽出ステップと、
映像データから映像特徴量を抽出する映像特徴抽出ステップと、
センサデータからセンサ特徴量を抽出するセンサ特徴抽出ステップと、
前記音声特徴量、前記映像特徴量、及び前記センサ特徴量に基づいて、所定の事象の有無を判定する判定ステップと
を備える判定方法。
(第5項)
コンピュータを、第1項ないし第3項のうちいずれか1項に記載の判定装置における各部として機能させるためのプログラム。
101、201 音声前処理部
102、202 映像前処理部
103、203 センサ前処理部
104、204 音声特徴量抽出ネットワーク部
105、205 像特徴量抽出ネットワーク部
106、206 センサ特徴量抽出ネットワーク部
107、207 音声特徴圧縮部
108、208 映像特徴圧縮部
109、209 センサ特徴圧縮部
111、211 時系列特徴モデリング部
112、210 映像/センサ/音声特徴結合部
114、212 出力部
1000 ドライブ装置
1002 補助記憶装置
1003 メモリ装置
1004 CPU
1005 インタフェース装置
1006 表示装置
1007 入力装置
Claims (3)
- 音声データから音声特徴量を抽出する音声特徴抽出部と、
映像データから映像特徴量を抽出する映像特徴抽出部と、
センサデータからセンサ特徴量を抽出するセンサ特徴抽出部と、
前記音声特徴量、前記映像特徴量、及び前記センサ特徴量に基づいて、所定の事象の有無を判定する判定部とを備える判定装置であって、
前記判定部は、
前記音声特徴量、前記映像特徴量、及び前記センサ特徴量のうちの2つの特徴量を結合する第1特徴結合部と、
前記第1特徴結合部により結合された特徴量から、ある時刻のデータがそれ以前の時刻のデータの影響を受けているような時系列データの特徴量である時系列特徴量を抽出する時系列特徴抽出部と、
前記時系列特徴抽出部から出力された時系列特徴量と、前記音声特徴量、前記映像特徴量、及び前記センサ特徴量のうちの前記2つの特徴量以外の特徴量とを結合する第2特徴結合部と、
前記第2特徴結合部により結合された特徴量から、判定結果となる特徴量を抽出する特徴抽出部と
を備える判定装置。 - 判定装置が実行する判定方法であって、
音声データから音声特徴量を抽出する音声特徴抽出ステップと、
映像データから映像特徴量を抽出する映像特徴抽出ステップと、
センサデータからセンサ特徴量を抽出するセンサ特徴抽出ステップと、
前記音声特徴量、前記映像特徴量、及び前記センサ特徴量に基づいて、所定の事象の有無を判定する判定ステップとを備え、
前記判定ステップは、
前記音声特徴量、前記映像特徴量、及び前記センサ特徴量のうちの2つの特徴量を結合する第1特徴結合ステップと、
前記第1特徴結合ステップにより結合された特徴量から、ある時刻のデータがそれ以前の時刻のデータの影響を受けているような時系列データの特徴量である時系列特徴量を抽出する時系列特徴抽出ステップと、
前記時系列特徴抽出ステップにより得られた時系列特徴量と、前記音声特徴量、前記映像特徴量、及び前記センサ特徴量のうちの前記2つの特徴量以外の特徴量とを結合する第2特徴結合ステップと、
前記第2特徴結合ステップにより結合された特徴量から、判定結果となる特徴量を抽出する特徴抽出ステップと
を備える判定方法。 - コンピュータを、請求項1に記載の判定装置における各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019034701A JP6920361B2 (ja) | 2019-02-27 | 2019-02-27 | 判定装置、判定方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019034701A JP6920361B2 (ja) | 2019-02-27 | 2019-02-27 | 判定装置、判定方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020141221A JP2020141221A (ja) | 2020-09-03 |
JP6920361B2 true JP6920361B2 (ja) | 2021-08-18 |
Family
ID=72265234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019034701A Active JP6920361B2 (ja) | 2019-02-27 | 2019-02-27 | 判定装置、判定方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6920361B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003255993A (ja) * | 2002-03-04 | 2003-09-10 | Ntt Docomo Inc | 音声認識システム、音声認識方法、音声認識プログラム、音声合成システム、音声合成方法、音声合成プログラム |
JP2016157893A (ja) * | 2015-02-26 | 2016-09-01 | 東京エレクトロン株式会社 | カーボン膜の成膜方法および成膜装置 |
JP2017138694A (ja) * | 2016-02-02 | 2017-08-10 | ソニー株式会社 | 映像処理装置及び映像処理方法 |
-
2019
- 2019-02-27 JP JP2019034701A patent/JP6920361B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020141221A (ja) | 2020-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110647893B (zh) | 目标对象识别方法、装置、存储介质和设备 | |
CN107690657B (zh) | 根据影像发现商户 | |
Takeda et al. | International large-scale vehicle corpora for research on driver behavior on the road | |
KR20190069457A (ko) | 이미지 기반 차량 손실 평가 방법, 장치 및 시스템, 및 전자 디바이스 | |
Kuchibhotla et al. | A comparative analysis of classifiers in emotion recognition through acoustic features | |
Sajid et al. | An efficient deep learning framework for distracted driver detection | |
CN111931929A (zh) | 一种多任务模型的训练方法、装置及存储介质 | |
Sathyanarayana et al. | Information fusion for robust ‘context and driver aware’active vehicle safety systems | |
CN115457395A (zh) | 基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法 | |
CN110765807A (zh) | 驾驶行为分析、处理方法、装置、设备和存储介质 | |
CN106650660A (zh) | 一种车型识别方法及终端 | |
CN112183166A (zh) | 确定训练样本的方法、装置和电子设备 | |
JP6511982B2 (ja) | 運転操作判別装置 | |
CN111091044B (zh) | 一种面向网约车的车内危险场景识别方法 | |
JP2018529298A (ja) | 環境コンテキストにおいて人間のような制御行動をシミュレーションするためのシステム及びコンピュータに基づく方法。 | |
CN112307816A (zh) | 车内图像获取方法、装置以及电子设备、存储介质 | |
CN111723809B (zh) | 评估目标检测模型的方法和系统 | |
US11238289B1 (en) | Automatic lie detection method and apparatus for interactive scenarios, device and medium | |
CN111128178A (zh) | 一种基于面部表情分析的语音识别方法 | |
CN109784140A (zh) | 驾驶员属性识别方法及相关产品 | |
CN110363193A (zh) | 车辆重识别方法、装置、设备和计算机存储介质 | |
JP6920361B2 (ja) | 判定装置、判定方法、及びプログラム | |
CN114299953A (zh) | 一种结合嘴部运动分析的话者角色区分方法与系统 | |
CN111914841B (zh) | 一种ct图像处理方法和装置 | |
CN115641570A (zh) | 驾驶行为确定方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20190325 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210706 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210726 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6920361 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |