JP6397385B2 - 学習装置、探索装置、方法、及びプログラム - Google Patents
学習装置、探索装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6397385B2 JP6397385B2 JP2015164218A JP2015164218A JP6397385B2 JP 6397385 B2 JP6397385 B2 JP 6397385B2 JP 2015164218 A JP2015164218 A JP 2015164218A JP 2015164218 A JP2015164218 A JP 2015164218A JP 6397385 B2 JP6397385 B2 JP 6397385B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- signal
- feature
- target
- accumulated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、本発明の第1の実施形態に係るマルチモーダル信号探索装置の構成について説明する。図1に示すように、本発明の第1の実施形態に係るマルチモーダル信号探索装置100は、CPUと、RAMと、後述する学習信号処理ルーチン、蓄積信号処理ルーチン、及び探索処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。このマルチモーダル信号探索装置100は、機能的には図1に示すように学習信号取得部10と、蓄積信号取得部12と、目的信号取得部14と、演算部20と、出力部90とを含んで構成されている。
次に、本発明の第1の実施形態に係るマルチモーダル信号探索装置100の作用について説明する。マルチモーダル信号探索装置100は、学習信号取得部10によって学習信号の各々が取得されると、マルチモーダル信号探索装置100によって、図2に示す学習信号処理ルーチンが実行される。また、マルチモーダル信号探索装置100は、蓄積信号取得部12によって蓄積信号を受け付けると、マルチモーダル信号探索装置100によって、図3に示す蓄積信号処理ルーチンが実行される。また、マルチモーダル信号探索装置100は、目的信号取得部14によって目的信号を受け付けると、マルチモーダル信号探索装置100によって、図4に示す探索処理ルーチンが実行される。
次に、本発明の第2の実施形態に係るマルチモーダル信号探索装置の構成について説明する。図5に示すように、本発明の第2の実施形態に係るマルチモーダル信号探索装置200は、CPUと、RAMと、後述する学習信号処理ルーチン、蓄積信号処理ルーチン、及び探索処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。このマルチモーダル信号探索装置200は、機能的には図5に示すように学習信号取得部10と、蓄積信号取得部12と、目的信号取得部14と、演算部220と、出力部90とを含んで構成されている。
次に、本発明の第2の実施形態に係るマルチモーダル信号探索装置200の作用について説明する。マルチモーダル信号探索装置200は、学習信号取得部10によって学習信号の各々が取得されると、マルチモーダル信号探索装置によって、図2に示す学習信号処理ルーチンが実行される。また、マルチモーダル信号探索装置200は、蓄積信号取得部12によって蓄積信号を受け付けると、マルチモーダル信号探索装置200によって、図6に示す蓄積信号処理ルーチンが実行される。また、マルチモーダル信号探索装置200は、目的信号取得部14によって目的信号を受け付けると、マルチモーダル信号探索装置200によって、図7に示す探索処理ルーチンが実行される。なお、第2の実施形態に係る学習信号処理ルーチンについては、第1の実施形態に係る学習信号処理ルーチンと同様である為、説明を省略する。
次に、本発明の第3の実施形態に係るマルチモーダル信号探索装置の構成について説明する。図8に示すように、本発明の第3の実施形態に係るマルチモーダル信号探索装置300は、CPUと、RAMと、後述する学習信号処理ルーチン、蓄積信号処理ルーチン、及び探索処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。このマルチモーダル信号探索装置300は、機能的には図8に示すように学習信号取得部10と、蓄積信号取得部12と、目的信号取得部14と、演算部320と、出力部90とを含んで構成されている。
次に、本発明の第3の実施形態に係るマルチモーダル信号探索装置300の作用について説明する。マルチモーダル信号探索装置300は、学習信号取得部10によって学習信号の各々が取得されると、マルチモーダル信号探索装置によって、図2に示す学習信号処理ルーチンが実行される。また、マルチモーダル信号探索装置300は、蓄積信号取得部12によって蓄積信号を受け付けると、マルチモーダル信号探索装置300によって、図9に示す蓄積信号処理ルーチンが実行される。また、マルチモーダル信号探索装置300は、目的信号取得部14によって目的信号を受け付けると、マルチモーダル信号探索装置300によって、図10に示す探索処理ルーチンが実行される。なお、第3の実施形態に係る学習信号処理ルーチンについては、第1の実施形態に係る学習信号処理ルーチンと同様である為、説明を省略する。
実際に、上記の第1、第2、及び第3の実施形態に係るマルチモーダル信号探索装置における処理を実データに対して適用した例について以下で説明する。まず、実験では、ヒップホップダンスを対象としてデータ収集を行った。データ収集は、2タイプ行い、一つ目は、図11にようにウェアラブルなモーダルを用いたデータ収集、もう一つは、図12のように外部に設置されたモーダルを用いたデータ収集である。なお、図11の例においては、取得されるデータ等と部位等との組み合わせを表している。図11、及び図12のように本実験では、様々なモーダルでデータを収集しており、全ての組み合わせにおいて、発明技術を適用することができるが、検証では、画像信号データ、音声信号データ、加速度センサデータを対象にした。画像信号データは、演者の正面に設置した固定カメラを用いて収集したものを用い、音声信号データは、スピーカで流したダンスの曲をカメラに付属しているマイクによって収集したものを用い、加速度センサデータは、演者の頭頂部、胴部、両手首部、両足首部に装着したウェアラブルデバイスを用いて収集したものを使用した。
(2)目的信号、蓄積信号、学習信号いずれもモーダルM2のデータのみを用いるパターン。
(3)目的信号、蓄積信号、学習信号いずれもモーダルM1とモーダルM2を組み合わせたデータを用いるパターン。
(4)学習信号は、モーダルM1とモーダルM2を組み合わせたデータを用い、目的信号、蓄積信号はモーダルM1のみを用いるパターン。なお、目的特徴量子化部分および蓄積特徴量子化部で量子化をする際に、モーダルの不足が生じるが、その不足分については、値を無視する。
(5)学習信号は、モーダルM1とモーダルM2を組み合わせたデータを用い、目的信号、蓄積信号はモーダルM2のみを用いるパターン。なお、目的特徴量子化部分および蓄積特徴量子化部で量子化をする際に、モーダルの不足が生じるが、その不足分については、値を無視する。
(6)学習信号は、モーダルM1とモーダルM2を組み合わせたデータを用い、目的信号、蓄積信号はモーダルM1のみを用いるパターン。なお、目的特徴量子化部分および蓄積特徴量子化部で量子化をする際に、モーダルの不足が生じるが、その不足分については、ゼロを埋める。本実験では、特徴データの抽出の後処理として、中心化を行っているため、ゼロを埋めることは、特徴データの代表値の一つである平均値を埋めることに対応する。
(7)学習信号は、モーダルM1とモーダルM2を組み合わせたデータを用い、目的信号、蓄積信号はモーダルM2のみを用いるパターン。なお、目的特徴量子化部分および蓄積特徴量子化部で量子化をする際に、モーダルの不足が生じるが、その不足分については、ゼロを埋める。本実験では、特徴データの抽出の後処理として、中心化を行っているため、ゼロを埋めることは、特徴データの代表値の一つである平均値を埋めることに対応する。
(8)学習信号は、モーダルM1とモーダルM2を組み合わせたデータを用い、目的信号はモーダルM1のみ、蓄積信号はモーダルM2のみを用いるパターン。この場合、目的特徴量子化部分および蓄積特徴量子化部で量子化をする際に、モーダルの不足が生じるが、その不足分については、値を無視する。
(9)学習信号は、モーダルM1とモーダルM2を組み合わせたデータを用い、目的信号はモーダルM2のみ、蓄積信号はモーダルM1のみを用いるパターン。この場合、目的特徴量子化部分および蓄積特徴量子化部で量子化をする際に、モーダルの不足が生じるが、その不足分については、値を無視する。
12 蓄積信号取得部
14 目的信号取得部
20 演算部
22 学習特徴抽出部
24 学習部
26 変換テーブル記憶部
30 蓄積特徴抽出部
32 蓄積特徴量子化部
34 属性付与部
36 データベース作成部
38 データベース記憶部
40 目的特徴抽出部
42 目的特徴量子化部
44 探索部
90 出力部
100 マルチモーダル信号探索装置
200 マルチモーダル信号探索装置
220 演算部
232 蓄積特徴量子化部
242 目的特徴量子化部
300 マルチモーダル信号探索装置
320 演算部
332 蓄積特徴量子化部
342 目的特徴量子化部
Claims (9)
- 入力されたマルチモーダルである学習信号の各々について、特徴データを抽出する学習特徴抽出部と、
前記学習特徴抽出部において抽出した前記学習信号の各々の特徴データに基づいて、前記特徴データから共通の符号への変換テーブルを作成する学習部と、
入力されたシングルモーダル又はマルチモーダルである蓄積信号の各々について、特徴データを抽出する蓄積特徴抽出部と、
前記蓄積信号の各々について、前記蓄積特徴抽出部により抽出した前記蓄積信号の特徴データと、前記学習部により作成した変換テーブルとに基づいて、前記蓄積信号の特徴データを前記符号を用いた量子化データへ変換した蓄積量子化データを取得する蓄積特徴量子化部と、
前記蓄積信号の各々について、前記蓄積特徴量子化部により取得した前記蓄積信号の蓄積量子化データと前記蓄積信号の属性とを対応付けてデータベースに登録し、前記データベースを作成するデータベース作成部と、
を含む、学習装置。 - 入力されたシングルモーダル又はマルチモーダルである目的信号の各々について、特徴データを抽出する目的特徴抽出部と、
前記目的信号の各々について、前記目的特徴抽出部により抽出した前記目的信号の特徴データと、請求項1記載の学習装置において作成された変換テーブルとに基づいて、前記目的信号の特徴データを前記符号を用いた量子化データへ変換した目的量子化データを取得する目的特徴量子化部と、
前記目的信号の各々について、前記目的特徴量子化部により取得された前記目的信号の目的量子化データに基づいて、前記学習装置において作成されたデータベースから、前記目的量子化データに対応する前記蓄積量子化データに対応付けられている前記属性を探索する探索部と、
を含む、探索装置。 - 前記蓄積特徴量子化部は、前記蓄積信号の特徴データに、前記学習信号の前記マルチモーダルに含まれるモーダルに対応するデータが欠損している場合には、前記蓄積信号の特徴データの前記欠損している部分にゼロを埋めた特徴データと、前記変換テーブルとに基づいて、前記蓄積量子化データを取得し、又は、前記蓄積信号の特徴データと、前記変換テーブルとに基づいて、前記変換テーブルに格納されている前記特徴データの、前記欠損している部分に対応するデータを無視して、前記蓄積量子化データを取得し、又は、前記蓄積信号の特徴データの前記欠損している部分に、対応する前記学習信号の特徴データの代表値を埋めた特徴データと、前記変換テーブルとに基づいて、前記蓄積量子化データを取得する請求項1記載の学習装置。
- 前記目的特徴量子化部は、前記目的信号の特徴データに、前記学習信号の前記マルチモーダルに含まれるモーダルに対応するデータが欠損している場合には、前記目的信号の特徴データの前記欠損している部分にゼロを埋めた特徴データと、前記変換テーブルとに基づいて、前記目的量子化データを取得し、又は、前記目的信号の特徴データと、前記変換テーブルとに基づいて、前記変換テーブルに格納されている前記特徴データの、前記欠損している部分に対応するデータを無視して、前記目的量子化データを取得し、又は、前記目的信号の特徴データの前記欠損している部分に、対応する前記学習信号の特徴データの代表値を埋めた特徴データと、前記変換テーブルとに基づいて、前記目的量子化データを取得する請求項2記載の探索装置。
- 前記学習信号は、センサデータ又はメディアデータを2つ以上含み、
前記蓄積信号は、センサデータ又はメディアデータを1つ以上含み、
前記目的信号は、センサデータ又はメディアデータを1つ以上含む請求項2又は4記載の探索装置。 - 学習特徴抽出部と、学習部と、蓄積特徴抽出部と、蓄積特徴量子化部と、データベース作成部とを含む、学習装置における学習方法であって、
前記学習特徴抽出部は、入力されたマルチモーダルである学習信号の各々について、特徴データを抽出し、
前記学習部は、前記学習特徴抽出部において抽出した前記学習信号の各々の特徴データに基づいて、前記特徴データから共通の符号への変換テーブルを作成し、
前記蓄積特徴抽出部は、入力されたシングルモーダル又はマルチモーダルである蓄積信号の各々について、特徴データを抽出し、
前記蓄積特徴量子化部は、前記蓄積信号の各々について、前記蓄積特徴抽出部により抽出した前記蓄積信号の特徴データと、前記学習部により作成した変換テーブルとに基づいて、前記蓄積信号の特徴データを前記符号を用いた量子化データへ変換した蓄積量子化データを取得し、
前記データベース作成部は、前記蓄積信号の各々について、前記蓄積特徴量子化部により取得した前記蓄積信号の蓄積量子化データと前記蓄積信号の属性とを対応付けてデータベースに登録し、前記データベースを作成する
学習方法。 - 目的特徴抽出部と、目的特徴量子化部と、探索部とを含む、探索装置における探索方法であって、
前記目的特徴抽出部は、入力されたシングルモーダル又はマルチモーダルである目的信号の各々について、特徴データを抽出し、
前記目的特徴量子化部は、前記目的信号の各々について、前記目的特徴抽出部により抽出した前記目的信号の特徴データと、請求項6記載の学習方法において作成された変換テーブルとに基づいて、前記目的信号の特徴データを前記符号を用いた量子化データへ変換した目的量子化データを取得し、
前記探索部は、前記目的信号の各々について、前記目的特徴量子化部により取得された前記目的信号の目的量子化データに基づいて、前記学習装置において作成されたデータベースから、前記目的量子化データに対応する前記蓄積量子化データに対応付けられている前記属性を探索する
探索方法。 - コンピュータを、請求項1若しくは3に記載の学習装置の各部として機能させるためのプログラム。
- コンピュータを、請求項2、請求項4、若しくは請求項5に記載の探索装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015164218A JP6397385B2 (ja) | 2015-08-21 | 2015-08-21 | 学習装置、探索装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015164218A JP6397385B2 (ja) | 2015-08-21 | 2015-08-21 | 学習装置、探索装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017041206A JP2017041206A (ja) | 2017-02-23 |
JP6397385B2 true JP6397385B2 (ja) | 2018-09-26 |
Family
ID=58208814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015164218A Active JP6397385B2 (ja) | 2015-08-21 | 2015-08-21 | 学習装置、探索装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6397385B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200012941A1 (en) * | 2018-07-09 | 2020-01-09 | Tata Consultancy Services Limited | Method and system for generation of hybrid learning techniques |
JP7060852B2 (ja) * | 2018-10-18 | 2022-04-27 | 株式会社シンクアウト | 情報処理システム |
US11587305B2 (en) | 2019-03-14 | 2023-02-21 | Fujifilm Business Innovation Corp. | System and method for learning sensory media association without using text labels |
US20210012061A1 (en) * | 2019-07-12 | 2021-01-14 | Nec Laboratories America, Inc. | Supervised cross-modal retrieval for time-series and text using multimodal triplet loss |
US11520993B2 (en) * | 2019-07-24 | 2022-12-06 | Nec Corporation | Word-overlap-based clustering cross-modal retrieval |
US20210027157A1 (en) * | 2019-07-24 | 2021-01-28 | Nec Laboratories America, Inc. | Unsupervised concept discovery and cross-modal retrieval in time series and text comments based on canonical correlation analysis |
US11651037B2 (en) * | 2019-12-20 | 2023-05-16 | Rakuten Group, Inc. | Efficient cross-modal retrieval via deep binary hashing and quantization |
CN112488292B (zh) * | 2020-11-19 | 2024-02-02 | 杭州电子科技大学 | 一种面向通用多模态学习的神经框架搜索方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5458815B2 (ja) * | 2009-11-11 | 2014-04-02 | 株式会社デンソーアイティーラボラトリ | マルチメディア検索システム |
-
2015
- 2015-08-21 JP JP2015164218A patent/JP6397385B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017041206A (ja) | 2017-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6397385B2 (ja) | 学習装置、探索装置、方法、及びプログラム | |
CN107944020B (zh) | 人脸图像查找方法及装置、计算机装置和存储介质 | |
CN109670474B (zh) | 一种基于视频的人体姿态估计方法、装置及设备 | |
CN105574063B (zh) | 基于视觉显著性的图像检索方法 | |
JP6431302B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP6017335B2 (ja) | パターン認識装置、その方法、及び、そのプログラム | |
KR101581112B1 (ko) | 계층적 패턴 구조에 기반한 기술자 생성 방법 및 이를 이용한 객체 인식 방법과 장치 | |
US11301509B2 (en) | Image search system, image search method, and program | |
JP6203077B2 (ja) | 学習装置、密度計測装置、学習方法、学習プログラム、及び密度計測システム | |
KR101917369B1 (ko) | 컨볼루션 신경망을 이용한 영상 검색 방법 및 그 장치 | |
CN104615676B (zh) | 一种基于最大相似度匹配的图片检索方法 | |
CN111161314B (zh) | 目标对象的位置区域确定方法、装置、电子设备及存储介质 | |
JP2013206187A (ja) | 情報変換装置、情報検索装置、情報変換方法、情報検索方法、情報変換プログラム、情報検索プログラム | |
JP2015111339A (ja) | 画像検索システム、画像検索装置、検索サーバ装置、画像検索方法、及び画像検索プログラム | |
JP5014479B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
JP4721829B2 (ja) | 画像検索方法及び装置 | |
WO2021007999A1 (zh) | 视频帧处理方法及装置 | |
CN110163103B (zh) | 一种基于视频图像的生猪行为识别方法和装置 | |
CN114168768A (zh) | 图像检索方法及相关设备 | |
JP6452324B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP6393495B2 (ja) | 画像処理装置および物体認識方法 | |
JP5370267B2 (ja) | 画像処理システム | |
JP6220737B2 (ja) | 被写体領域抽出装置、方法、及びプログラム | |
CN106909894B (zh) | 车辆品牌型号识别方法和系统 | |
JP4382744B2 (ja) | 画像情報抽出方法及び画像情報検索方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170825 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180611 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180828 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180831 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6397385 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |