JP6797854B2 - 情報処理装置および情報処理方法 - Google Patents
情報処理装置および情報処理方法 Download PDFInfo
- Publication number
- JP6797854B2 JP6797854B2 JP2018050181A JP2018050181A JP6797854B2 JP 6797854 B2 JP6797854 B2 JP 6797854B2 JP 2018050181 A JP2018050181 A JP 2018050181A JP 2018050181 A JP2018050181 A JP 2018050181A JP 6797854 B2 JP6797854 B2 JP 6797854B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- information processing
- division
- unit
- analyzer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2137—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on criteria of topology preservation, e.g. multidimensional scaling or self-organising maps
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Molecular Biology (AREA)
- Quality & Reliability (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Description
・処理速度が速い(背景の評価をスキップできるため)
・照合:与えられた人物と同一人物か否かを判定する
なお、上記の分類には、人物の属性の推定の他、人物の動作等、人物に関する様々な情報、状態を推定することが含まれる。
・コアNN:過去に枠が何を見てきたかを「記憶」するNN
・移動NN:記憶に基づき、枠を最適な位置に移動させるNN
・分析NN:記憶に基づき、分析結果を出すNN
以下、図面を参照しながら、本発明の実施形態を説明する。まず、図1を用いて、本実施形態の情報処理装置を含むシステムの概要を説明する。
引き続き、図1を用いて、情報処理装置10の構成を説明する。情報処理装置10は、入力部11と、スケール予測部(予測部)12と、分割方法決定部13と、分割実行部14と、出力部15とを備える。
次に、図5を用いてシステムの処理手順を説明する。まず、情報処理装置10の入力部11は、入力データを受け付ける(S1)。次に、スケール予測部12は、入力データのスケールを予測する(S2)。そして、分割方法決定部13は、S2で予測された入力データのスケールに基づき、当該入力データを分割するか否か、また分割する場合、どの程度細かく分割するかを決定する(S3:分割方法決定)。
なお、入力データが、図6のように奥行感のある画像データである場合、分割方法決定部13は、遠景の部分は遠景の部分として、近景の部分は近景の部分として分割するような分割の方法を定めてもよい。例えば、分割方法決定部13は、図6に示す画像の奥の方は細かく(小さく)分割し、手前の方は粗く(大きく)分割するような分割の方法を定めてもよい。このようにすることで、入力データに奥行感のある画像データが含まれる場合でも、分析装置20に入力されるデータのスケールをできるだけ同じにすることができる。
また、上記の実施形態で述べた情報処理装置10の機能を実現するプログラムを所望の情報処理装置(コンピュータ)にインストールすることによって実装できる。例えば、パッケージソフトウェアやオンラインソフトウェアとして提供される上記のプログラムを情報処理装置に実行させることにより、情報処理装置を情報処理装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型またはノート型のパーソナルコンピュータ、ラック搭載型のサーバコンピュータ等が含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)等の移動体通信端末、さらには、PDA(Personal Digital Assistants)等がその範疇に含まれる。また、情報処理装置10を、クラウドサーバに実装してもよい。
11 入力部
12 スケール予測部
13 分割方法決定部
14 分割実行部
15 出力部
20 分析装置
Claims (8)
- データの特徴部を抽出し、分析を行う分析装置で用いられるデータの前処理を行う情報
処理装置であって、
前記データの入力を受け付ける入力部と、
データごとに、前記データにおける特徴部の占める割合を示した訓練データを用いた機
械学習により、前記データに対する前記特徴部の占める割合を予測する予測部と、
前記予測された割合に応じて、前記データに対する分割の方法を決定する分割方法決定
部と、
前記決定した分割の方法に基づき、前記データに対して分割を実行する分割実行部と、
を備えることを特徴とする情報処理装置。 - データの特徴部を抽出し、分析を行う分析装置で用いられるデータの前処理を行う情報処理装置であって、
前記データの入力を受け付ける入力部と、
前記データに対する前記特徴部の占める割合を予測する予測部と、
前記データに対する前記特徴部の占める割合が所定値以下である場合、前記データに対
して分割を行うと判定する、分割の方法を決定する分割方法決定部と、
前記決定した分割の方法に基づき、前記データに対して分割を実行する分割実行部と、
を備えることを特徴とする情報処理装置。 - データの特徴部を抽出し、分析を行う分析装置で用いられるデータの前処理を行う情報処理装置であって、
前記データとしてテキストデータの入力を受け付ける入力部と、
前記データに対する前記特徴部として、前記テキストデータに含まれる所定のキーワードの占める割合を予測する予測部と、
前記予測された割合に応じて、前記データに対する分割の方法を決定する分割方法決定部と、
前記決定した分割の方法に基づき、前記データに対して分割を実行する分割実行部と、
を備えることを特徴とする情報処理装置。 - 前記分割方法決定部は、
前記データに対する前記特徴部の占める割合が小さいほど、前記データを細かく分割すると判定する
ことを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。 - 前記データは、画像データ、映像データ、音声データ、または時系列のセンサデータであり、
前記特徴部は、前記画像データ、前記映像データに写る被写体の部分、前記音声データに含まれる、人間の音声、所定の人物の音声、所定の単語を示す音声、および、所定の周波数帯域の音声のいずれかまたはこれらの組み合わせ、または前記時系列のセンサデータに含まれる所定のセンサ値のパターンである
ことを特徴とする請求項1または2に記載の情報処理装置。 - データの特徴部を抽出し、分析を行う分析装置で用いられるデータの前処理を行う情報
処理装置により実行される情報処理方法であって、
前記データの入力を受け付けるステップと、
データごとに、前記データにおける特徴部の占める割合を示した訓練データを用いた機
械学習により、前記データに対する前記特徴部の占める割合を予測するステップと、
前記予測された割合に応じて、前記データに対する分割の方法を決定するステップと、
前記決定した分割の方法に基づき、前記データに対して分割を実行するステップと
を含んだことを特徴とする情報処理方法。 - データの特徴部を抽出し、分析を行う分析装置で用いられるデータの前処理を行う情報
処理装置により実行される情報処理方法であって、
前記データの入力を受け付けるステップと、
前記データに対する前記特徴部の占める割合を予測するステップと、
前記データに対する前記特徴部の占める割合が所定値以下である場合、前記データに対
して分割を行うと判定する、分割の方法を決定するステップと、
前記決定した分割の方法に基づき、前記データに対して分割を実行するステップと
を含んだことを特徴とする情報処理方法。 - データの特徴部を抽出し、分析を行う分析装置で用いられるデータの前処理を行う情報
処理装置により実行される情報処理方法であって、
前記データとしてテキストデータの入力を受け付けるステップと、
前記データに対する前記特徴部として、前記テキストデータに含まれる所定のキーワードの占める割合を予測するステップと、
前記予測された割合に応じて、前記データに対する分割の方法を決定するステップと、
前記決定した分割の方法に基づき、前記データに対して分割を実行するステップと
を含んだことを特徴とする情報処理方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018050181A JP6797854B2 (ja) | 2018-03-16 | 2018-03-16 | 情報処理装置および情報処理方法 |
US16/971,313 US20210081821A1 (en) | 2018-03-16 | 2019-03-14 | Information processing device and information processing method |
PCT/JP2019/010714 WO2019177130A1 (ja) | 2018-03-16 | 2019-03-14 | 情報処理装置および情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018050181A JP6797854B2 (ja) | 2018-03-16 | 2018-03-16 | 情報処理装置および情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019160240A JP2019160240A (ja) | 2019-09-19 |
JP6797854B2 true JP6797854B2 (ja) | 2020-12-09 |
Family
ID=67907892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018050181A Active JP6797854B2 (ja) | 2018-03-16 | 2018-03-16 | 情報処理装置および情報処理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210081821A1 (ja) |
JP (1) | JP6797854B2 (ja) |
WO (1) | WO2019177130A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11250243B2 (en) * | 2019-03-26 | 2022-02-15 | Nec Corporation | Person search system based on multiple deep learning models |
JP7239050B2 (ja) * | 2020-02-14 | 2023-03-14 | 日本電信電話株式会社 | 画像処理装置、画像処理システム、画像処理方法、および画像処理プログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6714925B1 (en) * | 1999-05-01 | 2004-03-30 | Barnhill Technologies, Llc | System for identifying patterns in biological data using a distributed network |
US7194752B1 (en) * | 1999-10-19 | 2007-03-20 | Iceberg Industries, Llc | Method and apparatus for automatically recognizing input audio and/or video streams |
WO2008126347A1 (ja) * | 2007-03-16 | 2008-10-23 | Panasonic Corporation | 音声分析装置、音声分析方法、音声分析プログラム、及びシステム集積回路 |
JP4894741B2 (ja) * | 2007-12-03 | 2012-03-14 | ソニー株式会社 | 情報処理装置および情報処理方法、プログラム、並びに記録媒体 |
JP5441670B2 (ja) * | 2009-12-22 | 2014-03-12 | キヤノン株式会社 | 画像処理装置及びその制御方法 |
US9570087B2 (en) * | 2013-03-15 | 2017-02-14 | Broadcom Corporation | Single channel suppression of interfering sources |
US10561361B2 (en) * | 2013-10-20 | 2020-02-18 | Massachusetts Institute Of Technology | Using correlation structure of speech dynamics to detect neurological changes |
US11619983B2 (en) * | 2014-09-15 | 2023-04-04 | Qeexo, Co. | Method and apparatus for resolving touch screen ambiguities |
US9305530B1 (en) * | 2014-09-30 | 2016-04-05 | Amazon Technologies, Inc. | Text synchronization with audio |
JP2015097089A (ja) * | 2014-11-21 | 2015-05-21 | 株式会社Jvcケンウッド | 対象物検出装置、対象物検出方法 |
JP6116765B1 (ja) * | 2015-12-02 | 2017-04-19 | 三菱電機株式会社 | 物体検出装置及び物体検出方法 |
US10215830B2 (en) * | 2015-12-16 | 2019-02-26 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Automated cancer detection using MRI |
US11797837B2 (en) * | 2017-04-24 | 2023-10-24 | Intel Corporation | Dynamic distributed training of machine learning models |
US20190272375A1 (en) * | 2019-03-28 | 2019-09-05 | Intel Corporation | Trust model for malware classification |
-
2018
- 2018-03-16 JP JP2018050181A patent/JP6797854B2/ja active Active
-
2019
- 2019-03-14 WO PCT/JP2019/010714 patent/WO2019177130A1/ja active Application Filing
- 2019-03-14 US US16/971,313 patent/US20210081821A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20210081821A1 (en) | 2021-03-18 |
WO2019177130A1 (ja) | 2019-09-19 |
JP2019160240A (ja) | 2019-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021203863A1 (zh) | 基于人工智能的物体检测方法、装置、设备及存储介质 | |
CN110020592B (zh) | 物体检测模型训练方法、装置、计算机设备及存储介质 | |
US20190251333A1 (en) | Face detection training method and apparatus, and electronic device | |
KR20130095727A (ko) | 비디오 내 객체들의 시맨틱 파싱 | |
US9311729B2 (en) | Information processing apparatus, information processing method, and program | |
CN113656582B (zh) | 神经网络模型的训练方法、图像检索方法、设备和介质 | |
CN113065614B (zh) | 分类模型的训练方法和对目标对象进行分类的方法 | |
US11170512B2 (en) | Image processing apparatus and method, and image processing system | |
CN110059156A (zh) | 基于关联词的协同检索方法、装置、设备及可读存储介质 | |
CN109255289A (zh) | 一种基于统一式生成模型的跨衰老人脸识别方法 | |
CN113869449A (zh) | 一种模型训练、图像处理方法、装置、设备及存储介质 | |
US20170213074A1 (en) | Decoy-based matching system for facial recognition | |
JP6797854B2 (ja) | 情報処理装置および情報処理方法 | |
US11809990B2 (en) | Method apparatus and system for generating a neural network and storage medium storing instructions | |
CN112052816B (zh) | 基于自适应图卷积对抗网络的人体行为预测方法及系统 | |
CN113989519B (zh) | 一种长尾目标检测方法及系统 | |
CN110717407A (zh) | 基于唇语密码的人脸识别方法、装置及存储介质 | |
WO2015031350A1 (en) | Systems and methods for memory utilization for object detection | |
CN110704678B (zh) | 评估排序方法、评估排序系统、计算机装置及储存介质 | |
CN114168788A (zh) | 音频审核的处理方法、装置、设备及存储介质 | |
EP3816996A1 (en) | Information processing device, control method, and program | |
WO2020151530A1 (zh) | 服装的计件方法、装置及设备 | |
WO2018035768A1 (zh) | 一种候选框尺度的获取方法及装置 | |
KR20220017673A (ko) | 딥러닝 기반 클래스 분류 장치 및 방법 | |
Alizadeh et al. | Automatic detection of people getting into a bus in a smart public transportation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201029 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6797854 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |