JP5174068B2 - 信号分類装置 - Google Patents
信号分類装置 Download PDFInfo
- Publication number
- JP5174068B2 JP5174068B2 JP2010055103A JP2010055103A JP5174068B2 JP 5174068 B2 JP5174068 B2 JP 5174068B2 JP 2010055103 A JP2010055103 A JP 2010055103A JP 2010055103 A JP2010055103 A JP 2010055103A JP 5174068 B2 JP5174068 B2 JP 5174068B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- unit
- classification
- neighboring
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
された各種制御プログラムとの協働により各種処理を実行し、信号分類装置100を構成
する各部の動作を統括的に制御する。また、CPU101は、ROM104に予め記憶さ
れた所定のプログラムとの協働により、後述する取得部10、選択部11、決定部12、
クラスタリング部13、管理部14の各機能部を実現させる。 操作部102は、各種入
力キー等を備え、ユーザから操作入力された情報を入力信号として受け付け、その入力信
号をCPU101に出力する。
から、特徴が類似したk個(1≦k≦N−2)の第1近傍特徴を選択する第1の選択部と、互
いに類似する特徴量から特許群を生成し、異なる特徴群に属するu個の第2近傍特徴を選
択する第2の選択部とからなる。特徴群は、取得部10が取得した特徴量の中から、類似
した特徴同士を群として纏めたものである。特徴群の生成は、特徴量間の類似度を計算す
る過程で逐次的に実行できる簡易的な処理であれば良い。選択部11は、取得したN個の
特徴量を用いて、複数の特徴群を生成する。選択部11は、選択した第1近傍特徴及び第
2近傍特徴を決定部12に出力する。
まず、入力部106を介して識別対象となる信号が入力される(図3のステップS101)。取得部10は、入力された識別対象から特徴量を取得する(図3のステップS102、図4の動作例O1参照)。取得部10は、取得した特徴量を選択部11に出力する。
3のステップS109)。閾値ths又は閾値thcの変更が必要な場合には(図3のス
テップS109のYes)、閾値thsの変更が必要であるかをチェックする(図3のス
テップS110)。閾値thsの変更が必要な場合には(図3のステップS110のYe
s)、閾値ths及び閾値thcの値を決定部12に出力し、ステップS105に戻る。
閾値thsの変更が必要ない場合は(図3のステップS110のNo)、閾値thcの値
を決定部12に出力し、ステップS106に戻る。閾値ths及び閾値thcの変更が必
要ない場合には(図3のステップS109のNo)、処理を終了する。なお、管理部14
から変更された閾値ths及び閾値thcを取得した決定部12は、閾値にあわせて再度
テーブルを作成する。
プS205)、第1近傍特徴及び第2近傍特徴の中から、特徴量または追加特徴量毎に同
じクラスに分類する特徴量または追加特徴量を決定する(図14のステップS206)。
決定部22は決定した結果を参照できるテーブルを作成し(図14のステップS207)
、分類部13に出力する。
グラムとの協働により実現される機能部である。
判定部は識別対象のもつ個別情報によって修正候補の判定を行ってもよい。
これらにより、ひとつのクラスに分類される特徴群(図26(b))を複数のクラスに適切に分離することが可能になり、メモリ容量を要さずにより精度の高い分類が可能となる。
10・・・取得部、11、22・・・選択部、12・・・決定部、13・・・分類部、34、14・・・管理部、25・・・追加取得部、26・・・更新部、37・・・表示部、46・・・判定部
Claims (11)
- 入力された信号に含まれるN個の識別対象の特徴量を取得する取得部と、
前記特徴量毎に、前記特徴量からk個(1≦k≦N−2)の前記特徴量を第1近傍特徴として選択する第1の選択部と、
互いに類似する前記特徴量から特徴群を生成し、取得したN個の前記特徴量から異なる前記特徴群に属するu個(1≦k+u≦N−2)の前記特徴量を第2の近傍特徴として選択する第2の選択部と、
前記特徴量毎に選択した前記第1近傍特徴または前記第2近傍特徴との類似性の高さを反映したスコアを前記第1または前記第2近傍特徴毎に求め、該スコアの総計を前記特徴量の周辺密度とし、
前記周辺密度よりも高い周辺密度を持つ前記近傍特徴の中で、類似性が所定の閾値を上回る前記近傍特徴を同じ分類となる特徴量として決定する決定部と、
前記特徴量の決定結果から分類を行う分類部と、
前記閾値を管理する管理部と、
を備えたことを特徴とする信号分類装置。 - 追加するM個の識別対象の特徴量を取得する追加取得部と、
追加された前記特徴量を含む前記特徴量について、特徴量の類似したk個(1≦k≦N+M−2)の第1の近傍特徴と、前記特徴群が異なるu個(1≦k+u≦N+M−2)の第2の近傍特徴とを選択し、前記追加された特徴量夫々についてk個の第1近傍特徴及びu個の第2近傍特徴を選択する第3の選択部をさらに備えることを特徴とする請求項1記載の信号分類装置。 - 前記追加取得部は、取得数(M)に応じて、前記第1の近傍特徴の選択数k及び前記第2の近傍特徴の選択数uを変更することを特徴とする請求項2に記載の信号分類装置。
- 前記決定部は前記特徴量が互いの近傍特徴であるか否か、あるいは前記特徴量が共通の近傍特徴を有するか否かの参照関係に関する情報によって、分類を判定する判定部を更に備えることを特徴とする請求項1または2に記載の信号分類装置。
- 前記取得部は前記入力信号として画像を取得し、
前記参照関係に関する情報が、前記識別対象が同じ前記画像から取得されたものであることを示す情報を更に含むことを特徴とする請求項4に記載の信号分類装置。 - 前記特徴量の参照関係に関する情報を取得する更新情報取得部を更に有することを特徴とする請求項4または5に記載の信号分類装置。
- 前記分類部の分類に基づいて、前記識別対象の分類結果を表示する表示部をさらに備える請求項1乃至6いずれか1項に記載の信号分類装置。
- 前記分類部は、前記分類結果の中で類似した特徴量を持つ分類を一つに統合することを特徴とする請求項1乃至7いずれか1項に記載の信号分類装置。
- 前記管理部は、前記閾値を新たに取得し取得した値に変更することを特徴とする請求項1乃至8に記載の信号分類装置。
- 前記決定部は、前記特徴量と決定した分類とを組とする表形式のデータとして保持し、該当データを用いて分類を行うこと特徴とする請求項1乃至9いずれか1項記載の信号分類装置。
- 前記決定部は、前記特徴量と決定した分類とを組とする表形式のデータとして保持し、前記第3の選択部の結果を用いて、前記表形式のデータを作成することを特徴とする請求項2または3に記載の信号分類装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010055103A JP5174068B2 (ja) | 2010-03-11 | 2010-03-11 | 信号分類装置 |
US12/923,277 US8675973B2 (en) | 2010-03-11 | 2010-09-13 | Signal classification apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010055103A JP5174068B2 (ja) | 2010-03-11 | 2010-03-11 | 信号分類装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011191824A JP2011191824A (ja) | 2011-09-29 |
JP5174068B2 true JP5174068B2 (ja) | 2013-04-03 |
Family
ID=44560029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010055103A Expired - Fee Related JP5174068B2 (ja) | 2010-03-11 | 2010-03-11 | 信号分類装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8675973B2 (ja) |
JP (1) | JP5174068B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9536526B2 (en) | 2014-09-22 | 2017-01-03 | Kabushiki Kaisha Toshiba | Electronic device with speaker identification, method and storage medium |
US10089061B2 (en) | 2015-08-28 | 2018-10-02 | Kabushiki Kaisha Toshiba | Electronic device and method |
EP3410396A1 (en) | 2017-05-29 | 2018-12-05 | Kabushiki Kaisha Toshiba | Moving object tracking apparatus, moving object tracking method, and computer-readable medium |
US10592198B2 (en) | 2014-06-27 | 2020-03-17 | Toshiba Client Solutions CO., LTD. | Audio recording/playback device |
US10770077B2 (en) | 2015-09-14 | 2020-09-08 | Toshiba Client Solutions CO., LTD. | Electronic device and method |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8478053B2 (en) * | 2009-07-15 | 2013-07-02 | Nikon Corporation | Image sorting apparatus |
JP5259670B2 (ja) | 2010-09-27 | 2013-08-07 | 株式会社東芝 | コンテンツ要約装置およびコンテンツ要約表示装置 |
KR20120052636A (ko) * | 2010-11-16 | 2012-05-24 | 한국전자통신연구원 | 온톨로지 기반의 품목분류코드 추천 시스템 및 방법 |
US8811754B2 (en) * | 2011-08-29 | 2014-08-19 | Lawrence Livermore National Security, Llc | Spatial clustering of pixels of a multispectral image |
WO2014109040A1 (ja) * | 2013-01-10 | 2014-07-17 | 富士通株式会社 | 制御方法、制御プログラム、および制御装置 |
JP6085538B2 (ja) * | 2013-09-02 | 2017-02-22 | 本田技研工業株式会社 | 音響認識装置、音響認識方法、及び音響認識プログラム |
AU2015218184B2 (en) * | 2014-02-14 | 2019-08-01 | Commonwealth Scientific And Industrial Research Organisation | Processing hyperspectral or multispectral image data |
JP6509516B2 (ja) | 2014-09-29 | 2019-05-08 | Dynabook株式会社 | 電子機器、方法及びプログラム |
US20160163331A1 (en) * | 2014-12-04 | 2016-06-09 | Kabushiki Kaisha Toshiba | Electronic device and method for visualizing audio data |
JP6464411B6 (ja) * | 2015-02-25 | 2019-03-13 | Dynabook株式会社 | 電子機器、方法及びプログラム |
US9928408B2 (en) * | 2016-06-17 | 2018-03-27 | International Business Machines Corporation | Signal processing |
KR102505719B1 (ko) * | 2016-08-12 | 2023-03-03 | 삼성전자주식회사 | 음성 인식이 가능한 디스플레이 장치 및 방법 |
CN108268899B (zh) * | 2018-01-22 | 2019-03-01 | 清华大学 | 一种电子元件的检测方法、装置和设备 |
CN111310664B (zh) * | 2020-02-18 | 2022-11-22 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7756341B2 (en) * | 2005-06-30 | 2010-07-13 | Xerox Corporation | Generic visual categorization method and system |
US7680748B2 (en) * | 2006-02-02 | 2010-03-16 | Honda Motor Co., Ltd. | Creating a model tree using group tokens for identifying objects in an image |
-
2010
- 2010-03-11 JP JP2010055103A patent/JP5174068B2/ja not_active Expired - Fee Related
- 2010-09-13 US US12/923,277 patent/US8675973B2/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10592198B2 (en) | 2014-06-27 | 2020-03-17 | Toshiba Client Solutions CO., LTD. | Audio recording/playback device |
US9536526B2 (en) | 2014-09-22 | 2017-01-03 | Kabushiki Kaisha Toshiba | Electronic device with speaker identification, method and storage medium |
US10089061B2 (en) | 2015-08-28 | 2018-10-02 | Kabushiki Kaisha Toshiba | Electronic device and method |
US10770077B2 (en) | 2015-09-14 | 2020-09-08 | Toshiba Client Solutions CO., LTD. | Electronic device and method |
EP3410396A1 (en) | 2017-05-29 | 2018-12-05 | Kabushiki Kaisha Toshiba | Moving object tracking apparatus, moving object tracking method, and computer-readable medium |
US10891740B2 (en) | 2017-05-29 | 2021-01-12 | Kabushiki Kaisha Toshiba | Moving object tracking apparatus, moving object tracking method, and computer program product |
Also Published As
Publication number | Publication date |
---|---|
JP2011191824A (ja) | 2011-09-29 |
US20110222785A1 (en) | 2011-09-15 |
US8675973B2 (en) | 2014-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5174068B2 (ja) | 信号分類装置 | |
JP6596376B2 (ja) | 話者識別方法及び話者識別装置 | |
JP4728972B2 (ja) | インデキシング装置、方法及びプログラム | |
JP5576384B2 (ja) | データ処理装置 | |
US8170702B2 (en) | Method for classifying audio data | |
US20240205368A1 (en) | Methods and Apparatus for Displaying, Compressing and/or Indexing Information Relating to a Meeting | |
CN109493881B (zh) | 一种音频的标签化处理方法、装置和计算设备 | |
JP5356527B2 (ja) | 信号分類装置 | |
JP4274221B2 (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 | |
JP5500024B2 (ja) | 画像認識方法及び装置並びにプログラム | |
CN110457577B (zh) | 数据处理方法、装置、设备和计算机存储介质 | |
JP2014219557A (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP3903610B2 (ja) | 検索装置、検索方法及び検索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
WO2015114216A2 (en) | Audio signal analysis | |
JP4759745B2 (ja) | 映像分類装置、映像分類方法、映像分類プログラムおよびコンピュータ読取可能な記録媒体 | |
CN110399522B (zh) | 一种基于lstm与分层匹配的音乐哼唱检索方法及装置 | |
Gingras et al. | A three-parameter model for classifying anurans into four genera based on advertisement calls | |
JP6676009B2 (ja) | 話者判定装置、話者判定情報生成方法、プログラム | |
JP2013097645A (ja) | 認識支援装置、認識支援方法、およびプログラム | |
JP2015225410A (ja) | 認識装置、方法及びプログラム | |
JP4447602B2 (ja) | 信号検出方法,信号検出システム,信号検出処理プログラム及びそのプログラムを記録した記録媒体 | |
CN111737513B (zh) | 一种针对海量音乐数据的哼唱检索系统 | |
JP2002073076A (ja) | パターン認識方法、パターン認識装置及び記録媒体 | |
KR101520572B1 (ko) | 음악에 대한 복합 의미 인식 방법 및 그 장치 | |
CN117828537B (zh) | 一种基于cba模型的音乐情感识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110916 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111125 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20111205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120313 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120601 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120831 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121227 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160111 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |