JP5190840B2 - 複数音識別装置 - Google Patents
複数音識別装置 Download PDFInfo
- Publication number
- JP5190840B2 JP5190840B2 JP2008073429A JP2008073429A JP5190840B2 JP 5190840 B2 JP5190840 B2 JP 5190840B2 JP 2008073429 A JP2008073429 A JP 2008073429A JP 2008073429 A JP2008073429 A JP 2008073429A JP 5190840 B2 JP5190840 B2 JP 5190840B2
- Authority
- JP
- Japan
- Prior art keywords
- neuron
- sound
- neurons
- competitive learning
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
then y(t)=1,ET(t)=0
else y(t)=0,ET(t)=ET(t−△t)+△t
パラメータτ、w1、w2、…、wN、THは、各PNモデルにより可変の値であり、この組合せにより各PNモデルの動作は決定される。
比較例として、従来のCONPを用いて実験したものを示す。CONPとしては、8個のCLニューロン51を1列に並べたものを使用した。すなわち、h番(h=2〜7)のCLニューロン51と(h−1)番及び(h+1)番のCLニューロン51とは隣接するが、1番と8番のCLニューロン51は隣接しない。
2.自動車の走行音と救急車のサイレンとの合成音(自動車&救急車)
3.自動車の走行音と2kHzの純音との合成音(自動車&2kHz)
4.240Hzの純音と救急車のサイレンとの合成音(240Hz&救急車)
5.240Hzの純音と2kHzの純音との合成音(240Hz&2kHz)
6.救急車のサイレンと2kHzの純音との合成音(救急車&2kHz)
学習後、上記6種類の合成音を認識させた結果を表2に示す。この表は、例えば「自動車&240Hz」を入力した場合、自動車の音を示すCLニューロン51(表では「自動車」と表記)の認識率は67.6%、240Hzの純音を示すCLニューロン51(表では「240Hz」と表記)の認識率は21.9%、救急車のサイレンを示すCLニューロン51(表では「救急車」と表記)の認識率は8.2%、2Hzの純音を示すCLニューロン51(表では「2kHz」と表記)の認識率は2.3%であることを示している。なお、認識率=(認識単位時間あたりのそのCLニューロン51の発火数)÷(認識単位時間あたりのすべてのCLニューロン51の発火数)×100で計算した。認識単位時間は1secとした。
CONPは、入力に対してCLニューロン51を1つだけ発火させようとするものである。したがって、合成音に対しても1つの音しか識別できないこととなる。そこで、認識率が最も高かったCLニューロン51によって示された音に対応するCLニューロン51(すなわち、識別された音を示すCLニューロン51)をすべて削除する(具体的には、CLニューロン51の出力を「0」にする。)ことによって、次に特徴の強い音を検出させることとする。
しかし、表3から分かるように、実験例1では「自動車&救急車」、「240Hz&救急車」の場合に次に識別された音は、それぞれ「240Hz」、「自動車」であり、誤認識している。これは、先に識別した音に対応するCLニューロン51を削除しても、先に識別した音に近い音が次に認識され易いからではないかと考えられる。
学習用データ及びテスト用データとして、救急車のサイレン、自動車の走行音、自転車のベル音の3種の音を、表6に示すような各環境で録音し、サンプリング周波数16kHz、量子化ビット数8bitで、最大音量を揃えた1秒間の音を作った。
51…競合学習ニューロン
60…制御ニューロン群
40…調整値計算部
Claims (2)
- 音から生成されたパルス信号が入力されて、該入力パルス信号と結合重みとを用いて演算された内部電位値が閾値を超えたときに発火するように構成された複数個の競合学習パルスニューロンモデル部(以下、「競合学習ニューロン」という。)と、
前記競合学習ニューロンの複数発火と無発火とを検出する検出手段と、
を備え、
前記検出手段からの出力を用いて、結合重みから構成される参照ベクトルが入力パルス信号から構成される入力ベクトルに最も近い前記競合学習ニューロンのみが発火する方向に、制御を行うように構成された複数音識別装置であって、
認識単位時間内にいずれの前記競合学習ニューロンの発火頻度が最大になったかによって、1の音源種類の特定情報を出力した後、該特定情報で特定された音源種類を示す前記競合学習ニューロンの出力を0にして、次の認識単位時間内にいずれの前記競合学習ニューロンの発火頻度が最大になったかによって、他の音源種類の特定情報を出力することを特徴とする複数音識別装置。 - 前記1の音源種類の特定情報で特定された音源種類を示す前記競合学習ニューロンの出力を0にするとともに、発火頻度が最大となった前記競合学習ニューロンの結合重みに基づいて前記各競合学習ニューロンの結合重みを減少させて、次の認識単位時間内にいずれの前記競合学習ニューロンの発火頻度が最大になったかによって、他の音源種類の特定情報を出力することを特徴とする請求項1記載の複数音識別装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008073429A JP5190840B2 (ja) | 2008-03-21 | 2008-03-21 | 複数音識別装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008073429A JP5190840B2 (ja) | 2008-03-21 | 2008-03-21 | 複数音識別装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009230337A JP2009230337A (ja) | 2009-10-08 |
JP5190840B2 true JP5190840B2 (ja) | 2013-04-24 |
Family
ID=41245673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008073429A Expired - Fee Related JP5190840B2 (ja) | 2008-03-21 | 2008-03-21 | 複数音識別装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5190840B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9269045B2 (en) * | 2014-02-14 | 2016-02-23 | Qualcomm Incorporated | Auditory source separation in a spiking neural network |
JP6864085B2 (ja) | 2017-04-10 | 2021-04-21 | ソフトバンク株式会社 | 情報処理装置、情報処理方法、およびプログラム |
WO2018189793A1 (ja) | 2017-04-10 | 2018-10-18 | ソフトバンク株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP6864084B2 (ja) * | 2017-04-10 | 2021-04-21 | ソフトバンク株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4972739B2 (ja) * | 2006-09-19 | 2012-07-11 | 国立大学法人 名古屋工業大学 | 音学習装置 |
-
2008
- 2008-03-21 JP JP2008073429A patent/JP5190840B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009230337A (ja) | 2009-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10373609B2 (en) | Voice recognition method and apparatus | |
KR101844932B1 (ko) | 신호처리 알고리즘이 통합된 심층 신경망 기반의 음성인식 장치 및 이의 학습방법 | |
KR102137151B1 (ko) | 노이즈 캔슬링 장치 및 그 방법 | |
US9524730B2 (en) | Monaural speech filter | |
US5749072A (en) | Communications device responsive to spoken commands and methods of using same | |
JP3987429B2 (ja) | 音響環境状況の決定方法及び装置、同方法の使用及び聴音装置 | |
KR102605736B1 (ko) | 주파수 변화에 강인한 음향 이벤트 검출 방법 및 그 장치 | |
JP2008085472A (ja) | 音源定位・同定装置 | |
JP5190840B2 (ja) | 複数音識別装置 | |
CN111133511A (zh) | 声源分离系统 | |
WO2005029467A1 (en) | A method for recovering target speech based on amplitude distributions of separated signals | |
JP2020533723A (ja) | パターン認識装置、パターン認識方法、及びパターン認識プログラム | |
Katthi et al. | Deep canonical correlation analysis for decoding the auditory brain | |
US8335332B2 (en) | Fully learning classification system and method for hearing aids | |
Geirnaert et al. | Time-adaptive unsupervised auditory attention decoding using EEG-based stimulus reconstruction | |
CN117234455B (zh) | 基于环境感知的音频装置智能控制方法及系统 | |
US7085685B2 (en) | Device and method for filtering electrical signals, in particular acoustic signals | |
CN109634554B (zh) | 用于输出信息的方法和装置 | |
CN114189795B (zh) | 助听器尖峰噪声自适应调节方法及设备 | |
Mogridge et al. | Non-Intrusive Speech Intelligibility Prediction for Hearing-Impaired Users using Intermediate ASR Features and Human Memory Models | |
JP4972739B2 (ja) | 音学習装置 | |
CN112349298A (zh) | 声音事件识别方法、装置、设备和存储介质 | |
JP5131416B2 (ja) | 適応フィルタの制御装置及び適応フィルタの制御方法 | |
Luberadzka et al. | Estimating fundamental frequency and formants based on periodicity glimpses: A deep learning approach | |
KR101619265B1 (ko) | 음성 인식 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121225 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130122 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5190840 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160208 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |