JP5279010B2 - Wearable sound recognition device - Google Patents

Wearable sound recognition device Download PDF

Info

Publication number
JP5279010B2
JP5279010B2 JP2008250268A JP2008250268A JP5279010B2 JP 5279010 B2 JP5279010 B2 JP 5279010B2 JP 2008250268 A JP2008250268 A JP 2008250268A JP 2008250268 A JP2008250268 A JP 2008250268A JP 5279010 B2 JP5279010 B2 JP 5279010B2
Authority
JP
Japan
Prior art keywords
sound source
vibration
sound
input
neuron
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008250268A
Other languages
Japanese (ja)
Other versions
JP2010079182A (en
Inventor
彰 岩田
Original Assignee
国立大学法人 名古屋工業大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立大学法人 名古屋工業大学 filed Critical 国立大学法人 名古屋工業大学
Priority to JP2008250268A priority Critical patent/JP5279010B2/en
Publication of JP2010079182A publication Critical patent/JP2010079182A/en
Application granted granted Critical
Publication of JP5279010B2 publication Critical patent/JP5279010B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

本発明は、聴覚障害者等が身に着けることができて、聴覚障害者等に音の方向と種類とを知らせることが可能なウェアラブル音認識装置に関する。   The present invention relates to a wearable sound recognition device that can be worn by a hearing-impaired person or the like and can inform the hearing-impaired person or the like of the direction and type of sound.

音による周辺環境把握の基本機能は、音源方向を識別する音源定位と、音源種類を識別する音源認識(音源同定)である。聴覚障害者等に日常的に周囲音を知らせるには、聴覚障害者等が身に着けられる、すなわち、ウェアラブルな装置であることが望ましい。下記特許文献1には、周囲音を視覚的に認識し得る眼鏡型の聴覚障害者用ヘッドマウントディスプレイ装置が記載されている。   The basic functions of grasping the surrounding environment by sound are sound source localization for identifying the sound source direction and sound source recognition (sound source identification) for identifying the sound source type. In order to inform a hearing-impaired person or the like of ambient sounds on a daily basis, it is desirable that the hearing-impaired person or the like be worn, that is, a wearable device. The following Patent Document 1 describes a spectacle-type head mounted display device for a hearing impaired person that can visually recognize ambient sounds.

なお、出願人による関連する出願に、下記特許文献2〜4がある。また、下記特許文献5、非特許文献1、2には、ニューラルネットワークを用いた音源認識装置(音源同定装置)が記載され、下記非特許文献3〜5には、ニューラルネットワークを用いた音源定位装置が記載されている。さらに、関連する文献として下記非特許文献6〜9がある。
特開2007―334149号公報 特開2007−164027号公報 特開2008−77177号公報 特開2008−85472号公報 特許第3164100号公報 坂口晋也、「パルスニューロンモデルを用いた音源認識に関する研究」、名古屋工業大学平成9年度卒業論文、1998年3月 坂口晋也、黒柳奨、岩田彰、「環境把握のための音源識別システム」、電子情報通信学会NC研究会技術研究報告、社団法人電子情報通信学会、1999年12月、NC99−70、p.61−68 黒柳奨、岩田彰、「パルス伝達型聴覚神経回路モデルによる音源方向知覚−時間差・音圧差の抽出−」、電子情報通信学会技術研究報告、社団法人電子情報通信学会、1993年3月、NC92−149、p.163−170 黒柳奨、岩田彰、「パルスニューロンモデルのための教師あり学習則」、電子情報通信学会技術研究報告、社団法人電子情報通信学会、1998年3月、NC97−151、p.95−102 黒柳奨、平田浩一、岩田彰、「パルスニューラルネットワークのための競合学習手法」、電子情報通信学会NC研究会技術研究報告、社団法人電子情報通信学会、2002年3月、NC2001−210、p.113−120 中尾裕之、黒柳奨、岩田彰、「パルスニューラルネットワークによる音源の方向情報を用いた音像抽出モデル」、電子情報通信学会NC研究会技術研究報告、社団法人電子情報通信学会、2001年3月、NC2000−108、p.39−46 田中愛久、黒柳奨、岩田彰、「FPGAのためのニューラルネットワークのハードウェア化手法」、電子情報通信学会NC研究会技術研究報告、社団法人電子情報通信学会、2001年3月、NC2000−179、p.175−182 二俣宣義、黒柳奨、岩田彰、「FPGAのためのパルスニューロンモデルの実装方法」、電子情報通信学会NC研究会技術研究報告、社団法人電子情報通信学会、2002年3月、NC2001−211、p.121−128 黒柳奨、岩田彰、「聴覚情報処理システムのためのパルスニューロンモデルを用いた競合学習ニューラルネットワーク」、電子情報通信学会論文誌(D−II)、2004年7月、第J87−D−II巻、第7号、p.1496−1504
In addition, the following patent documents 2-4 are in the related application by the applicant. The following Patent Document 5 and Non-Patent Documents 1 and 2 describe a sound source recognition device (sound source identification device) using a neural network, and the following Non-Patent Documents 3 to 5 describe sound source localization using a neural network. An apparatus is described. Furthermore, there are the following non-patent documents 6 to 9 as related documents.
JP 2007-334149 A JP 2007-164027 A JP 2008-77177 A JP 2008-85472 A Japanese Patent No. 3164100 Shinya Sakaguchi, “Research on sound source recognition using pulsed neuron model”, Nagoya Institute of Technology Graduation thesis, March 1998 Sakaguchi Shinya, Kuroyanagi Shu, Iwata Akira, "Sound Source Identification System for Understanding the Environment", IEICE Technical Committee, IEICE Technical Report, December 1999, NC99-70, p. 61-68 Kuroyanagi Shu, Akira Iwata, "Sound source direction perception by pulse transmission type auditory neural circuit model-Extraction of time difference and sound pressure difference-" Technical report of IEICE, IEICE, March 1993, NC92- 149, p. 163-170 Kuroyanagi Shu, Akira Iwata, “Supervised Learning Rules for Pulsed Neuron Model”, IEICE Technical Report, IEICE, March 1998, NC97-151, p. 95-102 Kuroyanagi Shu, Hirata Koichi, Iwata Akira, “Competitive Learning Method for Pulsed Neural Networks”, IEICE NC Study Technical Report, Institute of Electronics, Information and Communication Engineers, March 2002, NC2001-210, p. 113-120 Hiroyuki Nakao, Shu Kururoyanagi, Akira Iwata, "Sound Image Extraction Model Using Direction Information of Sound Source Using Pulse Neural Network", IEICE Technical Committee Report, IEICE, March 2001, NC2000 -108, p. 39-46 Tanaka Aihisa, Kuroyanagi Shu, Iwata Akira, “Hardware Implementation Method of Neural Network for FPGA”, IEICE NC Study Technical Report, The Institute of Electronics, Information and Communication Engineers, March 2001, NC2000-179 , P. 175-182 Noriyoshi Futaki, Susumu Kuroyanagi, Akira Iwata, “Implementation Method of Pulsed Neuron Model for FPGA”, IEICE NC Research Technical Report, The Institute of Electronics, Information and Communication Engineers, March 2002, NC2001-211, p . 121-128 Kuroyanagi Shu, Akira Iwata, “Competitive Learning Neural Network Using Pulsed Neuron Model for Auditory Information Processing System”, IEICE Transactions (D-II), July 2004, Vol. J87-D-II No. 7, p. 1496-1504

しかし、上記特許文献1の聴覚障害者用ヘッドマウントディスプレイ装置は、視野の一部に文字情報で音の認識結果を表示するものであるため、使用者の視野の邪魔になる虞があった。   However, since the head mounted display device for the hearing impaired person of the said patent document 1 displays the recognition result of a sound by character information on a part of visual field, there existed a possibility of disturbing a user's visual field.

この発明は、上述した問題を解決するものであり、使用者の視野の邪魔になることなく、使用者に音源の種類と方向とを知らせることができる音認識装置を提供することを目的とする。   SUMMARY OF THE INVENTION The present invention solves the above-described problems, and an object thereof is to provide a sound recognition device that can inform the user of the type and direction of the sound source without interfering with the user's visual field. .

本発明のウェアラブル音認識装置は、使用者に装着される眼鏡一体型のものであって、眼鏡の左の蔓に設けられた左のマイクロホンと、前記眼鏡の右の蔓に設けられた右のマイクロホンと、前記左のマイクロホンから入力された左の入力音と前記右のマイクロホンから入力された右の入力音との時間差に基づいて、音源が複数の音源方向のうちのどの音源方向にあるかを識別し、当該音源方向を示す方向情報を出力する音源定位部と、前記左の入力音または前記右の入力音の少なくとも一方の周波数パターンに基づいて、音源が複数の音源種類のうちのどの音源種類であるかを識別し、当該音源種類を示す種類情報を出力する音源同定部と、使用者が装着したときにそれぞれ使用者に接触するような部位に設けられた複数の振動部と、を備え、前記各音源種類に対してそれぞれ異なる振動パターンが設定され、前記方向情報と前記種類情報とに基づいて、1つ以上の前記振動部が前記種類情報で示される音源種類に対する振動パターンで振動するように構成されるとともに、異なる音源方向に対しては少なくとも1つの異なる前記振動部が振動するように構成され、前記振動部として、前記眼鏡の左の蔓に設けられた左の振動部と、前記眼鏡の右の蔓に設けられた右の振動部とを備え、音源方向が左の場合には前記左の振動部が前記種類情報で示される音源種類に対する振動パターンで振動して前記右の振動部は振動せず、音源方向が右の場合には前記右の振動部が前記種類情報で示される音源種類に対する振動パターンで振動して前記左の振動部は振動しないように構成されたことを特徴とする。 The wearable sound recognition device of the present invention is an eyeglass-integrated type worn by a user, and includes a left microphone provided on the left vine of the glasses and a right microphone provided on the right vine of the glasses. Based on the time difference between the microphone and the left input sound input from the left microphone and the right input sound input from the right microphone, which sound source direction the sound source is in a plurality of sound source directions And a sound source localization unit that outputs direction information indicating the sound source direction and a frequency pattern of at least one of the left input sound and the right input sound, and the sound source A sound source identification unit that identifies whether the type is a sound source, and outputs type information indicating the sound source type, and a plurality of vibration units provided in parts that contact the user when worn by the user, With Different vibration patterns are set for each of the sound source types, and one or more of the vibration units vibrate in a vibration pattern for the sound source type indicated by the type information based on the direction information and the type information. And at least one different vibration part for different sound source directions, the left vibration part provided on the left vine of the glasses as the vibration part, A right vibration part provided on the right vine of the glasses, and when the sound source direction is left, the left vibration part vibrates with a vibration pattern for the sound source type indicated by the type information and the right vibration parts are not vibrating, the vibrating portion of the left oscillating vibration pattern for tone generator type vibration part of the right represented by the type information when the sound source direction is right configured so as not to vibrate this The features.

これによれば、使用者が装着したときに使用者に接触するような部位に振動部が設けられて、音源の方向によって少なくとも1つの異なる振動部が振動するとともに、音源の種類によって異なる振動パターンで振動部が振動するので、どの振動部が振動するかによって音源の方向が分かり、振動パターンによって音源の種類が分かる。したがって、使用者の視野の邪魔になることなく、使用者に音源の種類と方向とを知らせることができる。   According to this, the vibration part is provided in a part that comes into contact with the user when worn by the user, and at least one different vibration part vibrates depending on the direction of the sound source, and the vibration pattern varies depending on the type of the sound source. Since the vibration part vibrates, the direction of the sound source can be determined by which vibration part vibrates, and the type of the sound source can be determined by the vibration pattern. Therefore, the user can be informed of the type and direction of the sound source without disturbing the user's visual field.

本発明の他のウェアラブル音認識装置は、既製の眼鏡に装着可能なアタッチメント型のものであって、眼鏡の左の蔓に取り付け可能な左の取付部と、前記眼鏡の右の蔓に取り付け可能な右の取付部と、前記左の取付部に設けられた左のマイクロホンと、前記右の取付部に設けられた右のマイクロホンと、前記左のマイクロホンから入力された左の入力音と前記右のマイクロホンから入力された右の入力音との時間差に基づいて、音源が複数の音源方向のうちのどの音源方向にあるかを識別し、当該音源方向を示す方向情報を出力する音源定位部と、前記左の入力音または前記右の入力音の少なくとも一方の周波数パターンに基づいて、音源が複数の音源種類のうちのどの音源種類であるかを識別し、当該音源種類を示す種類情報を出力する音源同定部と、前記左の取付部の、前記ウェアラブル音認識装置を装着した眼鏡を使用者が装着したときに使用者に接触するような部位に設けられた左の振動部と、前記右の取付部の、前記ウェアラブル音認識装置を装着した眼鏡を使用者が装着したときに使用者に接触するような部位に設けられた右の振動部と、を備え、前記各音源種類に対してそれぞれ異なる振動パターンが設定され、前記方向情報と前記種類情報とに基づいて、音源方向が左の場合には前記左の振動部が前記種類情報で示される音源種類に対する振動パターンで振動して前記右の振動部は振動せず、音源方向が右の場合には前記右の振動部が前記種類情報で示される音源種類に対する振動パターンで振動して前記左の振動部は振動しないように構成されたことを特徴とする。Another wearable sound recognition apparatus of the present invention is an attachment type that can be attached to ready-made glasses, and can be attached to the left vine that can be attached to the left vine of the glasses and the right vine of the glasses. A right mounting portion, a left microphone provided in the left mounting portion, a right microphone provided in the right mounting portion, a left input sound input from the left microphone, and the right A sound source localization unit that identifies a sound source direction of a plurality of sound source directions based on a time difference from the right input sound input from the microphone of the sound source and outputs direction information indicating the sound source direction; Based on a frequency pattern of at least one of the left input sound and the right input sound, the sound source is identified from among a plurality of sound source types, and type information indicating the sound source type is output. Sound An identification part; a left vibration part provided in a part of the left attachment part that comes into contact with the user when the user wears glasses wearing the wearable sound recognition device; and the right attachment And a right vibration part provided at a part that comes into contact with the user when the user wears the glasses equipped with the wearable sound recognition device, and is different for each of the sound source types. When a vibration pattern is set and the sound source direction is left based on the direction information and the type information, the left vibration unit vibrates with a vibration pattern for the sound source type indicated by the type information and The vibration unit does not vibrate, and when the sound source direction is right, the right vibration unit vibrates with a vibration pattern for the sound source type indicated by the type information, and the left vibration unit does not vibrate. Features .

本発明のウェアラブル音認識装置によれば、振動で音源の方向と種類とを知らせるので、使用者の視野の邪魔になることなく、使用者に音源の種類と方向とを知らせることができる。   According to the wearable sound recognition apparatus of the present invention, since the direction and type of the sound source are notified by vibration, it is possible to notify the user of the type and direction of the sound source without obstructing the user's visual field.

以下、本発明の一実施形態について図面に基づいて説明する。   Hereinafter, an embodiment of the present invention will be described with reference to the drawings.

音認識装置1は、図1、2に示すように、左右のマイクロホン2L、2Rと、マイクロホン2L、2Rが接続された認識処理部4と、認識処理部4に接続された電源5と、認識処理部4にそれぞれ接続された左右の振動部3L、3Rとから構成されている。音認識装置1は、眼鏡Gと一体型であり、マイクロホン2Lは眼鏡Gの左の蔓の外側に取着され、マイクロホン2Rは眼鏡Gの右の蔓の外側に取着されている。また、振動部3Lは眼鏡Gの左の蔓の使用者の耳の上に接触する部位の内側に取着され、振動部3Rは眼鏡Gの右の蔓の使用者の耳の上に接触する部位の内側に取着されている。さらに、眼鏡Gの一方の蔓の後端部30に認識処理部4及び電源5が内蔵されている。認識処理部4は、カスタムLSIにより構成され、電源5はボタン電池により構成されている。   As shown in FIGS. 1 and 2, the sound recognition apparatus 1 includes left and right microphones 2L and 2R, a recognition processing unit 4 to which the microphones 2L and 2R are connected, a power source 5 connected to the recognition processing unit 4, and a recognition unit. The left and right vibrating parts 3L and 3R are connected to the processing part 4, respectively. The sound recognition device 1 is integrated with the glasses G, the microphone 2L is attached to the outside of the left vine of the glasses G, and the microphone 2R is attached to the outside of the right vine of the glasses G. The vibration unit 3L is attached to the inside of a portion of the glasses G that contacts the user's ear of the left vine, and the vibration unit 3R contacts the user's ear of the right vine of the glasses G. It is attached inside the part. Further, the recognition processing unit 4 and the power source 5 are built in the rear end 30 of one vine of the glasses G. The recognition processing unit 4 is configured by a custom LSI, and the power source 5 is configured by a button battery.

認識処理部4は、図2に示すように、マイクロホン2L、2Rにそれぞれ接続された左右の入力信号処理部6、7と、入力信号処理部6、7の両方に接続された音源定位部8と、入力信号処理部7に接続された音源同定部9と、音源定位部8及び音源同定部9に接続された振動選択部18とを備えている。なお、音源同定部9は、入力信号処理部6、7の少なくとも一方に接続されていればよい。振動選択部18は、振動部3L、3Rに接続されている。   As shown in FIG. 2, the recognition processing unit 4 includes left and right input signal processing units 6 and 7 connected to the microphones 2L and 2R, and a sound source localization unit 8 connected to both of the input signal processing units 6 and 7, respectively. A sound source identification unit 9 connected to the input signal processing unit 7, and a sound source localization unit 8 and a vibration selection unit 18 connected to the sound source identification unit 9. The sound source identification unit 9 only needs to be connected to at least one of the input signal processing units 6 and 7. The vibration selection unit 18 is connected to the vibration units 3L and 3R.

音源定位部8は、時間差検出部10と左右方向検出部11とを備え、音源同定部9は、周波数パターン検出部12と音源種類検出部13とを備えている。時間差検出部10、左右方向検出部11、周波数パターン検出部12、及び、音源種類検出部13は、いずれも、複数のパルスニューロンモデル(以下、「PNモデル」と言う。)により構成されたニューラルネットワークから構成されている。PNモデルとは、入出力信号としてパルス列を用いるニューロンモデルをいい、各PNモデルはディジタル回路で構成される(非特許文献8の図4参照)。   The sound source localization unit 8 includes a time difference detection unit 10 and a left-right direction detection unit 11, and the sound source identification unit 9 includes a frequency pattern detection unit 12 and a sound source type detection unit 13. The time difference detection unit 10, the left-right direction detection unit 11, the frequency pattern detection unit 12, and the sound source type detection unit 13 are all configured by a plurality of pulse neuron models (hereinafter referred to as “PN models”). It consists of a network. The PN model refers to a neuron model that uses a pulse train as an input / output signal, and each PN model is composed of a digital circuit (see FIG. 4 of Non-Patent Document 8).

図3に示すように、入力信号処理部6、7は、AD変換部14L、14Rと、人の聴覚系の蝸牛に相当する周波数分解部15L、15Rと、有毛細胞に相当する非線形変換部16L、16Rと、蝸牛神経に相当するパルス変換部17L、17Rとを備えている。AD変換部14L、14RはAD変換回路で、周波数分解部15L、15R、非線形変換部16L、16R、パルス変換部17L、17Rは、それぞれディジタル回路で構成される。   As shown in FIG. 3, the input signal processing units 6 and 7 include AD conversion units 14L and 14R, frequency decomposition units 15L and 15R corresponding to human cochleas, and nonlinear conversion units corresponding to hair cells. 16L and 16R, and pulse converters 17L and 17R corresponding to the cochlear nerve. The AD conversion units 14L and 14R are AD conversion circuits, and the frequency resolution units 15L and 15R, the nonlinear conversion units 16L and 16R, and the pulse conversion units 17L and 17R are each configured by a digital circuit.

そして、AD変換部14L、14Rは、それぞれマイクロホン2L、2Rから入力された信号をAD変換する。周波数分解部15L、15Rは、バンドパスフィルタ(BPF)群により構成され、AD変換された信号を所定の周波数範囲について対数スケールで複数(N個)の周波数帯域(以下、「周波数チャンネル」あるいは単に「チャンネル」という。)の信号に分解する。非線形変換部16L、16Rは、周波数分解部15L、15Rから入力された各周波数帯域の信号に対して、それぞれ、非線形変換を行うことによりその正の成分だけを取り出すとともに、ローパスフィルタ(LPF)によりエンベロープ検出を行う。パルス変換部17L、17Rは、非線形変換部16L、16Rから入力された各周波数帯域の信号を、それぞれ、信号強度に比例したパルス頻度を持つパルス列に変換する。これらの処理により、入力信号処理部6、7は、左右の入力信号の各々を、周波数帯域毎に、信号強度すなわち音圧に応じたパルス頻度を持つパルス列に変換する。   The AD converters 14L and 14R AD convert the signals input from the microphones 2L and 2R, respectively. The frequency resolving units 15L and 15R are configured by a band-pass filter (BPF) group, and a plurality of (N) frequency bands (hereinafter referred to as “frequency channels” or simply “logarithmic scales”) of AD-converted signals in a predetermined frequency range. It is broken down into “channels”). The non-linear transformation units 16L and 16R take out only the positive components by performing non-linear transformation on the signals of the respective frequency bands input from the frequency decomposition units 15L and 15R, and also by a low-pass filter (LPF). Perform envelope detection. The pulse converters 17L and 17R convert the signals in the respective frequency bands input from the nonlinear converters 16L and 16R into pulse trains each having a pulse frequency proportional to the signal intensity. Through these processes, the input signal processing units 6 and 7 convert each of the left and right input signals into a pulse train having a pulse frequency corresponding to the signal intensity, that is, the sound pressure, for each frequency band.

時間差検出部10は、図4に示すようなPNモデルからなる時間差抽出モデルと、パルス列をシフトさせつつ時間差抽出モデルに入力するための時間遅れ素子19(図5参照)の列とから構成されている。時間差抽出モデルは、非特許文献3等に記載されているものと同様であるので詳説しないが、図4に示すように時間差抽出ニューロン(以下、「MSOニューロン」という。)20を複数(但し、奇数個)並べたMSOニューロン列を、周波数チャンネル毎に設けたものである。各MSOニューロン20は、左のパルス信号が入力される左入力端子21と、右のパルス信号が入力される右入力端子22と、出力端子23とを備え、全MSOニューロン20において、左右の入力に対する重みを共通の固定値とし、閾値を重みの2倍又は重みの2倍に内部電位の基準値を加えた値とすること等により、パルス信号が左右から略同時に入力されたときに出力端子23からパルス信号を出力するように構成される。なお、「略同時」とは、勿論、同時である場合を含む。   The time difference detection unit 10 is composed of a time difference extraction model composed of a PN model as shown in FIG. 4 and a sequence of time delay elements 19 (see FIG. 5) for inputting to the time difference extraction model while shifting the pulse train. Yes. The time difference extraction model is the same as that described in Non-Patent Document 3 and the like and will not be described in detail. However, as shown in FIG. 4, a plurality of time difference extraction neurons (hereinafter referred to as “MSO neurons”) 20 are provided. An odd number of MSO neuron arrays are provided for each frequency channel. Each MSO neuron 20 includes a left input terminal 21 to which a left pulse signal is input, a right input terminal 22 to which a right pulse signal is input, and an output terminal 23. When the pulse signal is input almost simultaneously from the left and right by setting the weight to the common fixed value and the threshold value to be twice the weight or the value obtained by adding the reference value of the internal potential to the double weight, etc. 23 is configured to output a pulse signal. Note that “substantially simultaneous” includes, of course, simultaneous.

そして、時間差検出部10は、図5に示すように、時間遅れ素子19により、1クロック(単位時間)毎に、左のパルス列を右にシフトさせるとともに右のパルス列を左にシフトさせつつ、左右のパルス列を対応する周波数チャンネルのMSOニューロン列に入力する。すなわち、左のパルス信号はMSOニューロン列の一端(図5では左端)から他端(同右端)まで単位時間毎にシフトされつつ順次各MSOニューロン20に入力され、右のパルス信号はMSOニューロン列の他端(同右端)から一端(同左端)まで単位時間毎にシフトされつつ順次各MSOニューロン20に入力される。   Then, as shown in FIG. 5, the time difference detection unit 10 shifts the left pulse train to the right and shifts the right pulse train to the left and shifts the left and right pulses every clock (unit time) by the time delay element 19. Are input to the MSO neuron train of the corresponding frequency channel. That is, the left pulse signal is sequentially input to each MSO neuron 20 while being shifted from one end (left end in FIG. 5) to the other end (right end in FIG. 5) every unit time, and the right pulse signal is input to the MSO neuron train. Are sequentially input to each MSO neuron 20 while being shifted every other unit time from the other end (same right end) to one end (same left end).

例えば各MSOニューロン列内のMSOニューロン20を2J+1個とし、各MSOニューロン20に−JからJまでの番号を付すと、時刻tに、各MSOニューロン20は下記[数1]に従って内部電位IMSO ji(t)を演算し、この内部電位が所定の閾値を超えた場合にはyji(t)=1を出力し、超えない場合にはyji(t)=0を出力する。なお、jはMSOニューロン20の番号、iは周波数チャンネルの番号(i=1〜N)とする。下記[数1]において、pleft ji(t)は左の入力信号に対する局所膜電位、pright ji(t)は右の入力信号に対する局所膜電位であり、wは全ニューロン20で共通の結合重み、τは減衰時定数である。 For example, if the number of MSO neurons 20 in each MSO neuron array is 2J + 1 and each MSO neuron 20 is assigned a number from −J to J, at time t, each MSO neuron 20 has an internal potential I MSO according to the following [Equation 1]. ji (t) is calculated, and y ji (t) = 1 is output when the internal potential exceeds a predetermined threshold, and y ji (t) = 0 is output when it does not exceed the predetermined threshold. Note that j is the number of the MSO neuron 20, and i is the frequency channel number (i = 1 to N). In the following [Equation 1], p left ji (t) is a local membrane potential for the left input signal, p right ji (t) is a local membrane potential for the right input signal, and w is a common connection in all neurons 20. The weight, τ, is the decay time constant.

Figure 0005279010
これにより、時間差抽出モデルは、左右からパルス信号が略同時に入ってきた場合にはMSOニューロン列における中央付近のニューロン20が発火し、パルス信号が右よりも左から早く入ってきた場合にはMSOニューロン列における右側のニューロン20が発火し、パルス信号が左よりも右から早く入ってきた場合にはMSOニューロン列における左側のニューロン20が発火するというように、左右の入力信号間の時間差によって変化する発火パターンを、音の時間差情報として出力する。
Figure 0005279010
Thus, in the time difference extraction model, the neuron 20 near the center in the MSO neuron array fires when a pulse signal enters from the left and right substantially simultaneously, and when the pulse signal enters from the left earlier than the right, the MSO The right neuron 20 in the neuron array fires, and when the pulse signal comes in from the right earlier than the left, the left neuron 20 in the MSO neuron array fires. The firing pattern is output as sound time difference information.

すなわち、上述したように各MSOニューロン列内の各MSOニューロン20に−JからJまでの番号を付し、周波数チャンネルの数をNとすると、時刻tに、時間差抽出モデルからは次のようなベクトルyMSO(t)が時間差情報として出力される。 That is, as described above, if each MSO neuron 20 in each MSO neuron array is numbered from -J to J and the number of frequency channels is N, at time t, from the time difference extraction model, The vector y MSO (t) is output as time difference information.

MSO(t)=(y−J1(t),…,y01(t),…,yJ1(t),
−J2(t),…,y02(t),…,yJ2(t),
…,
−JN(t),…,y0N(t),…,yJN(t))
時間差検出部10は、例えば図6に示すように、ディジタル回路で構成可能である。この構成例は、非特許文献8の第5章にも記載されているので詳説しない。なお、不応期の実装は、不応期をカウントするカウンタを設け、発火から不応期の間は発火しないようにして、発火とともにカウンタをリセットすることにより実現可能である。
y MSO (t) = (y− J1 (t),..., y 01 (t),..., y J1 (t),
y −J2 (t),..., y 02 (t),..., y J2 (t),
…,
y −JN (t),..., y 0N (t),..., y JN (t))
For example, as shown in FIG. 6, the time difference detection unit 10 can be configured by a digital circuit. Since this configuration example is also described in Chapter 5 of Non-Patent Document 8, it will not be described in detail. Note that the implementation of the refractory period can be realized by providing a counter that counts the refractory period and not firing during the period from ignition to resetting the counter along with the ignition.

左右方向検出部11は、非特許文献9に記載された競合学習ニューラルネットワーク(以下、「CONP」という。)から構成されている。CONPは、入力ベクトルの量子化を行うパルスニューラルネットワークである。以下、CONPについて説明する。   The left-right direction detection unit 11 includes a competitive learning neural network (hereinafter referred to as “CONP”) described in Non-Patent Document 9. CONP is a pulse neural network that performs quantization of an input vector. Hereinafter, CONP will be described.

CONPは、図7に示すように、競合学習ニューロン群50と制御ニューロン群60とから構成され、競合学習ニューロン群50は複数の競合学習ニューロン(以下、「CLニューロン」という。)51から構成され、制御ニューロン群はCLニューロン51が1つも発火しなかったときに発火する無発火検出ニューロン(以下、「NFDニューロン」という。)61とCLニューロン51が複数発火したときに発火する複数発火検出ニューロン(以下、「MFDニューロン」という。)62とから構成されている。   As shown in FIG. 7, the CONP is composed of a competitive learning neuron group 50 and a control neuron group 60, and the competitive learning neuron group 50 is composed of a plurality of competitive learning neurons (hereinafter referred to as “CL neurons”) 51. The control neuron group is a non-firing detection neuron (hereinafter referred to as “NFD neuron”) 61 that fires when none of the CL neurons 51 fires, and a multiple firing detecting neuron that fires when multiple CL neurons 51 fire. (Hereinafter referred to as “MFD neuron”) 62.

NFDニューロン61とMFDニューロン62は、それらの発火状況に応じて各CLニューロン51の閾値を一律に変化させる(実際には、各CLニューロン51の内部電位を一律に変化させる)ことで、CLニューロン群50内でCLニューロン51が1個だけ発火する状況を保持するためのPNモデルである。NFDニューロン61とMFDニューロン62は、CLニューロン群50内のCLニューロン51の数に応じた入力端子と、出力端子とを備え、各CLニューロン51から出力されたパルス信号を各入力端子で受け取って、NFDニューロン61は、全てのCLニューロン51からの信号が「0」の場合にのみ出力端子から「1」を出力し、MFDニューロン62は、複数のCLニューロン51から信号「1」を受け取った場合にのみ出力端子から「1」を出力する。   The NFD neuron 61 and the MFD neuron 62 change the threshold value of each CL neuron 51 uniformly according to their firing status (actually, the internal potential of each CL neuron 51 is changed uniformly), so that the CL neuron This is a PN model for maintaining a situation where only one CL neuron 51 is fired in the group 50. Each of the NFD neuron 61 and the MFD neuron 62 includes an input terminal corresponding to the number of CL neurons 51 in the CL neuron group 50 and an output terminal. The pulse signal output from each CL neuron 51 is received by each input terminal. The NFD neuron 61 outputs “1” from the output terminal only when the signals from all the CL neurons 51 are “0”, and the MFD neuron 62 receives the signal “1” from the plurality of CL neurons 51. Only in this case, “1” is output from the output terminal.

各CLニューロン51は、図8に示すように、入力パルスx(t),x(t),…,x(t),…,x(t)がそれぞれ入力される入力端子551、552、…、55i、…、55nと、NFDニューロン61、MFDニューロン62から出力されたパルス信号ynfd(t)、ymfd(t)がそれぞれ入力される入力端子56、57と、出力端子58とを備えている。各入力端子55i(i=1〜n)は2つに分岐して、一方は可変の結合重みwhiを有するシナプス部53iに、他方は固定の結合重み「1」を有するシナプス部54iに接続されている。なお、hは、CLニューロン群50内で各CLニューロン51に付された番号であり、h=1〜Mとする。 Each CL neuron 51, as shown in FIG. 8, the input pulse x 1 (t), x 2 (t), ..., x i (t), ..., the input terminal x n (t) are respectively input 551 , 552, ..., 55i, ..., 55n, and input terminals 56 and 57 to which pulse signals y nfd (t) and y mfd (t) output from the NFD neuron 61 and the MFD neuron 62 are input, respectively, and output terminals 58. Each input terminal 55i (i = 1 to n) branches into two, one connected to the synapse unit 53i having a variable coupling weight w hi and the other connected to the synapse unit 54i having a fixed coupling weight “1”. Has been. Note that h is a number assigned to each CL neuron 51 in the CL neuron group 50, and h = 1 to M.

CONPの動作について、図9−1、9−2に基づいて説明する。CLニューロン群50内の各CLニューロン51には、単位時間毎に、n個の入力パルスからなる入力ベクトルx(t)=(x(t),x(t),…,x(t),…,x(t))(t:時刻)が入力される(S101)。すると、NFDニューロン61、MFDニューロン62は、それぞれ、保持しておいた時刻(t−1)における各CLニューロン51からの出力y(t−1)に基づいて、時刻tにおける出力値ynfd(t)、ymfd(t)を演算して、各CLニューロン51に出力する(S102、S103)。なお、NFDニューロン61、MFDニューロン62において、それぞれ、時刻(t−1)に各CLニューロン51からの出力y(t−1)を用いて出力値ynfd(t)、ymfd(t)を演算して保持しておき、時刻tになったらynfd(t)、ymfd(t)を各CLニューロン51に出力するようにしてもよい。 The operation of CONP will be described with reference to FIGS. Each CL neuron 51 in the CL neuron group 50 has an input vector x (t) = (x 1 (t), x 2 (t) ,. t),..., x n (t)) (t: time) are input (S101). Then, the NFD neuron 61 and the MFD neuron 62 respectively output the output value y nfd at the time t based on the output y h (t−1) from each CL neuron 51 at the held time (t−1). (T), y mfd (t) are calculated and output to each CL neuron 51 (S102, S103). Note that, in the NFD neuron 61 and the MFD neuron 62, output values y nfd (t) and y mfd (t) using the output y h (t−1) from each CL neuron 51 at time (t−1), respectively. May be calculated and held, and y nfd (t) and y mfd (t) may be output to each CL neuron 51 at time t.

次に、各CLニューロン51は、それぞれ、内部電位I(t)(h=1〜M)を演算し(S104)(下記[数5]参照)、内部電位I(t)が閾値THを超え、かつ、前回の発火時から不応期を経過している場合にはy(t)=1を出力し、それ以外の場合にはy(t)=0を出力する(S105)。 Next, each CL neuron 51 calculates an internal potential I h (t) (h = 1 to M) (S104) (see [Expression 5] below), and the internal potential I h (t) is a threshold TH. Is exceeded and y h (t) = 1 is output when the refractory period has elapsed since the previous ignition, and y h (t) = 0 is output otherwise (S105) .

そして、学習時には、「1」を出力したCLニューロン51について、シナプス部54iにおける局所膜電位pcwiを用いて結合重みwiを更新するとともに(S106)、そのCLニューロン51の周辺のCLニューロン51についても同様に結合重みを更新する(S107)。結合重みを更新するCLニューロン51の範囲(すなわち、学習範囲)の決定方法としては、例えば、最初は全部のCLニューロン51を学習範囲とし、線形的に範囲を縮小して、最後は勝者ニューロンだけを学習範囲とするような、次第に縮小する方法がある。そして、結合重みを更新したCLニューロン51について結合重みのノルム(参照ベクトルのノルム)を1に正規化する(S108)。すなわち、CONPにおいては、勝者ニューロンのみならずその周辺のニューロンも学習を行うことにより、自己組織化マップ(SOM)のアルゴリズムを実現している。 At the time of learning, for the CL neuron 51 that has output “1”, the connection weight w i is updated using the local membrane potential pcw i at the synapse 54 i (S 106), and the CL neurons 51 around the CL neuron 51 are also updated. Similarly, the connection weight is updated (S107). As a method of determining the range of CL neurons 51 that updates the connection weight (ie, the learning range), for example, all CL neurons 51 are initially set as the learning range, the range is linearly reduced, and the winner neuron is the last. There is a method of gradually reducing the learning range. Then, the norm of the connection weight (norm of the reference vector) is normalized to 1 for the CL neuron 51 whose connection weight has been updated (S108). That is, in CONP, the self-organizing map (SOM) algorithm is realized by learning not only the winner neurons but also the neighboring neurons.

一方、学習時でない場合(認識時)は、結合重みの更新は行わない。そして、結合重みの更新のための係数αを定数γ(0≦γ)を乗じることにより更新し(S109)、次の入力ベクトルについてステップS101〜108の処理を行う。   On the other hand, when it is not at the time of learning (at the time of recognition), the connection weight is not updated. Then, the coefficient α for updating the connection weight is updated by multiplying by a constant γ (0 ≦ γ) (S109), and the processing of steps S101 to S108 is performed for the next input vector.

ここで、CONPにおける内部電位I(t)の演算方法について説明する。まず、引数として、時刻t、減衰時定数τ、結合重みw、時刻tにおける入力信号x(t)の4つを持つ関数Fを導入し、下記[数2]のように定義する。なお、△t=1/Fs(Fs:サンプリング周波数)とする。 Here, a method of calculating the internal potential I h (t) in CONP will be described. First, as an argument, a function F having four parameters of time t, decay time constant τ, coupling weight w, and input signal x (t) at time t is introduced and defined as [Equation 2] below. Note that Δt = 1 / Fs (Fs: sampling frequency).

Figure 0005279010
すると、時刻tにおけるPNモデルの内部電位I(t)は、局所膜電位p(t)(i=1〜n)の総和として、下記[数3]のように記述できる。τはpi(t)の減衰時定数である。
Figure 0005279010
Then, the internal potential I (t) of the PN model at time t can be described as the following [Equation 3] as the sum of the local membrane potentials p i (t) (i = 1 to n). τ is the decay time constant of p i (t).

Figure 0005279010
PNモデルの不応期をRP、時刻tにおける前回発火からの経過時間をET(t)とし、ET(0)>RPとすると、PNモデルの出力値y(t)は、以下のアルゴリズムにより計算される。なお、THは閾値である。
Figure 0005279010
If the refractory period of the PN model is RP, the elapsed time from the previous firing at time t is ET (t), and ET (0)> RP, the output value y (t) of the PN model is calculated by the following algorithm: The TH is a threshold value.

if I(t)≧TH and ET(t)>RP
then y(t)=1,ET(t)=0
else y(t)=0,ET(t)=ET(t−△t)+△t
パラメータτ、w、w、…、w、THは、各PNモデルにより可変の値であり、この組合せにより各PNモデルの動作は決定される。
if I (t) ≧ TH and ET (t)> RP
then y (t) = 1, ET (t) = 0
else y (t) = 0, ET (t) = ET (t−Δt) + Δt
The parameters τ, w 1 , w 2 ,..., W n , TH are variable values depending on each PN model, and the operation of each PN model is determined by this combination.

ここで、時刻tにおけるNFDニューロン61、MFDニューロン62の出力をそれぞれynfd(t)、ymfd(t)、各CLニューロン51のNFDニューロン61、MFDニューロン62に対する結合重みをそれぞれwfd、−wfd(但し、wfd>0)とすると、時刻tにおける番号hのCLニューロン51の内部電位I(t)は前述の関数Fを用いて下記[数4]のように記述できる。CONPでは、pnfd(t)、pmfd(t)を閾値の動的変化量として扱う(但し、閾値THを変化させる代りに、閾値THと比較する内部電位I(t)をpnfd(t)、pmfd(t)により調整する)ことでCLニューロン51が1個だけ発火する状態を保持する。このため、減衰時定数τfdは時定数τに対して充分大きいものとする。 Here, the outputs of the NFD neuron 61 and the MFD neuron 62 at time t are respectively y nfd (t) and y mfd (t), and the connection weights of the CL neurons 51 to the NFD neuron 61 and the MFD neuron 62 are respectively w fd and − Assuming w fd (where w fd > 0), the internal potential I h (t) of the CL neuron 51 of number h at time t can be described using the function F described above as in the following [Equation 4]. In CONP, p nfd (t) and p mfd (t) are treated as dynamic variations of the threshold (however, instead of changing the threshold TH, the internal potential I h (t) to be compared with the threshold TH is changed to p nfd ( t) and p mfd (t) to maintain the state in which only one CL neuron 51 is fired. For this reason, the attenuation time constant τ fd is sufficiently large with respect to the time constant τ.

Figure 0005279010
ところで、入力パルス列によって発生する内部電位の総量が大きく変動する場合、この変動量を吸収するために閾値の変化が生じることになり、閾値の変化が入力ベクトルの方向変化に追従できない場合がある。そこで、CONPでは内部電位に対して、結合重みを1に固定したシナプス部54i(i=1〜n)における局所膜電位pcw(t)の総和を一定の比率βpcw(但し、0≦βpcw≦1)であらかじめ差引くことで、入力信号のノルム変動に対する内部電位の変化を抑制している。これにより上記[数4]のI(t)は下記[数5]のように修正され、各CLニューロン51は[数5]に従って内部電位I(t)を演算する。
Figure 0005279010
By the way, when the total amount of the internal potential generated by the input pulse train fluctuates greatly, a change in the threshold value occurs to absorb this fluctuation amount, and the change in the threshold value may not follow the change in the direction of the input vector. Therefore, in CONP, the total sum of local membrane potentials pcw i (t) in the synapse portions i (i = 1 to n) with the coupling weight fixed to 1 is set to a constant ratio β pcw (where 0 ≦ β By subtracting in advance with pcw ≦ 1), the change in the internal potential with respect to the norm fluctuation of the input signal is suppressed. As a result, I h (t) in the above [Equation 4] is corrected as shown in [Equation 5] below, and each CL neuron 51 calculates the internal potential I h (t) according to [Equation 5].

Figure 0005279010
CONPは簡単なディジタル回路によりハードウェア化可能であり、その例を図10に示す。この例では、CONPは、それぞれCLニューロン51に相当するM個のCLニューロン部51Hと、NFDニューロン61に相当する1個のNFDニューロン部61Hと、MFDニューロン62に相当する1個のMFDニューロン部62Hとを備え、さらに、閾値変化量生成部63、64と内部電位抑制量生成部65とを1個ずつ備えている。
Figure 0005279010
The CONP can be implemented by hardware with a simple digital circuit, and an example is shown in FIG. In this example, CONP includes M CL neuron units 51H corresponding to CL neurons 51, one NFD neuron unit 61H corresponding to NFD neuron 61, and one MFD neuron unit corresponding to MFD neuron 62, respectively. 62H, and further includes one threshold change amount generators 63 and 64 and one internal potential suppression amount generator 65.

各CLニューロン部51Hは、CLニューロン51の入力端子551、…、55nに相当するn個の入力端子と、それらの入力端子から入力されたn個の入力パルスx(t),…,x(t)に対してそれぞれ重みを乗じるn個のAND回路71と、各AND回路71からの出力を内部電位に加算する加算器72と、内部電位を減衰して加算器72に出力する減衰生成部73と、加算器72から出力された内部電位と閾値とを比較する比較器74とを備え、比較器74は、内部電位が閾値を超え、かつ、前回の発火時から不応期を経過している場合にはy(t)=1、それ以外の場合にはy(t)=0を出力する。なお、比較器74には、後述するように、動的な閾値変化量としてpnfd(t)、pmfd(t)が、内部電位の抑制量としてSpcw(t)が入力され、比較器74は、これらの値で上記[数5]のように内部電位を調整してから閾値と比較する。 Each CL neuron unit 51H includes n input terminals corresponding to the input terminals 551,..., 55n of the CL neuron 51, and n input pulses x 1 (t),. n AND circuits 71 each multiplying n (t) by a weight, an adder 72 that adds the output from each AND circuit 71 to the internal potential, and an attenuation that attenuates the internal potential and outputs it to the adder 72 A generator 73 and a comparator 74 that compares the internal potential output from the adder 72 with a threshold value are provided. The comparator 74 exceeds the threshold value, and the refractory period has elapsed since the previous ignition. If y h (t) = 1, y h (t) = 1 is output. Otherwise, y h (t) = 0 is output. As will be described later, the comparator 74 receives p nfd (t) and p mfd (t) as dynamic threshold change amounts and S pcw (t) as a suppression amount of the internal potential. In 74, the internal potential is adjusted with these values as in [Formula 5], and then compared with the threshold value.

NFDニューロン部61Hは、M個のCLニューロン部51Hの出力端子にそれぞれ接続されたM個の入力端子と、それらの入力端子から入力されたM個の入力パルスy(t),y(t),…,y(t)に対してそれぞれ重みを乗じるM個のAND回路76と、各AND回路76からの出力を内部電位に加算する加算器77と、内部電位を減衰して加算器77に出力する減衰生成部78と、加算器77から出力された内部電位と閾値とを比較して、内部電位が閾値を超え、かつ、前回の発火時から不応期を経過している場合には1、それ以外の場合には0を出力する比較器79とを備え、M個の入力パルスが全て0のとき発火するように構成されている。 The NFD neuron unit 61H includes M input terminals respectively connected to the output terminals of the M CL neuron units 51H, and M input pulses y 1 (t) and y 2 ( t),..., y M (t) each multiplied by M AND circuits 76, an adder 77 for adding the output from each AND circuit 76 to the internal potential, and attenuating and adding the internal potential When the internal potential output from the adder 77 is compared with the threshold value, the internal potential exceeds the threshold value, and the refractory period has elapsed since the previous ignition. Is provided with a comparator 79 that outputs 1 and in other cases 0, and is configured to ignite when all M input pulses are 0.

MFDニューロン部62Hは、NFDニューロン部61Hと同様の構成であるが、重みや閾値を変更することにより、M個の入力パルスのうち複数が1のとき発火するように構成されている。   The MFD neuron unit 62H has the same configuration as that of the NFD neuron unit 61H, but is configured to fire when a plurality of M input pulses are 1 by changing weights and thresholds.

閾値変化量生成部63、64は、それぞれ、各CLニューロン部51HにおけるNFDニューロン部61H、MFDニューロン部62Hからの出力に対する局所膜電位pnfd(t)、pmfd(t)を生成する部分であり、本来は各CLニューロン部51Hが共通に備える部分であるが、CLニューロン部51Hによって重みや減衰時定数は変わらないので、各CLニューロン部51Hから取り出して全体で1個としたものである。 The threshold value change amount generation units 63 and 64 are portions that generate local membrane potentials p nfd (t) and p mfd (t) for outputs from the NFD neuron unit 61H and the MFD neuron unit 62H in each CL neuron unit 51H, respectively. Yes, it is originally a part that each CL neuron unit 51H has in common, but since the weight and decay time constant are not changed by the CL neuron unit 51H, it is taken out from each CL neuron unit 51H to be one in total. .

閾値変化量生成部63は、NFDニューロン部61Hからの出力に対して重みwfdを乗じるAND回路81と、AND回路81からの出力を局所膜電位に加算する加算器82と、局所膜電位を減衰して加算器82に出力する減衰生成部83とを備え、閾値の動的変化量として、加算器82から局所膜電位pnfd(t)を各CLニューロン部51Hの比較器74に出力する。 The threshold change amount generation unit 63 multiplies the output from the NFD neuron unit 61H by a weight w fd , an adder 82 that adds the output from the AND circuit 81 to the local membrane potential, and the local membrane potential. An attenuation generation unit 83 that attenuates and outputs to the adder 82, and outputs the local membrane potential p nfd (t) from the adder 82 to the comparator 74 of each CL neuron unit 51H as the dynamic change amount of the threshold. .

閾値変化量生成部64は、閾値変化量生成部63と同様の構成を有し、各MFDニューロン部62Hからの出力を用いて局所膜電位pmfd(t)を生成して、閾値の動的変化量として、各CLニューロン部51Hの比較器74に出力する。 The threshold value change amount generation unit 64 has the same configuration as the threshold value change amount generation unit 63, generates a local membrane potential p mfd (t) using the output from each MFD neuron unit 62H, and generates a dynamic threshold value. The change amount is output to the comparator 74 of each CL neuron unit 51H.

内部電位抑制量生成部65は、上述した入力信号のノルム変動に対する内部電位の変化の抑制量Spcw(t)を生成する部分であり、本来は、各CLニューロン部51Hにおいて、固定重み1のシナプス部54iにおける局所膜電位pcw(t)の総和に一定の比率βpcwを乗じて生成するものであるが、CLニューロン部51Hによって重みや減衰時定数は変わらないので、各CLニューロン部51Hから取り出して全体で1個としたものである。内部電位抑制量生成部65は、n個の入力パルスに対してそれぞれ固定の重みβpcwを乗じるAND回路86と、AND回路86からの出力を内部電位に加算する加算器87と、内部電位を減衰して加算器87に出力する減衰生成部88とを備え、内部電位を抑制量Spcw(t)として、加算器87から各CLニューロン部51Hの比較器74に出力する。 The internal potential suppression amount generation unit 65 is a portion that generates the suppression amount S pcw (t) of the change in internal potential with respect to the norm fluctuation of the input signal described above. Originally, each CL neuron unit 51H has a fixed weight of 1 The total sum of local membrane potentials pcw i (t) in the synapse part 54i is generated by multiplying by a constant ratio β pcw , but the weight and the decay time constant are not changed by the CL neuron part 51H, so each CL neuron part 51H It is taken out from the whole to make one. The internal potential suppression amount generator 65 multiplies the n input pulses by a fixed weight β pcw , an adder 87 that adds the output from the AND circuit 86 to the internal potential, and the internal potential. And an attenuation generation unit 88 that attenuates and outputs to the adder 87, and outputs the internal potential as the suppression amount S pcw (t) from the adder 87 to the comparator 74 of each CL neuron unit 51H.

なお、図10に示すCONPのハードウェア構成例では、学習機構(各CLニューロン部51Hにおける重みの更新機構)は搭載されていない。これは、学習はソフトウェアによるシミュレーションで行って、重みを決定しておき、その重みをハードウェア上に設定すればよいからである。勿論、学習機構のハードウェア化も可能であるが、回路構成の容易化や回路サイズの縮小のためには、学習はソフトウェア上で行っておくことが望ましい。   Note that the CONNP hardware configuration example shown in FIG. 10 does not include a learning mechanism (a weight update mechanism in each CL neuron unit 51H). This is because learning is performed by simulation by software, weights are determined, and the weights are set on the hardware. Of course, the learning mechanism can be implemented in hardware, but it is desirable to perform learning on software in order to facilitate the circuit configuration and reduce the circuit size.

左右方向検出部11は、上述した学習機構無しのハードウェア化されたCONPから構成され、図4に示すように、CLニューロン51を16個有している。16個のCLニューロン51は、番号1のものから番号16のものまで1列に並べられており、番号が近いものほど距離が近いとされている。各CLニューロン51には、時間差検出部10から出力された時間差情報(ベクトルyMSO(t))が入力される。左右方向検出部11は、上述したようにソフトウェア上でのシミュレーションにより重みが決定されている結果、入力ベクトルyMSO(t)をその類似関係を保持したまま量子化可能とされている。すなわち、左右方向検出部11は、互いに類似度の高い(方向の近い)ベクトルが入力されたときは互いに近いCLニューロン51が発火し、互いに類似度の低い(方向の遠い)ベクトルが入力されたときは互いに遠いCLニューロン51が発火する。したがって、左右方向検出部11からは、左右方向における音源方向(音源の方向)を示す方向情報が、どのCLニューロン51が発火するかで示されることとなる。ここでは、左右方向検出部11は、音源が左右2方向のうちのいずれの方向であるかを識別するものとし、番号1〜8のCLニューロンからの発火信号は左、番号9〜16のCLニューロンからの発火信号は右を示すものとする。 The left-right direction detection unit 11 includes the above-described hardware CONP without a learning mechanism, and includes 16 CL neurons 51 as shown in FIG. The 16 CL neurons 51 are arranged in a row from number 1 to number 16, and the closer the number, the closer the distance. The time difference information (vector y MSO (t)) output from the time difference detector 10 is input to each CL neuron 51. As described above, the left-right direction detection unit 11 can quantize the input vector y MSO (t) while maintaining the similarity as a result of the weight being determined by software simulation. That is, when the vectors having high similarity (close directions) are input to the left / right direction detection unit 11, the CL neurons 51 that are close to each other fire, and vectors having low similarity (distant directions) are input. Sometimes CL neurons 51 that are distant from each other fire. Therefore, the direction information indicating the sound source direction (sound source direction) in the left-right direction is indicated from the left-right direction detection unit 11 according to which CL neuron 51 fires. Here, the left / right direction detection unit 11 identifies which direction of the two left and right directions the sound source is, and the firing signals from the CL neurons numbered 1 to 8 are left, and the number 9 to number CL CL The firing signal from the neuron shall indicate the right.

また、音源同定部9の周波数パターン検出部12及び音源種類検出部13も、それぞれ、上述した学習機構無しのハードウェア化されたCONPから構成されている。   Also, the frequency pattern detection unit 12 and the sound source type detection unit 13 of the sound source identification unit 9 are each configured by hardware-based CONP without the learning mechanism described above.

周波数パターン検出部12は、入力信号処理部7から入力された入力信号に存在する周波数パターンを検出するものであり、入力信号に存在する周波数パターンをベクトル量子化して、CLニューロン51の発火パターンとして出力するように構成されている(非特許文献9の図5、図8参照)。   The frequency pattern detection unit 12 detects a frequency pattern present in the input signal input from the input signal processing unit 7. The frequency pattern detection unit 12 vector-quantizes the frequency pattern present in the input signal to generate a firing pattern of the CL neuron 51. It is comprised so that it may output (refer FIG. 5, FIG. 8 of a nonpatent literature 9).

音源種類検出部13は、学習時(すなわち、ソフトウェアによるシミュレーション時)にはLVQ(Learning Vector Quantization)による教師有り学習を行うことにより、周波数パターン検出部12から入力された発火パターンをさらにベクトル量子化して、その発火パターンに対応する音源種類(音源の種類)を示すCLニューロン51が発火するように構成されている。なお、LVQについては周知であるのでここでは説明しない。したがって、音源種類検出部13からは、音源種類を示す種類情報が、どのCLニューロン51が発火するかで示されることとなる。   The sound source type detection unit 13 further performs vector quantization on the firing pattern input from the frequency pattern detection unit 12 by performing supervised learning using LVQ (Learning Vector Quantization) during learning (that is, during simulation by software). Thus, the CL neuron 51 indicating the sound source type (sound source type) corresponding to the firing pattern is configured to fire. Since LVQ is well known, it will not be described here. Accordingly, the sound source type detection unit 13 indicates the type information indicating the sound source type according to which CL neuron 51 fires.

例えば、救急車の音には、それぞれ「ピー」「ポー」のように聞こえる2つの周波数パターンが存在するが、この2つの周波数パターンをそれぞれベクトル量子化するのが、周波数パターン検出部12であり、これらベクトル量子化された2つのパターンをまとめてベクトル量子化して「救急車」を示す発火信号を出力するのが、音源種類検出部13である。   For example, in the sound of an ambulance, there are two frequency patterns that sound like “pea” and “po”, respectively, and it is the frequency pattern detection unit 12 that vector-quantizes these two frequency patterns, The sound source type detection unit 13 outputs the firing signal indicating “ambulance” by vector quantization of these two vector-quantized patterns.

本実施形態では、音源種類検出部13は、音源が、「(一般の)自動車」「救急車」「インターフォン」「電話」の4種類のうちのいずれであるかを識別するものとし、CLニューロン51は8個として、番号1、2のCLニューロンからの発火信号は「自動車」、番号3、4のCLニューロンからの発火信号は「救急車」、番号5、6のCLニューロンからの発火信号は「インターフォン」、番号7、8のCLニューロンからの発火信号は「電話」を示すものとする。   In the present embodiment, the sound source type detection unit 13 identifies whether the sound source is one of four types of “(general) automobile”, “ambulance”, “interphone”, and “phone”, and the CL neuron 51 , The firing signals from the CL neurons numbered 1 and 2 are “car”, the firing signals from the CL neurons numbered 3 and 4 are “ambulances”, and the firing signals from the CL neurons numbered 5 and 6 are “ It is assumed that the firing signal from the CL neuron of “interphone” and numbers 7 and 8 indicates “telephone”.

認識処理部4の振動選択部18は、上記4つの音源種類にそれぞれ対応する振動パターンを記憶している。なお、振動パターンは音源種類によって異なるものとされている。そして、振動選択部18は、音源定位部8から出力された方向情報と音源同定部9から出力された種類情報とに基づいて、方向情報で示される音源方向が左であれば振動部3Lに、右であれば振動部3Rに、種類情報で示される音源種類に対する振動パターンに従って振動制御信号を出力するように構成されている。   The vibration selection unit 18 of the recognition processing unit 4 stores vibration patterns respectively corresponding to the four sound source types. The vibration pattern differs depending on the type of sound source. Based on the direction information output from the sound source localization unit 8 and the type information output from the sound source identification unit 9, the vibration selection unit 18 determines to the vibration unit 3L if the sound source direction indicated by the direction information is left. If it is right, the vibration control signal is output to the vibration unit 3R according to the vibration pattern for the sound source type indicated by the type information.

振動部3L、3Rは、それぞれ、振動モータを備え、振動選択部18から入力された振動制御信号に従って、振動モータで振動を発生するように構成されている。   Each of the vibration units 3L and 3R includes a vibration motor, and is configured to generate vibration with the vibration motor in accordance with a vibration control signal input from the vibration selection unit 18.

以上のように構成された音認識装置1を、使用者が装着すると、振動部3L、3Rは、それぞれ使用者の左の耳の上、右の耳の上に接触することとなる。そして、マイクロホン2L、2Rが、それぞれ使用者の左側、右側の音を集音して、入力信号処理部6、7に入力する。入力信号処理部6、7は、左右の入力信号を、それぞれ、周波数チャンネル毎に音圧に応じたパルス頻度を持つパルス列に変換する。   When the user wears the sound recognition device 1 configured as described above, the vibration units 3L and 3R come into contact with the left ear and the right ear of the user, respectively. The microphones 2L and 2R collect the sounds on the left and right sides of the user, respectively, and input them to the input signal processing units 6 and 7, respectively. The input signal processing units 6 and 7 convert the left and right input signals into a pulse train having a pulse frequency corresponding to the sound pressure for each frequency channel.

音源定位部8の時間差検出部10は、入力信号処理部6、7から入力されたパルス列に基づいて、左右の入力信号の時間差を示す時間差情報を出力する。そして、左右方向検出部11は、時間差検出部10から入力された時間差情報に基づいて、音源方向が左右のいずれであるかを示す方向情報を出力する。   The time difference detection unit 10 of the sound source localization unit 8 outputs time difference information indicating the time difference between the left and right input signals based on the pulse trains input from the input signal processing units 6 and 7. The left / right direction detection unit 11 outputs direction information indicating whether the sound source direction is left or right based on the time difference information input from the time difference detection unit 10.

一方、音源同定部9の周波数パターン検出部12は、入力信号処理部6、7から入力されたパルス列に基づいて、入力信号に存在する周波数パターンをベクトル量子化して、CLニューロン51の発火パターンを出力する。そして、音源種類検出部13は、周波数パターン検出部12から入力された発火パターンをベクトル量子化して、その発火パターンに対応した音源種類を示す種類情報を出力する。   On the other hand, the frequency pattern detection unit 12 of the sound source identification unit 9 vector-quantizes the frequency pattern present in the input signal based on the pulse train input from the input signal processing units 6 and 7, and determines the firing pattern of the CL neuron 51. Output. The sound source type detection unit 13 vector-quantizes the firing pattern input from the frequency pattern detection unit 12 and outputs type information indicating the sound source type corresponding to the firing pattern.

振動選択部18は、音源定位部8から出力された方向情報と音源同定部9から出力された種類情報とに基づいて、方向情報で示される音源方向が左であれば振動部3Lに、右であれば振動部3Rに、種類情報で示される音源種類に対応する振動パターンに従って振動制御信号を出力し、これにより、振動部3L、3Rは、音源種類に対応する振動パターンに従って振動する。   Based on the direction information output from the sound source localization unit 8 and the type information output from the sound source identification unit 9, the vibration selection unit 18 determines that the sound source direction indicated by the direction information is to the left, the vibration unit 3L If so, a vibration control signal is output to the vibration unit 3R in accordance with the vibration pattern corresponding to the sound source type indicated by the type information, whereby the vibration units 3L and 3R vibrate according to the vibration pattern corresponding to the sound source type.

振動部3L、3Rは、音認識装置1の使用者に接触する部位に設けられているため、使用者は直ぐに振動を感知することができ、その振動パターンで音源種類を知ることができるとともに、左側に設けられた振動部3Lが振動していれば音源が左に、右側に設けられた振動部3Rが振動していれば音源が右にあることが分かり、感覚的に音源の方向を知ることができる。   Since the vibration parts 3L and 3R are provided in a portion that comes into contact with the user of the sound recognition device 1, the user can immediately detect vibration and know the sound source type from the vibration pattern. If the vibration unit 3L provided on the left side vibrates, the sound source is on the left, and if the vibration unit 3R provided on the right side vibrates, the sound source is on the right side, and the direction of the sound source is known sensuously. be able to.

以上述べたように、音認識装置1は、使用者が音認識装置1を装着したときに使用者に接触するような部位に振動部3L、3Rが設けられて、方向情報で示される音源方向に対向するような部位の振動部3L、3R(すなわち、左方向なら振動部3L、右方向なら振動部3R)が、音源種類によって異なる振動パターンで振動するので、使用者の視野の邪魔をせずに使用者に音源の方向と種類を知らせることが可能であるとともに、振動を感じた方向に音源があるので、使用者は感覚的に音の方向を知ることができる。   As described above, the sound recognizing device 1 is provided with the vibration units 3L and 3R at portions that come into contact with the user when the user wears the sound recognizing device 1, and the sound source direction indicated by the direction information. Since the vibration parts 3L and 3R of the part facing to (vibration part 3L in the left direction and vibration part 3R in the right direction) vibrate with different vibration patterns depending on the sound source type, disturb the user's visual field. In addition, it is possible to inform the user of the direction and type of the sound source, and since the sound source is in the direction in which the vibration is felt, the user can know the direction of the sound sensuously.

なお、1の音源方向に対して複数の振動部を振動させるようにしてもよい。例えば、音認識装置1において音源定位部8で左、右、前の3方向を識別するようにし、音源方向が左の場合には振動部3Lのみを、右の場合には振動部3Rのみを振動させるが、前の場合には振動部3L、3Rの両方を振動させることとしてもよい。すなわち、互いに異なる音源方向に対しては少なくとも1つの異なる振動部が振動するように構成すればよい。どの振動部が振動するかによって音源の方向が分かるからである。上記の3方向の例では、音源方向が左の場合と右の場合とでは振動する振動部が前者は振動部3L、後者は振動部3Rとすべて異なり、左の場合と前の場合とでは振動部3Lは共通するが振動部3Rが異なり、右の場合と前の場合とでは振動部3Rは共通するが振動部3Lが異なる。   In addition, you may make it vibrate a some vibration part with respect to one sound source direction. For example, in the sound recognition device 1, the sound source localization unit 8 identifies the left, right, and front three directions. When the sound source direction is left, only the vibration unit 3L is used, and when the sound source direction is right, only the vibration unit 3R is used. Although it vibrates, in the case of the former, it is good also as vibrating both the vibration parts 3L and 3R. That is, at least one different vibration part may be configured to vibrate for different sound source directions. This is because the direction of the sound source can be determined depending on which vibration part vibrates. In the example of the above three directions, the vibration part that vibrates is different between the former and the vibration part 3L, and the latter is different from the vibration part 3R. The part 3L is the same, but the vibrating part 3R is different, and the vibrating part 3R is the same in the right case and the previous case, but the vibrating part 3L is different.

また、音認識装置1では、使用者が装着したときに各音源方向(すなわち左方と右方)に対向する部位にそれぞれ振動部3L、3Rを設け、方向情報で示される音源方向が左であれば振動部3Lを、右であれば振動部3Rを振動させたが、必ずしも、各音源方向に対向するような部位に振動部を設けて、方向情報で示される音源方向に対向する部位の振動部を振動させる必要は無い。但し、使用者が装着したときに各音源方向に対向するような部位にそれぞれ振動部を設けて、方向情報で示される音源方向に対向する部位の振動部を振動させれば、振動を感じた方向が音源方向であるので、使用者は感覚的に音の方向を知ることができる。   Further, in the sound recognition device 1, the vibration units 3L and 3R are respectively provided in portions facing each sound source direction (that is, left and right) when the user wears, and the sound source direction indicated by the direction information is on the left. If there is a vibration part 3L, if it is right, the vibration part 3R is vibrated, but a vibration part is not necessarily provided in a part that faces each sound source direction, and a part that faces the sound source direction indicated by the direction information. There is no need to vibrate the vibration part. However, if a vibration part is provided in each part that faces each sound source direction when the user wears it, and the vibration part in the part that faces the sound source direction indicated by the direction information is vibrated, vibration was felt. Since the direction is the sound source direction, the user can know the direction of the sound sensuously.

また、音認識装置1が識別可能な各音源種類に対してどの振動パターンを対応付けるかを使用者が設定できるようにしたり、振動強度を使用者が調整できるようにしたりしてもよい。   In addition, the user may be able to set which vibration pattern is associated with each sound source type that can be identified by the sound recognition device 1, or the user may be able to adjust the vibration intensity.

また、音認識装置は、図11に示すように、既製の眼鏡に装着可能なアタッチメント型の音認識装置1Bとしてもよい。以下、音認識装置1と同じ構成要素には同じ符号を用いて説明すると、音認識装置1Bは、眼鏡の左右の蔓にそれぞれ嵌合可能な取付部31L、31Rを備え、取付部31L、31Rは互いに紐状部材32で接続されている。取付部31Lには、外側にマイクロホン2Lが、内側に振動部3Lが取着され、取付部31Rには、外側にマイクロホン2Rが、内側に振動部3Rが取着されている。また、取付部31L、31Rの一方には、認識処理部4及び電源5が内蔵されている。音認識装置1Bは、取付部31L、31Rを既製の眼鏡の左右の蔓に、図中2点鎖線で示すようにそれぞれ嵌合して用いる。すると、音認識装置1Bは、音認識装置1と同様に動作して、振動部3L、3Rが振動により使用者に音源の方向と種類を報知する。   In addition, as shown in FIG. 11, the sound recognition device may be an attachment type sound recognition device 1B that can be attached to ready-made glasses. Hereinafter, the same components as those of the sound recognition device 1 will be described using the same reference numerals. The sound recognition device 1B includes attachment portions 31L and 31R that can be fitted to the left and right vines of the glasses, respectively, and the attachment portions 31L and 31R. Are connected to each other by a string-like member 32. A microphone 2L is attached to the outside of the attachment portion 31L, and a vibration portion 3L is attached to the inside. A microphone 2R is attached to the outside of the attachment portion 31R, and the vibration portion 3R is attached to the inside. Further, the recognition processing unit 4 and the power source 5 are built in one of the attachment units 31L and 31R. The sound recognition device 1B is used by fitting the attachment portions 31L and 31R to the left and right vines of ready-made glasses as shown by the two-dot chain lines in the figure. Then, the sound recognition device 1B operates in the same manner as the sound recognition device 1, and the vibration units 3L and 3R notify the user of the direction and type of the sound source by vibration.

また、音認識装置を眼鏡以外のウェアラブルな形態としてもよく、例えば、帽子に一体化された帽子型としてもよい。帽子型の場合には、例えば振動部を帽子の内側の前部、後部、左側部、右側部にそれぞれ取着するとともに、音源定位部8で前後左右の4方向を識別することとし、前方、後方、左方、右方からの音に対しては、それぞれ、前部、後部、左側部、右側部に取着された振動部が振動するように構成してもよい。   Further, the sound recognition device may be a wearable form other than glasses, for example, a hat shape integrated with a hat. In the case of a hat type, for example, the vibration part is attached to the front part, the rear part, the left part, and the right part on the inner side of the hat, and the sound source localization part 8 identifies the front, rear, left, and right directions, and the front, You may comprise so that the vibration part attached to the front part, the rear part, the left side part, and the right side part may vibrate with respect to the sound from back, left side, and right side, respectively.

また、時間差検出部10として、特許文献2に記載された時間差検出器を用いてもよいし、左右方向検出部11、周波数パターン検出部12、音源種類検出部13として、特許文献3記載の競合学習ニューラルネットワーク(CONP−II)を用いてもよく、パルスニューラルネットワークではない装置を用いてもよい。すなわち、音源定位の方法、音源同定の方法は、上述した方法に限られない。   Moreover, the time difference detector described in Patent Document 2 may be used as the time difference detection unit 10, and the competition described in Patent Document 3 may be used as the left-right direction detection unit 11, the frequency pattern detection unit 12, and the sound source type detection unit 13. A learning neural network (CONP-II) may be used, or a device that is not a pulse neural network may be used. That is, the sound source localization method and the sound source identification method are not limited to the methods described above.

本発明の一実施形態に係る音認識装置の斜視図である。1 is a perspective view of a sound recognition device according to an embodiment of the present invention. 同実施形態に係る音認識装置のブロック構成図である。It is a block block diagram of the sound recognition apparatus which concerns on the same embodiment. 入力信号処理部の構成を示すブロック図である。It is a block diagram which shows the structure of an input signal processing part. 時間差検出部及び左右方向検出部の模式図である。It is a schematic diagram of a time difference detection part and a left-right direction detection part. MSOニューロン列の構成を示す図である。It is a figure which shows the structure of a MSO neuron row | line | column. 時間差検出部をディジタル回路で構成した例であり、(a)は1クロックの前半の動作を、(b)は後半の動作を説明するための図である。It is the example which comprised the time difference detection part with the digital circuit, (a) is the figure for demonstrating operation | movement of the first half of 1 clock, (b) is operation | movement for the latter half. CONPの模式図である。It is a schematic diagram of CONP. CONPにおけるCLニューロンの模式図である。It is a schematic diagram of CL neuron in CONP. CONPの動作を示すフローチャートである。It is a flowchart which shows the operation | movement of CONP. CONPの動作を示すフローチャートである。It is a flowchart which shows the operation | movement of CONP. CONPをディジタル回路で構成した例である。This is an example in which CONP is configured by a digital circuit. 本発明の他の実施形態に係る音認識装置である。It is a sound recognition apparatus which concerns on other embodiment of this invention.

符号の説明Explanation of symbols

1、1B…音認識装置
2L、2R…マイクロホン
3L、3R…振動部
8…音源定位部
9…音源同定部
DESCRIPTION OF SYMBOLS 1, 1B ... Sound recognition apparatus 2L, 2R ... Microphone 3L, 3R ... Vibration part 8 ... Sound source localization part 9 ... Sound source identification part

Claims (2)

使用者に装着される眼鏡一体型ウェアラブル音認識装置であって、
眼鏡の左の蔓に設けられた左のマイクロホンと、
前記眼鏡の右の蔓に設けられた右のマイクロホンと、
前記左のマイクロホンから入力された左の入力音と前記右のマイクロホンから入力された右の入力音との時間差に基づいて、音源が複数の音源方向のうちのどの音源方向にあるかを識別し、当該音源方向を示す方向情報を出力する音源定位部と、
前記左の入力音または前記右の入力音の少なくとも一方の周波数パターンに基づいて、音源が複数の音源種類のうちのどの音源種類であるかを識別し、当該音源種類を示す種類情報を出力する音源同定部と、
使用者が装着したときにそれぞれ使用者に接触するような部位に設けられた複数の振動部と、
を備え、
前記各音源種類に対してそれぞれ異なる振動パターンが設定され、
前記方向情報と前記種類情報とに基づいて、1つ以上の前記振動部が前記種類情報で示される音源種類に対する振動パターンで振動するように構成されるとともに、異なる音源方向に対しては少なくとも1つの異なる前記振動部が振動するように構成され
前記振動部として、前記眼鏡の左の蔓に設けられた左の振動部と、前記眼鏡の右の蔓に設けられた右の振動部とを備え、
音源方向が左の場合には前記左の振動部が前記種類情報で示される音源種類に対する振動パターンで振動して前記右の振動部は振動せず、音源方向が右の場合には前記右の振動部が前記種類情報で示される音源種類に対する振動パターンで振動して前記左の振動部は振動しないように構成されたことを特徴とするウェアラブル音認識装置。
An eyeglass-integrated wearable sound recognition device worn by a user,
The left microphone on the left vine of the glasses,
A right microphone provided on the right vine of the glasses;
Based on the time difference between the left input sound input from the left microphone and the right input sound input from the right microphone, the sound source is identified from among the plurality of sound source directions. A sound source localization unit that outputs direction information indicating the sound source direction;
Based on the frequency pattern of at least one of the left input sound and the right input sound, the sound source is identified from among a plurality of sound source types, and type information indicating the sound source type is output. A sound source identification unit;
A plurality of vibration parts provided in parts that come into contact with the user when the user wears each;
With
Different vibration patterns are set for each sound source type,
Based on the direction information and the type information, one or more of the vibration units are configured to vibrate with a vibration pattern for the sound source type indicated by the type information, and at least one for different sound source directions. Two different vibrating parts are configured to vibrate ;
As the vibration part, comprising a left vibration part provided on the left vine of the glasses, and a right vibration part provided on the right vine of the glasses,
When the sound source direction is left, the left vibration unit vibrates in a vibration pattern corresponding to the sound source type indicated by the type information, the right vibration unit does not vibrate, and when the sound source direction is right, the right vibration unit A wearable sound recognizing device, wherein the vibration unit vibrates in a vibration pattern corresponding to a sound source type indicated by the type information, and the left vibration unit does not vibrate .
既製の眼鏡に装着可能なアタッチメント型ウェアラブル音認識装置であって、
眼鏡の左の蔓に取り付け可能な左の取付部と、
前記眼鏡の右の蔓に取り付け可能な右の取付部と、
前記左の取付部に設けられた左のマイクロホンと、
前記右の取付部に設けられた右のマイクロホンと、
前記左のマイクロホンから入力された左の入力音と前記右のマイクロホンから入力された右の入力音との時間差に基づいて、音源が複数の音源方向のうちのどの音源方向にあるかを識別し、当該音源方向を示す方向情報を出力する音源定位部と、
前記左の入力音または前記右の入力音の少なくとも一方の周波数パターンに基づいて、音源が複数の音源種類のうちのどの音源種類であるかを識別し、当該音源種類を示す種類情報を出力する音源同定部と、
前記左の取付部の、前記ウェアラブル音認識装置を装着した眼鏡を使用者が装着したときに使用者に接触するような部位に設けられた左の振動部と、
前記右の取付部の、前記ウェアラブル音認識装置を装着した眼鏡を使用者が装着したときに使用者に接触するような部位に設けられた右の振動部と、
を備え、
前記各音源種類に対してそれぞれ異なる振動パターンが設定され、
前記方向情報と前記種類情報とに基づいて、音源方向が左の場合には前記左の振動部が前記種類情報で示される音源種類に対する振動パターンで振動して前記右の振動部は振動せず、音源方向が右の場合には前記右の振動部が前記種類情報で示される音源種類に対する振動パターンで振動して前記左の振動部は振動しないように構成されたことを特徴とするウェアラブル音認識装置。
An attachment-type wearable sound recognition device that can be attached to ready-made glasses,
A left attachment that can be attached to the left vine of glasses;
A right attachment that can be attached to the right vine of the glasses;
A left microphone provided in the left mounting portion;
A right microphone provided in the right mounting portion;
Based on the time difference between the left input sound input from the left microphone and the right input sound input from the right microphone, the sound source is identified from among the plurality of sound source directions. A sound source localization unit that outputs direction information indicating the sound source direction;
Based on the frequency pattern of at least one of the left input sound and the right input sound, the sound source is identified from among a plurality of sound source types, and type information indicating the sound source type is output. A sound source identification unit;
A left vibrating portion provided on a portion of the left mounting portion that comes into contact with the user when the user wears the spectacles on which the wearable sound recognition device is mounted;
A right vibrating portion provided on a portion of the right attachment portion that comes into contact with the user when the user wears the glasses equipped with the wearable sound recognition device;
With
Different vibration patterns are set for each sound source type,
Based on the direction information and the type information, when the sound source direction is left, the left vibration unit vibrates with a vibration pattern for the sound source type indicated by the type information, and the right vibration unit does not vibrate. The wearable sound is configured such that when the sound source direction is right, the right vibration unit vibrates in a vibration pattern corresponding to the sound source type indicated by the type information, and the left vibration unit does not vibrate. Recognition device.
JP2008250268A 2008-09-29 2008-09-29 Wearable sound recognition device Expired - Fee Related JP5279010B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008250268A JP5279010B2 (en) 2008-09-29 2008-09-29 Wearable sound recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008250268A JP5279010B2 (en) 2008-09-29 2008-09-29 Wearable sound recognition device

Publications (2)

Publication Number Publication Date
JP2010079182A JP2010079182A (en) 2010-04-08
JP5279010B2 true JP5279010B2 (en) 2013-09-04

Family

ID=42209656

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008250268A Expired - Fee Related JP5279010B2 (en) 2008-09-29 2008-09-29 Wearable sound recognition device

Country Status (1)

Country Link
JP (1) JP5279010B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160066896A (en) * 2014-12-03 2016-06-13 오성우 Glasses style wearable terminal for hearing impaired person
CN106954140A (en) * 2017-04-21 2017-07-14 北京奇虎科技有限公司 A kind of reminding method of barrier, device and barrier prompt system

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8766765B2 (en) 2012-09-14 2014-07-01 Hassan Wael HAMADALLAH Device, method and computer program product to assist visually impaired people in sensing voice direction
US9781243B1 (en) * 2016-06-27 2017-10-03 Intel Corporation Optimizing wearable device settings using machine learning
EP4011099A1 (en) * 2019-08-06 2022-06-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. System and method for assisting selective hearing
CN111314839A (en) * 2020-03-06 2020-06-19 湘潭大学 Pendant capable of distinguishing sound source direction and implementation method thereof
KR20220006924A (en) * 2020-07-09 2022-01-18 삼성전자주식회사 Wearable device and operating method thereof

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0997396A (en) * 1995-09-29 1997-04-08 Aqueous Res:Kk On-vehicle guiding device
JPH10282985A (en) * 1997-04-07 1998-10-23 Omron Corp Hearing support device
JP4250871B2 (en) * 2001-02-08 2009-04-08 ヤマハ株式会社 Hearing aids
JP2004205839A (en) * 2002-12-25 2004-07-22 Fuji Iryoki:Kk Hearing aid
JP2004240855A (en) * 2003-02-07 2004-08-26 Nippon Telegr & Teleph Corp <Ntt> Acoustic information presentation device
JP2007108254A (en) * 2005-10-11 2007-04-26 Towa Kogyo:Kk Eyeglasses with hearing aid and adjusting method thereof
JP2007334149A (en) * 2006-06-16 2007-12-27 Akira Hata Head mount display apparatus for hearing-impaired persons
JP2008227806A (en) * 2007-03-12 2008-09-25 Yamaha Corp Bone conduction speaker system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160066896A (en) * 2014-12-03 2016-06-13 오성우 Glasses style wearable terminal for hearing impaired person
CN106954140A (en) * 2017-04-21 2017-07-14 北京奇虎科技有限公司 A kind of reminding method of barrier, device and barrier prompt system

Also Published As

Publication number Publication date
JP2010079182A (en) 2010-04-08

Similar Documents

Publication Publication Date Title
JP5279010B2 (en) Wearable sound recognition device
US20180070173A1 (en) Methods circuits devices systems and associated computer executable code for acquiring acoustic signals
US11330378B1 (en) Hearing device comprising a recurrent neural network and a method of processing an audio signal
EP3267697A1 (en) Direction of arrival estimation in miniature devices using a sound sensor array
US10469959B2 (en) Method of operating a hearing aid system and a hearing aid system
JP4982743B2 (en) Sound source localization / identification device
CN115243137A (en) Earphone set
US9906872B2 (en) Hearing-aid noise reduction circuitry with neural feedback to improve speech comprehension
US9253571B2 (en) Hearing apparatus for binaural supply and method for providing a binaural supply
CN113692750A (en) Sound transfer function personalization using sound scene analysis and beamforming
US20220232331A1 (en) Hearing device comprising a recurrent neural network and a method of processing an audio signal
EP2876900A1 (en) Spatial filter bank for hearing system
EP2519033B1 (en) Method for operating a hearing aid with reduced comb filter perceptio and hearing aid with reduced comb filter perception
EP4236361A2 (en) Audio system using individualized sound profiles
EP4352973A1 (en) System and method for aiding hearing
CN114009063A (en) Hearing device with bone conduction sensor
JP4958172B2 (en) Sound source localization device
KR20220047257A (en) Earplug assembly for a hear-through audio system
KR20220050215A (en) Pinna information inference through beamforming for individualized spatial audio generation
US11290837B1 (en) Audio system using persistent sound source selection for audio enhancement
CN112911477A (en) Hearing system comprising a personalized beamformer
US11889268B2 (en) Method for operating a hearing aid system having a hearing instrument, hearing aid system and hearing instrument
KR20230041755A (en) Virtual microphone calibration based on displacement of the outer ear
US20190306618A1 (en) Methods circuits devices systems and associated computer executable code for acquiring acoustic signals
WO2020176770A1 (en) Hearing assistance devices with motion sickness prevention and mitigation features

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110824

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130516

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5279010

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees