JP2003255984A - 野鳥の鳴き声認識装置及びその認識方法 - Google Patents

野鳥の鳴き声認識装置及びその認識方法

Info

Publication number
JP2003255984A
JP2003255984A JP2002060981A JP2002060981A JP2003255984A JP 2003255984 A JP2003255984 A JP 2003255984A JP 2002060981 A JP2002060981 A JP 2002060981A JP 2002060981 A JP2002060981 A JP 2002060981A JP 2003255984 A JP2003255984 A JP 2003255984A
Authority
JP
Japan
Prior art keywords
wild bird
wild
bird
model
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002060981A
Other languages
English (en)
Other versions
JP4209122B2 (ja
Inventor
Kunihiko Owa
邦彦 尾和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asahi Kasei Corp
Original Assignee
Asahi Kasei Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asahi Kasei Corp filed Critical Asahi Kasei Corp
Priority to JP2002060981A priority Critical patent/JP4209122B2/ja
Publication of JP2003255984A publication Critical patent/JP2003255984A/ja
Application granted granted Critical
Publication of JP4209122B2 publication Critical patent/JP4209122B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 野鳥の鳴き声からその野鳥の種別を的確に識
別する。 【解決手段】 人の音響モデルと同様にして野鳥の鳴き
声の音響的な特徴を表す野鳥用音響モデルを作成する。
鳴き声の特徴がフクロウと類似するキジバトについて
は、複数の特徴からなるパターンであり且つ鳴き声に繰
り返し現れるパターンに基づいて音響モデルを作成し、
フクロウについてはその音響的な特徴単体に基づき音響
モデルを作成する。キジバトの鳴き声はフクロウの音響
モデルよりもキジバトの音響モデルとの類似度が高く、
フクロウの鳴き声はキジバトの音響モデルよりもフクロ
ウの音響モデルとの類似度が高くなり識別できる。ま
た、鳴き方によって鳴き声の特徴の継続時間が異なるヒ
ヨドリについては、その継続時間に応じて複数の音響モ
デルを作成する。長く鳴いた場合には、短く鳴いた場合
の音響モデルとの類似度は低いが、長く鳴いた場合の音
響モデルとの類似度は高くなり識別が可能となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、野鳥の鳴き声か
ら野鳥の種類を認識するようにした野鳥の鳴き声認識装
置及び野鳥の鳴き声認識方法に関する。
【0002】
【従来の技術】一般に、野鳥の鳴き声には非常に類似し
ているものがあるため、一般の人々にとって、野鳥の鳴
き声からその種類を特定するのは困難である。このた
め、例えば、鳴き声を記憶しておき、後に、事典等を参
照して野鳥の種別を認識したり、野鳥の専門家が同行し
ているときに、専門家にその鳴き声から野鳥を特定して
もらうこと等によって、野鳥の種別を認識するようにし
ている。
【0003】
【発明が解決しようとする課題】しかしながら、野鳥の
鳴き声を記憶しておき、後に事典等を参照して野鳥の種
別を認識するような方法では、記憶が不鮮明になってし
まい、的確に野鳥の種別を判定することができない。ま
た、仮に野鳥の種別がわかっても、めずらしい野鳥であ
った場合等には、後に野鳥の鳴き声がわかったとして
も、その野鳥の鳴き声を聞いたという感動が薄れてしま
う。また、野鳥の鳴き声を聞いたときに専門家が常に同
行しているとは限らず、野鳥の専門家でなくとも、鳴き
声を聞いた時点で野鳥の種類を識別することのできる装
置が望まれていた。
【0004】そこで、この発明は、上記従来の未解決の
問題に着目してなされたものであり、野鳥の鳴き声から
その種別を容易に識別することの可能な野鳥の鳴き声認
識装置及び野鳥の鳴き声認識方法を提供することを目的
としている。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、本発明の請求項1に係る野鳥の鳴き声認識装置は、
音情報からその音響的な特徴を抽出する特徴抽出手段
と、野鳥の鳴き声の音響的な特徴を表す複数のモデルか
らなるデータベースと、前記特徴抽出手段で抽出した音
情報の特徴と前記データベースのモデルとを照合して、
前記音情報に該当する野鳥を検出する鳴き声認識手段
と、を備えた野鳥の鳴き声認識装置であって、前記モデ
ルは、前記野鳥の鳴き方パターンに応じた前記音響的な
特徴の出現パターンに応じて設定されることを特徴とし
ている。
【0006】また、請求項2に係る野鳥の鳴き声認識装
置は、前記請求項1に係る野鳥の鳴き声認識装置におい
て、前記モデルは、同一の特徴が繰り返し出現する繰り
返しパターンからなるモデルであることを特徴としてい
る。また、請求項3に係る野鳥の鳴き声認識装置は、前
記請求項1に係る野鳥の鳴き声認識装置において、前記
モデルは、同一の特徴を有し且つ継続時間の異なるパタ
ーンからなる複数のモデルであることを特徴としてい
る。
【0007】また、請求項4に係る野鳥の鳴き声認識装
置は、前記請求項1乃至3の何れかに係る野鳥の鳴き声
認識装置において、前記音情報が観測されたときの環境
状況を入力するための環境条件設定手段を備え、前記鳴
き声認識手段は、前記環境条件設定手段で設定された環
境条件を考慮して前記音情報に該当する野鳥を検出する
ようになっていることを特徴としている。
【0008】また、請求項5に係る野鳥の鳴き声認識装
置は、前記請求項4に係る野鳥の鳴き声認識装置におい
て、前記鳴き声認識手段は、前記複数のモデルのうち、
前記環境条件設定手段で設定された条件に該当するモデ
ルを選択し、当該選択したモデルについてのみ前記照合
を行うようになっていることを特徴としている。また、
請求項6に係る野鳥の鳴き声認識装置は、前記請求項4
又は5に係る野鳥の鳴き声認識装置において、前記鳴き
声認識手段は、前記環境条件設定手段で設定された条件
に基づいて前記モデルとの照合結果に重み付けを行い、
これに基づいて前記音情報に該当する野鳥を特定するよ
うになっていることを特徴としている。
【0009】また、請求項7に係る野鳥の鳴き声認識装
置は、前記請求項4乃至5の何れかに係る野鳥の鳴き声
認識装置において、前記環境条件設定手段は、GPS人
工衛星からの衛星電波を受信する受信手段を備え、前記
衛星電波に含まれるGPS情報を前記環境条件として利
用するようになっていることを特徴としている。また、
本発明の請求項8に係る野鳥の鳴き声認識方法は、音情
報からその音響的な特徴を抽出し、抽出した特徴と、予
め設定した野鳥の鳴き声の音響的な特徴を表す複数のモ
デルとを照合して前記音情報に該当する野鳥を特定する
ようにした野鳥の鳴き声認識方法であって、前記モデル
を、前記野鳥の鳴き方パターンに応じた前記音響的な特
徴の出現パターンに応じて設定するようにしたことを特
徴としている。
【0010】また、請求項9に係る野鳥の鳴き声認識方
法は、請求項8に係る野鳥の鳴き声認識方法において、
前記音情報が観測されたときの環境状況を入力するため
の環境条件設定手段を設け、当該環境条件設定手段で設
定された環境条件を考慮して前記音情報に該当する野鳥
を検出することを特徴としている。
【0011】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて説明する。図1は、本発明における野鳥の鳴
き声認識装置の一例を示すブロック図であって、図1に
示すように、マイクロフォン1と、A/D変換部2と、
特徴抽出手段としての音響解析部3と、鳴き声認識手段
としての音声認識部4と、データベース5と、出力部6
と、環境条件設定手段としての条件入力部7と、を備え
ている。
【0012】前記マイクロフォン1は、野鳥の鳴き声等
の音情報をその音情報に対応するアナログの電気信号に
変換し、この電気信号を、A/D変換部2においてデジ
タル信号に変換する。前記音響解析部3は、公知の音声
認識装置における音響解析部3と同等の機能構成を有
し、前記A/D変換部2で変換されたデジタル信号に基
づいて、例えばケプストラム分析や線形予測分析等を行
い、入力される音情報の特徴を表す特徴パラメータを求
め、この特徴パラメータの時系列に変換する。
【0013】前記音声認識部4は、公知の音声認識装置
における音声認識部と同等の機能構成を有し、例えば、
公知の隠れマルコフモデル(HMM)による方法等を用
いて、前記データベース5に予め格納された、後述の、
野鳥の鳴き声及び音声の特徴パラメータに関する情報、
つまり音響モデルと、音響解析部3で変換した特徴パラ
メータとを照合し、ビタビアルゴリズムにより確率演算
を行い、最大確率を持つ認識対象、つまり、最も類似度
の高いモデルに該当する野鳥又は音声を認識結果としこ
れを出力する。なお、音声認識部4における認識方法
は、これに限るものではなく、人間の音声認識を行うた
めの機能を有するものであれば、どのような認識方法で
あってもよい。
【0014】前記出力部6は、音声認識部4での認識結
果をもとに、認識した単語や、鳴き声に該当する野鳥の
名前を表示装置に表示したり、また、野鳥の場合には、
これに該当する画像を表示する等の処理を行い、入力さ
れた音情報に対する認識結果を出力する。前記データベ
ース5には、公知の音声認識装置と同様に、人の音声の
特徴を表す人用音響モデルが格納されていると共に、さ
らに、野鳥の種別を識別するための、鳴き声の特徴を表
す野鳥用音響モデルが格納されている。
【0015】ここで、人間の音声に対する音声認識は、
音声の周波数情報の時間的変化をパターン認識すること
と同等であるとみなすことができる。したがって、周波
数情報の時間的変化パターンに特徴のある音情報であれ
ば、人間の音声認識を行う場合と同様の手順で、識別を
行うことが可能であり、野鳥の鳴き声についても識別を
行うことが可能である。
【0016】前記人用音響モデルは、公知の音声認識装
置における音響モデルと同様であって、例えば、不特定
の話者が発生した音声を認識対象とする場合には、不特
定話者の音声データを大量に収集し、公知のEMアルゴ
リズムを用いて認識音声単位のHMMのパラメータを推
定することにより音響モデルを作成する。また、野鳥用
音響モデルの場合も同様であって、野鳥の鳴き声のデー
タを大量に収集し、人用音響モデルと同様にして音響モ
デルを作成したものであるが、音声の認識単位は、野鳥
の種別毎にその鳴き方のパターンに応じた鳴き声の特徴
の出現パターンに応じて設定される。
【0017】図2及び図3は、野鳥の鳴き声波形とその
スペクトログラムの一例を示したものであって、図2
(a)はキジバトの鳴き声、図2(b)はフクロウの鳴
き声である。また、図3はヒヨドリの鳴き声であって、
(a)は短く鳴いた場合、(b)は長く鳴いた場合であ
る。図2(a)に示すように、キジバトの鳴き声の場
合、鳴き声波形及びスペクトログラムにおいて特定のパ
ターンa11及びa21を繰り返している。ここで、図2
(a)のキジバトの鳴き声におけるパターンa11、a21
の前半部a12、a22の一部a13、a23と、図2(b)の
フクロウの鳴き声波形におけるパターンb1 、b 2 とを
比較してみると、これらは類似している。なお、図2
(a)において、パターンa13、a23の時間長は、0.
41秒、図2(b)において、パターンb1、b2 の時
間長は、0.52秒である。
【0018】ところで、キジバトは一般に同じ鳴き方で
連続して繰り返し鳴くことが多く、その鳴き声には、図
2(a)に示すように、パターンa11及びa21を繰り返
す特徴がある。したがって、キジバトの鳴き声の認識単
位としては、繰り返し現れるパターンa11及びa21をキ
ジバトの鳴き声の特徴を表す特徴パターンとする。一
方、フクロウは、一般に、ある特定のパターンを繰り返
し連続して鳴くことはないから、図2(b)に示すよう
に、b1 及びb2をフクロウの鳴き声の特徴を表す特徴
パターンとする。
【0019】また、図3(a)及び(b)に示すよう
に、ヒヨドリの場合、短く鳴く場合と長く鳴く場合とが
あり、これらの場合、その音響的な特徴は同一であるが
その継続時間が異なっている。したがって、短く鳴く場
合のパターンc1 と、長く鳴く場合のパターンd1 とを
それぞれ特徴パターンとして設定する。なお、図3
(a)においてパターンc1 、c2 の時間長は0.27
秒、図3(b)においてパターンd1 、d2 の時間長は
0.75秒である。
【0020】なお、ここでは、ヒヨドリの特徴パターン
として短く鳴く場合と長く鳴く場合の2つを設定した場
合について説明したが、これに限らず、鳴き声の継続時
間に応じて、複数設定することも可能である。そして、
これら特徴パターンに基づいてそれぞれ野鳥用音響モデ
ルを作成する。
【0021】前記データベース5には、さらに、前記条
件入力部7から入力される識別モード及び環境条件に応
じて、複数の音響モデルの中から、入力された識別モー
ド及び環境条件に該当する音響モデルを選定するための
選定情報が格納されている。ここで、前記条件入力部7
から入力される条件としては、野鳥の鳴き声を識別する
野鳥モード、人間の音声を識別する人モードの何れのモ
ードを選択するかといった識別モードと、野鳥の鳴き声
を観測した場所が、山、川、野、或いは海であるかとい
った場所情報、緯度、経度等といった位置情報、観測時
期、観測時間等の時刻情報等といった、野鳥の鳴き声を
観測した環境を表す環境条件とが入力される。
【0022】そして、これら識別モードとこれに該当す
る音響モデルと、環境条件とこの環境条件で特定される
環境下において観測されると予測される野鳥に該当する
音響モデルとが対応づけられて、前記選定情報として設
定されている。次に、上記実施の形態の動作を、音声認
識部4の処理手順の一例を示す図4のフローチャートに
基づいて説明する。
【0023】今、野鳥の鳴き声から野鳥の種類を識別す
るものとすると、まず、条件入力部7において、識別モ
ードとして野鳥モードを設定する。また、条件入力部7
において、環境条件を設定する。この状態で、野鳥の鳴
き声がマイクロフォン1で集音されると、A/D変換部
2で野鳥の鳴き声に対応する電気信号に変換され、これ
が音響解析部3で処理されて時系列の特徴パラメータに
変換され音声認識部4に出力される。
【0024】音声認識部4では、図4のフローチャート
に示すように、条件入力部7において、識別モードとし
て野鳥モードが設定されているから、ステップS1から
ステップS2に移行する。このとき、環境条件が設定さ
れている場合には、ステップS3に移行し、データベー
ス4に格納されている選定情報に基づき、設定された環
境条件に対応する音響モデルを選定する。例えば、観測
位置が、水辺であれば、水辺に存在する野鳥の音響モデ
ルが選定され、野山等に存在する野鳥の音響モデルは排
除される。また、観測時期が、冬であれば、日本に夏に
しか存在しない野鳥の音響モデルは排除される。また、
観測時刻が、夜であれば、昼間にしか活動しない野鳥の
音響モデルは排除される。したがって、環境条件にそぐ
わない野鳥はこの時点で排除されることになるから、観
測環境からみてあり得ない野鳥が、入力された鳴き声に
対応する野鳥として認識されることが回避される。
【0025】前記音声認識部4では、選定された音響モ
デルと、音響解析部3から入力された特徴パラメータと
を照合し(ステップS3)、最も類似度の高い鳴き声を
認識結果とし、この鳴き声に該当する野鳥名を出力部6
に出力する(ステップS4)。これによって出力部6で
は、その認識結果を、例えば表示装置に表示する。これ
によって、利用者は、集音した野鳥の鳴き声がどの野鳥
の鳴き声であるかを認識することができる。
【0026】一方、環境条件が設定されていない場合に
は、ステップS2からステップS7に移行し、各野鳥用
音響モデルと照合を行い、最も類似度の高い鳴き声に該
当する野鳥を認識結果とする(ステップS7)。また、
識別モードが人モードである場合には、ステップS1か
らステップS9に移行し、人用音響モデルに基づいて照
合を行い、最も類似度の高い音声を認識結果とする(ス
テップS9)。
【0027】ここで、例えば、マイクロフォン1でキジ
バトの鳴き声を集音したとする。上述のようにキジバト
の鳴き声は、図2(a)に示すように、パターンa11
21に相当する特定パターンを繰り返す。このパターン
11、a21の一部分a13、a 23に相当する部分は、図2
(b)に示すフクロウのパターンb1 、b2 と類似して
いる。
【0028】しかしながら、キジバトの音響モデルは特
徴パターンa11、a21に基づいて設定されているから、
各種の音響モデルと照合した場合、キジバトの音響モデ
ルに対する類似度が最も高くなる。したがって、部分的
にみればキジバトとフクロウとが類似したパターンであ
っても、フクロウとして誤認識されることが回避され
る。
【0029】逆に、フクロウの鳴き声を集音した場合、
フクロウの鳴き声は、図2(b)に示すように、その特
徴パターンb1 、b2 を繰り返さないから、入力された
鳴き声の特徴を表すパターンはb1 、b2 に相当するパ
ターンとなり、これと各音響モデルとを比較した場合、
キジバトの音響モデルとはパターンa13、a23に相当す
る部分においては類似するが、キジバトの場合、パター
ンa13、a23を含む特徴パターンa11、a21に基づいて
音響モデルとして設定している。したがって、キジバト
よりもフクロウの音響モデルに対する類似度の方が高く
なることから、フクロウとして認識される。
【0030】このように、キジバトの音響モデルを、そ
の特徴を表す例えばパターンa13、a23ではなく、繰り
返し現れる特徴パターンa11、a21に基づいて音響モデ
ルを設定しているから、鳴き声の特徴に、他の鳴き声と
類似するパターンが含まれる場合であっても、的確に識
別することができる。次に、マイクロフォン1によっ
て、ヒヨドリの鳴き声を集音したものとする。
【0031】ヒヨドリの音響モデルとしては、図3
(a)及び(b)に示すように、長く鳴いた場合の音響
モデルと短く鳴いた場合の音響モデルとが用意されてい
る。ヒヨドリの音響モデルとして図3(b)に示す長く
鳴いた場合の特徴パターンd1 、d2 に基づく音響モデ
ルしか設けられていないものとすると、ヒヨドリが短く
鳴いた場合、その特徴パターンは図3(a)に示す
1 、c2 に相当することになる。このパターンc1
2 に相当するパターンと、図3(b)のパターン
1 、d2 に基づく音響モデルとを比較した場合、入力
された鳴き声の特徴を表すパターンは図3(a)に示す
1 、c2 に相当するため、これとヒヨドリの音響モデ
ルとを照合した場合、その類似度は低くなり、ヒヨドリ
として認識されない場合がある。
【0032】しかしながら、図3(a)のヒヨドリが短
く鳴いた場合の特徴パターンc1 、c2 に基づく音響モ
デルだけでなく、図3(b)に示すヒヨドリが長く鳴い
た場合の特徴パターンd1 、d2 に基づく音響モデルも
備えているから、各音響モデルと照合を行ったとき、図
3(a)に示す短く鳴いた場合の音響モデルとの類似度
は低いが、図3(b)に示す長く鳴いた場合の音響モデ
ルとの類似度は高くなるため、ヒヨドリとして認識する
ことが可能となる。
【0033】逆に、ヒヨドリが長く鳴いた場合には、長
く鳴いた場合の音響モデルとの類似度が最も高くなるか
ら、この場合もヒヨドリとして認識することができる。
このように、同一種の野鳥であっても鳴き方によって、
音響的な特徴は同じであっても、その特徴パターンの長
さが大きく異なる場合には、その長さに応じて音響モデ
ルを複数設けるようにしているから、音響モデルとの照
合を的確に行うことができる。
【0034】また、ヒヨドリが短く鳴いた場合の音響的
な特徴は、シジュウカラやヤマガラの鳴き声の音響的な
特徴と類似している。このため、ヒヨドリの音響モデル
として、短く鳴いた場合、また、長く鳴いた場合でも区
別ができるような一つの音響モデルを設定した場合に
は、ヒヨドリが短く鳴いた場合或いは長く鳴いた場合の
何れにおいても識別精度が低下してしまう。しかしなが
ら、シジュウカラやヤマガラの鳴き声の音響的な特徴の
継続時間とは異なる音響モデルであり、且つヒヨドリの
音響的な特徴の継続時間に応じて複数の音響モデルを用
意することによって、ヒヨドリが短く鳴いた場合或いは
長く鳴いた場合であっても的確に識別することができ
る。
【0035】また、例えば、キジバトの鳴き声を集音し
た場合、条件入力部7によって入力された環境条件か
ら、フクロウの鳴き声が聞こえない環境下にあると予測
される場合には、データベース5に格納された選定情報
に基づいて、入力された環境条件に応じた音響モデルが
選定されるため、この時点で、フクロウの音響モデルは
照合対象の音響モデルから排除される。したがって、集
音したキジバトの鳴き声に対して、図2(b)に示す特
徴をもつフクロウの音響モデルは選ばれず、仮に、図2
のa13、a23に相当するパターンがキジバトの鳴き声と
して集音されたとしても、フクロウとして誤認識される
ことを回避することができる。
【0036】このように、データベース5に、人間の音
声の音響モデルだけでなく、野鳥の鳴き声に基づく音響
モデルをも含むようにし、入力された音情報の特徴につ
いて、これら音響モデルについて照合を行うようにした
から、人間の音声だけでなく、野鳥の鳴き声から野鳥の
種別をも識別することができる。また、このとき、野鳥
の鳴き声の特徴が類似している場合であっても、この鳴
き声の特徴を表すパターンの出現状況が野鳥毎に異なる
ことに着目し、例えば図2(a)の場合には、パターン
13、a23のような鳴き声の特徴を表すパターンの最小
単位ではなく、パターンa11、a21を特徴パターンとし
たように、最小単位のパターンの出現状況に応じて特徴
パターンを設定し、これに基づき音響モデルを形成する
ようにしたから、鳴き声の特徴に、類似するパターンを
含む野鳥が複数存在する場合であっても、的確に識別す
ることができる。
【0037】また、同一の野鳥であっても、鳴き方によ
って、その特徴を表す音響的な特徴の継続時間が長い場
合と、短い場合とがある場合には、その継続長さの異な
る複数の音響モデルを形成するようにしたから、鳴き方
によってその特徴の出現状況が異なる場合であっても、
的確に識別することができる。また、鳴き声の観測環境
に応じた環境条件を入力可能にし、設定された環境条件
に該当する音響モデルを選定し、この選定した音響モデ
ルについてのみ照合を行うようにしたから、環境条件か
らあり得ない野鳥が、鳴き声に該当する野鳥として認識
されることを回避することができ、その分、認識精度を
向上させることができる。
【0038】また、音声認識部4としては、公知の人間
の音声を認識するための音声認識部をそのまま用いるこ
とができる。したがって、従来の人間用の音声認識装置
に、野鳥用の音響モデルを新たに設けるだけで容易に実
現することができる。また、野鳥用の音響モデルを作成
する際に、野鳥の鳴き声からその野鳥を識別するための
専門的な情報、つまり、専門家のみが知り得る情報を考
慮して音響モデルを作成することによって、素人には識
別しにくい鳴き声であっても、的確に識別することがで
き、素人であっても、専門家と同等に識別を行うことが
できる。
【0039】ちなみに、上述のようにして設定した野鳥
用音響モデルを用いて、鳴き声の識別を行ったところ、
16種類の野鳥について識別することができることが確
認できた。なお、上記実施の形態においては、鳴き声の
特徴を表すパターンが類似した野鳥として、キジバトと
フクロウとについて説明し、また、鳴き方によって音響
的な特徴の出現状況が異なる野鳥としてヒヨドリについ
て説明したが、これに限るものではない。鳴き声の特徴
を表すパターンの最小単位からは識別が困難なものや、
鳴き方によって、音響的な特徴は同一であるがその出現
状況が異なるものであれば適用することができる。
【0040】また、上記実施の形態においては、鳴き声
の特徴を表す最小単位のパターンが類似しているもの、
或いは鳴き方によって特徴の出現状況が異なるものにつ
いて、これを考慮して音響モデルを設定するようにした
場合について説明したが、これに限るものではなく、鳴
き声に、その音響的な特徴が現れる出現状況に特徴があ
るもの、つまり、その音響的な特徴の出現状況からその
野鳥を識別可能なものであれば、この出現状況を識別可
能なパターンを特徴パターンとし、これに基づいて音響
モデルを形成するようにすればよい。
【0041】また、上記実施の形態においては、音声認
識を行う際に、野鳥モードと人モードとを設定し、照合
する音響モデルを選定するようにした場合について説明
したが、必ずしもモードの設定を行う必要はない。ここ
で、野鳥及び人モードの設定を行わないようにした場
合、野鳥用及び人用音響モデルについて照合が行われる
ことになる。このとき、例えばキジバトの鳴き声は、そ
の音響的な特徴が、部分的に見るとフクロウの鳴き声に
類似しているだけでなく、男性の声にも類似している。
しかしながら、上述のように、キジバトの音響モデル
を、繰り返し現れる特定パターンをひとまとまりとした
特徴パターンに基づいて設定しているから、フクロウの
鳴き声だけでなく、男性の声との識別も可能である。
【0042】また、上記実施の形態においては、人モー
ド及び野鳥モードの切換を可能にした場合について説明
したが、野鳥用音響モデルのみを搭載し、野鳥用音声認
識装置とするようにしてもよい。また、人及び野鳥の音
声及び鳴き声認識を行う単体の装置として説明したが、
例えば、上述の音声認識装置の機能を実現するための処
理機能を携帯電話或いはPDA等、他の装置に組み込む
ようにしてもよい。
【0043】また、上記実施の形態においては、条件入
力部7の設定に応じて、設定された条件に該当する音響
モデルを選定し、この選定した音響モデルに基づいて照
合を行うようにした場合について説明したが、これに限
るものではない。例えば、各音響モデルについて照合を
行い、その類似度に条件入力部7からの入力条件に応じ
て重み付けを行い、重み付けを行った類似度に基づい
て、最終的な認識判定を行うようにしてもよく、また、
入力条件に応じて選定した音響モデルについて照合を行
うと共に、その類似度に重み付けを行い、その結果に基
づいて最終的な認識判定を行うようにしてもよい。前記
重み付けとしては、例えば、冬に認識を行う場合には、
冬鳥の類似度には1.0、夏鳥の類似度には1.0より
も小さな値を乗算するようにすればよい。
【0044】また、上記実施の形態においては、緯度、
経度等の位置情報、また、季節、時期、日付、時刻等の
時刻情報を、条件入力部7から入力するようにした場合
について説明したが、これに限るものではなく、GPS
人工衛星からの衛星電波を受信するためのGPS受信機
等の受信手段を搭載し、衛星電波に含まれるGPS情報
に基づいて位置情報或いは時刻情報を設定するようにし
てもよい。
【0045】また、上記実施の形態においては、環境条
件として位置、場所、時間、時期等を設定し、この環境
条件に応じた音響モデルを選定するようにした場合につ
いて説明したが、これに限るものではない。例えば、ウ
グイス等のように、春先の繁殖期には「ホーホケキョ」
(さえずり)となき、それ以外の時期では、地鳴きとい
う短い鳴き声で鳴くような場合には、さえずり時の音響
モデルと地鳴き時の音響モデルとを作成し、時期条件に
応じて何れかの音響モデルを選定するようにしてもよ
い。また、渡り鳥の場合には、時期情報に基づいて、音
響モデルを選定するようにしてもよい。
【0046】
【発明の効果】本発明の請求項1乃至3に係る野鳥の鳴
き声認識装置によれば、野鳥の鳴き声の音響的な特徴を
表すモデルを、野鳥の鳴き方パターンに応じた音響的な
特徴の出現パターンに応じて設定したから、鳴き声の特
徴が類似した野鳥であっても、その特徴の出現パターン
の違いから的確に識別することができ、認識精度を向上
させることができる。
【0047】例えば、キジバトのように同一の特徴が繰
り返し現れる場合には、この繰り返しパターンに基づい
てモデルを作成することによって、例えば、キジバトの
特徴の一部と同じ特徴を有する野鳥であっても、キジバ
トのモデルとは特徴が一致しないことから、的確に識別
することができる。また、ヒヨドリのように、同一の特
徴を有するが、鳴き方によって、前記特徴の継続時間が
異なる場合には、その継続時間に応じて音響モデルを作
成することによって、鳴き方によって特徴の継続時間が
異なった場合でも、的確に識別することができる。
【0048】また、請求項4乃至6に係る野鳥の鳴き声
認識装置によれば、音情報が観測されたときの環境状況
を入力するための環境条件設定手段を備え、この環境条
件設定手段で設定された環境条件を考慮して野鳥の認識
を行うようにしたから、認識精度をより向上させること
ができる。例えば、複数のモデルのうち、環境条件設定
手段で設定された条件に該当するモデルについてのみ、
抽出された音情報の特徴を照合することによって、条件
に該当しない野鳥が、誤認識されることを回避すること
ができ、その分、認識精度を向上させることができる。
【0049】また、抽出された音情報の特徴をモデルと
照合した照合結果に対し、環境条件設定手段で設定され
た条件に応じて重み付けを行い、これに基づいて最終的
に識別を行うことによって、認識精度をより向上させる
ことができる。また、請求項7に係る野鳥の鳴き声認識
装置によれば、GPS人工衛星からの衛星電波を受信す
る受信手段を備え、この衛星電波に含まれるGPS情報
を環境条件として利用するようにしたから、環境条件
を、人手を介さずに容易に設定することができる。
【0050】また、請求項8に係る野鳥の鳴き声認識方
法によれば、野鳥の鳴き声の音響的な特徴を表すモデル
を、野鳥の鳴き方パターンに応じた音響的な特徴の出現
パターンに応じて設定したから、鳴き声の特徴が類似し
た野鳥であっても、その特徴の出現パターンの違いから
的確に識別することができ、認識精度を向上させること
ができる。
【0051】さらに、請求項9に係る野鳥の鳴き声認識
方法によれば、音情報が観測されたときの環境状況を入
力するための環境条件設定手段を設け、この環境条件設
定手段で設定された環境条件を考慮して野鳥の認識を行
うようにしたから、その認識精度をより向上させること
ができる。
【図面の簡単な説明】
【図1】本発明における野鳥の鳴き声認識装置の概略構
成を示すブロック図である。
【図2】キジバト及びフクロウの鳴き声波形とそのスペ
クトログラムの一例である。
【図3】ヒヨドリの鳴き声波形とそのスペクトログラム
の一例である。
【図4】音声認識部における処理手順の一例を示すフロ
ーチャートである。
【符号の説明】
1 マイクロフォン 2 A/D変換器 3 音響解析部 4 音声認識部 5 データベース 6 出力部 7 条件入力部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 音情報からその音響的な特徴を抽出する
    特徴抽出手段と、 野鳥の鳴き声の音響的な特徴を表す複数のモデルからな
    るデータベースと、 前記特徴抽出手段で抽出した音情報の特徴と前記データ
    ベースのモデルとを照合して、前記音情報に該当する野
    鳥を検出する鳴き声認識手段と、を備えた野鳥の鳴き声
    認識装置であって、 前記モデルは、前記野鳥の鳴き方パターンに応じた前記
    音響的な特徴の出現パターンに応じて設定されることを
    特徴とする野鳥の鳴き声認識装置。
  2. 【請求項2】 前記モデルは、同一の特徴が繰り返し出
    現する繰り返しパターンからなるモデルであることを特
    徴する請求項1記載の野鳥の鳴き声認識装置。
  3. 【請求項3】 前記モデルは、同一の特徴を有し且つ継
    続時間の異なるパターンからなる複数のモデルであるこ
    とを特徴とする請求項1記載の野鳥の鳴き声認識装置。
  4. 【請求項4】 前記音情報が観測されたときの環境状況
    を入力するための環境条件設定手段を備え、 前記鳴き声認識手段は、前記環境条件設定手段で設定さ
    れた環境条件を考慮して前記音情報に該当する野鳥を検
    出するようになっていることを特徴とする請求項1乃至
    3の何れかに記載の野鳥の鳴き声認識装置。
  5. 【請求項5】 前記鳴き声認識手段は、前記複数のモデ
    ルのうち、前記環境条件設定手段で設定された条件に該
    当するモデルを選択し、当該選択したモデルについての
    み前記照合を行うようになっていることを特徴とする請
    求項4記載の野鳥の鳴き声認識装置。
  6. 【請求項6】 前記鳴き声認識手段は、前記環境条件設
    定手段で設定された条件に基づいて前記モデルとの照合
    結果に重み付けを行い、これに基づいて前記音情報に該
    当する野鳥を特定するようになっていることを特徴とす
    る請求項4又は5記載の野鳥の鳴き声認識装置。
  7. 【請求項7】 前記環境条件設定手段は、GPS人工衛
    星からの衛星電波を受信する受信手段を備え、前記衛星
    電波に含まれるGPS情報を前記環境条件として利用す
    るようになっていることを特徴とする請求項4乃至6の
    何れかに記載の野鳥の鳴き声認識装置。
  8. 【請求項8】 音情報からその音響的な特徴を抽出し、
    抽出した特徴と、予め設定した野鳥の鳴き声の音響的な
    特徴を表す複数のモデルとを照合して前記音情報に該当
    する野鳥を特定するようにした野鳥の鳴き声認識方法で
    あって、 前記モデルを、前記野鳥の鳴き方パターンに応じた前記
    音響的な特徴の出現パターンに応じて設定するようにし
    たことを特徴とする野鳥の鳴き声認識方法。
  9. 【請求項9】 前記音情報が観測されたときの環境状況
    を入力するための環境条件設定手段を設け、 当該環境条件設定手段で設定された環境条件を考慮して
    前記音情報に該当する野鳥を検出することを特徴とする
    請求項8記載の野鳥の鳴き声認識方法。
JP2002060981A 2002-03-06 2002-03-06 野鳥の鳴き声及び人の音声認識装置及びその認識方法 Expired - Fee Related JP4209122B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002060981A JP4209122B2 (ja) 2002-03-06 2002-03-06 野鳥の鳴き声及び人の音声認識装置及びその認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002060981A JP4209122B2 (ja) 2002-03-06 2002-03-06 野鳥の鳴き声及び人の音声認識装置及びその認識方法

Publications (2)

Publication Number Publication Date
JP2003255984A true JP2003255984A (ja) 2003-09-10
JP4209122B2 JP4209122B2 (ja) 2009-01-14

Family

ID=28670131

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002060981A Expired - Fee Related JP4209122B2 (ja) 2002-03-06 2002-03-06 野鳥の鳴き声及び人の音声認識装置及びその認識方法

Country Status (1)

Country Link
JP (1) JP4209122B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015049398A (ja) * 2013-09-02 2015-03-16 本田技研工業株式会社 音響認識装置、音響認識方法、及び音響認識プログラム
CN110706725A (zh) * 2018-07-09 2020-01-17 广西大学 一种鸟声录制系统
CN111048101A (zh) * 2020-01-15 2020-04-21 合肥慧图软件有限公司 基于语音识别技术的生物多样性物种分析方法
JP2021021815A (ja) * 2019-07-26 2021-02-18 一般財団法人電力中央研究所 生物種の音声把握システム
JP7084568B1 (ja) 2021-06-01 2022-06-15 広東省科学院動物研究所 湿地公園の鳥類の多様性を回復するための鳥誘引監視装置および方法
WO2022143723A1 (zh) * 2020-12-31 2022-07-07 中兴通讯股份有限公司 语音识别模型训练方法、语音识别方法及相应装置
CN118173105A (zh) * 2024-05-15 2024-06-11 百鸟数据科技(北京)有限责任公司 基于音频信号处理的鸟类鸣声识别方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02300799A (ja) * 1989-05-15 1990-12-12 Matsushita Electric Ind Co Ltd 音の図鑑
JPH052399A (ja) * 1991-06-25 1993-01-08 Toshiba Corp 音声認識装置
JPH0772894A (ja) * 1993-06-15 1995-03-17 Ontario Hydro 自動知的監視装置
JPH0990974A (ja) * 1995-09-25 1997-04-04 Nippon Telegr & Teleph Corp <Ntt> 信号処理方法
JPH09179579A (ja) * 1995-12-25 1997-07-11 Casio Comput Co Ltd 検索装置
JP2000172291A (ja) * 1998-12-02 2000-06-23 Sony Corp 音声認識装置
JP2000322436A (ja) * 1999-05-13 2000-11-24 Nippon Telegr & Teleph Corp <Ntt> サイバー図鑑検索システム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02300799A (ja) * 1989-05-15 1990-12-12 Matsushita Electric Ind Co Ltd 音の図鑑
JPH052399A (ja) * 1991-06-25 1993-01-08 Toshiba Corp 音声認識装置
JPH0772894A (ja) * 1993-06-15 1995-03-17 Ontario Hydro 自動知的監視装置
JPH0990974A (ja) * 1995-09-25 1997-04-04 Nippon Telegr & Teleph Corp <Ntt> 信号処理方法
JPH09179579A (ja) * 1995-12-25 1997-07-11 Casio Comput Co Ltd 検索装置
JP2000172291A (ja) * 1998-12-02 2000-06-23 Sony Corp 音声認識装置
JP2000322436A (ja) * 1999-05-13 2000-11-24 Nippon Telegr & Teleph Corp <Ntt> サイバー図鑑検索システム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
川村多実二: ""鳥の歌の科学"", 自然選書, JPN4007006821, pages 36 - 95, ISSN: 0000840874 *
川村多実二: ""鳥の歌の科学"", 自然選書, JPN7008007170, pages 36 - 95, ISSN: 0001140145 *
芦戸武彦他: ""鳴き声による鳥の種類の認識システム"", 電子情報通信学会技術研究報告, vol. Vol.92,No.125,SP92-13(1992-06), JPN6008048266, pages 1 - 6, ISSN: 0001140146 *
芦谷武彦 他: ""鳴き声による鳥の種類の認識システム"", 電子情報通信学会技術研究報告, vol. Vol.92,No.125,SP92-13(1992-06), JPN4007007060, pages 1 - 6, ISSN: 0000840875 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015049398A (ja) * 2013-09-02 2015-03-16 本田技研工業株式会社 音響認識装置、音響認識方法、及び音響認識プログラム
US9911436B2 (en) 2013-09-02 2018-03-06 Honda Motor Co., Ltd. Sound recognition apparatus, sound recognition method, and sound recognition program
CN110706725A (zh) * 2018-07-09 2020-01-17 广西大学 一种鸟声录制系统
JP2021021815A (ja) * 2019-07-26 2021-02-18 一般財団法人電力中央研究所 生物種の音声把握システム
JP7312046B2 (ja) 2019-07-26 2023-07-20 一般財団法人電力中央研究所 生物種の音声把握システム
CN111048101A (zh) * 2020-01-15 2020-04-21 合肥慧图软件有限公司 基于语音识别技术的生物多样性物种分析方法
WO2022143723A1 (zh) * 2020-12-31 2022-07-07 中兴通讯股份有限公司 语音识别模型训练方法、语音识别方法及相应装置
JP7084568B1 (ja) 2021-06-01 2022-06-15 広東省科学院動物研究所 湿地公園の鳥類の多様性を回復するための鳥誘引監視装置および方法
JP2022184687A (ja) * 2021-06-01 2022-12-13 広東省科学院動物研究所 湿地公園の鳥類の多様性を回復するための鳥誘引監視装置および方法
CN118173105A (zh) * 2024-05-15 2024-06-11 百鸟数据科技(北京)有限责任公司 基于音频信号处理的鸟类鸣声识别方法

Also Published As

Publication number Publication date
JP4209122B2 (ja) 2009-01-14

Similar Documents

Publication Publication Date Title
Browning et al. Passive acoustic monitoring in ecology and conservation.
Mellinger et al. Recognizing transient low-frequency whale sounds by spectrogram correlation
Obrist et al. Bioacoustics approaches in biodiversity inventories
US9812152B2 (en) Systems and methods for identifying a sound event
JP4166153B2 (ja) 鳴声の音声的特徴分析に基づく犬の感情判別装置及びその方法
Brandes Feature vector selection and use with hidden Markov models to identify frequency-modulated bioacoustic signals amidst noise
CN112712809B (zh) 一种语音检测方法、装置、电子设备及存储介质
Ogundile et al. A hidden Markov model with selective time domain feature extraction to detect inshore Bryde's whale short pulse calls
JP2018040848A (ja) 音響処理装置および音響処理方法
Himawan et al. Deep Learning Techniques for Koala Activity Detection.
Duan et al. Acoustic component detection for automatic species recognition in environmental monitoring
Mouy et al. Automatic recognition of fin and blue whale calls for real-time monitoring in the St. Lawrence
US7650281B1 (en) Method of comparing voice signals that reduces false alarms
Ogundile et al. Analysis of template-based detection algorithms for inshore Bryde’s whale short pulse calls
Trawicki Multispecies discrimination of whales (cetaceans) using Hidden Markov Models (HMMS)
JP4607908B2 (ja) 音声区間検出装置および音声区間検出方法
JP2003255984A (ja) 野鳥の鳴き声認識装置及びその認識方法
Poupard et al. Large-scale unsupervised clustering of Orca vocalizations: a model for describing Orca communication systems
Li et al. Research on environmental sound classification algorithm based on multi-feature fusion
JP2009020461A (ja) 音声処理装置およびプログラム
Fox et al. Call-independent individual identification in birds
KR101791907B1 (ko) 위치 기반의 음향 처리 장치 및 방법
JP2004287010A (ja) 波形認識方法及び装置、並びにプログラム
Nadir et al. Marine mammals classification using acoustic binary patterns
Kohlsdorf et al. Feature Learning and Automatic Segmentation for Dolphin Communication Analysis.

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040204

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20040204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040323

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050223

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080930

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081022

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121031

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121031

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131031

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees