JP2969527B2 - メロディ認識装置及びそれに使用されるメロディ情報抽出装置 - Google Patents

メロディ認識装置及びそれに使用されるメロディ情報抽出装置

Info

Publication number
JP2969527B2
JP2969527B2 JP2075485A JP7548590A JP2969527B2 JP 2969527 B2 JP2969527 B2 JP 2969527B2 JP 2075485 A JP2075485 A JP 2075485A JP 7548590 A JP7548590 A JP 7548590A JP 2969527 B2 JP2969527 B2 JP 2969527B2
Authority
JP
Japan
Prior art keywords
melody
information
relative scale
duration
scale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2075485A
Other languages
English (en)
Other versions
JPH03276197A (ja
Inventor
基正 五十嵐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NITSUTSUKO KK
Original Assignee
NITSUTSUKO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NITSUTSUKO KK filed Critical NITSUTSUKO KK
Priority to JP2075485A priority Critical patent/JP2969527B2/ja
Publication of JPH03276197A publication Critical patent/JPH03276197A/ja
Application granted granted Critical
Publication of JP2969527B2 publication Critical patent/JP2969527B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Auxiliary Devices For Music (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、不特定多数の話者を認識するための話者認
識装置に関し、特に、話者認識装置に適したメロディ認
識装置及びそれに使用されるメロディ情報抽出装置に関
する。
〔従来の技術〕
この種の話者認識装置としては、従来から不特定多数
の話者の発声する基本的な言語の音声からその話者を認
識する音声認識装置が採用されている。
〔発明が解決しようとする課題〕
しかしながら、音声認識装置は、構成(ハードウェア
及びソフトウェア)が複雑で高価になるという欠点があ
る。また、言語は数多くあるので、共通性に欠けるとい
う欠点がある。
したがって、本発明の目的は、構成(ハードウェア及
びソフトウェア)が簡単な話者認識装置を提供すること
にある。
本発明の他の目的は、安価な話者認識装置を提供する
ことにある。
本発明のさらに他の目的は、共通性の高い話者認識装
置を提供することにある。
〔課題を解決するための手段〕
本発明者は、言語が共通性に欠けるので、言語以外の
共通性のある認識対象を思案した。その結果、本発明者
は、共通性のある認識対象としてメロディを選んだ。こ
こで「メロディ」とは、複数の音階と各音階の継続時間
との組合わせからなるものをいう。従って、メロディは
言語の違い(例えば、日本語や英米語や仏語等)に左右
されない。また、メロディは、人間の発声する歌や口笛
による音声のみでなく、楽器の楽音によっても伝達さ
れ、共通性が高い。従って、本発明では、話者認識装置
としてメロディ認識装置を採用すると共に、このメロデ
ィ認識装置を構成するために必要なメロディ情報抽出装
置を提供する。
また、メロディを含む入力音信号から抽出するメロデ
ィ情報として、絶対音階ではなく、相対音階や音階差を
表す情報及び各音階の継続時間情報を抽出する。これに
より、音程が狂っていても話者認識が可能であり、認識
範囲を増加できる。また、継続時間情報を省けば、さら
に、認識範囲が増加し、構成が簡単になる。
本発明によるメロディ認識装置は、複数の音階と該各
音階の継続時間との組合わせからなるメロディを含む入
力音信号から該メロディを表すメロディ情報を抽出し、
抽出されたメロディ情報を出力するメロディ情報抽出手
段と、少なくとも1つの予め定められたメロディを表す
メロディ情報を予め登録し、登場されたメロディ情報を
出力するメロディ情報登録手段と、前記抽出されたメロ
ディ情報と前記登録されたメロディ情報とを比較して前
記入力音信号に含まれるメロディを認識するメロディ情
報比較手段とを有することを特徴とする。
メロディ情報抽出手段の第1の態様において、メロデ
ィ情報抽出手段は、前記入力音信号を所定周期でサンプ
リングして得られた基本周波数成分のデータ列に対し
て、各サンプリング時点のデータと最初のサンプリング
時点のデータとの比に基づいて算出された相対音階を表
す算出相対音階信号列を抽出し、該算出相対音階信号列
を前記抽出されたメロディ情報として出力する。この場
合、前記メロディ情報登録手段は、予め定められたメロ
ディの先頭の音の周波数を基準にした前記所定周期毎の
相対音階を表す登録相対音階信号列を登録し、該登録相
対音階信号列を前記登録されたメロディ情報として出力
する。
メロディ情報抽出手段の第2の態様において、メロデ
ィ情報抽出手段は、前記入力音信号を所定周期でサンプ
リングして得られた基本周波数成分のデータ列に対し
て、各サンプリング時点のデータと最初のサンプリング
時点のデータとの比に基づいて算出された相対音階の中
で変化した相対音階を表す検出相対音階情報を抽出し、
該検出相対音階情報を前記抽出されたメロディ情報とし
て出力する。この場合、前記メロディ情報登録手段は、
前記予め定められたメロディの先頭の音の周波数を基準
にした変化した相対音階を表す登録相対音階情報を登録
し、該登録相対音階情報を前記登録されたメロディ情報
として出力する。
メロディ情報抽出手段の第3の態様において、前記メ
ロディ情報抽出手段は、前記入力音信号を所定周期でサ
ンプリングして得られた基本周波数成分のデータ列に対
して、各サンプリング時点のデータと最初のサンプリン
グ時点のデータとの比に基づいて算出された相対音階の
中で変化した相対音階を表す検出相対音階情報と各相対
音階の継続時間を計数して得られる計数継続時間情報と
の組の抽出し、前記検出相対音階情報と前記計数継続時
間情報との組を前記抽出されたメロディ情報として出力
する。この場合、前記メロディ情報登録手段は、前記予
め定められたメロディの先頭の音の周波数を基準にした
変化した相対音階を表す登録相対音階情報と各相対音階
の継続時間を表す登録継続時間情報との組を登録し、前
記登録相対音階情報と前記登録継続時間情報との組を前
記登録されたメロディ情報として出力する。
メロディ情報抽出手段の第4の態様において、前記メ
ロディ情報抽出手段は、前記入力音信号を所定周期でサ
ンプリングして得られた基本周波数成分のデータ列に対
して、現サンプリング時点のデータと前記所定周期前の
サンプリング時点のデータとの比に基づいて算出された
音階差を表す算出音階差信号列を抽出し、該算出音階差
信号列を前記抽出されたメロディ情報として出力する。
この場合、前記メロディ情報登録手段は、前記予め定め
られたメロディの前記所定周期毎の音階差を表す登録音
階差信号列を登録し、該登録音階差信号列を前記登録さ
れたメロディ情報として出力する。
メロディ情報抽出手段の第5の態様において、前記メ
ロディ情報抽出手段は、前記入力音信号を所定周期でサ
ンプリングして得られた基本周波数成分のデータ列に対
して、現サンプリング時点のデータと前記所定周期前の
サンプリング時点のデータとの比に基づいて算出された
音階差の中で変化した音階差を表す検出音階差情報を抽
出し、該検出音階差情報を前記抽出されたメロディ情報
として出力する。この場合、前記メロディ情報登録手段
は、前記予め定められたメロディの変化した音階差を表
す登録音階差情報を登録し、該登録音階差情報を前記登
録されたメロディ情報として出力する。
メロディ情報抽出手段の第6の態様において、前記メ
ロディ情報抽出手段は、前記入力音信号を所定周期でサ
ンプリングして得られた基本周波数成分のデータ列に対
して、現サンプリング時点のデータと前記所定周期前の
サンプリング時点のデータとの比に基づいて算出された
音階差の中で変化した音階差を表す検出音階差情報と連
続する零の音階差の継続時間を計数して得られる計数継
続時間情報との組を抽出し、前記検出音階差情報と前記
計数継続時間情報との組を前記抽出されたメロディ情報
として出力する。この場合、前記メロディ情報登録手段
は、前記予め定められたメロディの変化した音階差を表
す登録音階差情報と各音階差の零の継続時間を表す登録
継続時間情報との組を登録し、前記登録音階差情報と前
記登録継続時間情報との組を前記登録されたメロディ情
報として出力する。
本発明によるメロディ情報抽出装置は、複数の音階と
該各音階の継続時間との組合わせからなるメロディを含
む入力音信号から該メロディを表すメロディ情報を抽出
するメロディ情報抽出装置であって、 前記入力音信号を受け、該入力音信号から基本周波数
成分の音信号を抽出し、該抽出された基本周波数の音信
号を表す基本周波数音信号を出力する基本周波数抽出手
段と、 前記基本周波数音信号を所定周期Tでサンプリングし
て、それぞれ第0乃至第N(N≧1)のサンプリング時
点でサンプリングされた基本周波数を表す第0乃至第N
のデジタル周波数信号f(0)〜f(NT)を出力する周
波数カウンタと、 前記第1乃至第Nのデジタル周波数信号f(0)〜f
(NT)を処理して、前記入力音信号のメロディ情報を求
めるメロディ情報算出手段とを有することを特徴とす
る。
メロディ情報抽出装置の第1の態様によれば、前記メ
ロディ情報算出手段は、第n(1≦n≦N)のサンプル
時点の第nのデジタル周波数信号f(nT)と第0のサン
プル時点の第0のデジタル周波数信号f(0)との比で
ある音程に基づいて、所定周期T毎にそれらの間の相対
音階を算出し、該算出された相対音階を表す算出相対音
階信号列を出力する相対音階算出手段を有し、前記算出
相対音階信号列を前記入力音信号のメロディ情報として
抽出する。
この第1の態様において、メロディ情報算出手段は、
更に、前記算出相対音階信号列の変化点を検出し、変化
した相対音階を表す検出相対音階情報を検出する相対音
階変化点検手段を有し、前記検出相対音階情報を前記入
力音信号のメロディ情報として抽出しても良い。
更に、この第1の態様において、前記メロディ情報算
出手段は、更に、前記算出相対音階信号列中の連続する
同一相対音階の継続時間を計数し、相対音階毎の計数さ
れた継続時間を表す計数継続時間情報を出力する継続時
間計数手段を有し、前記検出相対音階情報と前記計数継
続時間情報との組を前記入力音信号のメロディ情報とし
て抽出しても良い。
メロディ情報抽出装置の第2の態様によれば、前記メ
ロディ情報算出手段は、第n(1≦n≦N)のサンプル
時点を第nのデジタル周波数信号f(nT)と第(n−
1)のサンプル時点の第(n−1)のデジタル周波数信
号f((n−1)T)との比である音程に基づいて、所
定周期T毎にそれらの間の音階差を算出し、該算出され
た音階差を表す算出音階差信号列を出力する音階差算出
手段を有し、前記算出音階差信号列を前記入力音信号の
メロディ情報として抽出する。
この第2の態様において、前記メロディ情報算出手段
は、更に、前記算出音階差信号列の変化点を検出し、変
化した音階差を表す検出音階差情報を出力する音階差変
化点検出手段を有し、前記検出音階差情報を前記入力音
信号のメロディ情報として抽出しても良い。
更に、この第2の態様において、.前記メロディ情報
算出手段は、更に、前記算出音階差信号列中の連続する
零の音階差の継続時間を計数し、計数された継続時間を
表す計数継続時間情報を出力する継続時間計数手段を有
し、前記検出音階差情報と前記計数継続時間情報との組
を前記入力音信号のメロディ情報として抽出しても良
い。
〔実施例〕
以下、本発明の実施例について図面を参照して説明す
る。
第1図を参照すると、本発明によるメロディ認識装置
は、複数の音階と各音階の継続時間との組合わせからな
るメロディを含む入力音信号INからこのメロディを表す
メロディ情報を抽出し、抽出されたメロディ情報EMIを
出力するメロディ情報抽出装置10と、少なくとも1つの
予め定められたメロディを表すメロディ情報を予め登録
し、登録されたメロディ情報MMIを出力するメロディ情
報登録装置20と、抽出されたメロディ情報EMIと登録さ
れたメロディ情報MMIとを比較して入力音信号INに含ま
れるメロディを認識し、メロディ認識結果RRを出力する
メロディ情報比較装置30とを有する。
第2図を参照すると、メロディ情報抽出装置10は、入
力音信号INを受け、入力音信号INから基本周波数成分の
音信号を抽出し、抽出された基本周波数の音信号を表す
基本周波数音信号を出力する基本周波数抽出部11を有す
る。
本実施例の基本周波数抽出部11は、ローパスフィルタ
(LPF)111と自動利得調節器(AGC)112とからなる。入
力音信号INはLPF111を通ることによって基本周波数成分
がその高周波成分に対して強調される。LPF111の出力は
AGC112によって波形整形される。AGC112の出力は基本周
波数音信号として出力される。
基本周波数音信号は周波数カンウタ12に供給される。
周波数カウンタ12は、基本周波数音信号を所定周期Tで
サンプリングして、それぞれ第0乃至第N(N≧1)の
サンプル時点でサンプリングされた基本周波数を表す第
0乃至第Nのデジタル周波数信号f(0)〜f(NT)を
出力する。
第0乃至第Nのデジタル周波数信号f(0)〜f(N
T)は、メロディ情報算出器13に供給される。メロディ
情報算出器13は第1乃至第Nのデジタル周波数信号f
(0)〜f(NT)を処理して、入力音信号INのメロディ
情報を求める。メロディ情報算出器13で求められたメロ
ディ情報は抽出されたメロディ情報EMIとしてメロディ
情報比較装置30(第1図)へ供給される。
第3図を参照すると、メロディ情報算出器13は、第n
(1≦n≦N)のサンプル時点の第nのデジタル周波数
信号f(nT)と第0のサンプル時点の第0のデジタル周
波数信号f(0)との比f(nT)/f(0)である音程に
基づいて、所定周期T毎にそれらの間の相対音階を算出
し、この算出された相対音階を表す算出相対音階信号列
RS(nT)を出力する相対音階算出器40を有する。
相対音階算出器40は第0のサンプル時点(初期サンプ
ル時点)の第0のデジタル周波数信号f(0)を保持す
る初期サンプル値保持回路41と、相対音階を算出する相
対音階算出回路42とを有する。本実施例では、相対音階
算出回路42は平均律音階に基づいて相対音階を算出す
る。平均律音階は、周知のように、オクターブのあいだ
を12のこまかい音程に等分した音階である。すなわち、
1オクターブを に分ける。従って、相対音階算出回路42は次式により相
対音階RS(nT)を求める。
算出相対音階信号列RS(nT)は相対音階変化点検出回
路50と継続時間計数回路60とに供給される。相対音階変
化点検出回路50は、算出相対音階信号列RS(nT)の変化
点を検出し、変化した相対音階を表す検出相対音階情報
DVSを出力する。継続時間計数回路60は、算出相対音階
信号列RS(nT)中の連続する同一相対音階の継続時間を
計数し、相対音階毎の計数された継続時間を表す計数継
続時間情報CCTを出力する。検出相対音階情報DVSと計数
継続時間情報CCTとの組は、抽出されたメロディ情報EMI
としてメロディ情報比較装置30(第1図)へ供給され
る。
メロディ情報登録装置20は、登録されたメロディ情報
MMIとして、予め定められたメロディの先頭の音の周波
数を基準にした変化した相対音階を表す登録相対音階情
報MVSと各相対音階の継続時間を表す登録継続時間情報M
CTとの組を登録する。
尚、上記実施例では、検出相対音階情報DVSと計数継
続時間情報CCTとの組を抽出されたメロディ情報EMIとし
て出力しているが、検出相対音階情報DVSのみを抽出さ
れたメロディ情報EMIとして出力しても良い。この場
合、メロディ情報算出器13の継続時間計数回路60が不要
となる。そして、メロディ情報登録装置20は、登録され
たメロディ情報MMIとして、予め定められたメロディの
先頭の音の周波数を基準にした変化した相対音階を表す
登録相対音階情報MVSのみを登録する。
また、相対音階算出器40が出力する算出相対音階信号
列RS(nT)を、直接、抽出されたメロディ情報EMIとし
て出力しても良い。この場合、メロディ情報算出器13は
相対音階算出器40のみで構成される。メロディ情報登録
装置20は、登録されたメロディ情報MMIとして、予め定
められたメロディの先頭の音の周波数を基準にした変化
した所定周期T毎の相対音階を表す登録相対音階信号列
MS(nT)を登録する。
第4図を参照すると、他のメロディ情報算出器13aが
示されている。図示のメロディ情報算出器13aは、第n
のサンプル時点の第nのデジタル周波数信号f(nT)と
第(n−1)のサンプル時点の第(n−1)のデジタル
周波数信号f((n−1)T)との比f(nT)/f((n
−1)T)である音程に基づいて、所定周期T毎にそれ
らの間の音階差を算出し、この算出された音階差を表す
算出音階差信号列SD(nT)を出力する音階差算出器40a
を有する。
音階差算出器40aは第nのサンプル時点の第nのデジ
タル周波数信号(nT)を所定周期Tだけ遅延して、第
(n−1)のサンプル時点の第(n−1)のデジタル周
波数信号f((n−1)T)を出力する遅延回路41a
と、音階差を算出する音階差算出回路42aとを有する。
この実施例でも、音階差算出回路42aは、第3図の相対
音階算数回路42と同様に、平均律音階に基づいて音階差
を算出する。従って、音階差算出回路42aは次式により
相対音階差SD(nT)を求める。
算出音階差信号列SD(nT)は音階差変化点検出回路50
aと継続時間計数回路60aとに供給される。音階差変化点
検出回路50aは、算出音階差信号列SD(nT)の変化点を
検出し、変化した音階差を表す検出音階差情報DVDを出
力する。継続時間計数回路60aは算出音階差信号列SD(n
T)中の連続する零の音階差の継続時間を計数し、計数
された継続時間を表す計数継続時間情報CCTを出力す
る。検出音階差情報DVDと計数継続時間情報CCTとの組
は、抽出されたメロディ情報EMIとしてメロディ情報比
較装置30(第1図)へ供給される。
本実施例において、メロディ情報登録装置20は、登録
されたメロディ情報MMIとして、予め定められたメロデ
ィの変化した音階差を表す登録音階情報MVDと各音階差
の零の継続時間を表す登録継続時間情報MCTとの組を登
録する。
尚、第4図のメロディ情報算出器13aでは、検出音階
差情報DVDと計数継続時間情報CCTとの組を抽出されたメ
ロディ情報EMIとして出力しているが、検出音階差情報D
VDのみを抽出されたメロディ情報EMIとして出力しても
良い。この場合、メロディ情報算出器13aの継続時間計
数回路60aは不要となる。そして、メロディ情報登録装
置20は、登録されたメロディ情報MMIとして、予め定め
られたメロディの変化した音階差を表す登録音階差情報
MVDのみを登録する。
また、音階差算出器40aが出力する算出音階差信号列S
D(nT)を、直後、抽出されたメロディ情報EMIとして出
力しても良い。この場合、メロディ情報算出器13は音階
差算出器aのみで構成される。メロディ情報登録装置20
は、登録されたメロディ情報MMIとして、予め定められ
たメロディの所定周期T毎の音階差を表す登録音階差信
号列MD(nT)を登録する。
次に、第5図を参照して、具体的なメロディをあげて
第3図のメロディ情報算出器13及び第4図のメロディ情
報算出器13aの動作について説明する。
第5図(a)に示されるように、“HAGFisEDEGFisGED
EDH"の音階で表されるメロディについて説明する。この
メロディは、例えば、第5図(b)に示されるように、
日本語では、『あおいそらがおひさまにと−ける』と歌
われる。このメロディは、第5図(a)から明らかなよ
うに、最も継続時間が長い音符として2分音符を、最も
継続時間が短い音符として16分音符を含む。従って、以
下の説明では、説明の簡単化のために、周波数カウンタ
12(第1図)は、基本周波数抽出部11の出力を16分音符
に対応するサンプリング周期(所定周期)Tでサンプリ
ングするものとする。
尚、16分音符を単位にして、上記メロディに括弧内の
数字で継続時間を付して表すと、“H(8)A(6)G
(2)Fis(4)E(4)D(8)E(4)G(3)Fis
(1)G(6)E(2)D(3)E(1)D(4)H
(8)”となる。従って、上記メロディの全体の継続時
間は、16分音符を単位にして、“64"である。
先ず、第3図のメロディ情報算出器13について説明す
る。
第5図(b)における最初の歌詞である『あ』は、第
5図(a)に示されるように、H(8)の音階(継続時
間)を有するので、相対音階算出器40は、第0〜第7の
サンプル時点に対応する算出相対音階信号RS(0)〜RS
(7T)として“0"を出力する。又、相対音階変化点検出
回路50は、第0のサンプル時点で、検出相対音階情報DV
Sとして“0"を出力する。
第8のサンプル時点で、次の歌詞『お』に対応する音
A(6)がサンプルされる。この『お』の音は、第5図
(a)から明らかなように、最初の歌詞『あ』よりも全
音低いので、相対音階算出器40は、第8〜第13のサンプ
ル時点に対応する算出相対音階信号RS(8T)〜RS(13
T)として“−2"を出力する。相対音階変化点検出回路5
0は、第8のサンプル時点で“−2"を出力する。又、第
8のサンプル時点で、継続時間計数回路60は計数継続時
間情報CCTとして“8"を出力する。
以下同様に動作する。その結果を第5図(c)に示
す。すなわち、相対音階算出器40は、第0〜第63のサン
プル時点に対応する算出相対音階信号RS(0)〜RS(63
T)として“0"〜“−12"を出力する。相対音階変化点検
出回路50は、検出相対音階情報DVSとして“0,−2,−4,
−5,−7,−9,−7,−4,−5,−4,−7,−9,−7,−9,−12"
を出力する。継続時間計数回路60は計数継続時間情報CC
Tとして“8,6,2,4,4,8,4,3,1,6,2,3,1,4,8"を出力す
る。
次に、第4図のメロディ情報算出器13aについて説明
する。
第5図(b)における最初の歌詞である『あ』の音に
対して、音階差算出器40aは、第0〜第7のサンプル時
点に対応する算出音階差信号SD(0)〜RS(7T)として
“0"を出力する。又、音階差変化点検出回路50aは、第
0のサンプル時点で、検出音階差情報DVD“0"を出力す
る。
第8図のサンプル時点で、次の歌詞『お』に対応する
音A(6)がサンプルされる。この『お』の音は、第5
図(a)から明らかなように、最初の歌詞『あ』よりも
全音低いので、音階差算出器40aは、第8のサンプル時
点に対応する算出音階差信号SD(8T)として“−2"を出
力する。音階差変化点検出回路50aは、第8のサンプル
時点で検出音階差情報DVDとして“−2"を出力する。
又、第8のサンプル時点で、継続時間計数回路60aは計
数継続時間情報CCTとして“8"を出力する。
歌詞『お』は、第8〜第13のサンプル時点でサンプル
されるので、音階差算出器40aは、第9〜第13のサンプ
ル時点に対応する算出音階差信号SD(8T)〜SD(13T)
として“0"を出力する。
以下同様に動作する。その結果を第5図(d)に示
す。すなわち、音階差算出器40aは、第0〜第63のサン
プル時点に対応する算出音階差信号SD(0)〜SD(63
T)として“0"〜“0"を出力する。音階差変化点検回路5
0aは、検出音階情報DVDとして“0,−2,−2,−1,−2,−
2,2,3,−1,1,−3,−2,2,−2,−3"を出力する。継続時間
計数回路60aは計数継続時間情報CCTとして“8,6,2,4,4,
8,4,3,1,6,2,3,1,4,8"を出力する。
上記実施例では、16分音符を継続時間の単位にし、サ
ンプリング周期Tもそれに対応させている。しかしなが
ら、実際には、サンプリング周期Tはもっと短い時間に
選択される。そのため、サンプル数も膨大な数になる。
従って、相対音階算出器13から出力される算出相対音階
信号列RS(nT)や、音階差算出器13aから出力される算
出音階差信号列SN(nT)を抽出されたメロディ情報EMI
として採用すると、メロディ情報登録装置20は、登録相
対音階信号列MS(nT)や登録音階差信号列MD(nT)を登
録するために、大きい記憶容量をもつ必要がある。
メロディ情報登録装置20の記憶容量を少なくするため
には、抽出されたメロディ情報EMIとして、検出相対音
階情報DVSと計数継続時間情報CCTとの組や、検出音階差
情報DIDと計数継続時間情報CCTとの組を採用すればよ
い。
尚、上記実施例では、計数継続時間情報CCTが絶対的
な継続時間を表している。例えば、第5図の場合、絶対
的な継続時間を表す計数継続時間情報CCT(DN)(DN=
0,1,2,…)は、次の値を持つ。
CCT(0)=8,CCT(1)=6,CCT(2)=2,CCT(3)
=4,…。
しかしながら、以下に述べるように、相対的な継続時
間を表すようにしても良い。
相対的な継続時間の算出方法として、次の2種類があ
る。
最初のサンプリング時点のデータとの比に基づく方
法。
CCT′(DN)=CCT(DN)/CCT(0) 前のデータを基準にする方法。
CCT″(DN)=CCT(DN)/CCT(DN−1) 但し、CCT′(0)=CCT″(0)=1とする。
相対的な継続時間を表す計数継続時間情報CCT′(D
N)は、第5図の例では、次の値を持つ。
CCT′(0)=1,CCT′(1)=0.75,CCT′(2)=0.
25,CCT′(3)=0.5,…。
同様に、相対的な継続時間を表す計数継続時間情報CC
T″(DN)は、第5図の例では、次の値を持つ。
CCT″(0)=1,CCT″(1)=0.75,CCT″(2)=0.
333…,CCT″(3)=2,…。
もっと、記憶容量を少なくするために、検出相対音階
情報DVSのみや、検出音階差情報DVDのみを採用するほう
がよい。また、メロディを各音階に割当てられた正しい
継続時間を維持して歌える人はほとんどいない。この点
からも、検出相対音階情報DVSのみや、検出音階差情報D
VDのみを抽出されたメロディ情報EMIとして用いた方が
好ましい。
メロディ情報抽出装置10中のメロディ情報算出器13
(13a)とメロディ情報比較装置30はマイクロプロセッ
サで構成される。上述した、メロディ情報算出器13(13
a)は、比較的簡単なソフトウェアによって、実現可能
である。すなわち、メロディ認識装置は、入力音信号の
基本周波数を検出するハードウェアと比較的簡単なソフ
トウェアによって実現される。
〔発明の効果〕
以上説明したように、本発明では、メロディ情報抽出
手段によって入力音信号に含まれるメロディを表すメロ
ディ情報を抽出し、この抽出されたメロディ情報とメロ
ディ情報登録手段に登録されたメロディ情報とをメロデ
ィ情報比較手段で比較して、入力音信号に含まれるメロ
ディを認識している。メロディは共通性が高いので、不
特定多数の話者を認識する話者認識装置として使用すれ
ば、容易に話者の認識を行えるという効果がある。ま
た、従来の音声認識装置と比較して、構成が非常に簡単
になるという利点もある。
【図面の簡単な説明】
第1図は本発明の一実施例によるメロディ認識装置の構
成を示すブロック図、第2図は第1図中のメロディ情報
抽出装置の構成を示すブロック図、第3図は第2図中の
メロディ情報算出器の一構成を示すブロック図、第4図
はメロディ情報算出器の他の構成を示すブロック図、第
5図は第3図及び第4図のメロディ情報算出器の動作を
説明するためのブロック図である。 10……メロディ情報抽出装置、11……基本周波数抽出
部、111……ローパスフィルタ(LPF)、112……自動利
得調節器(AGC)、12……周波数カウンタ、13……メロ
ディ情報算出器、20……メロディ情報登録装置、30……
メロディ情報比較装置、40……相対音階算出器、40a…
…音階差算出器、41……初期サンプル値保持回路、41a
……遅延回路、42……相対音階算出回路、42a……音階
差算出回路、50……相対音階変化点検出回路、50a……
音階差変化点検出回路、60,60a……継続時間計数回路。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 G10K 15/04 G10H 1/00

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】複数の音階と該各音階の継続時間との組合
    わせからなるメロディを含む入力音信号から該メロディ
    を表すメロディ情報を抽出し、抽出されたメロディ情報
    を出力するメロディ情報抽出手段と、 少なくとも1つの予め定められたメロディを表すメロデ
    ィ情報を予め登録し、登録されたメロディ情報を出力す
    るメロディ情報登録手段と、 前記抽出されたメロディ情報と前記登録されたメロディ
    情報とを比較して前記入力音信号に含まれるメロディを
    認識するメロディ情報比較手段と、 を有するメロディ認識装置において、 前記メロディ情報抽出手段は、前記入力音信号を所定周
    期でサンプリングして得られた基本周波数成分のデータ
    列に対して、各サンプリング時点のデータと最初のサン
    プリング時点のデータとの比に基づいて算出された相対
    音階の中で変化した相対音階を表す検出相対音階情報と
    各相対音階の継続時間を計数して得られる計数継続時間
    情報との組を抽出し、前記検出相対音階情報と前記計数
    継続時間情報との組を前記抽出されたメロディ情報とし
    て出力し、 前記メロディ情報登録手段は、前記予め定められたメロ
    ディの先頭の音の周波数を基準にした変化した相対音階
    を表す登録相対音階情報と各相対音階の継続時間を表す
    登録継続時間情報との組を登録し、前記登録相対音階情
    報と前記登録継続時間情報との組を前記登録されたメロ
    ディ情報として出力する ことを特徴とするメロディ認識装置。
  2. 【請求項2】複数の音階と該各音階の継続時間との組合
    わせからなるメロディを含む入力音信号から該メロディ
    を表すメロディ情報を抽出するメロディ情報抽出装置に
    於いて、 前記入力音信号を受け、該入力音信号から基本周波数成
    分の音信号を抽出し、該抽出された基本周波数の音信号
    を表す基本周波数音信号を出力する基本周波数抽出手段
    と、 前記基本周波数音信号を所定周期Tでサンプリングし
    て、それぞれ第0乃至第N(N≧1)のサンプリング時
    点でサンプリングされた基本周波数を表す第0乃至第N
    のデジタル周波数信号f(0)〜f(NT)を出力する周
    波数カウンタと、 前記第1乃至第Nのデジタル周波数信号f(0)〜f
    (NT)を処理して、前記入力音信号のメロディ情報を求
    めるメロディ情報算出手段とを有し、 前記メロディ情報算出手段は、 第n(1≦n≦N)のサンプル時点の第nのデジタル周
    波数信号f(nT)と第0のサンプル時点の第0のデジタ
    ル周波数信号f(0)との比である音程に基いて、所定
    周期T毎にそれらの間の相対音階を算出し、該算出され
    た相対音階を表す算出相対音階信号列を出力する相対音
    階算出手段と、 前記算出相対音階信号列の変化点を検出し、変化した相
    対音階を表す検出相対音階情報を出力する相対音階変化
    点検出手段と、 前記算出相対音階信号列中の連続する同一相対音階の継
    続時間を計数し、相対音階毎の計数された継続時間を表
    す計数継続時間情報を出力する継続時間計数手段とを有
    し、 前記検出相対音階情報と前記計数継続時間情報との組を
    前記入力音信号のメロディ情報として抽出することを特
    徴とするメロディ情報抽出装置。
JP2075485A 1990-03-27 1990-03-27 メロディ認識装置及びそれに使用されるメロディ情報抽出装置 Expired - Fee Related JP2969527B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2075485A JP2969527B2 (ja) 1990-03-27 1990-03-27 メロディ認識装置及びそれに使用されるメロディ情報抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2075485A JP2969527B2 (ja) 1990-03-27 1990-03-27 メロディ認識装置及びそれに使用されるメロディ情報抽出装置

Publications (2)

Publication Number Publication Date
JPH03276197A JPH03276197A (ja) 1991-12-06
JP2969527B2 true JP2969527B2 (ja) 1999-11-02

Family

ID=13577642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2075485A Expired - Fee Related JP2969527B2 (ja) 1990-03-27 1990-03-27 メロディ認識装置及びそれに使用されるメロディ情報抽出装置

Country Status (1)

Country Link
JP (1) JP2969527B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123818A (ja) * 1994-10-25 1996-05-17 Nippon Telegr & Teleph Corp <Ntt> 音楽情報検索システム及び音楽情報検索方法
JP3764033B2 (ja) * 2000-07-10 2006-04-05 シャープ株式会社 楽曲検索装置および方法
US6747201B2 (en) 2001-09-26 2004-06-08 The Regents Of The University Of Michigan Method and system for extracting melodic patterns in a musical piece and computer-readable storage medium having a program for executing the method
US8584198B2 (en) * 2010-11-12 2013-11-12 Google Inc. Syndication including melody recognition and opt out
US8584197B2 (en) * 2010-11-12 2013-11-12 Google Inc. Media rights management using melody identification
JP2012194653A (ja) * 2011-03-15 2012-10-11 Nec Corp データ処理装置、データ処理システム、データ処理方法およびプログラム
CN105957538B (zh) * 2016-05-09 2019-06-11 大连民族大学 基于显著性的复调音乐主旋律提取方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0254300A (ja) * 1988-08-19 1990-02-23 Nec Corp 自動選曲装置
JPH038394U (ja) * 1989-06-09 1991-01-25

Also Published As

Publication number Publication date
JPH03276197A (ja) 1991-12-06

Similar Documents

Publication Publication Date Title
Bittner et al. Deep Salience Representations for F0 Estimation in Polyphonic Music.
Marolt A connectionist approach to automatic transcription of polyphonic piano music
Goto A robust predominant-F0 estimation method for real-time detection of melody and bass lines in CD recordings
US7035742B2 (en) Apparatus and method for characterizing an information signal
Kuhn A real-time pitch recognition algorithm for music applications
CN104978962A (zh) 哼唱检索方法及系统
US7064262B2 (en) Method for converting a music signal into a note-based description and for referencing a music signal in a data bank
JP5127982B2 (ja) 音楽検索装置
JP2969527B2 (ja) メロディ認識装置及びそれに使用されるメロディ情報抽出装置
CN112992109A (zh) 辅助歌唱系统、辅助歌唱方法及其非瞬时计算机可读取记录媒体
JP3508978B2 (ja) 音楽演奏に含まれる楽器音の音源種類判別方法
Wei et al. RMVPE: A robust model for vocal pitch estimation in polyphonic music
JP5790496B2 (ja) 音響処理装置
Li et al. Musical sound separation using pitch-based labeling and binary time-frequency masking
JP2604410B2 (ja) 自動採譜方法及び装置
US20020126830A1 (en) Phone apparatus having a ringing device
CN110111813B (zh) 节奏检测的方法及装置
EP0367191B1 (en) Automatic music transcription method and system
JP2604404B2 (ja) 自動採譜方法及び装置
JP2806048B2 (ja) 自動採譜装置
JP2604414B2 (ja) 自動採譜方法及び装置
JP2653456B2 (ja) 自動採譜方法及び装置
JP2604405B2 (ja) 自動採譜方法及び装置
JP2604401B2 (ja) 自動採譜方法及び装置
JPH0648556Y2 (ja) 電子楽器の入力制御装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070827

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080827

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080827

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090827

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees