JPH09146545A - 音声自動採譜装置 - Google Patents

音声自動採譜装置

Info

Publication number
JPH09146545A
JPH09146545A JP7304254A JP30425495A JPH09146545A JP H09146545 A JPH09146545 A JP H09146545A JP 7304254 A JP7304254 A JP 7304254A JP 30425495 A JP30425495 A JP 30425495A JP H09146545 A JPH09146545 A JP H09146545A
Authority
JP
Japan
Prior art keywords
frequency
voice
data
signal
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP7304254A
Other languages
English (en)
Inventor
Kazuo Sudo
一夫 須藤
Tadashi Tokuyama
正 徳山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP7304254A priority Critical patent/JPH09146545A/ja
Publication of JPH09146545A publication Critical patent/JPH09146545A/ja
Abandoned legal-status Critical Current

Links

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【課題】 人間による歌唱やハミング等のアナログ音声
信号から自動的にMIDIデータや楽譜の作成を可能と
すると共に、周波数分析の際のウィンドウ間隔による時
間分解能の損失を最小限にする。 【解決手段】 アナログ音声信号を積分する積分回路1
7と、その積分出力を基準値VREFと比較するコンパレ
ータ18と、アナログ音声信号をディジタル変換するA
/D変換器106と、そのディジタル音声信号を所定の
ウィンドウ間隔で高速フーリエ変換するDSP105
と、高速フーリエ変換により得られたパワースペクトル
から楽譜データを生成するCPU113とを有し、DS
P105は、コンパレータ18での比較において積分出
力が基準値VREFを越えた時点で、ディジタル音声信号
に対するウィンドウ化を開始して高速フーリエ変換を行
う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された歌唱又
はハミング等の音声から自動的に楽譜を生成する音声自
動採譜装置に関する。
【0002】
【従来の技術】近年、電子楽器とパーソナルコンピュー
タ間のインターフェイス規格であるMIDI(Musical
Instrument Digital Interface)規格が普及し、多くの
人がパーソナルコンピュータを使って作曲したり、電子
楽器を演奏するようになっている。
【0003】
【発明が解決しようとする課題】しかし、アコースティ
ック楽器を演奏できない人でも容易に楽器演奏ができる
ようになった反面、そのためには何らかの方法でMID
Iデータをコンピュータに入力しなければならない。し
たがって、この段階でコンピュータの画面上で楽譜を書
いていくか、ピアノやギターなどの音を発し、かつその
音をMIDIデータに変換できるような電子楽器を演奏
する能力が要求される。
【0004】このようなことから、近年は、人間による
歌唱やハミング等の音声から自動的にMIDIデータや
楽譜の作成を可能とする音声自動採譜装置が各種提案さ
れている。
【0005】ところで、人間による歌唱やハミング等の
音声から自動的に採譜を行う場合、例えば、当該歌唱や
ハミング等の音声信号を周波数分析し、この分析結果に
基づいて楽譜データを生成することが行われている。
【0006】ところが、上記周波数分析では、通常、一
定のウィンドウ間隔で音声信号を周波数分析するように
しているため、例えばウィンドウの途中で有効なデータ
(その前は無効データ)となったようなときには、当該
ウィンドウの途中からは有効なデータであるにもかかわ
らず、そのウィンドウでの演算結果は使用されず、次の
ウィンドウからが有効となる。したがって、有効なデー
タとなった始めの部分で時間的損失が起こることにな
る。
【0007】そこで、本発明はこの様な実情に鑑みてな
されたものであり、特別な演奏能力が要求されることが
ない、人間による歌唱やハミング等の音声から自動的に
MIDIデータや楽譜の作成を可能とすると共に、周波
数分析の際のウィンドウ間隔による時間分解能の損失を
最小限にすることができる音声自動採譜装置を提供する
ことを目的とする。
【0008】
【課題を解決するための手段】本発明は、音声信号から
自動的に楽譜を生成する音声自動採譜装置であり、アナ
ログ音声信号をディジタル変換したディジタル音声信号
を所定のウィンドウ間隔で周波数分析し、この周波数分
析により得られた周波数成分から楽譜データを生成する
と共に、アナログ音声信号の積分出力を所定の基準値と
比較し、この積分出力が所定の基準値を越えた時点で、
アナログ音声信号をディジタル変換したディジタル音声
信号を周波数分析する際のウィンドウ化を開始すること
により、上述の課題を解決する。
【0009】すなわち、本発明によれば、人間による歌
唱やハミング等のアナログ音声信号から自動的にMID
Iデータや楽譜の作成を可能とすると共に、アナログ音
声信号の積分出力が所定の基準値を越えた時を有効なデ
ィジタル音声信号であると判断して周波数分析をスター
トさせることにより、周波数分析の際のウィンドウ間隔
による時間分解能の損失を最小限にしている。
【0010】
【発明の実施の形態】以下、本発明の好ましい実施の形
態について図面を参照にしながら説明する。
【0011】先ず、図1には、本発明の音声自動採譜装
置が適用されるシステム全体の構成を示す。
【0012】この図1において、マイクロホン111か
ら入力された音声信号は、アンプ110によって増幅さ
れ、切換スイッチ108の一方の被切換端子に送られ
る。この切換スイッチ108の他方の被切換端子はライ
ンイン端子109と接続されている。したがって、当該
切換スイッチ108はマイクロホン111からの入力音
声信号とラインイン端子109からの入力音声信号とを
切換選択する。なお、切換スイッチ108の出力は、ラ
インアウト端子112から外部にも出力可能となってい
る。
【0013】この切換スイッチ108を介して供給され
た音声信号は、ローパスフィルタ(以下LPFと呼ぶ)
107に送られる。このLPF107では高域成分が除
去され音声帯域のみを通過させる。
【0014】ここで、入力音声信号が人間の音声である
場合、人間の音声の基本波の帯域は声楽をしている男性
の最低音から女性の最高音までが約50Hz〜1kHz
であり、また一般の人のハミング程度では上限が500
Hzもあれば十分である。したがって、後段のA/D変
換器106でのサンプリング周波数を例えば2.016
kHzにしたとき、音程検出時に2次高調波による1オ
クターブ上への検出ミスを減らすためにも、入力段で少
なくとも必要最低限の500Hzをカットオフするよう
な2次のLPF107を用いている。なお、音程検出時
に男性の低音での1オクターブ上への検出ミスを減らす
ためにも、低域側はできるだけのばようにしており、上
記LPF107の前段又は後段には図示は省略している
がカットオフ2Hzの1次ハイパスフィルタ(HPF)
を接続している。
【0015】当該LPF107を介した音声信号は、ア
ナログ/ディジタル(A/D)変換器106にてディジ
タル音声信号に変換される。
【0016】ここで、当該A/D変換器106は、入力
ダイナミックレンジが±3Vで、サンプリング周波数が
2.02kHz、量子化ビット数が14ビットのものを
使用している。また、当該A/D変換器106は、シリ
アルポートとダイレクトにインターフェイスが可能なも
のであり、サンプリング周波数と内蔵フィルタのカット
オフをプログラムにより変えることができるものであ
る。なお、当該A/D変換器106の場合、内蔵フィル
タのカットオフ周波数については例えば1.01kHz
にしている。さらに当該A/D変換器106は、所定サ
ンプル数毎に後段のディジタル・シグナル・プロセッサ
(以下DSPとする)105に対して割り込みをかけ、
当該DSP105の割り込みルーチン内でサンプリング
データをシリアル伝送する。このサンプリング周波数
が、後述する音符の長さやメトロノームなどのタイミン
グの基準になっている。
【0017】上記A/D変換器106から出力されたデ
ィジタル音声信号は、DSP105に送られる。当該D
SP105では、上記A/D変換器106から供給され
たディジタル音声信号を高速フーリエ変換(以下FFT
とする)処理により周波数分析し、周波数成分を得る。
すなわち、当該DSP105では、上記A/D変換器1
06からのサンプリングによる14ビットデータを、一
旦入力バッファに例えば右詰めにして格納し、当該14
ビットのサンプリングデータが512個すなわち512
ワード(この長さをウィンドウと言う)格納されたなら
ば、この512ワードのデータを入力バッファから読み
出して演算バッファに転送し、この演算バッファ上でF
FT演算を行う。なお、ここでのFFT演算の窓関数に
はいわゆるブラックマンウィンドウを用いている。ま
た、FFT演算は複素演算であり、サンプリングデータ
を実部に、0を虚部に入れていくため、上記入力バッフ
ァのメモリ容量としては、実際には1024ワード分の
メモリ容量が少なくとも必要であり、しかもFFT演算
中もデータがサンプリングされるため、当該入力バッフ
ァはダブルバッファ構成とし、合計で2048ワード分
のメモリとして使用している。
【0018】ここで、512ワードのデータのサンプリ
ングに要する時間は約253msecであり、この時間
によりFFT演算時の最小時間分解能が決まることにな
る。言い換えれば、当該253msec以下の変化には
追従できないことになる。実際にはこれでは遅すぎ、し
たがって時間分解能を上げるにはサンプリング周波数を
上げるか、FFT演算のポイント数を減らさなければな
らない。しかし、このどちらも好ましくないので、本発
明の例では、見かけ上の時間分解能を上げるために、図
2に示すように、上記ウィンドウを図中W1〜W4に示す
ように4つのブロックに分け、これらを順にシフトさせ
ながらFFT演算を行っていく方法をとっている。な
お、図2の図中矢印で示す範囲がFFT演算されるブロ
ックの範囲を示している。この方法によって、時間分解
能は例えば63msecにすることができる。また、最
小周波数分解能は3.9Hz以下となっている。
【0019】上記FFT演算が終了すると、当該FFT
演算後のデータはビット逆順に次のバッファに送られ、
実部と虚部の2乗和をとりながら出力バッファに転送さ
れる。当該出力バッファもダブルバッファ構成となさ
れ、各々512ワードのデータの格納を行う。出力バッ
ファにおいて1ウィンドウ分のデータが格納されると、
CPU113に対して割り込みをかけ、同時に出力バッ
ファに対して出力命令を発して当該出力バッファに送
る。
【0020】CPU113は、当該割り込みルーチンで
上記出力バッファのデータを読みに行き、当該出力バッ
ファからはパラレルにデータが出力される。DSP10
5は、上記CPU113が出力バッファに対して出力す
るアドレスをデコードしたデータの後エッジによって割
り込みがかかり、上記CPU113が出力バッファから
データを読んだことを知る。
【0021】なお、上記入力バッファと演算バッファ及
び出力バッファは、例えば2Mビットの記憶容量を有す
るSRAM(スタティックRAM)114にて実現さ
れ、このSRAM114は各バッファに対応して記憶領
域が分けられて使用されている。
【0022】上記CPU113は、ROM115内に格
納されているプログラムデータ等を用いて、各部を制御
すると共に、上記マイクロホン111を介して入力され
た人間による歌唱やハミング等の音声信号を上記DSP
105によってFFT演算したデータから、後述する図
5及び図6に示すアルゴリズムに従って自動的にMID
Iデータや楽譜の作成を行う。
【0023】ここで、上記CPU113により作成され
た楽譜のデータは、液晶ディスプレイ(以下LCDと呼
ぶ)コントローラ102に送られる。当該LCDコント
ローラ102は上記楽譜のデータを、2Mビットの容量
のDRAM(ダイナミックRAM)101に格納すると
共に、当該格納した楽譜のデータを用いてLCD装置1
00へ表示する表示データを生成する。これによりLC
D装置100の表示面上には、例えば図3に示すような
五線譜の楽譜が表示されることになる。この楽譜上には
例えば16分音符〜全音符までの音符が表示され、さら
にこの図3の例では3段分のピアノの鍵盤も表示されて
いる。ここでは16分音符からとしているが、32分音
符や64分音符等も表示可能であることは言うまでもな
い。また、臨時記号等も省略しているがもちろん表示す
ることは可能である。さらに、表示されたピアノ鍵盤の
上にはインジケータ200が表示され、このインジケー
タ200がピアノ鍵盤上を移動することで、五線譜上の
音程とピアノ鍵盤との対応が表示されるようになってい
る。その他、この表示画面上には、イメージとして、自
動採譜の開始を指示するスタートボタンの表示と、MI
DIチャンネル表示と、プログラム数を示す表示と、オ
クターブの高低を示す表示と、速さを示すビート表示も
表示されている。
【0024】なお、図3の例では、上記スタートボタン
として<<START>>を表示し、また、MIDIチ
ャンネル数は例えば16チャンネルで、そのうち一つが
表示される。図3の例では第1チャンネルとして[MI
DICH01]が表示されている。プログラム数は例え
ば1〜128あり、リアルタイムに変更可能で、図3の
例では[INST001]として第1番目のプログラム
の表示が行われている。オクターブは±5オクターブを
リアルタイムに変更可能で、図3の例ではオクターブ表
示として例えば[OCT±0]を表示している。さち
に、ビート表示はメトロノーム機能に応じてなされる。
なお、メトロノーム機能は、例えば1分間に4分音符を
234個奏するテンポとしたとき、図3の例におけるビ
ート表示のBEAT=0でなし、BEAT=1で全音符
毎(1024msec毎)、BEAT=2で2分音符毎
(512msec毎)、BEAT=4で4分音符毎(2
56msec毎)、BEAT=8で8分音符毎(128
msec毎)、BEAT=16で16分音符毎(64m
sec毎)に、例えばウッドブロック音のMIDIデー
タとして出力され、このMIDIデータに基づいてスピ
ーカ等からメトロノーム音として鳴らされる。なお、図
3の例ではビート表示として[BEAT00]を表示し
ている。
【0025】また、上記LCD装置100は、VGA
(Video Graphics Array、信号線数640本×走査線数
480本)LCDを使用し、図4に示すように、LCD
上の各ドットはバス上のアドレスに対するデータそのま
まに対応している。各アドレスで扱うデータはロングワ
ードで、そのうちMSB側から1バイトずつ区切って3
バイトをR(赤),G(緑),B(青)又はモノクロの
諧調に使用している。上記楽譜(スコア)の表示は例え
ばモノクロ2値とし、五線譜と音符又は休符をレイヤに
して音符又は休符の更新を可能にしている。なお、図4
において、任意のアドレスドットに書き込むデータを*
ドットとすると、 五線譜 *ドット=xxxx0000 音符 *ドット
=xx00xx00 となる。
【0026】さらに、当該LCD装置100は表示面上
にいわゆるタッチパネルを備えている。LCDコントロ
ーラ102は使用者が上記タッチパネルを介して入力し
たデータをCPU113に送る。一方、上記CPU11
3が作成したMIDIデータは、MIDIインターフェ
イス部103及びMIDI出力端子104を介して外部
に出力可能となっている。なお、MIDIインターフェ
イス部103は、ホストとバスで接続された内部レジス
タに、設定コマンドとMIDIデータを入れることで自
動的にMIDIデータとして出力することが可能なもの
である。次に、図5及び図6を用いてCPU113にお
ける信号処理のアルゴリズムについて説明する。
【0027】先ず、図5において、ステップS1では、
歌唱やハミング等の音声から自動的にMIDIデータや
楽譜の作成を開始することを、当該装置の使用者が指示
するための前記図3のスタートボタンが押されているか
否かの判断を行う。なお、例えばLCD装置100の表
示画面上にイメージとして表示されているスタートボタ
ンを押すと、当該スタートボタンの表示位置に対応する
タッチパネルの出力信号がCPU113に送られ、これ
によりCPU113はスタートボタンが押されたことを
知る。当該ステップS1において、スタートボタンが押
されていると判断した場合にはステップS2に進み、ス
タートボタンが押されていないと判断した場合には後述
する図6のステップS28へ進む。
【0028】ステップS2では、前記DSP105から
出力バッファに格納されたデータが無効データか否かを
判断する。具体的に言うと、前記DSP105は、前記
FFT演算のウィンドウ期間中に音声信号が存在すると
きにはデータが有効である旨を示す信号(以下有効デー
タと呼ぶ)を出力し、またウィンドウ期間中に音声信号
が存在しないときにはデータが無効である旨を示す信号
(以下無効データと呼ぶ)を出力し、CPU113に送
るようになされており、当該CPU113は、上記DS
P105から無効データの供給の有無を判断している。
ここで、DSP105から無効データが供給されたと判
断したならばステップS4に進み、無効データが供給さ
れていないと判断したならばステップS3に進む。
【0029】ステップS3では、前記出力バッファから
データの転送が開始されたか否かを判断し、開始されて
いないと判断したときにはステップS4に進み、開始さ
れたと判断したときにはステップS5に進む。
【0030】ステップS4では変数eventを無音である
ことを示す”0”にし、ステップS5では変数eventを
有音であることを示す”1”にして、それぞれステップ
S6に進む。
【0031】ステップS6ではルート計算を行い、次の
ステップS7ではウィンドウ期間のトータルのパワーを
計算する。次に、ステップS8では16分音符の長さに
なっていたならば、16分音符をLCD装置100の表
示画面上に表示された楽譜(スコア)上に表示し、ステ
ップS9ではメトロノーム音を鳴らす。
【0032】次に、ステップS10では変数eventが”
1”であるか否かの判断を行い、event=”1”のとき
にはステップS11に、event=”1”でないときには
後述する図6のステップS24に進む。
【0033】ステップS11では上記計算したパワーの
値により速度(ベロシティ)を決定し、次のステップS
12では前回が無音なら休符を上記LCD装置100の
表示画面上に表示されたスコア上に表示する。
【0034】次のステップS13ではウィンドウ期間内
で1番低いピーク値を検出し、ステップS14では当該
1番低いピークの両隣のスペクトラムの値を比較し、ス
テップS15では大きい方のスペクトラムの隣のスペク
トラムとの間で内分を計算する。
【0035】上記スペクトルの内分は以下のように行
う。ここで、スペクトルの周波数精度を向上させる方法
として、複素スペクトル内挿法が知られている。これは
複素平面上でピークに隣接する複素ベクトルから内積に
より真のピークを導き出す手法であるが、本システムで
はDSP105からCPU113にはにパワースペクト
ルの形で送られるため、複素演算はDSP105で行わ
なければならない。そこで、本発明では、パワースペク
トルから内分法によって真のピークを推定する方法をと
るようにしている。この方法を用いることでCPU11
3で容易に処理できる。すなわちこのパワースペクトル
から内分法によって真のピークを推定する方法では、図
7に示すように、周波数fmにおけるスペクトルをPm
し、周波数fm+1におけるスペクトルをPm+1とする。
【0036】ここで、 a:b=Pm+1:Pm とし、 a+b=1 b=1−a とすると、 a・Pm=(1−a)・Pm+1 a=Pm+1/(Pm+1+Pm) となる。したがって、真のピークのスペクトルfを、 f=fm+Pm+1/(Pm+1+Pm) のように求めることができる。
【0037】次のステップS16では求めた音を音階番
号に量子化し、図6のステップS17に進む。図6のス
テップS17では、前回の音と今回の音との間の音程が
3度以上10度以下ならば当該音を採用し、次のステッ
プS18で前回が休符なら音を発する。ステップS19
では前回の音と違うか否かが判断され、違わないときに
は後述するステップS27に進み、違うときにはステッ
プS20に進む。
【0038】ステップS20ではLCD装置100の表
示画面上のピアノ鍵盤(キーボード)上のインジケータ
200を当該音に対応する鍵盤上に移動して表示し、ス
テップS21では当該音の音符をLCD装置100の表
示画面上の五線譜上に表示する。次にステップS22で
は前回の音の発音を停止し、ステップS23では今回の
音を発音する。その後はステップS28に進む。
【0039】一方、図5のステップS10にてNoと判
断されたときに進むステップS24では、前回が音か否
かを判断し、音でないときにはステップS28に、音で
あるときにはステップS25に進む。ステップS25で
はLCD装置100の表示画面上のピアノ鍵盤上のイン
ジケータ200を当該音に対応する鍵盤上に移動して表
示し、ステップS26では当該音の音符をLCD装置1
00の表示画面上の五線譜上に表示し、次のステップS
27では当該音の発音を停止する。
【0040】次のステップS28ではタッチパネルから
の入力を読み込み、ステップS29では当該読み込んだ
座標値に従ってパラメータを変更する。その後は、ステ
ップS1に戻って、上述した処理を繰り返す。
【0041】上述のようにすることによって、図1の音
声自動採譜装置においては、入力された人間による歌唱
やハミング等の音声信号から自動的にMIDIデータや
楽譜を作成可能としている。なお、上述の例では、歌唱
やハミング等の人間による音声を例に挙げているが、楽
器,口笛等の音であっても同様に自動的に採譜できるこ
とは言うまでもない。ただし、この場合、ローパスフィ
ルタのカットオフ周波数は、各種楽器に対応できるもの
となる。
【0042】ところで、上記DSP105にて行われる
高速フーリエ変換(FFT)を、一定のウィンドウ間隔
で常時行うようにすると、例えば図8に示すように、ウ
ィンドウの途中で有効データ(その前は無効データ)と
なったとしても、そのウィンドウでの演算結果は使用さ
れず、次のウィンドウからが有効となる。したがって、
有効データとなった始めの部分で時間的損失が起こるこ
とになる。
【0043】このような時間的損失の発生を避けるた
め、本発明の音声自動採譜装置では、図1において、さ
らに図9に示すような構成が付加されている。なお、図
9の構成には主要部分のみを示しており、また、図1と
対応する構成要素には同一の指示符号を付している。
【0044】この図9において、マイクロホン111か
ら入力された音声信号は、アンプ110によって増幅さ
れ、ローパスフィルタ(LPF)107により高域成分
が除去され、音声帯域のみが取り出される。
【0045】次に、上記LPF107を介した音声信号
はA/D変換器106にてディジタル信号に変換されて
DSP105に送られ、ここでFFT処理されて周波数
成分に変換される。
【0046】一方、LPF107の出力信号は積分回路
17にも入力され、そこで積分された後、コンパレータ
18にて基準電圧VREFと比較される。当該コンパレー
タ18では、上記積分回路17の出力信号が基準電圧V
REFよりも大きければ論理”1”、小さければ論理”
0”の信号を出力する。この信号は、CPU113に入
力されて音符と休符の1区切り毎のセグメントに分ける
セグメンテーションに使用するだけでなく、DSP10
5の制御にも使用される。すなわち、上記CPU113
では、上記コンパレータ18の出力が論理”1”である
ときは音符とし、論理”0”であるときは休符としてセ
グメンテーションを行い、DFP105では、上記コン
パレータ18の出力が論理”1”であるとき(積分回路
17での積分出力が基準電圧VREFよりも大きいとき)
はディジタル音声信号をウィンドウ化してFFT演算
し、論理”0”であるとき(積分回路17での積分出力
が基準電圧VREFよりも小さいとき)はウィンドウ化を
行わずに論理”1”となったとき(積分回路17での積
分出力が基準電圧VREFを越えた時点)にウィンドウ化
をスタートさせてFFT演算を行う。
【0047】CPU113は、上記セグメンテーション
の他、音符の期間にはピッチの検出、及び音符,休符の
長さのカウント等を行い、これらから求めた楽譜のデー
タを前記LCDコントローラ102,DRAM101,
LCD装置100からなる楽譜表示装置16に送る。こ
れにより当該楽譜表示装置16には楽譜が表示されるこ
とになる。
【0048】次に、図10には上記LPF107、積分
回路17、コンパレータ18のより具体的な回路例を示
す。また、図11には、当該図10の各部の波形を示
す。
【0049】この図10及び図11において、端子20
には入力信号として前記アンプ110にて増幅された音
声信号が供給され、当該音声信号がLPF107に送ら
れる。当該音声信号は、抵抗R1,R2の抵抗値とコン
デンサC1,C2の容量により決まるカットオフ周波数
で帯域制限され、オペアンプ21を介し、さらにコンデ
ンサC3によりDC(直流)成分がカットされる。この
コンデンサC3を介した信号は、積分回路17のオペア
ンプ22に送られ、バイアス電圧V1を中心に抵抗R3
と抵抗R4の抵抗値で決まる増幅率で増幅される。次
に、当該増幅された信号は、抵抗R5とコンデンサC4
で積分され、コンパレータ18のオペアンプ23に送ら
れる。このオペアンプ23では、上記積分回路17の出
力電圧値が基準電圧VREFより上なら論理”1”を、下
なら論理”0”の信号を出力する。なお、オペアンプ2
3では、論理レベルの電圧まで出力できないため、トラ
ンジスタ24をスイッチング動作させ、論理レベルで出
力させる。この出力信号が端子25から出力され、図9
のCPU113及びDSP105に送られる。
【0050】次に図12には、DSP105におけるF
FT演算が、上記コンパレータ18の出力信号が論理”
1”になると同時に始まる様子を示す。この図12か
ら、有効データの入力と同時にFFT処理のウィンドウ
期間TWが始まるため、遅延時間無しに有効データのみ
によるFFT演算結果が得られることがわかる。すなわ
ち、上記図9及び図10の構成を図1の音声自動採譜装
置に適用することにより、音声入力の立ち上がりで検出
の遅れがなくなる。
【0051】上述したように、本発明の音声自動採譜装
置は、音声の周波数等を分析して自動的に楽譜に変換す
る装置であり、音声波を積分し、その積分出力の包絡線
の高さが、ある基準値を越えた時を有効データと判断し
て高速フーリエ変換をスタートさせることで、高速フー
リエ変換のウィンドウ間隔による時間分解能の損失を最
小限にしている。
【0052】
【発明の効果】以上の説明で明らかなように、本発明に
おいては、アナログ音声信号をディジタル変換したディ
ジタル音声信号を所定のウィンドウ間隔で周波数分析
し、この周波数分析により得られた周波数成分から楽譜
データを生成することにより、人間による歌唱やハミン
グ等のアナログ音声信号から自動的にMIDIデータや
楽譜の作成を可能とする。また、アナログ音声信号の積
分出力を所定の基準値と比較し、この積分出力が所定の
基準値を越えた時点で、アナログ音声信号をディジタル
変換したディジタル音声信号を周波数分析する際のウィ
ンドウ化を開始することにより、周波数分析の際のウィ
ンドウ間隔による時間分解能の損失を最小限にしてい
る。
【図面の簡単な説明】
【図1】本発明の音声自動採譜装置の全体システム構成
例を示すブロック回路図である。
【図2】ウィンドウを4つに分け、シフトさせながらF
FT演算を行う方法について説明するための図である。
【図3】LCD装置の表示画面の一例を示す図である。
【図4】LCP装置のLCDのアドレスマップを示す図
である。
【図5】CPUのアルゴリズムの前半部分を示すフロー
チャートである。
【図6】CPUのアルゴリズムの後半部分を示すフロー
チャートである。
【図7】スペクトルの内分方法を説明するための図であ
る。
【図8】ウィンドウの途中で有効データがきた場合の時
間的損失について説明するための図である。
【図9】本発明の音声自動採譜装置の要部の構成を示す
ブロック回路図である。
【図10】本発明の音声自動採譜装置の要部のLPFと
積分回路とコンパレータの構成を具体的に示す回路図で
ある。
【図11】図10の回路図の各部の信号波形を示す波形
図である。
【図12】本発明の音声自動採譜装置において、ウィン
ドウの途中で有効データがきた場合でも時間的損失がな
いことを説明するための図である。
【符号の説明】
17 積分回路 18 コンパレータ 16 楽譜表示装置 100 LCD装置 101 DRAM 102 LCDコントローラ 103 MIDIインターフェイス部 105 DSP 106 A/D変換器 107 ローパスフィルタ 111 マイクロホン 113 CPU 114 SRAM 115 ROM

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 音声信号から自動的に楽譜を生成する音
    声自動採譜装置において、 アナログ音声信号を積分する積分手段と、 上記積分手段の積分出力を所定の基準値と比較する比較
    手段と、 上記アナログ音声信号をディジタル変換するアナログ/
    ディジタル変換手段と、 上記ディジタル変換されたディジタル音声信号を所定の
    ウィンドウ間隔で周波数分析する周波数分析手段と、 上記周波数分析手段により得られた周波数成分から楽譜
    データを生成する信号処理手段とを有し、 上記周波数分析手段は、上記比較手段での比較において
    上記積分出力が所定の基準値を越えた時点で、上記ディ
    ジタル音声信号に対するウィンドウ化を開始して上記周
    波数分析を行うことを特徴とする音声自動採譜装置。
  2. 【請求項2】 上記周波数分析手段は、ウィンドウを複
    数のブロックに分割し、当該分割したブロックをシフト
    させながら上記周波数分析を行うことを特徴とする請求
    項1記載の音声自動採譜装置。
  3. 【請求項3】 上記周波数分析手段は、高速フーリエ変
    換により上記ディジタル音声信号を上記周波数成分に変
    換することを特徴とする請求項1記載の音声自動採譜装
    置。
  4. 【請求項4】 上記信号処理手段は、上記周波数成分か
    ら内分法によりピークを推定することを特徴とする請求
    項1記載の音声自動採譜装置。
  5. 【請求項5】 上記アナログ音声信号のうち、人間の音
    声の周波数帯域の信号成分のみを通過させるフィルタ手
    段を設けることを特徴とする請求項1記載の音声自動採
    譜装置。
JP7304254A 1995-11-22 1995-11-22 音声自動採譜装置 Abandoned JPH09146545A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7304254A JPH09146545A (ja) 1995-11-22 1995-11-22 音声自動採譜装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7304254A JPH09146545A (ja) 1995-11-22 1995-11-22 音声自動採譜装置

Publications (1)

Publication Number Publication Date
JPH09146545A true JPH09146545A (ja) 1997-06-06

Family

ID=17930851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7304254A Abandoned JPH09146545A (ja) 1995-11-22 1995-11-22 音声自動採譜装置

Country Status (1)

Country Link
JP (1) JPH09146545A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008085883A1 (en) * 2007-01-03 2008-07-17 Xiao-Yu Ding Digital music systems
CN115602182A (zh) * 2022-12-13 2023-01-13 广州感音科技有限公司(Cn) 声音变换方法、系统、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008085883A1 (en) * 2007-01-03 2008-07-17 Xiao-Yu Ding Digital music systems
CN115602182A (zh) * 2022-12-13 2023-01-13 广州感音科技有限公司(Cn) 声音变换方法、系统、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
JP2874832B2 (ja) カラオケシステムにおける歌の点数採点装置
KR100256718B1 (ko) 음피치 변환 장치
Jensen The timbre model
JP3452792B2 (ja) カラオケ採点装置
JP3279204B2 (ja) 音信号分析装置及び演奏情報発生装置
JPH09152865A (ja) 音声自動採譜装置
JPH09146545A (ja) 音声自動採譜装置
JP2003015672A (ja) 声域告知機能付きカラオケ装置
JPH0332073B2 (ja)
JP4180548B2 (ja) 声域告知機能付きカラオケ装置
JP2001155031A (ja) 曲検索システムの入力データ処理方法及びデータ入力装置
JPH01288900A (ja) 歌声伴奏装置
JP3001353B2 (ja) 自動採譜装置
JP3279299B2 (ja) 楽音要素抽出装置及び方法並びに記憶媒体
JPH0566776A (ja) 自動伴奏装置
JP2000163072A (ja) 波形再生装置のピッチ制御装置
JP3243856B2 (ja) ピッチ抽出型電子楽器
JP2508035B2 (ja) 入力波形信号制御装置
JPH08123448A (ja) 音声信号の波形解析を用いた画像処理装置
JP2711523B2 (ja) コーラス効果装置
JPH0415958B2 (ja)
JPH09258758A (ja) カラオケ装置
JP3185266B2 (ja) 楽音発生装置
JP5659501B2 (ja) 電子音楽装置及びプログラム
JP3662112B2 (ja) 電子楽器

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041109

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20050111