JP3678838B2 - 音声認識によるリズム音発生装置 - Google Patents

音声認識によるリズム音発生装置 Download PDF

Info

Publication number
JP3678838B2
JP3678838B2 JP11711896A JP11711896A JP3678838B2 JP 3678838 B2 JP3678838 B2 JP 3678838B2 JP 11711896 A JP11711896 A JP 11711896A JP 11711896 A JP11711896 A JP 11711896A JP 3678838 B2 JP3678838 B2 JP 3678838B2
Authority
JP
Japan
Prior art keywords
rhythm
rhythm sound
signal
sound
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11711896A
Other languages
English (en)
Other versions
JPH09281968A (ja
Inventor
敦史 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Korg Inc
Original Assignee
Korg Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Korg Inc filed Critical Korg Inc
Priority to JP11711896A priority Critical patent/JP3678838B2/ja
Publication of JPH09281968A publication Critical patent/JPH09281968A/ja
Application granted granted Critical
Publication of JP3678838B2 publication Critical patent/JP3678838B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、楽器演奏時等において使用するリズム音源を音声認識により作成することのできるリズム音発生装置に関する。
【0002】
【従来の技術】
例えば、楽器演奏時等においては所定のリズム音を発生するためにリズムマシーンを使用する。通常、リズムマシーンは太鼓やシンバル等の各種打楽器から発せられるリズム音を電気的に発生させることができ、また、ボリュームつまみ等を調整することによりテンポを任意に設定することができるものである。このような従来から用いられているリズムマシーンにおいては、各種の設定方法によりバスドラム、バスタム、スネアドラム、タムタム、サイドシンバル、ハイハット等各種打楽器の音を所定のテンポで出力することができ、これにより楽器演奏時に各種音楽ジャンルに合ったリズム音を得ることができる。
【0003】
【発明が解決しようとする課題】
しかしながら、従来より使用されているリズムマシーンにおいては、各種の打楽器の出力タイミングやテンポ等を調整しながら好みに合ったリズムを設定する必要があるので、設定操作が面倒であり所望のリズムを得るまでに長時間を要してしまうこともあり、所望のリズム音を容易に設定することのできる装置が望まれていた。
この発明はこのような従来の課題を解決するためになされたものであり、その目的とするところは、音声認識により所望のリズム音を生成することのできるリズム音発生装置を提供することにある。
【0004】
【課題を解決するための手段】
上記目的を達成するため、本発明は、マイクロフォンから入力されるリズム音声を認識してリズム音信号を生成するリズム音発生装置であって、前記マイクロフォンから入力される音声信号をディジタル化するA/D変換手段と、ディジタル化された音声信号を記憶する音声信号記憶手段と、音声信号が所定のしきい値を越えた際に、この時点より所定時間戻した時点からの音声信号を前記音声信号記憶手段から抽出する音声信号抽出手段と、初期登録設定時には、抽出された音声信号と所望のリズム音信号とを対応させて登録する音声登録手段と、音声認識時には、抽出された音声信号と前記登録されたリズム音信号との一致、不一致を判定して、一致したリズム音信号を取り出す入力音声判定手段と、前記発声者が発声したリズムパターンのタイミングを認識して記憶するリズムパターン記憶手段と、リズム音再生時には、前記取り出されたリズム音を所定のテンポで出力するリズム音出力手段と、を有することが特徴である。
上述の如く構成された本発明によれば、音声により入力されるリズム音はマイクロフォンにより電気信号に変換され、ディジタル化された後音声信号記憶手段にて記憶される。この音声信号記憶手段は、例えばリングバッファーメモリ等により構成されるものであり、ある一定の時間記憶すると上書きにより古いデータが消去されるようになるものを使用することが好ましい。
【0005】
そして、音声を初期登録する際には、使用者がリズム音を発声するとこの音声波形から特徴部分が抽出され、音声登録手段に記憶される。更に、この音声に対応づけられる楽器音も記憶される。次いで、音声認識時には入力された音声信号から特徴部分が抽出され、登録されているパターンとの間で相互相関演算等によりパターンマッチングが行われ、高い相関係数の得られた登録波形に対応づけられた楽器音を出力する。次いで、使用者が所望のリズムパターンでリズム音を発声すると、リズムパターン記憶手段にてこのリズムパターン及び楽器音が記憶され、リズム音出力手段にて出力される。従って、好みに合ったリズム、楽器音からなるリズム音を容易に作成して出力することができるようになる。
【0006】
【発明の実施の形態】
以下、本発明の実施形態を図面に基づいて説明する。図1は、本発明が適用されたリズム音発生装置の構成を示すブロック図であり、このリズム音発生装置は、操作者が例えば「ドン」,「パン」等、打楽器に対応する音声をマイクロフォンに向かって発生すると、予め登録されているパターンに従って、実際の打楽器のリズム音を出力するものである。
図示のようにこのリズム音発生装置は、操作者の発生音を取り込んで電気信号に変換するマイクロフォン1と、この出力を増幅するアンプ2と、入力された音声信号の帯域を制限するバンドパスフィルタ3と、該バンドパスフィルタ3の出力信号をディジタル信号に変換するA/D変換器4と、ディジタル化された入力信号を上書き方式で所定時間前まで記憶する揮発性メモリ5と、入力信号に含まれる音声の特徴パターンを抽出する等の処理を行うディジタルシグナルプロセッサ(以下、DSPと略す)7と、抽出された特徴パターン及び該特徴パターンに対応づける楽器音を記憶する不揮発性メモリ6と、を有している。
【0007】
また、DSP7にて抽出された音声のパターンと一致した特徴パターンに対応づけられる楽器音を出力するリズム音発生部8と、この出力信号をアナログ化するD/A変換器9と、バンドパスフィルタ10と、アンプ11とを有している。更に、出力されるリズム音のテンポを調整するテンポ調整部13と、当該リズム音発生装置を総括的に制御するCPU12と、タイムベースカウンタ19と、音符メモリ20と、パネルLED設定部14と、パネルスイッチ設定部15と、MIDI(Musical Instrument Digital Interface)18と、シリアル/パラレル変換器16、パラレル/シリアル変換器17とを具備している。
【0008】
パネルLED設定部14は、後述するように、表示パネルに搭載される各LEDの表示を切り換える操作を行う。パネルスイッチ設定部15は、表示パネルに搭載される各種モードスイッチの切り換え操作に応じてそれぞれの機能を設定する。タイムベースカウンタ19は、一定の周期でカウントするカウンタ動作するものであり、音声信号で入力されるリズム音の出力タイミングを認識するものである。音符メモリ20は、入力された音声信号から認識されたリズム音を記憶するものである。
【0009】
図2は、DSP7の詳細な構成を機能的に示すブロック図であり、同図に示すように、入力されるディジタル信号から特徴を有する部分を抽出する特徴抽出部21と、抽出された信号と不揮発性メモリ6内に記憶されているパターンとの間で相互相関演算等の手法によりパターンマッチングを行う比較部22と、比較の結果一致しているかどうかを判定する判定部23と、から構成されている。
【0010】
図3は、本実施形態に係るリズム音発生装置の操作パネルの構成を示す説明図であり、同図に示すように、この操作パネルは8個の選択スイッチSW1〜SW8と、入力する音声を初期設定するモードを選択するための登録スイッチSW9と、入力する音声を認識するモードを選択するための音声認識スイッチSW10と、リズムパターンを音声により入力しこれを認識するモードを選択するためのリズムパターン音声入力スイッチSW11と、認識されたリズムパターンでリズム音を出力するモードを選択するリズム音出力スイッチSW12と、音声入力のスタート/ストップを入力するSSスイッチSW13と、の各種スイッチを有している。また、各スイッチSW1〜SW12に対応してそえぞれ動作状況を表示するLED1〜LED13が配置されている。
更に、マイクロフォン1の入力レベルを調整するためのマイクボリューム31と、出力レベルを調整するための出力ボリューム32と、テンポを設定するためのテンポボリューム33を有している。
【0011】
また、パネルの裏面側には、マイクロフォンのプラグを差し込むためのマイク端子34と、出力端子35と、フットスイッチを接続するためのフットスイッチコネクタ36と、が配設されている。
次に、上記の如く構成された本実施形態に係るリズム音発生装置の動作について説明する。人間により発声された音声の波形は、各個人で異なるものであるので、初期設定として使用者(発声者)の音声をマイクロフォン1にて入力し、この音声に各種楽器音を対応させる処理を行う。まず、図3に示した操作パネルの登録スイッチSW9を押すと、図1に示すパネルスイッチ設定部15により、登録モードに設定されたことがCPU12に通知され、パネルLED設定部15により登録スイッチSW9に対応するLED9(図3参照)が点灯する。そして、本実施形態では、8個の選択スイッチSW1〜SW8にて選択される8種のリズム音声を入力することができるようになっており、ここでは、例えばSW1を押してLED1を点灯させ、リズム音声の登録を行う。
【0012】
そして、使用者がマイクロフォン1に向かって、例えば、「ドン」と発生すると、該マイクロフォン1により音声信号が電気信号に変換され、アンプ2で増幅され、LPF3にて周波数帯域が制限された後、A/D変換器4にてディジタル化されてDSP7内部に供給される。DSP7は、図2に示すように特徴抽出部21を有しており、入力された音声の波形の特徴を抽出する。通常、音声は子音と母音とで構成され、このうち子音は音声波形の振幅が小さく母音は振幅が大きい。そして、音声の特徴はこの子音部分にあることが多いので、ここでは、音声波形の子音部分から特徴を抽出する。例えば、図4に示す如くの波形が与えられた場合、前半の振幅の小さい部分R1が子音の波形で、後半の振幅の大きい部分R2が母音の波形であり、特徴抽出部21では、子音から母音に切り替わる直前の所定時間帯tの子音部分を取り出してこれを登録する。
【0013】
子音と母音の区切りを決めるために、図4に示すように予め所定のしきい値thを設定しておき、入力音声の波形がこのしきい値thを越えた時点から所定時間tだけ戻した区間の波形を入力音声の特徴であるとして登録する。ここでは、上書き方式で記憶可能な揮発性メモリ5内に、入力されるリズム音声を逐次記憶し、特徴が抽出されると抽出された波形を不揮発性メモリ6内に記憶させて登録する。そして、更にこの入力音声に対応する楽器音(例えば、バスドラム等)を設定し、やはり不揮発性メモリ6内に登録する。これにより、例えば「ドン」というリズム音声に対して「バスドラム」の音が対応して登録される。
【0014】
次いで、図3に示す操作パネル上の選択スイッチSW2を押して、前記と同様にリズム音声と楽器音とを対応させて登録する。その結果、例えば「パン」というリズム音声には「スネアドラム」、「チャン」には「サイドシンバル」という具合に8種類のリズム音声に対してそれぞれ8種類の打楽器の音が対応して登録されることになる。
【0015】
登録モードが終了すると、今度は操作パネルの音声認識スイッチSW10を押して音声認識モードを選択する。そして、選択スイッチSW1を押して、マイクロフォン1に向かって「ドン」と発生すると、この発生音はDSP7内部に取り込まれ、比較部22にて既に登録されているリズム音声の特徴パターンとの比較を行う。前記したように、登録されているリズム音声は8種類であるので、入力されたリズム音声の特徴パターンと、登録されている各リズム音声の特徴パターンとの間の相関を演算し、高い相関係数の得られたものを選択し、これに対応付けられた楽器音を選定する。例えば、「ドン」というリズム音声に対して「バスドラム」が選定される。そして、楽器音が選定されると、リズム音発生部8にてバスドラムのリズム音信号が出力され、D/A変換器9、LPF10、アンプ11を介して実際のリズム音として外部に出力されるようになる。使用者は、これを聞いて初期設定登録が正しかったことを認識することができる。
【0016】
次いで、音声認識モードが終了すると、リズムパターン音声入力スイッチSW11をオンとすることにより、リズムパターンを音声で入力するモードに移る。このモードにおいても登録モードと同様に各選択スイッチSW1〜SW8により選択される8種のリズムパターンを設定することができる。いま、例えば、スイッチSW1をオンとすると、テンポ調整部9のテンポボリューム33にて設定されたテンポによりLED1が点滅する。そして、CPU12では一例として該LED1の点滅する周期の1/96の周期でタイムベースカウンタ19をカウントアップするように動作する。そして、スタート/ストップスイッチ(SSスイッチ)SW13を押すとこのタイムベースカウンタ19がリセットされてカウントを開始する。
【0017】
リズム音声が入力されると、これを構成する各音声の特徴パターンがDSP7の特徴抽出部21にて抽出され、比較部22にて登録された波形とのパターンマッチングが行われるので、タイムベースカウンタ19により得られる出力タイミングと、パターンマッチングにより得られる楽器音とにより、所望のリズムパターンが生成され、音符メモリ20内に記憶される。そして、このリズムパターンは、各選択スイッチSW1〜SW8毎、即ち8種類のリズムパターンを登録することができるようになる。
【0018】
そして、リズムパターンの登録が終了すると、操作パネルのリズム音出力スイッチSW12がオンとされ、リズム音の出力モードが選択される。選択スイッチSW1が選択されると、この選択スイッチSW1に対応して登録されたリズムパターンが音符メモリ20から読み出されてリズム音発声部8に供給されるので、所望のリズムパターンで所望の楽器音を出力することができ、更に、この出力はSSスイッチSW13により停止されるまで連続して繰り返されることになる。こうして所望のリズム音を得ることができるのである。
【0019】
このようにして、本実施形態においては、使用者による音声入力信号で所望のリズム音を得ることができるので、面倒な操作設定を必要とせず簡易な操作でリズム音の設定が可能となる。
また、マイクロフォン1にて入力される音声信号のレベルを検出し、この信号レベルの大きさに応じて出力側のリズム音の強弱(ベロシティ)を調整することも可能である。これは、図1に示すマイクロフォン1の出力側にレベル検出器(不図示)と配置し、これによる検出レベルに応じてリズム音発生部8における出力レベルを設定すれば良い。そして、このような構成によれば、使用者が入力する発声音の強弱をそのまま出力されるリズム音の強弱に反映させることができるようになり、より幅広いリズム音の生成が可能となる。
【0020】
【発明の効果】
以上説明したように、本発明のリズム音発生装置によれば、従来のように各種打楽器の選択やリズムパターンの選択等、面倒な作業をする必要はなく、使用者の発声による音声認識により、容易に所望の楽器音を所望のリズムパターンで出力することができるので、操作が簡単であり、好みのリズム音を簡易に得ることができるという効果が得られる。
【図面の簡単な説明】
【図1】 本発明が適用されたリズム音発生装置の一実施形態の構成を示すブロック図。
【図2】 DSP(ディジタルシグナルプロセッサ)の内部構成を示すブロック図。
【図3】 操作パネルの構成を示す説明図。
【図4】 入力音声の波形を示す説明図。
【符号の説明】
1 マイクロフォン
2 アンプ
3 バンドパスフィルタ
4 A/D変換器
5 揮発性メモリ(音声信号記憶手段)
6 不揮発性メモリ(音声登録手段)
7 DSP(ディジタルシグナルプロセッサ)
8 リズム音発生部(リズム音出力手段)
9 D/A変換器
10 バンドパスフィルタ(帯域制限フィルタ)
11 アンプ
12 CPU
13 テンポ調整部
14 パネルLED設定部
15 パネルスイッチ設定部
16 シリアル/パラレル変換器
17 パラレル/シリアル変換器
18 MIDI
19 タイムベースカウンタ
20 音符メモリ(リズムパターン記憶手段)
21 特徴抽出部(音声信号抽出手段)
22 比較部
23 判定部(入力音声判定手段)
31 マイクボリューム
32 出力ボリューム
33 テンポボリューム
34 マイク端子
35 出力端子
36 フットスイッチコネクタ
SW1〜SW8 選択スイッチ
SW9 登録スイッチ
SW10 音声認識スイッチ
SW11 リズムパターン音声入力スイッチ
SW12 リズム音出力スイッチ
SW13 スタート/ストップスイッチ

Claims (5)

  1. マイクロフォンから入力されるリズム音声を認識してリズム音信号を生成し出力するリズム音発生装置であって、
    予め発声者からの各種リズム音声を取り込み、入力された音声信号とこの音声信号に対応づける楽器音とを対応させて登録する音声登録手段と、
    前記発声者が発声したリズム音声を取り込み、前記登録された音声信号との一致、不一致を判定する入力音声判定手段と、
    前記発声者が発声したリズムパターンのタイミングを認識して記憶するリズムパターン記憶手段と、
    前記入力音声判定手段にて一致が判定された登録音声信号に対応するリズム音を、前記認識されたリズムパターンにて出力するリズム音出力手段と、
    を有することを特徴とする音声認識によるリズム音発生装置。
  2. マイクロフォンから入力されるリズム音声を認識してリズム音信号を生成するリズム音発生装置であって、
    前記マイクロフォンから入力される音声信号をディジタル化するA/D変換手段と、
    ディジタル化された音声信号を記憶する音声信号記憶手段と、
    音声信号が所定のしきい値を越えた際に、この時点より所定時間戻した時点からの音声信号を前記音声信号記憶手段から抽出する音声信号抽出手段と、
    初期登録設定時には、抽出された音声信号と所望のリズム音信号とを対応させて登録する音声登録手段と、
    音声認識時には、抽出された音声信号と前記登録されたリズム音信号との一致、不一致を判定して、一致したリズム音信号を取り出す入力音声判定手段と、
    前記発声者が発声したリズムパターンのタイミングを認識して記憶するリズムパターン記憶手段と、
    リズム音再生時には、前記取り出されたリズム音を所定のテンポで出力するリズム音出力手段と、
    を有することを特徴とする音声認識によるリズム音発生装置。
  3. 入力される音声信号のパワーを測定し、該パワーの大きさに応じて出力するリズム音の強弱を調整する出力調整手段を配置したことを特徴とする請求項1または請求項2のいづれかに記載の音声認識によるリズム音発生装置。
  4. 前記入力音声判定手段は、相互相関演算にてリズム音信号の一致、不一致を判定することを特徴とする請求項1または請求項2のいづれかに記載の音声認識によるリズム音発生装置。
  5. 前記A/D変換器の前段に帯域制限フィルターを設けたことを特徴とする請求項2に記載の音声認識によるリズム音発生装置。
JP11711896A 1996-04-16 1996-04-16 音声認識によるリズム音発生装置 Expired - Fee Related JP3678838B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11711896A JP3678838B2 (ja) 1996-04-16 1996-04-16 音声認識によるリズム音発生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11711896A JP3678838B2 (ja) 1996-04-16 1996-04-16 音声認識によるリズム音発生装置

Publications (2)

Publication Number Publication Date
JPH09281968A JPH09281968A (ja) 1997-10-31
JP3678838B2 true JP3678838B2 (ja) 2005-08-03

Family

ID=14703879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11711896A Expired - Fee Related JP3678838B2 (ja) 1996-04-16 1996-04-16 音声認識によるリズム音発生装置

Country Status (1)

Country Link
JP (1) JP3678838B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100511422C (zh) 2000-12-07 2009-07-08 索尼公司 内容检索方法和装置、通信系统和通信方法
JP4714479B2 (ja) * 2005-02-21 2011-06-29 セイコーインスツル株式会社 電子式メトロノームおよび電子式メトロノームのテンポ設定方法
CN102446504B (zh) * 2010-10-08 2013-10-09 华为技术有限公司 语音/音乐识别方法及装置

Also Published As

Publication number Publication date
JPH09281968A (ja) 1997-10-31

Similar Documents

Publication Publication Date Title
US10777180B2 (en) Apparatus for a reed instrument
US10832645B2 (en) Transducer apparatus for a labrosone and a labrosone having the transducer apparatus
US9418642B2 (en) Vocal processing with accompaniment music input
US6798886B1 (en) Method of signal shredding
CN101983403B (zh) 演奏相关信息输出装置、具有演奏相关信息输出装置的系统、以及电子乐器
US7851688B2 (en) Portable sound processing device
US8134062B2 (en) Apparatus and method for generating music using bio-signal
JP3678838B2 (ja) 音声認識によるリズム音発生装置
CN107871492B (zh) 音乐合成方法和系统
Marolt et al. On detecting note onsets in piano music
Marolt Networks of adaptive oscillators for partial tracking and transcription of music recordings
JP2005091485A (ja) チューニング支援装置
Choi Auditory virtual environment with dynamic room characteristics for music performances
WO2024115024A1 (en) System and method for representing sounds of a wind instrument
CN118197263A (zh) 声音合成方法、装置、终端设备以及存储介质
JPS58123591A (ja) 電子楽器
CN116320854A (zh) 音高调整方法、装置和麦克风设备
JPH02105198A (ja) 電子楽器
JPS58220191A (ja) 歌唱装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050420

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050511

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090520

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100520

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110520

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110520

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120520

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees