WO2019082321A1

WO2019082321A1 - テンポ設定装置及びその制御方法、プログラム

Info

Publication number: WO2019082321A1
Application number: PCT/JP2017/038593
Authority: WO
Inventors: 松本　秀一
Original assignee: ヤマハ株式会社
Priority date: 2017-10-25
Filing date: 2017-10-25
Publication date: 2019-05-02
Also published as: JPWO2019082321A1; US11526134B2; JP6891969B2; JP2021144238A; US20200249633A1

Abstract

発話によりテンポを設定することができるテンポ設定装置及びその制御方法、プログラムを提供する。音声認識部３２は、音声を認識して検知対象の発話を検知する。コントローラ３１は、検知対象の発話が２回以上続けて検知されたことに応じて、検知された発話の検知間隔に基づいてテンポを決定し、決定されたテンポを設定する。

Description

テンポ設定装置及びその制御方法、プログラム

　本発明は、テンポを設定するテンポ設定装置及びその制御方法、プログラムに関する。

　電子式のメトロノームは、操作子を用いてユーザが拍子とテンポを直接設定する構成が一般的である。また、操作子の操作で発生するクリック信号の時間間隔を計測し、それに対応する時間情報を順に記録し、記録した時間情報に応じて、クリック信号の時間間隔よりも短い同期信号を発生させる同期信号発生装置が知られている（下記特許文献１）。さらに、本体を叩いた衝撃の振動を検出した信号の周期から、メトロノームの発音速度を決定する電子メトノロームも知られている。

特許第１５３２１７８号公報特開２００１－１４１８５２号公報

　しかしながら、上記従来技術によれば、テンポを設定するために、ユーザは手や指等を用いて何らかの操作行為を行う必要がある。そのため、例えば合奏において、リーダーが演奏曲の変更のためにテンポ設定を変更したい場合、いちいちテンポ発生装置に近づいて操作する必要があり、面倒である。

　本発明の目的は、発話によりテンポを設定することができるテンポ設定装置及びその制御方法、プログラムを提供することである。

　上記目的を達成するために本発明によれば、所定の発話を検知対象とし、音声を認識して前記検知対象の発話を検知する検知部と、前記検知部により前記検知対象の発話が２回以上続けて検知されたことに応じて、前記検知された発話の検知間隔に基づいてテンポを決定するテンポ決定部と、前記テンポ決定部により決定されたテンポを設定する設定部と、を有するテンポ設定装置が提供される。

　上記目的を達成するために本発明によれば、テンポ設定装置の制御方法であって、所定の発話を検知対象とし、音声を認識して前記検知対象の発話を検知する検知ステップと、前記検知ステップにより前記検知対象の発話が２回以上続けて検知されたことに応じて、前記検知された発話の検知間隔に基づいてテンポを決定するテンポ決定ステップと、前記テンポ決定ステップにより決定されたテンポを設定する設定ステップと、を有するテンポ設定装置の制御方法が提供される。

　上記目的を達成するために本発明によれば、テンポ設定装置の制御方法をコンピュータに実行させるプログラムであって、前記制御方法は、所定の発話を検知対象とし、音声を認識して前記検知対象の発話を検知する検知ステップと、前記検知ステップにより前記検知対象の発話が２回以上続けて検知されたことに応じて、前記検知された発話の検知間隔に基づいてテンポを決定するテンポ決定ステップと、前記テンポ決定ステップにより決定されたテンポを設定する設定ステップと、を有するプログラムが提供される。

　本発明によれば、発話によりテンポを設定することができる。

テンポ設定装置を含むテンポ設定システムの全体構成を示す図である。メトロノームのブロック図である。テンポ設定のための主要部のブロック図である。テンポ設定動作例のタイミングチャートである。テンポ修正動作例のタイミングチャートである。モード１におけるテンポ設定動作例のタイミングチャートである。モード２におけるテンポ設定動作例のタイミングチャートである。モード３におけるテンポ設定動作例のタイミングチャートである。モード４におけるテンポ設定動作例のタイミングチャートである。モード５におけるテンポ設定動作例のタイミングチャートである。モード６におけるテンポ設定動作例のタイミングチャートである。メトロノーム処理のフローチャートである。

　以下、図面を参照して本発明の実施の形態を説明する。

　図１は、本発明の一実施の形態に係るテンポ設定装置を含むテンポ設定システムの全体構成を示す図である。本発明のテンポ設定装置は一例として、メトロノーム３０として構成される。メトロノーム３０は、外観が機械式メトロノームであるが、発音機能のほか、表示部１８による表示機能を有する。メトロノーム３０は、メトロノームパターン（拍子及びテンポ）を振り子３４の動作で提示できるほか、表示または音声でも提示する機能を有する。なお、ＰＣやスマートフォン等の情報端末装置４０とメトロノーム３０とを無線または有線で通信可能に接続し、メトロノーム３０に対して情報端末装置４０でメトロノームパターンの設定を行えるシステムとしてもよい。あるいは、伴奏音等を再生するシーケンサ３９とメトロノーム３０とを無線または有線で通信可能に接続し、シーケンサ３９に対して情報端末装置４０で拍子やテンポを設定できるシステムとしてもよい。情報端末装置４０に本発明を適用する場合に情報端末装置４０と接続される装置は、少なくともテンポを音声や表示や可視動作等により提示する機能を有すればよい。以降、本発明を主としてメトロノーム３０単体で実現した例を説明する。

　図２は、メトロノーム３０のブロック図である。メトロノーム３０は、ＣＰＵ（Central Processing Unit）１０と、タイマ１１と、ＲＯＭ（Read Only Memory）１２と、ＲＡＭ（Random Access Memory）１３と、記憶部１４と、設定操作子１７と、表示部１８と、音源１９と、効果回路２０と、サウンドシステム２１と、通信Ｉ／Ｆ（Interface）１６と、駆動部３５と、マイク３６と、バス２２と、を備える。ＣＰＵ１０は、メトロノーム３０全体の制御を行う中央処理装置である。タイマ１１は、時間を計測するモジュールである。ＲＯＭ１２は制御プログラムや各種のデータなどを格納する不揮発性のメモリである。ＲＡＭ１３はＣＰＵ１０のワーク領域及び各種のバッファなどとして使用される揮発性のメモリである。表示部１８は、液晶ディスプレイパネルなどで構成され、メトロノーム３０の動作状態、各種設定画面、ユーザに対するメッセージなどを表示する。

　設定操作子１７は、例えば、拍子やテンポを手動で設定するための操作ボタンや操作つまみなどの操作モジュールである。外部記憶装置１５は、例えば、メトロノーム３０に接続される外部機器であり、例えば、音声データを記憶する装置である。通信Ｉ／Ｆ１６は、外部機器と無線または有線で通信するための通信モジュールである。通信Ｉ／Ｆ１６には、ＭＩＤＩ（Musical Instrument Digital Interface）インターフェイスが含まれる。バス２２はメトロノーム３０における各部の間のデータ転送を行う。マイク３６は周囲の音声を取得する。

　音源１９は、記憶部１４やＲＡＭ１３に記憶されたメトロノームパターンに基づいて、ＣＰＵ１０の制御の基で、メトロノーム音等の発音用データを生成する。効果回路２０は、音源１９が生成した発音用データに対して、設定操作子１７により指定された音響効果を適用する。サウンドシステム２１は、効果回路２０による処理後のデータを、デジタル／アナログ変換器によりアナログ信号に変換する。そして、サウンドシステム２１は、アナログ信号を増幅してスピーカなどから出力する。表示部１８は、メトロノームパターンに基づいて、ＣＰＵ１０の制御の基で、拍子やテンポを提示するために表示を行う。駆動部３５は、メトロノームパターンに基づいて、ＣＰＵ１０の制御の基で、振り子３４を揺動駆動する。

　次に、ユーザの発話からテンポを設定する方法について説明する。図３は、テンポ設定のための主要部のブロック図である。この主要部は、音声認識部３２、音声コントローラ３１及び発音部３３を有する。音声認識部３２の機能は、主としてマイク３６、ＲＯＭ１２、ＲＡＭ１３及びＣＰＵ１０の協働により実現される。音声コントローラ３１の機能は、主として記憶部１４、ＲＯＭ１２、タイマ１１、ＲＡＭ１３及びＣＰＵ１０の協働により実現される。発音部３３の機能は、主としてＲＯＭ１２、ＲＡＭ１３、記憶部１４、音源１９、効果回路２０、サウンドシステム２１及びＣＰＵ１０の協働により実現される。

　テンポ設定モードにおいて、音声認識部３２は、ユーザ、例えば合奏におけるリーダーの声を公知の手法により認識し、認識した音声から拍の設定に関する発話だけを抽出し、音声コントローラ３１に送る。ここでいう発話とは、「ア」、「トン」や「いち」等、少なくとも１つの音節から成るものであり、言葉としての意味を有する必要はない。音声コントローラ３１は、発話に基づきメトロノームパターンとして拍子及びテンポ（ないし拍間隔）を設定する。その詳細は図５以降で後述する。音声コントローラ３１は、設定した拍子及びテンポに基づき、それらを提示するためのノートオンの情報を生成する。その際、強拍と弱拍とで音量に強弱を付け、さらには音色を異ならせてもよい。そして音声コントローラ３１は、発音部３３に対してメトロノームパターンに基づく発音を指示し、発音部３３がメトロノーム音を発音する。

　次に、図４で、テンポ設定モードの動作例を概説する。図４Ａは、テンポ設定動作例のタイミングチャートである。図４Ｂは、テンポ修正動作例のタイミングチャートである。メトロノーム３０は、例えば設定操作子１７の操作によりテンポ設定モードの動作を開始し、発話の検知が可能なスタンバイ状態となる。

　テンポ設定動作例（図４Ａ）では、リーダーは、メトロノーム３０をテンポ設定モードに設定し、練習開始と曲のリズム等を事前に合奏者に伝えてから、マイク３６に届くように、所定の発話として数字の１、２を示す「いち」、「に」を発声する。２巡目までの「いち」、「に」の発声に追従して、音声コントローラ３１（以下、コントローラ３１と略記することもある）は所定のメトロノーム音（Ｐｉ、Ｐｏ）を発音させる。コントローラ３１は、「いち」、「に」の繰り返しにより４分の２拍子であると決定すると共に、「いち」、「に」の発声タイミングに応じて拍間隔及び拍タイミングを決定する。拍子及び拍間隔（またはテンポ）がメトロノームパターンとなる。そしてコントローラ３１は、２巡目の「に」の発声時点またはそれより拍間隔だけ後の時点から、決定後のメトロノームパターンに従ってメトロノーム音を発音させる。すなわち、２拍子のメトロノーム音（Ｐｉ、Ｐｏ）が連続して発音される。合奏者は、メトロノームパターンの決定以降の先頭拍のタイミングから合奏を開始することができる。なお、メトロノームパターンの決定前に必ずしもメトロノーム音を追従して発音させる必要はない。すなわち、図４Ａの例では、メトロノームパターンが決定される前段階からメトロノーム音（Ｐｉ、Ｐｏ）が発生されるとしているが、これらのメトロノーム音の発音は、メトロノームパターンが決定された後に開始されるようにしてもよい。

　なお、予め、１つの拍の音価を、４分の１、または２分の１、のように指定しておき、決定され得る拍子を限定することで、例えば、２分の２拍子と４分の２拍子とが区別されるようにしてもよい。なお、テンポが遅くなる等の場合には特に、裏打ち（１／２拍等）を所定の音で提示するようにしてもよい。

　２拍子のメトロノーム音（Ｐｉ、Ｐｏ）が連続して発音されている最中に、テンポ等を変更したい場合は、リーダーは改めて発声する。例えば、図４Ｂに示すように、リーダーが再び「いち」、「に」と発声したとする。すると、コントローラ３１は、それまで決定されていたメトロノームパターンに従った発音を停止し、代わりに、新たな発声に追従する発音をする。そしてコントローラ３１は、新たな発声に基づきメトロノームパターンを設定し直し、新たに決定したメトロノームパターンに従ってメトロノーム音を発音させる。これにより、テンポを途中変更できる。なお、発声する発話を変えて、拍子を変更することも可能である。

　次に、各種のテンポ設定モードに応じたメトロノームパターンの設定態様を図５、図６で説明する。テンポ設定モードには複数種類が有り、そのうちモード１～モード６を例示する。テンポ設定モードの種類は、ユーザが設定操作子１７で設定できる。検知部としての音声認識部３２が、音声を認識して検知の対象とする発話の種類（所定の発話）は限定されている。音声認識部３２は検知対象の発話を検知（抽出）し、検知対象でない発話を無視（削除）する。コントローラ３１は、検知対象の発話が２回以上続けて検知されたことに応じて、検知された発話の検知間隔に基づいてテンポを決定すると共に（テンポ決定部）、決定されたテンポを設定する（設定部）。

　検知対象の発話は、例えば、「いち、に、さん、よん」や「ワン、ツー、スリー」のように数値と対応するものでもよいし、数字と無関係な「トン」、「タン」等であってもよい。また、検知対象の発話に組み合わせを設定してもよい。例えば、「いち、に、さん」を１つの組とし、「ワン、ツー、スリー、フォー」を別の１つの組としてもよい。検知対象を組み合わせで用いることが指定されている場合は、検知対象の組み合わせ内の発話を検知対象としてもよい。検知対象の発話や検知対象の組み合わせは、予め定めた固定のものでもよいが、ユーザの指示に基づき任意に設定されるようにしてもよい。検知対象を示す情報は記憶部１４に記憶され、必要に応じてＲＡＭ１３にも記憶される。

　図５Ａ、Ｂは、モード１、２におけるテンポ設定動作例のタイミングチャートである。図６Ａ、Ｂ、Ｃ、Ｄは、モード３、４、５、６におけるテンポ設定動作例のタイミングチャートである。

　まず、モード１（図５Ａ）では、検知対象の発話は、「トン」の１つだけとする。モード１の動作開始直後のスタンバイ状態では、コントローラ３１は、拍子もテンポも決定していない。音声認識部３２により検知対象である「トン」が検知されると、音声認識部３２は、それ以降の「トン」の検知を待つ。そして、「トン」が続けて２回以上検知されるとコントローラ３１は拍子及びテンポを決定することが可能となる。すなわち、検知対象の発話が続けて検知された回数に基づいて拍子が決定される。例えば、コントローラ３１は、連続する最後の「トン」から時間Ｔｘが経過しても次の「トン」が検知されないと、それまでの連続回数から拍子を決定する。図５Ａの例では、「トン」が３連続し、その後、時間Ｔｘが経過したので、矢印で示す時点で、拍子（４分の３拍子）とテンポと拍タイミングとが決定される。

　時間Ｔｘは、２つ目以降の「トン」が検知される度に算出される。例えば、３つ目の「トン」から経過を待つ場合の時間Ｔｘは、Ｔｘ＝｛（ｔ１＋ｔ２）／２｝＋αにより算出される（αは正の値）。時間Ｔｘは、（ｔ１＋ｔ２）／２より少し長く、（ｔ１＋ｔ２）より短い時間であるとする。なお、２つ目の「トン」から経過を待つ場合の時間Ｔｘは、Ｔｘ＝ｔ１＋αにより算出される。テンポは、６０秒／拍間隔ＴＰ（秒）により算出される。ここで拍間隔ＴＰは、一例として各発話（「トン」）の発声間隔の平均であり、ＴＰ＝（ｔ１＋ｔ２）／２により算出される。拍タイミングは、例えば、３連続した「トン」のタイミングと同期するタイミングに決定される。

　このようにしてメトロノームパターンが確定すると、コントローラ３１は、発音部３３によりメトロノームパターンを音で提示する「提示発音」を実施する。なお、拍タイミングを３連続した「トン」のタイミングと同期させることは必須でない。例えば、テンポ決定後の所定の発話（「スタート」等）によって、「スタート」を１拍目として提示発音が開始されるようにしてもよい。

　図５、図６の各図において、○印（白丸）は、メトロノームパターンが決定された後の「提示発音」のタイミングと強さを示す。大きい○（白丸）が強拍、小さい○（白丸）が弱拍を示す。図５Ａの例では３拍子と決定されたので、１小節に弱拍が２つである。なお、提示発音の態様（音色等）は予め定めたとしてもよく、強拍と弱拍とで異ならせてもよい。また、提示発音の音色を拍子やテンポに応じて決定してもよい。図５Ａの例では、３連続した「トン」の後、強拍の前に、２拍目と３拍目の弱拍も、決定したメトロノームパターン通りに発音されている。従って、テンポ決定後の最初の１拍目（強拍）のタイミングから合奏が可能となる。なお、テンポ決定後であれば、いずれの１拍目（強拍）のタイミングを合奏開始タイミングとしてもよい。なお、テンポ決定後の最初の１拍目より前の弱拍の発音は必須でない。また、図４Ａで示したような、テンポ決定前の、「トン」の発声に追従する発音を設けてもよいが、必須でない。図５Ａでは３拍子と決定されたが、例えば、「トン」が４連続し、その後、時間Ｔｘが経過したならば、拍子は４分の４拍子と決定される。なお、図５Ａ、図５Ｂの例では、３拍子のうちの２拍目から提示発音が開始される（弱弱強）ことを示している。しかし提示発音が、先頭拍から開始されたり（強弱弱）、２拍目以外の拍から開始されたり（弱強弱弱）するようにしてもよい。

　図５Ａの例では、検知対象の発話を「トン」の１つだけとしたので、例えば、検知対象でない「ハイ」「ハイ」「ハイ」ではコントローラ３１は反応せず、テンポ設定を行わない。なお、検知対象の発話を複数種類とし、そのうちどれがどの順番で発声されても、「トン」の場合と同様に扱うようにしてもよい。例えば、検知対象が「トン」「ヘイ」「ホー」であるとし、「ヘイ」「ヘイ」「ホー」の３連続によって３拍子と決定されてもよい。また、「ヘイ」「トン」「トン」「ホー」の４連続によって４拍子と決定されてもよい。

　モード２（図５Ｂ）では、検知対象の発話はモード１と同様に「トン」とし、指示停止用の発話を「ストップ」とする。コントローラ３１は、「トン」が２以上検知されると、その後の「ストップ」の検知を待つ。図５Ｂの例では、３連続した最後の「トン」の後、「ストップ」が検知された矢印で示す時点で、拍子（４分の３拍子）とテンポと拍タイミングとが決定される。拍間隔ＴＰは、モード１の場合と同様に決定される。メトロノームパターンが決定された後の「提示発音」の態様はモード１と同様である。リーダーは、「ストップ」を最後の「トン」の直後（ｔ１より十分に短い時間の後）に発声してもよい。拍タイミングは、モード１と同様に決定され、例えば３連続した「トン」のタイミングと同期するタイミングに決定される。なお、コントローラ３１は、「ストップ」の発声が遅れ、ｔ１やｔ２よりも十分に長い時間経過の後に検知された場合は、「ストップ」の発声タイミングに基づいて拍タイミングを決定してもよい。例えば、「ストップ」のタイミングに同期させて１拍目のタイミングを決定してもよい。

　なお、指示停止用の発話は「ストップ」に限らず、他の種類、例えば「ハイ」でもよい。また、指示停止用の発話も複数種類設定し、それらのうちどれが検知されても有効と扱ってもよい。なお、モード２をモード１と組み合わせてもよい。例えば、最後の「トン」から時間Ｔｘが経過する前に指示停止用の発話が検知されるとモード２の処理を適用し、最後の「トン」から、指示停止用の発話がないまま時間Ｔｘが経過するとモード１で説明した処理を適用するようにしてもよい。

　モード３（図６Ａ）では、検知対象の発話は、数字の１～８を示す、「いち」「に」「さん」「よん」「ご」「ろく」「なな」「はち」であるとする。そして検知対象の発話の所定の組み合わせが、第１拍から所定拍（例えば、８拍）までの各拍を示す発話から成るとする。この組み合わせとして次の第１組～第７組が定められているとする。第１組＝「いち」「に」、第２組＝「いち」「に」「さん」、第３組＝「いち」「に」「さん」「よん」・・・第７組＝「いち」「に」・・・「はち」。各組において、発話の順番が予め定められているとし、「いち」は先頭の発話に該当する。組に属する検知対象の発話の数は２以上であればよく、８個に限らない。

　コントローラ３１は、先頭の発話を示す「いち」が検知されると、その後の検知対象の発話の検知を待つ。この時点で、上記７組のうちどの組が該当しているかは確定していない。そしてコントローラ３１は、「いち」「に」「さん」の後、時間Ｔｘが経過しても順番が後続する「よん」が検知されないと、それまでの連続回数（あるいは、最後の発話）から拍子を決定する。図６Ａの例では、「さん」の後、時間Ｔｘが経過したので、矢印で示す時点で、拍子（４分の３拍子）とテンポと拍タイミングとが決定される。拍間隔ＴＰや拍タイミングは、モード１の場合と同様に決定される。メトロノームパターンが決定された後の「提示発音」の態様はモード１と同様である。この例では、最後の発話が「さん」であるので３拍子であることがわかる。なお、最後の発話が「よん」であったなら４拍子となる。このように、所定の組み合わせに該当する発話が予め定められた順番通りに検知されたことに応じて、テンポ及び拍子が決定される。なお、発話の組み合わせには、ユーザにとっては必ずしも数値を連想しない発話から成るものも含まれる。例えば、２発話から成る「セー」「ノー」を組み合わせとし、「セー」を先頭の発話に設定すれば、「いち」「に」と同様に扱うこともできる。その他、モード１で説明した変形例を適宜適用できる。

　なお、モード３において、発話の組み合わせとして「いち、に、さん、よん」に限らず、「ワン、ツー、スリー」等を検知対象としてもよいし、これら双方を検知対象の組み合わせとしてもよい。従って、検知対象の発話の複数の組み合わせのうち、先頭の発話が異なるものが混在してもよい。例えば、ある組においては「いち」が先頭であるが、他の組においては、「ワン」が先頭であるとする。そして、コントローラ３１は、検知対象の発話のうち、いずれかの組み合わせにおける先頭に該当する発話が検知されたら、その発話が属する組み合わせの２番目以降の発話の検知を待ち、発話が順番に検知されればテンポ等を決定する。

　モード４（図６Ｂ）では、検知対象の発話や組み合わせはモード３と同様とし、指示停止用の発話を「ストップ」とする。コントローラ３１は、先頭の発話を示す「いち」が検知されると、その後の検知対象の発話の検知を待つ。この時点で、上記７組のうちどの組が該当しているかは確定していない。そしてコントローラ３１は、「いち」「に」「さん」の後、「ストップ」が検知された矢印で示す時点で、拍子（４分の３拍子）とテンポと拍タイミングとが決定される。拍間隔ＴＰや拍タイミングは、モード１の場合と同様に決定される。メトロノームパターンが決定された後の「提示発音」の態様はモード１と同様である。その他、モード２で説明した変形例を適宜適用できる。

　モード５（図６Ｃ）では、検知対象の発話や組み合わせはモード３と同様とする。モード５では、コントローラ３１は、組み合わせに属する発話のうち先頭に該当する発話が再び検知されるのを待ってテンポ等を決定する。図６Ｃに示すように、「いち」「に」「さん」の連続発話の後、先頭の「いち」が再び発話されたとする。するとコントローラ３１は、その直前の発話である「さん」の発話順から、矢印で示す時点で、拍子（４分の３拍子）とテンポと拍タイミングとを決定する。すなわち、第１拍を示す発話（いち）から始まって順番通りに各拍の発話が検知された後、第１拍を示す発話（いち）が再び検知されると、第１拍を示す発話が再び検知される前の拍を示す発話（さん）に基づいて拍子が決定される。拍間隔ＴＰは、一例として各発話の発声間隔の平均であり、ＴＰ＝（ｔ１＋ｔ２＋ｔ３）／３により算出される。この例では、２回目の「いち」の直前の発話が「さん」であるので３拍子であることがわかる。なお、２回目の「いち」の直前の発話が「よん」であったなら４拍子となる。拍タイミングは、モード１の場合と同様に決定される。メトロノームパターンが決定された後の「提示発音」の態様はモード１と同様である。

　モード６（図６Ｄ）では、スタンバイ状態において拍子が設定されているとする。拍子はユーザが設定操作子１７で設定できる。検知対象の発話や組み合わせはモード３と同様とする。図６Ｄの例では、事前に４分の３拍子と設定されているとする。従って、最後尾の発話は「さん」である。図６Ｄに示すように、予め定められた順番で「いち」「に」「さん」と最後尾まで連続発話されたとする。するとコントローラ３１は、最後の「さん」が発話された矢印で示す時点で、テンポと拍タイミングとを決定する。拍間隔ＴＰや拍タイミングは、モード１の場合と同様に決定される。メトロノームパターンが決定された後の「提示発音」の態様はモード１と同様である。なお、例えば、２発話から成る「セー」「ノー」を組み合わせとし、拍子の設定を２拍子とし、「セー」に続いて「ノー」が発話されるとテンポ及び拍タイミングが決定されるようにしてもよい。その場合、「セー」と「ノー」との時間間隔によって拍間隔ＴＰが決まる。

　ところで、図示はしないが、モード１～６以外にも、所定の組み合わせに該当する発話の検知順が周期性を示す場合に、発話の検知間隔に基づいてテンポを決定する周期性モードを設けてもよい。例えばコントローラ３１は、検知対象の発話の同じ繰り返しが２セット以上続いた場合に周期性有りと判定する。あるいは、コントローラ３１は、「特定の発話の後、所定回数の他の発話がされる」というパターンが２回以上続いた場合に、周期性有りと判定する。このほか、連続した発話に対し、予め定めた各種のルールと照合して繰り返し性を解析し、周期性を判定してもよい。

　一例として、周期性モードをモード５（図６Ｃ）に当てはめて考える。検知対象の組み合わせに属する発話のうち、先頭の発話だけを決めておき、その他の発話の順番を問わない構成としてもよい。例えば、先頭の発話を「トン」とし、その他の発話を「ヘイ」、「ホー」とする。コントローラ３１は、「トン」の後、「トン」以外の検知対象の発話が順不同で検知され、その後、２回目の「トン」が検知されたとする。するとコントローラ３１は、２回目の「トン」が再び検知される前までの発話回数に基づいて拍子を決定する。このほか、後尾の発話だけ決めておいてもよい。その場合、コントローラ３１は、検知対象の発話が順不同で検知された後、後尾の発話が検知されると、後尾の発話までの発話回数に基づいて拍子を決定する。なお、先頭の発話と後尾の発話の双方を決めておき、先頭の発話の後、検知対象の発話が順不同で検知された後、後尾の発話が検知されると、後尾の発話までの発話回数に基づいて拍子を決定するようにしてもよい。

　ところで、図４Ｂで示したようなテンポ修正は、各テンポ設定モードに適用可能である。テンポ修正の実施は、一旦、テンポが設定されていることが前提となる。コントローラ３１は、検知対象の発話が新たに２回以上続けて検知されたことに応じて、新たに検知された発話の検知間隔に基づいてテンポを修正する。例えば、モード１（図５Ａ）で、提示発音の実施中に「トン」が新たに検知されると、コントローラ３１は、それまで設定されていたメトロノームパターンに基づく提示発音を一旦停止すると共に、スタンバイ状態で「トン」が検知されたときと同じ動作に移行する。また、所定の組み合わせに該当する発話が予め定められた順番通りに新たに検知されると、コントローラ３１は、検知された発話の検知間隔に基づいてテンポを修正する。例えば、モード５（図６Ｃ）で、提示発音の実施中に「いち」が新たに検知されると、コントローラ３１は、それまで設定されていたメトロノームパターンに基づく提示発音を一旦停止すると共に、スタンバイ状態で「いち」が検知されたときと同じ動作に移行する。なお、周期性モードにおいては、コントローラ３１は、所定の組み合わせに該当する発話の周期性を示す検知順が新たに検知されると、新たに検知された発話の検知間隔に基づいてテンポを修正する。

　次に、これまで説明したテンポ設定モードの動作を実現する処理を図７で説明する。図７は、メトロノーム処理のフローチャートである。この処理は、ＲＯＭ１２に格納されているプログラムをＣＰＵ１０がＲＯＭ１２に読み出して実行することにより実現される。この処理は、テンポ設定モードの動作開始が指示されると開始される。

　まず、ＣＰＵ１０は、初期設定を実行する（ステップＳ１０１）。この初期設定では、テンポ設定モードの種類の設定、検知対象の発話の設定、組み合わせの設定、音色設定のほか、必要に応じて組み合わせにおける発話の順番の設定や、モード６の場合の拍子の設定等が行われる。次に、ＣＰＵ１０は、検知対象の発話が検知されたか否かを判別し（ステップＳ１０２）、検知対象の発話が検知された場合は、その検知タイミングを取得する（ステップＳ１０６）。そしてＣＰＵ１０は、ＲＡＭ１３に記憶される判定バッファをクリアする（ステップＳ１０７）。判定バッファは、検知された発話を記録するためのレジスタである。

　次にＣＰＵ１０は、今回検知された発話をテキスト化し（ステップＳ１０８）、提示発音を終了すべきか否かを判別する（ステップＳ１０９）。ここで、リーダーによる所定の終了指示を示す発話（例えば、おわり、エンド等）が検知されると、提示発音を終了すべきと判別される。あるいは、設定操作子１７による所定の操作により終了指示がなされるようにしてもよい。そしてＣＰＵ１０は、提示発音を終了すべきと判別した場合は、図７の処理を終了させる。一方、提示発音を終了すべきでない場合は、ＣＰＵ１０は、今回検知されテキスト化された発話とその検知タイミングを示す情報とを判定バッファに追加記憶させる（ステップＳ１１０）。

　次にＣＰＵ１０は、判定バッファに記憶された発話が２以上であるか否かを判別する（ステップＳ１１１）。判定バッファに記憶された発話が２未満である場合は、ＣＰＵ１０は、その他処理を実行する（ステップＳ１１２）。この「その他処理」においては、ＣＰＵ１０は、例えば、今回の発話に追従する発音等の処理を実行する。次に、ＣＰＵ１０は、改めて、検知対象の発話が検知されたか否かの判別を継続する（ステップＳ１１３）。そしてＣＰＵ１０は、検知対象の発話が検知されると、その他処理を実行し（ステップＳ１１４）、処理をステップＳ１０８に戻す。この「その他処理」においても、ＣＰＵ１０は、例えば、改めて検知された発話に追従する発音等の処理を実行する。

　ステップＳ１１１での判別の結果、判定バッファに記憶された発話が２以上である場合は、ＣＰＵ１０は、記憶された２以上の発話からテンポを決定可能か否かを判別する（ステップＳ１１５）。ここでは、図５、図６で説明した各モードのルールに従って、テンポが決定可能かどうかが判別される。モード１（図５Ａ）を例にとると、連続した「トン」の最後（３つ目）の発話の後、時間Ｔｘが経過したことで、テンポが決定可能と判別される。なお、ここで、周期性モードの場合は、連続した発話に対する周期性有りが検知されると、テンポが決定可能と判別される。

　そして、ＣＰＵ１０は、テンポを決定可能でない場合（モード１では「トン」の検知後、時間Ｔｘの経過前）は、処理をステップＳ１１２に進める一方、テンポを決定可能である場合は、処理をステップＳ１１６に進める。ステップＳ１１６では、ＣＰＵ１０は、モード応じてメトロノームパターンを決定する。例えば、ＣＰＵ１０は、モード１～５では、拍子とテンポと拍タイミングとを決定し、モード６ではテンポと拍タイミングとを決定する。決定されたメトロノームパターンはＲＡＭ１３に記憶される。その後、処理はステップＳ１０３に戻る。

　ステップＳ１０２での判別の結果、検知対象の発話が検知されない場合は、メトロノーム音の発生タイミングとなったか否かを判別する。ここで、メトロノームパターンが既に設定されていて、それに応じた発音をすべきタイミングとなると、メトロノーム音の発生タイミングであると判別される。そしてＣＰＵ１０は、メトロノーム音の発生タイミングでない場合は、処理をステップＳ１０２に戻す。一方、ＣＰＵ１０は、メトロノーム音の発生タイミングである場合は、発音の種別（例えば、強拍用か弱拍用か）を取得し（ステップＳ１０４）、発音の種別に従ってメトロノーム音を発音して（ステップＳ１０５）、処理をステップＳ１０２に戻す。２巡目以降のステップＳ１０２で検知対象の発話が検知されると、テンポや拍子が再設定（修正）される。

　本実施の形態によれば、検知対象の発話が２回以上続けて検知されたことに応じて、発話の検知間隔に基づいてテンポが決定され、設定されたメトロノームパターンが提示される。例えば、所定の組み合わせに該当する発話が予め定められた順番通りに検知されたことに応じてテンポが決定される。あるいは、所定の組み合わせに該当する発話の検知順が周期性を示す場合にテンポが決定される。よって、発話によりテンポを設定することができ、操作子の煩雑な操作を要しない。

　また、所定の組み合わせに該当する発話が予め定められた順番通りに検知されたことに応じて拍子が決定される。あるいは、検知対象の発話が続けて検知された回数に基づいて拍子が決定される。あるいは、第１拍を示す発話が再び検知されると、その前の拍を示す発話に基づいて拍子が決定される。これにより、発話により拍子を設定することができ、操作子の煩雑な操作を要しない。

　また、テンポ設定後においても、改めて検知対象の発話を検知すると、テンポや拍子の修正が可能であるので、使い勝手がよい。

　なお、本実施の形態において、テンポ設定モードとしてモード１～６、及び周期性モードを例示したが、これら以外のモードも設定可能である。また、矛盾が生じない限り、複数のモードを同時に適用してもよい。

　なお、上述したように、メトロノームパターンを、音による提示以外にも、表示や動作、またはこれらの組み合わせによって提示してもよい。

　なお、検知対象の発話の検知において、「発話揺れ」を考慮して検知できるようにしてもよい。例えば、同じ数字を意味する異なる発話を同じ発話と扱ってもよい。例えば、「よん」は「し」と発話されてもよく、「なな」は「しち」と発話されても良いとしてもよい。

　なお、検知対象の発話とは別に、コマンドの意味を理解し、コマンドによるテンポや音量や音色等の設定や修正等の指示を行えるようにしてもよい。

　なお、シーケンサ３９には、楽器練習アシスト向けの装置や、最初から曲のシーケンスデータが入っているカラオケ装置等も含まれる。シーケンサ３９に対し、発話の検知に基づいて、繰り返しの設定やジャンプやリズムパターンや伴奏パターンの設定等を行えるようにしてもよい。また、発話の検知に基づいて決定されたテンポ（乃至再生スピード）に応じて、シーケンスデータの再生が行われたり、再生中に再生テンポ（乃至再生スピード）が修正されたりするようにしてもよい。

　なお、メトロノーム３０または情報端末装置４０に本発明を適用した場合において、装置の起動、テンポ設定モードの動作の開始、図７のステップＳ１０１での初期設定等を、全て発話によって指示できるように構成してもよい。例えば、ユーザは、本発明が適用される装置の名称を発話することで装置を起動させ、テンポ設定モードの動作開始を指示する「メトロノーム」等の発話によってテンポ設定モードを開始させる。その後、ユーザは、所定の発話によって初期設定を行い、その後、上記説明したように検知対象の発話を行う。

　なお、本発明をスマートフォン等の情報端末装置４０で実現する場合は、それに接続される提示装置はメトロノーム３０やシーケンサ３９に限らない。本発明を実現するためのアプリケーションの取得方法は問わない。情報端末装置４０で実行されるアプリケーションは、情報端末装置４０に当初からインストールされていなくてもよく、事後的にダウンロードされ、インストールされてもよい。

　以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。上述の実施形態の一部を適宜組み合わせてもよい。

　なお、本発明を達成するためのソフトウェアによって表される制御プログラムを記憶した記憶媒体を、本楽器に読み出すことによって同様の効果を奏するようにしてもよく、その場合、記憶媒体から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記憶した、非一過性のコンピュータ読み取り可能な記録媒体は本発明を構成することになる。また、プログラムコードを伝送媒体等を介して供給してもよく、その場合は、プログラムコード自体が本発明を構成することになる。なお、これらの場合の記憶媒体としては、ＲＯＭのほか、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ－ＲＯＭ、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード等を用いることができる。「非一過性のコンピュータ読み取り可能な記録媒体」は、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ（例えばＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ））のように、一定時間プログラムを保持しているものも含む。

３１　コントローラ（テンポ決定部、設定部、拍子決定部）
３２　音声認識部（検知部）
３３　発音部（提示部）

Claims

　所定の発話を検知対象とし、音声を認識して前記検知対象の発話を検知する検知部と、
　前記検知部により前記検知対象の発話が２回以上続けて検知されたことに応じて、前記検知された発話の検知間隔に基づいてテンポを決定するテンポ決定部と、
　前記テンポ決定部により決定されたテンポを設定する設定部と、
を有するテンポ設定装置。
　前記検知対象の発話は複数あり、
　前記テンポ決定部は、所定の組み合わせに該当する発話が予め定められた順番通りに前記検知部により検知されたことに応じて、前記検知された発話の検知間隔に基づいてテンポを決定する請求項１に記載のテンポ設定装置。
　前記所定の組み合わせは、第１拍から所定拍までの各拍を示す発話から成る組み合わせを含み、
　前記所定の組み合わせに該当する発話が予め定められた順番通りに前記検知部により検知されたことに応じて、拍子を決定する拍子決定部を有し、
　前記設定部は、前記決定されたテンポと共に、前記拍子決定部により決定された拍子を設定する請求項２に記載のテンポ設定装置。
　前記拍子決定部は、前記検知部により、前記第１拍を示す発話から始まって順番通りに各拍の発話が検知された後、前記第１拍を示す発話が再び検知されると、前記第１拍を示す発話が再び検知される前の拍を示す発話に基づいて拍子を決定する請求項３に記載のテンポ設定装置。
　前記検知対象の発話は複数あり、
　前記テンポ決定部は、前記検知部による、所定の組み合わせに該当する発話の検知順が周期性を示す場合に、前記検知された発話の検知間隔に基づいてテンポを決定する請求項１に記載のテンポ設定装置。
　前記検知部により前記検知対象の発話が続けて検知された回数に基づいて拍子を決定する拍子決定部を有し、
　前記設定部は、前記決定されたテンポと共に、前記拍子決定部により決定された拍子を設定する請求項１に記載のテンポ設定装置。
　前記設定部により設定された拍子及びテンポを発音により提示する提示部を有する請求項３、４または６に記載のテンポ設定装置。
　前記提示部は、前記設定された拍子における強拍と弱拍とで発音の態様を異ならせる請求項７に記載のテンポ設定装置。
　前記設定部により設定されたテンポを提示する提示部を有する請求項１～６のいずれか１項に記載のテンポ設定装置。
　前記テンポ決定部は、テンポが設定されている状態で、前記検知部により前記検知対象の発話が新たに２回以上続けて検知されたことに応じて、前記新たに検知された発話の検知間隔に基づいてテンポを修正する請求項１～９のいずれか１項に記載のテンポ設定装置。
　前記テンポ決定部は、テンポが設定されている状態で、前記所定の組み合わせに該当する発話が予め定められた順番通りに前記検知部により新たに検知されたことに応じて、前記新たに検知された発話の検知間隔に基づいてテンポを修正する請求項２～４のいずれか１項に記載のテンポ設定装置。
　前記テンポ決定部は、テンポが設定されている状態で、前記所定の組み合わせに該当する発話の周期性を示す検知順が、前記検知部により新たに検知されたことに応じて、前記新たに検知された発話の検知間隔に基づいてテンポを修正する請求項５に記載のテンポ設定装置。
　テンポ設定装置の制御方法であって、
　所定の発話を検知対象とし、音声を認識して前記検知対象の発話を検知する検知ステップと、
　前記検知ステップにより前記検知対象の発話が２回以上続けて検知されたことに応じて、前記検知された発話の検知間隔に基づいてテンポを決定するテンポ決定ステップと、
　前記テンポ決定ステップにより決定されたテンポを設定する設定ステップと、を有するテンポ設定装置の制御方法。
　テンポ設定装置の制御方法をコンピュータに実行させるプログラムであって、
　前記制御方法は、
　所定の発話を検知対象とし、音声を認識して前記検知対象の発話を検知する検知ステップと、
　前記検知ステップにより前記検知対象の発話が２回以上続けて検知されたことに応じて、前記検知された発話の検知間隔に基づいてテンポを決定するテンポ決定ステップと、
　前記テンポ決定ステップにより決定されたテンポを設定する設定ステップと、を有するプログラム。