(基本構成)
本例は、図1に示す構成を有し、マイクロホンを備えた音声入力部1に入力される音声の指示によって制御部6から照明器具10(図5参照)の制御を可能とする制御信号を出力する。制御部6からの制御信号は、照明器具10に直接与えられるか、もしくは調光卓12を通して照明器具10に与えられる。図1に示す構成のうち、音声入力部1を除く構成はコンピュータにおいて適宜のプログラムを実行することにより実現される。
音声入力部1に入力された音声は認識変換部3に入力され、認識変換部3では音声入力部1に入力された音声から特徴量を抽出する。さらに、認識変換部3は、音声から抽出した特徴量を用いて、認識語彙保持部2にあらかじめ登録されている語彙のうち、入力された音声に一致する確率の高い語彙を抽出し、当該語彙に対応付けてあらかじめ認識語彙保持部2に登録されている語彙の種別に従って、制御対象記憶部4と動作記憶部5とのいずれかに語彙(テキストデータ)を振り分けて記憶させる。
認識語彙保持部2は、認識しようとする語彙を登録した辞書であって、制御対象(照明器具や昇降装置)を意味する語彙と、制御対象に対する操作(移動方向やフィルタないし装飾の種類の選択)を意味する語彙とがあらかじめリストとして登録される。 認識語彙保持部2における語彙のリストの一例を表1に示す。すなわち、語彙の種別は「制御対象」と「操作」とであって、認識変換部3において認識した語彙の種別が「制御対象」であると当該語彙は制御対象記憶部4に格納され、認識変換部3において認識した語彙の種別が「操作」であると当該語彙は動作記憶部5に格納される。
表1には示していないが、認識語彙保持部2には、「右」「左」のような移動方向も「操作」として登録される。表1において「ゴボ」は調光フィルタを意味している。
認識変換部3では、音声認識の周知の技術によって音声入力部1に入力された音声をテキストデータに変換する。すなわち、音声入力部1から認識変換部3に入力された音声は、たとえば量子化ビット数を16、標本化周波数を16kHzとしてA/D変換され、その後、分析フレーム長を25ミリ秒、分析間隔を10ミリ秒などとして周波数変換された後に、音声の特徴量が抽出される。音声の特徴量としては、たとえばメル周波数ケプストラム係数などを用いることができる。認識変換部3には、大量の音声データを用いてEMアルゴリズムなどによって学習させた隠れマルコフモデルなどの音声モデルが内部に設定されており、音声入力部1から入力された音声の特徴量を用いフォワードアルゴリズムなどを適用することによって、認識語彙保持部2に登録されているすべての語彙について各語彙を音声モデルが出力する確率を求める。このようにして語彙ごとに求めた確率が最大になる語彙を1個選択するか、あるいは確率が規定値以上の複数の語彙からなる語彙列を選択して出力する。
認識変換部3において認識語彙保持部2から語彙を選択すると、上述したように、語彙の種別が「制御対象」であれば制御対象記憶部4に格納され、語彙の種別が「操作」であれば動作記憶部5に格納される。制御対象記憶部4と動作記憶部5とは、いずれも複数個の語彙を格納することができ、制御部6で読出可能な語彙はポインタにより指定される。つまり、制御対象記憶部4と動作記憶部5とでは、新たな語彙が格納されると格納された語彙の位置がポインタ(語彙の先頭アドレスなど)により指定される。ポインタの位置は制御部6から指示可能であり、制御対象記憶部4と動作記憶部5とに残されている語彙であれば、ポインタの位置を変更することによって読出可能である。また、制御対象記憶部4と動作記憶部5とは、いずれも語彙が格納されるたびに制御部6に通知する機能を有している。
制御部6は、制御対象記憶部4と動作記憶部5とからそれぞれ語彙の格納が通知されると通知があったことを記憶し(ラッチし)、制御対象記憶部4と動作記憶部5との両方からの通知が揃った時点をトリガとして、制御対象記憶部4から制御対象の語彙を読み出すとともに、動作記憶部5から操作の語彙を読み出し、制御対象記憶部4から読み出した制御対象に対して、動作記憶部5から読み出した操作を行うように制御信号を生成する。ここに、本例における制御部6は、制御信号を一度生成すると、次に制御対象記憶部4と動作記憶部5とからそれぞれ記憶内容の更新が通知されるまでは、次のトリガを発生しないように構成してある。
制御信号は照明器具10(図5参照)などを制御するために用いられるから、調光卓から照明器具10への制御信号と同形式の信号を用いるのが望ましい。調光卓ではDMXプロトコルの信号(DMX信号)を用いることが多いから、制御部6から出力する制御信号をDMX信号とする場合には、制御対象を示す語彙をDMXアドレスに変換するとともに、操作を示す語彙をDMX値に変換することができる変換テーブルを制御部6に設けておく。
以下に具体例を示して本例の動作を説明する。いま、表1のように、制御対象として10台のスポットライトが設けられている場合を想定する。各スポットライトは、それぞれ5種類の色を選択することが可能であり、さらにゴボ(調光フィルタ)によって5段階の調光が可能であるものとする。
利用者が、3番目のスポットライトの色を赤色に変更する場合を例として説明する。また、制御対象記憶部4と動作記憶部5とには格納された語彙がないものとする。まず、利用者は音声入力部1に設けたマイクロホンに向かって制御対象を指定するために、「3番スポット」という音声を入力する。「3番スポット」は認識語彙保持部2に登録されているから、認識変換部3では認識語彙保持部2から「3番スポット」の語彙を選択する。「3番スポット」の種別は「制御対象」であるから「3番スポット」の語彙は制御対象記憶部4に格納され、このとき制御対象記憶部4は制御部6に対して語彙の格納を通知する。ただし、動作記憶部5には語彙が格納されておらず、制御部6には制御対象記憶部4と動作記憶部5との両方からの通知が揃っていないから、制御部6から制御信号を出力することはない。
次に、利用者が操作の内容を指示するために、マイクロホンに向かって「赤」という音声を入力すると、認識変換部3では認識語彙保持部2から「赤」という語彙を選択する。「赤」の種別は「操作」であるから、「赤」という語彙は制御対象記憶部4ではなく動作記憶部5に格納され、動作記憶部5から制御部6に語彙の格納が通知される。制御部6では、動作記憶部5から語彙の格納が通知された時点で、制御対象記憶部4と動作記憶部5との両方からの通知が揃うから、制御対象記憶部4と動作記憶部5との両方から記憶内容を読み出し、変換テーブルによって制御信号(DMX信号)に変換し外部に出力する。制御信号はスポットライトを含む照明システムに送出され、DMX信号に含まれるDMXアドレスによって3番目のスポットライトが指定され、3番目のスポットライトの色が赤色に変更される。
ここに、上述の例では制御対象を指定してから操作を指示しているが、操作の指示の後に制御対象を指定しても同様に動作する。これは、制御部6において、制御対象と操作との指示が揃った後に、制御対象と操作とを組み合わせて制御信号を生成しているからであって、音声による指示は制御対象と操作とのどちらを先に行っても、制御部6からは同じ制御信号が出力される。また、制御部6では制御対象の指定と操作の指示とが揃うまで制御信号を出力しないから、制御対象の指定と操作の指示との間に時間が空いてもよく、利用者は指示内容を文として指示する必要がなく、制御の際の指示が容易になる。
上述したように、本構成では、認識語彙保持部2に制御対象と操作とに分けて語彙を登録しているから、制御対象と操作との語彙を組み合わせることによって、比較的少数の語彙で複雑な制御が可能になる。しかも、認識語彙保持部2に登録する語彙は文ではないから、認識変換部3における処理の負荷が比較的小さく高速な処理が可能であり、その上、単純な語彙を用いることによって音声の認識率が高くなる。つまり、誤認識や処理の遅れによって制御をやり直す可能性が低減され、音声での指示による照明制御を違和感なく行うことができる。
上述の例では、制御対象としてスポットライトを例示したから、操作の内容としては色とゴボとを例示したが、制御対象としては、モータのような駆動源を備え照射方向を制御することができるムービングライトを用いる場合もある。この種の制御対象に対する操作としては、照射方向が含まれるから、認識語彙保持部2には「右」「左」「上」「下」「ライト」「レフト」「アップ」「ダウン」などの方向を示す語彙を登録し、制御部6ではこれらの語彙に対応した制御信号を生成可能としておく。操作としては、上述のような色、ゴボ、方向のほか、調光量(光源の光出力)を含めてもよい。つまり、操作としては、色、ゴボ、方向、調光量(光出力)のうちの少なくとも1種類が選択される。
操作が方向や調光量である場合には、程度を表す語彙も認識可能としておく。たとえば、方向について「少し」「大きく」などの程度を表す語彙の組合せを可能とし、方向の語彙に「少し」が付加されていればDMX値を15変化させ、「大きく」が付加されていればDMX値を45変化させ、程度を表す語彙が付加されていなければDMX値を30変化させるというように、方向について変化量の程度を付加することで、所望の向きに制御することが可能になる。調光量についても同様であって、「明るく」「暗く」などの変化の方向を示す語彙に「少し」「大きく」のような変化量の程度を表す語彙を組み合わせることで、光出力の変化量を音声によって調節することが可能になる。
上述したように、色やゴボのほかに、ムービングライトの姿勢を音声によって指示可能としたり、調光量を音声によって制御可能とすることで、照明制御をきめ細かく行うことが可能になる。しかも、姿勢や制御量の変化量を複数段階で制御可能としていることにより、音声による照明制御を簡単な語彙で行えるようにしながらも、大きく変化させたり細かく変化させたりすることが可能であって、所望の操作を音声に対応付けて簡単に行うことができる。
ところで、上述した例では、制御対象への制御信号を生成するための語彙のみを認識語彙保持部2に登録しているが、制御部6の動作を指示する語彙を認識語彙保持部2に登録し、制御部6の動作を音声によって制御してもよい。たとえば、制御部6による制御信号の出力開始を指示するための「スタート」というような制御用語彙を認識語彙保持部2に登録しておき、認識変換部3において制御用語彙を抽出したときには、制御対象記憶部4や動作記憶部5に語彙を格納するのではなく、制御部6に対して制御用語彙の内容に従う指示を通知するようにしてもよい。あるいはまた、認識変換部3で制御用語彙を抽出したときに制御部6に引き渡し、制御部6において制御用語彙に応じた動作を行うようにしてもよい。
いま、制御用語彙として上述した「スタート」を認識語彙保持部2に登録している場合を想定する。ここでは、制御部6は「スタート」による指示がなされると、制御対象記憶部4および動作記憶部5の内容を読み出して制御信号を生成する動作を行うように機能するものとする。すなわち、制御部6は、制御対象記憶部4あるいは動作記憶部5から記憶内容の更新が通知されただけでは制御信号を生成せず、認識変換部3から「スタート」を抽出したことの通知がなされると(または、「スタート」の語彙が転送されると)、制御部6は制御信号の生成を開始し、制御対象記憶部4と動作記憶部5とから記憶内容を読み出して制御信号を生成して出力する。
具体例で説明すると、利用者が、3番目のスポットライトの色を赤色に制御した後に、3番目のスポットライトの色を青色に変更する場合を想定する。3番目のスポットライトが赤色である状態において、利用者が「青」という音声を入力すると、制御対象記憶部4に「3番スポット」の語彙が登録された状態で、動作記憶部5には「青」の語彙が格納されるが、この時点では制御部6から制御信号が出力されることはなく、その後、「スタート」という音声を入力すると、制御部6が制御信号を生成して出力し、3番目のスポットライトの色が青色に変更される。「青」と「スタート」との音声の入力の間の時間についてはとくに制限はない。また、3番目のスポットライトの色を青色としてから、「スタート」という音声を入力する前であれば、別の色に変更することが可能であり、たとえば、3番目のスポットライトの色が赤色であるときに、「青」に続いて「白」という音声を入力した後に「スタート」という音声を入力すれば、3番目のスポットライトの色は青色になることなく白色に変更される。
以上説明したように、認識語彙保持部2に制御用語彙を登録しておき、認識変換部3において制御用語彙を抽出したときに、制御用語彙の内容に応じて制御部6を動作させるようにすれば、利便性の向上を図ることができる。とくに、制御対象や操作に関する音声を入力した後に、「スタート」という音声を入力するまでは、制御対象や操作の内容を変更することが可能であるから、制御信号の内容を設定する際に実際の制御前に内容変更が可能になる。
ところで、上述した制御部6では制御対象記憶部4と動作記憶部5との両方からの語彙の格納の通知によって制御信号を生成すると、制御対象記憶部4と動作記憶部5との両方から語彙の格納が次に通知されるまで制御信号を出力しないように構成しているが、制御部6は、制御信号を生成して出力した後に、制御対象記憶部4と動作記憶部5との一方から語彙の格納が通知されると次の制御信号を生成するように構成してもよい。
ここでは、利用者が、3番目のスポットライトの色を赤色に指定した後に、同じスポットライトの色を青色に変更する場合を例として具体的な動作を説明する。まず、利用者は「3番スポット」と「赤」との音声入力を行うことにより、3番目のスポットライトの色を赤色に指定する。つまり、制御対象記憶部4には「3番スポット」という語彙が記憶され、動作記憶部5には「赤」という語彙が記憶される。
この状態において、利用者が、「青」という音声を入力すると動作記憶部5には「青」という語彙が格納される。動作記憶部5では新たな語彙が格納されると、新たな語彙が制御部6により最初に読出可能な語彙になるように記憶内容が更新される。また、動作記憶部5に新たな語彙が格納されると、語彙の格納が制御部6に通知される。動作記憶部5から語彙の格納の通知があると、制御部6は、制御対象記憶部4と動作記憶部5とから語彙を読み出して制御信号に変換し制御信号を出力する。つまり、制御対象記憶部4の内容には変化がないから、3番目のスポットライトを対象とし、操作の内容が「赤」から「青」に変化して3番目のスポットライトは色を青色に変更する。
上述のようにして3番目のスポットライトの色を青色にした状態で、4番目のスポットライトの色を青色に変更するには、利用者は「4番スポット」という音声を入力する。つまり、制御対象記憶部4の記憶内容が「4番スポット」という語彙に更新され、語彙の更新が制御部6に通知される。制御部6では、動作制御部5の記憶内容が「青色」に更新されたときの通知が有効であるから、制御対象記憶部4から語彙の更新が通知されると、制御部6は、制御対象記憶部4と動作記憶部5との両方からの格納の通知が揃ったとみなし、制御対象記憶部4と動作記憶部5とから語彙を読み出して制御信号に変換し制御信号を出力する。つまり、動作制御部5の内容には変化がないから、操作の内容を「青」に保ったままで、制御対象が3番目のスポットライトから4番目のスポットライトに変更される。つまり、4番目のスポットライトの色を青にするように制御信号が生成される。
上述した動作を行うには、制御対象記憶部4と動作記憶部5との両方に語彙が格納されていなければならないから、制御対象記憶部4と動作記憶部5とには適宜の初期値をあらかじめ記憶させておくのが望ましい。あるいはまた、制御対象記憶部4と動作記憶部5とにともに語彙が格納されていなければ、制御を行わないようにすればよい。さらに、上述した制御部6の2種類の動作を選択可能に構成することも可能である。
上述したように、後者の動作を採用すれば、同じ制御対象(スポットライト)について操作のみを次々に変更する場合や、複数の制御対象(スポットライト)について同じ操作を次々に行う場合などに、すべての制御対象と操作との組で指示を与える必要がなく、音声による指示を簡略化することができ、制御対象に対する指示を容易に与えることができる。
ところで、制御部6の2種類の動作のうち前者の動作では、「スタート」のように制御部6の動作を指示する制御用語彙を例示したが、制御用語彙として、認識語彙保持部2に登録された語彙を登録順で選択するための語彙を用いてもよい。たとえば、制御対象をスポットライトとするときに、「前のスポット」「次のスポット」のような制御用語彙を用い、操作を色とするときに、「前の色」「次の色」のような制御用語彙を認識語彙保持部2に設定するのである。ただし、この種の制御用語彙を用いる場合に、表1を例にすれば、「スポット」が「1番スポット」……「10番スポット」に対応し、「色」が「赤」「青」「黄」「緑」「白」に対応することを認識変換部3に認識させる必要があるから、各語彙にはカテゴリを対応付けておくことが必要である。つまり、語彙「赤」に対しては種別「操作」だけではなく、カテゴリ「色」を対応付けておくことが必要である。
認識語彙保持部2の語彙を指定する制御用語彙が認識変換部3において抽出されたときには、認識変換部3では制御対象記憶部4あるいは動作記憶部5において現在使用中の語彙(最新の制御信号を生成した語彙)のカテゴリと同じカテゴリの語彙を抽出し、同カテゴリ内で1つ前または後の語彙を読み出すのである。たとえば、「前のスポット」に対しては、カテゴリが「スポット」である制御対象のうち認識語彙保持部2での登録順が1つ前の語彙を抽出して制御対象記憶部4に格納する。また、「後のスポット」に対しては、カテゴリが「スポット」である制御対象のうち認識語彙保持部2での登録順が1つ後の語彙を抽出して制御対象記憶部4に格納する。同様にして、「前の色」「後の色」に対しては、カテゴリが「色」である操作のうち、認識語彙保持部2での登録順が1つ前あるいは後の語彙を抽出して動作記憶部5に格納する。このように認識語彙保持部2における語彙の登録順で語彙を選択する場合には、制御用語彙を入力して選択した語彙を制御対象の動作によって確認する必要があるから、制御対象記憶部4と動作記憶部5との一方の記憶内容が更新された時点で制御信号を生成する必要があり、したがって制御部6の2種類の動作のうち後者の動作において、この種の制御用語彙を使用することが可能になる。なお、登録順での先頭と末尾との語彙は連続するように扱うのが望ましく、1番スポットの前は10番スポットとみなし、10番スポットの次は1番スポットとみなす。
いま、利用者が3番目のスポットライトの色を赤色に設定した後に、2番目のスポットライトを青色に変更する場合を例にする。また、認識語彙保持部2には表1の語彙が登録されているものとする。3番目のスポットライトの色が赤色であるときに、「次の色」という音声を入力すると、認識語彙保持部2に登録されている語彙のうち「色」のカテゴリの語彙「赤」「青」「黄」「緑」「白」が抽出され、登録順において「次」である「青」が選択され、「青」の種別は「操作」であるから動作記憶部5の内容が「青」に更新される。この時点では3番目のスポットライトの色が青色になるから、さらに、「前のスポット」という音声を入力することによって、認識語彙保持部2からカテゴリが「スポットライト」である語彙を抽出し、登録順で「3番スポット」の1つ「前」である「2番スポット」が制御対象記憶部4に格納される。つまり、2番目のスポットライトの色が青色になる。この動作例から明らかなように、3番目のスポットライトの色が赤色であるときに、2番目のスポットライトの色を青色にするために上述の手順を採用すると、3番目のスポットライトの色も青色になる。つまり、2番目と3番目とのスポットライトの色がともに青色になる。
3番目のスポットライトの色を赤色に保って2番目のスポットライトのみの色を青色にしようとするのであれば、まず「前のスポット」と入力して2番目のスポットライトを赤色に変更し、その後、「次の色」と入力すれば2番目のスポットライトのみの色が青色に変更されることになる。このように、音声の入力によって指定する順序を変更すれば、所望の設定が可能になる。
上述のように、認識語彙保持部2の登録順で語彙を指定する制御用語彙を設けることによって、利用者は認識語彙保持部2に登録されている語彙を記憶していなくても、指定可能な色を試すことができ、所望の色の選択が可能になる。とくに、多数色の指定が可能である場合には、全色に対応する語彙を利用者が覚えるのは困難であるから、全色を記憶することなく色の指定が可能になることによって、利用者の負担が軽減される。
ところで、「前のスポット」「次のスポット」あるいは「前の色」「次の色」というように認識語彙保持部2での登録順を指定する制御用語彙を用いる場合に、上述の例のように制御用語彙の1回の入力に対して1つの語彙だけを指定するのではなく、同じカテゴリの語彙を順に所定時間ずつ選択してもよい。つまり、認識語彙保持部2での登録順を指定する制御用語彙が抽出されると、カテゴリ内の語彙を順に自動的に選択して制御対象記憶部4または動作記憶部5に格納するのである。この動作により制御対象あるいは操作の内容を変化させた制御信号が所定時間ごとに生成されることになる。所望の状態の制御信号が得られた時点での制御状態を保持するために、認識語彙保持部2には制御用語彙として「ストップ」を用意しておく。認識変換部3では「ストップ」という制御用語彙を抽出したときには、認識語彙保持部2の登録語彙から順に語彙を選択する処理を停止する。
たとえば、2番目のスポットライトの色を赤色に設定した後に、「次の色」と入力すると、認識語彙保持部2に登録されたカテゴリが「色」である語彙が所定時間(たとえば、1秒)ずつ順に選択される。つまり、表1の例では、「青」「黄」「緑」「白」「赤」……の順で動作記憶部5の記憶内容が変更され、各色に制御する制御信号が所定時間ごとに生成され、2番目のスポットライトの色が順に変更される。そこで、2番目のスポットライトの色が所望の色になった時点で「ストップ」という音声を入力し、認識語彙保持部2に登録された語彙の選択を停止する。このようにして、認識語彙保持部2に語彙が登録されている色から所望の色を選択するために、音声を2回だけ入力すればよく、多数の色から所望の色を選択するような場合には利用者の負担を大幅に軽減することができる。上述の例では「色」について説明したが、他の操作についても同様である。また制御対象についても同様に処理することができる。
認識語彙保持部2に登録された語彙の選択を自動的に行う機能を設けていることによって、たとえば100種類の色が選択可能である照明器具を用い、すべての色をチェックする場合を想定すると、「次の色」という音声入力を100回行うのではなく、1回だけ「次の色」という音声入力を行った後には、「ストップ」という音声入力のみになるから、利用者の負担が大幅に軽減される。
なお、認識語彙保持部2においてムービングライトの照射方向などを指定するための上述のような方向を示す語彙を登録しているときに、方向を示す語彙の入力によって、指定された方向に所定の変化量でDMX値が変化するように認識変換部3から動作記憶部5にデータを格納するようにし、このときの1回当たりの変化量を比較的小さくしておくことによって、ムービングライトの照射方向を自動的に少しずつ変化させることが可能になる。したがって、ムービングライトの照射方向が所望の方向に到達した時点で、「ストップ」という音声の入力により、照射方向の変化を停止させれば、ムービングライトの照射方向を略連続的に変化させることが可能になる。この技術は、操作として調光量(光出力)を連続的に変化させる場合にも適用可能である。
(参考例)
本例は、基本構成に図2のようにタイマ7を付加したものである。タイマ7は、制御対象記憶部4と動作記憶部5との一方の記憶内容が更新されることによって制御部6から制御信号を出力することが可能になった時点でリセットされ、リセットから所定時間を時限するものである。また、時限中に制御対象記憶部4と動作記憶部5との一方の記憶内容が更新されたときにもリセットされる。一方、制御部6は、タイマ7の時限動作中には制御信号を出力せず、タイマ7での時限終了が制御部6に通知されたときに、制御対象記憶部4と動作記憶部5とから語彙を読み出して制御信号を出力するように構成されている。
タイマ7は、減算カウンタであって、あらかじめ設定したカウント値から所定時間ごとに1ずつ減算し、カウント値が0になると時限動作を終了するように構成されている。すなわち、図3に示すように、タイマ7を構成するカウンタにカウント値(N)を設定した状態でタイマ7をリセット(スタート)すると(S1)、時間ΔTごとにカウント値が1ずつ減算される(S2)。カウント値が0になるまでに制御対象記憶部4と動作記憶部5とのいずれかから語彙の更新が通知されると(S3)、カウンタはリセットされてカウント値がNに復帰する。また、カウント値を1ずつ減算する間に制御対象記憶部4と動作記憶部5とのどちらからも語彙の更新が通知されなければ、やがてカウント値が0になり(S4)、制御部6に時限終了を通知する。
たとえば、図3においてカウンタに設定するカウント値Nを100とし、時間ΔTを100分の1秒とすれば、タイマ7の時限時間は1秒間になる。時間ΔTは100分の1秒であるから、制御部6は100分の1秒間隔で制御対象記憶部4と動作記憶部5との一方からの更新の通知を待ち受ける。この間に更新の通知がなければカウント値が0になったか否かを判断し、カウント値が0でなければ再びカウント値を1だけ減らす。また、カウント値が0であれば制御部6に通知するのである。カウント値が0ではなく、時間ΔTの間にタイマ7が制御対象記憶部4と動作記憶部5とのいずれかから通知を受け取った場合には、カウント値を再び100に設定して時限動作をやりなおす。
本例の具体例として、利用者が、3番目のスポットライトの色を赤色に設定した後に、4番目のスポットライトの色を青色に変更する場合について説明する。利用者は、3番目のスポットライトの色を赤色に設定した状態において、まず制御対象を4番目のスポットライトに変更するために、音声入力部1に設けたマイクロホンに向かって「4番スポット」という音声を入力する。このことによって、制御対象記憶部4の記憶内容は「4番スポット」に更新される。制御対象記憶部4は内容の更新を制御部6とタイマ7とに通知される。基本構成ではタイマ7を設けていないから、制御対象と操作とのいずれかが変更されると、ただちに制御信号が出力されていたが、本例では、タイマ7による時限時間が経過するまでは制御信号が出力されない。
しかるに、カウント値は100であって、時間ΔTは100分の1秒であるから、「4番スポット」という音声に続いて、「青」という音声を1秒以内に入力すると、制御部6によって制御対象記憶部4および動作記憶部5の記憶内容が読み出される前に、動作記憶部5に「青」という語彙を記憶させることができる。「青」という音声の入力から1秒以内に音声による指示を行わなければ、4番目のスポットライトを青色に変更する制御信号が制御部6から出力されるのである。「4番スポット」という音声を入力した後、1秒以内に次の音声を入力しなければ、制御対象記憶部4の記憶内容が「4番スポット」であり、動作記憶部5の記憶内容が「赤」である状態において、タイマ7から制御部6への通知がなされるから、制御部6は4番目のスポットライトを赤色に変更する制御信号を出力する。
以上説明したように、本例では制御対象と操作との両方を変更する場合でも1つの制御信号で変更することができるから、制御対象と操作とをともに変更しようとする場合に、所望の状態に至る途中で不必要な状態を経由することがなく、違和感のない操作が可能になる。また、制御信号を2回送信する必要がないから、制御信号の伝送系におけるトラフィックを基本構成よりも低減することが可能である。他の構成および動作は基本構成と同様である。
(実施形態)
上述した構成例では、認識語彙保持部2において語彙のリストを1個だけ登録する例を示したが、本実施形態では複数個のリストを認識語彙保持部2に設けた例について説明する。
まず、リストを2個設ける場合について説明する。この場合、各リストには他方のリストの選択を可能とするための制御用語彙を登録する。たとえば、一方のリストには「後半を制御」という制御用語彙を登録し、他方のリストには「前半を制御」という制御用語彙を登録しておく。どちらのリストを用いるかは、認識変換部3において上述した制御用語彙を抽出することで選択可能であって、「前半」を第1のリスト、「後半」を第2のリストを意味する語彙とすれば、第1のリストに「後半を制御」という語彙を登録し、第2のリストに「前半を制御」という語彙を登録しておくことで、第1のリストの使用中において「後半を制御」という音声入力があったときに、第2のリストを使用する状態に切り替えるのである。同様に、第2のリストの使用中において「前半を制御」という音声入力があると、第1のリストを使用する状態に切り替える。
いま、1番目から5番目のスポットライトは、色の制御とゴボの制御が可能であり、6番目から10番目のスポットライトは、色だけが制御可能な場合を想定する。この場合、認識語彙保持部2に設定される各リストは、表2、表3のようになる。
上述したように、認識語彙保持部2に2個のリストを設け、各一方のリストを切り替えて使用可能としたことにより、制御対象と操作との組がグループ化される場合に各グループごとのリストを作成することが可能であって、たとえば、制御対象のカテゴリに応じて可能な操作に制限があるような場合に、リストを分けて設定することができる。このようにリストを分けると、各リストに含まれる語彙数が低減されることにより、認識変換部3が認識語彙保持部2から語彙を抽出する際の負荷が軽減され、語彙の抽出に要する処理能力が比較的低くても語彙の抽出を実用的な時間内で行うことが可能になる。つまり、比較的安価に提供することが可能になる。また、認識変換部3において照合すべき語彙数が少なくなることによって、語彙が誤って抽出される可能性も低減され、音声による指示内容の認識率が向上する。
上述の例では2個のリストを設けているが、3個以上のリストを用いることも可能である。3個以上のリストを用いる場合には、各リスト間で他のリストを直接指定するように、最大で(リスト数−1)個の制御用語彙を登録しておけばよい。
ところで、認識語彙保持部2においてリストが選択されているときに他者と会話し、その会話において認識語彙保持部2に登録された語彙が使用されると、制御信号が出力されることがある。そこで、リストとして表5のように制御信号を生成するための語彙を含まないリスト(第2のリスト)を設定し、制御信号を生成するための語彙を含むリストと表5のような制御信号を生成しないリストとを切り替えて使用してもよい。リストの切替のために、表4のように制御信号を生成する語彙を含むリスト(第1のリスト)には、表5のリストに切り替えるための「制御停止」という制御用語彙を含め、表5のリストでは表4のリストに切り替えるための「制御開始」という制御用語彙を含める。認識変換部3では、これらの制御用語彙を抽出すると、上述した「前半を制御」「後半を制御」の語彙と同様に、リストの切替を行う。
制御部6において制御信号を生成するときには、表4に示すリストを選択しておけば、音声の入力によって制御対象および操作を選択することができ、制御部6において制御信号が生成される。一方、音声入力による制御を停止する場合には、「制御停止」という音声を入力する。「制御停止」という制御用語彙が抽出されると、認識変換部3では表5に示すリストを使用するように、リストの切替を行い、表5に示すリストでは「あ」……「ん」の50音の単音を語彙に含むだけであり制御信号を生成する語彙を含まないから、表5に示すリストが選択されている間には、「制御開始」以外のどのような語彙を入力しても制御信号が出力されることはない。
表5のリストが選択された状態において、「制御開始」という音声入力がなされると、認識変換部3が表4のリストを使用するようになり、上述した構成例と同様に制御部6において制御信号を生成することが可能になる。
すなわち、図4に示すように、表4のリスト(リスト4と記載している)が選択された状態で動作を開始(スタート)すると(S1)、音声入力に対して語彙の認識を行い(S2)、抽出した語彙が「制御停止」でなければ(S3)、抽出した語彙に従って制御信号を生成する(S4)。一方、ステップS3において「制御停止」が抽出されると、表5のリスト(リスト5と記載している)に切り替える(S5)。この状態でも音声入力に対する語彙の認識は行うが(S6)、「制御開始」以外では何の制御も行わない(S7)。「制御開始」が入力されたときには、表4のリストに切り替えて(S8)、音声入力に対する語彙の認識を行う動作に復帰する(S2)。
以上説明したように、表4のリストが選択されている状態において、「制御停止」という音声を入力すれば、表5のリストが選択され、このリストが選択されている間には、音声入力によっては制御信号を出力することができないから、たとえばヘッドセットマイクを装着し、音声入力を可能とするスイッチ(図示せず)を投入した状態であっても、他人との会話によって制御信号が生成されることはなく、他人との打ち合わせなどを交えながら、制御信号による制御対象の制御が可能になる。他の構成および動作は基本構成と同様である。