JP4849131B2

JP4849131B2 - 音声認識による照明制御装置

Info

Publication number: JP4849131B2
Application number: JP2009004731A
Authority: JP
Inventors: 朗馬場; 秀彦西窪
Original assignee: Panasonic Corp; Matsushita Electric Works Ltd
Current assignee: Panasonic Corp; Panasonic Electric Works Co Ltd
Priority date: 2009-01-13
Filing date: 2009-01-13
Publication date: 2012-01-11
Anticipated expiration: 2023-05-27
Also published as: JP2009116352A

Description

本発明は、舞台照明やスタジオ照明において、操作卓の操作に代えて利用者の音声による照明制御を可能とした音声認識による照明制御装置に関するものである。

一般に、舞台照明、ステージ照明、スタジオ照明のように、多数台の照明器具や昇降装置が存在しているような照明システムでは、照明機器（照明器具、昇降装置など）の操作を操作卓によって行っている（たとえば、特許文献１参照）。

特開平６−５１０７号公報（第００１４段落、図１）

この種の操作卓では、多数台の照明機器を制御するために、可変抵抗器やスイッチを多数備えており、この種の操作卓を操作するのは容易ではなく、操作卓の操作には習熟が必要である。

また、この種の照明では点灯させる照明器具や各照明器具の色などをシーンに応じて変化させる必要があるから、コンピュータを備える調光卓に各シーンに応じた制御内容をあらかじめプリセットしておき、シーンごとにプリセットされた制御内容に切り替えることが多い。制御内容のプリセットを行う作業には、図５に示すように、照明器具１０のような照明機器を設置した舞台１１の上や観客席から照明の効果を確認する人（指示者）Ｍ１と、舞台１１とは別の場所に設置された調光卓１２を操作する人Ｍ２（オペレータ）との２人が必要であって、２人の人Ｍ１，Ｍ２の間では無線式の通話装置などを用いて口頭による指示を行っているのが現状である。つまり２人の人が必要になる上に、口頭による指示では指示内容を伝達するのが難しいという問題がある。

指示者Ｍ１が音声によって照明機器の制御を行うことができれば、この種の問題を解決することができると考えられる。このように音声による指示を行う場合には、照明器具や昇降装置のような制御対象を指定するとともに、各制御対象の操作を指示しなければならない。つまり、制御対象と操作との組からなる文を認識し、文の内容に応じた制御を行うことが必要であるから、制御対象の台数が多く、操作の種類が多くなれば、制御対象と操作との組合せが膨大な数になる。その結果、音声の内容と照合するためのデータの登録作業に膨大な時間がかかることになる。また、登録されているデータ（制御対象と操作との組合せ）の数が膨大であることによって、入力された音声と登録されているデータとの照合に多大の時間を要することになり、音声の入力から実際に照明機器の制御状態が変化するまでの応答に遅れが生じ、シーンなどの設定作業における作業時間が長くなるという問題が生じる。

本発明は上記事由に鑑みて為されたものであり、その目的は、照明機器の制御を音声によって指示可能としながらも、音声を認識させるために設定するデータの量を少なくすることによって、データの登録作業を容易にし、しかも音声とデータとの照合に要する負荷を小さくした音声認識による照明制御装置を提供することにある。

本発明は、照明機器を制御対象とした制御信号を生成する制御部と、使用者が音声を入力する音声入力部と、制御対象と制御対象の操作とに関する語彙のリストを登録した認識語彙保持部と、音声入力部に入力される音声から認識語彙保持部に登録されている語彙を抽出する認識変換部と、認識変換部が認識語彙保持部から抽出した語彙が制御対象であるときに当該語彙が格納される制御対象記憶部と、認識変換部が認識語彙保持部から抽出した語彙が制御対象の操作であるときに当該語彙が格納される動作記憶部とを備え、制御部は、制御対象記憶部に格納される制御対象と動作記憶部に格納される操作との一方が更新されたことをトリガとして、制御対象記憶部と動作記憶部とにそれぞれ格納された語彙で示される制御内容の制御信号を生成して出力し、認識語彙保持部は、認識語彙保持部の語彙を所定時間ごとに登録順で抽出するように認識変換部に指示する第１の制御用語彙と、認識変換部に認識語彙保持部からの語彙の抽出の停止を指示する第２の制御用語彙とを含み、認識変換部は第１の制御用語彙を抽出したときに所定時間ごとに登録順で各語彙を抽出して制御対象記憶部と動作記憶部とのいずれか一方に抽出した語彙を格納し、第２の制御用語彙を抽出した時点で認識語彙保持部からの語彙の抽出を停止することを特徴とする。

本発明の構成によれば、照明機器の制御を音声によって指示可能としながらも、音声を認識させるために設定するデータの量を少なくすることによって、データの登録作業を容易にし、しかも音声とデータとの照合に要する負荷を小さくすることができるという利点がある。すなわち、制御部が制御対象記憶部に記憶した制御対象と動作記憶部に記憶した制御対象の操作とを結合して制御信号を生成するから、制御対象と操作とを各別に分けて入力することができ、音声入力に際しては、制御対象と操作とを別々に語彙として入力するだけで制御信号を生成することができる。また、音声入力を制御対象と操作との語彙に分けて入力することができるから、音声入力と照合する語彙を登録した認識語彙保持部においても、制御対象と操作とに関する語彙を登録しておけばよく、認識語彙保持部において制御対象と操作との語彙を組み合わせる必要がないから語彙の登録が容易になる。すなわち、認識変換部では音声入力に対して照合すべき語彙数が少ないから高速な処理が期待でき、また照合すべき語彙数が少なければ誤認の確率も低減されることになる。

さらに、制御対象と操作との一方が更新されると制御信号が生成されるから、制御対象と操作との一方を決めた後に、他方を次々に変更することが可能であり、たとえば、同じ操作を複数の制御対象に適用する際には、制御対象のみを音声入力すればよいから作業性が高くなる。

加えて、第１の制御用語彙を用いると制御内容が自動的に順に変更されるから、利用者は所望の制御内容になったときに第２の制御用語彙を入力することで、所望の制御内容を選択することができる。したがって、制御内容を作業性よく選択することが可能になる。しかも、制御内容を自動的に変更させる開始点と終了点とを指示するだけであるから、多数の制御内容を試験するような場合に、何度も音声入力を行う必要がなく作業性よく使用することができる。

基本構成および実施形態１を示すブロック図である。実施形態２を示すブロック図である。実施形態２を示す動作説明図である。実施形態３を示す動作説明図である。従来例の概略構成図である。

（基本構成）
本例は、図１に示す構成を有し、マイクロホンを備えた音声入力部１に入力される音声の指示によって制御部６から照明器具１０（図５参照）の制御を可能とする制御信号を出力する。制御部６からの制御信号は、照明器具１０に直接与えられるか、もしくは調光卓１２を通して照明器具１０に与えられる。図１に示す構成のうち、音声入力部１を除く構成はコンピュータにおいて適宜のプログラムを実行することにより実現される。

音声入力部１に入力された音声は認識変換部３に入力され、認識変換部３では音声入力部１に入力された音声から特徴量を抽出する。さらに、認識変換部３は、音声から抽出した特徴量を用いて、認識語彙保持部２にあらかじめ登録されている語彙のうち、入力された音声に一致する確率の高い語彙を抽出し、当該語彙に対応付けてあらかじめ認識語彙保持部２に登録されている語彙の種別に従って、制御対象記憶部４と動作記憶部５とのいずれかに語彙（テキストデータ）を振り分けて記憶させる。

認識語彙保持部２は、認識しようとする語彙を登録した辞書であって、制御対象（照明器具や昇降装置）を意味する語彙と、制御対象に対する操作（移動方向やフィルタないし装飾の種類の選択）を意味する語彙とがあらかじめリストとして登録される。認識語彙保持部２における語彙のリストの一例を表１に示す。すなわち、語彙の種別は「制御対象」と「操作」とであって、認識変換部３において認識した語彙の種別が「制御対象」であると当該語彙は制御対象記憶部４に格納され、認識変換部３において認識した語彙の種別が「操作」であると当該語彙は動作記憶部５に格納される。

表１には示していないが、認識語彙保持部２には、「右」「左」のような移動方向も「操作」として登録される。表１において「ゴボ」は調光フィルタを意味している。

認識変換部３では、音声認識の周知の技術によって音声入力部１に入力された音声をテキストデータに変換する。すなわち、音声入力部１から認識変換部３に入力された音声は、たとえば量子化ビット数を１６、標本化周波数を１６ｋＨｚとしてＡ／Ｄ変換され、その後、分析フレーム長を２５ミリ秒、分析間隔を１０ミリ秒などとして周波数変換された後に、音声の特徴量が抽出される。音声の特徴量としては、たとえばメル周波数ケプストラム係数などを用いることができる。認識変換部３には、大量の音声データを用いてＥＭアルゴリズムなどによって学習させた隠れマルコフモデルなどの音声モデルが内部に設定されており、音声入力部１から入力された音声の特徴量を用いフォワードアルゴリズムなどを適用することによって、認識語彙保持部２に登録されているすべての語彙について各語彙を音声モデルが出力する確率を求める。このようにして語彙ごとに求めた確率が最大になる語彙を１個選択するか、あるいは確率が規定値以上の複数の語彙からなる語彙列を選択して出力する。

認識変換部３において認識語彙保持部２から語彙を選択すると、上述したように、語彙の種別が「制御対象」であれば制御対象記憶部４に格納され、語彙の種別が「操作」であれば動作記憶部５に格納される。制御対象記憶部４と動作記憶部５とは、いずれも複数個の語彙を格納することができ、制御部６で読出可能な語彙はポインタにより指定される。つまり、制御対象記憶部４と動作記憶部５とでは、新たな語彙が格納されると格納された語彙の位置がポインタ（語彙の先頭アドレスなど）により指定される。ポインタの位置は制御部６から指示可能であり、制御対象記憶部４と動作記憶部５とに残されている語彙であれば、ポインタの位置を変更することによって読出可能である。また、制御対象記憶部４と動作記憶部５とは、いずれも語彙が格納されるたびに制御部６に通知する機能を有している。

制御部６は、制御対象記憶部４と動作記憶部５とからそれぞれ語彙の格納が通知されると通知があったことを記憶し（ラッチし）、制御対象記憶部４と動作記憶部５との両方からの通知が揃った時点をトリガとして、制御対象記憶部４から制御対象の語彙を読み出すとともに、動作記憶部５から操作の語彙を読み出し、制御対象記憶部４から読み出した制御対象に対して、動作記憶部５から読み出した操作を行うように制御信号を生成する。ここに、本例における制御部６は、制御信号を一度生成すると、次に制御対象記憶部４と動作記憶部５とからそれぞれ記憶内容の更新が通知されるまでは、次のトリガを発生しないように構成してある。

制御信号は照明器具１０（図５参照）などを制御するために用いられるから、調光卓から照明器具１０への制御信号と同形式の信号を用いるのが望ましい。調光卓ではＤＭＸプロトコルの信号（ＤＭＸ信号）を用いることが多いから、制御部６から出力する制御信号をＤＭＸ信号とする場合には、制御対象を示す語彙をＤＭＸアドレスに変換するとともに、操作を示す語彙をＤＭＸ値に変換することができる変換テーブルを制御部６に設けておく。

以下に具体例を示して本例の動作を説明する。いま、表１のように、制御対象として１０台のスポットライトが設けられている場合を想定する。各スポットライトは、それぞれ５種類の色を選択することが可能であり、さらにゴボ（調光フィルタ）によって５段階の調光が可能であるものとする。

利用者が、３番目のスポットライトの色を赤色に変更する場合を例として説明する。また、制御対象記憶部４と動作記憶部５とには格納された語彙がないものとする。まず、利用者は音声入力部１に設けたマイクロホンに向かって制御対象を指定するために、「３番スポット」という音声を入力する。「３番スポット」は認識語彙保持部２に登録されているから、認識変換部３では認識語彙保持部２から「３番スポット」の語彙を選択する。「３番スポット」の種別は「制御対象」であるから「３番スポット」の語彙は制御対象記憶部４に格納され、このとき制御対象記憶部４は制御部６に対して語彙の格納を通知する。ただし、動作記憶部５には語彙が格納されておらず、制御部６には制御対象記憶部４と動作記憶部５との両方からの通知が揃っていないから、制御部６から制御信号を出力することはない。

次に、利用者が操作の内容を指示するために、マイクロホンに向かって「赤」という音声を入力すると、認識変換部３では認識語彙保持部２から「赤」という語彙を選択する。「赤」の種別は「操作」であるから、「赤」という語彙は制御対象記憶部４ではなく動作記憶部５に格納され、動作記憶部５から制御部６に語彙の格納が通知される。制御部６では、動作記憶部５から語彙の格納が通知された時点で、制御対象記憶部４と動作記憶部５との両方からの通知が揃うから、制御対象記憶部４と動作記憶部５との両方から記憶内容を読み出し、変換テーブルによって制御信号（ＤＭＸ信号）に変換し外部に出力する。制御信号はスポットライトを含む照明システムに送出され、ＤＭＸ信号に含まれるＤＭＸアドレスによって３番目のスポットライトが指定され、３番目のスポットライトの色が赤色に変更される。

ここに、上述の例では制御対象を指定してから操作を指示しているが、操作の指示の後に制御対象を指定しても同様に動作する。これは、制御部６において、制御対象と操作との指示が揃った後に、制御対象と操作とを組み合わせて制御信号を生成しているからであって、音声による指示は制御対象と操作とのどちらを先に行っても、制御部６からは同じ制御信号が出力される。また、制御部６では制御対象の指定と操作の指示とが揃うまで制御信号を出力しないから、制御対象の指定と操作の指示との間に時間が空いてもよく、利用者は指示内容を文として指示する必要がなく、制御の際の指示が容易になる。

上述したように、本構成では、認識語彙保持部２に制御対象と操作とに分けて語彙を登録しているから、制御対象と操作との語彙を組み合わせることによって、比較的少数の語彙で複雑な制御が可能になる。しかも、認識語彙保持部２に登録する語彙は文ではないから、認識変換部３における処理の負荷が比較的小さく高速な処理が可能であり、その上、単純な語彙を用いることによって音声の認識率が高くなる。つまり、誤認識や処理の遅れによって制御をやり直す可能性が低減され、音声での指示による照明制御を違和感なく行うことができる。

上述の例では、制御対象としてスポットライトを例示したから、操作の内容としては色とゴボとを例示したが、制御対象としては、モータのような駆動源を備え照射方向を制御することができるムービングライトを用いる場合もある。この種の制御対象に対する操作としては、照射方向が含まれるから、認識語彙保持部２には「右」「左」「上」「下」「ライト」「レフト」「アップ」「ダウン」などの方向を示す語彙を登録し、制御部６ではこれらの語彙に対応した制御信号を生成可能としておく。操作としては、上述のような色、ゴボ、方向のほか、調光量（光源の光出力）を含めてもよい。つまり、操作としては、色、ゴボ、方向、調光量（光出力）のうちの少なくとも１種類が選択される。

操作が方向や調光量である場合には、程度を表す語彙も認識可能としておく。たとえば、方向について「少し」「大きく」などの程度を表す語彙の組合せを可能とし、方向の語彙に「少し」が付加されていればＤＭＸ値を１５変化させ、「大きく」が付加されていればＤＭＸ値を４５変化させ、程度を表す語彙が付加されていなければＤＭＸ値を３０変化させるというように、方向について変化量の程度を付加することで、所望の向きに制御することが可能になる。調光量についても同様であって、「明るく」「暗く」などの変化の方向を示す語彙に「少し」「大きく」のような変化量の程度を表す語彙を組み合わせることで、光出力の変化量を音声によって調節することが可能になる。

上述したように、色やゴボのほかに、ムービングライトの姿勢を音声によって指示可能としたり、調光量を音声によって制御可能とすることで、照明制御をきめ細かく行うことが可能になる。しかも、姿勢や制御量の変化量を複数段階で制御可能としていることにより、音声による照明制御を簡単な語彙で行えるようにしながらも、大きく変化させたり細かく変化させたりすることが可能であって、所望の操作を音声に対応付けて簡単に行うことができる。

ところで、上述した例では、制御対象への制御信号を生成するための語彙のみを認識語彙保持部２に登録しているが、制御部６の動作を指示する語彙を認識語彙保持部２に登録し、制御部６の動作を音声によって制御してもよい。たとえば、制御部６による制御信号の出力開始を指示するための「スタート」というような制御用語彙を認識語彙保持部２に登録しておき、認識変換部３において制御用語彙を抽出したときには、制御対象記憶部４や動作記憶部５に語彙を格納するのではなく、制御部６に対して制御用語彙の内容に従う指示を通知するようにしてもよい。あるいはまた、認識変換部３で制御用語彙を抽出したときに制御部６に引き渡し、制御部６において制御用語彙に応じた動作を行うようにしてもよい。

いま、制御用語彙として上述した「スタート」を認識語彙保持部２に登録している場合を想定する。ここでは、制御部６は「スタート」による指示がなされると、制御対象記憶部４および動作記憶部５の内容を読み出して制御信号を生成する動作を行うように機能するものとする。すなわち、制御部６は、制御対象記憶部４あるいは動作記憶部５から記憶内容の更新が通知されただけでは制御信号を生成せず、認識変換部３から「スタート」を抽出したことの通知がなされると（または、「スタート」の語彙が転送されると）、制御部６は制御信号の生成を開始し、制御対象記憶部４と動作記憶部５とから記憶内容を読み出して制御信号を生成して出力する。

具体例で説明すると、利用者が、３番目のスポットライトの色を赤色に制御した後に、３番目のスポットライトの色を青色に変更する場合を想定する。３番目のスポットライトが赤色である状態において、利用者が「青」という音声を入力すると、制御対象記憶部４に「３番スポット」の語彙が登録された状態で、動作記憶部５には「青」の語彙が格納されるが、この時点では制御部６から制御信号が出力されることはなく、その後、「スタート」という音声を入力すると、制御部６が制御信号を生成して出力し、３番目のスポットライトの色が青色に変更される。「青」と「スタート」との音声の入力の間の時間についてはとくに制限はない。また、３番目のスポットライトの色を青色としてから、「スタート」という音声を入力する前であれば、別の色に変更することが可能であり、たとえば、３番目のスポットライトの色が赤色であるときに、「青」に続いて「白」という音声を入力した後に「スタート」という音声を入力すれば、３番目のスポットライトの色は青色になることなく白色に変更される。

以上説明したように、認識語彙保持部２に制御用語彙を登録しておき、認識変換部３において制御用語彙を抽出したときに、制御用語彙の内容に応じて制御部６を動作させるようにすれば、利便性の向上を図ることができる。とくに、制御対象や操作に関する音声を入力した後に、「スタート」という音声を入力するまでは、制御対象や操作の内容を変更することが可能であるから、制御信号の内容を設定する際に実際の制御前に内容変更が可能になる。

（実施形態１）
本実施形態は、基本構成とは制御部６の動作のみが異なるものである。すなわち、基本構成において説明した制御部６では制御対象記憶部４と動作記憶部５との両方からの語彙の格納の通知によって制御信号を生成すると、制御対象記憶部４と動作記憶部５との両方から語彙の格納が次に通知されるまで制御信号を出力しないように構成しているが、本実施形態の制御部６は、制御信号を生成して出力した後に、制御対象記憶部４と動作記憶部５との一方から語彙の格納が通知されると次の制御信号を生成するように構成してある。

ここでは、利用者が、３番目のスポットライトの色を赤色に指定した後に、同じスポットライトの色を青色に変更する場合を例として具体的な動作を説明する。まず、利用者は「３番スポット」と「赤」との音声入力を行うことにより、３番目のスポットライトの色を赤色に指定する。つまり、制御対象記憶部４には「３番スポット」という語彙が記憶され、動作記憶部５には「赤」という語彙が記憶される。

この状態において、利用者が、「青」という音声を入力すると動作記憶部５には「青」という語彙が格納される。動作記憶部５では新たな語彙が格納されると、新たな語彙が制御部６により最初に読出可能な語彙になるように記憶内容が更新される。また、動作記憶部５に新たな語彙が格納されると、基本構成と同様に、語彙の格納が制御部６に通知される。動作記憶部５から語彙の格納の通知があると、制御部６は、制御対象記憶部４と動作記憶部５とから語彙を読み出して制御信号に変換し制御信号を出力する。つまり、制御対象記憶部４の内容には変化がないから、３番目のスポットライトを対象とし、操作の内容が「赤」から「青」に変化して３番目のスポットライトは色を青色に変更する。

上述のようにして３番目のスポットライトの色を青色にした状態で、４番目のスポットライトの色を青色に変更するには、利用者は「４番スポット」という音声を入力する。つまり、制御対象記憶部４の記憶内容が「４番スポット」という語彙に更新され、語彙の更新が制御部６に通知される。制御部６では、動作制御部５の記憶内容が「青色」に更新されたときの通知が有効であるから、制御対象記憶部４から語彙の更新が通知されると、制御部６は、制御対象記憶部４と動作記憶部５との両方からの格納の通知が揃ったとみなし、制御対象記憶部４と動作記憶部５とから語彙を読み出して制御信号に変換し制御信号を出力する。つまり、動作制御部５の内容には変化がないから、操作の内容を「青」に保ったままで、制御対象が３番目のスポットライトから４番目のスポットライトに変更される。つまり、４番目のスポットライトの色を青にするように制御信号が生成される。

上述した動作を行うには、制御対象記憶部４と動作記憶部５との両方に語彙が格納されていなければならないから、制御対象記憶部４と動作記憶部５とには適宜の初期値をあらかじめ記憶させておくのが望ましい。あるいはまた、制御対象記憶部４と動作記憶部５とにともに語彙が格納されていなければ、制御を行わないようにすればよい。さらに、基本構成と本実施形態との動作を選択可能に構成することも可能である。

上述したように、本実施形態の構成は、同じ制御対象（スポットライト）について操作のみを次々に変更する場合や、複数の制御対象（スポットライト）について同じ操作を次々に行う場合などに、すべての制御対象と操作との組で指示を与える必要がなく、音声による指示を簡略化することができ、制御対象に対する指示を容易に与えることができる。他の構成および動作は基本構成と同様である。

ところで、基本構成では、「スタート」のように制御部６の動作を指示する制御用語彙を例示したが、本実施形態では、制御用語彙として、認識語彙保持部２に登録された語彙を登録順で選択するための語彙を用いてもよい。たとえば、制御対象をスポットライトとするときに、「前のスポット」「次のスポット」のような制御用語彙を用い、操作を色とするときに、「前の色」「次の色」のような制御用語彙を認識語彙保持部２に設定するのである。ただし、この種の制御用語彙を用いる場合に、表１を例にすれば、「スポット」が「１番スポット」……「１０番スポット」に対応し、「色」が「赤」「青」「黄」「緑」「白」に対応することを認識変換部３に認識させる必要があるから、各語彙にはカテゴリを対応付けておくことが必要である。つまり、語彙「赤」に対しては種別「操作」だけではなく、カテゴリ「色」を対応付けておくことが必要である。

認識語彙保持部２の語彙を指定する制御用語彙が認識変換部３において抽出されたときには、認識変換部３では制御対象記憶部４あるいは動作記憶部５において現在使用中の語彙（最新の制御信号を生成した語彙）のカテゴリと同じカテゴリの語彙を抽出し、同カテゴリ内で１つ前または後の語彙を読み出すのである。たとえば、「前のスポット」に対しては、カテゴリが「スポット」である制御対象のうち認識語彙保持部２での登録順が１つ前の語彙を抽出して制御対象記憶部４に格納する。また、「後のスポット」に対しては、カテゴリが「スポット」である制御対象のうち認識語彙保持部２での登録順が１つ後の語彙を抽出して制御対象記憶部４に格納する。同様にして、「前の色」「後の色」に対しては、カテゴリが「色」である操作のうち、認識語彙保持部２での登録順が１つ前あるいは後の語彙を抽出して動作記憶部５に格納する。このように認識語彙保持部２における語彙の登録順で語彙を選択する場合には、制御用語彙を入力して選択した語彙を制御対象の動作によって確認する必要があるから、制御対象記憶部４と動作記憶部５との一方の記憶内容が更新された時点で制御信号を生成する必要があり、したがって本実施形態の構成において、この種の制御用語彙を使用することが可能になる。なお、登録順での先頭と末尾との語彙は連続するように扱うのが望ましく、１番スポットの前は１０番スポットとみなし、１０番スポットの次は１番スポットとみなす。

いま、利用者が３番目のスポットライトの色を赤色に設定した後に、２番目のスポットライトを青色に変更する場合を例にする。また、認識語彙保持部２には表１の語彙が登録されているものとする。３番目のスポットライトの色が赤色であるときに、「次の色」という音声を入力すると、認識語彙保持部２に登録されている語彙のうち「色」のカテゴリの語彙「赤」「青」「黄」「緑」「白」が抽出され、登録順において「次」である「青」が選択され、「青」の種別は「操作」であるから動作記憶部５の内容が「青」に更新される。この時点では３番目のスポットライトの色が青色になるから、さらに、「前のスポット」という音声を入力することによって、認識語彙保持部２からカテゴリが「スポットライト」である語彙を抽出し、登録順で「３番スポット」の１つ「前」である「２番スポット」が制御対象記憶部４に格納される。つまり、２番目のスポットライトの色が青色になる。この動作例から明らかなように、３番目のスポットライトの色が赤色であるときに、２番目のスポットライトの色を青色にするために上述の手順を採用すると、３番目のスポットライトの色も青色になる。つまり、２番目と３番目とのスポットライトの色がともに青色になる。

３番目のスポットライトの色を赤色に保って２番目のスポットライトのみの色を青色にしようとするのであれば、まず「前のスポット」と入力して２番目のスポットライトを赤色に変更し、その後、「次の色」と入力すれば２番目のスポットライトのみの色が青色に変更されることになる。このように、音声の入力によって指定する順序を変更すれば、所望の設定が可能になる。

上述のように、認識語彙保持部２の登録順で語彙を指定する制御用語彙を設けることによって、利用者は認識語彙保持部２に登録されている語彙を記憶していなくても、指定可能な色を試すことができ、所望の色の選択が可能になる。とくに、多数色の指定が可能である場合には、全色に対応する語彙を利用者が覚えるのは困難であるから、全色を記憶することなく色の指定が可能になることによって、利用者の負担が軽減される。

ところで、「前のスポット」「次のスポット」あるいは「前の色」「次の色」というように認識語彙保持部２での登録順を指定する制御用語彙を用いる場合に、上述の例のように制御用語彙の１回の入力に対して１つの語彙だけを指定するのではなく、同じカテゴリの語彙を順に所定時間ずつ選択してもよい。つまり、認識語彙保持部２での登録順を指定する制御用語彙が抽出されると、カテゴリ内の語彙を順に自動的に選択して制御対象記憶部４または動作記憶部５に格納するのである。この動作により制御対象あるいは操作の内容を変化させた制御信号が所定時間ごとに生成されることになる。所望の状態の制御信号が得られた時点での制御状態を保持するために、認識語彙保持部２には制御用語彙として「ストップ」を用意しておく。認識変換部３では「ストップ」という制御用語彙を抽出したときには、認識語彙保持部２の登録語彙から順に語彙を選択する処理を停止する。

たとえば、２番目のスポットライトの色を赤色に設定した後に、「次の色」と入力すると、認識語彙保持部２に登録されたカテゴリが「色」である語彙が所定時間（たとえば、１秒）ずつ順に選択される。つまり、表１の例では、「青」「黄」「緑」「白」「赤」……の順で動作記憶部５の記憶内容が変更され、各色に制御する制御信号が所定時間ごとに生成され、２番目のスポットライトの色が順に変更される。そこで、２番目のスポットライトの色が所望の色になった時点で「ストップ」という音声を入力し、認識語彙保持部２に登録された語彙の選択を停止する。このようにして、認識語彙保持部２に語彙が登録されている色から所望の色を選択するために、音声を２回だけ入力すればよく、多数の色から所望の色を選択するような場合には利用者の負担を大幅に軽減することができる。上述の例では「色」について説明したが、他の操作についても同様である。また制御対象についても同様に処理することができる。

認識語彙保持部２に登録された語彙の選択を自動的に行う機能を設けていることによって、たとえば１００種類の色が選択可能である照明器具を用い、すべての色をチェックする場合を想定すると、「次の色」という音声入力を１００回行うのではなく、１回だけ「次の色」という音声入力を行った後には、「ストップ」という音声入力のみになるから、利用者の負担が大幅に軽減される。

なお、認識語彙保持部２においてムービングライトの照射方向などを指定するための上述のような方向を示す語彙を登録しているときに、方向を示す語彙の入力によって、指定された方向に所定の変化量でＤＭＸ値が変化するように認識変換部３から動作記憶部５にデータを格納するようにし、このときの１回当たりの変化量を比較的小さくしておくことによって、ムービングライトの照射方向を自動的に少しずつ変化させることが可能になる。したがって、ムービングライトの照射方向が所望の方向に到達した時点で、「ストップ」という音声の入力により、照射方向の変化を停止させれば、ムービングライトの照射方向を略連続的に変化させることが可能になる。この技術は、操作として調光量（光出力）を連続的に変化させる場合にも適用可能である。

（実施形態２）
本実施形態は、実施形態１の構成に図２のようにタイマ７を付加したものである。タイマ７は、制御対象記憶部４と動作記憶部５との一方の記憶内容が更新されることによって制御部６から制御信号を出力することが可能になった時点でリセットされ、リセットから所定時間を時限するものである。また、時限中に制御対象記憶部４と動作記憶部５との一方の記憶内容が更新されたときにもリセットされる。一方、制御部６は、タイマ７の時限動作中には制御信号を出力せず、タイマ７での時限終了が制御部６に通知されたときに、制御対象記憶部４と動作記憶部５とから語彙を読み出して制御信号を出力するように構成されている。

タイマ７は、減算カウンタであって、あらかじめ設定したカウント値から所定時間ごとに１ずつ減算し、カウント値が０になると時限動作を終了するように構成されている。すなわち、図３に示すように、タイマ７を構成するカウンタにカウント値（Ｎ）を設定した状態でタイマ７をリセット（スタート）すると（Ｓ１）、時間ΔＴごとにカウント値が１ずつ減算される（Ｓ２）。カウント値が０になるまでに制御対象記憶部４と動作記憶部５とのいずれかから語彙の更新が通知されると（Ｓ３）、カウンタはリセットされてカウント値がＮに復帰する。また、カウント値を１ずつ減算する間に制御対象記憶部４と動作記憶部５とのどちらからも語彙の更新が通知されなければ、やがてカウント値が０になり（Ｓ４）、制御部６に時限終了を通知する。

たとえば、図３においてカウンタに設定するカウント値Ｎを１００とし、時間ΔＴを１００分の１秒とすれば、タイマ７の時限時間は１秒間になる。時間ΔＴは１００分の１秒であるから、制御部６は１００分の１秒間隔で制御対象記憶部４と動作記憶部５との一方からの更新の通知を待ち受ける。この間に更新の通知がなければカウント値が０になったか否かを判断し、カウント値が０でなければ再びカウント値を１だけ減らす。また、カウント値が０であれば制御部６に通知するのである。カウント値が０ではなく、時間ΔＴの間にタイマ７が制御対象記憶部４と動作記憶部５とのいずれかから通知を受け取った場合には、カウント値を再び１００に設定して時限動作をやりなおす。

本実施形態の具体例として、利用者が、３番目のスポットライトの色を赤色に設定した後に、４番目のスポットライトの色を青色に変更する場合について説明する。利用者は、３番目のスポットライトの色を赤色に設定した状態において、まず制御対象を４番目のスポットライトに変更するために、音声入力部１に設けたマイクロホンに向かって「４番スポット」という音声を入力する。このことによって、制御対象記憶部４の記憶内容は「４番スポット」に更新される。制御対象記憶部４は内容の更新を制御部６とタイマ７とに通知される。実施形態１ではタイマ７を設けていないから、制御対象と操作とのいずれかが変更されると、ただちに制御信号が出力されていたが、本実施形態では、タイマ７による時限時間が経過するまでは制御信号が出力されない。

しかるに、カウント値は１００であって、時間ΔＴは１００分の１秒であるから、「４番スポット」という音声に続いて、「青」という音声を１秒以内に入力すると、制御部６によって制御対象記憶部４および動作記憶部５の記憶内容が読み出される前に、動作記憶部５に「青」という語彙を記憶させることができる。「青」という音声の入力から１秒以内に音声による指示を行わなければ、４番目のスポットライトを青色に変更する制御信号が制御部６から出力されるのである。「４番スポット」という音声を入力した後、１秒以内に次の音声を入力しなければ、制御対象記憶部４の記憶内容が「４番スポット」であり、動作記憶部５の記憶内容が「赤」である状態において、タイマ７から制御部６への通知がなされるから、制御部６は４番目のスポットライトを赤色に変更する制御信号を出力する。

以上説明したように、本実施形態では制御対象と操作との両方を変更する場合でも１つの制御信号で変更することができるから、制御対象と操作とをともに変更しようとする場合に、所望の状態に至る途中で不必要な状態を経由することがなく、違和感のない操作が可能になる。また、制御信号を２回送信する必要がないから、制御信号の伝送系におけるトラフィックを実施形態１の構成よりも低減することが可能である。他の構成および動作は実施形態１と同様である。

（実施形態３）
上述した各実施形態では、認識語彙保持部２において語彙のリストを１個だけ登録する例を示したが、本実施形態では複数個のリストを認識語彙保持部２に設けた例について説明する。

まず、リストを２個設ける場合について説明する。この場合、各リストには他方のリストの選択を可能とするための制御用語彙を登録する。たとえば、一方のリストには「後半を制御」という制御用語彙を登録し、他方のリストには「前半を制御」という制御用語彙を登録しておく。どちらのリストを用いるかは、認識変換部３において上述した制御用語彙を抽出することで選択可能であって、「前半」を第１のリスト、「後半」を第２のリストを意味する語彙とすれば、第１のリストに「後半を制御」という語彙を登録し、第２のリストに「前半を制御」という語彙を登録しておくことで、第１のリストの使用中において「後半を制御」という音声入力があったときに、第２のリストを使用する状態に切り替えるのである。同様に、第２のリストの使用中において「前半を制御」という音声入力があると、第１のリストを使用する状態に切り替える。

いま、１番目から５番目のスポットライトは、色の制御とゴボの制御が可能であり、６番目から１０番目のスポットライトは、色だけが制御可能な場合を想定する。この場合、認識語彙保持部２に設定される各リストは、表２、表３のようになる。

上述したように、認識語彙保持部２に２個のリストを設け、各一方のリストを切り替えて使用可能としたことにより、制御対象と操作との組がグループ化される場合に各グループごとのリストを作成することが可能であって、たとえば、制御対象のカテゴリに応じて可能な操作に制限があるような場合に、リストを分けて設定することができる。このようにリストを分けると、各リストに含まれる語彙数が低減されることにより、認識変換部３が認識語彙保持部２から語彙を抽出する際の負荷が軽減され、語彙の抽出に要する処理能力が比較的低くても語彙の抽出を実用的な時間内で行うことが可能になる。つまり、比較的安価に提供することが可能になる。また、認識変換部３において照合すべき語彙数が少なくなることによって、語彙が誤って抽出される可能性も低減され、音声による指示内容の認識率が向上する。

上述の例では２個のリストを設けているが、３個以上のリストを用いることも可能である。３個以上のリストを用いる場合には、各リスト間で他のリストを直接指定するように、最大で（リスト数−１）個の制御用語彙を登録しておけばよい。

ところで、認識語彙保持部２においてリストが選択されているときに他者と会話し、その会話において認識語彙保持部２に登録された語彙が使用されると、制御信号が出力されることがある。そこで、リストとして表５のように制御信号を生成するための語彙を含まないリスト（第２のリスト）を設定し、制御信号を生成するための語彙を含むリストと表５のような制御信号を生成しないリストとを切り替えて使用してもよい。リストの切替のために、表４のように制御信号を生成する語彙を含むリスト（第１のリスト）には、表５のリストに切り替えるための「制御停止」という制御用語彙を含め、表５のリストでは表４のリストに切り替えるための「制御開始」という制御用語彙を含める。認識変換部３では、これらの制御用語彙を抽出すると、上述した「前半を制御」「後半を制御」の語彙と同様に、リストの切替を行う。

制御部６において制御信号を生成するときには、表４に示すリストを選択しておけば、音声の入力によって制御対象および操作を選択することができ、制御部６において制御信号が生成される。一方、音声入力による制御を停止する場合には、「制御停止」という音声を入力する。「制御停止」という制御用語彙が抽出されると、認識変換部３では表５に示すリストを使用するように、リストの切替を行い、表５に示すリストでは「あ」……「ん」の５０音の単音を語彙に含むだけであり制御信号を生成する語彙を含まないから、表５に示すリストが選択されている間には、「制御開始」以外のどのような語彙を入力しても制御信号が出力されることはない。

表５のリストが選択された状態において、「制御開始」という音声入力がなされると、認識変換部３が表４のリストを使用するようになり、上述した各実施形態と同様に制御部６において制御信号を生成することが可能になる。

すなわち、図４に示すように、表４のリスト（リスト４と記載している）が選択された状態で動作を開始（スタート）すると（Ｓ１）、音声入力に対して語彙の認識を行い（Ｓ２）、抽出した語彙が「制御停止」でなければ（Ｓ３）、抽出した語彙に従って制御信号を生成する（Ｓ４）。一方、ステップＳ３において「制御停止」が抽出されると、表５のリスト（リスト５と記載している）に切り替える（Ｓ５）。この状態でも音声入力に対する語彙の認識は行うが（Ｓ６）、「制御開始」以外では何の制御も行わない（Ｓ７）。「制御開始」が入力されたときには、表４のリストに切り替えて（Ｓ８）、音声入力に対する語彙の認識を行う動作に復帰する（Ｓ２）。

以上説明したように、表４のリストが選択されている状態において、「制御停止」という音声を入力すれば、表５のリストが選択され、このリストが選択されている間には、音声入力によっては制御信号を出力することができないから、たとえばヘッドセットマイクを装着し、音声入力を可能とするスイッチ（図示せず）を投入した状態であっても、他人との会話によって制御信号が生成されることはなく、他人との打ち合わせなどを交えながら、制御信号による制御対象の制御が可能になる。他の構成および動作は基本構成と同様である。

１音声入力部
２認識語彙保持部
３認識変換部
４制御対象記憶部
５動作記憶部
６制御部
７タイマ
８発声時間計測部
９音圧レベル計測部
１０照明器具（照明機器）

Claims

照明機器を制御対象とした制御信号を生成する制御部と、使用者が音声を入力する音声入力部と、制御対象と制御対象の操作とに関する語彙のリストを登録した認識語彙保持部と、音声入力部に入力される音声から認識語彙保持部に登録されている語彙を抽出する認識変換部と、認識変換部が認識語彙保持部から抽出した語彙が制御対象であるときに当該語彙が格納される制御対象記憶部と、認識変換部が認識語彙保持部から抽出した語彙が制御対象の操作であるときに当該語彙が格納される動作記憶部とを備え、制御部は、制御対象記憶部に格納される制御対象と動作記憶部に格納される操作との一方が更新されたことをトリガとして、制御対象記憶部と動作記憶部とにそれぞれ格納された語彙で示される制御内容の制御信号を生成して出力し、認識語彙保持部は、認識語彙保持部の語彙を所定時間ごとに登録順で抽出するように認識変換部に指示する第１の制御用語彙と、認識変換部に認識語彙保持部からの語彙の抽出の停止を指示する第２の制御用語彙とを含み、認識変換部は第１の制御用語彙を抽出したときに所定時間ごとに登録順で各語彙を抽出して制御対象記憶部と動作記憶部とのいずれか一方に抽出した語彙を格納し、第２の制御用語彙を抽出した時点で認識語彙保持部からの語彙の抽出を停止することを特徴とする音声認識による照明制御装置。