JP4367005B2 - Lighting control device by voice recognition - Google Patents

Lighting control device by voice recognition Download PDF

Info

Publication number
JP4367005B2
JP4367005B2 JP2003149769A JP2003149769A JP4367005B2 JP 4367005 B2 JP4367005 B2 JP 4367005B2 JP 2003149769 A JP2003149769 A JP 2003149769A JP 2003149769 A JP2003149769 A JP 2003149769A JP 4367005 B2 JP4367005 B2 JP 4367005B2
Authority
JP
Japan
Prior art keywords
vocabulary
control
unit
storage unit
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003149769A
Other languages
Japanese (ja)
Other versions
JP2004355854A (en
Inventor
朗 馬場
秀彦 西窪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Electric Works Co Ltd
Original Assignee
Panasonic Corp
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Works Ltd filed Critical Panasonic Corp
Priority to JP2003149769A priority Critical patent/JP4367005B2/en
Publication of JP2004355854A publication Critical patent/JP2004355854A/en
Application granted granted Critical
Publication of JP4367005B2 publication Critical patent/JP4367005B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Arrangement Of Elements, Cooling, Sealing, Or The Like Of Lighting Devices (AREA)
  • Circuit Arrangement For Electric Light Sources In General (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、舞台照明やスタジオ照明において、操作卓の操作に代えて利用者の音声による照明制御を可能とした音声認識による照明制御装置に関するものである。
【0002】
【従来の技術】
一般に、舞台照明、ステージ照明、スタジオ照明のように、多数台の照明器具や昇降装置が存在しているような照明システムでは、照明機器(照明器具、昇降装置など)の操作を操作卓によって行っている(たとえば、特許文献1参照)。
【0003】
【特許文献1】
特開平6−5107号公報(第0014段落、図1)
【0004】
【発明が解決しようとする課題】
この種の操作卓では、多数台の照明機器を制御するために、可変抵抗器やスイッチを多数備えており、この種の操作卓を操作するのは容易ではなく、操作卓の操作には習熟が必要である。
【0005】
また、この種の照明では点灯させる照明器具や各照明器具の色などをシーンに応じて変化させる必要があるから、コンピュータを備える調光卓に各シーンに応じた制御内容をあらかじめプリセットしておき、シーンごとにプリセットされた制御内容に切り替えることが多い。制御内容のプリセットを行う作業には、図7に示すように、照明器具10のような照明機器を設置した舞台11の上や観客席から照明の効果を確認する人(指示者)M1と、舞台11とは別の場所に設置された調光卓12を操作する人M2(オペレータ)との2人が必要であって、2人の人M1,M2の間では無線式の通話装置などを用いて口頭による指示を行っているのが現状である。つまり2人の人が必要になる上に、口頭による指示では指示内容を伝達するのが難しいという問題がある。
【0006】
指示者M1が音声によって照明機器の制御を行うことができれば、この種の問題を解決することができると考えられる。このように音声による指示を行う場合には、照明器具や昇降装置のような制御対象を指定するとともに、各制御対象の操作を指示しなければならない。つまり、制御対象と操作との組からなる文を認識し、文の内容に応じた制御を行うことが必要であるから、制御対象の台数が多く、操作の種類が多くなれば、制御対象と操作との組合せが膨大な数になる。その結果、音声の内容と照合するためのデータの登録作業に膨大な時間がかかることになる。また、登録されているデータ(制御対象と操作との組合せ)の数が膨大であることによって、入力された音声と登録されているデータとの照合に多大の時間を要することになり、音声の入力から実際に照明機器の制御状態が変化するまでの応答に遅れが生じ、シーンなどの設定作業における作業時間が長くなるという問題が生じる。
【0007】
本発明は上記事由に鑑みて為されたものであり、その目的は、照明機器の制御を音声によって指示可能としながらも、音声を認識させるために設定するデータの量を少なくすることによって、データの登録作業を容易にし、しかも音声とデータとの照合に要する負荷を小さくした音声認識による照明制御装置を提供することにある。
【0008】
【課題を解決するための手段】
請求項1の発明は、照明機器を制御対象とした制御信号を生成する制御部と、使用者が音声を入力する音声入力部と、制御対象と制御対象の操作とに関する語彙のリストを登録した認識語彙保持部と、音声入力部に入力される音声から認識語彙保持部に登録されている語彙を抽出する認識変換部と、認識変換部が認識語彙保持部から抽出した語彙が制御対象であるときに当該語彙が格納される制御対象記憶部と、認識変換部が認識語彙保持部から抽出した語彙が制御対象の操作であるときに当該語彙が格納される動作記憶部とを備え、制御部は、制御対象記憶部に格納される制御対象と動作記憶部に格納される操作との一方が更新されたことをトリガとして制御対象記憶部と動作記憶部とにそれぞれ格納された語彙で示される制御内容の制御信号を生成して出力し、認識語彙保持部は、認識語彙保持部の語彙のうち登録順で前後の語彙を抽出するように認識変換部に指示する制御用語彙を含み、認識変換部は当該制御用語彙を抽出したときに登録順を用いて指示された語彙を認識語彙保持部から抽出することを特徴とする。
【0009】
この構成によれば、照明機器の制御を音声によって指示可能としながらも、音声を認識させるために設定するデータの量を少なくすることによって、データの登録作業を容易にし、しかも音声とデータとの照合に要する負荷を小さくすることができる。すなわち、制御部が制御対象記憶部に記憶した制御対象と動作記憶部に記憶した制御対象の操作とを結合して制御信号を生成するから、制御対象と操作とを各別に分けて入力することができ、音声入力に際しては、制御対象と操作とを別々に語彙として入力するだけで制御信号を生成することができる。また、音声入力を制御対象と操作との語彙に分けて入力することができるから、音声入力と照合する語彙を登録した認識語彙保持部においても、制御対象と操作とに関する語彙を登録しておけばよく、認識語彙保持部において制御対象と操作との語彙を組み合わせる必要がないから語彙の登録が容易になる。すなわち、認識変換部では音声入力に対して照合すべき語彙数が少ないから高速な処理が期待でき、また照合すべき語彙数が少なければ誤認の確率も低減されることになる。
さらに、制御対象と操作との一方が更新されると制御信号が生成されるから、制御対象と操作との一方を決めた後に、他方を次々に変更することが可能であり、たとえば、同じ操作を複数の制御対象に適用する際には、制御対象のみを音声入力すればよいから作業性が高くなる。
加えて、認識語彙保持部に登録されている語彙を記憶していなくとも登録順で指定することができるから、多数の語彙が登録されている場合のように記憶が困難な場合でも容易に使用することができる。
【0032】
【発明の実施の形態】
基本構成
本例は、図1に示す構成を有し、マイクロホンを備えた音声入力部1に入力される音声の指示によって制御部6から照明器具10(図7参照)の制御を可能とする制御信号を出力する。制御部6からの制御信号は、照明器具10に直接与えられるか、もしくは調光卓12を通して照明器具10に与えられる。図1に示す構成のうち、音声入力部1を除く構成はコンピュータにおいて適宜のプログラムを実行することにより実現される。
【0033】
音声入力部1に入力された音声は認識変換部3に入力され、認識変換部3では音声入力部1に入力された音声から特徴量を抽出する。さらに、認識変換部3は、音声から抽出した特徴量を用いて、認識語彙保持部2にあらかじめ登録されている語彙のうち、入力された音声に一致する確率の高い語彙を抽出し、当該語彙に対応付けてあらかじめ認識語彙保持部2に登録されている語彙の種別に従って、制御対象記憶部4と動作記憶部5とのいずれかに語彙(テキストデータ)を振り分けて記憶させる。
【0034】
認識語彙保持部2は、認識しようとする語彙を登録した辞書であって、制御対象(照明器具や昇降装置)を意味する語彙と、制御対象に対する操作(移動方向やフィルタないし装飾の種類の選択)を意味する語彙とがあらかじめリストとして登録される。 認識語彙保持部2における語彙のリストの一例を表1に示す。すなわち、語彙の種別は「制御対象」と「操作」とであって、認識変換部3において認識した語彙の種別が「制御対象」であると当該語彙は制御対象記憶部4に格納され、認識変換部3において認識した語彙の種別が「操作」であると当該語彙は動作記憶部5に格納される。
【0035】
【表1】

Figure 0004367005
【0036】
表1には示していないが、認識語彙保持部2には、「右」「左」のような移動方向も「操作」として登録される。表1において「ゴボ」は調光フィルタを意味している。
【0037】
認識変換部3では、音声認識の周知の技術によって音声入力部1に入力された音声をテキストデータに変換する。すなわち、音声入力部1から認識変換部3に入力された音声は、たとえば量子化ビット数を16、標本化周波数を16kHzとしてA/D変換され、その後、分析フレーム長を25ミリ秒、分析間隔を10ミリ秒などとして周波数変換された後に、音声の特徴量が抽出される。音声の特徴量としては、たとえばメル周波数ケプストラム係数などを用いることができる。認識変換部3には、大量の音声データを用いてEMアルゴリズムなどによって学習させた隠れマルコフモデルなどの音声モデルが内部に設定されており、音声入力部1から入力された音声の特徴量を用いフォワードアルゴリズムなどを適用することによって、認識語彙保持部2に登録されているすべての語彙について各語彙を音声モデルが出力する確率を求める。このようにして語彙ごとに求めた確率が最大になる語彙を1個選択するか、あるいは確率が規定値以上の複数の語彙からなる語彙列を選択して出力する。
【0038】
認識変換部3において認識語彙保持部2から語彙を選択すると、上述したように、語彙の種別が「制御対象」であれば制御対象記憶部4に格納され、語彙の種別が「操作」であれば動作記憶部5に格納される。制御対象記憶部4と動作記憶部5とは、いずれも複数個の語彙を格納することができ、制御部6で読出可能な語彙はポインタにより指定される。つまり、制御対象記憶部4と動作記憶部5とでは、新たな語彙が格納されると格納された語彙の位置がポインタ(語彙の先頭アドレスなど)により指定される。ポインタの位置は制御部6から指示可能であり、制御対象記憶部4と動作記憶部5とに残されている語彙であれば、ポインタの位置を変更することによって読出可能である。また、制御対象記憶部4と動作記憶部5とは、いずれも語彙が格納されるたびに制御部6に通知する機能を有している。
【0039】
制御部6は、制御対象記憶部4と動作記憶部5とからそれぞれ語彙の格納が通知されると通知があったことを記憶し(ラッチし)、制御対象記憶部4と動作記憶部5との両方からの通知が揃った時点をトリガとして、制御対象記憶部4から制御対象の語彙を読み出すとともに、動作記憶部5から操作の語彙を読み出し、制御対象記憶部4から読み出した制御対象に対して、動作記憶部5から読み出した操作を行うように制御信号を生成する。ここに、本例における制御部6は、制御信号を一度生成すると、次に制御対象記憶部4と動作記憶部5とからそれぞれ記憶内容の更新が通知されるまでは、次のトリガを発生しないように構成してある。
【0040】
制御信号は照明器具10(図7参照)などを制御するために用いられるから、調光卓から照明器具10への制御信号と同形式の信号を用いるのが望ましい。調光卓ではDMXプロトコルの信号(DMX信号)を用いることが多いから、制御部6から出力する制御信号をDMX信号とする場合には、制御対象を示す語彙をDMXアドレスに変換するとともに、操作を示す語彙をDMX値に変換することができる変換テーブルを制御部6に設けておく。
【0041】
以下に具体例を示して本例の動作を説明する。いま、表1のように、制御対象として10台のスポットライトが設けられている場合を想定する。各スポットライトは、それぞれ5種類の色を選択することが可能であり、さらにゴボ(調光フィルタ)によって5段階の調光が可能であるものとする。
【0042】
利用者が、3番目のスポットライトの色を赤色に変更する場合を例として説明する。また、制御対象記憶部4と動作記憶部5とには格納された語彙がないものとする。まず、利用者は音声入力部1に設けたマイクロホンに向かって制御対象を指定するために、「3番スポット」という音声を入力する。「3番スポット」は認識語彙保持部2に登録されているから、認識変換部3では認識語彙保持部2から「3番スポット」の語彙を選択する。「3番スポット」の種別は「制御対象」であるから「3番スポット」の語彙は制御対象記憶部4に格納され、このとき制御対象記憶部4は制御部6に対して語彙の格納を通知する。ただし、動作記憶部5には語彙が格納されておらず、制御部6には制御対象記憶部4と動作記憶部5との両方からの通知が揃っていないから、制御部6から制御信号を出力することはない。
【0043】
次に、利用者が操作の内容を指示するために、マイクロホンに向かって「赤」という音声を入力すると、認識変換部3では認識語彙保持部2から「赤」という語彙を選択する。「赤」の種別は「操作」であるから、「赤」という語彙は制御対象記憶部4ではなく動作記憶部5に格納され、動作記憶部5から制御部6に語彙の格納が通知される。制御部6では、動作記憶部5から語彙の格納が通知された時点で、制御対象記憶部4と動作記憶部5との両方からの通知が揃うから、制御対象記憶部4と動作記憶部5との両方から記憶内容を読み出し、変換テーブルによって制御信号(DMX信号)に変換し外部に出力する。制御信号はスポットライトを含む照明システムに送出され、DMX信号に含まれるDMXアドレスによって3番目のスポットライトが指定され、3番目のスポットライトの色が赤色に変更される。
【0044】
ここに、上述の例では制御対象を指定してから操作を指示しているが、操作の指示の後に制御対象を指定しても同様に動作する。これは、制御部6において、制御対象と操作との指示が揃った後に、制御対象と操作とを組み合わせて制御信号を生成しているからであって、音声による指示は制御対象と操作とのどちらを先に行っても、制御部6からは同じ制御信号が出力される。また、制御部6では制御対象の指定と操作の指示とが揃うまで制御信号を出力しないから、制御対象の指定と操作の指示との間に時間が空いてもよく、利用者は指示内容を文として指示する必要がなく、制御の際の指示が容易になる。
【0045】
上述したように、本例の構成では、認識語彙保持部2に制御対象と操作とに分けて語彙を登録しているから、制御対象と操作との語彙を組み合わせることによって、比較的少数の語彙で複雑な制御が可能になる。しかも、認識語彙保持部2に登録する語彙は文ではないから、認識変換部3における処理の負荷が比較的小さく高速な処理が可能であり、その上、単純な語彙を用いることによって音声の認識率が高くなる。つまり、誤認識や処理の遅れによって制御をやり直す可能性が低減され、音声での指示による照明制御を違和感なく行うことができる。
【0046】
上述の例では、制御対象としてスポットライトを例示したから、操作の内容としては色とゴボとを例示したが、制御対象としては、モータのような駆動源を備え照射方向を制御することができるムービングライトを用いる場合もある。この種の制御対象に対する操作としては、照射方向が含まれるから、認識語彙保持部2には「右」「左」「上」「下」「ライト」「レフト」「アップ」「ダウン」などの方向を示す語彙を登録し、制御部6ではこれらの語彙に対応した制御信号を生成可能としておく。操作としては、上述のような色、ゴボ、方向のほか、調光量(光源の光出力)を含めてもよい。つまり、操作としては、色、ゴボ、方向、調光量(光出力)のうちの少なくとも1種類が選択される。
【0047】
操作が方向や調光量である場合には、程度を表す語彙も認識可能としておく。たとえば、方向について「少し」「大きく」などの程度を表す語彙の組合せを可能とし、方向の語彙に「少し」が付加されていればDMX値を15変化させ、「大きく」が付加されていればDMX値を45変化させ、程度を表す語彙が付加されていなければDMX値を30変化させるというように、方向について変化量の程度を付加することで、所望の向きに制御することが可能になる。調光量についても同様であって、「明るく」「暗く」などの変化の方向を示す語彙に「少し」「大きく」のような変化量の程度を表す語彙を組み合わせることで、光出力の変化量を音声によって調節することが可能になる。
【0048】
上述したように、色やゴボのほかに、ムービングライトの姿勢を音声によって指示可能としたり、調光量を音声によって制御可能とすることで、照明制御をきめ細かく行うことが可能になる。しかも、姿勢や制御量の変化量を複数段階で制御可能としていることにより、音声による照明制御を簡単な語彙で行えるようにしながらも、大きく変化させたり細かく変化させたりすることが可能であって、所望の操作を音声に対応付けて簡単に行うことができる。
【0049】
ところで、上述した例では、制御対象への制御信号を生成するための語彙のみを認識語彙保持部2に登録しているが、制御部6の動作を指示する語彙を認識語彙保持部2に登録し、制御部6の動作を音声によって制御してもよい。たとえば、制御部6による制御信号の出力開始を指示するための「スタート」というような制御用語彙を認識語彙保持部2に登録しておき、認識変換部3において制御用語彙を抽出したときには、制御対象記憶部4や動作記憶部5に語彙を格納するのではなく、制御部6に対して制御用語彙の内容に従う指示を通知するようにしてもよい。あるいはまた、認識変換部3で制御用語彙を抽出したときに制御部6に引き渡し、制御部6において制御用語彙に応じた動作を行うようにしてもよい。
【0050】
いま、制御用語彙として上述した「スタート」を認識語彙保持部2に登録している場合を想定する。ここでは、制御部6は「スタート」による指示がなされると、制御対象記憶部4および動作記憶部5の内容を読み出して制御信号を生成する動作を行うように機能するものとする。すなわち、制御部6は、制御対象記憶部4あるいは動作記憶部5から記憶内容の更新が通知されただけでは制御信号を生成せず、認識変換部3から「スタート」を抽出したことの通知がなされると(または、「スタート」の語彙が転送されると)、制御部6は制御信号の生成を開始し、制御対象記憶部4と動作記憶部5とから記憶内容を読み出して制御信号を生成して出力する。
【0051】
具体例で説明すると、利用者が、3番目のスポットライトの色を赤色に制御した後に、3番目のスポットライトの色を青色に変更する場合を想定する。3番目のスポットライトが赤色である状態において、利用者が「青」という音声を入力すると、制御対象記憶部4に「3番スポット」の語彙が登録された状態で、動作記憶部5には「青」の語彙が格納されるが、この時点では制御部6から制御信号が出力されることはなく、その後、「スタート」という音声を入力すると、制御部6が制御信号を生成して出力し、3番目のスポットライトの色が青色に変更される。「青」と「スタート」との音声の入力の間の時間についてはとくに制限はない。また、3番目のスポットライトの色を青色としてから、「スタート」という音声を入力する前であれば、別の色に変更することが可能であり、たとえば、3番目のスポットライトの色が赤色であるときに、「青」に続いて「白」という音声を入力した後に「スタート」という音声を入力すれば、3番目のスポットライトの色は青色になることなく白色に変更される。
【0052】
以上説明したように、認識語彙保持部2に制御用語彙を登録しておき、認識変換部3において制御用語彙を抽出したときに、制御用語彙の内容に応じて制御部6を動作させるようにすれば、利便性の向上を図ることができる。とくに、制御対象や操作に関する音声を入力した後に、「スタート」という音声を入力するまでは、制御対象や操作の内容を変更することが可能であるから、制御信号の内容を設定する際に実際の制御前に内容変更が可能になる。
【0053】
実施形態1
本実施形態は、基本構成とは制御部6の動作のみが異なるものである。すなわち、基本構成において説明した制御部6では制御対象記憶部4と動作記憶部5との両方からの語彙の格納の通知によって制御信号を生成すると、制御対象記憶部4と動作記憶部5との両方から語彙の格納が次に通知されるまで制御信号を出力しないように構成しているが、本実施形態の制御部6は、制御信号を生成して出力した後に、制御対象記憶部4と動作記憶部5との一方から語彙の格納が通知されると次の制御信号を生成するように構成してある。
【0054】
ここでは、利用者が、3番目のスポットライトの色を赤色に指定した後に、同じスポットライトの色を青色に変更する場合を例として具体的な動作を説明する。まず、利用者は「3番スポット」と「赤」との音声入力を行うことにより、3番目のスポットライトの色を赤色に指定する。つまり、制御対象記憶部4には「3番スポット」という語彙が記憶され、動作記憶部5には「赤」という語彙が記憶される。
【0055】
この状態において、利用者が、「青」という音声を入力すると動作記憶部5には「青」という語彙が格納される。動作記憶部5では新たな語彙が格納されると、新たな語彙が制御部6により最初に読出可能な語彙になるように記憶内容が更新される。また、動作記憶部5に新たな語彙が格納されると、基本構成と同様に、語彙の格納が制御部6に通知される。動作記憶部5から語彙の格納の通知があると、制御部6は、制御対象記憶部4と動作記憶部5とから語彙を読み出して制御信号に変換し制御信号を出力する。つまり、制御対象記憶部4の内容には変化がないから、3番目のスポットライトを対象とし、操作の内容が「赤」から「青」に変化して3番目のスポットライトは色を青色に変更する。
【0056】
上述のようにして3番目のスポットライトの色を青色にした状態で、4番目のスポットライトの色を青色に変更するには、利用者は「4番スポット」という音声を入力する。つまり、制御対象記憶部4の記憶内容が「4番スポット」という語彙に更新され、語彙の更新が制御部6に通知される。制御部6では、動作制御部5の記憶内容が「青色」に更新されたときの通知が有効であるから、制御対象記憶部4から語彙の更新が通知されると、制御部6は、制御対象記憶部4と動作記憶部5との両方からの格納の通知が揃ったとみなし、制御対象記憶部4と動作記憶部5とから語彙を読み出して制御信号に変換し制御信号を出力する。つまり、動作制御部5の内容には変化がないから、操作の内容を「青」に保ったままで、制御対象が3番目のスポットライトから4番目のスポットライトに変更される。つまり、4番目のスポットライトの色を青にするように制御信号が生成される。
【0057】
上述した動作を行うには、制御対象記憶部4と動作記憶部5との両方に語彙が格納されていなければならないから、制御対象記憶部4と動作記憶部5とには適宜の初期値をあらかじめ記憶させておくのが望ましい。あるいはまた、制御対象記憶部4と動作記憶部5とにともに語彙が格納されていなければ、制御を行わないようにすればよい。さらに、基本構成と実施形態1との動作を選択可能に構成することも可能である。
【0058】
上述したように、本実施形態の構成は、同じ制御対象(スポットライト)について操作のみを次々に変更する場合や、複数の制御対象(スポットライト)について同じ操作を次々に行う場合などに、すべての制御対象と操作との組で指示を与える必要がなく、音声による指示を簡略化することができ、制御対象に対する指示を容易に与えることができる。他の構成および動作は基本構成と同様である。
【0059】
ところで、基本構成では、「スタート」のように制御部6の動作を指示する制御用語彙を例示したが、本実施形態では、制御用語彙として、認識語彙保持部2に登録された語彙を登録順で選択するための語彙を用いてもよい。たとえば、制御対象をスポットライトとするときに、「前のスポット」「次のスポット」のような制御用語彙を用い、操作を色とするときに、「前の色」「次の色」のような制御用語彙を認識語彙保持部2に設定するのである。ただし、この種の制御用語彙を用いる場合に、表1を例にすれば、「スポット」が「1番スポット」……「10番スポット」に対応し、「色」が「赤」「青」「黄」「緑」「白」に対応することを認識変換部3に認識させる必要があるから、各語彙にはカテゴリを対応付けておくことが必要である。つまり、語彙「赤」に対しては種別「操作」だけではなく、カテゴリ「色」を対応付けておくことが必要である。
【0060】
認識語彙保持部2の語彙を指定する制御用語彙が認識変換部3において抽出されたときには、認識変換部3では制御対象記憶部4あるいは動作記憶部5において現在使用中の語彙(最新の制御信号を生成した語彙)のカテゴリと同じカテゴリの語彙を抽出し、同カテゴリ内で1つ前または後の語彙を読み出すのである。たとえば、「前のスポット」に対しては、カテゴリが「スポット」である制御対象のうち認識語彙保持部2での登録順が1つ前の語彙を抽出して制御対象記憶部4に格納する。また、「後のスポット」に対しては、カテゴリが「スポット」である制御対象のうち認識語彙保持部2での登録順が1つ後の語彙を抽出して制御対象記憶部4に格納する。同様にして、「前の色」「後の色」に対しては、カテゴリが「色」である操作のうち、認識語彙保持部2での登録順が1つ前あるいは後の語彙を抽出して動作記憶部5に格納する。このように認識語彙保持部2における語彙の登録順で語彙を選択する場合には、制御用語彙を入力して選択した語彙を制御対象の動作によって確認する必要があるから、制御対象記憶部4と動作記憶部5との一方の記憶内容が更新された時点で制御信号を生成する必要があり、したがって本実施形態の構成において、この種の制御用語彙を使用することが可能になる。なお、登録順での先頭と末尾との語彙は連続するように扱うのが望ましく、1番スポットの前は10番スポットとみなし、10番スポットの次は1番スポットとみなす。
【0061】
いま、利用者が3番目のスポットライトの色を赤色に設定した後に、2番目のスポットライトを青色に変更する場合を例にする。また、認識語彙保持部2には表1の語彙が登録されているものとする。3番目のスポットライトの色が赤色であるときに、「次の色」という音声を入力すると、認識語彙保持部2に登録されている語彙のうち「色」のカテゴリの語彙「赤」「青」「黄」「緑」「白」が抽出され、登録順において「次」である「青」が選択され、「青」の種別は「操作」であるから動作記憶部5の内容が「青」に更新される。この時点では3番目のスポットライトの色が青色になるから、さらに、「前のスポット」という音声を入力することによって、認識語彙保持部2からカテゴリが「スポットライト」である語彙を抽出し、登録順で「3番スポット」の1つ「前」である「2番スポット」が制御対象記憶部4に格納される。つまり、2番目のスポットライトの色が青色になる。この動作例から明らかなように、3番目のスポットライトの色が赤色であるときに、2番目のスポットライトの色を青色にするために上述の手順を採用すると、3番目のスポットライトの色も青色になる。つまり、2番目と3番目とのスポットライトの色がともに青色になる。
【0062】
3番目のスポットライトの色を赤色に保って2番目のスポットライトのみの色を青色にしようとするのであれば、まず「前のスポット」と入力して2番目のスポットライトを赤色に変更し、その後、「次の色」と入力すれば2番目のスポットライトのみの色が青色に変更されることになる。このように、音声の入力によって指定する順序を変更すれば、所望の設定が可能になる。
【0063】
上述のように、認識語彙保持部2の登録順で語彙を指定する制御用語彙を設けることによって、利用者は認識語彙保持部2に登録されている語彙を記憶していなくても、指定可能な色を試すことができ、所望の色の選択が可能になる。とくに、多数色の指定が可能である場合には、全色に対応する語彙を利用者が覚えるのは困難であるから、全色を記憶することなく色の指定が可能になることによって、利用者の負担が軽減される。
【0064】
ところで、「前のスポット」「次のスポット」あるいは「前の色」「次の色」というように認識語彙保持部2での登録順を指定する制御用語彙を用いる場合に、上述の例のように制御用語彙の1回の入力に対して1つの語彙だけを指定するのではなく、同じカテゴリの語彙を順に所定時間ずつ選択してもよい。つまり、認識語彙保持部2での登録順を指定する制御用語彙が抽出されると、カテゴリ内の語彙を順に自動的に選択して制御対象記憶部4または動作記憶部5に格納するのである。この動作により制御対象あるいは操作の内容を変化させた制御信号が所定時間ごとに生成されることになる。所望の状態の制御信号が得られた時点での制御状態を保持するために、認識語彙保持部2には制御用語彙として「ストップ」を用意しておく。認識変換部3では「ストップ」という制御用語彙を抽出したときには、認識語彙保持部2の登録語彙から順に語彙を選択する処理を停止する。
【0065】
たとえば、2番目のスポットライトの色を赤色に設定した後に、「次の色」と入力すると、認識語彙保持部2に登録されたカテゴリが「色」である語彙が所定時間(たとえば、1秒)ずつ順に選択される。つまり、表1の例では、「青」「黄」「緑」「白」「赤」……の順で動作記憶部5の記憶内容が変更され、各色に制御する制御信号が所定時間ごとに生成され、2番目のスポットライトの色が順に変更される。そこで、2番目のスポットライトの色が所望の色になった時点で「ストップ」という音声を入力し、認識語彙保持部2に登録された語彙の選択を停止する。このようにして、認識語彙保持部2に語彙が登録されている色から所望の色を選択するために、音声を2回だけ入力すればよく、多数の色から所望の色を選択するような場合には利用者の負担を大幅に軽減することができる。上述の例では「色」について説明したが、他の操作についても同様である。また制御対象についても同様に処理することができる。
【0066】
認識語彙保持部2に登録された語彙の選択を自動的に行う機能を設けていることによって、たとえば100種類の色が選択可能である照明器具を用い、すべての色をチェックする場合を想定すると、「次の色」という音声入力を100回行うのではなく、1回だけ「次の色」という音声入力を行った後には、「ストップ」という音声入力のみになるから、利用者の負担が大幅に軽減される。
【0067】
なお、認識語彙保持部2においてムービングライトの照射方向などを指定するための上述のような方向を示す語彙を登録しているときに、方向を示す語彙の入力によって、指定された方向に所定の変化量でDMX値が変化するように認識変換部3から動作記憶部5にデータを格納するようにし、このときの1回当たりの変化量を比較的小さくしておくことによって、ムービングライトの照射方向を自動的に少しずつ変化させることが可能になる。したがって、ムービングライトの照射方向が所望の方向に到達した時点で、「ストップ」という音声の入力により、照射方向の変化を停止させれば、ムービングライトの照射方向を略連続的に変化させることが可能になる。この技術は、操作として調光量(光出力)を連続的に変化させる場合にも適用可能である。
【0068】
実施形態2
本実施形態は、実施形態1の構成に図2のようにタイマ7を付加したものである。タイマ7は、制御対象記憶部4と動作記憶部5との一方の記憶内容が更新されることによって制御部6から制御信号を出力することが可能になった時点でリセットされ、リセットから所定時間を時限するものである。また、時限中に制御対象記憶部4と動作記憶部5との一方の記憶内容が更新されたときにもリセットされる。一方、制御部6は、タイマ7の時限動作中には制御信号を出力せず、タイマ7での時限終了が制御部6に通知されたときに、制御対象記憶部4と動作記憶部5とから語彙を読み出して制御信号を出力するように構成されている。
【0069】
タイマ7は、減算カウンタであって、あらかじめ設定したカウント値から所定時間ごとに1ずつ減算し、カウント値が0になると時限動作を終了するように構成されている。すなわち、図3に示すように、タイマ7を構成するカウンタにカウント値(N)を設定した状態でタイマ7をリセット(スタート)すると(S1)、時間ΔTごとにカウント値が1ずつ減算される(S2)。カウント値が0になるまでに制御対象記憶部4と動作記憶部5とのいずれかから語彙の更新が通知されると(S3)、カウンタはリセットされてカウント値がNに復帰する。また、カウント値を1ずつ減算する間に制御対象記憶部4と動作記憶部5とのどちらからも語彙の更新が通知されなければ、やがてカウント値が0になり(S4)、制御部6に時限終了を通知する。
【0070】
たとえば、図3においてカウンタに設定するカウント値Nを100とし、時間ΔTを100分の1秒とすれば、タイマ7の時限時間は1秒間になる。時間ΔTは100分の1秒であるから、制御部6は100分の1秒間隔で制御対象記憶部4と動作記憶部5との一方からの更新の通知を待ち受ける。この間に更新の通知がなければカウント値が0になったか否かを判断し、カウント値が0でなければ再びカウント値を1だけ減らす。また、カウント値が0であれば制御部6に通知するのである。カウント値が0ではなく、時間ΔTの間にタイマ7が制御対象記憶部4と動作記憶部5とのいずれかから通知を受け取った場合には、カウント値を再び100に設定して時限動作をやりなおす。
【0071】
本実施形態の具体例として、利用者が、3番目のスポットライトの色を赤色に設定した後に、4番目のスポットライトの色を青色に変更する場合について説明する。利用者は、3番目のスポットライトの色を赤色に設定した状態において、まず制御対象を4番目のスポットライトに変更するために、音声入力部1に設けたマイクロホンに向かって「4番スポット」という音声を入力する。このことによって、制御対象記憶部4の記憶内容は「4番スポット」に更新される。制御対象記憶部4は内容の更新を制御部6とタイマ7とに通知される。実施形態1ではタイマ7を設けていないから、制御対象と操作とのいずれかが変更されると、ただちに制御信号が出力されていたが、本実施形態では、タイマ7による時限時間が経過するまでは制御信号が出力されない。
【0072】
しかるに、カウント値は100であって、時間ΔTは100分の1秒であるから、「4番スポット」という音声に続いて、「青」という音声を1秒以内に入力すると、制御部6によって制御対象記憶部4および動作記憶部5の記憶内容が読み出される前に、動作記憶部5に「青」という語彙を記憶させることができる。「青」という音声の入力から1秒以内に音声による指示を行わなければ、4番目のスポットライトを青色に変更する制御信号が制御部6から出力されるのである。「4番スポット」という音声を入力した後、1秒以内に次の音声を入力しなければ、制御対象記憶部4の記憶内容が「4番スポット」であり、動作記憶部5の記憶内容が「赤」である状態において、タイマ7から制御部6への通知がなされるから、制御部6は4番目のスポットライトを赤色に変更する制御信号を出力する。
【0073】
以上説明したように、本実施形態では制御対象と操作との両方を変更する場合でも1つの制御信号で変更することができるから、制御対象と操作とをともに変更しようとする場合に、所望の状態に至る途中で不必要な状態を経由することがなく、違和感のない操作が可能になる。また、制御信号を2回送信する必要がないから、制御信号の伝送系におけるトラフィックを実施形態1の構成よりも低減することが可能である。他の構成および動作は実施形態1と同様である。
【0074】
実施形態3
上述した各実施形態では、認識語彙保持部2において語彙のリストを1個だけ登録する例を示したが、本実施形態では複数個のリストを認識語彙保持部2に設けた例について説明する。
【0075】
まず、リストを2個設ける場合について説明する。この場合、各リストには他方のリストの選択を可能とするための制御用語彙を登録する。たとえば、一方のリストには「後半を制御」という制御用語彙を登録し、他方のリストには「前半を制御」という制御用語彙を登録しておく。どちらのリストを用いるかは、認識変換部3において上述した制御用語彙を抽出することで選択可能であって、「前半」を第1のリスト、「後半」を第2のリストを意味する語彙とすれば、第1のリストに「後半を制御」という語彙を登録し、第2のリストに「前半を制御」という語彙を登録しておくことで、第1のリストの使用中において「後半を制御」という音声入力があったときに、第2のリストを使用する状態に切り替えるのである。同様に、第2のリストの使用中において「前半を制御」という音声入力があると、第1のリストを使用する状態に切り替える。
【0076】
いま、1番目から5番目のスポットライトは、色の制御とゴボの制御が可能であり、6番目から10番目のスポットライトは、色だけが制御可能な場合を想定する。この場合、認識語彙保持部2に設定される各リストは、表2、表3のようになる。
【0077】
【表2】
Figure 0004367005
【0078】
【表3】
Figure 0004367005
【0079】
上述したように、認識語彙保持部2に2個のリストを設け、各一方のリストを切り替えて使用可能としたことにより、制御対象と操作との組がグループ化される場合に各グループごとのリストを作成することが可能であって、たとえば、制御対象のカテゴリに応じて可能な操作に制限があるような場合に、リストを分けて設定することができる。このようにリストを分けると、各リストに含まれる語彙数が低減されることにより、認識変換部3が認識語彙保持部2から語彙を抽出する際の負荷が軽減され、語彙の抽出に要する処理能力が比較的低くても語彙の抽出を実用的な時間内で行うことが可能になる。つまり、比較的安価に提供することが可能になる。また、認識変換部3において照合すべき語彙数が少なくなることによって、語彙が誤って抽出される可能性も低減され、音声による指示内容の認識率が向上する。
【0080】
上述の例では2個のリストを設けているが、3個以上のリストを用いることも可能である。3個以上のリストを用いる場合には、各リスト間で他のリストを直接指定するように、最大で(リスト数−1)個の制御用語彙を登録しておけばよい。
【0081】
ところで、認識語彙保持部2においてリストが選択されているときに他者と会話し、その会話において認識語彙保持部2に登録された語彙が使用されると、制御信号が出力されることがある。そこで、リストとして表5のように制御信号を生成するための語彙を含まないリスト(第2のリスト)を設定し、制御信号を生成するための語彙を含むリストと表5のような制御信号を生成しないリストとを切り替えて使用してもよい。リストの切替のために、表4のように制御信号を生成する語彙を含むリスト(第1のリスト)には、表5のリストに切り替えるための「制御停止」という制御用語彙を含め、表5のリストでは表4のリストに切り替えるための「制御開始」という制御用語彙を含める。認識変換部3では、これらの制御用語彙を抽出すると、上述した「前半を制御」「後半を制御」の語彙と同様に、リストの切替を行う。
【0082】
【表4】
Figure 0004367005
【0083】
【表5】
Figure 0004367005
【0084】
制御部6において制御信号を生成するときには、表4に示すリストを選択しておけば、音声の入力によって制御対象および操作を選択することができ、制御部6において制御信号が生成される。一方、音声入力による制御を停止する場合には、「制御停止」という音声を入力する。「制御停止」という制御用語彙が抽出されると、認識変換部3では表5に示すリストを使用するように、リストの切替を行い、表5に示すリストでは「あ」……「ん」の50音の単音を語彙に含むだけであり制御信号を生成する語彙を含まないから、表5に示すリストが選択されている間には、「制御開始」以外のどのような語彙を入力しても制御信号が出力されることはない。
【0085】
表5のリストが選択された状態において、「制御開始」という音声入力がなされると、認識変換部3が表4のリストを使用するようになり、上述した各実施形態と同様に制御部6において制御信号を生成することが可能になる。
【0086】
すなわち、図4に示すように、表4のリスト(リスト4と記載している)が選択された状態で動作を開始(スタート)すると(S1)、音声入力に対して語彙の認識を行い(S2)、抽出した語彙が「制御停止」でなければ(S3)、抽出した語彙に従って制御信号を生成する(S4)。一方、ステップS3において「制御停止」が抽出されると、表5のリスト(リスト5と記載している)に切り替える(S5)。この状態でも音声入力に対する語彙の認識は行うが(S6)、「制御開始」以外では何の制御も行わない(S7)。「制御開始」が入力されたときには、表4のリストに切り替えて(S8)、音声入力に対する語彙の認識を行う動作に復帰する(S2)。
【0087】
以上説明したように、表4のリストが選択されている状態において、「制御停止」という音声を入力すれば、表5のリストが選択され、このリストが選択されている間には、音声入力によっては制御信号を出力することができないから、たとえばヘッドセットマイクを装着し、音声入力を可能とするスイッチ(図示せず)を投入した状態であっても、他人との会話によって制御信号が生成されることはなく、他人との打ち合わせなどを交えながら、制御信号による制御対象の制御が可能になる。他の構成および動作は基本構成と同様である。
【0088】
参考例1
実施形態1においては、照射方向や調光量を連続的(アナログ的)に変化させる技術として、開始点(「次の色」などの入力)と終了点(「ストップ」の入力)とを指定し、中間値を自動的に生成する技術を例示した。これに対して、本実施形態では、開始点と終了点との指定を行わず、音声入力の継続時間をDMX値に換算することによって、照射方向や調光量を連続的に変化させるものである。
【0089】
すなわち、図1に示した基本構成に対して、図5に示すように、音声入力部1に入力された音声の継続時間を計測する発声時間計測部8を付加してあり、発声時間計測部8において計測された時間を制御部6に与えることによって、音声の入力が継続した時間によってDMX値が変化するように構成してある。音声入力の継続時間は、音声信号の包絡線が規定値以上である期間を計測すればよい。制御部6では、動作記憶部5から読み出した操作に基づいて設定したDMX値に対して、音声入力の継続時間の係数倍の値を乗じることによって得た積を、制御信号のDMX値とする。継続時間に乗じる係数は適宜に設定される。
【0090】
たとえば、動作記憶部5から読み出した「右」という動作に対応するDMX値が30であって、「右」という音声入力の継続時間が0.5秒で係数が3であるとすれば、3×0.5×30=45であって、制御信号のDMX値は45になる。また、同条件で音声の継続時間が0.3秒であるとすると、制御信号のDMX値は27になる。要するに、制御対象の動作の変化量を音声入力の継続時間に比例させているのである。
【0091】
上述のように本実施形態の構成では、可変抵抗器などを用いることなく、入力する音声の継続時間によってアナログ量の指示が可能になり、直感的な制御が可能となる。他の構成および動作は基本構成と同様である。
【0092】
参考例2
本実施形態は、参考例1と同様に、開始点と終了点との指定を行わずにDMX値をアナログ的に変化させるものである。ただし、参考例1では音声入力の継続時間を用いてDMX値に換算していたのに対して、本実施形態では音声入力部1に入力された音声の音圧レベルをDMX値に換算する点で相違する。すなわち、図6に示すように、音声入力部1の出力レベルを音圧レベルとみなして計測する音圧レベル計測部9を設け、音圧レベル計測部9で求めた音圧レベルを制御部6に入力することによって、制御部6において音圧レベルに応じたDMX値を生成し、このDMX値による制御信号を生成する。ここに、音圧レベル計測部9では音圧レベルの平均値あるいは最大値を音圧レベルとして求める。
【0093】
制御部6では、動作記憶部5から読み出した操作に基づいて設定したDMX値に対して、音声入力の音圧レベルの係数倍の値を乗じることによって得た積を、制御信号のDMX値とする。音圧レベルに乗じる係数は適宜に設定される。
【0094】
たとえば、動作記憶部5には「右」という操作が入力され、「右」に対するDMX値が30であるものとし、音声入力部1から入力された「右」という音声の音圧レベルが60dBAであり、係数を0.02とすれば、0.02×60×30=36であって、DMX値は36になる。一方、音声の音圧レベルが50dBAであったならば、最終的なDMX値として30が送信される。要するに、制御対象の動作の変化量を音声入力の音圧レベルに比例させているのである。
【0095】
上述のように本実施形態の構成では、可変抵抗器などを用いることなく、入力する音声の継続時間によってアナログ量の指示が可能になり、直感的な制御が可能となる。他の構成および動作は基本構成と同様である。
【0096】
【発明の効果】
本発明の構成によれば、照明機器の制御を音声によって指示可能としながらも、音声を認識させるために設定するデータの量を少なくすることによって、データの登録作業を容易にし、しかも音声とデータとの照合に要する負荷を小さくすることができるという利点がある。すなわち、制御部が制御対象記憶部に記憶した制御対象と動作記憶部に記憶した制御対象の操作とを結合して制御信号を生成するから、制御対象と操作とを各別に分けて入力することができ、音声入力に際しては、制御対象と操作とを別々に語彙として入力するだけで制御信号を生成することができる。また、音声入力を制御対象と操作との語彙に分けて入力することができるから、音声入力と照合する語彙を登録した認識語彙保持部においても、制御対象と操作とに関する語彙を登録しておけばよく、認識語彙保持部において制御対象と操作との語彙を組み合わせる必要がないから語彙の登録が容易になる。すなわち、認識変換部では音声入力に対して照合すべき語彙数が少ないから高速な処理が期待でき、また照合すべき語彙数が少なければ誤認の確率も低減されることになる。
さらに、制御対象と操作との一方が更新されると制御信号が生成されるから、制御対象と操作との一方を決めた後に、他方を次々に変更することが可能であり、たとえば、同じ操作を複数の制御対象に適用する際には、制御対象のみを音声入力すればよいから作業性が高くなる。
加えて、認識語彙保持部に登録されている語彙を記憶していなくとも登録順で指定することができるから、多数の語彙が登録されている場合のように記憶が困難な場合でも容易に使用することができる。
【図面の簡単な説明】
【図1】 基本構成、実施形態1を示すブロック図である。
【図2】 実施形態2を示すブロック図である。
【図3】 実施形態2を示す動作説明図である。
【図4】 実施形態3を示す動作説明図である。
【図5】 参考例1を示すブロック図である。
【図6】 参考例2を示すブロック図である。
【図7】 従来例の概略構成図である。
【符号の説明】
1 音声入力部
2 認識語彙保持部
3 認識変換部
4 制御対象記憶部
5 動作記憶部
6 制御部
7 タイマ
8 発声時間計測部
9 音圧レベル計測部
10 照明器具[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a lighting control device by voice recognition that enables lighting control by a user's voice in place of operation of an operation console in stage lighting or studio lighting.
[0002]
[Prior art]
In general, in lighting systems where there are multiple lighting fixtures and lifting devices, such as stage lighting, stage lighting, and studio lighting, the lighting equipment (lighting fixtures, lifting devices, etc.) is operated by the console. (For example, refer to Patent Document 1).
[0003]
[Patent Document 1]
JP-A-6-5107 (paragraph 0014, FIG. 1)
[0004]
[Problems to be solved by the invention]
This type of console is equipped with a number of variable resistors and switches to control a large number of lighting devices, so it is not easy to operate this type of console, and you are familiar with the operation of the console. is required.
[0005]
Also, with this type of lighting, it is necessary to change the lighting fixtures to be turned on and the color of each lighting fixture in accordance with the scene. In many cases, the control content is preset for each scene. As shown in FIG. 7, the work for performing the presetting of the control contents includes a person (instructor) M1 who confirms the lighting effect on the stage 11 where the lighting device such as the lighting device 10 is installed or from the audience seat, Two people, M2 (operator) who operates the dimming table 12 installed in a place different from the stage 11, are necessary. Between the two people M1 and M2, a wireless communication device is used. It is currently used to give verbal instructions. That is, there are problems that two people are required and that it is difficult to convey the contents of the instructions by verbal instructions.
[0006]
It is considered that this kind of problem can be solved if the instructor M1 can control the lighting device by voice. Thus, when giving an instruction by voice, it is necessary to specify a control object such as a lighting fixture or a lifting device and to instruct an operation of each control object. In other words, since it is necessary to recognize a sentence consisting of a set of control objects and operations and perform control according to the contents of the sentence, if the number of control objects is large and the types of operations are large, There are a huge number of combinations with operations. As a result, it takes an enormous amount of time to register data for collation with the contents of the voice. In addition, since the number of registered data (combinations of controlled objects and operations) is enormous, it takes a lot of time to collate the input voice with the registered data. There is a delay in the response from the input until the control state of the lighting device actually changes, and there is a problem that the work time in setting work such as a scene becomes long.
[0007]
The present invention has been made in view of the above-mentioned reasons, and its purpose is to reduce the amount of data set for recognizing voice while enabling control of the lighting device by voice. It is an object of the present invention to provide a lighting control device based on voice recognition that facilitates the registration work and reduces the load required for collating voice and data.
[0008]
[Means for Solving the Problems]
  The invention of claim 1 registers a control unit that generates a control signal for a lighting device as a control target, a voice input unit for a user to input voice, and a list of vocabularies related to the control target and the control target operation. The recognition vocabulary holding unit, the recognition conversion unit for extracting the vocabulary registered in the recognition vocabulary holding unit from the voice input to the voice input unit, and the vocabulary extracted by the recognition conversion unit from the recognition vocabulary holding unit are the control targets A control object storage unit that sometimes stores the vocabulary, and an operation storage unit that stores the vocabulary when the vocabulary extracted from the recognition vocabulary holding unit by the recognition conversion unit is an operation to be controlled,The control unit is triggered by one of the control target stored in the control target storage unit and the operation stored in the action storage unit being updated.Generates and outputs control signals for the control content indicated by the vocabulary stored in the control target storage and action storageThe recognition vocabulary holding unit includes a control vocabulary that instructs the recognition conversion unit to extract the vocabulary before and after the vocabulary of the recognition vocabulary holding unit in the registration order, and the recognition conversion unit extracts the control vocabulary Sometimes the specified vocabulary is extracted from the recognition vocabulary holding unit using the registration orderIt is characterized by that.
[0009]
  According to this configuration, the control of the lighting device can be instructed by voice, but the amount of data set for recognizing the voice is reduced, thereby facilitating data registration work, and further, the voice and data can be controlled. The load required for verification can be reduced. That is, the control unit generates a control signal by combining the control object stored in the control object storage unit and the operation of the control object stored in the operation storage unit, so that the control object and the operation are input separately. In the case of voice input, a control signal can be generated simply by inputting a control object and an operation separately as a vocabulary. In addition, since voice input can be divided into vocabulary of control target and operation, the vocabulary related to the control target and operation can be registered even in the recognized vocabulary holding unit in which the vocabulary to be collated with speech input is registered. In other words, it is not necessary to combine the vocabulary of the controlled object and the operation in the recognized vocabulary holding unit, so that the vocabulary can be easily registered. That is, since the recognition conversion unit has a small number of vocabularies to be collated with respect to the voice input, high-speed processing can be expected, and if the number of vocabularies to be collated is small, the probability of misidentification is reduced.
Furthermore, when one of the control object and the operation is updated, a control signal is generated. Therefore, after determining one of the control object and the operation, the other can be changed one after another. For example, the same operation Is applied to a plurality of control objects, it is only necessary to input the sound of only the control object.
In addition, even if the vocabulary registered in the recognition vocabulary holding unit is not memorized, it can be specified in the order of registration, so it can be used easily even when it is difficult to memorize it, such as when many vocabularies are registered can do.
[0032]
DETAILED DESCRIPTION OF THE INVENTION
  (Basic configuration)
  This example1 has the configuration shown in FIG. 1, and outputs a control signal enabling control of the lighting fixture 10 (see FIG. 7) from the control unit 6 according to a voice instruction input to the voice input unit 1 having a microphone. . The control signal from the control unit 6 is given directly to the lighting fixture 10 or given to the lighting fixture 10 through the dimming console 12. Among the configurations shown in FIG. 1, the configuration excluding the voice input unit 1 is realized by executing an appropriate program in a computer.
[0033]
The voice input to the voice input unit 1 is input to the recognition conversion unit 3, and the recognition conversion unit 3 extracts a feature amount from the voice input to the voice input unit 1. Further, the recognition conversion unit 3 uses the feature amount extracted from the speech to extract a vocabulary having a high probability of matching the input speech from the vocabulary registered in the recognition vocabulary holding unit 2 in advance. In accordance with the type of vocabulary registered in the recognized vocabulary holding unit 2 in advance, the vocabulary (text data) is distributed and stored in either the control target storage unit 4 or the action storage unit 5.
[0034]
The recognition vocabulary holding unit 2 is a dictionary in which vocabulary to be recognized is registered, and a vocabulary meaning a control target (lighting device or lifting device) and an operation on the control target (selection of moving direction, filter or decoration type) ) Is registered in advance as a list. An example of a vocabulary list in the recognized vocabulary holding unit 2 is shown in Table 1. That is, when the vocabulary type is “control target” and “operation” and the vocabulary type recognized by the recognition conversion unit 3 is “control target”, the vocabulary is stored in the control target storage unit 4 and recognized. If the type of vocabulary recognized by the conversion unit 3 is “operation”, the vocabulary is stored in the action storage unit 5.
[0035]
[Table 1]
Figure 0004367005
[0036]
Although not shown in Table 1, the movement direction such as “right” and “left” is also registered as “operation” in the recognized vocabulary holding unit 2. In Table 1, “gobo” means a dimming filter.
[0037]
The recognition conversion unit 3 converts the voice input to the voice input unit 1 into text data by a known technique of voice recognition. That is, the speech input from the speech input unit 1 to the recognition conversion unit 3 is A / D converted, for example, with a quantization bit number of 16 and a sampling frequency of 16 kHz, and then an analysis frame length of 25 milliseconds and an analysis interval. Is converted to a frequency of 10 milliseconds or the like, and then the feature amount of the voice is extracted. For example, a mel frequency cepstrum coefficient or the like can be used as the voice feature amount. In the recognition conversion unit 3, a speech model such as a hidden Markov model trained by an EM algorithm or the like using a large amount of speech data is set inside, and the feature amount of speech input from the speech input unit 1 is used. By applying a forward algorithm or the like, the probability that the speech model outputs each vocabulary for all vocabularies registered in the recognized vocabulary holding unit 2 is obtained. In this way, one vocabulary having the maximum probability obtained for each vocabulary is selected, or a vocabulary string composed of a plurality of vocabularies having a probability equal to or higher than a predetermined value is selected and output.
[0038]
When the vocabulary is selected from the recognized vocabulary holding unit 2 in the recognition conversion unit 3, as described above, if the vocabulary type is “control target”, it is stored in the control target storage unit 4, and the vocabulary type is “operation”. Stored in the operation storage unit 5. Both the control object storage unit 4 and the action storage unit 5 can store a plurality of vocabularies, and the vocabulary that can be read by the control unit 6 is designated by a pointer. That is, in the controlled object storage unit 4 and the action storage unit 5, when a new vocabulary is stored, the position of the stored vocabulary is designated by a pointer (such as the vocabulary start address). The position of the pointer can be instructed from the control unit 6, and any vocabulary remaining in the control target storage unit 4 and the action storage unit 5 can be read by changing the pointer position. The controlled object storage unit 4 and the action storage unit 5 both have a function of notifying the control unit 6 every time a vocabulary is stored.
[0039]
  The control unit 6 stores (latches) the notification when the storage of the vocabulary is notified from the control target storage unit 4 and the action storage unit 5, and the control target storage unit 4, the action storage unit 5, As a trigger, when the notifications from both are collected, the control target vocabulary is read from the control target storage unit 4, the operation vocabulary is read from the operation storage unit 5, and the control target read from the control target storage unit 4 is read Then, a control signal is generated so as to perform the operation read from the operation storage unit 5. here,This exampleThe control unit 6 in FIG. 1 is configured so that once the control signal is generated, the next trigger is not generated until the update of the storage contents is notified from the control target storage unit 4 and the operation storage unit 5 respectively. is there.
[0040]
Since the control signal is used to control the lighting fixture 10 (see FIG. 7) and the like, it is desirable to use a signal having the same format as the control signal from the light control console to the lighting fixture 10. Since the light control table often uses a DMX protocol signal (DMX signal), when the control signal output from the control unit 6 is a DMX signal, the vocabulary indicating the control target is converted into a DMX address and the operation is performed. Is provided in the control unit 6 so that the vocabulary indicating can be converted into a DMX value.
[0041]
  Here is a specific exampleThis exampleThe operation of will be described. Now, as shown in Table 1, it is assumed that ten spotlights are provided as control targets. It is assumed that each spotlight can select five kinds of colors, and can be dimmed in five stages by a gobo (a dimming filter).
[0042]
An example will be described in which the user changes the color of the third spotlight to red. Further, it is assumed that the controlled object storage unit 4 and the operation storage unit 5 have no stored vocabulary. First, the user inputs a voice “No. 3 spot” in order to designate a control target toward the microphone provided in the voice input unit 1. Since “No. 3 spot” is registered in the recognized vocabulary holding unit 2, the recognition conversion unit 3 selects the vocabulary “No. 3 spot” from the recognized vocabulary holding unit 2. Since the type of “No. 3 spot” is “control target”, the vocabulary of “No. 3 spot” is stored in the control target storage unit 4. At this time, the control target storage unit 4 stores the vocabulary in the control unit 6. Notice. However, since the vocabulary is not stored in the operation storage unit 5 and the control unit 6 has not received notifications from both the control target storage unit 4 and the operation storage unit 5, a control signal is sent from the control unit 6. There is no output.
[0043]
Next, when the user inputs the voice “red” to the microphone in order to instruct the content of the operation, the recognition conversion unit 3 selects the vocabulary “red” from the recognition vocabulary holding unit 2. Since the type of “red” is “operation”, the vocabulary “red” is stored not in the control target storage unit 4 but in the operation storage unit 5, and the storage of the vocabulary is notified from the operation storage unit 5 to the control unit 6. . In the control unit 6, when the storage of the vocabulary is notified from the operation storage unit 5, notifications from both the control target storage unit 4 and the operation storage unit 5 are prepared, so the control target storage unit 4 and the operation storage unit 5. The stored contents are read out from both, converted into a control signal (DMX signal) by a conversion table, and output to the outside. The control signal is sent to the illumination system including the spotlight, the third spotlight is designated by the DMX address included in the DMX signal, and the color of the third spotlight is changed to red.
[0044]
Here, in the above-described example, the operation is instructed after designating the control target. However, the same operation is performed even if the control target is designated after the operation instruction. This is because the control unit 6 generates a control signal by combining the control object and the operation after the instructions for the control object and the operation are aligned. Regardless of which is performed first, the control unit 6 outputs the same control signal. Further, since the control unit 6 does not output the control signal until the control target designation and the operation instruction are completed, there may be time between the control target designation and the operation instruction. It is not necessary to instruct as a sentence, and the instruction at the time of control becomes easy.
[0045]
  As mentioned above,This exampleIn this configuration, since the vocabulary is registered separately in the recognition vocabulary holding unit 2 for the controlled object and the operation, complicated control can be performed with a relatively small number of vocabularies by combining the vocabulary of the controlled object and the operation. Become. Moreover, since the vocabulary registered in the recognition vocabulary holding unit 2 is not a sentence, the processing load in the recognition conversion unit 3 is relatively small and high-speed processing is possible. In addition, speech recognition is achieved by using a simple vocabulary. The rate is high. That is, the possibility of redoing the control due to misrecognition or processing delay is reduced, and lighting control by voice instruction can be performed without a sense of incongruity.
[0046]
In the above example, the spotlight is exemplified as the control target. Therefore, the color and gobo are illustrated as the contents of the operation. However, the control target includes a drive source such as a motor and can control the irradiation direction. A moving light may be used. Since the operation for this type of control target includes the irradiation direction, the recognition vocabulary holding unit 2 includes “right”, “left”, “up”, “down”, “right”, “left”, “up”, “down”, and the like. The vocabulary indicating the direction is registered, and the control unit 6 can generate control signals corresponding to these vocabularies. As the operation, in addition to the color, gobo, and direction as described above, a dimming amount (light output of the light source) may be included. That is, as the operation, at least one of color, gobo, direction, and light control amount (light output) is selected.
[0047]
When the operation is a direction or dimming amount, a vocabulary representing the degree is also made recognizable. For example, it is possible to combine vocabulary indicating the degree of “little” or “large” in the direction, and if “little” is added to the vocabulary in the direction, the DMX value is changed by 15 and “large” is added. For example, the DMX value is changed by 45, and if the vocabulary representing the degree is not added, the DMX value is changed by 30. By adding the degree of change in the direction, it is possible to control in a desired direction. Become. The same applies to the light control amount, and the change in light output is achieved by combining the vocabulary indicating the degree of change, such as “little” or “large”, with the vocabulary indicating the direction of change, such as “bright” or “dark”. The amount can be adjusted by voice.
[0048]
As described above, in addition to colors and gobos, it is possible to finely control illumination by making it possible to indicate the moving light posture by voice and by controlling the light control amount by voice. In addition, by making it possible to control the amount of change in posture and control amount in multiple stages, it is possible to make large or small changes while allowing voice lighting control to be performed with a simple vocabulary. The desired operation can be easily performed in association with the voice.
[0049]
In the above example, only the vocabulary for generating the control signal for the control target is registered in the recognition vocabulary holding unit 2, but the vocabulary instructing the operation of the control unit 6 is registered in the recognition vocabulary holding unit 2. Then, the operation of the control unit 6 may be controlled by voice. For example, when a control vocabulary such as “start” for instructing the control unit 6 to start outputting a control signal is registered in the recognition vocabulary holding unit 2 and the recognition conversion unit 3 extracts the control vocabulary, Instead of storing the vocabulary in the control target storage unit 4 or the action storage unit 5, an instruction according to the contents of the control vocabulary may be notified to the control unit 6. Alternatively, when the control vocabulary is extracted by the recognition conversion unit 3, the control vocabulary may be transferred to the control unit 6, and the control unit 6 may perform an operation according to the control vocabulary.
[0050]
Assume that the above-mentioned “start” is registered in the recognized vocabulary holding unit 2 as a control vocabulary. Here, it is assumed that the control unit 6 functions to read out the contents of the control target storage unit 4 and the operation storage unit 5 and generate a control signal when an instruction by “start” is given. That is, the control unit 6 does not generate a control signal only when the update of the storage content is notified from the control target storage unit 4 or the operation storage unit 5, and a notification that “start” is extracted from the recognition conversion unit 3. When it is made (or when the vocabulary “start” is transferred), the control unit 6 starts generating a control signal, reads out the stored contents from the control target storage unit 4 and the operation storage unit 5 and outputs the control signal. Generate and output.
[0051]
To explain with a specific example, it is assumed that the user changes the color of the third spotlight to blue after controlling the color of the third spotlight to red. In a state where the third spotlight is red, when the user inputs a voice of “blue”, the vocabulary “No. 3 spot” is registered in the control target storage unit 4 and the operation storage unit 5 stores the vocabulary. The vocabulary of “blue” is stored, but at this point, the control signal is not output from the control unit 6, and thereafter, when the voice “start” is input, the control unit 6 generates and outputs the control signal. Then, the color of the third spotlight is changed to blue. There is no particular limitation on the time between the input of the “blue” and “start” voices. It is also possible to change the color of the third spotlight from blue to another color before the “start” sound is input, for example, the color of the third spotlight is red. If the voice “Start” is input after the voice “White” is input after “Blue”, the color of the third spotlight is changed to white without becoming blue.
[0052]
As described above, when the control vocabulary is registered in the recognition vocabulary holding unit 2 and the control vocabulary is extracted by the recognition conversion unit 3, the control unit 6 is operated according to the contents of the control vocabulary. In this way, convenience can be improved. In particular, it is possible to change the contents of the control object and operation until the sound of “Start” is input after inputting the sound related to the control object and operation. The contents can be changed before the control.
[0053]
  (Embodiment 1)
  This embodimentBasic configurationIs different only in the operation of the control unit 6. That is,Basic configurationIn the control unit 6 described in the above, when the control signal is generated by the vocabulary storage notification from both the control target storage unit 4 and the action storage unit 5, the vocabulary of the vocabulary is generated from both the control target storage unit 4 and the action storage unit 5. The control unit 6 according to the present embodiment is configured not to output the control signal until the next storage is notified. However, after generating and outputting the control signal, the control unit 6 and the operation storage unit 5 are configured to output the control signal. When the storage of the vocabulary is notified from one of the above, the next control signal is generated.
[0054]
Here, a specific operation will be described by taking as an example a case where the user changes the color of the same spotlight to blue after designating the color of the third spotlight to red. First, the user designates the color of the third spotlight as red by performing voice input of “No. 3 spot” and “Red”. That is, the vocabulary “No. 3 spot” is stored in the control target storage unit 4, and the vocabulary “red” is stored in the operation storage unit 5.
[0055]
  In this state, when the user inputs the sound “blue”, the vocabulary “blue” is stored in the operation storage unit 5. When a new vocabulary is stored in the action storage unit 5, the stored contents are updated so that the new vocabulary becomes a vocabulary that can be read first by the control unit 6. Further, when a new vocabulary is stored in the action storage unit 5,Basic configurationSimilarly, the storage of the vocabulary is notified to the control unit 6. When the storage of the vocabulary is notified from the action storage unit 5, the control unit 6 reads the vocabulary from the control target storage unit 4 and the action storage unit 5, converts it into a control signal, and outputs the control signal. That is, since there is no change in the contents of the control target storage unit 4, the third spotlight is targeted, the operation content changes from “red” to “blue”, and the third spotlight changes its color to blue. change.
[0056]
In order to change the color of the fourth spotlight to blue in the state where the color of the third spotlight is blue as described above, the user inputs the voice “No. 4 spot”. That is, the storage content of the control target storage unit 4 is updated to the vocabulary “No. 4 spot”, and the vocabulary update is notified to the control unit 6. In the control unit 6, since the notification when the storage content of the operation control unit 5 is updated to “blue” is valid, when the vocabulary update is notified from the control target storage unit 4, the control unit 6 Assuming that the storage notifications from both the target storage unit 4 and the action storage unit 5 have been prepared, the vocabulary is read from the control target storage unit 4 and the action storage unit 5, converted into a control signal, and the control signal is output. That is, since the content of the operation control unit 5 is not changed, the control target is changed from the third spotlight to the fourth spotlight while the operation content is kept “blue”. That is, the control signal is generated so that the color of the fourth spotlight is blue.
[0057]
  In order to perform the above-described operation, the vocabulary must be stored in both the control object storage unit 4 and the operation storage unit 5, so appropriate initial values are set in the control object storage unit 4 and the operation storage unit 5. It is desirable to memorize in advance. Alternatively, if no vocabulary is stored in both the control target storage unit 4 and the action storage unit 5, the control may be omitted. further,Basic configuration and Embodiment 1It is also possible to configure so that the operation can be selected.
[0058]
  As described above, the configuration of the present embodiment can be applied to the case where only the operation is sequentially changed for the same control target (spotlight) or the same operation is sequentially performed for a plurality of control targets (spotlights). It is not necessary to give an instruction by a combination of the control object and the operation, the voice instruction can be simplified, and the instruction to the control object can be easily given. Other configurations and operations areBasic configurationIt is the same.
[0059]
  by the way,Basic configurationIn the above example, the control vocabulary for instructing the operation of the control unit 6 is illustrated as “start”, but in this embodiment, the vocabulary registered in the recognized vocabulary holding unit 2 is selected as the control vocabulary in the order of registration. Vocabulary may be used. For example, when a control object is a spotlight, a control vocabulary such as “previous spot” or “next spot” is used, and when an operation is a color, “previous color” or “next color” Such a control vocabulary is set in the recognition vocabulary holding unit 2. However, if this type of control vocabulary is used, taking Table 1 as an example, “spot” corresponds to “1st spot” …… “10th spot”, and “color” is “red” “blue” Since it is necessary for the recognition conversion unit 3 to recognize that “Yellow”, “Green”, and “White” correspond, it is necessary to associate categories with each vocabulary. That is, it is necessary to associate not only the type “operation” but also the category “color” with the vocabulary “red”.
[0060]
When the control vocabulary designating the vocabulary of the recognized vocabulary holding unit 2 is extracted by the recognition conversion unit 3, the recognition conversion unit 3 uses the vocabulary currently used in the controlled object storage unit 4 or the operation storage unit 5 (the latest control signal). The vocabulary of the same category as the category of the vocabulary generated) is extracted, and the previous or subsequent vocabulary in the same category is read out. For example, for the “previous spot”, the vocabulary whose registration order in the recognition vocabulary holding unit 2 is the previous one among the control objects whose category is “spot” is extracted and stored in the control target storage unit 4. . For “subsequent spot”, a vocabulary whose registration order in the recognized vocabulary holding unit 2 is one after the control target having the category “spot” is extracted and stored in the control target storage unit 4. . Similarly, with respect to “previous color” and “subsequent color”, vocabulary whose registration order in the recognized vocabulary holding unit 2 is one before or after is extracted from operations whose category is “color”. And stored in the operation storage unit 5. When the vocabulary is selected in the vocabulary registration order in the recognized vocabulary holding unit 2 as described above, it is necessary to input the control vocabulary and confirm the selected vocabulary by the operation of the control target. Therefore, it is necessary to generate a control signal when one of the stored contents of the operation storage unit 5 is updated. Therefore, this type of control vocabulary can be used in the configuration of this embodiment. It should be noted that the vocabulary at the beginning and end in the order of registration is preferably handled so that it is considered to be the 10th spot before the 1st spot and the 1st spot after the 10th spot.
[0061]
Now, an example is given in which the user changes the second spotlight to blue after setting the color of the third spotlight to red. Further, it is assumed that the vocabulary shown in Table 1 is registered in the recognized vocabulary holding unit 2. If the voice of “next color” is input when the color of the third spotlight is red, the vocabulary “red” and “blue” in the “color” category among the vocabularies registered in the recognized vocabulary holding unit 2. ”,“ Yellow ”,“ green ”, and“ white ”are extracted,“ blue ”that is“ next ”is selected in the registration order, and the type of“ blue ”is“ operation ”, so the content of the operation storage unit 5 is“ blue ” Is updated. At this time, since the color of the third spotlight is blue, the vocabulary whose category is “spotlight” is further extracted from the recognized vocabulary holding unit 2 by inputting the voice “previous spot”, “No. 2 spot” that is one “front” of “No. 3 spot” in the order of registration is stored in the control target storage unit 4. That is, the color of the second spotlight is blue. As is clear from this operation example, when the above-described procedure is used to change the color of the second spotlight to blue when the color of the third spotlight is red, the color of the third spotlight Also turns blue. In other words, both the second and third spotlights are blue.
[0062]
If you want to keep the color of the 3rd spotlight red and make the color of only the 2nd spotlight blue, first enter “Previous Spot” and change the 2nd spotlight to red. Thereafter, if “next color” is input, only the color of the second spotlight is changed to blue. In this way, if the order specified by voice input is changed, a desired setting can be made.
[0063]
As described above, by providing a control vocabulary that specifies the vocabulary in the registration order of the recognized vocabulary holding unit 2, the user can specify the vocabulary registered in the recognized vocabulary holding unit 2 without memorizing it. Various colors can be tried and a desired color can be selected. In particular, when multiple colors can be specified, it is difficult for the user to memorize the vocabulary corresponding to all colors, so it is possible to specify colors without memorizing all colors. The burden on the person is reduced.
[0064]
By the way, when using the control vocabulary that specifies the registration order in the recognition vocabulary holding unit 2 such as “previous spot”, “next spot” or “previous color”, “next color”, Thus, instead of designating only one vocabulary for one input of control vocabulary, vocabularies in the same category may be selected in order for a predetermined time. That is, when the control vocabulary specifying the registration order in the recognized vocabulary holding unit 2 is extracted, the vocabulary in the category is automatically selected in order and stored in the controlled object storage unit 4 or the action storage unit 5. . By this operation, a control signal in which the control target or the content of the operation is changed is generated every predetermined time. In order to hold the control state at the time when the control signal of the desired state is obtained, the recognition vocabulary holding unit 2 prepares “stop” as the control vocabulary. When the recognition conversion unit 3 extracts the control vocabulary “stop”, the process of selecting the vocabulary in order from the registered vocabulary in the recognition vocabulary holding unit 2 is stopped.
[0065]
For example, after setting the color of the second spotlight to red and inputting “next color”, the vocabulary whose category registered in the recognized vocabulary holding unit 2 is “color” is displayed for a predetermined time (for example, 1 second). ) Are selected in order. That is, in the example of Table 1, the storage contents of the operation storage unit 5 are changed in the order of “blue”, “yellow”, “green”, “white”, “red”,... And the color of the second spotlight is changed in order. Therefore, when the color of the second spotlight becomes a desired color, a voice of “stop” is input, and selection of the vocabulary registered in the recognized vocabulary holding unit 2 is stopped. In this way, in order to select a desired color from colors registered in the recognized vocabulary holding unit 2, it is only necessary to input a voice twice, and a desired color is selected from a number of colors. In some cases, the burden on the user can be greatly reduced. In the above example, “color” has been described, but the same applies to other operations. Moreover, it can process similarly about a control object.
[0066]
Assuming that all the colors are checked by using a lighting device capable of selecting, for example, 100 colors by providing a function for automatically selecting a vocabulary registered in the recognized vocabulary holding unit 2. Since the voice input of “next color” is not performed 100 times, but the voice input of “next color” is performed only once, only the voice input of “stop” is performed. It is greatly reduced.
[0067]
Note that when the vocabulary indicating the direction as described above for specifying the moving light irradiation direction and the like is registered in the recognized vocabulary holding unit 2, a predetermined direction is input in the specified direction by inputting the vocabulary indicating the direction. The data is stored in the motion storage unit 5 from the recognition conversion unit 3 so that the DMX value changes according to the amount of change, and the amount of change per time at this time is kept relatively small, thereby moving the irradiation of the moving light. The direction can be automatically changed little by little. Therefore, when the moving light irradiation direction reaches the desired direction, the moving light irradiation direction can be changed substantially continuously if the change of the irradiation direction is stopped by inputting the voice of “stop”. It becomes possible. This technique can also be applied when continuously adjusting the light control amount (light output) as an operation.
[0068]
  (Embodiment 2)
  This embodimentEmbodiment 1In this configuration, a timer 7 is added as shown in FIG. The timer 7 is reset when a control signal can be output from the control unit 6 by updating the stored contents of one of the controlled object storage unit 4 and the operation storage unit 5, and a predetermined time from the reset. Is timed. It is also reset when the stored contents of one of the controlled object storage unit 4 and the operation storage unit 5 are updated during the time limit. On the other hand, the control unit 6 does not output a control signal during the time limit operation of the timer 7, and when the control unit 6 is notified of the end of the time limit in the timer 7, the control target storage unit 4 and the operation storage unit 5 The vocabulary is read from and the control signal is output.
[0069]
The timer 7 is a subtraction counter, and is configured to subtract one by one from a preset count value every predetermined time, and when the count value becomes 0, the timed operation is terminated. That is, as shown in FIG. 3, when the timer 7 is reset (started) with the count value (N) set in the counter constituting the timer 7 (S1), the count value is decremented by 1 every time ΔT. (S2). When the update of the vocabulary is notified from either the control target storage unit 4 or the action storage unit 5 until the count value becomes 0 (S3), the counter is reset and the count value returns to N. If neither the controlled object storage unit 4 nor the action storage unit 5 is notified of the vocabulary update while subtracting the count value by 1, the count value eventually becomes 0 (S4), and the control unit 6 is notified. Notify end of time.
[0070]
For example, if the count value N set in the counter in FIG. 3 is 100 and the time ΔT is 1/100 second, the time limit of the timer 7 is 1 second. Since the time ΔT is 1/100 second, the control unit 6 waits for an update notification from one of the control target storage unit 4 and the operation storage unit 5 at intervals of 1/100 second. If there is no update notification during this period, it is determined whether or not the count value has become 0. If the count value is not 0, the count value is decreased by 1 again. If the count value is 0, the control unit 6 is notified. When the count value is not 0 and the timer 7 receives a notification from either the control target storage unit 4 or the operation storage unit 5 during the time ΔT, the count value is set to 100 again and the timed operation is performed. Try again.
[0071]
  As a specific example of this embodiment, a case will be described in which the user changes the color of the fourth spotlight to blue after setting the color of the third spotlight to red. In the state in which the color of the third spotlight is set to red, the user firstly changes the control target to the fourth spotlight, toward the microphone provided in the voice input unit 1, "No. 4 spot". Enter the voice. As a result, the storage content of the control target storage unit 4 is updated to “No. 4 spot”. The control target storage unit 4 is notified of the content update to the control unit 6 and the timer 7.Embodiment 1However, since the timer 7 is not provided, the control signal is output immediately when either the control target or the operation is changed. In the present embodiment, the control signal is output until the time limit of the timer 7 elapses. Is not output.
[0072]
However, since the count value is 100 and the time ΔT is 1/100 second, if the voice “blue” is input within one second following the voice “No. 4 spot”, the control unit 6 Before the storage contents of the control target storage unit 4 and the operation storage unit 5 are read, the vocabulary “blue” can be stored in the operation storage unit 5. If no voice instruction is given within one second from the input of the voice “blue”, a control signal for changing the fourth spotlight to blue is output from the control unit 6. If the next voice is not inputted within one second after inputting the voice “No. 4 spot”, the storage content of the control target storage unit 4 is “No. 4 spot” and the storage content of the operation storage unit 5 is In the state of “red”, since the timer 7 notifies the control unit 6, the control unit 6 outputs a control signal for changing the fourth spotlight to red.
[0073]
  As described above, in the present embodiment, even when both the control object and the operation are changed, the control object can be changed with one control signal. There is no need to go through an unnecessary state on the way to the state, and an operation without a sense of incompatibility becomes possible. Also, since there is no need to send the control signal twice, traffic in the control signal transmission systemEmbodiment 1It is possible to reduce more than the structure of this. Other configurations and operations areEmbodiment 1It is the same.
[0074]
  (Embodiment 3)
  In each of the embodiments described above, an example in which only one vocabulary list is registered in the recognized vocabulary holding unit 2 has been described, but in this embodiment, an example in which a plurality of lists are provided in the recognized vocabulary holding unit 2 will be described.
[0075]
First, a case where two lists are provided will be described. In this case, a control vocabulary for enabling selection of the other list is registered in each list. For example, a control vocabulary “control the second half” is registered in one list, and a control vocabulary “control the first half” is registered in the other list. Which list is used can be selected by extracting the control vocabulary described above in the recognition conversion unit 3, and the vocabulary that means “first half” means the first list and “second half” means the second list. Then, by registering the vocabulary “control the second half” in the first list and registering the vocabulary “control the first half” in the second list, the “second half” is used during the use of the first list. When there is a voice input "control", the state is switched to a state where the second list is used. Similarly, when there is a voice input “control the first half” while using the second list, the state is switched to the state where the first list is used.
[0076]
It is assumed that the first to fifth spotlights can be controlled in color and gobo, and the sixth to tenth spotlights can only be controlled in color. In this case, the lists set in the recognized vocabulary holding unit 2 are as shown in Tables 2 and 3.
[0077]
[Table 2]
Figure 0004367005
[0078]
[Table 3]
Figure 0004367005
[0079]
As described above, by providing two lists in the recognized vocabulary holding unit 2 and switching one of the lists to be usable, when a set of control objects and operations is grouped, Lists can be created. For example, when there are restrictions on operations that can be performed according to the category to be controlled, the lists can be set separately. When the lists are divided in this way, the number of vocabulary included in each list is reduced, so that the load when the recognition conversion unit 3 extracts the vocabulary from the recognized vocabulary holding unit 2 is reduced, and the processing required for extracting the vocabulary Even if the ability is relatively low, vocabulary can be extracted within a practical time. That is, it can be provided at a relatively low cost. In addition, since the number of vocabularies to be collated in the recognition conversion unit 3 is reduced, the possibility that the vocabulary is erroneously extracted is reduced, and the recognition rate of the instruction content by voice is improved.
[0080]
In the above example, two lists are provided, but it is also possible to use three or more lists. When three or more lists are used, a maximum of (number of lists−1) control terms should be registered so that other lists are directly designated between the lists.
[0081]
By the way, if a list is selected in the recognized vocabulary holding unit 2 and a conversation is made with another person and a vocabulary registered in the recognized vocabulary holding unit 2 is used in the conversation, a control signal may be output. . Therefore, a list (second list) that does not include a vocabulary for generating a control signal as shown in Table 5 is set as a list, and a list including a vocabulary for generating a control signal and a control signal as shown in Table 5 It is also possible to switch and use a list that does not generate. For list switching, a list (first list) including a vocabulary for generating a control signal as shown in Table 4 includes a control vocabulary of “control stop” for switching to the list of Table 5, The list of 5 includes a control vocabulary of “control start” for switching to the list of Table 4. When the control conversion vocabulary is extracted, the recognition conversion unit 3 switches the list in the same manner as the vocabulary of “control the first half” and “control the second half” described above.
[0082]
[Table 4]
Figure 0004367005
[0083]
[Table 5]
Figure 0004367005
[0084]
When the control signal is generated in the control unit 6, if a list shown in Table 4 is selected, a control target and an operation can be selected by voice input, and the control signal is generated in the control unit 6. On the other hand, when the control by voice input is stopped, a voice “control stop” is input. When the control vocabulary of “control stop” is extracted, the recognition conversion unit 3 switches the list so that the list shown in Table 5 is used. In the list shown in Table 5, “A” …… “N” Is included in the vocabulary and does not include the vocabulary for generating the control signal. Therefore, any vocabulary other than “control start” is input while the list shown in Table 5 is selected. However, no control signal is output.
[0085]
When a voice input “start control” is made in a state where the list of Table 5 is selected, the recognition conversion unit 3 uses the list of Table 4 and the control unit 6 as in the above-described embodiments. It is possible to generate a control signal at.
[0086]
That is, as shown in FIG. 4, when the operation is started (S1) in a state where the list of Table 4 (listed as List 4) is selected (S1), vocabulary recognition is performed on the voice input ( If the extracted vocabulary is not “control stop” (S2), a control signal is generated according to the extracted vocabulary (S4). On the other hand, when “control stop” is extracted in step S3, the list is switched to the list of Table 5 (described as list 5) (S5). Even in this state, the vocabulary is recognized for the voice input (S6), but no control is performed except for “control start” (S7). When "control start" is input, the list is switched to the list shown in Table 4 (S8), and the operation returns to the operation of recognizing the vocabulary for the voice input (S2).
[0087]
  As described above, if the voice of “control stop” is input in the state where the list of Table 4 is selected, the list of Table 5 is selected, and the voice input is performed while this list is selected. Some control signals cannot be output, so for example, even when a headset microphone is attached and a switch (not shown) that enables voice input is turned on, a control signal is generated by conversation with another person. The control object can be controlled by the control signal while having a meeting with another person. Other configurations and operations areBasic configurationIt is the same.
[0088]
  (Reference example 1)
  Embodiment 1In, as a technique to change the irradiation direction and light intensity continuously (analog), specify the start point (input of “next color”, etc.) and the end point (input of “stop”), intermediate A technique for automatically generating values was illustrated. On the other hand, in the present embodiment, the irradiation direction and the light control amount are continuously changed by converting the duration of the voice input into the DMX value without specifying the start point and the end point. is there.
[0089]
  That is, as shown in FIG.Basic configurationOn the other hand, as shown in FIG. 5, an utterance time measuring unit 8 for measuring the duration of the voice input to the voice input unit 1 is added, and the time measured by the utterance time measuring unit 8 is controlled by the control unit. 6 is configured so that the DMX value changes depending on the duration of the voice input. The duration of voice input may be determined by measuring a period in which the envelope of the voice signal is equal to or greater than a specified value. In the control unit 6, the product obtained by multiplying the DMX value set based on the operation read from the operation storage unit 5 by the coefficient multiple of the voice input duration is set as the DMX value of the control signal. . The coefficient by which the duration is multiplied is set as appropriate.
[0090]
For example, if the DMX value corresponding to the operation “right” read from the operation storage unit 5 is 30, the duration of the voice input “right” is 0.5 seconds and the coefficient is 3, × 0.5 × 30 = 45, and the DMX value of the control signal is 45. If the duration of the voice is 0.3 seconds under the same conditions, the DMX value of the control signal is 27. In short, the amount of change in the operation of the controlled object is proportional to the duration of voice input.
[0091]
  As described above, in the configuration of the present embodiment, an analog amount can be instructed according to the duration of the input voice without using a variable resistor or the like, and intuitive control is possible. Other configurations and operations areBasic configurationIt is the same.
[0092]
  (Reference example 2)
  This embodimentReference example 1Similarly to the above, the DMX value is changed in an analog manner without specifying the start point and the end point. However,Reference example 1However, in this embodiment, the sound pressure level of the sound input to the sound input unit 1 is converted into a DMX value. That is, as shown in FIG. 6, a sound pressure level measurement unit 9 that measures the output level of the voice input unit 1 as a sound pressure level is provided, and the sound pressure level obtained by the sound pressure level measurement unit 9 is determined by the control unit 6. , The control unit 6 generates a DMX value corresponding to the sound pressure level, and generates a control signal based on the DMX value. Here, the sound pressure level measuring unit 9 obtains the average value or the maximum value of the sound pressure levels as the sound pressure level.
[0093]
In the control unit 6, the product obtained by multiplying the DMX value set based on the operation read from the operation storage unit 5 by the coefficient multiple of the sound pressure level of the voice input is obtained as the DMX value of the control signal. To do. A coefficient for multiplying the sound pressure level is set appropriately.
[0094]
For example, the operation “right” is input to the motion storage unit 5, the DMX value for “right” is 30, and the sound pressure level of the voice “right” input from the voice input unit 1 is 60 dBA. If the coefficient is 0.02, 0.02 × 60 × 30 = 36 and the DMX value is 36. On the other hand, if the sound pressure level of the voice is 50 dBA, 30 is transmitted as the final DMX value. In short, the amount of change in the operation of the controlled object is proportional to the sound pressure level of the voice input.
[0095]
  As described above, in the configuration of the present embodiment, an analog amount can be instructed according to the duration of the input voice without using a variable resistor or the like, and intuitive control is possible. Other configurations and operations areBasic configurationIt is the same.
[0096]
【The invention's effect】
  According to the configuration of the present invention, while it is possible to instruct the control of the lighting device by voice, the data registration work is facilitated by reducing the amount of data set for recognizing the voice, and the voice and data There is an advantage that the load required for collation can be reduced. That is, the control unit generates a control signal by combining the control object stored in the control object storage unit and the operation of the control object stored in the operation storage unit, so that the control object and the operation are input separately. In the case of voice input, a control signal can be generated simply by inputting a control object and an operation separately as a vocabulary. In addition, since voice input can be divided into vocabulary of control target and operation, the vocabulary related to the control target and operation can be registered even in the recognized vocabulary holding unit in which the vocabulary to be collated with speech input is registered. In other words, it is not necessary to combine the vocabulary of the controlled object and the operation in the recognized vocabulary holding unit, so that the vocabulary can be easily registered. That is, since the recognition conversion unit has a small number of vocabularies to be collated with respect to the voice input, high-speed processing can be expected, and if the number of vocabularies to be collated is small, the probability of misidentification is reduced.
Furthermore, when one of the control object and the operation is updated, a control signal is generated. Therefore, after determining one of the control object and the operation, the other can be changed one after another. For example, the same operation Is applied to a plurality of control objects, it is only necessary to input the sound of only the control object.
In addition, even if the vocabulary registered in the recognition vocabulary holding unit is not memorized, it can be specified in the order of registration, so it can be used easily even when it is difficult to memorize it, such as when many vocabularies are registered can do.
[Brief description of the drawings]
[Figure 1]Basic configuration,1 is a block diagram illustrating a first embodiment.
[Figure 2]Embodiment 2FIG.
[Fig. 3]Embodiment 2It is operation | movement explanatory drawing which shows.
[Fig. 4]Embodiment 3It is operation | movement explanatory drawing which shows.
[Figure 5]Reference example 1FIG.
[Fig. 6]Reference example 2FIG.
FIG. 7 is a schematic configuration diagram of a conventional example.
[Explanation of symbols]
  1 Voice input section
  2 Recognition vocabulary holding part
  3 recognition conversion part
  4 Control target storage
  5 Operation memory
  6 Control unit
  7 Timer
  8 Speaking time measurement unit
  9 Sound pressure level measurement unit
  10 Lighting equipment

Claims (1)

照明機器を制御対象とした制御信号を生成する制御部と、使用者が音声を入力する音声入力部と、制御対象と制御対象の操作とに関する語彙のリストを登録した認識語彙保持部と、音声入力部に入力される音声から認識語彙保持部に登録されている語彙を抽出する認識変換部と、認識変換部が認識語彙保持部から抽出した語彙が制御対象であるときに当該語彙が格納される制御対象記憶部と、認識変換部が認識語彙保持部から抽出した語彙が制御対象の操作であるときに当該語彙が格納される動作記憶部とを備え、制御部は、制御対象記憶部に格納される制御対象と動作記憶部に格納される操作との一方が更新されたことをトリガとして制御対象記憶部と動作記憶部とにそれぞれ格納された語彙で示される制御内容の制御信号を生成して出力し、認識語彙保持部は、認識語彙保持部の語彙のうち登録順で前後の語彙を抽出するように認識変換部に指示する制御用語彙を含み、認識変換部は当該制御用語彙を抽出したときに登録順を用いて指示された語彙を認識語彙保持部から抽出することを特徴とする音声認識による照明制御装置。 A control unit that generates a control signal for a lighting device, a voice input unit for a user to input voice, a recognition vocabulary holding unit that registers a list of vocabularies related to the control target and the operation of the control target, and a voice A recognition conversion unit that extracts the vocabulary registered in the recognition vocabulary holding unit from the speech input to the input unit, and the vocabulary stored when the vocabulary extracted by the recognition conversion unit from the recognition vocabulary holding unit is a control target A control object storage unit, and an operation storage unit in which the vocabulary is stored when the vocabulary extracted from the recognition vocabulary holding unit by the recognition conversion unit is an operation to be controlled. Generates a control signal of the control content indicated by the vocabulary stored in each of the control target storage unit and the action storage unit , triggered by one of the stored control target and the operation stored in the operation storage unit being updated and output The recognition vocabulary holding unit includes a control vocabulary that instructs the recognition conversion unit to extract the vocabulary before and after the registration vocabulary in the vocabulary of the recognition vocabulary holding unit, and the recognition conversion unit extracts the control vocabulary lighting control equipment according to speech recognition and extracts the indicated vocabulary from the recognition vocabulary holder using the registration order of.
JP2003149769A 2003-05-27 2003-05-27 Lighting control device by voice recognition Expired - Lifetime JP4367005B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003149769A JP4367005B2 (en) 2003-05-27 2003-05-27 Lighting control device by voice recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003149769A JP4367005B2 (en) 2003-05-27 2003-05-27 Lighting control device by voice recognition

Related Child Applications (3)

Application Number Title Priority Date Filing Date
JP2009004733A Division JP4944909B2 (en) 2009-01-13 2009-01-13 Lighting control device by voice recognition
JP2009004732A Division JP4951009B2 (en) 2009-01-13 2009-01-13 Lighting control device by voice recognition
JP2009004731A Division JP4849131B2 (en) 2009-01-13 2009-01-13 Lighting control device by voice recognition

Publications (2)

Publication Number Publication Date
JP2004355854A JP2004355854A (en) 2004-12-16
JP4367005B2 true JP4367005B2 (en) 2009-11-18

Family

ID=34045780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003149769A Expired - Lifetime JP4367005B2 (en) 2003-05-27 2003-05-27 Lighting control device by voice recognition

Country Status (1)

Country Link
JP (1) JP4367005B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018218567A1 (en) * 2017-05-31 2018-12-06 深圳市永恒丰科技有限公司 Smart wall lamp
JP6522725B1 (en) * 2017-12-07 2019-05-29 三精テクノロジーズ株式会社 Voice operation system
JP7110616B2 (en) * 2018-02-22 2022-08-02 三菱電機株式会社 Lighting control system, light emitting device, terminal device, voice recognition unit, and method of controlling terminal device
JP2019200393A (en) * 2018-05-18 2019-11-21 シャープ株式会社 Determination device, electronic apparatus, response system, method for controlling determination device, and control program
JP7463893B2 (en) 2020-07-22 2024-04-09 三菱電機株式会社 Lighting control systems and luminaires

Also Published As

Publication number Publication date
JP2004355854A (en) 2004-12-16

Similar Documents

Publication Publication Date Title
JP4849131B2 (en) Lighting control device by voice recognition
JP6143768B2 (en) User interface with voice to control the lighting system
US5146502A (en) Speech pattern correction device for deaf and voice-impaired
JP3968133B2 (en) Speech recognition dialogue processing method and speech recognition dialogue apparatus
EP1184782A3 (en) On-demand interface device and window display for the same
US20070073543A1 (en) Supported method for speech dialogue used to operate vehicle functions
JP4367005B2 (en) Lighting control device by voice recognition
JPH0373775A (en) Information input device for elevator
JP2018036902A (en) Equipment operation system, equipment operation method, and equipment operation program
JP4944909B2 (en) Lighting control device by voice recognition
JP4951009B2 (en) Lighting control device by voice recognition
KR20190059509A (en) Electronic apparatus and the control method thereof
JP3888584B2 (en) Speech recognition apparatus, speech recognition method, and speech recognition program
Rockland et al. Voice activated wheelchair controller
JP2007286376A (en) Voice guide system
JP2001042887A (en) Method for training automatic speech recognizing device
CN107171902A (en) Control system and method that switch degree is adjusted are carried out by Voice command illuminating lamp
JP2005184461A (en) Apparatus and method of controlling microphone
JP2003015689A (en) Voice manipulator
KR100341274B1 (en) Phonetic control device and control method thereof for Range-hood
JP7223423B2 (en) Remote control device and audiovisual equipment
JPH02146099A (en) Voice recognition device
JP6356649B2 (en) Control of vehicle functions based on sound
JP2006168907A (en) Elevator device
CN112927690A (en) Voice-controlled cosmetic mirror

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090804

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090817

R151 Written notification of patent or utility model registration

Ref document number: 4367005

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120904

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130904

Year of fee payment: 4

EXPY Cancellation because of completion of term