JP4849131B2 - 音声認識による照明制御装置 - Google Patents

音声認識による照明制御装置 Download PDF

Info

Publication number
JP4849131B2
JP4849131B2 JP2009004731A JP2009004731A JP4849131B2 JP 4849131 B2 JP4849131 B2 JP 4849131B2 JP 2009004731 A JP2009004731 A JP 2009004731A JP 2009004731 A JP2009004731 A JP 2009004731A JP 4849131 B2 JP4849131 B2 JP 4849131B2
Authority
JP
Japan
Prior art keywords
vocabulary
control
unit
recognition
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009004731A
Other languages
English (en)
Other versions
JP2009116352A (ja
Inventor
朗 馬場
秀彦 西窪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Electric Works Co Ltd
Original Assignee
Panasonic Corp
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Works Ltd filed Critical Panasonic Corp
Priority to JP2009004731A priority Critical patent/JP4849131B2/ja
Publication of JP2009116352A publication Critical patent/JP2009116352A/ja
Application granted granted Critical
Publication of JP4849131B2 publication Critical patent/JP4849131B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02BCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
    • Y02B20/00Energy efficient lighting technologies, e.g. halogen lamps or gas discharge lamps
    • Y02B20/40Control techniques providing energy savings, e.g. smart controller or presence detection

Landscapes

  • Circuit Arrangement For Electric Light Sources In General (AREA)

Description

本発明は、舞台照明やスタジオ照明において、操作卓の操作に代えて利用者の音声による照明制御を可能とした音声認識による照明制御装置に関するものである。
一般に、舞台照明、ステージ照明、スタジオ照明のように、多数台の照明器具や昇降装置が存在しているような照明システムでは、照明機器(照明器具、昇降装置など)の操作を操作卓によって行っている(たとえば、特許文献1参照)。
特開平6−5107号公報(第0014段落、図1)
この種の操作卓では、多数台の照明機器を制御するために、可変抵抗器やスイッチを多数備えており、この種の操作卓を操作するのは容易ではなく、操作卓の操作には習熟が必要である。
また、この種の照明では点灯させる照明器具や各照明器具の色などをシーンに応じて変化させる必要があるから、コンピュータを備える調光卓に各シーンに応じた制御内容をあらかじめプリセットしておき、シーンごとにプリセットされた制御内容に切り替えることが多い。制御内容のプリセットを行う作業には、図5に示すように、照明器具10のような照明機器を設置した舞台11の上や観客席から照明の効果を確認する人(指示者)M1と、舞台11とは別の場所に設置された調光卓12を操作する人M2(オペレータ)との2人が必要であって、2人の人M1,M2の間では無線式の通話装置などを用いて口頭による指示を行っているのが現状である。つまり2人の人が必要になる上に、口頭による指示では指示内容を伝達するのが難しいという問題がある。
指示者M1が音声によって照明機器の制御を行うことができれば、この種の問題を解決することができると考えられる。このように音声による指示を行う場合には、照明器具や昇降装置のような制御対象を指定するとともに、各制御対象の操作を指示しなければならない。つまり、制御対象と操作との組からなる文を認識し、文の内容に応じた制御を行うことが必要であるから、制御対象の台数が多く、操作の種類が多くなれば、制御対象と操作との組合せが膨大な数になる。その結果、音声の内容と照合するためのデータの登録作業に膨大な時間がかかることになる。また、登録されているデータ(制御対象と操作との組合せ)の数が膨大であることによって、入力された音声と登録されているデータとの照合に多大の時間を要することになり、音声の入力から実際に照明機器の制御状態が変化するまでの応答に遅れが生じ、シーンなどの設定作業における作業時間が長くなるという問題が生じる。
本発明は上記事由に鑑みて為されたものであり、その目的は、照明機器の制御を音声によって指示可能としながらも、音声を認識させるために設定するデータの量を少なくすることによって、データの登録作業を容易にし、しかも音声とデータとの照合に要する負荷を小さくした音声認識による照明制御装置を提供することにある。
本発明は、照明機器を制御対象とした制御信号を生成する制御部と、使用者が音声を入力する音声入力部と、制御対象と制御対象の操作とに関する語彙のリストを登録した認識語彙保持部と、音声入力部に入力される音声から認識語彙保持部に登録されている語彙を抽出する認識変換部と、認識変換部が認識語彙保持部から抽出した語彙が制御対象であるときに当該語彙が格納される制御対象記憶部と、認識変換部が認識語彙保持部から抽出した語彙が制御対象の操作であるときに当該語彙が格納される動作記憶部とを備え、制御部は、制御対象記憶部に格納される制御対象と動作記憶部に格納される操作との一方が更新されたことをトリガとして、制御対象記憶部と動作記憶部とにそれぞれ格納された語彙で示される制御内容の制御信号を生成して出力し、認識語彙保持部は、認識語彙保持部の語彙を所定時間ごとに登録順で抽出するように認識変換部に指示する第1の制御用語彙と、認識変換部に認識語彙保持部からの語彙の抽出の停止を指示する第2の制御用語彙とを含み、認識変換部は第1の制御用語彙を抽出したときに所定時間ごとに登録順で各語彙を抽出して制御対象記憶部と動作記憶部とのいずれか一方に抽出した語彙を格納し、第2の制御用語彙を抽出した時点で認識語彙保持部からの語彙の抽出を停止することを特徴とする。
本発明の構成によれば、照明機器の制御を音声によって指示可能としながらも、音声を認識させるために設定するデータの量を少なくすることによって、データの登録作業を容易にし、しかも音声とデータとの照合に要する負荷を小さくすることができるという利点がある。すなわち、制御部が制御対象記憶部に記憶した制御対象と動作記憶部に記憶した制御対象の操作とを結合して制御信号を生成するから、制御対象と操作とを各別に分けて入力することができ、音声入力に際しては、制御対象と操作とを別々に語彙として入力するだけで制御信号を生成することができる。また、音声入力を制御対象と操作との語彙に分けて入力することができるから、音声入力と照合する語彙を登録した認識語彙保持部においても、制御対象と操作とに関する語彙を登録しておけばよく、認識語彙保持部において制御対象と操作との語彙を組み合わせる必要がないから語彙の登録が容易になる。すなわち、認識変換部では音声入力に対して照合すべき語彙数が少ないから高速な処理が期待でき、また照合すべき語彙数が少なければ誤認の確率も低減されることになる。
さらに、制御対象と操作との一方が更新されると制御信号が生成されるから、制御対象と操作との一方を決めた後に、他方を次々に変更することが可能であり、たとえば、同じ操作を複数の制御対象に適用する際には、制御対象のみを音声入力すればよいから作業性が高くなる。
加えて、第1の制御用語彙を用いると制御内容が自動的に順に変更されるから、利用者は所望の制御内容になったときに第2の制御用語彙を入力することで、所望の制御内容を選択することができる。したがって、制御内容を作業性よく選択することが可能になる。しかも、制御内容を自動的に変更させる開始点と終了点とを指示するだけであるから、多数の制御内容を試験するような場合に、何度も音声入力を行う必要がなく作業性よく使用することができる。
基本構成および実施形態1を示すブロック図である。 実施形態2を示すブロック図である。 実施形態2を示す動作説明図である。 実施形態3を示す動作説明図である。 従来例の概略構成図である。
(基本構成)
本例は、図1に示す構成を有し、マイクロホンを備えた音声入力部1に入力される音声の指示によって制御部6から照明器具10(図5参照)の制御を可能とする制御信号を出力する。制御部6からの制御信号は、照明器具10に直接与えられるか、もしくは調光卓12を通して照明器具10に与えられる。図1に示す構成のうち、音声入力部1を除く構成はコンピュータにおいて適宜のプログラムを実行することにより実現される。
音声入力部1に入力された音声は認識変換部3に入力され、認識変換部3では音声入力部1に入力された音声から特徴量を抽出する。さらに、認識変換部3は、音声から抽出した特徴量を用いて、認識語彙保持部2にあらかじめ登録されている語彙のうち、入力された音声に一致する確率の高い語彙を抽出し、当該語彙に対応付けてあらかじめ認識語彙保持部2に登録されている語彙の種別に従って、制御対象記憶部4と動作記憶部5とのいずれかに語彙(テキストデータ)を振り分けて記憶させる。
認識語彙保持部2は、認識しようとする語彙を登録した辞書であって、制御対象(照明器具や昇降装置)を意味する語彙と、制御対象に対する操作(移動方向やフィルタないし装飾の種類の選択)を意味する語彙とがあらかじめリストとして登録される。 認識語彙保持部2における語彙のリストの一例を表1に示す。すなわち、語彙の種別は「制御対象」と「操作」とであって、認識変換部3において認識した語彙の種別が「制御対象」であると当該語彙は制御対象記憶部4に格納され、認識変換部3において認識した語彙の種別が「操作」であると当該語彙は動作記憶部5に格納される。
Figure 0004849131
表1には示していないが、認識語彙保持部2には、「右」「左」のような移動方向も「操作」として登録される。表1において「ゴボ」は調光フィルタを意味している。
認識変換部3では、音声認識の周知の技術によって音声入力部1に入力された音声をテキストデータに変換する。すなわち、音声入力部1から認識変換部3に入力された音声は、たとえば量子化ビット数を16、標本化周波数を16kHzとしてA/D変換され、その後、分析フレーム長を25ミリ秒、分析間隔を10ミリ秒などとして周波数変換された後に、音声の特徴量が抽出される。音声の特徴量としては、たとえばメル周波数ケプストラム係数などを用いることができる。認識変換部3には、大量の音声データを用いてEMアルゴリズムなどによって学習させた隠れマルコフモデルなどの音声モデルが内部に設定されており、音声入力部1から入力された音声の特徴量を用いフォワードアルゴリズムなどを適用することによって、認識語彙保持部2に登録されているすべての語彙について各語彙を音声モデルが出力する確率を求める。このようにして語彙ごとに求めた確率が最大になる語彙を1個選択するか、あるいは確率が規定値以上の複数の語彙からなる語彙列を選択して出力する。
認識変換部3において認識語彙保持部2から語彙を選択すると、上述したように、語彙の種別が「制御対象」であれば制御対象記憶部4に格納され、語彙の種別が「操作」であれば動作記憶部5に格納される。制御対象記憶部4と動作記憶部5とは、いずれも複数個の語彙を格納することができ、制御部6で読出可能な語彙はポインタにより指定される。つまり、制御対象記憶部4と動作記憶部5とでは、新たな語彙が格納されると格納された語彙の位置がポインタ(語彙の先頭アドレスなど)により指定される。ポインタの位置は制御部6から指示可能であり、制御対象記憶部4と動作記憶部5とに残されている語彙であれば、ポインタの位置を変更することによって読出可能である。また、制御対象記憶部4と動作記憶部5とは、いずれも語彙が格納されるたびに制御部6に通知する機能を有している。
制御部6は、制御対象記憶部4と動作記憶部5とからそれぞれ語彙の格納が通知されると通知があったことを記憶し(ラッチし)、制御対象記憶部4と動作記憶部5との両方からの通知が揃った時点をトリガとして、制御対象記憶部4から制御対象の語彙を読み出すとともに、動作記憶部5から操作の語彙を読み出し、制御対象記憶部4から読み出した制御対象に対して、動作記憶部5から読み出した操作を行うように制御信号を生成する。ここに、本例における制御部6は、制御信号を一度生成すると、次に制御対象記憶部4と動作記憶部5とからそれぞれ記憶内容の更新が通知されるまでは、次のトリガを発生しないように構成してある。
制御信号は照明器具10(図5参照)などを制御するために用いられるから、調光卓から照明器具10への制御信号と同形式の信号を用いるのが望ましい。調光卓ではDMXプロトコルの信号(DMX信号)を用いることが多いから、制御部6から出力する制御信号をDMX信号とする場合には、制御対象を示す語彙をDMXアドレスに変換するとともに、操作を示す語彙をDMX値に変換することができる変換テーブルを制御部6に設けておく。
以下に具体例を示して本例の動作を説明する。いま、表1のように、制御対象として10台のスポットライトが設けられている場合を想定する。各スポットライトは、それぞれ5種類の色を選択することが可能であり、さらにゴボ(調光フィルタ)によって5段階の調光が可能であるものとする。
利用者が、3番目のスポットライトの色を赤色に変更する場合を例として説明する。また、制御対象記憶部4と動作記憶部5とには格納された語彙がないものとする。まず、利用者は音声入力部1に設けたマイクロホンに向かって制御対象を指定するために、「3番スポット」という音声を入力する。「3番スポット」は認識語彙保持部2に登録されているから、認識変換部3では認識語彙保持部2から「3番スポット」の語彙を選択する。「3番スポット」の種別は「制御対象」であるから「3番スポット」の語彙は制御対象記憶部4に格納され、このとき制御対象記憶部4は制御部6に対して語彙の格納を通知する。ただし、動作記憶部5には語彙が格納されておらず、制御部6には制御対象記憶部4と動作記憶部5との両方からの通知が揃っていないから、制御部6から制御信号を出力することはない。
次に、利用者が操作の内容を指示するために、マイクロホンに向かって「赤」という音声を入力すると、認識変換部3では認識語彙保持部2から「赤」という語彙を選択する。「赤」の種別は「操作」であるから、「赤」という語彙は制御対象記憶部4ではなく動作記憶部5に格納され、動作記憶部5から制御部6に語彙の格納が通知される。制御部6では、動作記憶部5から語彙の格納が通知された時点で、制御対象記憶部4と動作記憶部5との両方からの通知が揃うから、制御対象記憶部4と動作記憶部5との両方から記憶内容を読み出し、変換テーブルによって制御信号(DMX信号)に変換し外部に出力する。制御信号はスポットライトを含む照明システムに送出され、DMX信号に含まれるDMXアドレスによって3番目のスポットライトが指定され、3番目のスポットライトの色が赤色に変更される。
ここに、上述の例では制御対象を指定してから操作を指示しているが、操作の指示の後に制御対象を指定しても同様に動作する。これは、制御部6において、制御対象と操作との指示が揃った後に、制御対象と操作とを組み合わせて制御信号を生成しているからであって、音声による指示は制御対象と操作とのどちらを先に行っても、制御部6からは同じ制御信号が出力される。また、制御部6では制御対象の指定と操作の指示とが揃うまで制御信号を出力しないから、制御対象の指定と操作の指示との間に時間が空いてもよく、利用者は指示内容を文として指示する必要がなく、制御の際の指示が容易になる。
上述したように、本構成では、認識語彙保持部2に制御対象と操作とに分けて語彙を登録しているから、制御対象と操作との語彙を組み合わせることによって、比較的少数の語彙で複雑な制御が可能になる。しかも、認識語彙保持部2に登録する語彙は文ではないから、認識変換部3における処理の負荷が比較的小さく高速な処理が可能であり、その上、単純な語彙を用いることによって音声の認識率が高くなる。つまり、誤認識や処理の遅れによって制御をやり直す可能性が低減され、音声での指示による照明制御を違和感なく行うことができる。
上述の例では、制御対象としてスポットライトを例示したから、操作の内容としては色とゴボとを例示したが、制御対象としては、モータのような駆動源を備え照射方向を制御することができるムービングライトを用いる場合もある。この種の制御対象に対する操作としては、照射方向が含まれるから、認識語彙保持部2には「右」「左」「上」「下」「ライト」「レフト」「アップ」「ダウン」などの方向を示す語彙を登録し、制御部6ではこれらの語彙に対応した制御信号を生成可能としておく。操作としては、上述のような色、ゴボ、方向のほか、調光量(光源の光出力)を含めてもよい。つまり、操作としては、色、ゴボ、方向、調光量(光出力)のうちの少なくとも1種類が選択される。
操作が方向や調光量である場合には、程度を表す語彙も認識可能としておく。たとえば、方向について「少し」「大きく」などの程度を表す語彙の組合せを可能とし、方向の語彙に「少し」が付加されていればDMX値を15変化させ、「大きく」が付加されていればDMX値を45変化させ、程度を表す語彙が付加されていなければDMX値を30変化させるというように、方向について変化量の程度を付加することで、所望の向きに制御することが可能になる。調光量についても同様であって、「明るく」「暗く」などの変化の方向を示す語彙に「少し」「大きく」のような変化量の程度を表す語彙を組み合わせることで、光出力の変化量を音声によって調節することが可能になる。
上述したように、色やゴボのほかに、ムービングライトの姿勢を音声によって指示可能としたり、調光量を音声によって制御可能とすることで、照明制御をきめ細かく行うことが可能になる。しかも、姿勢や制御量の変化量を複数段階で制御可能としていることにより、音声による照明制御を簡単な語彙で行えるようにしながらも、大きく変化させたり細かく変化させたりすることが可能であって、所望の操作を音声に対応付けて簡単に行うことができる。
ところで、上述した例では、制御対象への制御信号を生成するための語彙のみを認識語彙保持部2に登録しているが、制御部6の動作を指示する語彙を認識語彙保持部2に登録し、制御部6の動作を音声によって制御してもよい。たとえば、制御部6による制御信号の出力開始を指示するための「スタート」というような制御用語彙を認識語彙保持部2に登録しておき、認識変換部3において制御用語彙を抽出したときには、制御対象記憶部4や動作記憶部5に語彙を格納するのではなく、制御部6に対して制御用語彙の内容に従う指示を通知するようにしてもよい。あるいはまた、認識変換部3で制御用語彙を抽出したときに制御部6に引き渡し、制御部6において制御用語彙に応じた動作を行うようにしてもよい。
いま、制御用語彙として上述した「スタート」を認識語彙保持部2に登録している場合を想定する。ここでは、制御部6は「スタート」による指示がなされると、制御対象記憶部4および動作記憶部5の内容を読み出して制御信号を生成する動作を行うように機能するものとする。すなわち、制御部6は、制御対象記憶部4あるいは動作記憶部5から記憶内容の更新が通知されただけでは制御信号を生成せず、認識変換部3から「スタート」を抽出したことの通知がなされると(または、「スタート」の語彙が転送されると)、制御部6は制御信号の生成を開始し、制御対象記憶部4と動作記憶部5とから記憶内容を読み出して制御信号を生成して出力する。
具体例で説明すると、利用者が、3番目のスポットライトの色を赤色に制御した後に、3番目のスポットライトの色を青色に変更する場合を想定する。3番目のスポットライトが赤色である状態において、利用者が「青」という音声を入力すると、制御対象記憶部4に「3番スポット」の語彙が登録された状態で、動作記憶部5には「青」の語彙が格納されるが、この時点では制御部6から制御信号が出力されることはなく、その後、「スタート」という音声を入力すると、制御部6が制御信号を生成して出力し、3番目のスポットライトの色が青色に変更される。「青」と「スタート」との音声の入力の間の時間についてはとくに制限はない。また、3番目のスポットライトの色を青色としてから、「スタート」という音声を入力する前であれば、別の色に変更することが可能であり、たとえば、3番目のスポットライトの色が赤色であるときに、「青」に続いて「白」という音声を入力した後に「スタート」という音声を入力すれば、3番目のスポットライトの色は青色になることなく白色に変更される。
以上説明したように、認識語彙保持部2に制御用語彙を登録しておき、認識変換部3において制御用語彙を抽出したときに、制御用語彙の内容に応じて制御部6を動作させるようにすれば、利便性の向上を図ることができる。とくに、制御対象や操作に関する音声を入力した後に、「スタート」という音声を入力するまでは、制御対象や操作の内容を変更することが可能であるから、制御信号の内容を設定する際に実際の制御前に内容変更が可能になる。
(実施形態1)
本実施形態は、基本構成とは制御部6の動作のみが異なるものである。すなわち、基本構成において説明した制御部6では制御対象記憶部4と動作記憶部5との両方からの語彙の格納の通知によって制御信号を生成すると、制御対象記憶部4と動作記憶部5との両方から語彙の格納が次に通知されるまで制御信号を出力しないように構成しているが、本実施形態の制御部6は、制御信号を生成して出力した後に、制御対象記憶部4と動作記憶部5との一方から語彙の格納が通知されると次の制御信号を生成するように構成してある。
ここでは、利用者が、3番目のスポットライトの色を赤色に指定した後に、同じスポットライトの色を青色に変更する場合を例として具体的な動作を説明する。まず、利用者は「3番スポット」と「赤」との音声入力を行うことにより、3番目のスポットライトの色を赤色に指定する。つまり、制御対象記憶部4には「3番スポット」という語彙が記憶され、動作記憶部5には「赤」という語彙が記憶される。
この状態において、利用者が、「青」という音声を入力すると動作記憶部5には「青」という語彙が格納される。動作記憶部5では新たな語彙が格納されると、新たな語彙が制御部6により最初に読出可能な語彙になるように記憶内容が更新される。また、動作記憶部5に新たな語彙が格納されると、基本構成と同様に、語彙の格納が制御部6に通知される。動作記憶部5から語彙の格納の通知があると、制御部6は、制御対象記憶部4と動作記憶部5とから語彙を読み出して制御信号に変換し制御信号を出力する。つまり、制御対象記憶部4の内容には変化がないから、3番目のスポットライトを対象とし、操作の内容が「赤」から「青」に変化して3番目のスポットライトは色を青色に変更する。
上述のようにして3番目のスポットライトの色を青色にした状態で、4番目のスポットライトの色を青色に変更するには、利用者は「4番スポット」という音声を入力する。つまり、制御対象記憶部4の記憶内容が「4番スポット」という語彙に更新され、語彙の更新が制御部6に通知される。制御部6では、動作制御部5の記憶内容が「青色」に更新されたときの通知が有効であるから、制御対象記憶部4から語彙の更新が通知されると、制御部6は、制御対象記憶部4と動作記憶部5との両方からの格納の通知が揃ったとみなし、制御対象記憶部4と動作記憶部5とから語彙を読み出して制御信号に変換し制御信号を出力する。つまり、動作制御部5の内容には変化がないから、操作の内容を「青」に保ったままで、制御対象が3番目のスポットライトから4番目のスポットライトに変更される。つまり、4番目のスポットライトの色を青にするように制御信号が生成される。
上述した動作を行うには、制御対象記憶部4と動作記憶部5との両方に語彙が格納されていなければならないから、制御対象記憶部4と動作記憶部5とには適宜の初期値をあらかじめ記憶させておくのが望ましい。あるいはまた、制御対象記憶部4と動作記憶部5とにともに語彙が格納されていなければ、制御を行わないようにすればよい。さらに、基本構成と本実施形態との動作を選択可能に構成することも可能である。
上述したように、本実施形態の構成は、同じ制御対象(スポットライト)について操作のみを次々に変更する場合や、複数の制御対象(スポットライト)について同じ操作を次々に行う場合などに、すべての制御対象と操作との組で指示を与える必要がなく、音声による指示を簡略化することができ、制御対象に対する指示を容易に与えることができる。他の構成および動作は基本構成と同様である。
ところで、基本構成では、「スタート」のように制御部6の動作を指示する制御用語彙を例示したが、本実施形態では、制御用語彙として、認識語彙保持部2に登録された語彙を登録順で選択するための語彙を用いてもよい。たとえば、制御対象をスポットライトとするときに、「前のスポット」「次のスポット」のような制御用語彙を用い、操作を色とするときに、「前の色」「次の色」のような制御用語彙を認識語彙保持部2に設定するのである。ただし、この種の制御用語彙を用いる場合に、表1を例にすれば、「スポット」が「1番スポット」……「10番スポット」に対応し、「色」が「赤」「青」「黄」「緑」「白」に対応することを認識変換部3に認識させる必要があるから、各語彙にはカテゴリを対応付けておくことが必要である。つまり、語彙「赤」に対しては種別「操作」だけではなく、カテゴリ「色」を対応付けておくことが必要である。
認識語彙保持部2の語彙を指定する制御用語彙が認識変換部3において抽出されたときには、認識変換部3では制御対象記憶部4あるいは動作記憶部5において現在使用中の語彙(最新の制御信号を生成した語彙)のカテゴリと同じカテゴリの語彙を抽出し、同カテゴリ内で1つ前または後の語彙を読み出すのである。たとえば、「前のスポット」に対しては、カテゴリが「スポット」である制御対象のうち認識語彙保持部2での登録順が1つ前の語彙を抽出して制御対象記憶部4に格納する。また、「後のスポット」に対しては、カテゴリが「スポット」である制御対象のうち認識語彙保持部2での登録順が1つ後の語彙を抽出して制御対象記憶部4に格納する。同様にして、「前の色」「後の色」に対しては、カテゴリが「色」である操作のうち、認識語彙保持部2での登録順が1つ前あるいは後の語彙を抽出して動作記憶部5に格納する。このように認識語彙保持部2における語彙の登録順で語彙を選択する場合には、制御用語彙を入力して選択した語彙を制御対象の動作によって確認する必要があるから、制御対象記憶部4と動作記憶部5との一方の記憶内容が更新された時点で制御信号を生成する必要があり、したがって本実施形態の構成において、この種の制御用語彙を使用することが可能になる。なお、登録順での先頭と末尾との語彙は連続するように扱うのが望ましく、1番スポットの前は10番スポットとみなし、10番スポットの次は1番スポットとみなす。
いま、利用者が3番目のスポットライトの色を赤色に設定した後に、2番目のスポットライトを青色に変更する場合を例にする。また、認識語彙保持部2には表1の語彙が登録されているものとする。3番目のスポットライトの色が赤色であるときに、「次の色」という音声を入力すると、認識語彙保持部2に登録されている語彙のうち「色」のカテゴリの語彙「赤」「青」「黄」「緑」「白」が抽出され、登録順において「次」である「青」が選択され、「青」の種別は「操作」であるから動作記憶部5の内容が「青」に更新される。この時点では3番目のスポットライトの色が青色になるから、さらに、「前のスポット」という音声を入力することによって、認識語彙保持部2からカテゴリが「スポットライト」である語彙を抽出し、登録順で「3番スポット」の1つ「前」である「2番スポット」が制御対象記憶部4に格納される。つまり、2番目のスポットライトの色が青色になる。この動作例から明らかなように、3番目のスポットライトの色が赤色であるときに、2番目のスポットライトの色を青色にするために上述の手順を採用すると、3番目のスポットライトの色も青色になる。つまり、2番目と3番目とのスポットライトの色がともに青色になる。
3番目のスポットライトの色を赤色に保って2番目のスポットライトのみの色を青色にしようとするのであれば、まず「前のスポット」と入力して2番目のスポットライトを赤色に変更し、その後、「次の色」と入力すれば2番目のスポットライトのみの色が青色に変更されることになる。このように、音声の入力によって指定する順序を変更すれば、所望の設定が可能になる。
上述のように、認識語彙保持部2の登録順で語彙を指定する制御用語彙を設けることによって、利用者は認識語彙保持部2に登録されている語彙を記憶していなくても、指定可能な色を試すことができ、所望の色の選択が可能になる。とくに、多数色の指定が可能である場合には、全色に対応する語彙を利用者が覚えるのは困難であるから、全色を記憶することなく色の指定が可能になることによって、利用者の負担が軽減される。
ところで、「前のスポット」「次のスポット」あるいは「前の色」「次の色」というように認識語彙保持部2での登録順を指定する制御用語彙を用いる場合に、上述の例のように制御用語彙の1回の入力に対して1つの語彙だけを指定するのではなく、同じカテゴリの語彙を順に所定時間ずつ選択してもよい。つまり、認識語彙保持部2での登録順を指定する制御用語彙が抽出されると、カテゴリ内の語彙を順に自動的に選択して制御対象記憶部4または動作記憶部5に格納するのである。この動作により制御対象あるいは操作の内容を変化させた制御信号が所定時間ごとに生成されることになる。所望の状態の制御信号が得られた時点での制御状態を保持するために、認識語彙保持部2には制御用語彙として「ストップ」を用意しておく。認識変換部3では「ストップ」という制御用語彙を抽出したときには、認識語彙保持部2の登録語彙から順に語彙を選択する処理を停止する。
たとえば、2番目のスポットライトの色を赤色に設定した後に、「次の色」と入力すると、認識語彙保持部2に登録されたカテゴリが「色」である語彙が所定時間(たとえば、1秒)ずつ順に選択される。つまり、表1の例では、「青」「黄」「緑」「白」「赤」……の順で動作記憶部5の記憶内容が変更され、各色に制御する制御信号が所定時間ごとに生成され、2番目のスポットライトの色が順に変更される。そこで、2番目のスポットライトの色が所望の色になった時点で「ストップ」という音声を入力し、認識語彙保持部2に登録された語彙の選択を停止する。このようにして、認識語彙保持部2に語彙が登録されている色から所望の色を選択するために、音声を2回だけ入力すればよく、多数の色から所望の色を選択するような場合には利用者の負担を大幅に軽減することができる。上述の例では「色」について説明したが、他の操作についても同様である。また制御対象についても同様に処理することができる。
認識語彙保持部2に登録された語彙の選択を自動的に行う機能を設けていることによって、たとえば100種類の色が選択可能である照明器具を用い、すべての色をチェックする場合を想定すると、「次の色」という音声入力を100回行うのではなく、1回だけ「次の色」という音声入力を行った後には、「ストップ」という音声入力のみになるから、利用者の負担が大幅に軽減される。
なお、認識語彙保持部2においてムービングライトの照射方向などを指定するための上述のような方向を示す語彙を登録しているときに、方向を示す語彙の入力によって、指定された方向に所定の変化量でDMX値が変化するように認識変換部3から動作記憶部5にデータを格納するようにし、このときの1回当たりの変化量を比較的小さくしておくことによって、ムービングライトの照射方向を自動的に少しずつ変化させることが可能になる。したがって、ムービングライトの照射方向が所望の方向に到達した時点で、「ストップ」という音声の入力により、照射方向の変化を停止させれば、ムービングライトの照射方向を略連続的に変化させることが可能になる。この技術は、操作として調光量(光出力)を連続的に変化させる場合にも適用可能である。
(実施形態2)
本実施形態は、実施形態1の構成に図2のようにタイマ7を付加したものである。タイマ7は、制御対象記憶部4と動作記憶部5との一方の記憶内容が更新されることによって制御部6から制御信号を出力することが可能になった時点でリセットされ、リセットから所定時間を時限するものである。また、時限中に制御対象記憶部4と動作記憶部5との一方の記憶内容が更新されたときにもリセットされる。一方、制御部6は、タイマ7の時限動作中には制御信号を出力せず、タイマ7での時限終了が制御部6に通知されたときに、制御対象記憶部4と動作記憶部5とから語彙を読み出して制御信号を出力するように構成されている。
タイマ7は、減算カウンタであって、あらかじめ設定したカウント値から所定時間ごとに1ずつ減算し、カウント値が0になると時限動作を終了するように構成されている。すなわち、図3に示すように、タイマ7を構成するカウンタにカウント値(N)を設定した状態でタイマ7をリセット(スタート)すると(S1)、時間ΔTごとにカウント値が1ずつ減算される(S2)。カウント値が0になるまでに制御対象記憶部4と動作記憶部5とのいずれかから語彙の更新が通知されると(S3)、カウンタはリセットされてカウント値がNに復帰する。また、カウント値を1ずつ減算する間に制御対象記憶部4と動作記憶部5とのどちらからも語彙の更新が通知されなければ、やがてカウント値が0になり(S4)、制御部6に時限終了を通知する。
たとえば、図3においてカウンタに設定するカウント値Nを100とし、時間ΔTを100分の1秒とすれば、タイマ7の時限時間は1秒間になる。時間ΔTは100分の1秒であるから、制御部6は100分の1秒間隔で制御対象記憶部4と動作記憶部5との一方からの更新の通知を待ち受ける。この間に更新の通知がなければカウント値が0になったか否かを判断し、カウント値が0でなければ再びカウント値を1だけ減らす。また、カウント値が0であれば制御部6に通知するのである。カウント値が0ではなく、時間ΔTの間にタイマ7が制御対象記憶部4と動作記憶部5とのいずれかから通知を受け取った場合には、カウント値を再び100に設定して時限動作をやりなおす。
本実施形態の具体例として、利用者が、3番目のスポットライトの色を赤色に設定した後に、4番目のスポットライトの色を青色に変更する場合について説明する。利用者は、3番目のスポットライトの色を赤色に設定した状態において、まず制御対象を4番目のスポットライトに変更するために、音声入力部1に設けたマイクロホンに向かって「4番スポット」という音声を入力する。このことによって、制御対象記憶部4の記憶内容は「4番スポット」に更新される。制御対象記憶部4は内容の更新を制御部6とタイマ7とに通知される。実施形態1ではタイマ7を設けていないから、制御対象と操作とのいずれかが変更されると、ただちに制御信号が出力されていたが、本実施形態では、タイマ7による時限時間が経過するまでは制御信号が出力されない。
しかるに、カウント値は100であって、時間ΔTは100分の1秒であるから、「4番スポット」という音声に続いて、「青」という音声を1秒以内に入力すると、制御部6によって制御対象記憶部4および動作記憶部5の記憶内容が読み出される前に、動作記憶部5に「青」という語彙を記憶させることができる。「青」という音声の入力から1秒以内に音声による指示を行わなければ、4番目のスポットライトを青色に変更する制御信号が制御部6から出力されるのである。「4番スポット」という音声を入力した後、1秒以内に次の音声を入力しなければ、制御対象記憶部4の記憶内容が「4番スポット」であり、動作記憶部5の記憶内容が「赤」である状態において、タイマ7から制御部6への通知がなされるから、制御部6は4番目のスポットライトを赤色に変更する制御信号を出力する。
以上説明したように、本実施形態では制御対象と操作との両方を変更する場合でも1つの制御信号で変更することができるから、制御対象と操作とをともに変更しようとする場合に、所望の状態に至る途中で不必要な状態を経由することがなく、違和感のない操作が可能になる。また、制御信号を2回送信する必要がないから、制御信号の伝送系におけるトラフィックを実施形態1の構成よりも低減することが可能である。他の構成および動作は実施形態1と同様である。
(実施形態3)
上述した各実施形態では、認識語彙保持部2において語彙のリストを1個だけ登録する例を示したが、本実施形態では複数個のリストを認識語彙保持部2に設けた例について説明する。
まず、リストを2個設ける場合について説明する。この場合、各リストには他方のリストの選択を可能とするための制御用語彙を登録する。たとえば、一方のリストには「後半を制御」という制御用語彙を登録し、他方のリストには「前半を制御」という制御用語彙を登録しておく。どちらのリストを用いるかは、認識変換部3において上述した制御用語彙を抽出することで選択可能であって、「前半」を第1のリスト、「後半」を第2のリストを意味する語彙とすれば、第1のリストに「後半を制御」という語彙を登録し、第2のリストに「前半を制御」という語彙を登録しておくことで、第1のリストの使用中において「後半を制御」という音声入力があったときに、第2のリストを使用する状態に切り替えるのである。同様に、第2のリストの使用中において「前半を制御」という音声入力があると、第1のリストを使用する状態に切り替える。
いま、1番目から5番目のスポットライトは、色の制御とゴボの制御が可能であり、6番目から10番目のスポットライトは、色だけが制御可能な場合を想定する。この場合、認識語彙保持部2に設定される各リストは、表2、表3のようになる。
Figure 0004849131
Figure 0004849131
上述したように、認識語彙保持部2に2個のリストを設け、各一方のリストを切り替えて使用可能としたことにより、制御対象と操作との組がグループ化される場合に各グループごとのリストを作成することが可能であって、たとえば、制御対象のカテゴリに応じて可能な操作に制限があるような場合に、リストを分けて設定することができる。このようにリストを分けると、各リストに含まれる語彙数が低減されることにより、認識変換部3が認識語彙保持部2から語彙を抽出する際の負荷が軽減され、語彙の抽出に要する処理能力が比較的低くても語彙の抽出を実用的な時間内で行うことが可能になる。つまり、比較的安価に提供することが可能になる。また、認識変換部3において照合すべき語彙数が少なくなることによって、語彙が誤って抽出される可能性も低減され、音声による指示内容の認識率が向上する。
上述の例では2個のリストを設けているが、3個以上のリストを用いることも可能である。3個以上のリストを用いる場合には、各リスト間で他のリストを直接指定するように、最大で(リスト数−1)個の制御用語彙を登録しておけばよい。
ところで、認識語彙保持部2においてリストが選択されているときに他者と会話し、その会話において認識語彙保持部2に登録された語彙が使用されると、制御信号が出力されることがある。そこで、リストとして表5のように制御信号を生成するための語彙を含まないリスト(第2のリスト)を設定し、制御信号を生成するための語彙を含むリストと表5のような制御信号を生成しないリストとを切り替えて使用してもよい。リストの切替のために、表4のように制御信号を生成する語彙を含むリスト(第1のリスト)には、表5のリストに切り替えるための「制御停止」という制御用語彙を含め、表5のリストでは表4のリストに切り替えるための「制御開始」という制御用語彙を含める。認識変換部3では、これらの制御用語彙を抽出すると、上述した「前半を制御」「後半を制御」の語彙と同様に、リストの切替を行う。
Figure 0004849131
Figure 0004849131
制御部6において制御信号を生成するときには、表4に示すリストを選択しておけば、音声の入力によって制御対象および操作を選択することができ、制御部6において制御信号が生成される。一方、音声入力による制御を停止する場合には、「制御停止」という音声を入力する。「制御停止」という制御用語彙が抽出されると、認識変換部3では表5に示すリストを使用するように、リストの切替を行い、表5に示すリストでは「あ」……「ん」の50音の単音を語彙に含むだけであり制御信号を生成する語彙を含まないから、表5に示すリストが選択されている間には、「制御開始」以外のどのような語彙を入力しても制御信号が出力されることはない。
表5のリストが選択された状態において、「制御開始」という音声入力がなされると、認識変換部3が表4のリストを使用するようになり、上述した各実施形態と同様に制御部6において制御信号を生成することが可能になる。
すなわち、図4に示すように、表4のリスト(リスト4と記載している)が選択された状態で動作を開始(スタート)すると(S1)、音声入力に対して語彙の認識を行い(S2)、抽出した語彙が「制御停止」でなければ(S3)、抽出した語彙に従って制御信号を生成する(S4)。一方、ステップS3において「制御停止」が抽出されると、表5のリスト(リスト5と記載している)に切り替える(S5)。この状態でも音声入力に対する語彙の認識は行うが(S6)、「制御開始」以外では何の制御も行わない(S7)。「制御開始」が入力されたときには、表4のリストに切り替えて(S8)、音声入力に対する語彙の認識を行う動作に復帰する(S2)。
以上説明したように、表4のリストが選択されている状態において、「制御停止」という音声を入力すれば、表5のリストが選択され、このリストが選択されている間には、音声入力によっては制御信号を出力することができないから、たとえばヘッドセットマイクを装着し、音声入力を可能とするスイッチ(図示せず)を投入した状態であっても、他人との会話によって制御信号が生成されることはなく、他人との打ち合わせなどを交えながら、制御信号による制御対象の制御が可能になる。他の構成および動作は基本構成と同様である。
1 音声入力部
2 認識語彙保持部
3 認識変換部
4 制御対象記憶部
5 動作記憶部
6 制御部
7 タイマ
8 発声時間計測部
9 音圧レベル計測部
10 照明器具(照明機器)

Claims (1)

  1. 照明機器を制御対象とした制御信号を生成する制御部と、使用者が音声を入力する音声入力部と、制御対象と制御対象の操作とに関する語彙のリストを登録した認識語彙保持部と、音声入力部に入力される音声から認識語彙保持部に登録されている語彙を抽出する認識変換部と、認識変換部が認識語彙保持部から抽出した語彙が制御対象であるときに当該語彙が格納される制御対象記憶部と、認識変換部が認識語彙保持部から抽出した語彙が制御対象の操作であるときに当該語彙が格納される動作記憶部とを備え、制御部は、制御対象記憶部に格納される制御対象と動作記憶部に格納される操作との一方が更新されたことをトリガとして、制御対象記憶部と動作記憶部とにそれぞれ格納された語彙で示される制御内容の制御信号を生成して出力し、認識語彙保持部は、認識語彙保持部の語彙を所定時間ごとに登録順で抽出するように認識変換部に指示する第1の制御用語彙と、認識変換部に認識語彙保持部からの語彙の抽出の停止を指示する第2の制御用語彙とを含み、認識変換部は第1の制御用語彙を抽出したときに所定時間ごとに登録順で各語彙を抽出して制御対象記憶部と動作記憶部とのいずれか一方に抽出した語彙を格納し、第2の制御用語彙を抽出した時点で認識語彙保持部からの語彙の抽出を停止することを特徴とする音声認識による照明制御装置。
JP2009004731A 2009-01-13 2009-01-13 音声認識による照明制御装置 Expired - Fee Related JP4849131B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009004731A JP4849131B2 (ja) 2009-01-13 2009-01-13 音声認識による照明制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009004731A JP4849131B2 (ja) 2009-01-13 2009-01-13 音声認識による照明制御装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003149769A Division JP4367005B2 (ja) 2003-05-27 2003-05-27 音声認識による照明制御装置

Publications (2)

Publication Number Publication Date
JP2009116352A JP2009116352A (ja) 2009-05-28
JP4849131B2 true JP4849131B2 (ja) 2012-01-11

Family

ID=40783490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009004731A Expired - Fee Related JP4849131B2 (ja) 2009-01-13 2009-01-13 音声認識による照明制御装置

Country Status (1)

Country Link
JP (1) JP4849131B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201108861A (en) 2009-07-15 2011-03-01 Koninkl Philips Electronics Nv Luminaire with touch pattern control interface
US11592723B2 (en) 2009-12-22 2023-02-28 View, Inc. Automated commissioning of controllers in a window network
US11054792B2 (en) 2012-04-13 2021-07-06 View, Inc. Monitoring sites containing switchable optical devices and controllers
US10964320B2 (en) 2012-04-13 2021-03-30 View, Inc. Controlling optically-switchable devices
CA3156883A1 (en) 2014-03-05 2015-09-11 View, Inc. Monitoring sites containing switchable optical devices and controllers
CN105848378A (zh) * 2015-01-14 2016-08-10 潍坊歌尔光电有限公司 玄关灯的侦测控制装置
CN106879130B (zh) * 2015-12-14 2019-11-01 深圳市轻生活科技有限公司 可组网的语音识别灯及其语音识别灯控系统
CN109313498B (zh) * 2016-04-26 2023-08-11 唯景公司 控制光学可切换设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63228304A (ja) * 1987-03-18 1988-09-22 Toshiba Electric Equip Corp 調光装置
JPS63244585A (ja) * 1987-03-31 1988-10-12 東芝ライテック株式会社 自動調光装置
JPH02309399A (ja) * 1989-05-24 1990-12-25 Sekisui Chem Co Ltd 音声による照明制御装置
JP2002110368A (ja) * 2000-09-27 2002-04-12 Toshiba Lighting & Technology Corp 調光操作卓
JP2002135868A (ja) * 2000-10-21 2002-05-10 Katsuya Tanaka 音声による家庭電気器具制御システム。

Also Published As

Publication number Publication date
JP2009116352A (ja) 2009-05-28

Similar Documents

Publication Publication Date Title
JP4849131B2 (ja) 音声認識による照明制御装置
US5146502A (en) Speech pattern correction device for deaf and voice-impaired
JP6725006B2 (ja) 制御装置および機器制御システム
EP3246915A1 (en) Voice recognition system and method of robot system
JP2015501522A (ja) 照明システムをコントロールするための音声を使用したユーザーインターフェイス
JP2007334301A (ja) ユーザプロファイル管理コンポーネントを備えた音声認識システム
CN107909997A (zh) 一种拼接墙控制方法及系统
JP2005148151A (ja) 音声操作装置
CN104239007B (zh) 汉语自然人语音遥控电灯的方法
JP2018036902A (ja) 機器操作システム、機器操作方法および機器操作プログラム
JP4367005B2 (ja) 音声認識による照明制御装置
CN105700359A (zh) 一种语音识别智能家居控制方法及系统
CN109949803B (zh) 基于语义指令智能识别的建筑服务设施控制方法及系统
KR20190059509A (ko) 전자장치 및 그 제어방법
JP4951009B2 (ja) 音声認識による照明制御装置
JP4944909B2 (ja) 音声認識による照明制御装置
JP5589394B2 (ja) 音声認識によるエレベータの操作装置
CN109791764A (zh) 基于话音的通信
WO2022236111A1 (en) Real-time accent conversion model
JP3888584B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP2002278587A (ja) 音声認識入力装置
JP2015172848A (ja) 読唇入力装置、読唇入力方法及び読唇入力プログラム
KR102564985B1 (ko) 키 입력을 음성신호로 변환하는 장치 및 그 방법
US20220223152A1 (en) Information processing device, information processing method, and information processing program
JP2003015689A (ja) 音声操作装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100715

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110920

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111003

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141028

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees