JP6342118B2

JP6342118B2 - 画像表示装置、制御方法、コンピュータプログラム及び記録媒体

Info

Publication number: JP6342118B2
Application number: JP2013002161A
Authority: JP
Inventors: 大奎 ▲ペ▼; 泰煥車; 浩晶柳
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2012-01-09
Filing date: 2013-01-09
Publication date: 2018-06-13
Anticipated expiration: 2033-01-09
Also published as: US20210158821A1; AU2013200132A1; CN105847921A; JP2013142903A; US12033635B2; US20240339115A1; CN105847921B; KR101590332B1; US20130179168A1; US11763812B2; WO2013105782A1; IN2013DE00063A; EP2894633A1; AU2013200132B2; US20180025728A1; CN110265030A; CN103198832A; EP2613313A1; EP2613313B1; US9786278B2

Description

実施例は、音声認識を通じて命令を実行する映像装置及びその制御方法に関する。

一般に、映像装置、例えば、ＴＶは、映像信号を処理して様々な形態で出力する装置である。最近には、既存のアナログＴＶより優れた信号処理及び記憶容量を有したデジタルＴＶが開発され、商用化が進みながら、各家庭に接続されているインターネット網を用いてリアルタイム放送、ＣＯＤ（ＣｏｎｔｅｎｔｓｏｎＤｅｍａｎｄ）、ゲーム、画像通信などの様々な種類のコンテンツサービスをユーザに提供できるようになった。

また、映像装置が、上記の多様なサービスを含んだ様々な機能を行うためにユーザから命令の入力を受ける際に、マイクを介してユーザの音声の入力を受け、入力されたユーザの音声を認識して、対応する命令を実行する音声認識方式が適用されている。

しかし、マイクを介してユーザの音声が入力される時に、ユーザの音声以外に、他の背景音が共に入力され、特に、映像装置から出力される音響が共に入力されることがあり、この音響のボリュームが一定水準を超えると、映像装置でのユーザ音声認識率が低下する。

上述した問題を解決するために、一つ以上の実施例の側面は、映像装置でユーザの音声を認識する場合には、映像装置から出力される音響のボリュームを一定の水準に下げることにより、音声認識性能を向上させる映像装置及びその制御方法を提供することを目的とする。

実施例の一側面に係る音声認識可能な映像装置は、ユーザ側音響信号の入力を受ける第１音声入力部と；前記映像装置で処理される音響信号を出力する音響出力部と；前記第１音声入力部に入力されたユーザ側音響信号を分析する第１音声認識部と；前記分析されたユーザ側音響信号に音声認識の開始を示す音声認識開始命令が入力されると、前記出力される音響の大きさを、予め設定されたレベルに下げる制御部と；を含むことができる。

また、前記音声認識開始命令は、前記第１音声入力部を通じてユーザの音声信号として入力されてもよい。

また、前記制御部は、前記第１音声入力部を通じて音声認識開始命令語が入力されると、前記音声認識開始命令が入力されたものと判断することができる。また、前記制御部は、前記第１音声入力部を通じて予め設定された音量以上の音声が入力されると、前記音声認識開始命令が入力されたものと判断することができる。

前記映像装置は、前記第１音声入力部を通じて入力された前記ユーザ側音響信号から、前記ユーザの音声信号以外の背景音を低減させる背景音除去部をさらに含むことができる。

また、前記背景音除去部は、前記第１音声入力部を通じて入力された前記ユーザ側音響信号から、前記音響出力部を通じて出力される音響を低減させることができる。

前記制御部は、前記出力された音響の大きさを音声認識開始時のレベルに復帰させることができる。また、前記制御部は、予め定められた音声認識終了時間以上、前記第１音声入力部を通じて前記ユーザの制御命令が入力されないと、前記音声認識が終了したものと判断することができる。

また、前記制御部は、予め定められた命令要請時間以上、前記第１音声入力部を通じて前記ユーザの制御命令が入力されないと、前記ユーザに、制御命令を入力することを要請することができる。また、前記制御部は、前記第１音声入力部を通じて音声認識終了命令が入力されると、前記音声認識が終了したものと判断することができる。

前記映像装置は、前記音声認識開始命令に対応する音声認識開始命令語を生成する命令語生成部をさらに含むことができる。

また、前記命令語生成部は、前記第１音声入力部を通じて候補命令語が入力されると、前記候補命令語が前記音声認識開始命令語として適しているか否かをテストし、テストの結果、前記候補命令語が前記音声認識開始命令語として適している場合、前記音声認識開始命令語として登録することができる。

また、前記命令語生成部は、前記登録された音声認識命令語が２以上である場合、前記ユーザから選択命令の入力を受け、前記入力された選択命令に応じて前記音声認識開始命令語を選択して設定することができる。

前記映像装置は、前記映像装置を遠隔で制御する遠隔制御器をさらに含み、前記遠隔制御器は、前記ユーザの制御命令の入力を受ける入力ボタンと、ユーザ側音響信号の入力を受ける第２音声入力部と、前記第２音声入力部に入力された前記ユーザ側音響信号を分析する第２音声認識部と、を含むことができる。

また、前記制御部は、前記第２音声入力部を通じて予め設定された音量以上の音声が入力されると、前記音声認識開始命令が入力されたものと判断することができる。また、前記制御部は、音声認識が終了すると、前記音響出力部を通じて出力される音響の大きさを音声認識開始時のレベルに復帰させることができる。

また、前記制御部は、予め定められた音声認識終了時間以上、前記第２音声入力部を通じてユーザの制御命令が入力されないと、前記音声認識が終了したものと判断することができる。また、前記制御部は、予め定められた命令要請時間以上、前記第２音声入力部を通じてユーザの制御命令が入力されないと、前記ユーザに、制御命令を入力することを要請することができる。

また、前記制御部は、前記入力ボタンまたは前記第２音声入力部を通じて音声認識終了命令が入力されると、前記音声認識が終了したものと判断することができる。

実施例の他の一側面に係る音声認識可能な映像装置は、ユーザから制御命令語の入力を受ける音声入力部と、複数の制御命令語に対応する少なくとも一つのアイコンを表示し、前記音声入力部を通じてユーザから制御命令語が入力されると、前記入力された制御命令語に対応する前記少なくとも一つのアイコンのうち一つを変化させるディスプレイ部と、を含むことができる。

実施例の他の一側面に係る音響出力部を含む音響出力装置を制御する方法において、ユーザからユーザ側音響信号の入力を受け、前記入力されたユーザ側音響信号が音声認識開始命令語に対応するか否かを判断し、前記入力されたユーザ側音響信号が音声認識開始命令語に対応すると、前記音響出力部を通じて出力される音響の大きさを予め定められたレベルに下げることを含むことができる。

また、前記音声入力部を通じてユーザ側音響信号が入力されると、前記ユーザ側音響信号からユーザの音声信号以外の背景音信号を低減させることをさらに含むことができる。

また、前記背景音信号は、前記音響出力部を通じて出力される音響信号であってもよい。

また、前記音声認識が終了すると、前記出力された音響の大きさを音声認識開始時のレベルに復帰させることをさらに含むことができる。

また、前記音声認識が終了することは、予め定められた音声認識終了時間以上、前記音声入力部を通じてユーザの制御命令が入力されないと、音声認識が終了したものと判断することを含むことができる。

また、前記音声認識が終了することは、前記音声入力部を通じて音声認識終了命令が入力されると、音声認識が終了したものと判断することを含むことができる。

実施例の他の一側面に係る音声認識可能な処理装置の制御方法は、音声入力部を通じてユーザから候補命令語の入力を受け、前記入力された候補命令語が音声認識の対象になる制御命令語として適しているか否かをテストし、前記テストの結果、前記候補命令語が前記制御命令語として適している場合、前記候補命令語を前記制御命令語として登録することを含むことができる。

実施例の更に他の一側面に係る処理装置の制御方法は、前記処理装置の音声入力部または前記遠隔制御器を通じてユーザから音声認識開始命令が入力されると、前記処理装置から出力される音響の大きさを予め定められたボリュームレベルに下げ、前記ユーザから音声認識終了命令が入力されると、前記出力された音響の大きさを原状に復帰させることを含むことができる。

また、前記音声認識開始命令の入力を受けることは、前記音声入力部を通じてユーザの音声認識開始命令語の入力を受けることを含むことができる。

また、前記音声認識開始命令の入力を受けることは、前記音声入力部を通じて予め設定された音量以上の音声の入力を受けることを含むことができる。

また、前記音声認識終了命令の入力を受けることは、前記音声入力部を通じてユーザの音声認識終了命令語の入力を受けることを含むことができる。

また、前記音声認識終了命令の入力を受けることは、前記音声入力部を通じて、予め設定された音声認識終了時間以上、制御命令が入力されないことを含むことができる。

実施例の他の一側面に係る処理装置は、音響信号の出力を制御する音響出力制御器と；音声認識が開始したという決定に応答して、出力された音響の大きさを所定のレベルに下げること、及びユーザから入力されたユーザ側音響信号からユーザの音声信号以外の背景音を低減させることのうち少なくとも一つを行う制御器と；を含む。

実施例の一側面によれば、映像装置のユーザ音声認識性能が向上して、音声認識誤りによる映像装置の誤動作を防止することができる。

一実施例に係る映像装置の外観を示す図である。一実施例に係る映像装置本体の制御フローを示すブロック図である。一実施例に係る映像装置において、背景音除去部をさらに含む映像装置の制御フローを示すブロック図である。一実施例に係る映像装置において、制御命令語生成部をさらに含む映像装置の制御フローを示すブロック図である。一実施例に係る映像装置に含まれた遠隔制御器の外観を示す図である。一実施例に係る映像装置に含まれた遠隔制御器の制御フローを示すブロック図である。一実施例に係る映像装置の第１制御方法を示すフローチャートである。図７の実施例をより具体化したフローチャートである。他の実施例に係る映像装置の制御方法を示すフローチャートである。他の実施例に係る映像装置の制御方法を示すフローチャートである。一実施例に係る図９において、所定の時間の間にユーザから音声を通じた制御命令が入力されない場合に、音声認識を終了する方法を示すフローチャートである。一実施例に係る映像装置が音声認識モードである場合に、映像出力部に表示される画面を示す図である。一実施例に係る映像装置が音声認識モードである場合に、映像出力部に表示される画面を示す図である。一実施例に係る映像装置が音声認識モードである場合に、映像出力部に表示される画面を示す図である。一実施例に係る映像装置において、ユーザによって命令語を生成する方法を示すフローチャートである。一実施例に係る映像装置がユーザによって命令語を生成する場合に、映像出力部に表示される画面を示す図である。一実施例に係る映像装置がユーザによって命令語を生成する場合に、映像出力部に表示される画面を示す図である。一実施例に係る映像装置がユーザによって命令語を生成する場合に、映像出力部に表示される画面を示す図である。一実施例に係る映像装置がユーザによって命令語を生成する場合に、映像出力部に表示される画面を示す図である。

本明細書に記載された実施例と図面に示された構成は、本発明の好適な例に過ぎず、本明細書の実施例と図面を代替することができる様々な変形例があることを明記しておく。

以下では、添付の図面を参照して、実施例について詳細に説明する。

図１は、本発明の一実施例に係る映像装置１の外観を示す図である。図１を参照すると、一実施例に係る映像装置１は、ユーザの制御命令に応じて、映像と音響のうち少なくとも一つを出力する映像装置本体１００と、遠隔で映像装置本体１００を制御する遠隔制御器３００とを含む。

映像装置本体１００は、デジタルＴＶで具現することができ、放送プログラムの映像信号及び各種コンテンツの映像信号を出力する映像出力部１２１と、放送プログラムの音響信号及び各種コンテンツの音響信号を出力する音響出力部１２２と、ユーザの音声または動作を通じて制御命令を獲得するユーザ入力部１１０とを含む。

一実施例に係る映像装置１は、有無及び／または無線ネットワークを介した画像通話も可能である。映像装置１が画像通話サービスを提供する場合には、映像出力部１２１を通じて画像通話の相手の映像信号を出力することができ、音響出力部１２２を通じて画像通話の相手の音声信号を出力することができる。また、この場合には、ユーザ入力部１１０を通じてユーザの映像信号及び音声信号を獲得して、画像通話の相手に伝送することができる。

音響出力部１２２は、スピーカー（ｓｐｅａｋｅｒ）などで具現することができ、映像装置１において処理される音響信号を出力する。具体的に、放送プログラム信号に含まれた音響信号を出力したり、映像装置１において実行されるコンテンツに含まれる音響信号を出力する。また、上述したように、映像装置１が画像通話動作を実行する場合には、相手の音声信号も出力することができる。本実施例の映像装置１は、その後面に音響出力部１２２が備えられているが、一つ以上の他の実施例がこれに限定されるものではなく、ユーザに音響を出力できる場所であれば、その位置に制限がない。

映像出力部１２１は、映像装置１において処理される映像信号を出力する。具体的に、放送プログラム信号に含まれた映像信号を出力したり、映像装置１において実行されるコンテンツに含まれる映像信号を出力する。また、映像装置１が画像通話動作を実行する場合には、画像通話の相手の映像信号も出力することができる。

ユーザ入力部１１０は、ユーザの映像を入力する映像入力部１１１と、ユーザの音声を入力する第１音声入力部１１２とを含む。

映像入力部１１１は、ユーザの映像を受けるレンズと、レンズを介して入ってきたユーザの映像を撮像するためのＣＣＤセンサ、ＣＭＯＳセンサなどの撮像素子と、撮像素子により撮像された映像を処理するための映像信号処理器（ＩｍａｇｅＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ：ＩＳＰ）とを含む。

第１音声入力部１１２は、マイク（ｍｉｃｒｏｐｈｏｎｅ）などで具現することができ、ユーザの音声を受け取る。しかし、第１音声入力部１１２は、ユーザの音声以外に、背景音、特に、映像装置１の音響出力部１２２から出力される音響を共に受け取ることがある。したがって、以下では、第１音声入力部１１２を通じて入力される信号、即ち、映像装置１または信号を獲得する他の装置、例えば、リモコンの周囲の周辺環境の音響を、‘ユーザ側音響信号’と呼ぶ。ユーザ側音響信号にはユーザの音声信号以外に、他の背景音信号が含まれ得る。

図１では、映像装置１が、映像入力部１１１と音声入力部１１２とが一体型で備えられたＭｏＩＰ（ＭｕｌｔｉｍｅｄｉａｏｖｅｒＩＰ）を備えるものとして示したが、一つ以上の他の実施例がこれに限定されるものではなく、映像入力部１１１なしに、第１音声入力部１１２を備えることも可能である。

一実施例に係る映像装置１は、その動作を制御する際に、ユーザが、遠隔制御器３００または映像装置本体１００に備えられた入力ボタンを押さずに、第１音声入力部１１２を通じて制御命令を音声信号として入力することが可能である。例えば、図１に示されたように、映像出力部１２１に様々なコンテンツメニューが表示されると、ユーザは、所望のメニューに対応する命令語を第１音声入力部１１２に音声信号として入力することにより、メニューを選択することができる。

ユーザ入力部１１０は、図１に示されたように、映像装置本体１００と別途に具現してもよいが、映像装置本体１００と一体型に具現してもよい。

図２は、一実施例に係る映像装置本体１００の制御フローを示すブロック図である。図２を参照すると、一実施例に係る映像装置本体１００は、放送信号を受信する放送信号受信部２３０と、コンテンツを実行するコンテンツ実行部２４０と、受信した放送の音響またはコンテンツに含まれた映像を処理する映像処理部２５１と、受信した放送の音響またはコンテンツに含まれた音響を処理する音響処理部２５２と、映像処理部２５１により処理された映像を出力する映像出力部１２１と、音響処理部２５２により処理された音響を出力する音響出力部１２２と、ユーザから音声信号を受信する第１音声入力部１１２と、ユーザから受信した音声信号に基づいて制御命令を認識する第１音声認識部２１０と、遠隔制御器３００から制御信号を受信する第１通信部２６０と、映像装置本体１００の動作全般を制御する第１制御部２２０と、を含む。

放送信号受信部２３０は、映像信号及び音声信号を含む放送信号を受信する。放送信号受信部２３０は、アンテナ及びチューナなどで構成され、映像信号は、映像出力部１２１を通じて映像として出力し、音響信号は、音響出力部１２２を通じて音響として出力する。

コンテンツ実行部２４０は、マルチメディアコンテンツを実行する。コンテンツ実行部２４０において実行するマルチメディアコンテンツは、映像装置内に格納されているゲーム、動画ファイルまたは音楽ファイルなどであってもよく、映像装置１が有線または無線でインターネットに接続されている場合には、インターネット上で提供される様々なマルチメディアコンテンツであってもよい。また、映像装置が、移動通信機器やコンピュータなどの他の外部機器と接続されている場合には、接続された外部機器で提供するマルチメディアコンテンツであってもよく、コンテンツ実行部２４０において実行するマルチメディアコンテンツの種類には制限がない。

音響処理部２５２は、放送信号受信部２３０及びコンテンツ実行部２４０から伝送される音響信号を、音響出力部１２２を通じて出力できるように、音響処理を行う。音響処理部２５２は、デコーダを備えて、放送音響信号のように一定のフォーマットで圧縮されている信号をデコーディングし、Ｄ／Ａコンバータを備えて、デジタル信号をアナログ信号に変換した後に音響出力部１２２に伝送することができる。

映像処理部２５１は、放送信号受信部２３０及びコンテンツ実行部２４０から伝送される映像信号を、映像出力部１２１を通じて出力できるように、映像処理を行う。映像処理部２５１は、デコーダを備えて、放送映像信号のように一定のフォーマットで圧縮されている信号をデコーディングし、Ｄ／Ａコンバータを備えて、デジタル信号をアナログ信号に変換した後に映像出力部１２１に伝送することができる。

第１音声入力部１１２は、ユーザから制御命令に関する音声信号の入力を受ける。第１音声入力部１１２は、マイクで具現することができ、例えば、図１に示されたように、マイクとカメラとが一体型で備えられたＭｏＩｐで具現することも可能である。また、第１音声入力部１１２は、入力されたユーザ側音響信号を増幅し、増幅されたユーザ側音響信号を、アナログ信号からデジタル信号に変換して音声認識部に伝送することができる。

前記第１音声入力部１１２は音声エンコーダを含むことができる。音声エンコーダは、第１音声入力部１１２がデータインターフェースを介して映像装置本体１００と接続された場合、ユーザ側音響信号をデータインターフェースのバンド幅（ｂａｎｄｗｉｄｔｈ）に適したフォーマットで圧縮したり、画像通話を実行する場合、画像通話の相手に送信できるフォーマットで圧縮することができる。この場合、映像装置本体１００には音声デコーダが備えられて、音声認識などを行う前に圧縮されたユーザ側音響信号をデコーディングする。

上述したように、第１音声入力部１１２を通じてユーザの音声が入力される時に、ユーザの音声以外に、他の背景音も共に入力され得るので、第１音声入力部１１２を通じて入力されるものはユーザの音声信号を含むユーザ側音響信号である。ユーザが第１音声入力部１１２を通じて制御命令を入力する時には、映像装置１が動作中であるので、ユーザ側音響信号には、ユーザの音声信号と共に音響出力部１２２を通じて出力された音響信号が含まれ得る。

第１音声認識部２１０は、第１音声入力部１１２を通じて入力されたユーザ音声信号を分析して、ユーザが入力した制御命令を認識する。音声認識の方式としては、予め格納された標準パターンと入力された音声信号とを比較し、入力された音声信号と最も近い音声パターンを検出するパターンマッチング方式と、一つの単語と他の単語を区別するための関数を予め設定し、設定された関数をユーザ音声信号に適用させて判定する識別関数方式のうち少なくとも一つを含むことができる。また、音声認識を単語単位で行ってもよく、音素単位で行ってもよい。音声認識部２１０の音声認識方式は、従来の技術のうちいずれをも採用してもよく、上述した方式に限定されない。

第１通信部２６０は、後述する遠隔制御器３００から制御信号を受信して、第１制御部２２０に提供する。第１通信部２６０は、Ｗｉ−Ｆｉ通信方式、ブルートゥース（ｂｌｕｅｔｏｏｔｈ）通信方式、ジグビー（Ｚｉｇｂｅｅ（登録商標））通信方式などの無線通信方式を採用できるだけでなく、構成が比較的簡単な赤外線通信方式を採用してもよい。

第１制御部２２０は、第１音声認識部２１０から認識結果の伝送を受け、その結果による制御を実行する。例えば、認識結果による制御命令が放送チャネルの変更である場合には、放送信号受信部２３０に制御信号を送って、制御命令に応じたチャネルの変更を行うようにし、認識結果による制御命令がコンテンツの選択である場合には、コンテンツ実行部２４０に制御信号を送って、制御命令に応じたコンテンツを実行するようにすることができる。

また、第１制御部２２０は、第１音声認識部２１０で伝送された制御命令が音声認識開始命令である場合には、音響出力部１２２から出力される音響のボリュームを、予め設定されたレベルに下げる。第１音声入力部１１２を通じて予め設定された音声認識開始命令語が入力されたり、予め設定された基準音量以上の音声が入力されると、第１音声認識部２１０が、これを音声認識開始命令と認識し、第１制御部２２０に音声認識開始命令が入力されたことを伝送する。音声認識開始命令が入力されると、第１制御部２２０は、映像装置１を音声認識モードに切り替え、音響出力部１２２のボリュームレベルを予め設定されたレベルに下げることができる。

音声認識開始命令語を通じて音声認識開始命令が入力される場合、音声認識を開始する開始命令語は、“ＨｉＴＶ”、“ＴＶ”などのように、比較的音声認識が容易な簡単な単語として設定することができる。さらに、後述するように、遠隔制御器３００や映像装置本体１００などに備えられた入力ボタンを介してユーザが音声認識開始命令を入力することも可能である。

上述したように、ユーザ側音響信号には、ユーザ音声信号だけでなく、音響出力部１２２を通じて出力された音響信号も含まれ得る。ユーザ側音響信号にこのような背景音が含まれている場合には、第１音声認識部２１０での音声認識率が低下することがある。音声認識が行われる間に、第１制御部２２０が、音響出力部１２２を通じて出力される音響のボリュームを予め設定された一定のレベルに下げると、ユーザ側音響信号に背景音が含まれても、ユーザの音声信号のみを抽出して制御命令を認識することがより容易になる。

ここで、予め設定されたボリュームレベルは、背景音が含まれても一定水準以上の音声認識率を確保することができる水準のレベルを示す。例えば、音声認識率を８０％以上確保できるボリュームレベルが５である場合には、音声認識開始命令が入力されると、音響出力部１２２から出力される音響のボリュームレベルを５に下げるように設定することができる。予め設定されるボリュームレベルは、実験または統計によって製造過程で予め設定されてもよく、ユーザによって予め設定されてもよい。

ただし、予め設定されるボリュームレベルは０ではないとよい。例えば、ユーザが映像装置を通じて音楽鑑賞の中に、映像装置に格納されているアルバムを見るために、音声認識を通じてコンテンツ選択に関する制御命令を入力することができる。このとき、音響出力部１２２から出力される音響のボリュームが０になって消音されれば、作業の連続性が阻害され、同時に様々な作業を行うとするユーザの意図とも符合しなくなる。したがって、予め設定されるボリュームレベルは、実行中の作業の連続的な実行と音声認識率を全て考慮して適切に選択され得るようにする。

また、第１制御部２２０は、現在のボリュームレベルが予め設定されたボリュームレベルよりも低いか、または同一であると判断された場合には、現在のボリュームレベルをそのまま維持するようにする。

音声認識が終了すると、第１制御部２２０は、音響出力部１２２を通じて出力される音響のボリュームレベルを原状に復帰させる。第１音声入力部１１２を通じて音声認識終了命令が入力されたり、予め定められた基準時間の間に音声認識の対象になる制御命令が入力されなかったり、遠隔制御器３００、映像装置本体１００などに備えられた入力ボタンを介して音声認識終了命令が入力されると、音声認識が終了したものと判断することができる。

図３は、一実施例に係る映像装置１において、背景音除去部２７０をさらに含む映像装置１の制御フローを示す図である。図３の実施例では、図２で説明した内容と重複する内容は省略し、説明の便宜のために、背景音除去部２７０を重点的に説明する。

上述したように、ユーザ側音響信号に背景音が含まれている場合には、第１音声認識部２１０での音声認識率が低下するだけでなく、画像通話を行う場合、画像通話の相手に優れた品質の音声信号を伝達することができない。したがって、一実施例に係る映像装置１は、ユーザ側音響信号から背景音を除去したり、または低減させる背景音除去部２７０をさらに含むことができる。

背景音除去部２７０は、音響エコー除去器（ＡｃｏｕｓｔｉｃＥｃｈｏＣａｎｃｅｌｌｅｒ）で具現することができる。音響エコー除去器は、音響信号とレファレンス信号（ｒｅｆｅｒｅｎｃｅｓｉｇｎａｌ）の入力を受け、入力された音響信号から、レファレンス信号に基づいて背景音を除去する。一実施例に係る映像装置１では、音響出力部１２２を通じて出力される音響信号をレファレンス信号として、背景音除去部２７０に入力されたユーザ側音響信号から、音響出力部１２２を通じて出力される音響信号を除去することができる。また、ユーザが放送プログラムを視聴中である場合には、放送信号受信部２３０で受信した音響信号を直接レファレンス信号としてもよく、コンテンツを実行中である場合には、コンテンツ実行部２４０で生成された音響信号を直接レファレンス信号としてもよい。

背景音除去部２７０で背景音が除去されたユーザ側音響信号は、第１音声認識部２１０に伝送される。ユーザが音声認識開始命令を音声信号として入力する場合には、音響出力部１２２のボリュームレベルが下げられていない状態で、第１音声認識部２１０にユーザ側音響信号が伝送される。したがって、背景音除去部２７０で背景音を除去すると、音声認識部で音声認識開始命令を認識することがより容易になる。

しかし、背景音除去部２７０で背景音を除去しても、音響出力部１２２を通じて出力される音響のボリュームが一定水準以上であれば、ユーザ音声信号と背景音信号とを分離して背景音信号のみを除去することが容易でなく、背景音除去部２７０で背景音信号をある程度除去しても、背景音の残像が残っているため、第１音声認識部２１０での音声認識率が低下することがある。

また、音声認識開始命令語は、主に音声認識が容易な簡単な単語として設定して、背景音除去部２７０のみで音声認識誤りが多く減少するのに比べて、他の制御命令語は、音声認識開始命令語よりも長くて、複雑な場合が多いため、背景音除去のみでは所望の音声認識率を得ることが難しい。したがって、一実施例においては、第１音声認識部２１０において音声認識開始命令が入力されたものと判断した後、第１制御部２２０において音響出力部１２２のボリュームレベルを予め設定されたレベルに下げることで、音声認識性能をさらに向上させる。

図４は、一実施例による映像装置１０において、制御命令語生成部２８０をさらに含む映像装置１の制御フローを示す図である。図４に示すように、映像装置１は、ユーザが命令語を生成できるようにする命令語生成部２８０をさらに含むことができる。

命令語生成部２８０は、ユーザから候補命令語を受信する命令語受信部２８１と、受信された候補命令語が命令語として適しているか否かをテストするテスト部２８２と、テスト部２８２のテスト結果によって、候補命令語を登録するか否かを決定する設定部２８３と、を含む。

命令語生成部２８０は、映像装置１の音声認識の対象になる命令語を全て生成することができ、特に、音声認識開始命令語を生成するのに有用に使用することができる。

上述したように、ユーザ側音響信号に背景音が含まれていると、音声認識性能が低下し、特に、背景音のボリュームレベルが大きすぎると、背景音除去部２７０を経ても音声認識に誤りが発生する可能性が高い。第１音声認識部２１０において音声認識開始命令が入力されたものと判断すると、音響出力部１２２のボリュームレベルを予め設定されたレベルに下げるが、音声認識開始命令語は、音響出力部１２２のボリュームレベルが調節されていない状態で入力されるため、背景音の音響が高くても音声認識部で容易に認識できる単語として設定することが有利である。

具体的に、ユーザは、映像装置に予め設定されている命令語の他に、自分が所望の新しい命令語を登録して使用することができる。ユーザが、第１音声入力部１１２を通じて新しい命令語を候補命令語として入力すると、命令語受信部２８１において候補命令語に関する音声信号を受信する。

そして、テスト部２８２は、命令語受信部２８１で受信した候補命令語が、音声認識開始命令語として使用するのに適した単語であるか否かをテストする。言い換えると、テスト部２８２は、候補命令語が、音声認識部で容易に音声認識を行うことができる単語であるか否か、ボリュームレベルが大きい背景音と共に入力されても、一定水準の音声認識率を維持することができる単語であるか否かを判断する。

設定部２８３は、テスト部２８２のテスト結果によって、候補命令語を登録するか否かを決定する。一例として、テスト部２８２のテスト結果、候補命令語の音声認識率が８０％以上であれば、音声認識開始命令語として登録し、候補命令語を第１音声認識部２１０に伝送することができる。その後、第１音声入力部１１２を通じて該当の命令語が入力されると、第１音声認識部２１０は、音声認識開始命令語として認識し、第１制御部２２０に信号を送る。

ユーザが複数の候補命令語を入力して複数の命令語が登録された場合、ユーザから命令語の選択に関する命令の入力を受けて、ユーザの選択命令に応じた命令語を音声認識開始命令語として設定することができ、複数の命令語を音声認識開始命令語として設定してもよい。複数の命令語が音声認識開始命令語として登録された場合、第１音声認識部２１０は、第１音声入力部１１２を通じて複数の命令語のいずれか一つが入力されると、音声認識開始命令が入力されたものと判断する。

図５は、一実施例に係る映像装置１に含まれた遠隔制御器３００の外観を示す図である。図５を参照すると、遠隔制御器３００は、タッチまたはボタンを介してユーザの制御命令を入力する入力ボタン３２０と、音声を介してユーザの制御命令を入力する第２音声入力部３１２（図６参照）とを含む。

入力ボタン３２０は、映像装置１の電源をオンまたはオフするための電源ボタン３２１と、映像装置１の音響出力の大きさを調節するための音量調節ボタン３２３と、映像装置１を通じて表示される放送のチャネルを調節するチャネル調節ボタン３２５と、音声認識開始命令を入力するための音声認識ボタン３２７と、を含む。

入力ボタン３２０は、ボタン式スイッチ、メンブレン（ｍｅｍｂｒａｎｅ）スイッチなどのスイッチ、またはユーザの身体の一部の接触を感知するタッチパッド（ｔｏｕｃｈｐａｄ）を採用することができる。さらに、スイッチとタッチパッドを混用してもよい。例えば、通常、ユーザがよく使用する電源ボタン３２１、音量調節ボタン３２３、チャネル調節ボタン３２５は、タッチパッドを採用し、音声認識ボタン３２７はメンブレンスイッチを採用してもよい。

第２音声入力部３１２は、ユーザから制御命令に関する音声信号の入力を受ける。第２音声入力部３１２は、音波を電気的信号に変換するマイクを含むことができ、入力された音声信号を増幅する増幅器と、音声信号をデジタル信号に変換するアナログ−デジタル変換器（Ａ／ＤＣｏｎｖｅｒｔｅｒ）をさらに含むことができる。

図６は、一実施例に係る映像装置１に含まれた遠隔制御器３００の制御フローを示すブロック図である。図６を参照すると、遠隔制御器３００は、その機能を行うために、タッチまたはボタンを介してユーザから制御命令の入力を受ける入力ボタン３２０と、音声信号を介してユーザから制御命令の入力を受ける第２音声入力部３１２と、第２音声入力信号３１２を介して入力された音声信号から制御命令を識別する第２音声認識部４１０と、映像装置本体１００に制御信号を送信する第２通信部４６０と、遠隔制御器３００の動作全般を制御する第２制御部４２０と、を含む。

入力ボタン３２０及び第２音声入力部３１２は、図５と関連して既に説明したので、その説明を省略する。

第２通信部４６０は、映像装置本体１００に制御信号を送信する。第２通信部４６０は、Ｗｉ−Ｆｉ通信方式、ブルートゥース通信方式、ジグビー通信方式などの無線通信方式を採用することができ、さらに、構成が比較的簡単な赤外線通信方式を採用してもよい。

第２制御部４２０は、入力ボタン３２０または第２音声認識部４１０を通じて提供された制御命令に応じて第２通信部４６０を制御して、映像装置本体１００に制御信号を送信する。具体的に、入力ボタン３２０を介して音響増減命令またはチャネル変更命令が入力されると、これを第２通信部４６０を通じて映像装置本体１００に送信する。

また、入力ボタン３２０に設けられた音声認識ボタン３２７を介して音声認識開始命令が入力されると、音声認識開始命令を映像装置本体１００に送信し、第２音声認識部４１０により識別された制御命令を、第２通信部４６０を通じて映像装置本体１００に送信する。また、このように、ユーザから音声認識開始命令の入力を受ける音声認識ボタン３２７は、映像装置本体１００に設けられてもよい。また、音声認識開始命令は、映像装置本体１００で提供するメニューを介しても入力され得る。

映像装置本体１００に設けられた第１制御部２２０は、遠隔制御器３００から音声認識開始命令が送信されると、音響出力部１２２を通じて出力される音響のボリュームを予め設定されたレベルに下げたり、遠隔制御器３００から音声を介した制御命令が送信されると、音響出力部１２２の音響ボリュームを予め設定されたレベルに下げることができる。

また、第２制御部４２０は、音声認識が終了すると、音声認識終了命令を第２通信部４６０を通じて映像装置本体１００に送信し、これを受信した映像装置本体１００は、音響出力部１２２を通じて出力される音響のボリュームを原状に復帰させる。音声認識の終了は、ユーザが音声認識ボタン３２７を介して音声認識終了命令を入力したり、予め定められた基準時間の間に音声認識の対象になる制御命令が入力されない場合に行われる。

映像装置本体１００に比べて、遠隔制御器３００は、ユーザが比較的近距離で音声命令を入力するので、一実施例に係る遠隔制御器３００は、背景音を除去するための背景音除去部を含んでいないが、一つ以上の実施例がこれに限定されるものではなく、遠隔制御器３００も背景音除去部を含んでもよい。

以下、一実施例に係る映像装置１の制御方法について説明する。

図７は、一実施例に係る映像装置１の制御方法を示すフローチャートである。図７を参照すると、まず、第１音声入力部１１２を通じて、ユーザからユーザ側音響信号の入力を受ける（ステップ５１１）。ユーザ側音響信号には、ユーザの音声信号、及び映像装置１の音響出力部１２２を通じて出力された音響信号が含まれ得る。

入力されたユーザ側音響信号が音声認識開始命令を示すか否かを判断する（ステップ５１３）。すなわち、音声認識開始命令が入力されたか否かを判断する。具体的に、音声認識部２１０において、予め格納された音声認識開始命令語と入力されたユーザ側音響信号とが一致するか否かを判断して、音声認識開始命令が入力されたか否かを判断する。

判断の結果、入力されたユーザ側音響信号が音声認識開始命令を示す場合（ステップ５１３の‘はい’）、音響出力部１２２のボリュームレベルを予め設定されたレベルに下げる（ステップ５１５）。ここで、予め設定されたレベルは、音声認識率を考慮して実験的または統計的に定めることができ、ユーザが設定及び変更できるようにすることも可能である。

そして、音声認識が終了したか否かを判断し（ステップ５１７）、音声認識が終了した場合（ステップ５１７の‘はい’）には、音響出力部１２２のボリュームレベルを元の状態に復帰させる（ステップ５１９）。

図８は、図７の実施例をより具体化したフローチャートである。図８を参照すると、まず、第１音声入力部１１２を通じて、ユーザからユーザ側音響信号の入力を受け（ステップ５２１）、入力されたユーザ側音響信号から背景音信号を除去する（ステップ５２３）。ここで、背景音信号は、音響出力部を通じて出力される音響信号であってもよい。背景音除去に音響エコー除去器（ＡＥＣ）を用いることができ、ユーザ側音響信号を入力信号として入力し、音響出力部１２２を通じて出力される音響信号をレファレンス信号として入力する。

そして、音声認識開始命令が入力されたか否かを判断（ステップ５２５）することは、図７と同一である。

判断の結果、音声認識開始命令が入力された場合（ステップ５２５の‘はい’）、すなわち、ユーザ側音響信号が音声認識開始命令を示すものであれば、現在の音響出力部１２２のボリュームレベルが予め設定されたレベルを超過するか否かを判断する（ステップ５２７）。

判断の結果、現在の音響出力部１２２のボリュームレベルが予め設定されたレベルを超過する場合（ステップ５２７の‘はい’）、音響出力部１２２のボリュームレベルを予め設定されたレベルに下げ（ステップ５２９）、そうでないと、現在の音響出力部１２２のボリュームレベルをそのまま維持する。

そして、音声認識が終了したか否かを判断する（ステップ５３１）。音声認識が終了したか否かは、ユーザから音声認識終了命令が入力されたか否か、または予め定められた基準時間の間にユーザの制御命令が入力されなかったかどうかなどで判断することができる。音声認識終了命令は、音声信号として入力されてもよく、遠隔制御器３００や映像装置本体１００に備えられた入力ボタンを押して入力されたり、モーション認識を通じて入力されてもよい。

音声認識が終了したものと判断される場合（ステップ５３１の‘はい’）、音響出力部１２２のボリュームレベルを元の状態に復帰させる（ステップ５３３）。但し、音声認識を開始する時に、音響出力部１２２のボリュームレベルが、予め設定されたレベルよりも小さいか、または同一であるので、そのまま維持された場合には、音声認識が終了しても音響出力部１２２のボリュームレベルはそのまま維持される。

図９は、一実施例に係る映像装置１の制御方法を示すフローチャートである。図９を参照すると、映像装置１は、音声認識開始命令が入力されたか否かを判断する（ステップ６１１）。具体的に、映像装置本体１００に設けられた第１音声入力部１１２を通じて、事前に定義された音声認識開始命令語（例えば、“ＨｉＴＶ”、“ＴＶ”など）が入力されたり、映像装置本体１００に設けられた音声認識ボタンまたは遠隔制御器３００に設けられた音声認識ボタン３２７を介して音声認識開始命令が入力されると、映像装置１は、音声認識開始命令が入力されたものと判断し、映像装置１は、音声認識モードに進入する。また、映像装置１は、映像装置本体１００に設けられた第１音声入力部１１２または遠隔制御器３００に設けられた第２音声入力部３１２を通じて予め設定された音量以上の音声が入力されると、音声認識開始命令が入力されたものと認識し、音声認識モードに進入することができる。

さらに、映像装置本体１００に設けられた音声入力部１１２を通じて音声認識開始命令語が入力される場合、映像装置１は、背景音除去部２７０を通じて音声認識開始命令語以外の背景音信号を除去することにより、音声入力部１１２を通じて入力される音声認識開始命令語をさらに正確に認識することができる。

音声認識開始命令が入力されると、映像装置１は、音響出力部１２２のボリュームレベルを予め設定されたボリュームレベルに下げる（ステップ６１３）。このとき、音響出力部１２２のボリュームレベルが予め設定されたボリュームレベル以下であれば、映像装置１の音響出力部１２２のボリュームレベルを下げる動作を行わなくてもよい。

次に、映像装置１は、音声入力部１２１を通じて入力されるユーザの音声制御命令に応じて、放送信号受信部２３０、コンテンツ実行部２４０、音響出力部１２２などを制御する（ステップ６１５）。ユーザの音声制御命令に応じた映像装置１の制御は、図１２を参照して、以下で詳細に説明する。

次に、映像装置１は、音声認識が終了したか否かを判断する（ステップ６１７）。例えば、音声認識モードで、映像装置本体１００に設けられた音声入力部１１２を通じて、事前に定義された音声認識開始命令語（例えば、“ＨｉＴＶ”、“ＴＶ”など）が再び入力されたり、または事前に定義された音声認識開始命令語が入力されたり、音声認識モードで、映像装置本体１００に設けられた音声認識ボタンまたは遠隔制御器３００に設けられた音声認識ボタン３２７が選択されると、映像装置１は、音声認識終了命令が入力されたものと判断する。さらに、予め設定された所定の時間の間にユーザから音声を介した制御命令が入力されないと音声認識を終了する。所定の時間の間にユーザから音声を介した制御命令が入力されない場合、音声認識を終了することについては、図１０を参照して、以下で詳細に説明する。

音声認識が終了したものと判断されると、映像装置１は、音声認識モードから解除されて音響出力部１２２のボリュームレベルを原状に復帰させる（ステップ６１９）。

図１０は、他の実施例に係る映像装置１の制御方法を示すフローチャートである。図１０を参照すると、映像装置１は、音声認識開始命令が入力されたか否かを判断する（ステップ７１１）。具体的に、映像装置本体１００に設けられた第１音声入力部１１２を通じて音声認識開始命令語（例えば、“ＨｉＴＶ”、“ＴＶ”など）が入力されたり、映像装置本体１００に設けられた音声認識ボタンまたは遠隔制御器３００に設けられた音声認識ボタン３２７を通じて音声認識開始命令が入力されたり、映像装置本体１００に設けられた第１音声入力部１１２または遠隔制御器３００に設けられた第２音声入力部３１２を通じて予め設定された音量以上の音声が入力されると、映像装置１は、音声認識開始命令が入力されたものと判断する。

音声認識開始命令が入力されると、映像装置１は、第１音声入力部１１２または第２音声入力部３１２を通じて、予め設定された音量以上の音声が入力されるか否かを判断する（ステップ７１３）。

予め設定された音量以上の音声が入力されると、映像装置１は、音響出力部１２２のボリュームレベルを予め設定されたボリュームレベルに下げる（ステップ７１５）。すなわち、図９で示す実施例の制御方法は、音声認識が開始されると直ちに音響出力部１２２のボリュームレベルを下げるのに比べて、本実施例による制御方法は、音声認識が開始された後、ユーザが音声を介して制御命令を入力する時にはじめて音響出力部１２２のボリュームレベルを下げる。このように制御することにより、ユーザが実行中にある作業の連続性をさらに確保することができる。

次に、映像装置１は、音声を介したユーザの制御命令に応じて、映像装置１に含まれた各構成を制御する（ステップ７１７）。

その後、映像装置１は、再び第１音声入力部１１２または第２音声入力部３１２を通じて、予め設定された音量以上の音声が入力されるか否かを判断する（ステップ７１９）。

予め設定された音量以上の音声が入力されると、映像装置１は、再び音声を介したユーザの制御命令に応じて、映像装置１に含まれた各構成を制御する（ステップ７１７）。しかし、予め設定された基準ボリューム下げ時間以上、予め設定された音量以上の音声が入力されない場合（ステップ７２１）、映像装置１は、音響出力部１２２のボリュームレベルを原状に復帰させる（ステップ７２３）。

すなわち、映像装置１は、音声認識モードに進入した後、予め設定された音量以上の音声が入力されると、音響出力部１２２のボリュームレベルを下げ、所定の基準ボリューム下げ時間の間に音声を介した制御命令が入力されないと、映像装置１は、音響出力部１２２のボリュームレベルを原状に復帰させる。

次に、映像装置１は、音声認識が終了したか否かを判断する（ステップ７２５）。

図１１は、一実施例に係る、所定の時間の間にユーザから音声を介した制御命令が入力されない場合、音声認識を終了する方法を示すフローチャートである。図１１に示すように、音声認識モードに進入すると、映像装置１は、待ち時間を初期化し、（ステップ６２１）、音声認識終了時間を第１基準時間として設定する（ステップ６２３）。ここで、待ち時間は、音声認識モードで、ユーザが音声を介した制御命令を入力するまで映像装置１が待機した時間を意味し、音声認識終了時間は、ユーザが音声を介した制御命令を入力しない場合、音声認識を終了するための所定の時間を意味する。また、第１基準時間は、音声認識モードに進入した後、ユーザが音声を介した制御命令を入力しない場合、映像装置１が待機する時間を意味する。

その後、映像装置１は、音声を介したユーザの制御命令が入力されるか否かを判断する（ステップ６２５）。

もし、音声を介したユーザの制御命令が入力されると、映像装置１は、ユーザの制御命令に応じて放送信号受信部２３０、コンテンツ実行部２４０、音響出力部１２２などを制御する（ステップ６２７）。

その後、映像装置１は、待ち時間を初期化し（ステップ６３１）、音声認識終了時間を第２基準時間として設定する（ステップ６３３）。ここで、第２基準時間は、音声認識モードに進入し、ユーザが音声を介して制御命令を入力した後、ユーザの次の制御命令まで映像装置１が待機する時間を意味する。通常、ユーザが制御命令を入力し、これによる映像装置１の動作を確認するのに時間が要求されるので、第２基準時間は、第１基準時間に比べてより長い時間とすることが好ましい。例えば、第１基準時間を３０秒と決める場合、第２基準時間は、ユーザが制御命令に応じた映像装置１の動作を確認するのに要求される時間を考慮して６０秒と決めることができる。

その後、映像装置１は、再び音声を介したユーザの制御命令が入力されるか否かを判断する（ステップ６２５）。

もし、音声を介したユーザの制御命令が入力されないと、映像装置１は、待ち時間が命令要請時間を経過したか否かを判断する（ステップ６３５）。命令要請時間は、ユーザが音声を介して制御命令を入力しない場合、ユーザに制御命令を要請するための所定の時間間隔を意味し、音声認識が終了する前に少なくとも一回以上、ユーザに制御命令要請をするために、命令要請時間は、音声認識終了時間よりも短いことが好ましい。

命令要請時間の間にユーザが音声を介した制御命令を入力しない場合、映像装置１は、映像出力部１２１と音響出力部１２２のうち少なくとも一つを通じて、“機能を言って下さい。”、“チャネルを変更しましょうか”、“音量を調整しましょうか”など、ユーザに制御命令を入力することを要請する（ステップ６３７）。

その後、映像装置１は、待ち時間が音声認識終了時間を経過したか否かを判断する（ステップ６３９）。

映像装置１の待ち時間、すなわち、ユーザが音声を介した制御命令を入力しない時間が、音声認識終了時間以上である場合、映像装置１は音声認識を終了する（ステップ６４１）。

図１２Ａ乃至図１２Ｃは、一実施例に係る映像装置１が音声認識モードである場合、映像出力部１２１に表示される画面を示す図である。

図１２Ａを参照すると、映像出力部１２１の下端にのみ制御関連のアイコンが表示され、残りの領域にはメイン画面が表示される。下端に表示されたアイコンのうち、‘電源オン／オフ’アイコン１２１ａは、電源オン（ｏｎ）に対する制御命令及び電源オフ（ｏｆｆ）に対する制御命令に対応し、‘ボリュームアップ／ダウン’アイコン１２１ｂは、ボリュームアップに対する制御命令及びボリュームダウンに対する制御命令に対応し、‘チャネルアップ／ダウン’アイコン１２１ｃは、チャネルアップに対する制御命令及びチャネルダウンに対する制御命令に対応する。

従来の映像装置は、前記制御命令に対応する６個のアイコンを表示しなければならなかったが、一実施例に係る映像装置１は、３個のアイコンのみを表示することで、６個の制御命令を実行することができる。

ユーザが、電源オンまたは電源オフに対応する制御命令を入力すると、映像出力部１２１上のカーソル１２１ｄが‘電源オン／オフ’アイコン１２１ａへ移動し、制御命令に応じて電源がオンされたり、またはオフされる。残りのアイコン１２１ｂ，１２１ｃもこれと同様に動作する。

図１２Ａ乃至図１２Ｃでは、一つのアイコンに、それに対応する制御内容を全て記載するものとして示したが、ボリュームの制御に関するアイコンに、‘ボリューム'のみを表示し、チャネルの制御に関するアイコンに、‘チャネル’のみを表示し、電源の制御に関するアイコンに、‘電源’のみを表示することも可能である。ユーザが、どの制御に関するアイコンであるかを認知できれば、アイコンに表示される内容には制限がない。

電源オンと電源オフ、ボリュームアップとボリュームダウン、及びチャネルアップとチャネルダウンは全てトグル（ｔｏｇｇｌｅ）される形態で実行されるとよい。例えば、ユーザが、第１音声入力部１１２を通じて‘チャネルアップ’に対応する制御命令語を入力した場合、図１２Ｂに示したように、カーソル１２１ｄを‘チャネルアップ／ダウン’アイコン１２１ｃへ移動させ、アップ命令とダウン命令を区別するために、‘チャネルアップ／ダウン’アイコン１２１ｃを赤色に変化させることができる。‘チャネルダウン’に対応する制御命令語を入力した場合には、図１２Ｃに示したように、カーソル１２１ｄを‘チャネルアップ／ダウン’アイコン１２１ｃへ移動させ、‘チャネルアップ／ダウン’アイコン１２１ｃが青色に変わるようにすることができる。

他の実施例であって、対応する制御命令語が入力されると、該当のアイコンが点滅するようにしたり、チャネルアップ／ダウンに対応する制御命令語、またはボリュームアップ／ダウンに対応する制御命令語が入力されると、該当のアイコン内に縦バー（ｂａｒ）が生成され、チャネルの調節量またはボリュームの調節量を表示することができる。

また、図１２Ａ乃至図１２Ｃでは、映像出力部１２１にカーソル１２１ｄが表示されるものとしたが、一つ以上の他の実施例がこれに限定されるものではなく、カーソルが表示されず、アイコンにのみ変化を与えることも可能である。

本実施例に係る映像装置１は、該当のアイコンに対応する制御命令語が入力されたことを示すために、様々な方式で該当のアイコンを変化させることができ、アイコンの変化には、アイコン内にカーソルが入ってくることも含まれる。但し、本発明の実施形態が上述した例示に限定されるものではない。

図１２Ａ乃至図１２Ｃにおいては、電源、チャネル及びボリュームの制御に関するアイコンのみを示したが、その他にも、ウェブブラウザーオン／オフ、ミュートオン／オフなどの様々な制御命令に対応するアイコンを表示することができる。

図１３は、一実施例に係る映像装置１において、ユーザによって命令語を生成する方法を示すフローチャートであり、図１４Ａ乃至図１４Ｄは、一実施例に係る映像装置１が、ユーザによって命令語を生成する場合、映像出力部１２１に表示される画面を示す図である。本実施例では、音声認識開始命令語を生成するものとする。

図１３を参照すると、まず、ユーザから命令語生成命令の入力を受ける（ステップ８１１）。命令語生成命令は、音声信号として入力されてもよく、遠隔制御器３００や映像装置本体１００に備えられた入力ボタンを介して入力されてもよく、モーション認識を通じて入力されてもよい。命令語生成命令のを入力方式には制限がない。

具体的に、図１４Ａに示すように、ユーザは、まず、環境設定に関するメニュー項目のうち、‘命令語生成’項目を選択する。‘命令語生成’項目も、音声認識を通じて選択してもよく、遠隔制御器３００または映像装置本体１００に備えられた入力ボタンを押したり、モーション認識を通じて選択してもよい。

そして、ユーザから候補命令語の入力を受ける（ステップ８１３）。候補命令語は、第１音声入力部１１２を通じて音声信号として入力を受けることができる。

具体的に、図１４Ｂに示されたように、映像装置１の映像出力部１２１に“候補命令語を入力して下さい。”という文句が表示されると、ユーザは、第１音声入力部１１２を通じて命令語として登録しようとする候補命令語を入力する。例えば、ユーザは、音節末子音がなく、短い単語である、‘マイク’を候補命令語として入力することができる。

候補命令語が入力されると、入力された候補命令語が音声認識開始命令語として適しているか否かをテストする（ステップ８１５）。音声認識開始命令語としては、音声認識が容易な短くて、音節末子音がない単語が適し、その他にも、様々な基準を用いて候補命令語の適合性をテストすることができ、候補命令語の音声認識率を測定することもできる。

具体的に、図１４Ｃに示すように、映像出力部１２１に、“テスト中”という文句が表示される。

テストの結果、候補命令語が音声認識開始命令語として適しているという結果が出ると（ステップ８１７の‘はい’）、候補命令語を音声認識開始命令語として登録し（ステップ８１９）、音声認識部に伝送する。一実施例において、候補命令語の音声認識率が所定の基準値（例：８０％）以上であれば、音声認識開始命令語として適しているものと判断することができる。

テストの結果、候補命令語が音声認識開始命令語として適していないという結果が出ると（ステップ８１７の‘いいえ’）、図９に示されたように、ユーザから、再び候補命令語の入力を受けることもでき、ユーザの選択によって命令語生成を終了することもできる。

具体的に、テスト部のテストが終了すると、図１４Ｄに示すように、テストの結果が表示され、例えば、候補命令語が音声認識開始命令語として登録が可能な場合は、映像出力部１２１に、‘登録可能’という文句が表示される。候補命令語が音声認識開始命令語として適していないため、映像出力部１２１に、‘登録不可能’という文句が表示されると、ユーザは、新しい候補命令語を再び入力することができる。

図１３及び図１４Ａ乃至図１４Ｄは、音声認識開始命令語の生成に関して説明したが、一つ以上の他の実施例はこれに限定されず、他の制御命令の生成にも適用可能であり、映像装置１の映像出力部１２１は、命令語の生成を進行させることができる様々な文句を表示することができる。

実施例でのように、音声認識を通じてユーザの制御命令を入力するようになる場合、ユーザの立場では、入力ボタンを押すなどの動作を取ることなく、制御命令を言うだけでよいので、便利に所望の作業を実行することができる。

また、映像出力部１２１上には、制御命令に対応するアイコンが表示される。例えば、‘チャネルアップ（ｃｈａｎｎｅｌｕｐ）’アイコン及び‘チャネルダウン（ｃｈａｎｎｅｌｄｏｗｎ）’アイコン、‘ボリュームアップ（ｖｏｌｕｍｅｕｐ）’アイコン及び‘ボリュームダウン（ｖｏｌｕｍｅｄｏｗｎ）’アイコンなどが表示されてもよい。特に、前記アイコンは、映像装置１の動作のためのものであるので、映像出力部１２１にメイン画面が表示される時に、映像出力部１２１の一部の領域に表示される。

映像出力部１２１の大きさは制限的であるので、表示できるアイコンの個数にも限界があり、他の実施例に係る映像装置１は、アイコンが占める面積を効率的に管理するために、複数の制御命令語に対応する一つのアイコンを表示する。

上述した実施例は映像装置１を参照して説明したが、一つ以上の他の実施例がこれに限定されないことを理解するであろう。例えば、他の実施例は、オーディオ／ビデオ受信機、セットトップボックス、音声認識及び／または音響出力を行ったり、具現したり、可能にしたり、制御できる独立型装置に適用され得る。

制限されないが、例示的な実施例は、コンピュータ可読記録媒体上のコンピュータ可読コードとして具現され得る。コンピュータ可読記録媒体は、以降にコンピュータシステムによって読み取ることができるデータを格納できる任意のデータ格納装置である。コンピュータ可読記録媒体の例には、ＲＯＭ、ＲＡＭ、ＣＤ−ＲＯＭ、磁気テープ、フロッピー（登録商標）ディスク及び光データ格納装置が含まれる。コンピュータ可読記録媒体は、ネットワーク結合コンピュータシステムを通じて分配され、コンピュータ可読コードが分配方式で格納及び実行される。また、例示的な実施例は、搬送波などのコンピュータ可読送信媒体を介して送信されたコンピュータプログラムとして記入され、プログラムを実行する汎用または特殊目的のディジタルコンピュータで受信されて具現され得る。また、例示的な実施例において、上述した装置の一つ以上のユニットは、回路、プロセッサ、及びマイクロプロセッサなどを含むことができ、コンピュータ可読媒体に格納されたコンピュータプログラムを実行することができる。

以上では、いくつかの実施例について図示し、説明したが、それは、上述した特定の実施例に限定されず、特許請求の範囲で請求する本発明の要旨を逸脱することなく、本発明の属する技術分野における通常の知識を有する者によって様々な変形実施が可能であることはもちろんであり、このような変形実施は、本発明の技術的思想から個別的に理解されてはならない。

１映像装置
１００映像装置本体
１１０ユーザ入力部
２２０制御部
２１０音声認識部
２８０命令語生成部

Claims

コンテンツを表示する表示部と、
外部装置と通信する通信部と、
音声信号を出力する音声出力部と、
前記外部装置から制御信号を受信すると音声認識を起動し、前記音声出力部を通じて出力される音声信号の出力音量を下げる制御部と、
を備え、
前記制御部は、前記音声認識が起動された後、第１所定時間の間音声命令としての音声入力が前記外部装置から受信されなかった場合、前記音声命令のための前記音声入力を要請するメッセージを出力し、
前記制御部は、前記音声認識が起動された後、第２所定時間の間前記音声命令としての前記音声入力が前記外部装置から受信されなかった場合において、前記音声認識が起動された後、第２所定時間が経過した場合に、前記音声認識を解除し、前記出力音量を前記音声認識の起動以前の出力音量に復元し、
前記制御部は、前記音声認識が起動された後、第２所定時間の間に前記音声命令としての前記音声入力が前記外部装置から受信された場合において、前記音声認識が起動され、前記音声命令として前記音声入力が受信された後、次の音声命令を待機する第３所定時間が経過した場合に、前記音声認識を解除し、前記出力音量を前記音声認識の起動以前の出力音量に復元し、
前記第２所定時間は、前記第１所定時間より長く、
前記第３所定時間は、前記第２所定時間より長い、
音声認識可能な画像表示装置。
前記外部装置は、リモートコントローラを含み、
前記画像表示装置は、前記リモートコントローラから、前記制御信号および／または前記音声命令としての前記音声入力を受信する
請求項１に記載の画像表示装置。
前記制御部により出力されるメッセージは、前記表示部に表示されるメッセージ画像を含む
請求項１に記載の画像表示装置。
前記制御部により出力されるメッセージは、前記音声出力部から出力される音声メッセージを含む
請求項１に記載の画像表示装置。
前記制御部は、前記外部装置から前記制御信号を受信すると、表示されているコンテンツに少なくとも１つのアイコンを表示するように前記表示部を制御し、
前記少なくとも１つのアイコンは、それぞれ１つ以上の音声命令に対応可能である
請求項１に記載の画像表示装置。
前記制御部は、前記外部装置から前記音声命令としての前記音声入力を受信すると、受信した前記音声命令に基づいて、前記少なくとも１つのアイコンのうち、受信した前記音声命令に対応する前記アイコンを変更するように前記表示部を制御する
請求項５に記載の画像表示装置。
前記制御部は、前記音声認識が起動された後、前記外部装置から前記制御信号を再び受信するか前記外部装置から他の制御信号を受信すると、前記音声認識を解除する
請求項１に記載の画像表示装置。
前記制御部は、前記外部装置から所定音量以上の音声を受信すると、前記制御信号が受信されたと判断する
請求項１に記載の画像表示装置。
前記制御部は、前記外部装置から候補音声命令言語を受信すると、該候補音声命令言語が音声認識される音声命令言語として適しているかを検査し、前記検査の結果、前記候補音声命令言語が前記音声命令言語として適している場合、前記音声命令として前記候補音声命令言語を登録する
請求項１に記載の画像表示装置。
コンテンツを表示する表示部と、
音声入力を受信する音声入力部と、
音声信号を出力する音声出力部と、
前記音声入力部を通じて前記音声入力を受信すると音声認識を起動し、前記音声出力部を通じて出力される音声信号の出力音量を下げる制御部と、
を備え、
前記制御部は、前記音声認識が起動された後、第１所定時間の間音声命令としての前記音声入力が前記音声入力部を通じて受信されなかった場合、前記音声認識のための前記音声入力を要請するメッセージを出力し、
前記制御部は、前記音声認識が起動された後、第２所定時間の間前記音声命令としての前記音声入力が前記音声入力部を通じて受信されなかった場合において、前記音声認識が起動された後、第２所定時間が経過した場合に、前記音声認識を解除し、前記出力音量を前記音声認識の起動以前の出力音量に復元し、
前記制御部は、前記音声認識が起動された後、第２所定時間の間に前記音声命令としての前記音声入力が前記音声入力部を通じて受信された場合において、前記音声認識が起動され、前記音声命令として前記音声入力が受信された後、次の音声命令を待機する第３所定時間が経過した場合に、前記音声認識を解除し、前記出力音量を前記音声認識の起動以前の出力音量に復元し、
前記第２所定時間は、前記第１所定時間より長く、
前記第３所定時間は、前記第２所定時間より長い、
音声認識可能な画像表示装置。
外部装置と通信して制御信号を受信する通信部をさらに備え、
前記画像表示装置は、前記外部装置から前記制御信号を受信する
請求項１０に記載の画像表示装置。
前記制御部により出力されるメッセージは、前記表示部に表示されるメッセージ画像を含む
請求項１０に記載の画像表示装置。
前記制御部により出力されるメッセージは、前記音声出力部から出力される音声メッセージを含む
請求項１０に記載の画像表示装置。
前記制御部は、前記音声入力部を通じて音声入力を受信すると、表示されているコンテンツに少なくとも１つのアイコンを表示するように前記表示部を制御し、
前記少なくとも１つのアイコンは、それぞれ１つ以上の音声命令に対応可能である
請求項１０に記載の画像表示装置。
前記制御部は、前記音声入力部を通じて前記音声命令としての前記音声入力を受信すると、受信した前記音声命令に基づいて、前記少なくとも１つのアイコンのうち、受信した前記音声命令に対応する前記アイコンを変更するように前記表示部を制御する
請求項１４に記載の画像表示装置。
前記制御部は、前記音声認識が起動された後、前記外部装置から前記制御信号を再び受信するか前記外部装置から他の制御信号を受信すると、前記音声認識を解除する
請求項１１に記載の画像表示装置。
前記制御部は、前記音声入力部を通じて所定音量以上の音声を受信すると、前記音声入力が受信されたと判断する
請求項１０に記載の画像表示装置。
前記制御部は、前記音声入力部を通じて候補音声命令言語を受信すると、該候補音声命令言語が音声認識される音声命令言語として適しているかを検査し、前記検査の結果、前記候補音声命令言語が前記音声命令言語として適している場合、前記音声命令として前記候補音声命令言語を登録する
請求項１０に記載の画像表示装置。
外部装置から制御信号を受信すると音声認識を起動し、音声出力部を通じて出力される音声信号の出力音量を下げ、
前記音声認識が起動された後、第１所定時間の間音声命令としての音声入力が前記外部装置から受信されなかった場合、前記音声認識のための前記音声入力を要請するメッセージを出力し、
前記音声認識が起動された後、第２所定時間の間前記音声命令としての前記音声入力が前記外部装置から受信されなかった場合において、前記音声認識が起動された後、第２所定時間が経過した場合に、前記音声認識を解除し、前記出力音量を前記音声認識の起動以前の出力音量に復元し、
前記音声認識が起動された後、第２所定時間の間に前記音声命令としての前記音声入力が前記外部装置から受信された場合において、前記音声認識が起動され、前記音声命令として前記音声入力が受信された後、次の音声命令を待機する第３所定時間が経過した場合に、前記音声認識を解除し、前記出力音量を前記音声認識の起動以前の出力音量に復元し、
前記第２所定時間は、前記第１所定時間より長く、
前記第３所定時間は、前記第２所定時間より長い、
音声認識可能な画像表示装置の制御方法。
制御部により出力されるメッセージは、表示部に表示されるメッセージ画像を含む
請求項１９に記載の制御方法。
制御部により出力されるメッセージは、前記音声出力部から出力される音声メッセージを含む
請求項１９に記載の制御方法。
さらに、前記外部装置から前記制御信号を受信すると、表示部に表示されているコンテンツに少なくとも１つのアイコンを表示し、
前記少なくとも１つのアイコンは、それぞれ１つ以上の音声命令に対応可能である
請求項１９に記載の制御方法。
さらに、前記外部装置から前記音声命令としての前記音声入力を受信すると、受信した前記音声命令に基づいて、前記少なくとも１つのアイコンのうち、受信した前記音声命令に対応する前記アイコンを変更する
請求項２２に記載の制御方法。
さらに、前記音声認識が起動された後、前記外部装置から前記制御信号を再び受信するか前記外部装置から他の制御信号を受信すると、前記音声認識を解除する
請求項１９に記載の制御方法。
さらに、前記外部装置から候補音声命令言語を受信すると、該候補音声命令言語が音声認識される音声命令言語として適しているかを検査し、前記検査の結果、前記候補音声命令言語が前記音声命令言語として適している場合、前記音声命令として前記候補音声命令言語を登録する
請求項１９に記載の制御方法。
音声入力部を通じて音声入力を受信すると音声認識を起動し、音声出力部を通じて出力された音声信号の出力音量を下げ、
前記音声認識が起動された後、第１所定時間の間音声命令としての前記音声入力が前記音声入力部を通じて受信されなかった場合、前記音声認識のための前記音声入力を要請するメッセージを出力し、
前記音声認識が起動された後、第２所定時間の間前記音声命令としての前記音声入力が外部装置から受信されなかった場合において、前記音声認識が起動された後、第２所定時間が経過した場合に、前記音声認識を解除し、前記出力音量を前記音声認識の起動以前の出力音量に復元し、
前記音声認識が起動された後、第２所定時間の間に前記音声命令としての前記音声入力が前記音声入力部を通じて受信された場合において、前記音声認識が起動され、前記音声命令として前記音声入力が受信された後、次の音声命令を待機する第３所定時間が経過した場合に、前記音声認識を解除し、前記出力音量を前記音声認識の起動以前の出力音量に復元し、
前記第２所定時間は、前記第１所定時間より長く、
前記第３所定時間は、前記第２所定時間より長い、
音声認識可能な画像表示装置の制御方法。
さらに、前記音声入力部を通じて前記音声入力を受信すると、表示部に表示されているコンテンツに少なくとも１つのアイコンを表示し、
前記少なくとも１つのアイコンは、それぞれ１つ以上の音声命令に対応可能である
請求項２６に記載の制御方法。
さらに、前記音声入力部を通じて前記音声命令としての前記音声入力を受信すると、受信した前記音声命令に基づいて、少なくとも１つのアイコンのうち、受信した前記音声命令に対応する前記アイコンを変更する
請求項２６記載の制御方法。
さらに、前記音声認識が起動された後、前記音声出力部を通じて他の制御信号を受信すると、前記音声認識を解除する
請求項２６に記載の制御方法。
さらに、前記音声入力部を通じて候補音声命令言語を受信すると、該候補音声命令言語が音声認識される音声命令言語として適しているかを検査し、前記検査の結果、前記候補音声命令言語が前記音声命令言語として適している場合、前記音声命令として前記候補音声命令言語を登録する
請求項２６に記載の制御方法。
請求項１９ないし３０のうちの何れか一項に記載の制御方法をコンピュータに実行させるコンピュータプログラム。
請求項３１に記載のコンピュータプログラムを記録した記録媒体。