JP5481058B2

JP5481058B2 - 移動端末機及びそのメニュー制御方法

Info

Publication number: JP5481058B2
Application number: JP2008298799A
Authority: JP
Inventors: ジョン−ホシン; チェ−ドカク; ジョン−クンユン
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2008-04-08
Filing date: 2008-11-21
Publication date: 2014-04-23
Anticipated expiration: 2028-11-21
Also published as: RU2008126782A; KR20090107365A; US8150700B2; US20120130712A1; CN101557651B; EP2109298B1; RU2394386C2; EP2109298A1; JP2009252238A; CN101557651A; US20090254351A1; US8560324B2

Description

本発明は、音声命令及び移動端末機で行われる事前動作に基づいて前記移動端末機で動作を行う方法、並びにその移動端末機に関する。

移動端末機は、基本的な電話サービス以外にも、多くのさらなるサービスを提供する。例えば、使用者は移動端末機を用いてインターネットアクセス、ゲーム、ビデオ鑑賞、音楽鑑賞、画像撮影、音声ファイル記録などを行うことができる。また、移動端末機が放送番組を提供することによって、使用者はテレビ番組、スポーツ番組、ビデオなどを見ることができる。

従って、移動端末機は、使用者が端末機上で様々な機能にアクセスできるように、非常に複雑なグラフィックユーザインタフェース（ＧＵＩ）を含む。例えば、使用者は、メインメニューにアクセスした後、電子メールサブメニュー、通話履歴サブメニュー、インターネットアクセスサブメニュー、写真サブメニューなどの様々なサブメニューからいずれか１つを選択することができる。使用者が特定サブメニューを選択すると、移動端末機は、サブメニュー又はオプションの他のリストを提供することにより、使用者が所望の機能を実行するために選択できるようにする。

しかしながら、このようなメニューシステムは、樹形図のような構造を有するので、使用者が最終的に所望の機能を選択するためには、いくつかの中間機能を実行しなければならない。また、移動端末機のサイズが小さいため、メニューオプションも小さくて見にくい。さらに、タッチスクリーンディスプレイを含む移動端末機の場合、特定メニューオプションをタッチする際、（メニューアイテムが隣接して表示されるため）隣接したメニューアイテムを同時にタッチしたり、間違ったメニューアイテムをタッチすることがある。

本発明は、上記問題及びその他の問題を解決するためになされたもので、音声命令の意味を認識し、その認識された音声命令に基づいて移動端末機を制御する方法、及びその移動端末機を提供することを目的とする。

本発明の他の目的は、前記認識された音声命令に基づいて前記移動端末機の様々な機能を実行するためのメニューを提供する方法、及びその移動端末機を提供することにある。

上記の目的を達成するために、本発明の一態様は、移動端末機の音声認識機能をアクティブにする入力を受信する入力部と、前記移動端末機で行われる動作に関する情報を保存するメモリと、前記音声認識機能をアクティブにする入力が受信されると前記音声認識機能をアクティブにし、前記移動端末機で行われる少なくとも１つの事前動作と音声命令に含まれる言語に基づいて、入力された前記音声命令の意味を判断し、前記移動端末機で行われる少なくとも１つの事前動作と前記音声命令に含まれる言語に基づいて、また、前記判断された入力音声命令の意味と前記移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、前記判断された入力音声命令の意味に関する動作を提供する制御部とを含む、移動端末機を提供する。

本発明の他の態様は、移動端末機の音声認識機能をアクティブにする入力を受信する段階と、前記音声認識機能をアクティブにする入力が受信されると前記音声認識機能をアクティブにする段階と、前記移動端末機で行われる少なくとも１つの事前動作と音声命令に含まれる言語に基づいて、また、判断された前記入力音声命令の意味と前記移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、前記判断された入力音声命令の意味に関する動作を提供する段階とを含む、移動端末機の制御方法を提供する。

上記目的を達成するために、本発明は、例えば、以下の手段を提供する。
（項目１）
移動端末機の音声認識機能をアクティブにする入力を受信する入力部と、
上記移動端末機で行われる動作に関する情報を保存するメモリと、
上記音声認識機能をアクティブにする入力が受信されると上記音声認識機能をアクティブにし、上記移動端末機で行われる少なくとも１つの事前動作と音声命令に含まれる言語に基づいて、入力された上記音声命令の意味を判断し、上記移動端末機で行われる少なくとも１つの事前動作と上記音声命令に含まれる言語に基づいて、また、上記判断された入力音声命令の意味と上記移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、上記判断された入力音声命令の意味に関する動作を提供する制御部と
を含むことを特徴とする移動端末機。
（項目２）
上記制御部は、特定動作に関する上記音声命令が入力されると、中間動作の選択を要求することなく、直ちに上記特定動作に対応する機能を実行することを特徴とする項目１に記載の移動端末機。
（項目３）
上記判断された入力音声命令の意味に関して提供される動作は、所定の閾値より大きい確率を有する全ての動作を含むことを特徴とする項目１に記載の移動端末機。
（項目４）
上記所定の閾値は、上記移動端末機のメーカ又は上記移動端末機の使用者により設定されることを特徴とする項目３に記載の移動端末機。
（項目５）
上記所定の閾値は、判断された動作の数に基づいて自動的に選択されることを特徴とする項目３に記載の移動端末機。
（項目６）
上記制御部は、上記移動端末機の動作状態に基づいて、上記入力された音声命令の意味を判断するように構成されることを特徴とする項目１に記載の移動端末機。
（項目７）
上記判断された入力音声命令の意味に関して提供される動作は、上記判断された入力音声命令の意味に対応する少なくとも１つのメニューオプションを含むことを特徴とする項目１に記載の移動端末機。
（項目８）
上記制御部は、所定の閾値より高い確率を有する、上記判断された入力音声命令の意味に対応する全てのメニューオプションを出力するように構成されることを特徴とする項目７に記載の移動端末機。
（項目９）
上記制御部は、最も高い確率を有する、上記判断された入力音声命令の意味に対応するメニューオプションを、他のメニューと差別化して表示するように構成されることを特徴とする項目８に記載の移動端末機。
（項目１０）
上記制御部は、上記最も高い確率を有するメニューオプションのサイズ、表示位置、色、明暗、及びハイライト情報の少なくとも１つが異なるように制御することにより、上記最も高い確率を有する、上記判断された入力音声命令の意味に対応するメニューオプションを差別化して表示することを特徴とする項目９に記載の移動端末機。
（項目１１）
上記入力部は、
１）上記音声認識機能をアクティブにするためにタッチするタッチソフトボタン、
２）上記音声認識機能をアクティブにするために押圧又は操作するハードボタン、
３）上記音声認識機能をアクティブにするためにタッチする、上記入力部に含まれるタッチスクリーンの任意の位置、
４）上記音声認識機能をアクティブにするために入力される衝撃音、
５）近距離無線信号又は遠距離無線信号、
６）使用者からの身体情報信号
の少なくとも１つを含むことを特徴とする項目１に記載の移動端末機。
（項目１２）
上記音声命令を認識する制御部により使用される音声又は発音情報を保存する第１データベースと、
上記音声命令を認識する制御部により使用される単語、キーワード、又は文章情報を保存する第２データベースと、
上記移動端末機の機能又はメニューに関する情報を保存する第３データベースと、
上記制御部が上記認識された音声命令の意味の判断を試みていることを使用者に通知するために出力されるヘルプ情報を保存する第４データベースと
をさらに含むことを特徴とする項目１に記載の移動端末機。
（項目１３）
上記制御部は、上記音声認識機能がアクティブ状態にあることを示すオーディオ情報又はビデオ情報を出力するように構成されることを特徴とする項目１に記載の移動端末機。
（項目１４）
移動端末機の音声認識機能をアクティブにする入力を受信する段階と、
上記音声認識機能をアクティブにする入力が受信されると上記音声認識機能をアクティブにする段階と、
上記移動端末機で行われる少なくとも１つの事前動作と音声命令に含まれる言語に基づいて、また、判断された上記入力音声命令の意味と上記移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、上記判断された入力音声命令の意味に関する動作を提供する段階と
を含むことを特徴とする移動端末機の制御方法。
（項目１５）
上記制御部は、特定動作に関する上記音声命令が入力されると、中間動作の選択を要求することなく、直ちに上記特定動作に対応する機能を実行することを特徴とする項目１４に記載の移動端末機の制御方法。
（項目１６）
上記判断された入力音声命令の意味に関して提供される動作は、所定の閾値より大きい確率を有する全ての動作を含むことを特徴とする項目１４に記載の移動端末機の制御方法。
（項目１７）
上記所定の閾値は、上記移動端末機のメーカ又は上記移動端末機の使用者により設定されることを特徴とする項目１６に記載の移動端末機の制御方法。
（項目１８）
上記所定の閾値は、判断された動作の数に基づいて自動的に選択されることを特徴とする項目１６に記載の移動端末機の制御方法。
（項目１９）
上記移動端末機で行われる少なくとも１つの事前動作と上記入力音声命令に含まれる言語に基づいて、上記入力音声命令の意味を判断する段階をさらに含むことを特徴とする項目１４に記載の移動端末機の制御方法。
（項目２０）
上記移動端末機の動作状態に基づいて、上記入力音声命令の意味を判断する段階をさらに含むことを特徴とする項目１９に記載の移動端末機の制御方法。
（項目２１）
上記判断された入力音声命令の意味に関して提供される動作は、上記判断された入力音声命令の意味に対応する少なくとも１つのメニューオプションを含むことを特徴とする項目２０に記載の移動端末機の制御方法。
（項目２２）
所定の閾値より高い確率を有する、上記判断された入力音声命令の意味に対応する全てのメニューオプションを出力する段階をさらに含むことを特徴とする項目２１に記載の移動端末機の制御方法。
（項目２３）
最も高い確率を有する、上記判断された入力音声命令の意味に対応するメニューオプションを、他のメニューと差別化して表示する段階をさらに含むことを特徴とする項目２２に記載の移動端末機の制御方法。
（項目２４）
上記表示する段階においては、
上記最も高い確率を有するメニューオプションのサイズ、表示位置、色、明暗、及びハイライト情報の少なくとも１つが異なるように制御することにより、上記最も高い確率を有する、上記判断された入力音声命令の意味に対応するメニューオプションを差別化して表示することを特徴とする項目２３に記載の移動端末機の制御方法。
（項目２５）
上記入力を受信する段階においては、
１）上記音声認識機能をアクティブにするためにタッチするタッチソフトボタン、
２）上記音声認識機能をアクティブにするために押圧又は操作するハードボタン、
３）上記音声認識機能をアクティブにするためにタッチする、上記入力部に含まれるタッチスクリーンの任意の位置、
４）上記音声認識機能をアクティブにするために入力される衝撃音、
５）近距離無線信号又は遠距離無線信号、
６）使用者からの身体情報信号
の少なくとも１つを使用することを特徴とする項目１４に記載の移動端末機の制御方法。
（項目２６）
上記音声認識機能がアクティブ状態にあることを示すオーディオ情報又はビデオ情報を出力する段階をさらに含むことを特徴とする項目１４に記載の移動端末機の制御方法。

音声命令の意味を認識し、その認識された音声命令に基づいて移動端末機を制御する方法、及びその移動端末機を提供する。

移動端末機は、移動端末機の音声認識機能をアクティブにする入力を受信する入力部と、移動端末機で行われる動作に関する情報を保存するメモリと、音声認識機能をアクティブにする入力が受信されると音声認識機能をアクティブにし、移動端末機で行われる少なくとも１つの事前動作と音声命令に含まれる言語に基づいて、入力された音声命令の意味を判断し、移動端末機で行われる少なくとも１つの事前動作と音声命令に含まれる言語に基づいて、また、判断された入力音声命令の意味と移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、判断された入力音声命令の意味に関する動作を提供する制御部とを含む。

以下、本発明の好ましい実施形態について添付図面を参照して詳細に説明する。

図１は、本発明の一実施形態による移動端末機１００のブロック図である。

移動端末機１００は、移動端末機１００と無線通信システム間の無線通信、又は移動端末機１００と移動端末機１００が位置するネットワーク間の無線通信を可能にする１つ以上の構成要素を有する無線通信部１１０を含む。

例えば、無線通信部１１０は、放送チャネルで外部の放送管理エンティティから放送信号及び／又は放送関連情報を受信する放送受信モジュール１１１を含む。前記放送チャネルは、衛星チャネル及び地上波チャネルを含む。

さらに、前記放送管理エンティティは、一般的に放送信号及び／又は放送関連情報を送信するシステムを意味する。前記放送関連情報は、放送チャネル、放送番組又は放送サービス提供者に関する情報を含む。例えば、放送関連情報は、ＤＭＢ（Digital Multimedia Broadcasting）のＥＰＧ（Electronic Program Guide）又はＤＶＢ−Ｈ（DigitalVideo Broadcast−Handheld）のＥＳＧ（Electronic Service Guide）を含むことができる。

また、前記放送信号は、ＴＶ放送信号、ラジオ放送信号、及びデータ放送信号だけでなく、ＴＶ放送信号又はラジオ放送信号と結合した放送信号も含む。

放送受信モジュール１１１は、多様な放送システムから伝送される放送信号を受信する。例えば、前記放送システムは、ＤＭＢ−Ｔ（Digital Multimedia Broadcasting−Terrestrial）、ＤＭＢ−Ｓ（DigitalMultimedia Broadcasting−Satellite）、ＭｅｄｉａＦＬＯ（Media Forward Link Only）、ＤＶＢ−Ｈ（DigitalVideo Broadcast−Handheld）、ＩＳＤＢ−Ｔ（Integrated Services Digital Broadcast−Terrestrial）などを含む。放送受信モジュール１１１は、マルチキャスト信号も受信できる。放送受信モジュール１１１により受信されたデータは、メモリ１６０のような適切な装置内に保存される。

無線通信部１１０は、１つ又は多数のネットワークエンティティ（例えば、基地局、ＮｏｄｅＢ）と無線信号を送受信する移動通信モジュール１１２も含む。ここで、前記無線信号は、音声、画像、マルチメディア、制御シグナリング、及びデータなどを示す。

移動端末機１００のインターネット接続をサポートするための無線インターネットモジュール１１３も含まれる。無線インターネットモジュール１１３は、移動端末機１００に内蔵又は外付けされる。

無線通信部１１０は、近距離通信のための近距離通信モジュール１１４も含む。近距離通信技術としては、ブルートゥース、ＲＦＩＤ（Radio Frequency Identification）、赤外線通信（IrDA, infrared DataAssociation）、ＵＷＢ（Ultra Wideband）、ＺｉｇＢｅｅなどが利用できる。

無線通信部１１０は、移動端末機１００の位置を確認又は取得するための位置情報モジュール１１５も含む。位置情報モジュール１１５は、関連衛星、ネットワーク構成要素、及びこれらの組み合わせと連動するＧＰＳ（Global Positioning System）構成要素を利用して実現される。

さらに、図１に示すように、移動端末機１００は、移動端末機１００にオーディオ又はビデオ信号を提供するＡ／Ｖ（Audio/Video）入力部１２０も含む。図に示すように、Ａ／Ｖ入力部１２０は、カメラ１２１及びマイク１２２を含む。カメラ１２１は、静止画像又は動画像などの画像フレームを受信及び処理する。また、マイク１２２は、前記端末機が通話モード、録音モード、及び音声認識モードのような特定モードにあるとき、外部の音響信号を受信した後、処理してデジタルデータに変換する。移動端末機１００、特に、Ａ／Ｖ入力部１２０は、前記外部の音響信号を受信する過程で発生する雑音を除去するための多様な雑音除去アルゴリズムを含む。また、Ａ／Ｖ入力部１２０により生成されたデータは、メモリ１６０内に保存され、出力部１５０により活用されるか、無線通信部１１０の１つ又は複数のモジュールを介して伝送される。必要に応じて、２つ又はそれ以上のマイク及び／又はカメラが利用される。

移動端末機１００は、関連入力装置の使用者操作に対応する入力データを発生させるユーザ入力部１３０も含む。ユーザ入力部１３０は、キーパッド、ドームスイッチ、タッチパッド（静圧／静電）、ジョグホイール、及びジョグスイッチを含む。以下、ユーザ入力部１３０がタッチスクリーンディスプレイと連動するタッチパッドとして実現される場合の例について説明する。

センシング部１４０も移動端末機１００内に含まれて移動端末機１００の多様な状態測定を提供する。例えば、センシング部１４０は、移動端末機１００の開閉状態、移動端末機１００の構成要素（例えば、ディスプレイ及びキーボード）の相対的位置、移動端末機１００の構成要素又は移動端末機１００の位置の変化、移動端末機１００への使用者の接触の有無、移動端末機１００の方位又は加速／減速などを検出する。

例えば、移動端末機１００がスライド型である場合、センシング部１４０は、移動端末機１００の摺動部が開状態であるか閉状態であるかを感知できる。他の例として、センシング部１４０は、電源供給部１９０による電源供給の有無、インタフェース部１７０と外部装置間の結合又は接続の有無などを感知する。

また、インタフェース部１７０は、移動端末機１００を外部装置に結合する役割を果たす。前記外部装置は、有／無線ヘッドホン、外部充電器、電源供給器、データ（例えば、オーディオ、ビデオ、写真など）を保存するための保存装置、イヤホン、及びマイクなどを含む。さらに、インタフェース部１７０は、有／無線データポート、カードソケット（例えば、メモリカード、ＳＩＭ（Subscriber Identity Module）カード、ＵＩＭ（User Identity Module）カード、ＲＵＩＭ（RemovableUser Identity Module）カードなど）、オーディオ入／出力ポート及びビデオ入／出力ポートを使用して構成される。

出力部１５０は、一般的に移動端末機１００の出力要件をサポートする多様な構成要素を含む。移動端末機１００は、移動端末機１００に関する情報を視覚的に表示するディスプレイモジュール１５１を含む。例えば、移動端末機１００が通話モードである場合、ディスプレイモジュール１５１は、一般的に発信、通話、及び終了に関する情報を含むユーザインタフェース、又はグラフィックユーザインタフェースを提供する。他の例として、移動端末機１００がビデオ通話モード又は撮影モードである場合、ディスプレイモジュール１５１は、前記モードに関連する映像を付加的に又は選択的に表示する。

さらに、ディスプレイモジュール１５１は、好ましくはタッチパッドのような入力装置と連動するタッチスクリーンも含む。このような構成によりディスプレイモジュール１５１が入力装置及び出力装置として作動できる。また、ディスプレイモジュール１５１は、液晶ディスプレイ（ＬＣＤ）、薄膜トランジスタ液晶ディスプレイ（ＴＦＴ−ＬＣＤ）、有機発光ダイオード（ＯＬＥＤ）、フレキシブルディスプレイ、及び３次元ディスプレイを含むディスプレイ技術を利用して実現される。

移動端末機１００は、ディスプレイモジュール１５１を２つ以上備えることもできる。２つのディスプレイが備えられた例として、１つは、内部ディスプレイ（移動端末機が開状態にあるときに見える）であり、他の１つは、外部ディスプレイ（移動端末機が開状態及び閉状態にあるときに見える）である。

図１は、移動端末機１００の音響出力要件をサポートする音響出力モジュール１５２を備える出力部１５０を示す。音響出力モジュール１５２は、１つ又は複数のスピーカー、ブザー、他の音響生成装置、及びこれらの組み合わせを利用して実現される。さらに、音響出力モジュール１５２は、呼受信モード、呼発信モード、録音モード、音声認識モード、及び放送受信モードを含む多様なモードで動作する。音響出力モジュール１５２は、特定機能（例えば、呼受信、メッセージ受信、及びエラー）に関連する音響を出力する。また、出力部１５０は、移動端末機１００に関連する特定イベントの発生を通知するための信号を出力するアラーム部１５３を備える。前記アラームイベントの例としては、呼受信、メッセージ受信、ユーザ入力の受信がある。前記出力の例として、使用者に提供される振動のような触感がある。例えば、アラーム部１５３は、呼又はメッセージを受信する移動端末機１００に反応して振動するように構成される。

他の例として、移動端末機１００におけるユーザ入力の受信に反応してアラーム部１５３が振動を発生することにより、触感フィードバックメカニズムを提供する。さらに、出力部１５０の構成要素により提供される前記多様な出力は、個別に行われるか、又は前記構成要素の任意の組み合わせを利用して行われる。

メモリ１６０は、移動端末機１００の処理、制御、及び保存要件をサポートするための多様なデータを保存するために使用される。前記データの例として、移動端末機１００で動作するアプリケーションのためのプログラム指示、通話履歴（call history）、接触データ、電話帳データ、メッセージ、静止画像、動画像などがある。

図１に示すメモリ１６０は、ＲＡＭ（Random Access Memory）、ＳＲＡＭ（Static Random Access Memory）、ＲＯＭ（Read−OnlyMemory）、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read−Only Memory）、ＥＰＲＯＭ（ErasableProgrammable Read−Only Memory）、ＰＲＯＭ（Programmable Read−Only Memory）、磁気メモリ、フラッシュメモリ、磁気もしくは光ディスク、カード型メモリ、又はその他の同様のメモリもしくはデータ記憶装置を含む適切な揮発性及び不揮発性メモリもしくは記憶装置のいずれか又は組み合わせを利用して実現される。

移動端末機１００は、移動端末機１００の全般的な動作を典型的に制御する制御部１８０も含む。例えば、制御部１８０は、音声通話、データ通信、インスタントメッセージ通信、ビデオ通話、カメラ機能、及び録音機能に関連する制御及び処理を行う。図１に示すように、制御部１８０は、マルチメディア再生のためのマルチメディアモジュール１８１を備える。マルチメディアモジュール１８１は、制御部１８０の一部として構成されるか、制御部１８０と別途に実現される。

電源供給部１９０は、移動端末機１００の多様な構成要素により利用される電源を供給する。前記電源としては、外部の電源、内部の電源、又はこれらの組み合わせが利用できる。

図２は、本発明の一実施形態による移動端末機１００の前面斜視図である。図２に示すように、移動端末機１００は、第１ボディー２００と、第１ボディー２００に対して摺動可能に構成された第２ボディー２０５とを含む。図１に示すユーザ入力部１３０は、ファンクションキー２１０のような第１入力部、キーパッド２１５のような第２入力部、及びサイドキー２４５のような第３入力部を含む。

ファンクションキー２１０は、第１ボディー２００に関連し、キーパッド２１５は、第２ボディー２０５に関連する。キーパッド２１５は、使用者が電話をかけること、テキスト又はマルチメディアメッセージを準備すること、移動端末機１００を動作させることなどを可能にする多様なキー（例えば、数字、文字、及びシンボル）を含む。第１ボディー２００は、第２ボディー２０５に対して摺動して開位置又は閉位置となる。閉状態において、第１ボディー２００は、キーパッド２１５が第１ボディー２００により完全に隠れるように第２ボディー２０５の上部に位置する。開状態において、使用者は、ディスプレイモジュール１５１及びファンクションキー２１０だけでなく、キーパッド２１５にアクセスできる。ファンクションキー２１０は、使用者による開始、停止、及びスクロールのような命令の入力を容易にする。

移動端末機１００は、待ち受けモード（例えば、呼又はメッセージ受信、ネットワーク制御シグナリングの受信及び応答ができるモード）、又は通話モードで動作する。移動端末機１００は、閉状態のときは主に待ち受けモードであり、開状態のときは主に通話モードであるが、使用者の希望により他のモードに変更できる。

第１ボディー２００は、第１ケース２２０と第２ケース２２５とからなり、第２ボディー２０５は、第１ケース２３０と第２ケース２３５とからなる。第１ケース２２０、２３０及び第２ケース２２５、２３５は、合成樹脂を射出して形成することもでき、ステンレススチール（ＳＴＳ）又はチタン（Ｔｉ）などの金属材質で形成することもできる。

第１ボディー２００と第２ボディー２０５の一方又は両方の第１ケース及び第２ケース間には、１つ又は複数の中間ケースを配置することもできる。第１ボディー２００及び第２ボディー２０５は、移動端末機１００の動作をサポートするために利用される電子部品を内蔵できるサイズに形成される。

第１ボディー２００は、カメラ１２１と、スピーカーとして実現され、ディスプレイモジュール１５１と相対的に位置する音響出力モジュール１５２とを含む。カメラ１２１は、第１ボディー２００に対して選択的に配置できるように（例えば、回転、スイベルなど）構成できる。

ファンクションキー２１０は、ディスプレイモジュール１５１の下側に隣接して位置する。前述したように、ディスプレイモジュール１５１は、ＬＣＤ又はＯＬＥＤで実現できる。ディスプレイモジュール１５１は、タッチパッドがレイヤ構造で重なったタッチスクリーンにより実現されて、使用者の前記タッチスクリーンとの接触（例えば、指、スタイラスなど）に反応して信号を生成する。

第２ボディー２０５は、キーパッド２１５に隣接したマイク１２２と、第２ボディー２０５の側面に沿って位置し、ユーザ入力部の一種類であるサイドキー２４５と含む。サイドキー２４５は、ホットキーとして実現され、移動端末機１００の特定機能と連係する。図２に示すように、インタフェース部１７０は、サイドキー２４５に隣接し、バッテリー形態の電源供給部１９０は、第２ボディー２０５の下部に位置する。

図３は、図２に示す移動端末機１００の後面斜視図である。図３を参照すると、第２ボディー２０５は、カメラ１２１と、カメラ１２１に関連するフラッシュ２５０及びミラー２５５とを含む。フラッシュ２５０は、第２ボディー２０５のカメラ１２１と連動して動作し、ミラー２５５は、使用者がカメラ１２１を利用してセルフ撮影をするとき、使用者の顔などを映してカメラ１２１の位置づけを容易にする。第２ボディー２０５のカメラ１２１は、図２に示すように、第１ボディー２００のカメラ１２１とは反対方向に向ける。

第１ボディー２００及び第２ボディー２０５の各カメラ１２１は、同一又は異なる容量を有する。例えば、第１ボディー２００のカメラ１２１は、第２ボディー２０５のカメラ１２１より低い解像度で動作する。このような構成は、例えば、逆方向リンク周波数容量が限定されるビデオ会議通話時に効果的である。第２ボディー２０５のカメラ１２１の高い解像度は、後に高画質の写真を得るのに有用である。

第２ボディー２０５は、スピーカーとして実現され、第２ボディー２０５の上部に位置する音響出力モジュール１５２も含む。第１ボディー２００及び第２ボディー２０５の前記音響出力モジュールは、連動してステレオ出力を提供する。前記音響出力モジュールの１つ又は２つは、スピーカーフォンとして動作するように構成できる。

移動端末機１００は、第２ボディー２０５の上端に位置する放送信号受信用アンテナ２６０を含む。アンテナ２６０は、放送受信モジュール１１１（図１）と連動して機能する。必要に応じて、アンテナ２６０は、固定されるか、第２ボディー２０５の内部に収まるように構成される。第１ボディー２００の後面は第２ボディー２０５の前面に位置する該当スライドモジュールと摺動可能に結合するスライドモジュール２６５を含む。

図示された第１ボディー２００及び第２ボディー２０５の多様な構成要素の配置は必要に応じて変更できる。１つのボディーの一部又は全ての構成要素を他のボディーに実現することもできる。前記構成要素の位置及び相対的位置決めは、図示した位置とは異なってもよい。

図１〜図３に示す移動端末機１００は、有無線通信システム及び衛星通信システムを含み、フレーム又はパケットでデータを伝送する通信システムで動作するように構成される。このような通信システムは、他の無線インタフェース及び／又は物理層を活用する。

例えば、通信システムにより利用可能な無線インタフェースとしては、周波数分割多元接続（Frequency Division Multiple Access：ＦＤＭＡ）、時分割多元接続（Time DivisionMultiple Access：ＴＤＭＡ）、符号分割多元接続（Code Division Multiple Access：ＣＤＭＡ：）、ユニバーサルモバイルテレコミュニケーションシステム（UniversalMobile Telecommunications Systems：ＵＭＴＳ）（特に、ＬＴＥ（Long Term Evolution）、移動通信用グローバルシステム（GlobalSystem for Mobile Communications：ＧＳＭ）などが用いられる。以下、説明の便宜のために、ＣＤＭＡに限定して説明する。しかしながら、本発明は、ＣＤＭＡ無線通信システムを含む全ての通信システムに適用できる。

図４に示すように、ＣＤＭＡ無線通信システムは、複数の移動端末機１００、複数の基地局（ＢＳ）２７０、基地局制御部（Base Station Controllers：ＢＳＣｓ）２７５、及び移動スイッチングセンター（Mobile SwitchingCenter：ＭＳＣ）２８０を含む。

ＭＳＣ２８０は、公衆交換電話網（Public Switched Telephone Network：ＰＳＴＮ）２９０とインタフェースで接続されるように構成され、ＢＳＣｓ２７５ともインタフェースで接続されるように構成される。ＢＳＣｓ２７５は、バックホールライン（backhaulline）で基地局２７０と接続される。前記バックホールラインは、例えば、Ｅ１／Ｔ1、ＡＴＭ、ＩＰ、ＰＰＰ、ＦｒａｍｅＲｅｌａｙ、ＨＤＳＬ、ＡＤＳＬ又はｘＤＳＬなどのインタフェースの少なくとも１つによって構成される。さらに、図４に示す前記システムは、複数のＢＳＣｓ２７５を含む。

それぞれの基地局２７０は、少なくとも１つのセクターを含み、各セクターは、全方向性アンテナ又は基地局２７０から放射状の特定方向を指すアンテナを含む。また、各セクターは、ダイバーシティ受信のために２つのアンテナを含む。それぞれの基地局２７０は、複数の周波数割り当てをサポートするように構成され、各周波数割り当ては、特定スペクトル（例えば、１．２５ＭＨｚ、５ＭＨｚ）を有する。

セクターと周波数割り当ての交差は、ＣＤＭＡチャネルと言われる。基地局２７０は、基地局送受信サブシステム（Base Station Transceiver Subsystem：ＢＴＳｓ）とも言われる。場合によっては、「基地局」という用語は、１つのＢＳＣ２７５及び少なくとも１つの基地局２７０を合わせたものを意味する。

基地局２７０はまた、「セルサイト」を示すこともできる。又は、特定基地局２７０のそれぞれのセクターをセルサイトという。地上波ＤＭＢ（digital multimedia broadcasting）送信部２９５は、システム内で動作する移動端末機１００に放送する。

移動端末機１００の放送用モジュール１１１（図１を参照）は、ＤＭＢ送信部２９５により伝送される放送信号を受信するために備えられる。前述したように、同様の配置が他のタイプのブロードキャスト及びマルチキャストシグナリングのために実現できる。

さらに、図４は、複数のＧＰＳ衛星３００を示す。衛星３００は、複数の移動端末機１００の一部又は全ての位置把握を容易にする。図４においては２つの衛星を示すが、位置情報は、それより多数の衛星によっても、それより少数の衛星によっても取得できる。

移動端末機１００の位置情報モジュール１１５（図１を参照）は、所望の位置情報を取得するために衛星３００と連動する。しかしながら、ＧＰＳ追跡技術に加えて又はＧＰＳ追跡技術の代わりに利用される追跡技術のような他のタイプの位置検出技術が代案として実現されてもよい。ＧＰＳ衛星３００の一部又は全ては、選択的に又は追加的に衛星ＤＭＢ伝送を提供するように構成される。

さらに、無線通信システムが一般的に動作する過程で、基地局２７０は、多様な移動端末機１００から逆方向リンク信号のセットを受信する。ここで、移動端末機１００は、呼接続中であるか、メッセージ送受信中であるか、又は他の通信動作を実行中である。

特定基地局２７０により受信された逆方向リンク信号のそれぞれは、特定基地局２７０内で処理され、前記処理の結果として生成されたデータは、関連ＢＳＣ２７５に送信される。ＢＳＣ２７５は、基地局２７０間のソフトハンドオフを含む呼リソース割り当て機能及び移動性管理機能を提供する。

また、ＢＳＣ２７５は、前記受信したデータをＭＳＣ２８０に送信し、ＭＳＣ２８０は、ＰＳＴＮ２９０とのインタフェース接続のために追加的なルーティングサービスを提供する。ＰＳＴＮ２９０は、ＭＳＣ２８０にインタフェース接続し、ＭＳＣ２８０は、ＢＳＣ２７５にインタフェース接続する。ＢＳＣ２７５は、移動端末機１００に順方向リンク信号のセットを伝送するようにＢＳ２７０を制御する。

以下の説明において、前述したように構成された移動端末機１００に適用可能な制御方法について様々な実施形態に基づいて説明する。しかしながら、下記の実施形態は、独立して又は互いに組み合わせて実現することができる。さらに、以下の説明において、ディスプレイモジュール１５１は、タッチスクリーンを含む。また、前記タッチスクリーン又は前記ディスプレイのスクリーンは、参照番号「４００」で示される。

図５は、本発明の一実施形態による移動端末機の制御方法を示すフローチャートである。以下の説明においては図１も参照する。図に示すように、制御部１８０は、移動端末機の音声認識機能がアクティブになったか否かを判断する（Ｓ１０１）。前記音声認識機能がアクティブになると（Ｓ１０１でＹｅｓ）、制御部１８０は、使用者による音声命令の入力（以下「音声命令」という）を受信する（Ｓ１０２）。その後、使用者により入力された音声命令が認識されると（Ｓ１０２でＹｅｓ）、制御部１８０は、その認識された音声命令の意味を判断する（Ｓ１０３）。

本発明による移動端末機の音声認識機能をアクティブにするために、使用者は、前記移動端末機の特定ボタンを選択するか、又はタッチスクリーンの特定部分をタッチする。使用者による音声認識機能の物理的アクティブ化は、使用者が前記移動端末機を制御するために音声命令を使用しようとすることをより意識できるので、より有利である。すなわち、使用者は、まず前記移動端末機の物理的操作を行わなければならないため、前記移動端末機に音声命令を入力しようとすることを直感的に認識するので、より明瞭に又はゆっくり発話することにより特定機能をアクティブにすることができる。

従って、使用者がより明瞭に又はゆっくり発話するため、例えば、前記音声命令を正確に認識する確率が高くなる。すなわち、前記音声認識機能のアクティブ化は、前記移動端末機に対する発話により行われるのではなく、前記移動端末機のボタンの物理的操作により行われる。

また、制御部１８０は、使用者が前記特定ボタン又は前記タッチスクリーンの特定部分をタッチした回数、使用者が前記特定ボタン又は前記タッチスクリーンの特定部分をタッチしていた時間などに基づいて、前記音声認識機能のアクティブ化を開始又は終了する。使用者は、本発明により提供される適切なメニューオプションを利用して、制御部１８０が前記音声認識機能をアクティブにする方法を設定することもできる。例えば、使用者は、１）前記音声アクティブ化ボタンが選択された回数（Ｘ）に基づく音声認識機能のアクティブ化の設定、２）前記音声アクティブ化ボタンが選択されていた時間（Ｘ）に基づく音声認識機能のアクティブ化の設定、３）前記ボタン（Ｘ、Ｙ）が選択されたときの音声認識機能のアクティブ化の設定などを含む前記移動端末機のメニューオプションを選択することができる。次に、使用者は、制御部１８０が前記音声認識機能のアクティブ化を判断する方法を可変的に設定するために、前記Ｘ及びＹの値を入力することができる。従って、本発明の一実施形態によれば、使用者が移動端末機の音声認識機能に積極的に関与できるようにすることにより、制御部１８０が使用者の音声命令に対応する機能を正確に判断する確率を高め、使用者の必要に応じて前記音声認識機能を調節できるようにする。

制御部１８０は、指定された前記ボタンがタッチ又は選択されている間、前記音声認識機能のアクティブ状態を維持し、指定された前記ボタンが解除されると、前記音声認識機能を停止する。また、制御部１８０は、指定された前記ボタンがタッチ又は選択されてから所定時間の間、前記音声認識機能のアクティブ化を維持し、前記所定時間が経過すると、前記音声認識機能を停止又は終了することができる。他の実施形態において、制御部１８０は、前記音声認識機能のアクティブ状態が維持されている間、受信された音声命令をメモリ１６０に保存することができる。

制御部１８０は、前記音声認識機能が終了するや否や前記音声命令の意味を判断することもでき、使用者による音声命令の入力と同時に前記音声命令の意味を判断することもできる。また、制御部１８０は、前記音声命令の意味を判断するために、前記入力された音声命令で使用された単語、キーワード、文章構造などを分析し、前記音声命令の内容又は意味を判断することができる。

さらに、制御部１８０は、前記音声命令の意味を判断するために、前記移動端末機で提供される機能、サービス、又はメニューなどに関する情報を、メモリ１６０のデータベースに保存することができる。さらに、使用者の音声命令を正確に感知する確率を高めるために、学習又は人工知能方法を用いて前記データベースに保存された情報をアップデートすることができる。前記移動端末機で行われる事前動作も前記データベースに保存することができる。例えば、使用者は、前記移動端末機を開いて他の動作を行う前に電子メールを確認することができる。

従って、制御部１８０は、使用者の音声命令の意味を判断する確率を高めるために、このような事前動作を利用することができる。また、使用者は、移動端末機を最初にターンオンするか又は開くとき、同一の音声命令を入力することがある。このような事前動作は、前記入力された音声命令と共に保存し、制御部１８０が入力命令の意味を判断するために利用することができる。

従って、前記移動端末機で行われる事前動作は、前記移動端末機のアクティブ状態（例えば、待機モード時、通話時、テレビ電話時、電子メールセッション時、インスタントメッセージセッション時、端末機を閉じるときなど）を含み、また使用者により入力される事前命令をも含む。例えば、音楽を聞くために、使用者は、移動端末機を予め閉じ、その後に「play my music」という命令を入力する。制御部１８０は、使用者により入力された音声命令の判断の助けになるように、移動端末機の状態（すなわち、閉じた状態）を利用することができる。

ここで、図５の説明に戻る。制御部１８０は、前記データベースの情報を利用して前記音声命令の意味を判断すると、対応する結果値を出力する（Ｓ１０４）。すなわち、前記結果値は、認識された前記音声命令に対応する機能を実行するか、又は特定構成要素を制御するための制御信号を含むことができる。また、前記結果値は、認識された前記音声命令に関するメニューを表示するためのデータ情報に該当するものであってもよい。

また、使用者は、特定メニュー（例えば、image capturing、voice call、message transmissionなど）を正確に示す音声命令を入力するか、又は自然言語（例えば、showme photo、save batteryなど）を使用して音声命令を入力することができる。前記自然言語命令は、特定メニューの正確な指示を含んでもよく含んでいなくてもよい。

また、前記自然言語は、（人工的に作られた）人工言語とは異なり、日常生活で人々が一般的に使用する言語であって、自然言語処理アルゴリズムを用いて処理できる。

その後、制御部１８０は、図５に示すように、使用者により入力された音声命令を認識できるか否かを判断する（Ｓ１０５）。

例えば、制御部１８０は、特定閾値（例えば、８０％）以上の確率で音声命令を認識できるか否かを判断することができる。前記特定閾値を満たす音声命令の意味を判断できない場合、制御部１８０は、付加的なエラー処理を行い（Ｓ１０７）、ステップＳ１０３〜Ｓ１０５を繰り返す。

前記特定閾値（例えば、８０％又はそれ以上の特定認識率より大きい値）を満たす音声命令を認識できる場合、制御部１８０は、前記特定閾値を満たす複数のメニューを表示する（Ｓ１０６）。使用者は、表示されたメニューを視覚的に見ることができ、その表示されたメニューのいずれか１つを選択することができる。

このような特徴は、使用者が前記音声認識機能に積極的に関与できるようにするため、特別な利点となる。より詳細には、制御部１８０は、使用者に音声命令の意味を正確に判断できないことを通知するメッセージを表示又は出力するのではなく、特定閾値（例えば、８０％）より高い、正確性のある確率を有する複数のメニューを出力する。例えば、使用者が「save battery」という音声命令を入力したが、（例えば、背景雑音や受信障害などにより）制御部１８０が「save」という音声命令のみ判断できた場合、制御部１８０は前記キーワード「save」に関する特定メニュー又はオプションを表示できる。すなわち、制御部１８０は写真メニュー、バッテリメニュー、電子メールメニューなどを表示できるが、これはこれらメニューが「save」の特徴を含んでいるからである。従って、使用者は表示された複数のメニューから適切なメニューを選択することができる。

また、前述したように、制御部１８０は、入力された音声命令の意味の判断において、移動端末機の事前動作を利用することができる。制御部１８０は、前記入力された音声命令の意味の判断の助けになるように、前記移動端末機の物理的状態を利用することができる。例えば、制御部１８０は、前記入力された音声命令の意味を決定するとき、バッテリの状態（例えば、低バッテリ状態）に関する情報を有益に利用することができる。

また、使用者の確認（ＡＣＫ）の受信タイプとしては、メッセージ、音声、又はメニューの表示位置若しくは形態（形状或いはサイズ）などを使用することができ、その応答タイプとしては、使用者音声、特定ボタン、又はタッチ入力などがある。さらに、前述したように、前記入力された音声命令の認識率が特定閾値より低い場合、制御部１８０はエラー処理動作を行うことができる（Ｓ１０７）。

また、前記エラー処理動作時、制御部１８０は、使用者から音声命令をさらに受信するか、又は前述したように、所定の認識率若しくは確率以上の複数のメニューを表示することができる。さらに、制御部１８０は、所定の認識率以上の認識された機能又はメニューの数を判断する。所定の認識率以上の認識された機能又はメニューが特定数より少ない場合（例えば、１つの機能又は１つのメニューしかない場合）、制御部１８０は前記１つの機能又はメニューを自動的に実行する。

次に、図６（ａ）〜（ｃ）は、本発明の一実施形態による移動端末機の音声認識機能のアクティブ化方法を説明するための表示画面を示す図である。前述したように、本発明は、前記音声認識機能が使用者の物理的操作により開始されるタイミングを使用者が判断できるようにする。従って、使用者は、使用者の周辺環境（例えば、使用者が静かな環境で発話しているか否かなど）、使用者の音声のトーン及びレベル、使用者自身が使用する自然言語又はその他のタイプの言語などをより意識する。その結果、使用者は音声命令を入力するときにさらに気をつけるようになり、制御部１８０が前記音声命令の意味を正確に判断する確率を高めることができる。

また、使用者が移動端末機のボタンをタッチ又は選択することにより行われる音声認識機能の手動アクティブ化は、バッテリの電力消費を低減するという利点がある。すなわち、前記音声認識機能は、移動端末機の様々なリソースを消費するが、前記音声認識機能のアクティブ状態が待機状態（又はアイドル状態）で持続的に動作すると、移動端末機の全体的な電力も持続的に消費される。

より詳細には、制御部１８０が、（使用者の特定ボタンの選択ではなく、）使用者の移動端末機に対する発話により、前記音声認識機能をアクティブにするアクティブ信号を受信するように構成された場合、制御部１８０は、アクティブ状態で前記音声認識機能を持続的に動作させ、使用者の（前記音声認識の開始を意味する）発話を待たなければならない。前記音声認識機能をアクティブにするための使用者の音声入力を持続的に待つこのような動作は、移動端末機の利用可能な電力を持続的に減少させる。

従って、移動端末機の電力消費及びリソース消費を抑えるために、制御部１８０は、前記音声認識機能の開始及び終了を制御することが好ましい。例えば、図６（ａ）に示すように、移動端末機のユーザ入力部１３０は、使用者が前記音声認識機能を開始又は停止するためにタッチできるように、ディスプレイモジュール１５１上にソフトボタン３５０を含むことができる。ここで、ソフトボタン３５０は、ボタン形状でもよく、特定形状のアイコンでもよい。さらに、ソフトボタン３５０は、例えば図６（ａ）に示すように、移動端末機の側部に配設されたハードボタン３５１で代替することもできる。

他の例として、図６（ｂ）に示すように、ディスプレイモジュール１５１上にボタン又はアイコンを表示するのではなく、ディスプレイモジュール１５１の任意の部分を前記音声認識機能のアクティブ化及び非アクティブ化のために使用することができる。さらに他の例として、図６（ｃ）に示すように、特定サウンドを移動端末機のマイク１２２から入力し、前記音声認識機能のアクティブ化及び終了を制御することができる。

より詳細には、前記特定サウンドは、使用者の拍手音などの特定レベル以上の衝撃音でもよい。制御部１８０は、マイク１２２から入力されたサウンドのレベルを判断するためのアルゴリズム又は回路を用いて、前記衝撃音を検出する。すなわち、前記衝撃音を検出するためのアルゴリズム又は回路は、前記音声認識機能に比べて前記移動端末機のリソース又は電力の消費が少なく、かつ予め設定されている特定レベル以上のサウンドを検出するように構成される。

使用者は、前記音声認識機能をアクティブにするために使用される特定衝撃音を設定することができる。例えば、使用者は、本発明の移動端末機により提供される適切なメニューオプションを選択した後、２回又は３回拍手し、その拍手音が前記音声認識機能のアクティブ化のために使用されることを制御部１８０に通知することができる。また、使用者は、前記音声認識機能をアクティブにするためのサウンドとして、その他のサウンドを設定することもできる。

さらに、制御部１８０は、前記音声認識機能を複数のモードで駆動することができる。例えば、制御部１８０は、特定レベル以上のサウンドが前記音声認識機能をアクティブにする第１モードと、音声命令が入力されてその内容又は意味が判断される第２モードとに区分して、前記音声認識機能を駆動する。すなわち、制御部１８０は、第１モードで特定レベル以上のサウンドが検出されると、第２モードを実行して前記音声認識機能をアクティブにする。

また、他の実施形態によれば、制御部１８０は、使用者から身体情報を受信し、音声認識機能のアクティブ化を開始する。より詳細には、前記身体情報は、使用者の手信号又はジェスチャを含む。前記使用者の身体情報を検出するためには、センシング部１４０を使用することができる。さらに他の実施形態によれば、制御部１８０は、無線装置により近距離又は遠距離（remote area）の無線信号を受信し、音声認識機能のアクティブ化を開始する。

また、制御部１８０は、無線通信部１１０により無線信号を受信し、センシング部１４０により使用者の手信号又はジェスチャを受信することができる。このような実施形態においては、前記音声認識機能をアクティブにするための信号を受信する無線通信部１１０、ユーザ入力部１３０、及びセンシング部１４０をまとめて、アクティブ信号入力部ともいう。

さらに、前述したように、移動端末機の電力消費及びリソース消費を低減するために、制御部１８０は、使用者から終了信号を受信して所定時間が経過すると、前記音声認識機能を終了又は停止する。このために、前記終了信号は、前記音声認識機能のアクティブ化を開始する方式と同一又は類似の方式で、ボタンのタッチ若しくは押圧、タッチスクリーンの特定部分のタッチ、衝撃音、無線信号、又は使用者からの身体情報に対応する。

より詳細には、制御部１８０は、前記音声認識機能のアクティブ化を開始し、特定期間では前記音声認識機能のアクティブ状態を維持し、前記特定期間が経過すると前記音声認識機能のアクティブ状態を自動的に終了することができる。また、制御部１８０は、ボタン又はタッチが持続的に入力されている間、前記音声認識機能のアクティブ状態を維持し、前記入力が解除されると、前記音声認識機能のアクティブ状態を終了することができる。他の実施形態によれば、制御部１８０は、特定期間が経過しても使用者が前記端末機に対して発話しないと、前記音声認識機能を終了することができる。

次に、図７Ａは、本発明の一実施形態による移動端末機の音声認識方法を示すフローチャートである。以下の説明においては図１も参照する。図７Ａに示すように、音声認識機能が入力されると（Ｓ２０１）、制御部１８０は、入力された音声命令をメモリ１６０に保存し（Ｓ２０２）、その音声命令を特定音声認識アルゴリズムにより処理する（Ｓ２０３）。

前記音声認識アルゴリズムにより、制御部１８０は、前記入力された音声命令をテキスト情報に変換し、その変換されたテキスト情報をメモリ１６０の任意の領域に保存する（Ｓ２０４）。その後、制御部１８０は、前記テキスト情報を処理してその音声命令の意味を判断する。

前記音声命令の意味の判断は、前記音声命令の入力と同時に行うことが好ましいが、これに限定されるものではなく、前述したように、前記音声命令の入力が終わった後に行ってもよい。例えば、使用者が予め設定されている特定期間に音声命令を入力しないと、制御部１８０は、使用者が前記音声命令の入力を完了したと判断し、前記音声命令の意味を判断する過程を開始することができる。

次に、図７Ａに示すように、制御部１８０は、前記音声命令の意味を判断するために、前記テキスト情報に含まれる特定単語又はキーワードを検出し（Ｓ２０５）、前記検出された単語又はキーワードと前記移動端末機の特定データベースに保存されている各種機能及びメニューに関する情報とを比較する（Ｓ２０６）。前記データベースに同一又は類似の単語又はキーワードが保存されていると、その対応する単語又はキーワードの数により前記音声命令の認識率を判断する（Ｓ２０７）。

ここで、前記認識率を判断するための情報は、前記音声命令に含まれる単語又はキーワードの数に関する情報に限定されるものではない。すなわち、キーワード毎に認識率を判断するための値が異なるように設定することにより、単語又はキーワードの数が少なくても認識率の高いキーワードにより認識率が変化することがある。

前記音声認識率は、前記認識された音声命令の意味が正確か否かを示す情報である。より詳細には、特定メニューの名称が正確に入力された場合、１００％の認識率が得られるが、音声命令が自然言語で入力された場合は、その音声命令に意味のない単語が含まれたり、同じ単語の発音が使用者毎に異なったりするため、事実上１００％の認識率を得ることは難しい。

従って、本発明の一実施形態においては、認識率が特定値（例えば、８０％）以上であると正確であると判断する。類似の認識率と判断された意味が複数である場合（すなわち、認識率は類似しているが、音声命令を異なる意味に解釈できる場合）、制御部１８０は、所定の閾値以上の認識率に対応する実行可能な複数のメニューを表示し、使用者がその表示されたメニューのいずれか１つを選択できるようにする（Ｓ２０８）。

また、制御部１８０は、前記メニューの表示において、認識率が高い順に前記メニューを表示することができる。例えば、図７Ｂに示すように、最も高い認識率を有するメニューアイコンを表示画面４１０の中心に表示することもでき、最も高い認識率を有するメニューアイコンをより大きく、より濃く、又は強調して表示画面４２０に表示することもできる。さらに、前記最も高い認識率を有するメニューは点滅させて表示することもできる。

認識率を高めるために、制御部１８０は、使用者により頻繁に選択されるメニューの場合、その選択回数を学習又は記憶し、その学習した情報を特定メニューの認識率を変更するために使用することができる。従って、その後に同一又は類似の発音又は内容で入力される音声命令に対する認識率が変化することがある。

図７Ｃは、本発明の一実施形態による移動端末機の音声認識方法を説明するための表示画面の一例を示す図である。例えば、使用者が自然言語で「I want to see my pictures」という音声命令を入力すると、制御部１８０は、前記音声命令を構成する文章から意味のある単語又はキーワード（例えば、see、picture）を検出し、前記移動端末機のデータベースに保存されている情報と比較する。

前記検出された単語又はキーワードが意味のある単語であるか否かは、発話の部分により判断することもでき、予め設定されているキーワードのみを意味のある単語として検出することもできる。また、制御部１８０は、前記意味のある単語又はキーワードに対応する情報を前記データベースから検索することができる。

前記データベースは、前記移動端末機の各種メニュー又は機能に関する複数のキーワード情報を保存することができる。例えば、「photo album」に対応するキーワード情報として、正確な「photo album」に加えて、カメラメニューの下位メニューなどの複数のキーワード情報である「photopicture」「video」「album」などを保存することができる。

図７Ｃの表示画面５１０に示すように、音声命令と一致するメニュー又は機能に関する情報がない場合、制御部１８０は、特定値より高い認識率を有する複数のメニューを表示する。このとき、制御部１８０は、前述したように、最も高い認識率を有するメニューアイコン５２１を他の表示アイテムよりも大きく又は濃く表示することができる。

また、図７Ｃの表示画面５２０は、特定値より高い認識率を有するメニューが１つしかない場合、制御部１８０がその特定値より高い認識率を有する該当メニュー機能を自動的に実行することを示している。このとき、制御部１８０は、意味が判断された前記音声命令を、テキスト若しくはその他のタイプのメッセージ、又は音声メッセージとして出力することができる。

図７Ｄは、本発明の一実施形態による移動端末機の音声認識方法を説明するための表示画面の他の例を示す図である。本実施形態においては、使用者が表示画面６１０をタッチすることにより音声認識機能をアクティブにした後、表示画面６２０に示すように自然言語で「Enable battery saving」という音声命令を入力する。次に、制御部１８０は、前記音声命令を構成する文章から意味のある単語又はキーワード（例えば、battery、saving）を検出し、前記データベースに保存されている情報と比較してその意味を判断する。

しかしながら、本例においては、前記音声命令に正確に対応するメニューが存在しないため、制御部１８０は、表示画面６３０に示すように、バッテリの電力消費を低減する機能に関する複数のメニュー（例えば、backlight、standby screen、background imageなど）を表示する。

前述したように、認識率が高い順に複数のメニューをサイズ、位置、色、及び明暗の少なくとも１つを変えて表示するか、又は強調して表示することができる。例えば、使用者選択度の高いメニューの認識率を他のメニューと差別化して表示することができる。

図８は、本発明の一実施形態による移動端末機の音声認識方法に使用されるデータベースシステムを示すブロック図である。前記データベースは音声命令の意味を判断するための情報を保存するものであり、各情報の特性によって複数のデータベースを構成することができる。前記各情報の特性に応じて構成された各データベースは、制御部１８０の制御下で持続的な学習過程によりアップデートすることができる。

前記データベースの学習過程とは、使用者により発音された音声をそれに該当する単語と対応させることをいう。例えば、使用者は「fifteen」と発音したが制御部１８０が「fifty」と認識した場合、使用者が「fifty」を「fifteen」に修正することにより、その後は制御部１８０が同発音を「fifteen」と認識できるようにする。

従って、前記学習過程により、複数の音声情報を前記データベースの各情報に対応させることができる。例えば、前記データベースは、マイクから入力された使用者の音声がフォーマット、音節、又は形態素単位で認識されるようにする音声情報を保存する第１データベース１６１と、制御部１８０が前記認識された音声情報に基づいて音声命令の全体的な意味を判断するようにする情報（例えば、文法、発音の正確度、文章構造など）を保存する第２データベース１６２と、前記移動端末機の機能又はサービスを実行するためのメニューに関する情報を保存する第３データベース１６３と、使用者が前記判断された音声命令の意味を確認できるように前記移動端末機が出力するメッセージ又は音声情報を保存する第４データベース１６４とを含む。

前記各データベースには、音声（発音）情報、その音声（発音）情報に対応するフォーマット、音節、形態素、単語、キーワード、又は文章情報などが保存される。従って、制御部１８０は、複数のデータベース１６１〜１６４の少なくとも１つを利用して、音声認識動作と音声命令の意味を判断する動作を行い、その判断された音声命令の意味に該当する機能又はサービスに関するメニューを実行することができる。

図９は、本発明の一実施形態による移動端末機で認識された音声命令が行われていることを使用者に通知するための情報を表示する表示画面を示す図である。制御部１８０は、音声命令が認識されるか、又は音声命令の意味が判断されると、その結果値を出力する。前記結果値は、前記移動端末機の特定機能を実行するための制御信号でもよく、前記認識された命令に関するメニュー情報でもよく、前記機能の実行時に出力されるデータ情報でもよい。図９によれば、制御部１８０は、情報（例えば、インジケータ）５００を出力して、前記入力された音声命令が認識されたことを使用者に通知する。

また、前述した実施形態は、使用者の音声命令の認識に関するものであるが、本発明は、前記音声命令が認識されている間に使用者がさらなる入力機能を実行できるように適用することもできる。例えば、音声認識とタッチ入力、音声認識とボタン入力、又は音声認識とタッチ／ボタン入力を同時に行うことができる。

また、制御部１８０は、特定モード、メニュー、又は特定動作状態で音声認識機能が実行されないようにすることができる。また、音声認識機能が適用されていることを示すオーディオ情報（例えば、音声告知若しくは案内情報）又はビデオ情報（例えば、図９の情報５００）を、音声認識モード、メニュー、又は動作状態で表示することができる。さらに、ヘルプ情報を出力することにより、音声認識機能が適用されていることを使用者に通知することもできる。

また、前述した多様な実施形態は、例えば、コンピュータソフトウェア、ハードウェア、又はこれらの組み合わせを利用したコンピュータ可読媒体で実現される。ハードウェア的な実現によれば、前述した実施形態は、ＡＳＩＣｓ（application specific integrated circuits）、ＤＳＰｓ（digital signalprocessors）、ＤＳＰＤｓ（digital signal processing devices）、ＰＬＤｓ（programmable logicdevices）、ＦＰＧＡｓ（field programmable gate arrays）、プロセッサ、制御部、マイクロ制御部、マイクロプロセッサ、ここに説明された前記機能を実行するように設計された他の電気的ユニット、又はこれらの選択的な組み合わせの少なくとも１つを利用して実現される。

ソフトウェア的な実現によれば、ここに説明された前記実施形態は、前述した機能又は動作のうちの１つ又は複数を行う各手順又は機能のような別個のソフトウェアモジュールと共に実現される。ソフトウェアコードは、適切なプログラム言語で作成されたソフトウェアアプリケーションにより実現される。また、ソフトウェアコードは、メモリ（例えば、メモリ１６０）に保存され、制御部又はプロセッサ（例えば、制御部１８０）により実行される。

さらに、移動端末機１００は、多様な異なる構造で実現される。前記構造の例としては、折り畳み型、スライド型、ストレート型、回転型、スイング型、及びこれらの組み合わせがある。

本発明の精神や範囲から外れない限り本発明の多様な変更及び変形ができることは、当業者には明らかである。従って、本発明の請求の範囲内で行われるあらゆる変更及び変形、並びに請求の範囲の均等物は本発明の請求の範囲に含まれる。

以上のように、本発明の好ましい実施形態を用いて本発明を例示してきたが、本発明は、この実施形態に限定して解釈されるべきものではない。本発明は、特許請求の範囲によってのみその範囲が解釈されるべきであることが理解される。当業者は、本発明の具体的な好ましい実施形態の記載から、本発明の記載および技術常識に基づいて等価な範囲を実施することができることが理解される。

本発明の一実施形態による移動端末機のブロック図である。本発明の一実施形態による移動端末機の前面斜視図である。図２の移動端末機の後面斜視図である。本発明の一実施形態による図１〜図３の移動端末機が動作可能な無線通信システムを示す図である。本発明の一実施形態による移動端末機の制御方法を示すフローチャートである。本発明の一実施形態による移動端末機の音声認識機能のアクティブ化方法を説明するための表示画面を示す図である。本発明の一実施形態による移動端末機の音声認識方法を示すフローチャートである。本発明の一実施形態による移動端末機の音声認識率に基づいて表示されたメニューを含む表示画面の例を示す図である。本発明の一実施形態による移動端末機の音声認識方法を説明するための表示画面の一例を示す図である。本発明の一実施形態による移動端末機の音声認識方法を説明するための表示画面の他の例を示す図である。本発明の一実施形態による移動端末機の音声認識方法に使用されるデータベースシステムを示すブロック図である。本発明の一実施形態による移動端末機で音声命令が行われていることを使用者に通知するメッセージを表示する表示画面を示す図である。

Claims

移動端末機であって、
前記移動端末機は、
前記移動端末機の音声認識機能をアクティブにする入力を受信するように構成された入力部と、
前記移動端末機で行われる動作に関する情報を保存するように構成されたメモリと、
前記音声認識機能をアクティブにする入力が受信されると前記音声認識機能をアクティブにし、前記移動端末機で行われる少なくとも１つの事前動作と入力音声命令に含まれる言語に基づいて、前記音声命令の意味を判断し、前記移動端末機で行われる少なくとも１つの事前動作と前記音声命令に含まれる言語に基づいて、また、前記判断された入力音声命令の意味と前記移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、前記判断された入力音声命令の意味に関する動作を提供するように構成された制御部と
を含み、
前記動作は、
所定の閾値より大きい確率を有する前記入力音声命令の意味にマッチするメニューの数を判断することと、
前記所定の閾値より大きい確率を有する前記入力音声命令の意味にマッチするのが１つのメニューしかない場合に、前記１つのメニューを表示せずに、前記１つのメニューを実行し、前記所定の閾値より大きい確率を有する前記入力音声命令の意味にマッチするメニューの数が１よりも大きい場合に、前記メニューの各々を表示部に表示することと
により、提供される、移動端末機。
前記所定の閾値は、前記移動端末機のメーカ又は前記移動端末機の使用者により設定される、請求項１に記載の移動端末機。
前記制御部は、前記移動端末機の動作状態に基づいて、前記入力音声命令の意味を判断するようにさらに構成される、請求項１に記載の移動端末機。
前記制御部は、前記所定の閾値より大きい確率を有する前記入力音声命令の意味にマッチするメニューの中で、最も高い確率を有し、かつ、前記入力音声命令の意味に対応するメニューを差別化して表示するようにさらに構成される、請求項１に記載の移動端末機。
前記メニューは、前記メニューのサイズ、表示位置、色、明暗又はハイライト情報のうちの少なくとも１つが異なるように制御することにより、表示される、請求項４に記載の移動端末機。
前記入力部は、
１）前記音声認識機能をアクティブにするためにタッチされるタッチソフトボタン、
２）前記音声認識機能をアクティブにするために押圧又は操作されるハードボタン、
３）前記音声認識機能をアクティブにするためにタッチされる、前記入力部に含まれるタッチスクリーンの任意の位置、
４）前記音声認識機能をアクティブにするために入力される衝撃音、
５）近距離無線信号又は遠距離無線信号、又は
６）使用者からの身体情報信号
のうちの少なくとも１つを含む、請求項１に記載の移動端末機。
前記音声命令を認識する制御部により使用される音声又は発音情報を保存するように構成された第１データベースと、
前記音声命令を認識する制御部により使用される単語、キーワード、又は文章情報を保存するように構成された第２データベースと、
前記移動端末機の機能又はメニューに関する情報を保存するように構成された第３データベースと、
前記制御部が前記認識された音声命令の意味の判断を試みていることを使用者に通知するために出力されるヘルプ情報を保存するように構成された第４データベースと
をさらに含む、請求項１に記載の移動端末機。
前記制御部は、前記音声認識機能がアクティブ状態にあることを示すオーディオ情報又はビデオ情報を出力するようにさらに構成される、請求項１に記載の移動端末機。
移動端末機を制御する方法であって、
前記方法は、
前記移動端末機の音声認識機能をアクティブにする入力を受信することと、
前記音声認識機能をアクティブにする入力が受信されると前記音声認識機能をアクティブにすることと、
前記移動端末機で行われる少なくとも１つの事前動作と入力音声命令に含まれる言語に基づいて、また、判断された前記入力音声命令の意味と前記移動端末機で行われる動作に関する情報とがマッチする確率に基づいて、前記判断された入力音声命令の意味に関する動作を提供することと
を含み、
前記動作を提供することは、
所定の閾値より大きい確率を有する前記入力音声命令の意味にマッチするメニューの数を判断することと、
前記所定の閾値より大きい確率を有する前記入力音声命令の意味にマッチするのが１つのメニューしかない場合に、前記１つのメニューを表示せずに、前記１つのメニューを実行し、前記所定の閾値より大きい確率を有する前記入力音声命令の意味にマッチするメニューの数が１よりも大きい場合に、前記メニューの各々を表示部に表示することと
により、実行される、方法。
前記所定の閾値は、前記移動端末機のメーカ又は前記移動端末機の使用者により設定される、請求項９に記載の方法。
前記移動端末機の動作状態に基づいて、前記入力音声命令の意味を判断することをさらに含む、請求項９に記載の方法。
前記所定の閾値より大きい確率を有する前記入力音声命令の意味にマッチするメニューの中で、最も高い確率を有し、かつ、前記入力音声命令の意味に対応するメニューを差別化して表示することをさらに含む、請求項９に記載の方法。
前記メニューは、前記メニューのサイズ、表示位置、色、明暗又はハイライト情報のうちの少なくとも１つが異なるように制御することにより、表示される、請求項１２に記載の方法。
前記入力するステップは、
１）前記音声認識機能をアクティブにするためにタッチされるタッチソフトボタン、
２）前記音声認識機能をアクティブにするために押圧又は操作されるハードボタン、
３）前記音声認識機能をアクティブにするためにタッチされる、前記入力部に含まれるタッチスクリーンの任意の位置、
４）前記音声認識機能をアクティブにするために入力される衝撃音、
５）近距離無線信号又は遠距離無線信号、又は
６）使用者からの身体情報信号
のうちの少なくとも１つを使用して、前記音声認識機能をアクティブにすることを含む、請求項９に記載の方法。
前記音声認識機能がアクティブ状態にあることを示すオーディオ情報又はビデオ情報を出力することをさらに含む、請求項９に記載の方法。