JP2009253970A

JP2009253970A - 移動端末機及びそのメニュー制御方法

Info

Publication number: JP2009253970A
Application number: JP2008274952A
Authority: JP
Inventors: Jong Keun Youn; チョン−キュンユン; Dae-Sung Jung; デ−スンチュン; Jae-Hoon Yu; チェ−フンユー; Tae-Jun Kim; テ−チュンキム; Chie-Ming Chou; チェ−ミンチョウ; Jae-Do Kwak; チェ−ドクウォク; Jong-Ho Shin; チョン−ホーシン
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2008-04-08
Filing date: 2008-10-24
Publication date: 2009-10-29
Also published as: US9900414B2; EP2109295B1; US20170019515A1; EP2109295A1; US9692865B2; US20090253463A1; US20170257470A1; US20150126252A1; US8958848B2; US9497305B2

Abstract

【課題】音声認識のためのドメインを特定メニュー又はサービスに関する情報に特定して音声認識率を向上させる移動端末機及びそのメニュー制御方法を提供する。
【解決手段】移動端末は、移動端末機で音声認識機能をアクティブ化するための入力を受信する入力部と、前記移動端末機の各メニュー又は動作に関連する複数のドメインを保存するためのメモリと、前記音声認識機能をアクティブ化するために受信された前記入力に基づいて、前記メモリ内に含まれる前記複数のドメインのうち特定ドメインにアクセスし、前記アクセスされたドメインの言語モデル及び音響モデルに基づいて使用者言語を認識し、前記アクセスされた特定ドメイン及び前記認識された使用者言語に基づいて前記移動端末機の少なくとも１つのメニュー及び動作を判断する制御部とを含む。
【選択図】図５

Description

本発明は、音声認識のためのドメインを特定メニュー又はサービスに関する情報に特定して音声認識率を向上させる移動端末機及びそのメニュー制御方法に関する。

移動端末機は、基本的な通話サービス以外にも多様な機能を行う。

例えば、使用者は、インターネットアクセス、ゲーム、ビデオ又は音楽鑑賞、映像撮影、音声ファイル記録などが可能である。一部の移動端末機は、使用者がテレビ番組、スポーツゲーム、ビデオなどを視聴できる放送番組を提供する。

さらに、移動端末機に含まれる機能が著しく増加したため、ユーザインタフェースも一層複雑になった。例えば、ユーザインタフェースは、使用者が特定アイテム又はメニューオプションをタッチして選択できるようにタッチスクリーンを含む。前記移動端末機は、使用者が基本的な機能を実行できるようにする非常に制限された音声認識機能を含む。しかしながら、使用者の音声命令の意味の判断におけるエラー率が高すぎるため、使用者は、一般的に前記端末機で前記制限された音声認識特性を使用しない。

本発明の目的は、移動端末機で音声命令の意味を文脈及び内容に基づいて認識することにより、端末機の特定機能又はサービスに関連するメニューを制御できる移動端末機及びそのメニュー制御方法を提供することにある。

また、本発明の他の目的は、端末機の音声認識のためのドメインを特定メニュー又はサービスに関連するドメインに特定することにより、音声認識率を向上させる移動端末機及びそのメニュー制御方法を提供することにある。

また、本発明のさらに他の目的は、使用者の操作を検出するために音声認識機能がアクティブ状態であるとき、少なくとも１つのユーザインタフェースを適用することにより、特定機能又はサービスに関連するメニューを制御できる移動端末機及びそのメニュー制御方法を提供することにある。

また、本発明のさらに他の目的は、端末機の動作状態又は動作モードによって音声命令の入力に関するヘルプ情報を提供することにより、初心者でも特定機能又はサービスに関連するメニューを音声命令で制御できる移動端末機及びそのメニュー制御方法を提供することにある。

このような目的を達成するための本発明による移動端末機は、前記移動端末機で音声認識機能をアクティブ化するための入力を受信する入力部と、前記移動端末機の各メニュー又は動作に関連する複数のドメインを保存するためのメモリと、前記音声認識機能をアクティブ化するために受信された前記入力に基づいて、前記メモリ内に含まれる前記複数のドメインのうち特定ドメインにアクセスし、前記アクセスされたドメインの言語モデル及び音響モデルに基づいて使用者言語を認識し、前記アクセスされた特定ドメイン及び前記認識された使用者言語に基づいて前記移動端末機の少なくとも１つのメニュー及び動作を判断する制御部とを含む。

さらに、このような目的を達成するための本発明は、移動端末機を制御する方法を提供する。前記方法は、前記移動端末機で音声認識機能をアクティブ化するための入力を受信する段階と、前記音声認識機能をアクティブ化するために受信された前記入力に基づいて、前記移動端末機のメモリに保存された複数のドメインのうち特定ドメインにアクセスする段階と、前記アクセスされたドメインの言語モデル及び音響モデルに基づいて入力された使用者言語を認識する段階と、前記アクセスされた特定ドメイン及び前記認識された使用者言語に基づいて前記移動端末機の少なくとも１つのメニュー及び動作を出力する段階とを含む。

本発明のさらなる適用範囲は、以下に説明される詳細説明により明らかになるであろう。しかし、本発明の好ましい実施形態を示す詳細説明及び特定例は、単なる例にすぎないことは理解できるであろう。本発明の精神と範囲内で行われる多様な変更及び変形は本発明の詳細な説明から当業者に明らかになるであろう。

本発明は、さらに以下の手段を提供する。
（項目１）
移動端末機であって、
上記移動端末機で音声認識機能をアクティブ化するための入力を受信する入力部と、
上記移動端末機の各メニュー又は動作に関連する複数のドメインを保存するためのメモリと、
上記音声認識機能をアクティブ化するために受信された上記入力に基づいて、上記メモリ内に含まれる上記複数のドメインのうち特定ドメインにアクセスし、上記アクセスされたドメインの言語モデル及び音響モデルに基づいて使用者言語を認識し、上記アクセスされた特定ドメイン及び上記認識された使用者言語に基づいて上記移動端末機の少なくとも１つのメニュー及び動作を判断する制御部と
を含むことを特徴とする移動端末機。
（項目２）
上記移動端末機が特定メニュー又は特定動作中であるとき、上記音声認識をアクティブ化するための上記入力が受信されると、上記アクセスされた特定ドメインは上記特定メニュー又は上記動作に対応することを特徴とする項目１に記載の移動端末機。
（項目３）
上記特定メニュー又は動作は、マルチメディアメニュー又は動作、接触メニュー又は動作、メッセージメニュー又は動作、サウンドメニュー又は動作、システム手帳（ｏｒｇａｎｉｚｅｒ）メニュー又は動作、画面メニュー又は動作、ユーティリティメニュー又は動作、カメラメニュー又は動作、及び設定メニュー又は動作の少なくとも１つを含むことを特徴とする項目２に記載の移動端末機。
（項目４）
上記制御部は、さらに、上記判断されたメニュー及び動作が正確に上記入力された使用者言語に対応する認識率を判断することを特徴とする項目１に記載の移動端末機。
（項目５）
情報を表示するディスプレイ部をさらに含み、
上記制御部は、さらに、所定の閾値より高い認識率を有すると判断された上記アクセスされた特定ドメイン及び上記認識された使用者言語に基づいて、上記移動端末機の全てのメニュー及び動作を上記ディスプレイ部上に出力することを特徴とする項目４に記載の移動端末機。
（項目６）
上記入力部は、さらに、上記表示されたメニュー及び動作の１つを選択するための音声入力命令を受信し、
上記制御部は、上記入力された音声命令を認識し、上記認識された入力音声命令が正確であるか否かを問い合わせる情報を出力することを特徴とする項目５に記載の移動端末機。
（項目７）
上記制御部は、さらに、高い認識率から低い認識率の順に、上記所定の閾値より高い上記認識率を有する上記アクセスされた特定ドメイン及び上記認識された使用者言語に基づいて、上記移動端末機の上記全てのメニュー及び動作を上記ディスプレイ部に出力することを特徴とする項目５に記載の移動端末機。
（項目８）
上記所定の閾値は、上記移動端末機の製造業者又は上記移動端末機の使用者により設定されることを特徴とする項目５に記載の移動端末機。
（項目９）
上記制御部は、さらに、上記メニュー又は動作のサイズ、位置、色、輝度、及びハイライトの少なくとも１つを制御して、最も高い認識率を有するメニュー又は動作を上記ディスプレイ部に区別して表示することを特徴とする項目５に記載の移動端末機。
（項目１０）
上記制御部は、さらに、上記移動端末機の特定メニュー又は動作が以前に選択された回数を判断し、上記特定メニュー又は動作が以前に選択されたと上記判断された回数に基づいて、上記特定メニュー又は動作に対する上記認識率を調整することを特徴とする項目４に記載の移動端末機。
（項目１１）
上記入力部は、
（１）上記音声認識機能をアクティブ化するためにタッチされるタッチソフトボタンと、
（２）上記音声認識機能をアクティブ化するために押圧又は操作されるハードボタンと、
（３）上記音声認識機能をアクティブ化するためにタッチされる上記入力部内に含まれるタッチスクリーンの任意の位置と、
（４）上記音声認識機能をアクティブ化するために入力される衝撃音と、
（５）ローカル領域無線信号又は遠隔領域無線信号と、
（６）使用者の身体情報の少なくとも１つを含むことを特徴とする項目１に記載の移動端末機。
（項目１２）
上記入力された使用者言語を認識するために上記制御部により使用される音声又は発音情報を保存する第１データベースと、
上記入力された使用者言語を認識するために上記制御部により使用される単語、キーワード、又は文章情報を保存する第２データベースと、
上記移動端末機の各機能又はメニューに関する情報を保存する第３データベースと、
上記制御部が上記入力された使用者言語の意味を判断中であることを使用者に通知するために出力するヘルプ情報を保存する第４データベースとをさらに含むことを特徴とする項目１に記載の移動端末機。
（項目１３）
上記制御部は、さらに、上記音声認識機能がアクティブ化状態にあることを示すオーディオ又はビデオ情報を出力することを特徴とする項目１に記載の移動端末機。
（項目１４）
上記複数のドメインは、上記移動端末機で送受信される電子メールに対応する電子メールドメインと、上記移動端末機に割り当てられたスケジューリングイベントに対応するスケジューリングタスクドメインと、上記移動端末機での接触に対応する接触ドメインと、上記移動端末機に保存された電話番号に対応する電話帳ドメインと、上記移動端末機により提供される地図情報に対応する地図ドメインと、上記移動端末機に保存された写真に対応する写真ドメインと、上記移動端末機で送受信されるメッセージに対応するメッセージドメインと、上記移動端末機で行われるマルチメディア機能に対応するマルチメディアドメインと、上記移動端末機が接続できる外部装置に対応する外部装置ドメインと、上記移動端末機で送受信された通話に対応する通話履歴ドメインと、上記移動端末機で行われる設定機能に対応する設定ドメインの少なくとも２つのドメインを含むことを特徴とする項目１に記載の移動端末機。
（項目１５）
移動端末機の制御方法であって、
上記移動端末機で音声認識機能をアクティブ化するための入力を受信する段階と、
上記音声認識機能をアクティブ化するために受信された上記入力に基づいて、上記移動端末機のメモリに保存された複数のドメインのうち特定ドメインにアクセスする段階と、
上記アクセスされたドメインの言語モデル及び音響モデルに基づいて入力された使用者言語を認識する段階と、
上記アクセスされた特定ドメイン及び上記認識された使用者言語に基づいて上記移動端末機の少なくとも１つのメニュー及び動作を出力する段階と
を含むことを特徴とする移動端末機の制御方法。
（項目１６）
上記移動端末機が特定メニュー又は動作中であるとき、上記音声認識をアクティブ化するための上記入力が受信されると、上記アクセスされた特定ドメインは、上記特定メニュー又は動作に対応することを特徴とする項目１５に記載の移動端末機の制御方法。
（項目１７）
上記特定メニュー又は動作は、マルチメディアメニュー又は動作、接触メニュー又は動作、メッセージメニュー又は動作、サウンドメニュー又は動作、システム手帳（ｏｒｇａｎｉｚｅｒ）メニュー又は動作、画面メニュー又は動作、ユーティリティメニュー又は動作、カメラメニュー又は動作、及び設定メニュー又は動作の少なくとも１つを含むことを特徴とする項目１６に記載の移動端末機の制御方法。
（項目１８）
上記アクセスされた特定ドメイン及び上記認識された使用者言語に基づいて、上記移動端末機の少なくとも１つのメニュー及び動作を判断する段階と、
上記判断されたメニュー及び動作が上記入力された使用者言語に正確に対応する認識率を判断する段階とをさらに含むことを特徴とする項目１５に記載の移動端末機の制御方法。
（項目１９）
所定の閾値より高い認識率を有すると判断された上記アクセスされた特定ドメイン及び上記認識された使用者言語に基づいて、上記移動端末機の全てのメニュー及び動作を上記移動端末機のディスプレイ部に出力する段階をさらに含むことを特徴とする項目１８に記載の移動端末機の制御方法。
（項目２０）
上記表示されたメニュー及び動作の１つを選択するための音声入力命令を受信する段階と、
上記入力された音声命令を認識する段階と、
上記認識された入力音声命令が正確であるか否かを問い合わせる情報を出力する段階とをさらに含むことを特徴とする項目１９に記載の移動端末機の制御方法。
（項目２１）
上記所定の閾値より高い認識率を有する上記アクセスされた特定ドメイン及び上記認識された使用者言語に基づいて、上記移動端末機の上記全てのメニュー及び動作を高い認識率から低い認識率の順に上記ディスプレイ部に出力する段階をさらに含むことを特徴とする項目１９に記載の移動端末機の制御方法。
（項目２２）
上記所定の閾値は、上記移動端末機の製造業者又は上記移動端末機の使用者により設定されることを特徴とする項目１９に記載の移動端末機の制御方法。
（項目２３）
上記メニュー又は動作のサイズ、位置、色、輝度、及びハイライトの少なくとも１つを制御して、最も高い認識率を有するメニュー又は動作を上記ディスプレイ部に区別して表示する段階をさらに含むことを特徴とする項目１９に記載の移動端末機の制御方法。
（項目２４）
上記移動端末機の特定メニュー又は動作が以前に選択された回数を判断し、上記特定メニュー又は動作が以前に選択されたと上記判断された回数に基づいて、上記特定メニュー又は動作に対する上記認識率を調整する段階をさらに含むことを特徴とする項目１８に記載の移動端末機の制御方法。
（項目２５）
上記入力を受信する段階は、
（１）上記音声認識機能をアクティブ化するためにタッチされるタッチソフトボタン、
（２）上記音声認識機能をアクティブ化するために押されるか操作されるハードボタン、
（３）上記音声認識機能をアクティブ化するためにタッチされる上記入力部に含まれるタッチスクリーンの任意の位置、
（４）上記音声認識機能をアクティブ化するために入力される衝撃音、
（５）ローカル領域無線信号又は遠隔領域無線信号、
（６）使用者からの身体情報のうち少なくとも１つにより発生する信号を受信する段階であることを特徴とする項目１５に記載の移動端末機の制御方法。
（項目２６）
上記入力された使用者言語を認識するために使用される音声又は発音情報を第１データベースに保存する段階と、
上記入力された使用者言語を認識するために使用される単語、キーワード、又は文章情報を第２データベースに保存する段階と、
上記移動端末機の各機能又はメニューに関する情報を第３データベースに保存する段階と、
上記入力された使用者言語の意味が判断中であることを使用者に通知するために出力するヘルプ情報を第４データベースに保存する段階とをさらに含むことを特徴とする項目１５に記載の移動端末機の制御方法。
（項目２７）
上記音声認識機能がアクティブ状態にあることを示すオーディオ又はビデオ情報を出力する段階をさらに含むことを特徴とする項目１５に記載の移動端末機の制御方法。
（項目２８）
上記複数のドメインは、
上記移動端末機で送受信される電子メールに対応する電子メールドメインと、上記移動端末機に割り当てられたスケジューリングイベントに対応するスケジューリングタスクドメインと、上記移動端末機での接触に対応する接触ドメインと、上記移動端末機に保存された電話番号に対応する電話帳ドメインと、上記移動端末機により提供される地図情報に対応する地図ドメインと、上記移動端末機に保存された写真に対応する写真ドメインと、上記移動端末機で送受信されるメッセージに対応するメッセージドメインと、上記移動端末機で行われるマルチメディア機能に対応するマルチメディアドメインと、上記移動端末機が接続できる外部装置に対応する外部装置ドメインと、上記移動端末機で送受信された通話に対応する通話履歴ドメインと、上記移動端末機で行われる設定機能に対応する設定ドメインのうち少なくとも２つのドメインを含むことを特徴とする項目１５に記載の移動端末機の制御方法。

（摘要）
音声認識のためのドメインを特定メニュー又はサービスに関する情報に特定して音声認識率を向上させる移動端末機及びそのメニュー制御方法を提供する。移動端末は、移動端末機で音声認識機能をアクティブ化するための入力を受信する入力部と、前記移動端末機の各メニュー又は動作に関連する複数のドメインを保存するためのメモリと、前記音声認識機能をアクティブ化するために受信された前記入力に基づいて、前記メモリ内に含まれる前記複数のドメインのうち特定ドメインにアクセスし、前記アクセスされたドメインの言語モデル及び音響モデルに基づいて使用者言語を認識し、前記アクセスされた特定ドメイン及び前記認識された使用者言語に基づいて前記移動端末機の少なくとも１つのメニュー及び動作を判断する制御部とを含む。

以下、図面を参照して本発明の実施形態について詳細に説明する。

図１は、本発明の一実施形態による移動端末機１００のブロック図である。

移動端末機１００は、移動端末機１００と無線通信システム間の無線通信、又は移動端末機１００と移動端末機１００が位置するネットワーク間の無線通信を可能にする１つ以上の構成要素を有する無線通信部１１０を含む。

例えば、無線通信部１１０は、放送チャネルで外部の放送管理エンティティから放送信号及び／又は放送関連情報を受信する放送受信モジュール１１１を含む。前記放送チャネルは、衛星チャネル及び地上波チャネルを含む。

さらに、前記放送管理エンティティは、一般的に放送信号及び／又は放送関連情報を送信するシステムを意味する。前記放送関連情報は、放送チャネル、放送番組又は放送サービス提供者に関する情報を含む。例えば、放送関連情報は、ＤＭＢ（ＤｉｇｉｔａｌＭｕｌｔｉｍｅｄｉａＢｒｏａｄｃａｓｔｉｎｇ）のＥＰＧ（ＥｌｅｃｔｒｏｎｉｃＰｒｏｇｒａｍＧｕｉｄｅ）又はＤＶＢ−Ｈ（ＤｉｇｉｔａｌＶｉｄｅｏＢｒｏａｄｃａｓｔ−Ｈａｎｄｈｅｌｄ）のＥＳＧ（ＥｌｅｃｔｒｏｎｉｃＳｅｒｖｉｃｅＧｕｉｄｅ）を含むことができる。

また、前記放送信号は、ＴＶ放送信号、ラジオ放送信号、及びデータ放送信号だけでなく、ＴＶ放送信号又はラジオ放送信号と結合した放送信号も含む。

放送受信モジュール１１１は、多様な放送システムから伝送される放送信号を受信する。例えば、前記放送システムは、ＤＭＢ−Ｔ（ＤｉｇｉｔａｌＭｕｌｔｉｍｅｄｉａＢｒｏａｄｃａｓｔｉｎｇ−Ｔｅｒｒｅｓｔｒｉａｌ）、ＤＭＢ−Ｓ（ＤｉｇｉｔａｌＭｕｌｔｉｍｅｄｉａＢｒｏａｄｃａｓｔｉｎｇ−Ｓａｔｅｌｌｉｔｅ）、ＭｅｄｉａＦＬＯ（ＭｅｄｉａＦｏｒｗａｒｄＬｉｎｋＯｎｌｙ）、ＤＶＢ−Ｈ（ＤｉｇｉｔａｌＶｉｄｅｏＢｒｏａｄｃａｓｔ−Ｈａｎｄｈｅｌｄ）、ＩＳＤＢ−Ｔ（ＩｎｔｅｇｒａｔｅｄＳｅｒｖｉｃｅｓＤｉｇｉｔａｌＢｒｏａｄｃａｓｔ−Ｔｅｒｒｅｓｔｒｉａｌ）などを含む。放送受信モジュール１１１は、マルチキャスト信号も受信できる。放送受信モジュール１１１により受信されたデータは、メモリ１６０のような適切な装置内に保存される。

無線通信部１１０は、１つ又は多数のネットワークエンティティ（例えば、基地局、ＮｏｄｅＢ）と無線信号を送受信する移動通信モジュール１１２も含む。ここで、前記無線信号は、音声、画像、マルチメディア、制御シグナリング、及びデータなどを示す。

移動端末機１００のインターネット接続をサポートするための無線インターネットモジュール１１３も含まれる。無線インターネットモジュール１１３は、移動端末機１００に内蔵又は外付けされる。

無線通信部１１０は、近距離通信のための近距離通信モジュール１１４も含む。近距離通信技術としては、ブルートゥース、ＲＦＩＤ（ＲａｄｉｏＦｒｅｑｕｅｎｃｙＩｄｅｎｔｉｆｉｃａｔｉｏｎ）、赤外線通信（ＩｒＤＡ，ｉｎｆｒａｒｅｄＤａｔａＡｓｓｏｃｉａｔｉｏｎ）、ＵＷＢ（ＵｌｔｒａＷｉｄｅｂａｎｄ）、ＺｉｇＢｅｅなどが利用できる。

無線通信部１１０は、移動端末機１００の位置を確認又は取得するための位置情報モジュール１１５も含む。位置情報モジュール１１５は、関連衛星、ネットワーク構成要素、及びこれらの組み合わせと連動するＧＰＳ（ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）構成要素を利用して実現される。

さらに、図１に示すように、移動端末機１００は、移動端末機１００にオーディオ又はビデオ信号を提供するＡ／Ｖ（Ａｕｄｉｏ／Ｖｉｄｅｏ）入力部１２０も含む。図に示すように、Ａ／Ｖ入力部１２０は、カメラ１２１及びマイク１２２を含む。カメラ１２１は、静止画像又は動画像などの画像フレームを受信及び処理する。また、マイク１２２は、前記端末機が通話モード、録音モード、及び音声認識モードのような特定モードにあるとき、外部の音響信号を受信した後、処理してデジタルデータに変換する。移動端末機１００、特に、Ａ／Ｖ入力部１２０は、前記外部の音響信号を受信する過程で発生する雑音を除去するための多様な雑音除去アルゴリズムを含む。また、Ａ／Ｖ入力部１２０により生成されたデータは、メモリ１６０内に保存され、出力部１５０により活用されるか、無線通信部１１０の１つ又は複数のモジュールを介して伝送される。必要に応じて、２つ又はそれ以上のマイク及び／又はカメラが利用される。

移動端末機１００は、関連入力装置の使用者操作に対応する入力データを発生させるユーザ入力部１３０も含む。ユーザ入力部１３０は、キーパッド、ドームスイッチ、タッチパッド（静圧／静電）、ジョグホイール、及びジョグスイッチを含む。以下、ユーザ入力部１３０がタッチスクリーンディスプレイと連動するタッチパッドとして実現される場合の例について説明する。

センシング部１４０も移動端末機１００内に含まれて移動端末機１００の多様な状態測定を提供する。例えば、センシング部１４０は、移動端末機１００の開閉状態、移動端末機１００の構成要素（例えば、ディスプレイ及びキーボード）の相対的位置、移動端末機１００の構成要素又は移動端末機１００の位置の変化、移動端末機１００への使用者の接触の有無、移動端末機１００の方位又は加速／減速などを検出する。

例えば、移動端末機１００がスライド型である場合、センシング部１４０は、移動端末機１００の摺動部が開状態であるか閉状態であるかを感知できる。他の例として、センシング部１４０は、電源供給部１９０による電源供給の有無、インタフェース部１７０と外部装置間の結合又は接続の有無などを感知する。

また、インタフェース部１７０は、移動端末機１００を外部装置に結合する役割を果たす。前記外部装置は、有／無線ヘッドホン、外部充電器、電源供給器、データ（例えば、オーディオ、ビデオ、写真など）を保存するための保存装置、イヤホン、及びマイクなどを含む。さらに、インタフェース部１７０は、有／無線データポート、カードソケット（例えば、メモリカード、ＳＩＭ（ＳｕｂｓｃｒｉｂｅｒＩｄｅｎｔｉｔｙＭｏｄｕｌｅ）カード、ＵＩＭ（ＵｓｅｒＩｄｅｎｔｉｔｙＭｏｄｕｌｅ）カード、ＲＵＩＭ（ＲｅｍｏｖａｂｌｅＵｓｅｒＩｄｅｎｔｉｔｙＭｏｄｕｌｅ）カードなど）、オーディオ入／出力ポート及びビデオ入／出力ポートを使用して構成される。

出力部１５０は、一般的に移動端末機１００の出力要件をサポートする多様な構成要素を含む。移動端末機１００は、移動端末機１００に関する情報を視覚的に表示するディスプレイモジュール１５１を含む。例えば、移動端末機１００が通話モードである場合、ディスプレイモジュール１５１は、一般的に発信、通話、及び終了に関する情報を含むユーザインタフェース、又はグラフィックユーザインタフェースを提供する。他の例として、移動端末機１００がビデオ通話モード又は撮影モードである場合、ディスプレイモジュール１５１は、前記モードに関連する映像を付加的に又は選択的に表示する。

さらに、ディスプレイモジュール１５１は、好ましくはタッチパッドのような入力装置と連動するタッチスクリーンも含む。このような構成によりディスプレイモジュール１５１が入力装置及び出力装置として作動できる。また、ディスプレイモジュール１５１は、液晶ディスプレイ（ＬＣＤ）、薄膜トランジスタ液晶ディスプレイ（ＴＦＴ−ＬＣＤ）、有機発光ダイオード（ＯＬＥＤ）、フレキシブルディスプレイ、及び３次元ディスプレイを含むディスプレイ技術を利用して実現される。

移動端末機１００は、ディスプレイモジュール１５１を２つ以上備えることもできる。２つのディスプレイが備えられた例として、１つは、内部ディスプレイ（移動端末機が開状態にあるときに見える）であり、他の１つは、外部ディスプレイ（移動端末機が開状態及び閉状態にあるときに見える）である。

図１は、移動端末機１００の音響出力要件をサポートする音響出力モジュール１５２を備える出力部１５０を示す。音響出力モジュール１５２は、１つ又は複数のスピーカー、ブザー、他の音響生成装置、及びこれらの組み合わせを利用して実現される。さらに、音響出力モジュール１５２は、呼受信モード、呼発信モード、録音モード、音声認識モード、及び放送受信モードを含む多様なモードで動作する。音響出力モジュール１５２は、特定機能（例えば、呼受信、メッセージ受信、及びエラー）に関連する音響を出力する。また、出力部１５０は、移動端末機１００に関連する特定イベントの発生を通知するための信号を出力するアラーム部１５３を備える。前記アラームイベントの例としては、呼受信、メッセージ受信、ユーザ入力の受信がある。前記出力の例として、使用者に提供される振動のような触感がある。例えば、アラーム部１５３は、呼又はメッセージを受信する移動端末機１００に反応して振動するように構成される。

他の例として、移動端末機１００におけるユーザ入力の受信に反応してアラーム部１５３が振動を発生することにより、触感フィードバックメカニズムを提供する。さらに、出力部１５０の構成要素により提供される前記多様な出力は、個別に行われるか、又は前記構成要素の任意の組み合わせを利用して行われる。

メモリ１６０は、移動端末機１００の処理、制御、及び保存要件をサポートするための多様なデータを保存するために使用される。前記データの例として、移動端末機１００で動作するアプリケーションのためのプログラム指示、通話履歴（ｃａｌｌｈｉｓｔｏｒｙ）、接触データ、電話帳データ、メッセージ、静止画像、動画像などがある。

図１に示すメモリ１６０は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＳＲＡＭ（ＳｔａｔｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＲＯＭ（Ｒｅａｄ−ＯｎｌｙＭｅｍｏｒｙ）、ＥＥＰＲＯＭ（ＥｌｅｃｔｒｉｃａｌｌｙＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄ−ＯｎｌｙＭｅｍｏｒｙ）、ＥＰＲＯＭ（ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄ−ＯｎｌｙＭｅｍｏｒｙ）、ＰＲＯＭ（ＰｒｏｇｒａｍｍａｂｌｅＲｅａｄ−ＯｎｌｙＭｅｍｏｒｙ）、磁気メモリ、フラッシュメモリ、磁気もしくは光ディスク、カード型メモリ、又はその他の同様のメモリもしくはデータ記憶装置を含む適切な揮発性及び不揮発性メモリもしくは記憶装置のいずれか又は組み合わせを利用して実現される。

移動端末機１００は、移動端末機１００の全般的な動作を典型的に制御する制御部１８０も含む。例えば、制御部１８０は、音声通話、データ通信、インスタントメッセージ通信、ビデオ通話、カメラ機能、及び録音機能に関連する制御及び処理を行う。図１に示すように、制御部１８０は、マルチメディア再生のためのマルチメディアモジュール１８１を備える。マルチメディアモジュール１８１は、制御部１８０の一部として構成されるか、制御部１８０と別途に実現される。

電源供給部１９０は、移動端末機１００の多様な構成要素により利用される電源を供給する。前記電源としては、外部の電源、内部の電源、又はこれらの組み合わせが利用できる。

図２は、本発明の一実施形態による移動端末機１００の前面斜視図である。図２に示すように、移動端末機１００は、第１ボディー２００と、第１ボディー２００に対して摺動可能に構成された第２ボディー２０５とを含む。図１に示すユーザ入力部１３０は、ファンクションキー２１０のような第１入力部、キーパッド２１５のような第２入力部、及びサイドキー２４５のような第３入力部を含む。

ファンクションキー２１０は、第１ボディー２００に関連し、キーパッド２１５は、第２ボディー２０５に関連する。キーパッド２１５は、使用者が電話をかけること、テキスト又はマルチメディアメッセージを準備すること、移動端末機１００を動作させることなどを可能にする多様なキー（例えば、数字、文字、及びシンボル）を含む。第１ボディー２００は、第２ボディー２０５に対して摺動して開位置又は閉位置となる。閉状態において、第１ボディー２００は、キーパッド２１５が第１ボディー２００により完全に隠れるように第２ボディー２０５の上部に位置する。開状態において、使用者は、ディスプレイモジュール１５１及びファンクションキー２１０だけでなく、キーパッド２１５にアクセスできる。ファンクションキー２１０は、使用者による開始、停止、及びスクロールのような命令の入力を容易にする。

移動端末機１００は、待ち受けモード（例えば、呼又はメッセージ受信、ネットワーク制御シグナリングの受信及び応答ができるモード）、又は通話モードで動作する。移動端末機１００は、閉状態のときは主に待ち受けモードであり、開状態のときは主に通話モードであるが、使用者の希望により他のモードに移行できる。

第１ボディー２００は、第１ケース２２０と第２ケース２２５とからなり、第２ボディー２０５は、第１ケース２３０と第２ケース２３５とからなる。第１ケース２２０、２３０及び第２ケース２２５、２３５は、合成樹脂を射出して形成することもでき、ステンレススチール（ＳＴＳ）又はチタン（Ｔｉ）などの金属材質で形成することもできる。

第１ボディー２００と第２ボディー２０５の一方又は両方の第１ケース及び第２ケース間には、１つ又は複数の中間ケースを配置することもできる。第１ボディー２００及び第２ボディー２０５は、移動端末機１００の動作をサポートするために利用される電子部品を内蔵できるサイズに形成される。

第１ボディー２００は、カメラ１２１と、スピーカーとして実現され、ディスプレイモジュール１５１と相対的に位置する音響出力モジュール１５２とを含む。カメラ１２１は、第１ボディー２００に対して選択的に配置できるように（例えば、回転、スイベルなど）構成できる。

ファンクションキー２１０は、ディスプレイモジュール１５１の下側に隣接して位置する。前述したように、ディスプレイモジュール１５１は、ＬＣＤ又はＯＬＥＤで実現できる。ディスプレイモジュール１５１は、タッチパッドがレイヤ構造で重なったタッチスクリーンにより実現されて、使用者の前記タッチスクリーンとの接触（例えば、指、スタイラスなど）に反応して信号を生成する。

第２ボディー２０５は、キーパッド２１５に隣接したマイク１２２と、第２ボディー２０５の側面に沿って位置し、ユーザ入力部の一種類であるサイドキー２４５と含む。サイドキー２４５は、ホットキーとして実現され、移動端末機１００の特定機能と連係する。図２に示すように、インタフェース部１７０は、サイドキー２４５に隣接し、バッテリー形態の電源供給部１９０は、第２ボディー２０５の下部に位置する。

図３は、図２に示す移動端末機１００の後面斜視図である。図３を参照すると、第２ボディー２０５は、カメラ１２１と、カメラ１２１に関連するフラッシュ２５０及びミラー２５５とを含む。フラッシュ２５０は、第２ボディー２０５のカメラ１２１と連動して動作し、ミラー２５５は、使用者がカメラ１２１を利用してセルフ撮影をするとき、使用者の顔などを映してカメラ１２１の位置づけを容易にする。第２ボディー２０５のカメラ１２１は、図２に示すように、第１ボディー２００のカメラ１２１とは反対方向に向ける。

第１ボディー２００及び第２ボディー２０５の各カメラ１２１は、同一又は異なる容量を有する。例えば、第１ボディー２００のカメラ１２１は、第２ボディー２０５のカメラ１２１より低い解像度で動作する。このような構成は、例えば、逆方向リンク周波数容量が限定されるビデオ会議通話時に効果的である。第２ボディー２０５のカメラ１２１の高い解像度は、後に高画質の写真を得るのに有用である。

第２ボディー２０５は、スピーカーとして実現され、第２ボディー２０５の上部に位置する音響出力モジュール１５２も含む。第１ボディー２００及び第２ボディー２０５の前記音響出力モジュールは、連動してステレオ出力を提供する。前記音響出力モジュールの１つ又は２つは、スピーカーフォンとして動作するように構成できる。

移動端末機１００は、第２ボディー２０５の上端に位置する放送信号受信用アンテナ２６０を含む。アンテナ２６０は、放送受信モジュール１１１（図１）と連動して機能する。必要に応じて、アンテナ２６０は、固定されるか、第２ボディー２０５の内部に収まるように構成される。第１ボディー２００の後面は第２ボディー２０５の前面に位置する該当スライドモジュールと摺動可能に結合するスライドモジュール２６５を含む。

図示された第１ボディー２００及び第２ボディー２０５の多様な構成要素の配置は必要に応じて変更できる。１つのボディーの一部又は全ての構成要素を他のボディーに実現することもできる。前記構成要素の位置及び相対的位置決めは、図示した位置とは異なってもよい。

図１〜図３に示す移動端末機１００は、有無線通信システム及び衛星通信システムを含み、フレーム又はパケットでデータを伝送する通信システムで動作するように構成される。このような通信システムは、他の無線インタフェース及び／又は物理層を活用する。

例えば、通信システムにより利用可能な無線インタフェースとしては、周波数分割多元接続（ＦｒｅｑｕｅｎｃｙＤｉｖｉｓｉｏｎＭｕｌｔｉｐｌｅＡｃｃｅｓｓ：ＦＤＭＡ）、時分割多元接続（ＴｉｍｅＤｉｖｉｓｉｏｎＭｕｌｔｉｐｌｅＡｃｃｅｓｓ：ＴＤＭＡ）、符号分割多元接続（ＣｏｄｅＤｉｖｉｓｉｏｎＭｕｌｔｉｐｌｅＡｃｃｅｓｓ：ＣＤＭＡ：）、ユニバーサルモバイルテレコミュニケーションシステム（ＵｎｉｖｅｒｓａｌＭｏｂｉｌｅＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓＳｙｓｔｅｍｓ：ＵＭＴＳ）（特に、ＬＴＥ（ＬｏｎｇＴｅｒｍＥｖｏｌｕｔｉｏｎ）、移動通信用グローバルシステム（ＧｌｏｂａｌＳｙｓｔｅｍｆｏｒＭｏｂｉｌｅＣｏｍｍｕｎｉｃａｔｉｏｎｓ：ＧＳＭ）などが用いられる。以下、説明の便宜のために、ＣＤＭＡに限定して説明する。しかしながら、本発明は、ＣＤＭＡ無線通信システムを含む全ての通信システムに適用できる。

図４に示すように、ＣＤＭＡ無線通信システムは、複数の移動端末機１００、複数の基地局（ＢＳ）２７０、基地局制御部（ＢａｓｅＳｔａｔｉｏｎＣｏｎｔｒｏｌｌｅｒｓ：ＢＳＣｓ）２７５、及び移動スイッチングセンター（ＭｏｂｉｌｅＳｗｉｔｃｈｉｎｇＣｅｎｔｅｒ：ＭＳＣ）２８０を含む。

ＭＳＣ２８０は、公衆交換電話網（ＰｕｂｌｉｃＳｗｉｔｃｈｅｄＴｅｌｅｐｈｏｎｅＮｅｔｗｏｒｋ：ＰＳＴＮ）２９０とインタフェースで接続されるように構成され、ＢＳＣｓ２７５ともインタフェースで接続されるように構成される。ＢＳＣｓ２７５は、バックホールライン（ｂａｃｋｈａｕｌｌｉｎｅ）で基地局２７０と接続される。前記バックホールラインは、例えば、Ｅ１／Ｔ１、ＡＴＭ、ＩＰ、ＰＰＰ、ＦｒａｍｅＲｅｌａｙ、ＨＤＳＬ、ＡＤＳＬ又はｘＤＳＬなどのインタフェースの少なくとも１つによって構成される。さらに、図４に示す前記システムは、複数のＢＳＣｓ２７５を含む。

それぞれの基地局２７０は、少なくとも１つのセクターを含み、各セクターは、全方向性アンテナ又は基地局２７０から放射状の特定方向を指すアンテナを含む。また、各セクターは、ダイバーシティ受信のために２つのアンテナを含む。それぞれの基地局２７０は、複数の周波数割り当てをサポートするように構成され、各周波数割り当ては、特定スペクトル（例えば、１．２５ＭＨｚ、５ＭＨｚ）を有する。

セクターと周波数割り当ての交差は、ＣＤＭＡチャネルと言われる。基地局２７０は、基地局送受信サブシステム（ＢａｓｅＳｔａｔｉｏｎＴｒａｎｓｃｅｉｖｅｒＳｕｂｓｙｓｔｅｍ：ＢＴＳｓ）とも言われる。場合によっては、「基地局」という用語は、１つのＢＳＣ２７５及び少なくとも１つの基地局２７０を合わせたものを意味する。

基地局２７０はまた、「セルサイト」を示すこともできる。又は、特定基地局２７０のそれぞれのセクターをセルサイトという。地上波ＤＭＢ（ｄｉｇｉｔａｌｍｕｌｔｉｍｅｄｉａｂｒｏａｄｃａｓｔｉｎｇ）送信部２９５は、システム内で動作する移動端末機１００に放送する。

移動端末機１００の放送用モジュール１１１（図１を参照）は、ＤＭＢ送信部２９５により伝送される放送信号を受信するために備えられる。前述したように、同様の配置が他のタイプのブロードキャスト及びマルチキャストシグナリングのために実現できる。

さらに、図４は、複数のＧＰＳ衛星３００を示す。衛星３００は、複数の移動端末機１００の一部又は全ての位置把握を容易にする。図４においては２つの衛星を示すが、位置情報は、それより多数の衛星によっても、それより少数の衛星によっても取得できる。

移動端末機１００の位置情報モジュール１１５（図１を参照）は、所望の位置情報を取得するために衛星３００と連動する。しかしながら、ＧＰＳ追跡技術に加えて又はＧＰＳ追跡技術の代わりに利用される追跡技術のような他のタイプの位置検出技術が代案として実現されてもよい。ＧＰＳ衛星３００の一部又は全ては、選択的に又は追加的に衛星ＤＭＢ伝送を提供するように構成される。

さらに、無線通信システムが一般的に動作する過程で、基地局２７０は、多様な移動端末機１００から逆方向リンク信号のセットを受信する。ここで、移動端末機１００は、呼接続中であるか、メッセージ送受信中であるか、又は他の通信動作を実行中である。

特定基地局２７０により受信された逆方向リンク信号のそれぞれは、特定基地局２７０内で処理され、前記処理の結果として生成されたデータは、関連ＢＳＣ２７５に送信される。ＢＳＣ２７５は、基地局２７０間のソフトハンドオフを含む呼リソース割り当て機能及び移動性管理機能を提供する。

また、ＢＳＣ２７５は、前記受信したデータをＭＳＣ２８０に送信し、ＭＳＣ２８０は、ＰＳＴＮ２９０とのインタフェース接続のために追加的なルーティングサービスを提供する。ＰＳＴＮ２９０は、ＭＳＣ２８０にインタフェース接続し、ＭＳＣ２８０は、ＢＳＣ２７５にインタフェース接続する。ＢＳＣ２７５は、移動端末機１００に順方向リンク信号のセットを伝送するようにＢＳ２７０を制御する。

以下の説明において、前述したように構成された移動端末機１００に適用可能な制御方法について様々な実施形態に基づいて説明する。しかしながら、下記の実施形態は、独立して又は互いに組み合わせて実現することができる。さらに、以下の説明において、ディスプレイモジュール１５１は、タッチスクリーンを含む。また、前記タッチスクリーン又は前記ディスプレイのスクリーンは、参照番号「４００」で示される。

本発明の実施形態において、前記移動端末機は、音声命令認識のための参照として用いられるデータベースのドメイン（又は、情報検索範囲）を特定メニュー又はサービスに関連するドメインに特定する。従って、音声命令に対する認識率が向上し、前記移動端末機により利用されるリソースの総量が減少する。

さらに、前記音声命令認識のための参照として用いられるデータベースのドメインは、前記移動端末機の環境設定メニューにより特定できる。また、音声認識機能がアクティブ化すると、前記特定されたドメインが自動で適用される。

以下、音声命令認識のためのデータベースの予め設定されたドメインが、現在ディスプレイモジュール１５１に表示されたメニュー、又は前記メニューのうち１つのメニューのサブメニューに関する情報を含むと仮定する。

図５は、本発明の実施形態による移動端末機の音声命令を利用したメニュー制御方法を示すフローチャートである。以下の説明において図１も参照する。図５に示すように、制御部１８０は、前記音声認識機能がアクティブ化しているか否かを判断する（Ｓ１０１）。

さらに、前記音声認識機能は、使用者が前記移動端末機のハードウェアボタン、又はディスプレイモジュール１５１に表示されたソフトウェアボタンを選択することによりアクティブ化される。また、前記使用者は、ディスプレイモジュール１５１に表示された特定メニューを操作して前記音声認識機能をアクティブ化することもできる。また、前記音声認識機能は、使用者による特定音もしくは音響効果の発生、近距離もしくは遠距離無線信号、又は身振りや手振りなどの使用者の身体動作情報によりアクティブ化することもある。

より詳しくは、前記特定音又は音響効果は、特定レベル以上の衝撃音を含む。前記特定音又は音響効果は、音響レベル検出アルゴリズムを利用して検出される。さらに、前記音響レベル検出アルゴリズムは、音声認識アルゴリズムより簡単であるので、前記移動端末機のリソースの消耗を低減できる。また、前記音響レベル検出アルゴリズム（又は、回路）は、前記音声認識アルゴリズム（又は、回路）と別途に実現されるか、前記音声認識アルゴリズムの一部機能を特定するように実現される。

さらに、前記無線信号は、無線通信部１１０により受信され、前記使用者の手振り又は身振りは、センシング部１４０により受信される。従って、本発明の一実施形態において、無線通信部１１０、ユーザ入力部１３０、及びセンシング部１４０は、信号入力部と言われる。前記音声認識機能は、同様の方法で終了される。

前記使用者の前記音声認識機能に対する物理的アクティブ化は、使用者が前記移動端末機を制御するための音声命令を使用しようとすることをより認識できるため、有利である。すなわち、前記使用者は、まず前記移動端末機の物理的操作を行い、前記移動端末機に音声命令又は指示を入力しようとすることを直感的に認識するため、よりはっきり又はゆっくり話すことにより特定機能をアクティブ化する。従って、前記使用者がよりはっきり又はゆっくり話すため、例えば、前記音声指示を正確に認識する可能性が高くなる。すなわち、本発明の一実施形態において、前記音声認識機能は、前記移動端末機に対して話して前記音声認識機能をアクティブ化するのではなく、前記移動端末機のボタンを操作してアクティブ化する。

制御部１８０は、前記使用者が特定ボタン又は前記タッチスクリーンの一部をタッチした回数、及び前記使用者が前記特定ボタン又は前記タッチスクリーンの一部をタッチしていた時間に基づいて、前記音声認識機能のアクティブ化を開始又は終了する。前記使用者は、制御部１８０が本発明により提供される適切なメニューオプションを利用して前記音声認識機能をアクティブ化する方法を設定することもできる。例えば、前記使用者は、（１）前記音声アクティブ化ボタンが選択された回数（Ｘ）に基づく音声認識アクティブ化の設定、（２）前記音声アクティブ化ボタンが選択された時間（Ｘ）に基づく音声認識アクティブ化の設定、（３）前記ボタンＸ、Ｙが選択されたときの音声認識アクティブ化の設定などを含む前記移動端末のメニューオプションを選択できる。次に、前記使用者は、前記音声アクティブ化機能がアクティブ化していると制御部１８０が判断する方法を可変的に設定するために、前記Ｘ及びＹ値を入力できる。従って、本発明の一実施形態によれば、前記使用者が使用者自身の移動端末機の前記音声アクティブ化機能に積極的に関与することにより、制御部１８０が前記使用者の音声命令に対応する正確な機能を判断する可能性が向上する。これにより、前記使用者は、使用者の必要に応じて前記音声アクティブ化機能を調節できる。

制御部１８０は、前記指定されたボタンがタッチ又は選択されると、前記音声認識機能のアクティブ状態を維持し、前記指定されたボタンが解除されると、前記音声認識機能を停止する。また、制御部１８０は、前記指定されたボタンがタッチ又は選択された後、前記音声認識機能のアクティブ化を所定時間維持することができ、前記所定時間が経過すると、前記音声認識機能を停止又は終了することができる。他の実施形態において、制御部１８０は、前記音声認識機能の前記アクティブ状態が維持される間、前記メモリ１６０に受信された音声命令を保存することができる。

図５に示すように、前記音声命令の意味を認識するための参照として用いられるデータベースのドメインは、前記移動端末機の特定機能又はメニューに関する情報に特定される（Ｓ１０２）。例えば、前記データベースの特定されるドメインは、現在ディスプレイモジュール１５１に表示されるメニュー、又は前記表示されたメニューのうち１つのメニューのサブメニューに関する情報である。さらに、前記データベースのドメインが特定されるため、前記入力された音声命令の認識率が向上する。前記ドメインの例としては、電子メールドメイン、受信された呼ドメイン、及びマルチメディアドメインなどがある。

前記サブメニューに関する情報は、データベースにデータとして構成される。例えば、前記情報は、キーワードの形態で構成され、複数の情報が１つの機能又はメニューに対応することもできる。また、前記データベースは、情報の特性によって複数で構成でき、メモリ１６０に保存される。

また、前記データベースの情報は、学習過程により更新できる。また、前記それぞれのデータベースの各ドメインは、音声命令の認識率の向上のために、現在出力されている機能又はメニューに関するドメインに特定できる。また、前記ドメインは、メニューの段階の進行に応じて変更することもできる。

前記音声認識機能がアクティブ化され（Ｓ１０１でＹｅｓ）、前記ドメインが特定されると（Ｓ１０２）、制御部１８０は、前記使用者が音声命令を入力したかを判断する（Ｓ１０３）。制御部１８０は、前記使用者が音声命令を入力したと判断されると（Ｓ１０３でＹｅｓ）、特定データベースに基づいてマイク１２２から入力された音声命令又は指示の文脈及び内容を分析して前記音声命令の意味を判断する（Ｓ１０４）。

制御部１８０は、前記アクセスされたドメインの言語モデル及び音響モデルに基づいて前記音声指示又は命令の意味を判断できる。具体的には、前記言語モデルは、単語自体に関連し、前記音響モデルは、前記単語の話し方に対応する（例えば、話された単語又は句の周波数成分）。前記言語モデル及び音響モデルを移動端末機１００の特定ドメイン及び状態と共に利用すると、制御部１８０は、前記入力された音声命令又は指示の意味を効果的に判断できる。

また、制御部１８０は、前記入力された音声命令をメモリ１６０に保存するとき、前記使用者が前記音声認識機能のアクティブ化を解除すると、直ちに前記音声命令の意味を判断するための過程を開始するか、前記音声命令が入力されると同時に前記音声アクティブ化機能を行う。

さらに、前記音声命令が完全に入力されなかった場合（Ｓ１０３でＮｏ）、制御部１８０は、他の機能を依然として行うことができる。例えば、前記使用者がメニューオプションをタッチして他の機能を行ったり、前記移動端末機のボタンを押した場合（Ｓ１０９でＹｅｓ）、制御部１８０は、該当選択された機能を行う（Ｓ１１０）。

制御部１８０は、前記入力された音声命令の意味を判断した後（Ｓ１０４）、前記意味の結果値を出力する（Ｓ１０５）。前記結果値は、前記判断された意味に対応する機能又はサービスに関連するメニューを行うための、又は、移動端末機の特定構成要素を制御するための制御信号を含む。前記結果値は、前記認識された音声命令に関する情報を表示するためのデータを含む。

また、制御部１８０は、前記出力された結果値が正確であるか否かの確認を使用者に要求する（Ｓ１０６）。例えば、制御部１８０は、前記音声命令の認識率が低いか、前記音声命令が複数の意味を有すると判断される場合、各意味に関連する複数のメニューを出力した後、前記使用者により選択されたメニューを行うことができる（Ｓ１０７）。また、制御部１８０は、認識率の高い特定メニューを行うか否かを使用者に聞いた後、前記使用者の選択又は応答によって該当する機能又はメニューを実行又は表示することもできる。

さらに、制御部１８０は、前記特定メニュー又はオプションを選択するために使用者に問い合わせる音声メッセージを出力することができる（例えは、フォトアルバムメニューを行いますか？はいかいいえで答えてください）。次に、制御部１８０は、前記使用者の応答に基づいて前記特定メニュー又はオプションに対応する機能を行ったり、行わなかったりする。前記使用者が特定時間応答しないと（例えば、５秒）、制御部１８０は、前記特定メニュー又はオプションを直ちに行うこともできる。すなわち、前記使用者から応答がない場合、制御部１８０は、前記無応答を肯定応答であると判断して前記機能又はメニューを自動で行う。

さらに、前記使用者は、音声（例えば、はい又はいいえ）又は他の入力手段（例えば、ハードウェアボタン又はソフトウェアボタン、タッチパッド）を利用して制御部１８０からの問い合わせに応答することもできる。さらに、段階Ｓ１０６で、前記使用者からの応答が否定的である場合（Ｓ１０６でＮｏ）、すなわち、前記音声命令の意味が正確に判断されない場合、制御部１８０は、エラー処理過程をさらに行う（Ｓ１０８）。

すなわち、前記エラー処理過程は、音声命令の入力を再び受信することにより行われるか、特定レベル以上の認識率を有する複数のメニュー又は近い意味に判断される複数のメニューを表示することにより行われる。その後、前記使用者は、前記複数のメニューの１つを選択することができる。また、特定レベル以上の認識率を有する機能又はメニューの数が特定数（例えば、２つ）未満である場合、制御部１８０は、前記該当機能又はメニューを自動で行うことができる。

図６Ａは、本発明の一実施形態による移動端末機の音声認識機能をアクティブ化する方法を説明するための図である。ディスプレイスクリーン４１０に示すように、前記使用者は、ソフトボタン４１１をタッチして音声認識機能をアクティブ化することができる。また、前記使用者は、前記ソフトボタン４１１を解除して前記音声認識機能を終了することができる。より詳しくは、前記使用者は、前記ソフトボタン４１１をタッチして前記音声認識機能をアクティブ化し、前記音声命令が完了するまで、ソフトボタン４１１又はハードボタン４１２を継続してタッチするようにしてもよい。すなわち、前記使用者は、前記音声命令が完了すると、ソフトボタン４１１又はハードボタン４１２を解除することができる。従って、制御部１８０は、前記音声命令が入力された時点と完了した時点を知ることができる。前述したように、前記使用者は、このような判断を直接することができるため、前記入力された音声命令の解釈の正確度を高めることができる
例えば、制御部１８０は、前記使用者がソフトボタン４１１を最初にタッチすると、前記音声アクティブ化の開始を認識し、その後、前記使用者がソフトボタン４１１を２回タッチすると、前記音声指示の完了を認識するように構成することもできる。他の選択方法も可能である。さらに、図６Ａのディスプレイスクリーン４１０に示すように、前記音声アクティブ化及び非アクティブ化は、ソフトボタン４１１を使用するのではなく、前記移動端末機のハードボタン４１２を操作して行うことができる。

さらに、ディスプレイスクリーン４１０に示すソフトボタン４１１は、前記使用者が前記音声認識機能をアクティブ化／非アクティブ化するために押圧又は解除する単一のソフトボタンであってもよく、選択されると「１．音声アクティブ化の開始、２．音声アクティブ化の停止」のようなメニューリストを生成するメニューボタンであってもよい。例えば、ソフトボタン４１１を待ち受け状態中に表示することもできる。

他の例において、ディスプレイスクリーン４２０に示すように、前記使用者は、前記スクリーンの任意の位置をタッチして前記音声認識機能をアクティブ化及び非アクティブ化することができる。ディスプレイスクリーン４３０は、前記使用者が特定レベル以上の音響や音響効果を生成することにより前記音声認識機能をアクティブ化及び非アクティブ化するさらに他の例を示す。例えば、前記使用者は、衝撃音を生成するために手をたたくこともある。

従って、本発明の一実施形態によれば、前記音声認識機能は、２つのモードで実現できる。例えば、前記音声認識機能は、所定レベル以上の特定音響や音響効果を検出するための第１モード、及び音声命令を認識して前記音声命令の意味を判断するための第２モードで実現される。前記音響又は音響効果が前記第１モードで所定レベル以上である場合、前記第２モードがアクティブ化して前記音声命令を認識する
ディスプレイスクリーン４４０は、前記使用者が前記音声認識機能をアクティブ化及び非アクティブ化するためのさらに他の方法を示す。本例において、制御部１８０は、前記音声アクティブ化機能を開始及び停止するための前記使用者の身体動作を解釈するように構成される。例えば、ディスプレイスクリーン４４０に示すように、制御部１８０は、前記ディスプレイ側への前記使用者の手を移動を前記音声認識機能をアクティブ化する指示と解釈し、前記ディスプレイから前記使用者の手が離隔する移動を前記音声アクティブ化機能を終了させる指示と解釈する。前記音声認識機能を開始及び停止させるために近距離又は遠距離無線信号を使用することもできる。

従って、本発明の一実施形態によれば、前記音声アクティブ化機能が開始されて停止されるため、前記音声認識機能が継続して行われない。すなわち、前記音声認識機能が継続的に前記アクティブ状態を維持する場合、前記移動端末機のリソースの量は本発明の前記実施形態に比べて増加する。

さらに、図５を参照して説明したように、前記音声認識機能がアクティブ化すると、制御部１８０は、音声命令認識のための参照として利用される特定データベースのドメインをディスプレイ１５１上のメニューリストに関連するドメインに特定する。次に、特定メニューが前記メニューリストから選択されるか実行される場合、前記データベースの前記ドメインは、前記特定メニューの前記選択されたメニュー又は下位メニューに関する情報に特定される。

さらに、前記特定メニューが音声命令又はタッチ入力により選択されるか実行される場合、制御部１８０は、前記特定メニューの下位メニューに関するヘルプ情報を音声メッセージ、ポップアップウィンドウ、又はバルーンヘルプの形態で出力することができる。例えば、図６Ｂに示すように、前記使用者がタッチ又は音声動作により「マルチメディアメニュー」を選択すると、制御部１８０は、前記「マルチメディアメニュー」の前記下位メニュー（例えば、放送、カメラ、テキストビューア、ゲームなど）に関する情報をバルーンヘルプ情報４４１として表示する。あるいは、制御部１８０は、前記ヘルプ情報を含む音声信号（Ｂｒｏａｄｃａｓｔｉｎｇ，ｃａｍｅｒａ，ｔｅｘｔｂｉｅｗｅｒ，ａｎｄｇａｍｅａｒｅｓｅｌｅｃｔａｂｌｅ：放送、カメラ、テキストビューア、ゲームが選択可能）４４２を出力することができる。次に、前記使用者は、音声命令を利用するか、タッチ動作により、前記表示されたヘルプオプションの１つを選択することができる。

図６Ｃは、使用者が自分の身体動作（本例においては、使用者の手振り）を利用してメニューアイテムを選択する実施形態を示す。より詳しくは、前記使用者が使用者の指をメニューアイテム４４３の近くに移動すると、制御部１８０は、メニュー４４３に関連する下位メニュー４４４を表示する。制御部１８０は、例えば、センシング部１４０により前記使用者の身体動作情報を認識することができる。さらに、前記表示されたヘルプ情報は、透明度又は輝度が前記使用者の距離によって制御されるように表示できる。すなわち、前記使用者の手が近くなるほど前記表示されたアイテムがさらに強調されるようにすることができる。

前述したように、制御部１８０は、様々な方法に基づいて前記音声認識機能の開始及び停止を判断するように構成できる。例えば、前記使用者は、ソフト又はハードボタンを選択／操作することができ、前記タッチスクリーン上の任意の位置をタッチすることができる。制御部１８０は、前記音声認識機能のアクティブ化を所定時間維持することもでき、前記所定時間の経過後、前記アクティブ化を自動で終了することもできる。また、制御部１８０は、特定ボタンの入力又はタッチ動作が行われたときにのみ前記アクティブ化を維持し、前記入力が解除されると、前記アクティブ化を自動で終了することができる。制御部１８０は、前記音声命令が所定時間の間入力されない場合、前記アクティブ化過程を終了することもできる。

図７Ａは、本発明の一実施形態による移動端末機で音声命令を認識する方法を示すフローチャートである。図７Ａを参照すると、前記音声認識機能がアクティブ化した場合、制御部１８０は、音声命令認識のための参照として用いられるデータベースのドメインをディスプレイ１５１上に表示されるメニュー又は前記メニューの下位メニューに関連するドメインに特定する（Ｓ２０１）。また、前記使用者は、正確なメニュー名を利用するか、自然言語（例えば、英語）を利用して、前記音声命令を入力する（Ｓ２０２）。

次に、制御部１８０は、メモリ１６０に前記入力された音声命令を保存する（Ｓ２０３）。さらに、前記音声命令が特定化されたドメイン下に入力される場合、制御部１８０は、音声認識アルゴリズムを利用して、前記特定化されたドメインに基づいて前記音声命令の文脈及び内容を分析する。また、前記音声命令は、分析のためにテキストタイプ情報に変換され（Ｓ２０４）、次に、メモリ１６０の特定データベースに保存される。しかしながら、前記音声命令をテキストタイプ情報に変換する段階は、省略できる。

その後、前記音声命令の前記文脈及び内容を分析するために、制御部１８０は、前記音声命令の特定単語又はキーワードを検出する（Ｓ２０５）。前記検出された単語又はキーワードに基づいて、制御部１８０は、前記音声命令の前記文脈及び内容を分析し、前記特定データベースに保存された情報を参照して前記音声命令の意味を判断する（Ｓ２０６）。

さらに、前述したように、参照として用いられる前記データベースは、特定されたドメインを含み、前記データベースに基づいて判断された前記音声命令の意味に対応する機能又はメニューが行われる（Ｓ２０７）。また、音声認識のための前記データベースが特定メニューに関連する各機能に特定されるため、前記認識率及び前記音声命令を認識する速度が向上し、前記移動端末機で利用されるリソースの量が減少する。なお、前記認識率は特定メニューに予め設定された名前との一致率を意味する。

入力された音声命令に対する前記認識率は、前記音声命令の特定機能又はメニューに関する情報の数によっても判断できる。従って、前記入力された音声命令に対する前記認識率は、前記情報が前記音声命令に含まれる特定機能又はメニュー（例えば、メニュー名）と正確に一致する場合に向上する。

より詳しく説明すると、図７Ｂは、本発明の一実施形態による移動端末機の音声命令を認識する方法を示す。図７Ｂに示すように、前記使用者は、「Ｉｗａｎｔｔｏｓｅｅｍｙｐｉｃｔｕｒｅｓ（私は、私の写真を見たい）」という６つの単語からなる自然言語で音声命令を入力する。この場合、前記認識率は、特定メニュー（例えば、フォトアルバム）に関連する意味のある単語（例えば、ｓｅｅ、ｐｉｃｔｕｒｅｓ）の数に基づいて判断できる。さらに、制御部１８０は、前記音声命令に含まれる前記単語が特定機能又はメニューに関連する意味のある単語であるか否かを、前記データベースに保存された前記情報に基づいて判断できる。例えば、前記特定メニューと関係ない前記自然言語音声命令に含まれる意味のない単語は、主語（Ｉ）、前置詞（ｔｏ）、及び所有代名詞（ｍｙ）である。

また、前記自然言語は、人間が一般的に使う言語であり、人工言語とは反対の概念を有する。さらに、前記自然言語は、自然言語処理アルゴリズムを用いて処理される。前記自然言語は、特定メニューに関連する正確な名前を含むこともあり、含まないこともあるが、これは、音声命令を完全かつ正確に認識することを困難にする原因となることもある。従って、本発明の一実施形態によれば、音声命令が所定レベル以上の認識率を有する場合（例えば、８０％）、制御部１８０は、前記認識が正確であると判断する。

さらに、制御部１８０が複数のメニューが近い意味を有すると判断した場合、制御部１８０は、前記複数のメニューを表示し、前記使用者は、前記表示されたメニューの１つを選択してその機能が実行されるようにすることができる。さらに、相対的に高い認識率を有するメニューが優先的に表示されるか、他のメニューより目立つように表示される。

例えば、図８は、本発明の一実施形態による移動端末機の音声認識率に関するメニューを表示する方法を示す図である。図８に示すように、相対的に高い認識率を有するメニューアイコンは、ディスプレイスクリーン５１０の中央部分に表示されるか、ディスプレイスクリーン５２０に示すように、大きく又は濃く表示される。前記高い認識率を有するメニューアイコンを優先的に表示した後、相対的に低い認識率を有するメニューを順に表示することもできる。

さらに、制御部１８０は、前記メニューのサイズ、位置、色、輝度の少なくとも１つを変更するか、認識率の高い順に強調表示することにより、前記複数のメニューを目立つように表示することができる。前記メニューの透明度は、適切に変更又は制御される。

さらに、図８の下部に示すように、使用者が高い選択率で選択するメニューは、更新されるか、認識率を有するように設定される。すなわち、制御部１８０は、前記使用者選択の履歴を保存し（Ｓ３０１）、学習過程を行って（Ｓ３０２）使用者により選択されたメニューオプションに対する特定認識率を他のメニューオプションより高く設定する（Ｓ３０３）。従って、メニューが使用者により選択された回数を前記メニューの認識率に適用できる。よって、同一又は類似の発音又は内容で入力される音声命令は、使用者が特定メニューを選択した回数によって異なる認識率を有する。

さらに、制御部１８０は、前記使用者が特定機能を実行した時間を保存することができる。例えば、使用者は、月曜日から金曜日まで目覚める度に電子メール又は未読メッセージをチェックすることが多い。このような時間情報は、前記認識率を向上させるために利用される。前記移動端末機の状態（例えば、待ち受けモードなど）も前記認識率を向上させるために利用される。例えば、前記使用者は、使用者の移動端末機の電源をつけたとき、前記移動端末機が閉状態から開状態となったときなどに、電子メール又は未読メッセージをチェックすることができる。

図９は、本発明の他の実施形態による移動端末機の音声命令認識方法を説明するための図である。図９に示すように、前記使用者は、前記音声認識機能をアクティブ化し、前記音声命令「Ｉｗａｎｔｔｏｓｅｅｍｙｐｉｃｔｕｒｅｓ」を入力する。次に、制御部１８０は、音声命令認識のためのデータベースのドメインを前記表示されたサブメニューに関連するドメインに特定する。次に、制御部１８０は、前記音声命令を解釈し（Ｓ４０１）、本例においては、特定値（例えば、８０％）以上の可能性を有する複数のメニューを表示する（Ｓ４０２）。図９のディスプレイスクリーン６１０に示すように、制御部１８０は、４つのマルチメディアメニューを表示する。

制御部１８０はまた、最も高い可能性を有するメニュー（例えば、本例においては、「フォトアルバム」メニューオプション６２１）を目立つように表示する。次に、前記使用者は、前記表示されたメニューのうち任意の１つを選択し、前記選択されたメニューに対応する機能を行うことができる。図９に示すように、前記使用者は、フォトアルバムメニューオプション６２１を選択し、制御部１８０は、ディスプレイスクリーン６２０に示すように、前記選択されたフォトアルバム内の写真を表示する。

さらに、図９の下部の段階Ｓ４０２に示すように、制御部１８０は、１つのメニューのみが前記所定の可能性より高いと判断される場合、機能を直ちに行うこともできる。すなわち、制御部１８０は、フォトアルバムメニューオプション６２１が所定閾値より高い認識率又は可能性を有する唯一のメニューであると判断される場合、前記使用者がフォトアルバムメニューオプション６２１を選択することなく、ディスプレイスクリーン６２０に示すように、前記フォトアルバム内の写真を直ちに表示する。さらに、メニューが「フォトアルバム」のような正確な名前を有しているが、メモリ１６０は、「フォト、写真、アルバム」などのメニューに関連する複数の情報を保存することができる。

さらに、図６Ｂに関連して前述したように、制御部１８０は、動作状態又はモード（例えば、音声認識機能を示すモード）によって音声命令又はタッチ入力を用いて特定メニューが選択されるか実行される場合は、前記使用者にヘルプ情報を出力することもできる。また、前記使用者は、環境設定メニューで提供される適切なメニューオプションを利用して前記ヘルプを出力するための前記動作モードを設定することができる。従って、使用者は、高いレベルの技術を備えなくても本発明の移動端末機を動作させることができる。すなわち、多くの高齢者は、移動端末機により提供される多様なメニューの操作に慣れていない。しかしながら、本発明の前記移動端末機を利用すると、前記移動端末機により提供される複雑なユーザインタフェースに詳しくない使用者でも前記移動端末機を容易に操作することができる。

さらに、前記音声命令が複数の意味を有していると制御部１８０が認識する場合（例えば、自然言語音声命令が正確なメニュー名を含まない場合、すなわち、メニューが、「マルチメディア」カテゴリーに属するが、「カメラ」、「フォトアルバム」、「ビデオ」のうち正確な名前を有しない場合）、制御部１８０は、所定値（例えば、８０％）以上の認識率を有する複数のメニューを表示する。

図１０は、本発明の一実施形態による移動端末機の音声命令を認識するために制御部１８０により用いられる複数のデータベースを示す図である。本実施形態において、前記データベースは、制御部１８０が音声命令の意味を判断するために利用する情報を保存するものであり、情報の特性によって任意の数のデータベースでもよい。さらに、情報特性に応じて構成されたそれぞれのデータベースは、制御部１８０の制御下で持続的な学習により更新される。

例えば、前記学習過程は、使用者の音声と該当単語とを対応させようと試みる。例えば、使用者が韓国語で「センイル（誕生日）」と発音したが、「センファル（生活）」と認識された場合、使用者が「センファル」を「センイル」に修正することにより、その後前記使用者により入力される同一の発音が「センイル」と認識されるようにする。

図１０に示すように、情報特性に応じた前記それぞれのデータベースは、第１データベース１６１、第２データベース１６２、第３データベース１６３、及び第４データベース１６４を含む。本実施形態において、第１データベース１６１は、前記マイクから入力された音声を音素、音節、又は形態素の単位で認識するための音声情報を保存し、第２データベース１６２は、前記認識された音声情報に基づいて音声命令の全体的な意味を判断するための情報（例えば、文法、発音正確度、文章構造など）を保存する。また、第３データベース１６３は、前記移動端末機の機能又はサービスのためのメニューに関する情報を保存し、第４データベース１６４は、前記判断された音声命令の意味の確認を使用者から取るために前記端末機から出力されるメッセージ又は音声情報を保存する。

図１１は、本発明の一実施形態による移動端末機の音声認識機能の実行中の状態を示す図である。図１１に示すように、制御部１８０が前記音声認識機能を実行中である場合、制御部１８０は、前記使用者に前記音声認識機能が実行中であることを通知する特定インジケータ又はアイコン５００を表示する。制御部１８０は、前記使用者に前記音声認識機能が実行中であることを通知するために音又はメッセージを出力することもできる。

また、前述した実施形態は、前記使用者の音声命令に対する認識を示す。しかしながら、本発明においては、前記音声命令が認識中である場合、前記使用者が別途の入力機能を実行することができる。例えば、音声認識及びタッチ入力、音声認識及びボタン入力、又は音声認識もしくはタッチ／ボタン入力が同時に行われる。

さらに、制御部１８０は、前記音声認識機能が特定モードもしくはメニュー、又は特定動作状態で行われることを防止することができる。また、音声認識機能が適用中であることを示すオーディオ情報（例えば、音声案内又は案内情報）又はビデオ情報（例えば、図１１のインジケータ５００）が前記音声認識モード、メニュー、又は動作状態で表示できる。また、ヘルプ情報を出力することにより前記音声認識機能が提供中であることを示す情報が前記使用者に提供される。

図１２は、本発明の一実施形態による音声命令により移動端末機の特定メニューに関する下位命令（Ｓｕｂ−Ｃｏｍｍａｎｄｓ）を処理する方法を示す図である。本実施形態において、前記使用者が前記音声認識機能を予めアクティブ化していると仮定する。

図１２の左側に示すように、前記使用者は、アラーム／スケジュールアイコンをタッチし、制御部１８０は、利用可能な機能（例えば、１．アラーム、２．スケジュール、３．やること、４．メモ）をリストで示すポップアップヘルプメニューを表示する。その後、前記使用者は、前記音声命令「ＴＯ−ＤＯ（やること）」を入力し、制御部１８０は、前記音声命令の意味を解釈し、ディスプレイスクリーン６１１に示すように、前記音声命令に対応すると判断される複数のメニューを表示する。

すなわち、ディスプレイスクリーン６１１に示すように、制御部１８０は、前記「やること」機能に関する４つのイベントを表示する。その後、前記使用者は、前記音声命令「Ｓｅｌｅｃｔｎｕｍｂｅｒ２（２番を選択する）」を入力し、制御部１８０は、前記２番のオプション（Ｍｅｅｔｉｎｇ１（会議１））を選択する。その後、前記使用者は、前記音声命令「Ｉｗａｎｔｔｏｄｅｌｅｔｅｔｈｉｓ（これを削除したい）」を入力する。その後、制御部１８０は、前記使用者にこの項目の削除に関して「Ｙｅｓ（はい）」又は「Ｎｏ（いいえ）」を確認することを要求するポップアップメニュー６１３を表示する。その後、前記使用者は、前記音声命令「Ｙｅｓ（はい）」を入力し、制御部１８０は、図１２のディスプレイスクリーン６１６に示すように、前記項目を削除する。

また、前記使用者から応答がない場合、制御部１８０は、これを肯定応答であると判断して前記下位命令を自動で実行できる。また、制御部１８０は、前記項目が削除されたことを前記使用者に通知する音声命令（Ｄｅｌｅｔｅｄ（削除されました））６１５を出力する。前記メニューをタッチすることにより前記第１メニューアラーム／スケジュールを選択する代わりに、前記使用者は、他の音声命令を出力できる。また、制御部１８０は、前記使用者が最初に前記アラーム／スケジュールアイコンを選択すると、前記使用者に該当タスクが実行されることを通知する音声メッセージ（Ｔｏ−Ｄｏｍｅｎｕｗｉｌｌｂｅｐｅｒｆｏｒｍｅｄ（やることのメニューが実行される））６１７を出力できる。

さらに、前述したように、前記特定メニューが実行される場合、制御部１８０は、音声命令認識のための参照として用いられるデータベースのドメインを前記実行されたメニューに関連するドメインに特定する。すなわち、前記ドメインは、前記特定メニューの下位メニューに関する情報、又は前記特定メニューから実行できる下位命令に関する情報を含む。

図１３は、本発明の一実施形態による移動端末機で音声命令により地下鉄路線図を探索する方法を示す図である。本例においても、前記使用者は、予め前記音声認識機能をアクティブ化していると仮定する。また、前記使用者の音声命令又は他の入力手段を利用した操作に基づいて、制御部１８０が地下鉄路線図の表示に関連する前記特定メニューを行うと仮定する。

すなわち、制御部１８０は、ディスプレイスクリーン６２１に示すように前記地下鉄路線図を表示する。前述したように、前記特定メニューが実行される場合、制御部１８０は、音声命令認識のための参照として用いられるデータベースのドメインを前記実行されたメニューに関連するドメイン（例えば、地下鉄駅名、各駅間の距離（時間）情報）に特定する。また、前記ドメインは、前記特定メニューの前記下位メニューに関する情報、又は前記特定メニューから実行できる下位命令に関する情報を含む。

次に、制御部１８０は、前記使用者に出発及び到着駅の入力を要求する音声命令（Ｓａｙｓｔａｒｔｓｔａｔｉｏｎａｎｄｅｎｄｓｔａｔｉｏｎ（出発駅及び到着駅を言って下さい））６２６を出力する。その後、前記使用者は、ディスプレイスクリーン６２１から２つの駅を選択する。すなわち、制御部１８０は、前記表示された地下鉄路線図から、前記使用者が駅間の所要時間を知りたいと思う２つの駅６２２、６２３を受信する。前記使用者は、前記移動端末機から要求された場合（すなわち、Ｓａｙｔｈｅｓｔａｒｔｓｔａｔｉｏｎａｎｄｅｎｄｓｔａｔｉｏｎ（出発駅と到着駅を言ってください）、音声命令を用いるか、前記２つの駅６２２、６２３をタッチすることにより、前記２つの駅を選択する。前記２つの駅を選択する他の方法も可能である。前記使用者が前記２つの駅を選択すると、制御部１８０は、前記選択された２つの駅を含む音声メッセージ（すなわち、ｔｈｅＩＳＵｓｔａｔｉｏｎａｎｄＳｅｏｕｌｓｔａｔｉｏｎｗｅｒｅｓｅｌｅｃｔｅｄ：梨水駅及びソウル駅が選択されました）。６２４をスピーカから出力する音声メッセージを出力する代わりに、制御部１８０は、前記要求又は入力された情報と共にポップアップウィンドウを表示することもできる。

また、制御部１８０は、前記２つの駅が選択されると、ヘルプ情報を出力することもできる。例えば、図１３のディスプレイスクリーン６２１に示すように、制御部１８０は、前記駅名及び前記地下鉄路線の色をリストで示すヘルプポップアップバルーンウィンドウを表示する。その後、前記使用者は、前記選択された２つの駅間の所要時間を要求する。前記使用者は、前記音声命令「ＩｗａｎｔｔｏｋｎｏｗｈｏｗｌｏｎｇｉｔｗｉｌｌｔａｋｅｆｒｏｍＩｓｕｔｏＳｅｏｕｌＳｔａｔｉｏｎ（梨水からソウル駅までの所要時間を知りたい）」を入力することにより前記情報を要求できる。

次に、制御部１８０は、前記音声命令の内容と文脈を分析するために前記ドメイン内で前記地下鉄路線情報処理に関する意味のある単語（例えば、ｈｏｗｌｏｎｇ，ｔａｋｅ，Ｉｓｕ，ＳｅｏｕｌＳｔａｔｉｏｎ）を検出する。前記分析された情報に基づいて、制御部１８０は、前記音声命令が前記２つの駅（Ｉｓｕ，ＳｅｏｕｌＳｔａｔｉｏｎ）間の時間情報を要求する意味を有すると判断する。

また、制御部１８０が前記音声命令の意味を判断するとき、制御部１８０は、前記音声命令の判断された意味が正確か否かについて使用者の確認を要求できる。その後、制御部１８０は、前記２つの駅間の距離（又は、所要時間）、前記２つの駅間の停車駅数などと共に、前記地下鉄路線図に前記２つの駅を表示し、図１３のディスプレイスクリーン６２５に示すように、前記使用者に前記結果を通知する音声メッセージ（Ｉｔｔａｋｅｓ２５ｍｉｎｕｔｅｓｆｒｏｍＩＳＵｓｔａｔｉｏｎａｎｄＳｅｏｕｌｓｔａｔｉｏｎｖｉａ９ｓｔａｔｉｏｎｓ（梨水駅からソウル駅まで９つの駅に停車して２５分かかります））６２７を出力する。また、前述したように、前記使用者が特定時間内に前記確認要求に応答しない場合、制御部１８０はこれを肯定応答であると解釈して前記要求されたサービスに対する結果を提供する。

図１４は、本発明の一実施形態による移動端末機の音声命令によりマルチメディアを再生する方法を示す図である。また、下記の説明においては、前記使用者が前記アクティブ化制御信号を入力すると、制御部１８０が前記音声認識機能のアクティブ化を開始すると仮定する。また、制御部１８０が、音声命令の入力又は他の入力部を利用した使用者の操作を受信することにより、マルチメディア再生メニューに関する特定メニューを行うと仮定する。

すなわち、ディスプレイスクリーン６３１に示すように、制御部１８０は、前記使用者が選択して再生できる曲のリストを表示する。従って、本発明において、使用者の希望するマルチメディアファイルは、音声命令により直接検索されて再生される。より詳しくは、マルチメディア再生メニューが実行されると、制御部１８０は、音声命令認識のための参照として用いられるデータベースのドメインを前記実行されたメニューに関連するドメインに特定する。

前述したように、前記ドメインは、前記マルチメディア再生メニューの下位メニューに関する情報、前記マルチメディア再生メニューから実行される下位命令に関する情報、又はマルチメディアに関する情報（例えば、ファイル名、再生時間、著作権者など）を含む。

さらに、制御部１８０は、音声命令の入力又は他の入力部を使用した使用者の操作を受信することにより、マルチメディアファイルを表示できる。図１４の例において、前記使用者は、ディスプレイスクリーン６３１に示すように、前記ファイルリストから１つのファイルが選択された状態で、自然言語音声命令（例えば、Ｌｅｔ’ｓｐｌａｙｔｈｉｓｓｏｎｇ（この曲を再生しましょう））を入力する。

前記音声命令が入力されると、制御部１８０は、前記ドメイン内で前記選択されたメニュー処理のための前記下位メニュー又は下位命令に関する意味のある単語（例えば、ｐｌａｙ，ｔｈｉｓｓｏｎｇ）を検出する。また、制御部１８０は、前記検出された単語、及び前記音声命令の全体的な文脈と内容を分析することにより、前記音声命令の意味を判断する。

前記音声命令の意味が判断されると、制御部１８０は、前記音声命令の前記判断された意味が正確か否かに関する前記使用者の確認を取る。例えば、図１３に示すように、制御部１８０は、前記選択された曲の再生に関して前記使用者が「Ｙｅｓ」又は「Ｎｏ」を言うように要求するポップアップウィンドウ６３３を表示する。制御部１８０は、曲２が再生する曲であるかを前記使用者に問い合わせる音声メッセージ６３２を出力することもできる。次に、前記使用者が「Ｙｅｓ」と言うと、制御部１８０は、ディスプレイスクリーン６３４に示すように前記選択された曲を出力する。

あるいは、制御部１８０は、前記使用者に前記選択に対する確認を要求せずに前記選択された曲を自動で再生することもできる。また、前記使用者は、制御部１８０が選択されたタスクに対する確認を要求するか否かをデフォルトに設定するための適切なメニューオプションを使用することもできる。さらに、前記使用者から応答がない場合、制御部１８０は、前記応答を肯定応答であると判断し、前記判断された音声命令を自動で実行できる。

従って、本実施形態においては、再生されるファイルが選択され、前記選択されたファイルに対する再生命令が音声命令により入力される。しかしながら、使用者が既にファイル名を知っている場合、前記ファイル名は、音声命令により上位メニューから直接入力されてもよい。

図１５は、本発明の一実施形態による移動端末機で音声命令により電子メール又はテキストメッセージを送信する方法を示す図である。この場合も、本実施形態においては、前記アクティブ化制御信号が入力されると、制御部１８０が前記音声認識機能のアクティブ化を開始すると仮定する。また、制御部１８０が、音声命令の入力又は他の入力部を利用した使用者の操作を受信することにより、特定メニュー（例えば、メール／メッセージ送受信メニュー）を実行すると仮定する。

より詳しくは、メール（又は、メッセージ）送受信メニューが実行されると、制御部１８０は、音声命令認識のための参照として用いられるデータベースのドメインを前記実行されたメニューに関連するドメインに特定する。前記ドメインは、前記メール／メッセージ送受信メニューの下位メニューに関する情報、前記メール／メッセージ送受信メニューから実行できる下位命令に関する情報、又は送受信されたメール／メッセージに関する情報（例えば、送信機、受信機、送受信時間、タイトルなど）を含む。

また、制御部１８０は、音声命令の入力又は他の入力部を利用した使用者の操作を受信することにより、メール／メッセージ送受信リストを表示できる。ディスプレイスクリーン６４１に示すように、前記使用者は、前記音声命令「Ｉｗａｎｔｔｏｒｅｐｌｙ（返信したい）」を入力する。その後、制御部１８０は、ディスプレイスクリーン６４５に示すように、前記使用者が返信できる受信メッセージを表示する。本例において、前記使用者は、ディスプレイスクリーン６４５に示すように、１つのメール／メッセージが前記メール／メッセージリストから選択された状態で、使用者の自然言語（例えば、Ｒｅｐｌｙｔｏｔｈｉｓｍｅｓｓａｇｅ（このメッセージに対して返信する））を使用する。

さらに、前記音声命令が入力されると、制御部１８０は、前記ドメイン内で前記選択されたメール／メッセージに対する返信処理に関する意味のある単語（例えば、ｒｅｐｌｙ，ｔｈｉｓｍｅｓｓａｇｅ）を検出する。その後、制御部１８０は、前記検出された単語及び前記音声命令の全体的な文脈と内容を分析することにより、前記音声命令の意味（メール／メッセージ返信メニューの実行）を判断する。

前記音声命令の意味が判断されると、制御部１８０は、前記音声命令の前記判断された意味が正確であるか否かに対する使用者の確認を取ることができる。例えば、前記使用者の確認のために、音声メッセージ６４２又はテキストメッセージ６４３が出力される。使用者の確認のための前記メッセージが出力される場合、前記使用者は、音声又は他の入力部を利用して応答できる。前記使用者から応答がない場合、制御部１８０は、肯定応答であると判断し、前記判断された意味に対応する機能を自動で実行できる。その後、前記メール／メッセージ返信メニューが実行される場合、制御部１８０は、メール／メッセージ作成ウィンドウ６４４に前記選択された相手のアドレス／電話番号を自動で入力する。

従って、本実施形態において、返信されるメール／メッセージがまず選択され、前記選択されたメール／メッセージに対する返信命令が音声命令を用いて入力される。しかしながら、使用者が相手に関する情報を知っている場合、相手への前記メール／メッセージ返信は、音声命令により直接入力できる。

さらに、図１５に示す実施形態は、テキストメッセージの送信に対応するように変更できる。より詳しくは、制御部１８０は、前記使用者が前記端末機に言いたいことを伝えられるように前記使用者の音声をテキストに変換するソフトウェアを含み、前記入力された音声をテキストメッセージに変換する。また、制御部１８０は、前記使用者が前記変換を許可するかに対して確認できるように、前記使用者に前記変換されたテキストを表示できる。その後、前記使用者は、前記移動端末機に前記テキストメッセージを所望の使用者に伝送することを要求する。

前記変形実施形態は、テキストメッセージを手で入力することが非常に面倒で退屈な過程であるため、特に有利である。多くの使用者は、様々な理由で相手に電話をかけるよりはテキストメッセージを送信することを所望するが、一つのテキストメッセージを送信するために複数のキーを手動で選択する面倒な過程は願わない。本発明の前記変形実施形態においては、前記使用者が自身の音声を使用して所望のテキスト情報を入力し、前記テキストメッセージを所望の相手に伝送することができる。

図１６は、本発明の一実施形態による移動端末機で音声命令により通話を行う方法を示す図である。前述した実施形態と同様に、本実施形態は、前記使用者が前記アクティブ化制御信号を入力すると、制御部１８０が前記音声認識機能をアクティブ化すると仮定する。また、制御部１８０が、音声命令の入力又は他の入力部を利用した使用者の操作を受信することにより、通話に関する特定メニュー（例えば、最近受信された通話に関する電話帳又はメニューリスト）を行うと仮定する。

通話に関する前記メニューが実行されると、制御部１８０は、音声命令認識のための参照として用いられるデータベースのドメインを前記通話に関するドメインに特定する。さらに、前記ドメインは、発信通話、受信通話、不在着信などに関する情報、及び各電話関連情報（例えば、発信時間、受信時間、送信機、受信機、通話時間、通話回数等）を含む。

また、制御部１８０は、音声命令の入力又は他の入力部を利用した使用者の操作を受信することにより、通話リストを表示する。すなわち、前記使用者は、自身の自然言語を用いて前記音声命令（例えば、Ｉｗａｎｔｔｏｓｅｅｔｈｅｒｅｃｅｉｖｅｄｐｈｏｎｅｃａｌｌｓ（着信履歴を見たい））を入力する。

前記音声命令が入力されると、制御部１８０は、前記ドメイン内で前記通話に関する意味のある単語（例えば、ｓｅｅ，ｒｅｃｅｉｖｅｄ，ｐｈｏｎｅ，ｃａｌｌｓ）を検出し、前記検出された単語及び前記音声命令の全体的な文脈と内容を分析することにより、前記音声命令が「着信履歴を出力してください」という意味を有すると判断する。前記音声命令の意味が判断されると、制御部１８０は、ディスプレイスクリーン７１２に示すように、着信履歴のリストを出力する。

さらに、前記使用者は、アイテムが前記出力されたリストから選択された状態で、「Ｃａｌｌｔｈｉｓｐｅｒｓｏｎ（この人に電話をかける）」という前記音声命令を入力する。その結果、制御部１８０は、前記音声命令が、「選択された受信通話の相手に電話をかけてください」という意味を有すると判断する。その後、制御部１８０は、前記音声命令の前記判断された意味が正確か否かに対する前記使用者の確認を取る。すなわち、制御部１８０は、音声メッセージ（ＤｏｙｏｕｗａｎｔｔｏｃａｌｌｗｉｔｈＲｉｃｈａｒｄ？（リチャードに電話をかけますか？））７１３又はテキストタイプメッセージ７１５を出力できる。

前記使用者は、音声又は他の入力部により応答できる。前述したように、前記使用者から応答がない場合、制御部１８０は、肯定応答であると判断して前記判断された意味に対応する機能を自動で実行できる。また、制御部１８０は、通話接続中であることを示すメッセージ（Ｃａｌｌｃｏｎｎｅｃｔｉｏｎｉｓｂｅｉｎｇｍａｄｅ：通話接続中です）７１４を出力する。

従って、本実施形態において、通話相手が通話リストから選択され、前記選択された通話相手への通話命令が音声命令により入力される。しかしながら、使用者が予め前記通話相手に関する情報を知っている場合、前記相手への通話は、音声命令により直接実行される。

図１７は、本発明の一実施形態による移動端末機で音声命令により電話帳情報を使用する方法を示す図である。他の実施形態と同様に、本実施形態においても同様の仮定を行う。すなわち、制御部１８０は、アクティブ化制御信号が入力されると前記音声認識機能のアクティブ化を開始し、制御部１８０は、音声命令又はディスプレイスクリーン７２０に示すような他の入力部を用いた使用者の操作の入力を受信して特定メニュー（例えば、電話帳メニュー）を選択するか、又は行うと仮定する。

電話帳メニューが実行されると、制御部１８０は、音声命令認識のための参照として用いられるデータベースのドメインを前記電話帳メニューの下位メニュー又は前記電話帳メニューから実行できる下位命令に関連するドメインに特定する。さらに、前記ドメインは、認識率を向上させるために特定するが、必ずしも特定する必要はない。

さらに、待ち受け状態又は前記電話帳に関連するメニューが選択された状態で、前記使用者が自然言語音声命令（例えば、ＥｄｉｔＪａｍｅｓ（ジェームズを編集する），ＡｄｄＪａｍｅｓ（ジェームズを追加する），ＦｉｎｄＪａｍｅｓ（ジェームズを検索する），ＣａｌｌＪａｍｅｓ（ジェームズと通話する），ＩｗａｎｔｔｏｓｅｎｄＭｅｓｓａｇｅｔｏＪａｍｅｓ（ジェームズにメッセージを送信したい））を入力する。前記音声命令が入力されると、制御部１８０は、前記ドメイン内で前記通話に関する意味のある単語（例えば、Ｅｄｉｔ，Ａｄｄ，Ｆｉｎｄ，Ｃａｌｌ，ＳｅｎｄＭｅｓｓａｇｅ，Ｊａｍｅｓ）を検出し、前記検出された単語及び前記音声命令の全体的な内容と文脈を分析して前記音声命令の各意味を判断する。

前記音声命令の各意味が判断されると、制御部１８０は、ディスプレイスクリーン７２２〜７２４に示すように、前記各音声命令に対応する機能又はメニューを実行する。また、前記機能を実行する前に、前記音声命令の前記判断された意味が正確か否かに関して使用者の確認を取ることができる。前述したように、前記使用者の確認を取るために音声メッセージ又はテキストタイプのメッセージを出力できる。

さらに、使用者の確認のための前記メッセージが出力されると、前記使用者は、音声又は他の入力手段を利用して応答できる。前記使用者から応答がない場合、制御部１８０は、肯定応答であると判断し、前記判断された意味に対応する機能を自動で実行できる。

図１８は、本発明の一実施形態による移動端末機で音声命令により待ち受け画面を変更する方法を示す図である。この場合も、制御部１８０は、アクティブ化制御信号が入力されると前記音声認識機能のアクティブ化を開始し、音声命令又は他の入力部を用いた使用者の操作を受信して特定メニュー（例えば、フォトアルバムメニュー）を実行すると仮定する。

前記フォトアルバムメニューは、音声命令又は他の入力部を用いた多段階の下位メニューの入力により実行される。また、前記フォトアルバムメニューは、ディスプレイスクリーン７３１に示すように、自然言語音声命令（例えば、Ｉｗａｎｔｔｏｓｅｅｍｙｐｈｏｔｏａｌｂｕｍ（私のフォトアルバムを見たい））により直ちに実行される。制御部１８０は、前記判断された音声命令の意味に応じて、ディスプレイスクリーン７３２に示すように、フォトアルバムメニューを実行して写真リストを出力する。その後、制御部１８０は、前記出力されたフォトアルバムリストから選択された一枚の写真を受信する。

この状態で、使用者の音声命令（例えば、Ｃｈａｎｇｅｍｙｗａｌｌｐａｐｅｒｕｓｉｎｇｔｈｉｓｐｉｃｔｕｒｅ（この写真に壁紙を変更せよ））が入力されると、制御部１８０は、前記実行されたメニューの下位メニュー又は下位命令に関する意味のある情報（例えば、ｃｈａｎｇｅ，ｗａｌｌｐａｐｅｒ）を検出する。その後、制御部１８０は、前記検出された単語及び前記音声命令の全体的な文脈と内容を分析して前記音声命令の意味を判断する。すなわち、制御部１８０は、前記音声命令が「選択された写真に待ち受け画面を変更せよ」という意味を持つと判断する。

前記音声命令の意味が判断されると、制御部１８０は、前記選択された写真に対応するように前記待ち受け画面を表示し、前記音声命令の判断された意味が正確か否かに関して使用者の確認を取る。前記使用者の確認を取るために音声メッセージ７３３又はテキスト形式のメッセージ７３４が出力される。高い認識率又は予め設定された環境設定オプションによって、前記使用者の確認がなくても、前記判断された音声命令を直ちに実行することもできる。

使用者の確認を取るための前記メッセージが出力されると、前記使用者は、音声又は他の入力部により応答できる。前記使用者から応答がない場合、制御部１８０は、肯定応答であると判断し、前記判断された音声命令に対応する機能を自動で実行できる。

待ち受け画面を変更するために、本実施形態に示すように、前記フォトアルバムメニューを必ずしも先に実行する必要はなく、待ち受け画面メニューを実行した後、使用者の望む写真を検索して変更することもできる。

図１９は、本発明の実施形態による移動端末機で音声命令によりマルチメディアファイルを再生する方法を示す図である。前述した実施形態と同様に、本例においては、制御部１８０は、アクティブ化制御信号が入力されると音声認識機能のアクティブ化を開始し、音声命令又は他の入力部を用いた使用者の操作の入力を受信して特定メニュー（例えば、マルチメディア再生メニュー）を実行すると仮定する。

使用者がマルチメディアファイルを再生するためには、前記特定メニューを実行した後、前記特定メニューの下位メニューから１つを選択してファイルリストを表示し、前記ファイルリストから１つのファイルを選択して再生する。しかしながら、本発明においては、音声命令により使用者の望むマルチメディアファイルを直ちに検索して再生することができる。

例えば、前記音声認識機能がアクティブ化した後、特定音声命令（例えば、ＭｏｖｅｔｏｔｈｅＢｅｅｔｌｅｓａｌｂｕｍ（ビートルズアルバムに移動せよ））が入力されると、制御部１８０は、ディスプレイスクリーン７４１に示すように前記音声命令の全体的な内容と文脈を分析して前記音声命令の意味を判断する。前記分析された情報に基づいて、制御部１８０は、特定機能又はメニューを実行するか、ディスプレイスクリーン７４２に示すように特定ファイルホルダーに移動してファイルリストを表示する。

前記ファイルリストから１つのファイルを選択した後、前記音声命令（例えば、Ｐｌａｙｔｈｉｓｓｏｎｇ（この曲を再生せよ），Ｐｌａｙｎｕｍｂｅｒ３（３番を再生せよ））が入力されると、制御部１８０は、前記音声命令の全体的な内容と文脈を分析して前記音声命令の意味を判断する。さらに、高い認識率又は予め設定された環境設定オプションにより、前記音声命令の意味に対応する機能又はメニューが直ちに実行される。

前記音声命令の意味が判断されると、制御部１８０は、前記音声命令の判断された意味が正確か否かに関して使用者の確認を取る。ここで、前記使用者の確認のために、テキスト形式のメッセージ又は音声メッセージ７４３を出力できる。使用者の確認のための前記メッセージが出力されると、前記使用者は、音声又は他の入力部により応答できる。前記使用者から応答がない場合、制御部１８０は、肯定応答であると判断し、前記判断された音声命令の機能を自動で実行することができる。その後、制御部１８０は、ディスプレイスクリーン７４４に示すように、前記選択された曲を実行又は再生する。

従って、本実施形態においては、再生するファイルを選択した後、前記選択されたファイルの再生命令を音声命令により入力したが、使用者がファイル名を知っている場合は、上位メニューから前記ファイル名を音声命令で直ちに入力して再生することもできる。

従って、本発明の実施形態によれば、音声認識機能がアクティブ化された状態で、入力された音声命令を特定形態に転換し、前記音声命令の文脈及び内容と、参照として用いられるドメインに特定された前記データベースとを比較する。また、前記音声命令の判断された意味に対応する結果値を前記移動端末機の特定構成要素として出力する。

本発明の移動端末機は、文脈及び内容に基づいて入力された音声命令の意味を判断することにより、特定機能又はサービスに関連するメニューを制御できる。また、本発明の移動端末機は、その動作状態又は動作モードに応じて音声認識のためのドメインを特定メニュー又はサービスに関連するドメインに特定することにより、音声認識率を向上させる。

また、本発明の移動端末機は、音声認識機能のアクティブ化中でも、使用者の操作を検出するために、１つ又は複数のユーザインタフェースを適用することにより、特定機能又はサービスに関連するメニューを同時に選択又は実行できる。さらに、本発明の移動端末機は、その動作状態又は動作モードによって前記音声命令の入力に関するヘルプ情報を提供することにより、使用者のスキルに関係なく音声命令を用いて特定機能又はサービスに関連するメニューを制御できる。

さらに、前記複数のドメインは、前記移動端末機で送受信される電子メールに対応する電子メールドメインと、前記移動端末機に割り当てられたスケジューリングイベントに対応するスケジューリングタスクドメインと、前記移動端末機での接触に対応する接触ドメインと、前記移動端末機に保存された電話番号に対応する電話帳ドメインと、前記移動端末機により提供される地図情報に対応する地図ドメインと、前記移動端末機に保存された写真に対応する写真ドメインと、前記移動端末機で送受信されるメッセージに対応するメッセージドメインと、前記移動端末機で行われるマルチメディア機能に対応するマルチメディアドメインと、前記移動端末機が接続できる外部装置に対応する外部装置ドメインと、前記移動端末機で送受信された通話に対応する通話履歴ドメインと、前記移動端末機で行われる設定機能に対応する設定ドメインの少なくとも２つのドメインを含むことができる。
さらに、前記認識率の前記所定の閾値は、前記移動端末機の製造業者又は前記移動端末機の使用者により設定される。

また、前述した多様な実施形態は、例えば、コンピュータソフトウェア、ハードウェア、又はこれらの組み合わせを利用したコンピュータ可読媒体で実現される。ハードウェア的な実現によれば、前述した実施形態は、ＡＳＩＣｓ（ａｐｐｌｉｃａｔｉｏｎｓｐｅｃｉｆｉｃｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔｓ）、ＤＳＰｓ（ｄｉｇｉｔａｌｓｉｇｎａｌｐｒｏｃｅｓｓｏｒｓ）、ＤＳＰＤｓ（ｄｉｇｉｔａｌｓｉｇｎａｌｐｒｏｃｅｓｓｉｎｇｄｅｖｉｃｅｓ）、ＰＬＤｓ（ｐｒｏｇｒａｍｍａｂｌｅｌｏｇｉｃｄｅｖｉｃｅｓ）、ＦＰＧＡｓ（ｆｉｅｌｄｐｒｏｇｒａｍｍａｂｌｅｇａｔｅａｒｒａｙｓ）、プロセッサ、制御部、マイクロ制御部、マイクロプロセッサ、ここに説明された前記機能を実行するように設計された他の電気的ユニット、又はこれらの選択的な組み合わせの少なくとも１つを利用して実現される。

ソフトウェア的な実現によれば、ここに説明された前記実施形態は、前述した機能又は動作のうちの１つ又は複数を行う各手順又は機能のような別個のソフトウェアモジュールと共に実現される。ソフトウェアコードは、適切なプログラム言語で作成されたソフトウェアアプリケーションにより実現される。また、ソフトウェアコードは、メモリ（例えば、メモリ１６０）に保存され、制御部又はプロセッサ（例えば、制御部１８０）により実行される。

さらに、移動端末機１００は、多様な異なる構造で実現される。前記構造の例としては、折り畳み型、スライド型、ストレート型、回転型、スイング型、及びこれらの組み合わせがある。

本発明の精神や範囲から外れない限り本発明の多様な変更及び変形ができることは、当業者には明らかである。従って、本発明の請求の範囲内で行われるあらゆる変更及び変形、並びに請求の範囲の均等物は本発明の請求の範囲に含まれる。

本発明の一実施形態による移動端末機のブロック構成図である。本発明の一実施形態による移動端末機の前面斜視図である。図２の移動端末機の後面斜視図である。本発明による端末機が動作可能な通信システムの例を示す図である。本発明の一実施形態による移動端末機の音声命令を利用したメニュー制御方法を説明するフローチャートである。本発明の一実施形態による移動端末機の音声認識機能をアクティブ化する方法を説明するための図である。本発明の一実施形態による移動端末機のヘルプ情報出力方法を説明するための図である。本発明の一実施形態による移動端末機のヘルプ情報出力方法を説明するための図である。本発明の一実施形態による移動端末機の音声命令認識方法を説明するためのフローチャートである。本発明の一実施形態による移動端末機の音声命令認識方法を説明するための図である。本発明の一実施形態による移動端末機の音声認識率に関するメニュー表示方法を説明するための図である。本発明の他の実施形態による移動端末機の音声命令認識方法を説明するための図である。本発明の一実施形態による移動端末機の音声命令認識のための参照として用いられるデータベースの構成を説明するための図である。本発明の一実施形態による移動端末機で音声命令認識機能が行われていることを表示する方法を説明するための図である。本発明の一実施形態による移動端末機で音声命令により特定メニューに関連する下位命令を処理する方法を説明するための図である。本発明の一実施形態による移動端末機で音声命令により地下鉄路線図検索を処理する方法を説明するための図である。本発明の一実施形態による移動端末機で音声命令によりマルチメディアファイルを再生する方法を説明するための図である。本発明の一実施形態による移動端末機で音声命令によりメールを伝送する方法を説明するための図である。本発明の一実施形態による移動端末機で音声命令により電話通話を行う方法を説明するための図である。本発明の一実施形態による移動端末機で音声命令により電話帳情報を利用する方法を説明するための図である。本発明の一実施形態による移動端末機で音声命令により待ち受け画面を変更する方法を説明するための図である。本発明に一実施形態による移動端末機で音声命令によりマルチメディアファイルを再生する方法を説明するための図である。

Claims

移動端末機であって、
前記移動端末機で音声認識機能をアクティブ化するための入力を受信する入力部と、
前記移動端末機の各メニュー又は動作に関連する複数のドメインを保存するためのメモリと、
前記音声認識機能をアクティブ化するために受信された前記入力に基づいて、前記メモリ内に含まれる前記複数のドメインのうち特定ドメインにアクセスし、前記アクセスされたドメインの言語モデル及び音響モデルに基づいて使用者言語を認識し、前記アクセスされた特定ドメイン及び前記認識された使用者言語に基づいて前記移動端末機の少なくとも１つのメニュー及び動作を判断する制御部と
を含むことを特徴とする移動端末機。
前記移動端末機が特定メニュー又は特定動作中であるとき、前記音声認識をアクティブ化するための前記入力が受信されると、前記アクセスされた特定ドメインは前記特定メニュー又は前記動作に対応することを特徴とする請求項１に記載の移動端末機。
前記特定メニュー又は動作は、マルチメディアメニュー又は動作、接触メニュー又は動作、メッセージメニュー又は動作、サウンドメニュー又は動作、システム手帳（ｏｒｇａｎｉｚｅｒ）メニュー又は動作、画面メニュー又は動作、ユーティリティメニュー又は動作、カメラメニュー又は動作、及び設定メニュー又は動作の少なくとも１つを含むことを特徴とする請求項２に記載の移動端末機。
前記制御部は、さらに、前記判断されたメニュー及び動作が正確に前記入力された使用者言語に対応する認識率を判断することを特徴とする請求項１に記載の移動端末機。
情報を表示するディスプレイ部をさらに含み、
前記制御部は、さらに、所定の閾値より高い認識率を有すると判断された前記アクセスされた特定ドメイン及び前記認識された使用者言語に基づいて、前記移動端末機の全てのメニュー及び動作を前記ディスプレイ部上に出力することを特徴とする請求項４に記載の移動端末機。
前記入力部は、さらに、前記表示されたメニュー及び動作の１つを選択するための音声入力命令を受信し、
前記制御部は、前記入力された音声命令を認識し、前記認識された入力音声命令が正確であるか否かを問い合わせる情報を出力することを特徴とする請求項５に記載の移動端末機。
前記制御部は、さらに、高い認識率から低い認識率の順に、前記所定の閾値より高い前記認識率を有する前記アクセスされた特定ドメイン及び前記認識された使用者言語に基づいて、前記移動端末機の前記全てのメニュー及び動作を前記ディスプレイ部に出力することを特徴とする請求項５に記載の移動端末機。
前記所定の閾値は、前記移動端末機の製造業者又は前記移動端末機の使用者により設定されることを特徴とする請求項５に記載の移動端末機。
前記制御部は、さらに、前記メニュー又は動作のサイズ、位置、色、輝度、及びハイライトの少なくとも１つを制御して、最も高い認識率を有するメニュー又は動作を前記ディスプレイ部に区別して表示することを特徴とする請求項５に記載の移動端末機。
前記制御部は、さらに、前記移動端末機の特定メニュー又は動作が以前に選択された回数を判断し、前記特定メニュー又は動作が以前に選択されたと前記判断された回数に基づいて、前記特定メニュー又は動作に対する前記認識率を調整することを特徴とする請求項４に記載の移動端末機。
前記入力部は、
（１）前記音声認識機能をアクティブ化するためにタッチされるタッチソフトボタンと、
（２）前記音声認識機能をアクティブ化するために押圧又は操作されるハードボタンと、
（３）前記音声認識機能をアクティブ化するためにタッチされる前記入力部内に含まれるタッチスクリーンの任意の位置と、
（４）前記音声認識機能をアクティブ化するために入力される衝撃音と、
（５）ローカル領域無線信号又は遠隔領域無線信号と、
（６）使用者の身体情報の少なくとも１つを含むことを特徴とする請求項１に記載の移動端末機。
前記入力された使用者言語を認識するために前記制御部により使用される音声又は発音情報を保存する第１データベースと、
前記入力された使用者言語を認識するために前記制御部により使用される単語、キーワード、又は文章情報を保存する第２データベースと、
前記移動端末機の各機能又はメニューに関する情報を保存する第３データベースと、
前記制御部が前記入力された使用者言語の意味を判断中であることを使用者に通知するために出力するヘルプ情報を保存する第４データベースとをさらに含むことを特徴とする請求項１に記載の移動端末機。
前記制御部は、さらに、前記音声認識機能がアクティブ化状態にあることを示すオーディオ又はビデオ情報を出力することを特徴とする請求項１に記載の移動端末機。
前記複数のドメインは、前記移動端末機で送受信される電子メールに対応する電子メールドメインと、前記移動端末機に割り当てられたスケジューリングイベントに対応するスケジューリングタスクドメインと、前記移動端末機での接触に対応する接触ドメインと、前記移動端末機に保存された電話番号に対応する電話帳ドメインと、前記移動端末機により提供される地図情報に対応する地図ドメインと、前記移動端末機に保存された写真に対応する写真ドメインと、前記移動端末機で送受信されるメッセージに対応するメッセージドメインと、前記移動端末機で行われるマルチメディア機能に対応するマルチメディアドメインと、前記移動端末機が接続できる外部装置に対応する外部装置ドメインと、前記移動端末機で送受信された通話に対応する通話履歴ドメインと、前記移動端末機で行われる設定機能に対応する設定ドメインの少なくとも２つのドメインを含むことを特徴とする請求項１に記載の移動端末機。
移動端末機の制御方法であって、
前記移動端末機で音声認識機能をアクティブ化するための入力を受信する段階と、
前記音声認識機能をアクティブ化するために受信された前記入力に基づいて、前記移動端末機のメモリに保存された複数のドメインのうち特定ドメインにアクセスする段階と、
前記アクセスされたドメインの言語モデル及び音響モデルに基づいて入力された使用者言語を認識する段階と、
前記アクセスされた特定ドメイン及び前記認識された使用者言語に基づいて前記移動端末機の少なくとも１つのメニュー及び動作を出力する段階と
を含むことを特徴とする移動端末機の制御方法。
前記移動端末機が特定メニュー又は動作中であるとき、前記音声認識をアクティブ化するための前記入力が受信されると、前記アクセスされた特定ドメインは、前記特定メニュー又は動作に対応することを特徴とする請求項１５に記載の移動端末機の制御方法。
前記特定メニュー又は動作は、マルチメディアメニュー又は動作、接触メニュー又は動作、メッセージメニュー又は動作、サウンドメニュー又は動作、システム手帳（ｏｒｇａｎｉｚｅｒ）メニュー又は動作、画面メニュー又は動作、ユーティリティメニュー又は動作、カメラメニュー又は動作、及び設定メニュー又は動作の少なくとも１つを含むことを特徴とする請求項１６に記載の移動端末機の制御方法。
前記アクセスされた特定ドメイン及び前記認識された使用者言語に基づいて、前記移動端末機の少なくとも１つのメニュー及び動作を判断する段階と、
前記判断されたメニュー及び動作が前記入力された使用者言語に正確に対応する認識率を判断する段階とをさらに含むことを特徴とする請求項１５に記載の移動端末機の制御方法。
所定の閾値より高い認識率を有すると判断された前記アクセスされた特定ドメイン及び前記認識された使用者言語に基づいて、前記移動端末機の全てのメニュー及び動作を前記移動端末機のディスプレイ部に出力する段階をさらに含むことを特徴とする請求項１８に記載の移動端末機の制御方法。
前記表示されたメニュー及び動作の１つを選択するための音声入力命令を受信する段階と、
前記入力された音声命令を認識する段階と、
前記認識された入力音声命令が正確であるか否かを問い合わせる情報を出力する段階とをさらに含むことを特徴とする請求項１９に記載の移動端末機の制御方法。
前記所定の閾値より高い認識率を有する前記アクセスされた特定ドメイン及び前記認識された使用者言語に基づいて、前記移動端末機の前記全てのメニュー及び動作を高い認識率から低い認識率の順に前記ディスプレイ部に出力する段階をさらに含むことを特徴とする請求項１９に記載の移動端末機の制御方法。
前記所定の閾値は、前記移動端末機の製造業者又は前記移動端末機の使用者により設定されることを特徴とする請求項１９に記載の移動端末機の制御方法。
前記メニュー又は動作のサイズ、位置、色、輝度、及びハイライトの少なくとも１つを制御して、最も高い認識率を有するメニュー又は動作を前記ディスプレイ部に区別して表示する段階をさらに含むことを特徴とする請求項１９に記載の移動端末機の制御方法。
前記移動端末機の特定メニュー又は動作が以前に選択された回数を判断し、前記特定メニュー又は動作が以前に選択されたと前記判断された回数に基づいて、前記特定メニュー又は動作に対する前記認識率を調整する段階をさらに含むことを特徴とする請求項１８に記載の移動端末機の制御方法。
前記入力を受信する段階は、
（１）前記音声認識機能をアクティブ化するためにタッチされるタッチソフトボタン、
（２）前記音声認識機能をアクティブ化するために押されるか操作されるハードボタン、
（３）前記音声認識機能をアクティブ化するためにタッチされる前記入力部に含まれるタッチスクリーンの任意の位置、
（４）前記音声認識機能をアクティブ化するために入力される衝撃音、
（５）ローカル領域無線信号又は遠隔領域無線信号、
（６）使用者からの身体情報のうち少なくとも１つにより発生する信号を受信する段階であることを特徴とする請求項１５に記載の移動端末機の制御方法。
前記入力された使用者言語を認識するために使用される音声又は発音情報を第１データベースに保存する段階と、
前記入力された使用者言語を認識するために使用される単語、キーワード、又は文章情報を第２データベースに保存する段階と、
前記移動端末機の各機能又はメニューに関する情報を第３データベースに保存する段階と、
前記入力された使用者言語の意味が判断中であることを使用者に通知するために出力するヘルプ情報を第４データベースに保存する段階とをさらに含むことを特徴とする請求項１５に記載の移動端末機の制御方法。
前記音声認識機能がアクティブ状態にあることを示すオーディオ又はビデオ情報を出力する段階をさらに含むことを特徴とする請求項１５に記載の移動端末機の制御方法。
前記複数のドメインは、
前記移動端末機で送受信される電子メールに対応する電子メールドメインと、前記移動端末機に割り当てられたスケジューリングイベントに対応するスケジューリングタスクドメインと、前記移動端末機での接触に対応する接触ドメインと、前記移動端末機に保存された電話番号に対応する電話帳ドメインと、前記移動端末機により提供される地図情報に対応する地図ドメインと、前記移動端末機に保存された写真に対応する写真ドメインと、前記移動端末機で送受信されるメッセージに対応するメッセージドメインと、前記移動端末機で行われるマルチメディア機能に対応するマルチメディアドメインと、前記移動端末機が接続できる外部装置に対応する外部装置ドメインと、前記移動端末機で送受信された通話に対応する通話履歴ドメインと、前記移動端末機で行われる設定機能に対応する設定ドメインのうち少なくとも２つのドメインを含むことを特徴とする請求項１５に記載の移動端末機の制御方法。