JP2015004977A

JP2015004977A - オーディオ及びテキスト間の変換のための方法及び電子装置

Info

Publication number: JP2015004977A
Application number: JP2014125070A
Authority: JP
Inventors: 兒螺高; A-Ra Go; 尚鎭金; Sang-Jin Kim
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2013-06-18
Filing date: 2014-06-18
Publication date: 2015-01-08
Also published as: KR20140146785A; US20140372123A1

Abstract

【課題】本発明は、ＴＴＳに関し、特に、オーディオ及びテキスト間の変換のための方法及び電子装置に関する。【解決手段】本発明の一側面に従うテキストをオーディオに変換する方法は、テキストをオーディオで出力するための要請を感知するステップと、上記テキストをユーザ入力保存部で確認するステップと、確認された上記テキストに対応する発音データを上記ユーザ入力保存部で確認するステップと、上記確認された発音データに該当するオーディオ信号で出力するステップとを含む。【選択図】図１

Description

本発明は、ＴＴＳ（ｔｅｘｔｔｏｓｐｅｅｃｈ）に関し、特に、オーディオ及びテキスト間の変換のための方法及び電子装置に関する。

最近、多国語端末のＴＴＳ技術が頻繁に適用されている。ＴＴＳとは、“ｔｅｘｔｔｏｓｐｅｅｃｈ”として、テキストをオーディオに変換することを称する。日本語の場合、ひらがなとカタカナの場合に容易に発音することができるが、漢字の場合には漢字辞典で発音を検索して該当漢字に合う発音をしなければならない。漢字の場合に、文脈によって異なる発音を有するが、人の名前や商号名などのような固有名詞の場合に、その発音は一般的な文脈上意味の漢字発音とは異なる。

従来のＴＴＳは、日本語漢字を日本語漢字辞典で検索して発音する。漢字の場合、文脈によって漢字辞典に保存された適切な値をマッチングして発音をするようになるが、人の名前や商号名のような一般的な意味の漢字でない場合、従来技術の場合にはユーザの意図とは異なる発音を出力するようになる。

例えば、日本語漢字の中、“光”の場合、名前に使われた場合、“ひかり（ｈｉｋａｒｉ）”あるいは“ひかる（ｈｉｋａｒｕ）”など、多様な読み方が存在する。これはその名前を使用する人のみが分かる部分で、ユーザが連絡先（または住所録）に保存するとき、ひかり、ｈｉｋａｒｉなどの発音入力を通じて“光”という漢字を保存するが、日本語ＴＴＳでは、その入力された“光”という名前が“ひかり（ｈｉｋａｒｉ）”で発音されなければならないのか、“ひかる（ｈｉｋａｒｕ）”で発音されなければならないのか分からない。

このような場合、“光”を漢字辞典の代表発音である“ひかる（ｈｉｋａｒｕ）”で発音するようになり、誤りが発生することがある。

特開２００９−２５８２９３号公報特開平０６−２０２６８４号公報

本発明の目的は、少なくとも上述した問題点及び／又は短所のうち、少なくとも一つを部分的に軽減または除去することにある。

本発明の一目的は、テキストをオーディオに変換するか、オーディオをテキストに変換する場合において、複数の発音を有することができるテキストをユーザの意図によって正確に発音するか、ユーザの意図に従う発音に基づいて該当テキストを正確に検索することができる方法を提供することにある。

本発明の他の目的は、日本語漢字、特に固有名詞に関連した漢字を正確に発音または認識することができる方法を提供することにある。

上記のような目的を達成するために、本発明の一態様によれば、テキストをオーディオに変換する方法を提供する。上記方法は、テキストをオーディオで出力するための要請を感知するステップと、上記テキストをユーザ入力保存部で確認するステップと、確認された上記テキストに対応する発音データを上記ユーザ入力保存部で確認するステップと、上記確認された発音データに該当するオーディオ信号を出力するステップと、を含む。

本発明の他の態様によれば、テキストをオーディオに変換する電子装置を提供する。上記電子装置は、ユーザ入力保存部を有する保存部と、テキストのオーディオ出力を必要とするイベントを確認し、上記テキストの発音データを上記ユーザ入力保存部で確認し、上記テキストの発音データが上記ユーザ入力保存部に存在する場合に、上記ユーザ入力保存部で確認された発音データをオーディオで出力する制御部と、を含む。

本発明のさらに他の態様によれば、オーディオをテキストに変換する電子装置を提供する。上記電子装置は、ユーザ入力保存部を有する保存部と、オーディオを発音データに変換し、上記発音データにマッピングされたテキストを上記ユーザ入力保存部で確認し、上記テキストが上記ユーザ入力保存部に存在する場合に、上記ユーザ入力保存部で確認されたテキストを出力する制御部と、を含む。

本発明による実施形態の上記及び他の態様、特徴、及び利点は、添付の図面とともに述べる以下の詳細な説明から、一層明らかになるはずである。

本発明の望ましい実施形態による電子装置を示す概略的なブロック図である。本発明の実施形態による電子装置の前面斜視図を示す図である。本発明の実施形態による電子装置の後面斜視図を示す図である。本発明の望ましい実施形態による発音情報保存方法を遂行するための電子装置の主要構成を示す図である。本発明の望ましい実施形態による発音情報保存方法を示すフローチャートである。本発明の望ましい実施形態による発音情報保存方法を説明するための図である。本発明の望ましい実施形態による発音情報保存方法を説明するための図である。本発明の望ましい実施形態による発音情報保存方法を説明するための図である。本発明の望ましい実施形態による発音情報保存方法を説明するための図である。本発明の望ましい実施形態による発音情報保存方法を説明するための図である。本発明の望ましい実施形態による発音情報保存方法を説明するための図である。本発明の望ましい実施形態による発音情報保存方法を説明するための図である。本発明の望ましい実施形態による発音情報保存方法を説明するための図である。本発明の望ましい第１の実施形態によるオーディオ及びテキスト間の変換方法を示すフローチャートである。本発明の望ましい第１の実施形態によるオーディオ及びテキスト間の変換方法を説明するための図である。本発明の望ましい第２の実施形態によるオーディオ及びテキスト間の変換方法を示すフローチャートである。本発明の望ましい第２の実施形態によるオーディオ及びテキスト間の変換方法を説明するための図である。本発明の望ましい第２の実施形態によるオーディオ及びテキスト間の変換方法を説明するための図である。電話発信画面を示す図である。

以下、本発明の好適な一実施形態を添付図面を参照しつつ詳細に説明する。下記の説明において、同一の構成要素及び部分には、可能な限り同一の符号及び番号を共通使用するものとする。また、明瞭性と簡潔性の観点から、本発明に関連した公知の機能や構成に関する具体的な説明が本発明の要旨を不明瞭にすると判断される場合には、その詳細な説明を省略する。

「第１」及び「第２」などのような序数を含む用語が様々な構成要素を説明するために使用されるが、これらの構成要素は、この用語により限定されない。この用語は、１つの構成要素を他の構成要素と区別するためにのみ使用される。例えば、本発明の権利範囲を逸脱することなく、第１の構成要素は第２の構成要素と呼ばれてもよく、同様に、第２の構成要素も第１の構成要素と呼ばれてもよい。及び／又はという用語は、複数の関連した記載の項目の組合せ又は複数の関連した記載の項目中のいずれの項目を含む。

本願に使用される用語は、本発明の実施形態の説明が単に実例を提供するためのものであって、本発明を限定するものでない。単数は文脈上これと異なることを要求しない限り、複数を含む。本願において、「含む」又は「有する」などの用語は、明細書に記載された特徴、数字、ステップ、動作、構成要素、部品又はこれらの組合せが存在することを指定しようとすることであり、一つ又はそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、又はこれらの組合せの存在又は付加の可能性を予め排除しないことと理解されるべきである。

別に定義されない限り、技術的であるか、科学的な用語を含んで、ここで使用された全ての用語は、本発明の属する技術分野における通常の知識を有する者により一般的に理解されるものと同一の意味を有する。一般的に使用される辞典に定義されているのと同様の用語は、関連技術の文脈上の意味と一致する意味を有することと解釈しなければならず、本願において明らかに定義されない限り、理想的であるか、過度に形式的な意味として解釈されない。

本発明の実施形態による電子装置は、任意の装置であり得、電子装置は、携帯端末、移動端末、通信端末、携帯用通信端末、携帯用移動端末などで称することができる。

例えば、電子装置は、スマートフォン、携帯電話、ゲーム機、ＴＶ、ディスプレイ装置、車両用ヘッドユニット、ノートブックコンピュータ、ラップトップコンピュータ、タブレット（Ｔａｂｌｅｔ）コンピュータ、ＰＭＰ（ＰｅｒｓｏｎａｌＭｅｄｉａＰｌａｙｅｒ）、ＰＤＡ（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔｓ）などであり得る。電子装置は、無線通信機能を有するポケットサイズの携帯用通信端末として具現されることができる。また、電子装置は、フレキシブル装置またはフレキシブルディスプレイ装置であり得る。

本発明の実施形態によって、電子装置の代表的な構成として携帯電話を例として説明する。このような電子装置の代表的な構成で、一部構成素子は、必要によって省略または変更可能である。

図１は、本発明の望ましい一実施形態による電子装置を示す概略的なブロック図である。

図１を参照すると、電子装置１００は、通信モジュール１２０、コネクタ１６５、及びイヤホン接続ジャック１６７のうち少なくとも一つを用いて外部装置（図示せず）と連結されることができる。このような外部装置は、電子装置１００に脱着されて有線で接続可能なイヤホン（Ｅａｒｐｈｏｎｅ）、外部スピーカ（Ｅｘｔｅｒｎａｌｓｐｅａｋｅｒ）、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリ、充電器、クレイドル／ドック（Ｃｒａｄｌｅ／Ｄｏｃｋ）、ＤＭＢアンテナ、モバイル決済関連装置、健康管理装置（血糖計など）、ゲーム機、自動車ナビゲーション装置など、多様な装置を含んでもよい。また、上記電子装置は、無線で連結可能なブルートゥース（登録商標）通信装置、ＮＦＣ（ＮｅａｒＦｉｅｌｄＣｏｍｍｕｎｉｃａｔｉｏｎ）装置、ワイファイダイレクト（ＷｉＦｉＤｉｒｅｃｔ）通信装置、無線アクセスポイント（ＡｃｃｅｓｓＰｏｉｎｔ；ＡＰ）を含んでもよい。そして、電子装置１００は、有線または無線を用いて他の携帯端末または電子装置、例えば、携帯電話、スマートフォン、タブレットＰＣ、デスクトップＰＣ及びサーバーのうち一つと接続されてもよい。

図１を参照すると、電子装置１００は、少なくとも一つのタッチスクリーン１９０及び少なくとも一つのタッチスクリーンコントローラ１９５を含む。また、電子装置１００は、制御部１１０、通信モジュール１２０、マルチメディアモジュール１４０、カメラモジュール１５０、入／出力モジュール１６０、センサモジュール１７０、保存部１７５及び電源供給部１８０を含む。

通信モジュール１２０は、移動通信モジュール１２１、サブ通信モジュール１３０及び放送通信モジュール１４１を含む。

サブ通信モジュール１３０は、無線ランモジュール１３１及び近距離通信モジュール１３２のうち少なくとも一つを含み、マルチメディアモジュール１４０は、オーディオ再生モジュール１４２及び動画再生モジュール１４３のうち少なくとも一つを含む。カメラモジュール１５０は、第１のカメラ１５１及び第２のカメラ１５２のうち少なくとも一つを含む。また、本発明の電子装置１００のカメラモジュール１５０は、電子装置１００の主な用途によって、第１及び／または第２のカメラ１５１、１５２のズームイン／ズームアウトのための円筒部１５５、円筒部１５５のズームイン／ズームアウトのために円筒部１５５の動きを制御するモータ部１５４、撮影のために光源を提供するフラッシュ１５３のうち少なくとも一つを含み得る。そして、入／出力モジュール１６０は、ボタン１６１、マイク１６２、スピーカ１６３、振動素子１６４、コネクタ１６５及びキーパッド１６６のうち少なくとも一つを含む。

制御部１１０は、ＣＰＵ１１１、電子装置１００の制御のための制御プログラムが記憶されたロム（ＲＯＭ）１１２及び電子装置１００の外部から入力される信号またはデータを記憶するか、電子装置１００で遂行される作業のための記憶領域として用いられるラム（ＲＡＭ）１１３を含んでもよい。ＣＰＵ１１１は、シングルコア、デュアルコア、トリプルコアまたはカッドコアを含んでもよい。ＣＰＵ１１１、ロム１１２及びラム１１３は、内部バス（ｂｕｓ）を通じて互いに連結されることができる。

制御部１１０は、通信モジュール１２０、マルチメディアモジュール１４０、カメラモジュール１５０、入／出力モジュール１６０、センサモジュール１７０、保存部１７５、電源供給部１８０、タッチスクリーン１９０及びタッチスクリーンコントローラ１９５を制御する。

制御部１１０は、タッチスクリーン１９０上に複数のオブジェクトまたはアイテムが表示された状態で、入力ユニット１６８、ユーザの指などのタッチ可能なユーザ入力手段がいずれか一つのオブジェクトをタッチするか、それに接近するか、それに近接するように位置することによるユーザ入力を感知し、ユーザ入力が発生したタッチスクリーン１９０上の位置に対応するオブジェクトを識別する。タッチスクリーン１９０を通じたユーザ入力は、オブジェクトを直接タッチする直接タッチ入力と、予め設定された認識距離以内にオブジェクトに接近するが、オブジェクトを直接タッチしない間接タッチ入力であるホバリング入力のうちの一つを含む。例えば、入力ユニット１６８をタッチスクリーン１９０に近く位置させると、入力ユニット１６８の直下に位置するオブジェクトが選択されることができる。本発明でユーザ入力は、タッチスクリーン１９０を通じたユーザ入力以外に、カメラモジュール１５０を通じたジェスチャ入力、ボタン１６１またはキーパッド１６６を通じたスイッチ／ボタン入力、マイク１６２を通じた音声入力などを含む。

オブジェクトまたはアイテム（または機能アイテム）は、電子装置１００のタッチスクリーン１９０上に表示されるか、表示され得るものとして、例えば、アプリケーション、メニュー、文書、ウィジェット、写真、動画、電子メール、ＳＭＳメッセージ及びＭＭＳメッセージうち少なくとも一つを表し、ユーザ入力手段により選択、実行、削除、取消、保存及び変更できる。このようなアイテムは、ボタン、アイコン（または短縮アイコン）、サムネイル映像または電子装置で少なくとも一つのオブジェクトを保存しているホルダーを包括する意味でも使用されることができる。また、このようなアイテムは、映像（ｉｍａｇｅ）、テキストなどの形態で表示されることができる。

短縮アイコンは、それぞれのアプリケーションまたは電子装置１００から基本的に提供される通話、連絡先、メニューなどの速い実行のために電子装置１００のタッチスクリーン１９０上に表示されるイメージとして、これを実行するための命令または選択が入力されると、該当アプリケーションを実行する。

また、制御部１１０は、入力ユニット１６８がタッチスクリーン１９０に接近するか、それに近接するように位置することによるホバリング（Ｈｏｖｅｒｉｎｇ）イベントのようなユーザ入力イベントを感知することができる。

制御部１１０は、予め設定されたアイテムに対して、または予め設定された方式によってユーザ入力イベントが発生されると、ユーザ入力イベントに対応する予め設定されたプログラム動作を遂行する。

制御部１１０は、制御信号を入力ユニット１６８または振動素子１６４に出力できる。このような制御信号は、振動パターンに対する情報を含むことができ、入力ユニット１６８または振動素子１６４は、このような振動パターンに従う振動を生成する。このような振動パターンに対する情報は、振動パターン自体、振動パターンの識別子などを表すことができる。またはこのような制御信号は、単純に振動生成の要請だけを含むこともできる。

電子装置１００は、その性能によって移動通信モジュール１２１、無線ランモジュール１３１、及び近距離通信モジュール１３２のうち少なくとも一つを含むことができる。

移動通信モジュール１２１は、制御部１１０の制御下、少なくとも一つ−一つまたは複数−のアンテナ（図示せず）を用いて、移動通信を通じて電子装置１００が外部電子装置と連結されるようにする。移動通信モジュール１２１は、電子装置１００に入力される電話番号を有する携帯電話（図示せず）、スマートフォン（図示せず）、タブレットＰＣまたは他の電子装置（図示せず）と音声通話、画像通話、文字メッセージ（ＳＭＳ）またはマルチメディアメッセージ（ＭＭＳ）のための無線信号を送受信する。

サブ通信モジュール１３０は、無線ランモジュール１３１と近距離通信モジュール１３２のうち少なくとも一つを含んでもよい。例えば、無線ランモジュール１３１のみを含むか、近距離通信モジュール１３２のみを含むか、または無線ランモジュール１３１と近距離通信モジュール１３２の両方を含んでもよい。

無線ランモジュール１３１は、制御部１１０の制御下、無線アクセスポイント（ＡＰ、ａｃｃｅｓｓｐｏｉｎｔ）（図示せず）が設定される場所でインターネットに接続できる。無線ランモジュール１３１は、米国電機電子学会（ＩＥＥＥ）の無線ＬＡＮ規格（ＩＥＥＥ８０２．１１ｘ）をサポートする。近距離通信モジュール１３２は、制御部１１０の制御下、電子装置１００と外部電子装置との間に無線で近距離通信をすることができる。近距離通信方式は、ブルートゥース（ｂｌｕｅｔｏｏｔｈ（登録商標）、赤外線通信（ＩｒＤＡ、ｉｎｆｒａｒｅｄＤａｔａＡｓｓｏｃｉａｔｉｏｎ）、ワイファイダイレクト（ＷｉＦｉ−Ｄｉｒｅｃｔ）通信、ＮＦＣ（ＮｅａｒＦｉｅｌｄＣｏｍｍｕｎｉｃａｔｉｏｎ）などを含んでもよい。

このようなサブ通信モジュール１３０を通じて制御部１１０は、振動パターンに従う制御信号を入力ユニット１６８に送信することができる。

放送通信モジュール１４１は、制御部１１０の制御下、放送通信アンテナ（図示せず）を通じて放送局から送出される放送信号（例、ＴＶ放送信号、ラジオ放送信号またはデータ放送信号）及び放送付加情報（例、ＥＰＳ（ＥｌｅｃｔｒｉｃＰｒｏｇｒａｍＧｕｉｄｅ）またはＥＳＧ（ＥｌｅｃｔｒｉｃＳｅｒｖｉｃｅＧｕｉｄｅ））を受信することができる。

マルチメディアモジュール１４０は、オーディオ再生モジュール１４２または動画再生モジュール１４３を含むことができる。オーディオ再生モジュール１４２は、制御部１１０の制御下、保存部１７５に保存されるか、または受信されるデジタルオーディオファイル（例、ファイル拡張子がｍｐ３、ｗｍａ、ｏｇｇまたはｗａｖであるファイル）を再生することができる。動画再生モジュール１４３は、制御部１１０の制御下、保存されるか、または受信されるデジタル動画ファイル（例、ファイル拡張子がｍｐｅｇ、ｍｐｇ、ｍｐ４、ａｖｉ、ｍｏｖ、またはｍｋｖであるファイル）を再生することができる。

マルチメディアモジュール１４０は、制御部１１０に統合されることができる。

カメラモジュール１５０は、制御部１１０の制御下、静止映像または動画を撮影する第１のカメラ１５１及び第２のカメラ１５２のうち少なくとも一つを含むことができる。また、カメラモジュール１５０は、被写体を撮影するためにズームイン／ズームアウトを遂行する円筒部１５５（ｂａｒｒｅｌｕｎｉｔ）、円筒部１５５の動きを制御するモータ部１５４、被写体を撮影するために必要な補助光源を提供するフラッシュ１５３のうち少なくとも一つを含むことができる。第１のカメラ１５１は、電子装置１００の前面に配置され、第２のカメラ１５２は、電子装置１００の背面に配置され得る。

第１及び第２のカメラ１５１、１５２は、各々レンズ系、イメージセンサなどを含み得る。第１及び第２のカメラ１５１、１５２は、各々レンズ系を通じて入力される（または撮影される）光信号を電気的なイメージ信号に変換して制御部１１０に出力し、ユーザは、このような第１及び第２のカメラ１５１、１５２を通じて動画または静止映像を撮影することができる。

入／出力モジュール１６０は、少なくとも一つのボタン１６１、少なくとも一つのマイク１６２、少なくとも一つのスピーカ１６３、少なくとも一つの振動素子１６４、コネクタ１６５、キーパッド１６６、イヤホン接続ジャック１６７及び入力ユニット１６８のうち少なくとも一つを含むことができる。そして、このような入／出力モジュール１６０は、これに限定されなく、マウス、トラックボール、ジョイスチックまたはカーソル方向キーなどのようなカーソルコントロール（ｃｕｒｓｏｒｃｏｎｔｒｏｌ）がタッチスクリーン１９０上のカーソルの動きを制御するために提供されることができる。

ボタン１６１は、電子装置１００のハウジング（またはケース）の前面、側面または背面に取り付けられてもよく、電源／ロックボタン、ボリュームボタン、メニューボタン、ホームボタン、戻るボタン（ｂａｃｋｂｕｔｔｏｎ）及び検索ボタンのうち少なくとも一つを含んでもよい。

マイク１６２は、制御部１１０の制御下、音声（ｖｏｉｃｅ）またはサウンドを受信して電気的な信号を生成する。

スピーカ１６３は、制御部１１０の制御下、様々な信号またはデータ（例えば、無線データ、放送データ、デジタルオーディオデータ、デジタル動画データなど）に対応するサウンドを電子装置１００の外部へ出力できる。スピーカ１６３は、電子装置１００の遂行機能に対応するサウンド（例えば、電話通話に対応するボタン操作音、通話接続音、相手方ユーザの音声など）を出力できる。スピーカ１６３は、電子装置１００のハウジングの適切な位置または位置らに、一つまたは複数で形成されてもよい。

振動素子１６４は、制御部１１０の制御下、電気的信号を機械的振動に切り替えることができる。例えば、振動モードにある電子装置１００は、別の装置（図示せず）から音声または画像通話が受信される場合、振動素子１６４が動作する。振動素子１６４は、電子装置１００のハウジング内に一つまたは複数で形成されてもよい。振動素子１６４は、タッチスクリーン１９０を通じたユーザ入力に対応して動作できる。

コネクタ１６５は、電子装置１００と外部電子装置または電源ソース（図示せず）を連結するためのインターフェースとして使用されることができる。制御部１１０は、コネクタ１６５に連結された有線ケーブルを通じて、電子装置１００の保存部１７５に保存されたデータを、外部電子装置に送信するか、外部電子装置からデータを受信することができる。電子装置１００は、コネクタ１６５に連結した有線ケーブルを通じて電源ソースから電力を受信するか、電源ソースを利用してバッテリー（図示せず）を充電することができる。

キーパッド１６６は、電子装置１００の制御のためにユーザからキーの入力を受信することができる。キーパッド１６６は、電子装置１００に設けられる物理的なキーパッド（図示せず）、またはタッチスクリーン１９０に表示される仮想のキーパッド（図示せず）を含む。電子装置１００に設けられる物理的なキーパッドは、電子装置１００の性能または構造によって除外されてもよい。

イヤホン接続ジャック（ＥａｒｐｈｏｎｅＣｏｎｎｅｃｔｉｎｇＪａｃｋ）１６７には、イヤホン（図示せず）が差し込まれて、電子装置１００に連結されることができる。

入力ユニット１６８は、電子装置１００内部に挿入されて保管できて、使用時には、電子装置１００から引出しまたは分離できる。このような入力ユニット１６８が挿入される電子装置１００内部の一領域には、入力ユニット１６８の装着及び脱着に対応して動作する脱／付着認識スイッチ１６９が設けられており、脱／付着認識スイッチ１６９は、入力ユニット１６８の装着及び分離に対応する信号を制御部１１０に出力する。脱／付着認識スイッチ１６９は、入力ユニット１６８の装着時、直・間接的に接触されるように構成されることができる。これによって、脱／付着認識スイッチ１６９は、入力ユニット１６８との接触可否に基づいて、入力ユニット１６８の装着または分離に対応する信号（すなわち、入力ユニット１６８の装着または分離を通知する信号）を生成して制御部１１０に出力する。

センサモジュール１７０は、電子装置１００の状態を検出する少なくとも一つのセンサを含む。例えば、センサモジュール１７０は、ユーザの電子装置１００に対する接近の可否を検出する近接センサ、電子装置１００周辺の光の量を検出する照度センサ（図示せず）、または電子装置１００の動作（例えば、電子装置１００の回転、電子装置１００の加速または振動）を検出するモーションセンサ（図示せず）、電子装置１００の回転運動を検出するジャイロスコープ、電子装置１００の加速運動を検出する加速度計、地球磁場を用いて電子装置１００の方位（ｐｏｉｎｔｏｆｔｈｅｃｏｍｐａｓｓ）を検出する地磁気センサ（Ｇｅｏ−ｍａｇｎｅｔｉｃＳｅｎｓｏｒ）、重力の作用方向を検出する重力センサ（ＧｒａｖｉｔｙＳｅｎｓｏｒ）、大気の圧力を測定して高度を検出する高度計（Ａｌｔｉｍｅｔｅｒ）、ＧＰＳモジュール１５７のうち少なくとも一つのセンサを含んでもよい。

ＧＰＳモジュール１５７は、地球の軌道上に位置する複数のＧＰＳ衛星（図示せず）から電波を受信し、ＧＰＳ衛星から電子装置１００までの電波到達時間（ＴｉｍｅｏｆＡｒｒｉｖａｌ）を利用して電子装置１００の位置を算出できる。

保存部１７５は、制御部１１０の制御下、通信モジュール１２０、マルチメディアモジュール１４０、カメラモジュール１５０、入／出力モジュール１６０、センサモジュール１７０またはタッチスクリーン１９０の動作によって入／出力される信号またはデータを保存することができる。保存部１７５は、電子装置１００または制御部１１０の制御のための制御プログラム及びアプリケーションを保存することができる。

“保存部”という用語は、保存部１７５、制御部１１０内のロム１１２及びラム１１３または電子装置１００に装着されるメモリカード（例えば、ＳＤカード、メモリスティック）などの任意のデータ保存装置を指す用語として使用される。保存部１７５は、非揮発性メモリ、揮発性メモリ、ハードディスクドライブ（ＨＤＤ）またはソリッドステートドライブ（ＳＳＤ）を含んでもよい。

また、保存部１７５は、ナビゲーション、画像通話、ゲーム、時間を基盤とするアラームアプリケーションなどのような多様な機能のアプリケーションとこれと関連したグラフィックユーザインターフェース（ｇｒａｐｈｉｃａｌｕｓｅｒｉｎｔｅｒｆａｃｅ：ＧＵＩ）を提供するためのイメージ、ユーザ情報、文書、タッチ入力を処理する方法と関連したデータベースまたはデータ、電子装置１００を駆動するのに必要な背景イメージ（メニュー画面、待機画面など）または運営プログラム、カメラモジュール１５０により撮影された映像などを保存することができる。

また、保存部１７５は、本発明にともなうオーディオ及びテキスト間の変換のための方法を実行するためのプログラム及び関連データを保存することができる。

保存部１７５は、機械（例えば、コンピュータ）で読むことができる媒体であり、機械で読むことができる媒体という用語は、機械が特定機能を遂行できるように上記機械にデータを提供する媒体として定義される。保存部１７５は、非揮発性媒体（ｎｏｎ−ｖｏｌａｔｉｌｅｍｅｄｉａ）及び揮発性媒体を含むことができる。このようなすべての媒体は、上記媒体により伝達される命令らが上記命令を上記機械で読み込む物理的機構により検出されることができるように類型のことでなければならない。

上記機械で読むことができる媒体は、これに限定されないが、フロッピー（登録商標）ディスク（ｆｌｏｐｐｙｄｉｓｋ）、フレキシブルディスク（ｆｌｅｘｉｂｌｅｄｉｓｋ）、ハードディスク、磁気テープ、ＣＤ−ＲＯＭ（ｃｏｍｐａｃｔｄｉｓｃｒｅａｄ−ｏｎｌｙｍｅｍｏｒｙ）、光学ディスク、パンチカード（ｐｕｎｃｈｃａｒｄ）、ペーパーテープ（ｐａｐｅｒｔａｐｅ）、ラム、ＰＲＯＭ（ＰｒｏｇｒａｍｍａｂｌｅＲｅａｄ−ＯｎｌｙＭｅｍｏｒｙ）、ＥＰＲＯＭ（ＥｒａｓａｂｌｅＰＲＯＭ）及びＦＬＡＳＨ−ＥＰＲＯＭのうち少なくとも一つを含む。

電源供給部１８０は、制御部１１０の制御下、電子装置１００のハウジングに配置される一つまたは複数のバッテリーに電力を供給することができる。一つまたは複数のバッテリーは、電子装置１００に電力を供給する。また、電源供給部１８０は、コネクタ１６５と連結された有線ケーブルを通じて、外部の電源ソースから入力される電源を電子装置１００に供給できる。また、電源供給部１８０は、無線充電技術を通じて、外部の電源ソースから無線で入力される電源を、電子装置１００に供給することもできる。

電子装置１００は、ユーザに多様なサービス（例、通話、データ送信、放送、写真撮影）に対応するユーザグラフィックインターフェースを提供する少なくとも一つのタッチスクリーン１９０を含むことができる。

タッチスクリーン１９０は、ユーザグラフィックインターフェースに入力される少なくとも一つのユーザ入力に対応するアナログ信号をタッチスクリーンコントローラ１９５に出力する。

タッチスクリーン１９０は、ユーザの身体（例えば、手の親指を含んだ指など）または入力ユニット１６８（例えば、スタイラスペン、電子ペンなど）を通じて、少なくとも一つのユーザ入力を受信することができる。

タッチスクリーン１９０は、一つのタッチの連続的な動き（すなわち、ドラッグ入力）を受信することもできる。タッチスクリーン１９０は、入力されるタッチの連続的な動きに対応するアナログ信号をタッチスクリーンコントローラ１９５に出力することができる。

本発明において、「タッチ」は、タッチスクリーン１９０と指または入力ユニット１６８との接触に限定されず、非接触（例えば、タッチスクリーン１９０との直接接触無しでユーザ入力手段を検出できる認識距離（例えば、１ｃｍ）以内にユーザ入力手段が位置する場合）を含んでもよい。タッチスクリーン１９０でユーザ入力手段を認識可能な距離または間隔は、電子装置１００の性能または構造によって変更でき、特にタッチスクリーン１９０は、ユーザ入力手段との接触による直接タッチイベントと、間接タッチイベント（すなわち、ホバリングイベント）を区分して検出可能であるように、上記直接タッチイベントとホバリングイベントにより検出される値（例えば、アナログ値で電圧値または電流値を含む）が相異なるように出力されるように構成されることができる。

タッチスクリーン１９０は、例えば、抵抗膜（ｒｅｓｉｓｔｉｖｅ）方式、静電容量（ｃａｐａｃｉｔｉｖｅ）方式、赤外線（ｉｎｆｒａｒｅｄ）方式、超音波（ａｃｏｕｓｔｉｃｗａｖｅ）方式、またはそれらの組合で実現できる。

また、タッチスクリーン１９０は、第１のユーザ入力手段（指などの身体一部など）による入力（すなわち、フィンガー入力）と第２のユーザ入力手段である入力ユニット１６８による入力（すなわち、ペン入力）を区分して検出できるように、フィンガー入力とペン入力を各々感知できる少なくとも二つのタッチスクリーンパネルを含むこともできる。ユーザ入力手段において、受動型と能動型の区分は、電磁波、電磁気波などのエネルギーを生成または誘導して出力することができるか否かによって区分される。上記少なくとも二つのタッチスクリーンパネルは、相異なる出力値をタッチスクリーンコントローラ１９５に提供し、タッチスクリーンコントローラ１９５は、上記少なくとも二つのタッチスクリーンパネルで入力される値を相異なるように認識して、タッチスクリーン１９０からの入力が指による入力であるか、入力ユニット１６８による入力であるかを区分することもできる。例えば、タッチスクリーン１９０は静電容量方式のタッチスクリーンパネルとＥＭＲ（Ｅｌｅｃｔｒｏｍａｇｎｅｔｉｃｒｅｓｏｎａｎｃｅ）方式のタッチスクリーンパネルが組み合わされた構造を有することができる。また、上述したように、タッチスクリーン１９０は、メニューボタン１６１ｂ、戻るボタン１６１ｃなどのようなタッチキーを含むように構成されることができるので、本発明におけるフィンガー入力またはタッチスクリーン１９０上でのフィンガー入力は、このようなタッチキー上でのタッチ入力を含む。

タッチスクリーンコントローラ１９５は、タッチスクリーン１９０から入力されたアナログ信号をデジタル信号に変換して制御部１１０へ送信する。制御部１１０は、タッチスクリーンコントローラ１９５から受信したデジタル信号を利用して、タッチスクリーン１９０を制御することができる。例えば、制御部１１０は、直接タッチイベントまたはホバリングイベントに応答してタッチスクリーン１９０に表示された短縮アイコン（図示せず）またはオブジェクトを選択または実行することができる。また、タッチスクリーンコントローラ１９５は、制御部１１０に組み込まれてもよい。

タッチスクリーンコントローラ１９５は、タッチスクリーン１９０を通じて出力される値（例えば、電流値など）を検出してユーザ入力位置だけでなく、ホバリング間隔または距離を確認することができ、確認された距離値をデジタル信号（例えば、Ｚ座標）に変換して制御部１１０に提供することもできる。また、タッチスクリーンコントローラ１９５は、タッチスクリーン１９０を通じて出力される値（例えば、電流値など）を検出してユーザ入力手段がタッチスクリーン１９０を押さえる圧力を検出することができ、確認された圧力値をデジタル信号に変換して制御部１１０に提供することもできる。

図２は、本発明の実施形態による電子装置の前面斜視図を示した図であり、図３は、本発明の実施形態による電子装置の後面斜視図を示した図である。

図２及び図３を参照すると、電子装置１００の前面１０１の中央には、タッチスクリーン１９０が配置される。タッチスクリーン１９０は、電子装置１００の前面１０１の大部分を占めるように大きく形成される。図２では、タッチスクリーン１９０にメインホーム画面が表示された例を示す。メインホーム画面は、電子装置１００の電源をオンにしたとき、タッチスクリーン１９０上に表示される初めの画面である。また、電子装置１００が、多くのページの相異なるホーム画面を有する場合、メインホーム画面は、上記多くのページのホーム画面のうち一番目のホーム画面であり得る。ホーム画面には、頻繁に使用されるアプリケーションを実行するための短縮アイコン１９１−１、１９１−２、１９１−３、メインメニュー切換えキー１９１−４、時間、天気などが表示されることができる。ユーザがメインメニュー切換えキー１９１−４を選択すると、タッチスクリーン１９０にメニュー画面が表示される。また、タッチスクリーン１９０の上段には、バッテリー充電状態、受信信号の強さ、現在時刻のような電子装置１００の状態を表示する状態バー（ＳｔａｔｕｓＢａｒ）１９２が形成されてもよい。

タッチスクリーン１９０の下部には、ホームボタン１６１ａ、メニューボタン１６１ｂ、及び戻るボタン１６１ｃのようなタッチキー、機械式ボタンまたはこれらの組み合わせが形成されてもよい。また、このようなタッチキーは、タッチスクリーン１９０の一部として構成されることができる。

ホームボタン１６１ａは、タッチスクリーン１９０にメインホーム画面（ｍａｉｎＨｏｍｅｓｃｒｅｅｎ）を表示する。例えば、タッチスクリーン１９０に、上記メインホーム画面と他のホーム画面（ａｎｙＨｏｍｅｓｃｒｅｅｎ）またはメニュー画面が表示された状態で、ホームボタン１６１ａが選択されると、タッチスクリーン１９０にメインホーム画面が表示されることができる。また、タッチスクリーン１９０上で、アプリケーションらが実行される途中、ホームボタン１６１ａが選択されると、タッチスクリーン１９０上には、図２に示したメインホーム画面がディスプレイされることができる。また、ホームボタン１６１ａは、タッチスクリーン１９０上に、最近に（ｒｅｃｅｎｔｌｙ）用いられたアプリケーションを表示するようにするか、タスクマネージャ（ＴａｓｋＭａｎａｇｅｒ）を表示するために用いてもよい。

メニューボタン１６１ｂは、タッチスクリーン１９０上に表示されることができる連結メニューを提供する。上記連結メニューには、ウィジェット追加メニュー、背景画面変更メニュー、検索メニュー、編集メニュー、環境設定メニューなどが含まれてもよい。

戻るボタン１６１ｃは、現在実行されている画面の直前に実行された画面を表示するか、最近に使われたアプリケーションを終了させる場合に使用される。

電子装置１００の前面１０１の上段（ｅｄｇｅ）には、第１のカメラ１５１、照度センサ１７０ａ、近接センサ１７０ｂ及び第１の距離／生体センサが配置されてもよい。電子装置１００の後面１０３には、第２のカメラ１５２、フラッシュ１５３、スピーカ１６３及び第２の距離／生体センサが配置されてもよい。

電子装置１００の側面１０２には、例えば、電源／ロックボタン１６１ｄ、ボリューム増加ボタン１６１ｆ及びボリューム減少ボタン１６１ｇを有するボリュームボタン１６１ｅ、放送受信のための地上波ＤＭＢアンテナ１４１ａ、一つまたは複数のマイク１６２などが配置されてもよい。ＤＭＢアンテナ１４１ａは、電子装置１００に固定されるか、着脱可能に設けられてもよい。

また、電子装置１００の下段の側面には、コネクタ１６５が形成される。コネクタ１６５には、多数の電極が取り付けられており、外部装置と有線で連結されることができる。電子装置１００の上段の側面には、イヤホン接続ジャック１６７が設けられてもよい。イヤホン接続ジャック１６７には、イヤホンが差し込まれることができる。

また、電子装置１００の下段の側面には、入力ユニット１６８が装着されることができる。入力ユニット１６８は、電子装置１００内部に挿入されて保管でき、使用時には、電子装置１００から引出し及び分離される。

制御部１１０は、電子装置１００の全般的な動作を制御し、制御部１１０は、電子装置１００内の他の構成素子を制御してオーディオ及びテキスト間の変換のための方法を遂行する。

図４は、本発明の望ましい実施形態による発音情報保存方法を遂行するための電子装置の主要構成を示す図である。

電子装置１００の主要構成は、タッチスクリーン１９０、入／出力モジュール１６０、保存部１７５及び制御部１１０を含む。

保存部１７５は、漢字辞典保存部２１０、発音データ保存部２２０及び連絡先保存部２３０を含み、発音データ保存部２２０及び連絡先保存部２３０は、ユーザが入力した情報を保存する保存部（すなわち、ユーザ入力保存部）でああり、漢字辞典保存部２１０は、ユーザ入力保存部でなく、予め情報が入力された保存部である。

制御部１１０は、タッチスクリーン１９０の画面に発音データを入力することができるウィンドウを表示する。ユーザは、入／出力モジュール１６０またはタッチスクリーン１９０を通じて発音データ（すなわち、音声記号）を入力する。この時、発音データは、ローマ字、外国語（ひらがな、カタカナのような日本語など）、ハングル、発音表記語などで表示されることができる。

制御部１１０は、保存部１７５の漢字辞典保存部２１０を検索して発音データにマッチングされるテキスト、すなわち漢字を確認する。制御部は確認された漢字をタッチスクリーン１９０の画面に表示し、ユーザが表示された漢字を選択すると、発音データを選択された漢字に切り替えて入力ウィンドウに表示する。また、制御部１１０は、発音データ及び選択された漢字を発音データ保存部２２０に互いにマッピングして保存する。

図５は、本発明の望ましい実施形態による発音情報保存方法を示すフローチャートであり、図６乃至図９は、本発明の望ましい実施形態による発音情報保存方法を説明するための図である。

発音情報保存方法は、ステップＳ１１０〜Ｓ１４０を含む。

ステップＳ１１０は、アプリケーション実行段階として、例えば、ユーザはタッチスクリーン１９０の画面に表示された多様なアイコンのうちで自身が所望するアイコンをタッチすることによって、上記アイコンにマッピングされたアプリケーションを実行することができる。

制御部１１０は、入／出力モジュール１６０、タッチスクリーン１９０、カメラモジュール１５０または通信モジュール１２０を通じてユーザ入力を受信する。ユーザは、入／出力モジュール１６０またはタッチスクリーン１９０を通じてボタン１６１、アイコンまたはメニュー項目を選択するか、マイク１６２を通じて音声命令を入力するか、カメラモジュール１５０を通じてジェスチャまたはモーション入力を遂行するか、通信モジュール１２０を通じて無線で特定命令を入力することができる。このような命令は、アプリケーション実行命令であり得、このようなアプリケーションは、任意のアプリケーションであり得、例えば、連絡先アプリケーション、音声認識アプリケーション、スケジュール管理アプリケーション、文書作成アプリケーション、ミュージックアプリケーション、インターネットアプリケーション、地図アプリケーション、カメラアプリケーション、電子メールアプリケーション、写真アプリケーション、イメージ編集アプリケーション、検索アプリケーション、ファイル探索アプリケーション、ビデオアプリケーション、ゲームアプリケーション、ＳＮＳアプリケーション、電話アプリケーション、メッセージアプリケーションなどであり得る。ジェスチャまたはモーション入力は、例えば、ユーザが手または指でカメラモジュール１５０に向けて原形、三角形、四角形などの予め設定されたパターンの軌跡を描く場合を意味する。この例では、ユーザ入力によってアプリケーションを実行すると例示しているが、このようなアプリケーションは、メッセージ受信、コール受信、アラームイベント発生などのようなイベントの発生によって自動で実行されることもできる。

図６Ａは、連絡先アプリケーション３１１が実行されたタッチスクリーン画面３１０を例示する。ユーザが新たな連絡先追加ボタン３１２を選択すると、図６Ｂに示したように、新たな連絡先追加画面３２０が表示される。

ステップＳ１２０は、発音受信段階として、制御部１１０はユーザから発音データを受信する。図６Ｂを参考すると、ユーザは新たな連絡先追加画面３２０の名前入力ウィンドウ３２１に名前を入力することができる。

ステップＳ１３０は、テキスト変換及び発音データ保存段階として、制御部１１０は、保存部１７５の漢字辞典保存部２１０を検索して発音データにマッチングされるテキスト、すなわち漢字を確認する。制御部１１０は、確認された漢字に基づいて、少なくとも一つの候補テキストを表示する。

図７Ａを参照すると、ユーザは名前入力ウィンドウ３２１に“ｎｉｎｏｍｉｙａ”（３２２）を入力し、制御部１１０は、漢字辞典保存部２１０を検索して“ｎｏｍｉ”に該当する“飲”という漢字、“ｎｉｎｏｍｉｙａ”に該当する“二宮”という漢字、“ｎｉ”及び“ｍｉｙａ”に該当する“二”及び“宮”という漢字を確認する。制御部１１０は、“にのみや“（３３１）、“に飲みや”（３３２）、“二の宮”（３３３）及び“二宮”（３３４）という候補テキストを表示する。

図７Ｂを参照すると、ユーザが“二宮”（３３４）という候補テキストを選択すると、制御部は“ｎｉｎｏｍｉｙａ”という入力発音を“二宮”（３２３）という漢字に置き換えて名前入力ウィンドウ３２１に表示する。また、制御部１１０は、“ｎｉｎｏｍｉｙａ”という入力発音及び“二宮”（３２３）という漢字を発音保存部２２０に互いにマッピングして保存する。

図８Ａを参照すると、ユーザは“ｎｉｎｏｍｉｙａ”という姓に続き名前を入力するために、名前入力ウィンドウ３２１に“二宮”に続いて“ｋａｚｕｎａｒｉ”（３２４）を入力する。

図８Ｂを参照すると、“ｎｉｎｏｍｉｙａ”と関連して上述した方式と同様に、制御部１１０は、ユーザの選択によって“ｋａｚｕｎａｒｉ”という入力発音を“和也”（３２５）という漢字に置き換えて名前入力ウィンドウ３２１に表示する。また、制御部１１０は、“ｋａｚｕｎａｒｉ”という入力発音及び“和也”という漢字を発音保存部２２０に互いにマッピングして保存する。

ステップＳ１４０は、変換されたテキストを保存する段階として、ユーザは電話番号入力ウィンドウ３４０に“二宮和也”の電話番号である“０１０１２３４５６７８“（３４１）を入力し、保存ボタン３５０を押して“二宮和也”の連絡先を保存部１７５に保存する。保存部１７５は、連絡先保存部２３０を含み、“二宮和也”の連絡先は連絡先保存部２３０に保存されることができる。

この例では、テキストが漢字であり、発音データがローマ字であることを例示しているが、本発明は、表記文字と発音文字が異なる任意の状況に適用されることができる。例えば、テキストは、中国語、ロシア語などであり、発音データは、ローマ字（すなわち、アルファベット）、ひらがな、カタカナ、ハングルなどであり得る。

この例では、漢字変換毎に発音データ及び漢字を発音データ保存部２２０に保存することを例示しているが、全体名前の漢字変換が完了した後、発音データ及び漢字を発音データ保存部２２０に保存することもできる。例えば、漢字変換の完了は、ユーザが他の入力ウィンドウを選択した場合、または保存ボタン３５０を選択した場合と判断することもできる。

この例では、制御部１１０は、“ｎｉｎｏｍｉｙａｋａｚｕｎａｒｉ”という全体発音に対して、“ｎｉｎｏｍｉｙａ”という入力発音及び“二宮”という漢字を発音データ保存部２２０に互いにマッピングして保存した後、“ｋａｚｕｎａｒｉ”という入力発音及び“和也”という漢字を発音データ保存部２２０に互いにマッピングして保存している。

下記の＜表１＞の第１の例によって、発音データ保存部２２０は、複数の発音情報を複数のレコード形態で保存することができる。

各レコードＡｉ（１≦ｉ≦ｎ、ｎは１以上の整数）は、漢字フィールドＢｉ、発音フィールドＣｉなどの情報を含むことができる。

これとは異なり、制御部１１０は、“ｎｉｎｏｍｉｙａ”という発音データ及び“二宮”という漢字を発音データ保存部２２０に互いにマッピングして保存した後、“ｋａｚｕｎａｒｉ”という発音データを“ｎｉｎｏｍｉｙａ”という発音データに追加し、“和也”という漢字を“二宮”という漢字に追加して保存することもできる。

これとは異なり、制御部１１０は、“ｎｉｎｏｍｉｙａｋａｚｕｎａｒｉ”という発音データ及び“二宮和也”という漢字を発音データ保存部２２０に互いにマッピングして保存することもできる。

下記の＜表２＞は、発音データ保存部２２０の第２の例を示す。

または、発音データ保存部２２０は、第１の例のレコードＡ１及びＡ２、第２の例のレコードＡ１の両方を含むこともできる。

下記の＜表３＞のように、漢字辞典保存部２１０も複数の漢字情報を複数のレコード形態で保存することができる。

各レコードＡｉは、漢字フィールドＢｉ、第１の発音フィールドＣｉ、第２の発音フィールドＣｉなどの情報を含むことができる。

下記の表４のように、連絡先保存部２３０も複数の連絡先情報を複数のレコード形態で保存することができる。

各レコードＡｉは、名前フィールドＢｉ、電話番号フィールドＣｉなどの情報を含むことができる。

上述した例とは異なり、下記の＜表５＞のように、発音データ保存部２２０は、連絡先保存部２３０に統合されることもできる。

例えば、漢字変換が完了した後、ユーザが名前入力ウィンドウ３２１以外の他の入力ウィンドウを選択するか、保存ボタン３５０を選択すると、制御部１１０は、発音データを自動で連絡先保存部２３０に保存することもできる。

さらに図７Ａを参照すると、ユーザが候補テキスト３３１〜３３４でなく、直接入力アイテム３３５を選択すると、ユーザは、直接“ｎｉｎｏｍｉｙａ”（３２２）という発音データを“二宮”（３２３）という漢字に置き換えて入力することができる。このような場合にも、制御部１１０は、“ｎｉｎｏｍｉｙａ”という入力発音及び“二宮”という漢字を発音データ保存部２２０に互いにマッピングして保存する。例えば、ユーザはインターネットアプリケーション、辞書アプリケーションなどの漢字検索が可能なアプリケーションを利用して、“ｎｉｎｏｍｉｙａ”という入力発音に対応する漢字を検索することができ、検索された漢字をコピーして名前入力ウィンドウ３２１に貼り付けることができる。ユーザが直接入力アイテム３３５を選択すると、インターネットアプリケーション、辞書アプリケーションなどの漢字検索が可能なアプリケーションに自動接続されることもできる。

図９Ａを参照すると、ユーザはインターネットアプリケーション画面３６０の検索ウィンドウ３６２に“ｎｉｎｏｍｉｙａ”（３２２）を入力し、検索ボタン３６４を選択することによって“ｎｉｎｏｍｉｙａ”という発音データに対応する漢字を検索することができる。また、ユーザは検索された“二宮”という漢字をコピーすることができる。

図９Ｂを参照すると、ユーザは名前入力ウィンドウの“ｎｉｎｏｍｉｙａ”（３２２ａ）を選択し、選択された“ｎｉｎｏｍｉｙａ”（３２２ａ）をペーストアイテム３７１またはクリップボードアイテム３７２を利用して検索された漢字である“二宮”に置き換える。“ｎｉｎｏｍｉｙａ”の代わりに“二宮”が表示された画面は、図７Ｂのようである。制御部１１０は、“ｎｉｎｏｍｉｙａ”という発音データ及び“二宮”という漢字を発音データ保存部２２０に互いにマッピングして保存する。

図１０は、本発明の望ましい第１の実施形態によるオーディオ及びテキスト間の変換方法を示すフローチャートである。

ステップＳ２１０は、イベント検出または確認段階として、制御部１１０は、文字メッセージ受信、コール受信、文書／文字列リーディング命令などのようなテキストをオーディオで出力することを要請するイベント（またはこのような要請）を検出または確認する。このようなイベントは、テキストのオーディオ変換が設定された任意のイベントを示す。

ステップＳ２２０は、ユーザ入力保存部検索段階として、確認されたイベントが文字メッセージ受信またはコールメッセージ受信（またはコール受信）である場合に、制御部１１０は、文字メッセージまたはコールメッセージで電話番号を抽出し、抽出された電話番号を連絡先保存部２３０で確認する。また、連絡先保存部２３０で確認された電話番号にマッピングされた名前が漢字を含む場合に、制御部１１０は、漢字を発音データ保存部２２０で確認する。

検出されたイベントが文書／文字列リーディング命令である場合に、制御部１１０は、文書または文字列に含まれた漢字を発音データ保存部２２０で検索する。

ステップＳ２３０は、検索確認段階として、制御部１１０は、発音保存部２２０で漢字の発音データが確認された場合、ステップＳ２４０を遂行し、発音保存部２２０で漢字の発音データが確認されない場合、ステップＳ２５０を遂行する。

ステップＳ２４０は、発音保存部で確認された発音データを出力する段階として、制御部１１０は、発音データ保存部２２０で確認された発音データをオーディオで出力する。

ステップＳ２５０は、漢字辞典保存部で確認された発音データを出力する段階として、制御部１１０は、漢字を漢字辞典保存部２１０で確認し、漢字辞典保存部２１０で確認された発音を出力する。漢字辞典保存部２１０で漢字にマッピングされた複数の発音が確認された場合に、制御部１１０は、複数の発音のうち、文脈に合う発音を出力するか、複数の発音のうち、代表発音を出力する。

図１１は、本発明の望ましい第１の実施形態によるオーディオ及びテキスト間の変換方法を説明するための図である。図１１は電話着信画面４１０を示し、制御部１１０は、電話着信画面４１０にコールメッセージから抽出された相手方の電話番号４２０と、連絡先保存部２３０で確認された名前４２５を表示する。制御部１１０は、予め設定された案内文句４３０（すなわち、“…から電話がきました”）に発音保存部２２０で確認された“Ｎｉｎｏｍｉｙａｋａｚｕｎａｒｉ”（４３５）という発音データを合成してオーディオで出力する。

図１２は、本発明の望ましい第２の実施形態によるオーディオ及びテキスト間の変換方法を示すフローチャートであり、図１３は、本発明の望ましい第２の実施形態によるオーディオ及びテキスト間の変換方法を説明するための図である。

ステップＳ３１０は、音声認識アプリケーションを実行する段階であり、ユーザはタッチスクリーン１９０、入／出力モジュール１６０またはカメラモジュール１５０を通じてボタン、アイコンまたはメニュー項目の選択、音声命令、ジェスチャまたはモーション入力、タッチパターンの入力などを遂行することによって、音声認識アプリケーションを実行する。

例えば、ユーザは、ホームボタン１６１ａをダブルクリックすることによって、音声認識アプリケーションを実行することができる。

図１３Ａは、音声認識アプリケーションの画面５１０を示す図である。

音声認識アプリケーションは、初期駆動されると、“どんな作業を実行しましょうか？”、または“Ｗｈａｔｗｏｕｌｄｙｏｕｌｉｋｅｔｏｄｏ？”という使用案内文句５５１をアプリケーション画面５１０に表示する。

アプリケーション画面５１０の下部には、クリックした場合に使用方法を音声で案内する音声案内ボタン５２０と、クリックした場合に音声認識モードを実行する音声認識ボタン５３０と、クリックした場合に使用方法の例を表示するヘルプボタン５４０が提供される。

ステップＳ３２０は、音声をテキストに変換する段階であり、制御部１１０は、ユーザの音声をテキストに変換する。

例えば、ユーザは“通話Ｎｉｎｏｍｉｙａｋａｚｕｎａｒｉ”という音声命令を入力することができ、制御部１１０は、ユーザの音声をテキストに変換する。

ステップＳ３３０は、発音データ保存部検索段階として、制御部１１０は、変換されたテキストで“Ｎｉｎｏｍｉｙａｋａｚｕｎａｒｉ”という発音データを抽出し、制御部１１０は、発音データを発音データ保存部２２０で検索する。

ステップＳ３４０は、検索確認段階として、制御部は、発音データ保存部２２０で発音データが確認された場合、ステップＳ３６０を遂行し、発音データ保存部２２０で発音データが確認されない場合、ステップＳ３５０を遂行する。

ステップＳ３５０は、漢字辞典保存部検索段階として、制御部１１０は、発音データを漢字辞典保存部２１０で検索する。

ステップＳ３６０は、連絡先保存部検索段階として、制御部１１０は、発音保存部２２０で確認された発音データにマッピングされたテキスト（すなわち、“二宮和也”）または漢字辞典保存部２１０で確認された発音データにマッピングされたテキストを連絡先保存部２３０で確認する。制御部は、連絡先保存部２３０で発音データにマッピングされたテキストが確認された場合、ステップＳ３７０を遂行し、連絡先保存部２３０で発音データにマッピングされたテキストが確認されない場合、この方法を終了する。

ステップＳ３７０は、命令実行段階として、制御部１１０は、“二宮和也”というテキストにマッピングされた電話番号を利用して“二宮和也”に電話をかける動作を遂行する。

図１３Ｂを参照すると、制御部１１０は、“通話Ｎｉｎｏｍｉｙａｋａｚｕｎａｒｉ”というユーザの音声命令をテキストに変換した結果５５２と、実行する動作を表すテキスト５５３（すなわち、“二宮和也様に電話をかけます”）をアプリケーション画面５１０に表示する。該当変換されたテキスト５５２は、“Ｎｉｎｏｍｉｙａｋａｚｕｎａｒｉ”（５５４）という発音データを含み、該当実行する動作を示すテキスト５５３は、発音データにマッピングされた“二宮和也”というテキスト６２０を含む。

図１４は、電話発信画面６１０を示し、制御部１１０は、電話発信画面６１０に発音データ保存部２２０及び／または連絡先保存部２３０で確認された電話番号６３０及び名前６２０を表示する。

この例とは異なり、制御部は、連絡先保存部２３０で発音データにマッピングされたテキストが確認されない場合にも、命令実行が不可能であることを示すテキスト（例えば、“二宮和也様の連絡先を探すことができません”）をアプリケーション画面５１０に表示することもできる。

上述した例において、画面を表示するディスプレイユニットの代表的な例として、タッチスクリーンを例示しているが、タッチスクリーンの代りにタッチ感知機能がない液晶表示装置（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ：ＬＣＤ）、有機発光ダイオード（ＯｒｇａｎｉｃＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｏｄｅｓ：ＯＬＥＤ）、ＬＥＤなどのような通常のディスプレイユニットを使用することもできる。

本発明によって、テキストをオーディオに変換するか、オーディオをテキストに変換する場合において、複数の発音を有することができるテキストをユーザの意図によって正確に発音するか、ユーザの意図に従う発音に基づいて該当テキストを正確に検索することができる方法が提供される。

また、本発明によって、日本語漢字、特に固有名詞に関連した漢字を正確に発音または認識することができる方法が提供される。

さらに、本発明によって、ユーザに追加要請せずに漢字入力時に使用されるひらがな、ローマ字などの発音データをそのまま利用することによって、電子装置でユーザが知っている通りの漢字発音を正確に予測できるようになる。

上記した本発明による実施形態は、ハードウェア、ソフトウェア、又はこれらの組み合わせで実現することができる。このような任意のソフトウェアは、例えば、削除可能、又は再記録可能の可否と関係なく、ＲＯＭ（Ｒｅａｄ−ＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（Ｒａｎｄｏｍ−ＡｃｃｅｓｓＭｅｍｏｒｙ）のような揮発性又は非揮発性格納装置、あるいはＣＤ（ＣｏｍｐａｃｔＤｉｓｃ）、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）、磁気ディスク、又は磁気テープのような光学あるいは磁気的に記録可能であると同時に、機械読み取り可能な記録媒体に格納され得る。電子装置内に含まれるメモリは、本発明の実施形態を実現する指示を含むプログラム又はプログラムを記録するのに適合した機械で読み取り可能な記録媒体の一例であることがわかる。したがって、本発明は、本明細書の任意の請求項に記載された装置又は方法を実現するためのコードを含むプログラム及びこのようなプログラムを記録する機械（コンピュータなど）で読み取れる格納媒体を含む。また、このようなプログラムは、有線又は無線接続を通じて伝達される通信信号のような任意の媒体を通じて、電子的に移送することができ、本発明は、これと均等であるものを適切に含む。

また、上記電子装置は、有線または無線で連結するプログラムの提供装置から、上記プログラムを受信して保存することができる。上記プログラムの提供装置は、上記電子装置が既に設定されたオーディオ及びテキスト間の変換のための方法を遂行するようにする指示を含むプログラム、オーディオ及びテキスト間の変換のための方法に必要な情報などを保存するためのメモリと、上記電子装置との有線または無線通信を遂行するための通信部と、上記電子装置の要請または自動で該当プログラムを上記電子装置へ送信する制御部とを含むことができる。

以上、本発明の詳細な説明においては具体的な実施形態に関して説明したが、特許請求の範囲の記載及びこれと均等なものに基づいて定められる本発明の範囲及び精神を逸脱することなく、形式や細部の様々な変更が可能であることは、当該技術分野における通常の知識を持つ者には明らかである。

１００電子装置
１０１前面
１０２側面
１０３後面
１１０制御部
１１２ロム
１１３ラム
１２０通信モジュール
１２１移動通信モジュール
１３０サブ通信モジュール
１３１無線ランモジュール
１３２近距離通信モジュール
１４０マルチメディアモジュール
１４１放送通信モジュール
１４１ａアンテナ
１４２オーディオ再生モジュール
１４３動画再生モジュール
１５０カメラモジュール
１５１第１のカメラ
１５２第２のカメラ
１５３フラッシュ
１５４モータ部
１５５円筒部
１５７モジュール
１６０出力モジュール
１６１ボタン
１６２マイク
１６３スピーカ
１６４振動素子
１６５コネクタ
１６６キーパッド
１６７イヤホン接続ジャック
１６８入力ユニット
１６９付着認識スイッチ
１７０センサモジュール
１８０電源供給部
１９０タッチスクリーン
１９１−１、１９１−２、１９１−３短縮アイコン
１９１−４キー
１９２状態バー（ＳｔａｔｕｓＢａｒ）
１９５タッチスクリーンコントローラ

Claims

テキストをオーディオに変換する方法であって、
テキストをオーディオで出力するための要請を感知するステップと、
前記テキストをユーザ入力保存部で確認するステップと、
確認された前記テキストに対応する発音データを前記ユーザ入力保存部で確認するステップと、
前記確認された発音データに該当するオーディオ信号を出力するステップと、を含むことを特徴とする方法。
前記テキストの発音データが前記ユーザ入力保存部に存在しない場合に、前記テキストの発音データを予め設定された辞書保存部で検索するステップと、
前記辞書保存部で確認された発音データをオーディオで出力するステップと、を含むことを特徴とする請求項１に記載の方法。
前記テキストは漢字列であることを特徴とする請求項１に記載の方法。
前記テキストをオーディオで出力するための要請は、メッセージの受信によって発生し、前記ユーザ入力保存部は、連絡先保存部及び発音保存部うちの少なくとも一つを含むことを特徴とする請求項１に記載の方法。
前記テキストの発音データを前記ユーザ入力保存部で確認するステップは、
前記メッセージから電話番号を抽出するステップと、
前記抽出された電話番号にマッピングされた前記テキストの発音データを前記ユーザ入力保存部で検索するステップと、を含むことを特徴とする請求項４に記載の方法。
前記テキストの発音データを前記ユーザ入力保存部で確認するステップは、
前記メッセージから電話番号を抽出するステップと、
前記抽出された電話番号にマッピングされた前記テキストを前記連絡先保存部で検索するステップと、
前記連絡先保存部で確認された前記テキストの発音データを前記発音保存部で検索するステップと、を含むことを特徴とする請求項４に記載の方法。
前記テキストをオーディオで出力するための要請を感知するステップの前に、
ユーザから前記発音データを受信するステップと、
前記発音データを前記テキストに変換するステップと、
自動で前記発音データ及び前記テキストを前記ユーザ入力保存部に保存するステップと、をさらに含むことを特徴とする請求項１に記載の方法。
前記ユーザから前記発音データを受信するステップの前に、ディスプレイユニットの画面に前記発音データを入力できるウィンドウを表示するステップをさらに含むことを特徴とする請求項７に記載の方法。
前記発音データにマッチングされる少なくとも一つのテキストを前記ディスプレイユニットの画面に表示するステップをさらに含み、
前記発音データを前記少なくとも一つのテキストのうちで前記ユーザが選択したテキストに変換することを特徴とする請求項８に記載の方法。
前記発音データを入力できるウィンドウは、連絡先アプリケーションを通じて提供されることを特徴とする請求項８に記載の方法。
前記発音データ及び前記テキストは、発音データ保存部に互いにマッピングされ保存され、前記テキストは、連絡先と共に連絡先保存部に保存されることを特徴とする請求項１０に記載の方法。
前記発音データに対する複数の候補テキストをユーザに表示するステップと、
前記発音データを前記複数の候補テキストのうちで前記ユーザが選択した候補テキストに置き換え、置き換えられた前記候補テキストを前記ユーザに表示するステップと、をさらに含むことを特徴とする請求項１に記載の方法。
請求項１乃至請求項１２のうちいずれか一項に従うテキストをオーディオで出力する方法を実行するためのプログラムを記録した機械で読むことができる保存媒体。
請求項１３に記載の機械で読むことができる保存媒体を含む電子装置。
テキストをオーディオに変換する電子装置であって、
ユーザ入力保存部を有する保存部と、
テキストのオーディオ出力を必要とするイベントを確認し、前記テキストの発音データを前記ユーザ入力保存部で確認し、前記テキストの発音データが前記ユーザ入力保存部に存在する場合に、前記ユーザ入力保存部で確認された発音データをオーディオで出力する制御部と、を含むことを特徴とする電子装置。
前記制御部は、
前記テキストの発音データが前記ユーザ入力保存部に存在しない場合に、前記テキストの発音データを予め設定された辞書保存部で検索し、前記辞書保存部で確認された発音データをオーディオで出力することを特徴とする請求項１５に記載の電子装置。
前記テキストは漢字列であることを特徴とする請求項１５に記載の電子装置。
オーディオをテキストに変換する電子装置であって、
ユーザ入力保存部を有する保存部と、
オーディオを発音データに変換し、前記発音データにマッピングされたテキストを前記ユーザ入力保存部で確認し、前記テキストが前記ユーザ入力保存部に存在する場合に、前記ユーザ入力保存部で確認されたテキストを出力する制御部と、を含むことを特徴とする電子装置。
前記制御部は、前記オーディオが示すユーザの命令を実行することを特徴とする請求項１８に記載の電子装置。
前記ユーザの命令は、コールメッセージまたは文字メッセージの送信命令であり、前記ユーザ入力保存部は、連絡先保存部及び発音保存部うちの少なくとも一つを含むことを特徴とする請求項１９に記載の電子装置。