JP2015004977A - オーディオ及びテキスト間の変換のための方法及び電子装置 - Google Patents

オーディオ及びテキスト間の変換のための方法及び電子装置 Download PDF

Info

Publication number
JP2015004977A
JP2015004977A JP2014125070A JP2014125070A JP2015004977A JP 2015004977 A JP2015004977 A JP 2015004977A JP 2014125070 A JP2014125070 A JP 2014125070A JP 2014125070 A JP2014125070 A JP 2014125070A JP 2015004977 A JP2015004977 A JP 2015004977A
Authority
JP
Japan
Prior art keywords
text
storage unit
pronunciation data
pronunciation
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014125070A
Other languages
English (en)
Inventor
兒螺 高
A-Ra Go
兒螺 高
尚鎭 金
Sang-Jin Kim
尚鎭 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2015004977A publication Critical patent/JP2015004977A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers

Abstract

【課題】本発明は、TTSに関し、特に、オーディオ及びテキスト間の変換のための方法及び電子装置に関する。【解決手段】本発明の一側面に従うテキストをオーディオに変換する方法は、テキストをオーディオで出力するための要請を感知するステップと、上記テキストをユーザ入力保存部で確認するステップと、確認された上記テキストに対応する発音データを上記ユーザ入力保存部で確認するステップと、上記確認された発音データに該当するオーディオ信号で出力するステップとを含む。【選択図】図1

Description

本発明は、TTS(text to speech)に関し、特に、オーディオ及びテキスト間の変換のための方法及び電子装置に関する。
最近、多国語端末のTTS技術が頻繁に適用されている。TTSとは、“text to speech”として、テキストをオーディオに変換することを称する。日本語の場合、ひらがなとカタカナの場合に容易に発音することができるが、漢字の場合には漢字辞典で発音を検索して該当漢字に合う発音をしなければならない。漢字の場合に、文脈によって異なる発音を有するが、人の名前や商号名などのような固有名詞の場合に、その発音は一般的な文脈上意味の漢字発音とは異なる。
従来のTTSは、日本語漢字を日本語漢字辞典で検索して発音する。漢字の場合、文脈によって漢字辞典に保存された適切な値をマッチングして発音をするようになるが、人の名前や商号名のような一般的な意味の漢字でない場合、従来技術の場合にはユーザの意図とは異なる発音を出力するようになる。
例えば、日本語漢字の中、“光”の場合、名前に使われた場合、“ひかり(hikari)”あるいは“ひかる(hikaru)”など、多様な読み方が存在する。これはその名前を使用する人のみが分かる部分で、ユーザが連絡先(または住所録)に保存するとき、ひかり、hikariなどの発音入力を通じて“光”という漢字を保存するが、日本語TTSでは、その入力された“光”という名前が“ひかり(hikari)”で発音されなければならないのか、“ひかる(hikaru)”で発音されなければならないのか分からない。
このような場合、“光”を漢字辞典の代表発音である“ひかる(hikaru)”で発音するようになり、誤りが発生することがある。
特開2009−258293号公報 特開平06−202684号公報
本発明の目的は、少なくとも上述した問題点及び/又は短所のうち、少なくとも一つを部分的に軽減または除去することにある。
本発明の一目的は、テキストをオーディオに変換するか、オーディオをテキストに変換する場合において、複数の発音を有することができるテキストをユーザの意図によって正確に発音するか、ユーザの意図に従う発音に基づいて該当テキストを正確に検索することができる方法を提供することにある。
本発明の他の目的は、日本語漢字、特に固有名詞に関連した漢字を正確に発音または認識することができる方法を提供することにある。
上記のような目的を達成するために、本発明の一態様によれば、テキストをオーディオに変換する方法を提供する。上記方法は、テキストをオーディオで出力するための要請を感知するステップと、上記テキストをユーザ入力保存部で確認するステップと、確認された上記テキストに対応する発音データを上記ユーザ入力保存部で確認するステップと、上記確認された発音データに該当するオーディオ信号を出力するステップと、を含む。
本発明の他の態様によれば、テキストをオーディオに変換する電子装置を提供する。上記電子装置は、ユーザ入力保存部を有する保存部と、テキストのオーディオ出力を必要とするイベントを確認し、上記テキストの発音データを上記ユーザ入力保存部で確認し、上記テキストの発音データが上記ユーザ入力保存部に存在する場合に、上記ユーザ入力保存部で確認された発音データをオーディオで出力する制御部と、を含む。
本発明のさらに他の態様によれば、オーディオをテキストに変換する電子装置を提供する。上記電子装置は、ユーザ入力保存部を有する保存部と、オーディオを発音データに変換し、上記発音データにマッピングされたテキストを上記ユーザ入力保存部で確認し、上記テキストが上記ユーザ入力保存部に存在する場合に、上記ユーザ入力保存部で確認されたテキストを出力する制御部と、を含む。
本発明による実施形態の上記及び他の態様、特徴、及び利点は、添付の図面とともに述べる以下の詳細な説明から、一層明らかになるはずである。
本発明の望ましい実施形態による電子装置を示す概略的なブロック図である。 本発明の実施形態による電子装置の前面斜視図を示す図である。 本発明の実施形態による電子装置の後面斜視図を示す図である。 本発明の望ましい実施形態による発音情報保存方法を遂行するための電子装置の主要構成を示す図である。 本発明の望ましい実施形態による発音情報保存方法を示すフローチャートである。 本発明の望ましい実施形態による発音情報保存方法を説明するための図である。 本発明の望ましい実施形態による発音情報保存方法を説明するための図である。 本発明の望ましい実施形態による発音情報保存方法を説明するための図である。 本発明の望ましい実施形態による発音情報保存方法を説明するための図である。 本発明の望ましい実施形態による発音情報保存方法を説明するための図である。 本発明の望ましい実施形態による発音情報保存方法を説明するための図である。 本発明の望ましい実施形態による発音情報保存方法を説明するための図である。 本発明の望ましい実施形態による発音情報保存方法を説明するための図である。 本発明の望ましい第1の実施形態によるオーディオ及びテキスト間の変換方法を示すフローチャートである。 本発明の望ましい第1の実施形態によるオーディオ及びテキスト間の変換方法を説明するための図である。 本発明の望ましい第2の実施形態によるオーディオ及びテキスト間の変換方法を示すフローチャートである。 本発明の望ましい第2の実施形態によるオーディオ及びテキスト間の変換方法を説明するための図である。 本発明の望ましい第2の実施形態によるオーディオ及びテキスト間の変換方法を説明するための図である。 電話発信画面を示す図である。
以下、本発明の好適な一実施形態を添付図面を参照しつつ詳細に説明する。下記の説明において、同一の構成要素及び部分には、可能な限り同一の符号及び番号を共通使用するものとする。また、明瞭性と簡潔性の観点から、本発明に関連した公知の機能や構成に関する具体的な説明が本発明の要旨を不明瞭にすると判断される場合には、その詳細な説明を省略する。
「第1」及び「第2」などのような序数を含む用語が様々な構成要素を説明するために使用されるが、これらの構成要素は、この用語により限定されない。この用語は、1つの構成要素を他の構成要素と区別するためにのみ使用される。例えば、本発明の権利範囲を逸脱することなく、第1の構成要素は第2の構成要素と呼ばれてもよく、同様に、第2の構成要素も第1の構成要素と呼ばれてもよい。及び/又はという用語は、複数の関連した記載の項目の組合せ又は複数の関連した記載の項目中のいずれの項目を含む。
本願に使用される用語は、本発明の実施形態の説明が単に実例を提供するためのものであって、本発明を限定するものでない。単数は文脈上これと異なることを要求しない限り、複数を含む。本願において、「含む」又は「有する」などの用語は、明細書に記載された特徴、数字、ステップ、動作、構成要素、部品又はこれらの組合せが存在することを指定しようとすることであり、一つ又はそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、又はこれらの組合せの存在又は付加の可能性を予め排除しないことと理解されるべきである。
別に定義されない限り、技術的であるか、科学的な用語を含んで、ここで使用された全ての用語は、本発明の属する技術分野における通常の知識を有する者により一般的に理解されるものと同一の意味を有する。一般的に使用される辞典に定義されているのと同様の用語は、関連技術の文脈上の意味と一致する意味を有することと解釈しなければならず、本願において明らかに定義されない限り、理想的であるか、過度に形式的な意味として解釈されない。
本発明の実施形態による電子装置は、任意の装置であり得、電子装置は、携帯端末、移動端末、通信端末、携帯用通信端末、携帯用移動端末などで称することができる。
例えば、電子装置は、スマートフォン、携帯電話、ゲーム機、TV、ディスプレイ装置、車両用ヘッドユニット、ノートブックコンピュータ、ラップトップコンピュータ、タブレット(Tablet)コンピュータ、PMP(Personal Media Player)、PDA(Personal Digital Assistants)などであり得る。電子装置は、無線通信機能を有するポケットサイズの携帯用通信端末として具現されることができる。また、電子装置は、フレキシブル装置またはフレキシブルディスプレイ装置であり得る。
本発明の実施形態によって、電子装置の代表的な構成として携帯電話を例として説明する。このような電子装置の代表的な構成で、一部構成素子は、必要によって省略または変更可能である。
図1は、本発明の望ましい一実施形態による電子装置を示す概略的なブロック図である。
図1を参照すると、電子装置100は、通信モジュール120、コネクタ165、及びイヤホン接続ジャック167のうち少なくとも一つを用いて外部装置(図示せず)と連結されることができる。このような外部装置は、電子装置100に脱着されて有線で接続可能なイヤホン(Earphone)、外部スピーカ(External speaker)、USB(Universal Serial Bus)メモリ、充電器、クレイドル/ドック(Cradle/Dock)、DMBアンテナ、モバイル決済関連装置、健康管理装置(血糖計など)、ゲーム機、自動車ナビゲーション装置など、多様な装置を含んでもよい。また、上記電子装置は、無線で連結可能なブルートゥース(登録商標)通信装置、NFC(Near Field Communication)装置、ワイファイダイレクト(WiFi Direct)通信装置、無線アクセスポイント(Access Point;AP)を含んでもよい。そして、電子装置100は、有線または無線を用いて他の携帯端末または電子装置、例えば、携帯電話、スマートフォン、タブレットPC、デスクトップPC及びサーバーのうち一つと接続されてもよい。
図1を参照すると、電子装置100は、少なくとも一つのタッチスクリーン190及び少なくとも一つのタッチスクリーンコントローラ195を含む。また、電子装置100は、制御部110、通信モジュール120、マルチメディアモジュール140、カメラモジュール150、入/出力モジュール160、センサモジュール170、保存部175及び電源供給部180を含む。
通信モジュール120は、移動通信モジュール121、サブ通信モジュール130及び放送通信モジュール141を含む。
サブ通信モジュール130は、無線ランモジュール131及び近距離通信モジュール132のうち少なくとも一つを含み、マルチメディアモジュール140は、オーディオ再生モジュール142及び動画再生モジュール143のうち少なくとも一つを含む。カメラモジュール150は、第1のカメラ151及び第2のカメラ152のうち少なくとも一つを含む。また、本発明の電子装置100のカメラモジュール150は、電子装置100の主な用途によって、第1及び/または第2のカメラ151、152のズームイン/ズームアウトのための円筒部155、円筒部155のズームイン/ズームアウトのために円筒部155の動きを制御するモータ部154、撮影のために光源を提供するフラッシュ153のうち少なくとも一つを含み得る。そして、入/出力モジュール160は、ボタン161、マイク162、スピーカ163、振動素子164、コネクタ165及びキーパッド166のうち少なくとも一つを含む。
制御部110は、CPU111、電子装置100の制御のための制御プログラムが記憶されたロム(ROM)112及び電子装置100の外部から入力される信号またはデータを記憶するか、電子装置100で遂行される作業のための記憶領域として用いられるラム(RAM)113を含んでもよい。CPU111は、シングルコア、デュアルコア、トリプルコアまたはカッドコアを含んでもよい。CPU111、ロム112及びラム113は、内部バス(bus)を通じて互いに連結されることができる。
制御部110は、通信モジュール120、マルチメディアモジュール140、カメラモジュール150、入/出力モジュール160、センサモジュール170、保存部175、電源供給部180、タッチスクリーン190及びタッチスクリーンコントローラ195を制御する。
制御部110は、タッチスクリーン190上に複数のオブジェクトまたはアイテムが表示された状態で、入力ユニット168、ユーザの指などのタッチ可能なユーザ入力手段がいずれか一つのオブジェクトをタッチするか、それに接近するか、それに近接するように位置することによるユーザ入力を感知し、ユーザ入力が発生したタッチスクリーン190上の位置に対応するオブジェクトを識別する。タッチスクリーン190を通じたユーザ入力は、オブジェクトを直接タッチする直接タッチ入力と、予め設定された認識距離以内にオブジェクトに接近するが、オブジェクトを直接タッチしない間接タッチ入力であるホバリング入力のうちの一つを含む。例えば、入力ユニット168をタッチスクリーン190に近く位置させると、入力ユニット168の直下に位置するオブジェクトが選択されることができる。本発明でユーザ入力は、タッチスクリーン190を通じたユーザ入力以外に、カメラモジュール150を通じたジェスチャ入力、ボタン161またはキーパッド166を通じたスイッチ/ボタン入力、マイク162を通じた音声入力などを含む。
オブジェクトまたはアイテム(または機能アイテム)は、電子装置100のタッチスクリーン190上に表示されるか、表示され得るものとして、例えば、アプリケーション、メニュー、文書、ウィジェット、写真、動画、電子メール、SMSメッセージ及びMMSメッセージうち少なくとも一つを表し、ユーザ入力手段により選択、実行、削除、取消、保存及び変更できる。このようなアイテムは、ボタン、アイコン(または短縮アイコン)、サムネイル映像または電子装置で少なくとも一つのオブジェクトを保存しているホルダーを包括する意味でも使用されることができる。また、このようなアイテムは、映像(image)、テキストなどの形態で表示されることができる。
短縮アイコンは、それぞれのアプリケーションまたは電子装置100から基本的に提供される通話、連絡先、メニューなどの速い実行のために電子装置100のタッチスクリーン190上に表示されるイメージとして、これを実行するための命令または選択が入力されると、該当アプリケーションを実行する。
また、制御部110は、入力ユニット168がタッチスクリーン190に接近するか、それに近接するように位置することによるホバリング(Hovering)イベントのようなユーザ入力イベントを感知することができる。
制御部110は、予め設定されたアイテムに対して、または予め設定された方式によってユーザ入力イベントが発生されると、ユーザ入力イベントに対応する予め設定されたプログラム動作を遂行する。
制御部110は、制御信号を入力ユニット168または振動素子164に出力できる。このような制御信号は、振動パターンに対する情報を含むことができ、入力ユニット168または振動素子164は、このような振動パターンに従う振動を生成する。このような振動パターンに対する情報は、振動パターン自体、振動パターンの識別子などを表すことができる。またはこのような制御信号は、単純に振動生成の要請だけを含むこともできる。
電子装置100は、その性能によって移動通信モジュール121、無線ランモジュール131、及び近距離通信モジュール132のうち少なくとも一つを含むことができる。
移動通信モジュール121は、制御部110の制御下、少なくとも一つ−一つまたは複数−のアンテナ(図示せず)を用いて、移動通信を通じて電子装置100が外部電子装置と連結されるようにする。移動通信モジュール121は、電子装置100に入力される電話番号を有する携帯電話(図示せず)、スマートフォン(図示せず)、タブレットPCまたは他の電子装置(図示せず)と音声通話、画像通話、文字メッセージ(SMS)またはマルチメディアメッセージ(MMS)のための無線信号を送受信する。
サブ通信モジュール130は、無線ランモジュール131と近距離通信モジュール132のうち少なくとも一つを含んでもよい。例えば、無線ランモジュール131のみを含むか、近距離通信モジュール132のみを含むか、または無線ランモジュール131と近距離通信モジュール132の両方を含んでもよい。
無線ランモジュール131は、制御部110の制御下、無線アクセスポイント(AP、access point)(図示せず)が設定される場所でインターネットに接続できる。無線ランモジュール131は、米国電機電子学会(IEEE)の無線LAN規格(IEEE802.11x)をサポートする。近距離通信モジュール132は、制御部110の制御下、電子装置100と外部電子装置との間に無線で近距離通信をすることができる。近距離通信方式は、ブルートゥース(bluetooth(登録商標)、赤外線通信(IrDA、infrared Data Association)、ワイファイダイレクト(WiFi−Direct)通信、NFC(Near Field Communication)などを含んでもよい。
このようなサブ通信モジュール130を通じて制御部110は、振動パターンに従う制御信号を入力ユニット168に送信することができる。
放送通信モジュール141は、制御部110の制御下、放送通信アンテナ(図示せず)を通じて放送局から送出される放送信号(例、TV放送信号、ラジオ放送信号またはデータ放送信号)及び放送付加情報(例、EPS(Electric Program Guide)またはESG(Electric Service Guide))を受信することができる。
マルチメディアモジュール140は、オーディオ再生モジュール142または動画再生モジュール143を含むことができる。オーディオ再生モジュール142は、制御部110の制御下、保存部175に保存されるか、または受信されるデジタルオーディオファイル(例、ファイル拡張子がmp3、wma、oggまたはwavであるファイル)を再生することができる。動画再生モジュール143は、制御部110の制御下、保存されるか、または受信されるデジタル動画ファイル(例、ファイル拡張子がmpeg、mpg、mp4、avi、mov、またはmkvであるファイル)を再生することができる。
マルチメディアモジュール140は、制御部110に統合されることができる。
カメラモジュール150は、制御部110の制御下、静止映像または動画を撮影する第1のカメラ151及び第2のカメラ152のうち少なくとも一つを含むことができる。また、カメラモジュール150は、被写体を撮影するためにズームイン/ズームアウトを遂行する円筒部155(barrel unit)、円筒部155の動きを制御するモータ部154、被写体を撮影するために必要な補助光源を提供するフラッシュ153のうち少なくとも一つを含むことができる。第1のカメラ151は、電子装置100の前面に配置され、第2のカメラ152は、電子装置100の背面に配置され得る。
第1及び第2のカメラ151、152は、各々レンズ系、イメージセンサなどを含み得る。第1及び第2のカメラ151、152は、各々レンズ系を通じて入力される(または撮影される)光信号を電気的なイメージ信号に変換して制御部110に出力し、ユーザは、このような第1及び第2のカメラ151、152を通じて動画または静止映像を撮影することができる。
入/出力モジュール160は、少なくとも一つのボタン161、少なくとも一つのマイク162、少なくとも一つのスピーカ163、少なくとも一つの振動素子164、コネクタ165、キーパッド166、イヤホン接続ジャック167及び入力ユニット168のうち少なくとも一つを含むことができる。そして、このような入/出力モジュール160は、これに限定されなく、マウス、トラックボール、ジョイスチックまたはカーソル方向キーなどのようなカーソルコントロール(cursor control)がタッチスクリーン190上のカーソルの動きを制御するために提供されることができる。
ボタン161は、電子装置100のハウジング(またはケース)の前面、側面または背面に取り付けられてもよく、電源/ロックボタン、ボリュームボタン、メニューボタン、ホームボタン、戻るボタン(back button)及び検索ボタンのうち少なくとも一つを含んでもよい。
マイク162は、制御部110の制御下、音声(voice)またはサウンドを受信して電気的な信号を生成する。
スピーカ163は、制御部110の制御下、様々な信号またはデータ(例えば、無線データ、放送データ、デジタルオーディオデータ、デジタル動画データなど)に対応するサウンドを電子装置100の外部へ出力できる。スピーカ163は、電子装置100の遂行機能に対応するサウンド(例えば、電話通話に対応するボタン操作音、通話接続音、相手方ユーザの音声など)を出力できる。スピーカ163は、電子装置100のハウジングの適切な位置または位置らに、一つまたは複数で形成されてもよい。
振動素子164は、制御部110の制御下、電気的信号を機械的振動に切り替えることができる。例えば、振動モードにある電子装置100は、別の装置(図示せず)から音声または画像通話が受信される場合、振動素子164が動作する。振動素子164は、電子装置100のハウジング内に一つまたは複数で形成されてもよい。振動素子164は、タッチスクリーン190を通じたユーザ入力に対応して動作できる。
コネクタ165は、電子装置100と外部電子装置または電源ソース(図示せず)を連結するためのインターフェースとして使用されることができる。制御部110は、コネクタ165に連結された有線ケーブルを通じて、電子装置100の保存部175に保存されたデータを、外部電子装置に送信するか、外部電子装置からデータを受信することができる。電子装置100は、コネクタ165に連結した有線ケーブルを通じて電源ソースから電力を受信するか、電源ソースを利用してバッテリー(図示せず)を充電することができる。
キーパッド166は、電子装置100の制御のためにユーザからキーの入力を受信することができる。キーパッド166は、電子装置100に設けられる物理的なキーパッド(図示せず)、またはタッチスクリーン190に表示される仮想のキーパッド(図示せず)を含む。電子装置100に設けられる物理的なキーパッドは、電子装置100の性能または構造によって除外されてもよい。
イヤホン接続ジャック(Earphone Connecting Jack)167には、イヤホン(図示せず)が差し込まれて、電子装置100に連結されることができる。
入力ユニット168は、電子装置100内部に挿入されて保管できて、使用時には、電子装置100から引出しまたは分離できる。このような入力ユニット168が挿入される電子装置100内部の一領域には、入力ユニット168の装着及び脱着に対応して動作する脱/付着認識スイッチ169が設けられており、脱/付着認識スイッチ169は、入力ユニット168の装着及び分離に対応する信号を制御部110に出力する。脱/付着認識スイッチ169は、入力ユニット168の装着時、直・間接的に接触されるように構成されることができる。これによって、脱/付着認識スイッチ169は、入力ユニット168との接触可否に基づいて、入力ユニット168の装着または分離に対応する信号(すなわち、入力ユニット168の装着または分離を通知する信号)を生成して制御部110に出力する。
センサモジュール170は、電子装置100の状態を検出する少なくとも一つのセンサを含む。例えば、センサモジュール170は、ユーザの電子装置100に対する接近の可否を検出する近接センサ、電子装置100周辺の光の量を検出する照度センサ(図示せず)、または電子装置100の動作(例えば、電子装置100の回転、電子装置100の加速または振動)を検出するモーションセンサ(図示せず)、電子装置100の回転運動を検出するジャイロスコープ、電子装置100の加速運動を検出する加速度計、地球磁場を用いて電子装置100の方位(point of the compass)を検出する地磁気センサ(Geo−magnetic Sensor)、重力の作用方向を検出する重力センサ(Gravity Sensor)、大気の圧力を測定して高度を検出する高度計(Altimeter)、GPSモジュール157のうち少なくとも一つのセンサを含んでもよい。
GPSモジュール157は、地球の軌道上に位置する複数のGPS衛星(図示せず)から電波を受信し、GPS衛星から電子装置100までの電波到達時間(Time of Arrival)を利用して電子装置100の位置を算出できる。
保存部175は、制御部110の制御下、通信モジュール120、マルチメディアモジュール140、カメラモジュール150、入/出力モジュール160、センサモジュール170またはタッチスクリーン190の動作によって入/出力される信号またはデータを保存することができる。保存部175は、電子装置100または制御部110の制御のための制御プログラム及びアプリケーションを保存することができる。
“保存部”という用語は、保存部175、制御部110内のロム112及びラム113または電子装置100に装着されるメモリカード(例えば、SDカード、メモリスティック)などの任意のデータ保存装置を指す用語として使用される。保存部175は、非揮発性メモリ、揮発性メモリ、ハードディスクドライブ(HDD)またはソリッドステートドライブ(SSD)を含んでもよい。
また、保存部175は、ナビゲーション、画像通話、ゲーム、時間を基盤とするアラームアプリケーションなどのような多様な機能のアプリケーションとこれと関連したグラフィックユーザインターフェース(graphical user interface:GUI)を提供するためのイメージ、ユーザ情報、文書、タッチ入力を処理する方法と関連したデータベースまたはデータ、電子装置100を駆動するのに必要な背景イメージ(メニュー画面、待機画面など)または運営プログラム、カメラモジュール150により撮影された映像などを保存することができる。
また、保存部175は、本発明にともなうオーディオ及びテキスト間の変換のための方法を実行するためのプログラム及び関連データを保存することができる。
保存部175は、機械(例えば、コンピュータ)で読むことができる媒体であり、機械で読むことができる媒体という用語は、機械が特定機能を遂行できるように上記機械にデータを提供する媒体として定義される。保存部175は、非揮発性媒体(non−volatile media)及び揮発性媒体を含むことができる。このようなすべての媒体は、上記媒体により伝達される命令らが上記命令を上記機械で読み込む物理的機構により検出されることができるように類型のことでなければならない。
上記機械で読むことができる媒体は、これに限定されないが、フロッピー(登録商標)ディスク(floppy disk)、フレキシブルディスク(flexible disk)、ハードディスク、磁気テープ、CD−ROM(compact disc read−only memory)、光学ディスク、パンチカード(punch card)、ペーパーテープ(paper tape)、ラム、PROM(Programmable Read−Only Memory)、EPROM(Erasable PROM)及びFLASH−EPROMのうち少なくとも一つを含む。
電源供給部180は、制御部110の制御下、電子装置100のハウジングに配置される一つまたは複数のバッテリーに電力を供給することができる。一つまたは複数のバッテリーは、電子装置100に電力を供給する。また、電源供給部180は、コネクタ165と連結された有線ケーブルを通じて、外部の電源ソースから入力される電源を電子装置100に供給できる。また、電源供給部180は、無線充電技術を通じて、外部の電源ソースから無線で入力される電源を、電子装置100に供給することもできる。
電子装置100は、ユーザに多様なサービス(例、通話、データ送信、放送、写真撮影)に対応するユーザグラフィックインターフェースを提供する少なくとも一つのタッチスクリーン190を含むことができる。
タッチスクリーン190は、ユーザグラフィックインターフェースに入力される少なくとも一つのユーザ入力に対応するアナログ信号をタッチスクリーンコントローラ195に出力する。
タッチスクリーン190は、ユーザの身体(例えば、手の親指を含んだ指など)または入力ユニット168(例えば、スタイラスペン、電子ペンなど)を通じて、少なくとも一つのユーザ入力を受信することができる。
タッチスクリーン190は、一つのタッチの連続的な動き(すなわち、ドラッグ入力)を受信することもできる。タッチスクリーン190は、入力されるタッチの連続的な動きに対応するアナログ信号をタッチスクリーンコントローラ195に出力することができる。
本発明において、「タッチ」は、タッチスクリーン190と指または入力ユニット168との接触に限定されず、非接触(例えば、タッチスクリーン190との直接接触無しでユーザ入力手段を検出できる認識距離(例えば、1cm)以内にユーザ入力手段が位置する場合)を含んでもよい。タッチスクリーン190でユーザ入力手段を認識可能な距離または間隔は、電子装置100の性能または構造によって変更でき、特にタッチスクリーン190は、ユーザ入力手段との接触による直接タッチイベントと、間接タッチイベント(すなわち、ホバリングイベント)を区分して検出可能であるように、上記直接タッチイベントとホバリングイベントにより検出される値(例えば、アナログ値で電圧値または電流値を含む)が相異なるように出力されるように構成されることができる。
タッチスクリーン190は、例えば、抵抗膜(resistive)方式、静電容量(capacitive)方式、赤外線(infrared)方式、超音波(acoustic wave)方式、またはそれらの組合で実現できる。
また、タッチスクリーン190は、第1のユーザ入力手段(指などの身体一部など)による入力(すなわち、フィンガー入力)と第2のユーザ入力手段である入力ユニット168による入力(すなわち、ペン入力)を区分して検出できるように、フィンガー入力とペン入力を各々感知できる少なくとも二つのタッチスクリーンパネルを含むこともできる。ユーザ入力手段において、受動型と能動型の区分は、電磁波、電磁気波などのエネルギーを生成または誘導して出力することができるか否かによって区分される。上記少なくとも二つのタッチスクリーンパネルは、相異なる出力値をタッチスクリーンコントローラ195に提供し、タッチスクリーンコントローラ195は、上記少なくとも二つのタッチスクリーンパネルで入力される値を相異なるように認識して、タッチスクリーン190からの入力が指による入力であるか、入力ユニット168による入力であるかを区分することもできる。例えば、タッチスクリーン190は 静電容量方式のタッチスクリーンパネルとEMR(Electromagnetic r esonance)方式のタッチスクリーンパネルが組み合わされた構造を有することができる。また、上述したように、タッチスクリーン190は、メニューボタン161b、戻るボタン161cなどのようなタッチキーを含むように構成されることができるので、本発明におけるフィンガー入力またはタッチスクリーン190上でのフィンガー入力は、このようなタッチキー上でのタッチ入力を含む。
タッチスクリーンコントローラ195は、タッチスクリーン190から入力されたアナログ信号をデジタル信号に変換して制御部110へ送信する。制御部110は、タッチスクリーンコントローラ195から受信したデジタル信号を利用して、タッチスクリーン190を制御することができる。例えば、制御部110は、直接タッチイベントまたはホバリングイベントに応答してタッチスクリーン190に表示された短縮アイコン(図示せず)またはオブジェクトを選択または実行することができる。また、タッチスクリーンコントローラ195は、制御部110に組み込まれてもよい。
タッチスクリーンコントローラ195は、タッチスクリーン190を通じて出力される値(例えば、電流値など)を検出してユーザ入力位置だけでなく、ホバリング間隔または距離を確認することができ、確認された距離値をデジタル信号(例えば、Z座標)に変換して制御部110に提供することもできる。また、タッチスクリーンコントローラ195は、タッチスクリーン190を通じて出力される値(例えば、電流値など)を検出してユーザ入力手段がタッチスクリーン190を押さえる圧力を検出することができ、確認された圧力値をデジタル信号に変換して制御部110に提供することもできる。
図2は、本発明の実施形態による電子装置の前面斜視図を示した図であり、図3は、本発明の実施形態による電子装置の後面斜視図を示した図である。
図2及び図3を参照すると、電子装置100の前面101の中央には、タッチスクリーン190が配置される。タッチスクリーン190は、電子装置100の前面101の大部分を占めるように大きく形成される。図2では、タッチスクリーン190にメインホーム画面が表示された例を示す。メインホーム画面は、電子装置100の電源をオンにしたとき、タッチスクリーン190上に表示される初めの画面である。また、電子装置100が、多くのページの相異なるホーム画面を有する場合、メインホーム画面は、上記多くのページのホーム画面のうち一番目のホーム画面であり得る。ホーム画面には、頻繁に使用されるアプリケーションを実行するための短縮アイコン191−1、191−2、191−3、メインメニュー切換えキー191−4、時間、天気などが表示されることができる。ユーザがメインメニュー切換えキー191−4を選択すると、タッチスクリーン190にメニュー画面が表示される。また、タッチスクリーン190の上段には、バッテリー充電状態、受信信号の強さ、現在時刻のような電子装置100の状態を表示する状態バー(Status Bar)192が形成されてもよい。
タッチスクリーン190の下部には、ホームボタン161a、メニューボタン161b、及び戻るボタン161cのようなタッチキー、機械式ボタンまたはこれらの組み合わせが形成されてもよい。また、このようなタッチキーは、タッチスクリーン190の一部として構成されることができる。
ホームボタン161aは、タッチスクリーン190にメインホーム画面(main Home screen)を表示する。例えば、タッチスクリーン190に、上記メインホーム画面と他のホーム画面(any Home screen)またはメニュー画面が表示された状態で、ホームボタン161aが選択されると、タッチスクリーン190にメインホーム画面が表示されることができる。また、タッチスクリーン190上で、アプリケーションらが実行される途中、ホームボタン161aが選択されると、タッチスクリーン190上には、図2に示したメインホーム画面がディスプレイされることができる。また、ホームボタン161aは、タッチスクリーン190上に、最近に(recently)用いられたアプリケーションを表示するようにするか、タスクマネージャ(Task Manager)を表示するために用いてもよい。
メニューボタン161bは、タッチスクリーン190上に表示されることができる連結メニューを提供する。上記連結メニューには、ウィジェット追加メニュー、背景画面変更メニュー、検索メニュー、編集メニュー、環境設定メニューなどが含まれてもよい。
戻るボタン161cは、現在実行されている画面の直前に実行された画面を表示するか、最近に使われたアプリケーションを終了させる場合に使用される。
電子装置100の前面101の上段(edge)には、第1のカメラ151、照度センサ170a、近接センサ170b及び第1の距離/生体センサが配置されてもよい。電子装置100の後面103には、第2のカメラ152、フラッシュ153、スピーカ163及び第2の距離/生体センサが配置されてもよい。
電子装置100の側面102には、例えば、電源/ロックボタン161d、ボリューム増加ボタン161f及びボリューム減少ボタン161gを有するボリュームボタン161e、放送受信のための地上波DMBアンテナ141a、一つまたは複数のマイク162などが配置されてもよい。DMBアンテナ141aは、電子装置100に固定されるか、着脱可能に設けられてもよい。
また、電子装置100の下段の側面には、コネクタ165が形成される。コネクタ165には、多数の電極が取り付けられており、外部装置と有線で連結されることができる。電子装置100の上段の側面には、イヤホン接続ジャック167が設けられてもよい。イヤホン接続ジャック167には、イヤホンが差し込まれることができる。
また、電子装置100の下段の側面には、入力ユニット168が装着されることができる。入力ユニット168は、電子装置100内部に挿入されて保管でき、使用時には、電子装置100から引出し及び分離される。
制御部110は、電子装置100の全般的な動作を制御し、制御部110は、電子装置100内の他の構成素子を制御してオーディオ及びテキスト間の変換のための方法を遂行する。
図4は、本発明の望ましい実施形態による発音情報保存方法を遂行するための電子装置の主要構成を示す図である。
電子装置100の主要構成は、タッチスクリーン190、入/出力モジュール160、保存部175及び制御部110を含む。
保存部175は、漢字辞典保存部210、発音データ保存部220及び連絡先保存部230を含み、発音データ保存部220及び連絡先保存部230は、ユーザが入力した情報を保存する保存部(すなわち、ユーザ入力保存部)でああり、漢字辞典保存部210は、ユーザ入力保存部でなく、予め情報が入力された保存部である。
制御部110は、タッチスクリーン190の画面に発音データを入力することができるウィンドウを表示する。ユーザは、入/出力モジュール160またはタッチスクリーン190を通じて発音データ(すなわち、音声記号)を入力する。この時、発音データは、ローマ字、外国語(ひらがな、カタカナのような日本語など)、ハングル、発音表記語などで表示されることができる。
制御部110は、保存部175の漢字辞典保存部210を検索して発音データにマッチングされるテキスト、すなわち漢字を確認する。制御部は確認された漢字をタッチスクリーン190の画面に表示し、ユーザが表示された漢字を選択すると、発音データを選択された漢字に切り替えて入力ウィンドウに表示する。また、制御部110は、発音データ及び選択された漢字を発音データ保存部220に互いにマッピングして保存する。
図5は、本発明の望ましい実施形態による発音情報保存方法を示すフローチャートであり、図6乃至図9は、本発明の望ましい実施形態による発音情報保存方法を説明するための図である。
発音情報保存方法は、ステップS110〜S140を含む。
ステップS110は、アプリケーション実行段階として、例えば、ユーザはタッチスクリーン190の画面に表示された多様なアイコンのうちで自身が所望するアイコンをタッチすることによって、上記アイコンにマッピングされたアプリケーションを実行することができる。
制御部110は、入/出力モジュール160、タッチスクリーン190、カメラモジュール150または通信モジュール120を通じてユーザ入力を受信する。ユーザは、入/出力モジュール160またはタッチスクリーン190を通じてボタン161、アイコンまたはメニュー項目を選択するか、マイク162を通じて音声命令を入力するか、カメラモジュール150を通じてジェスチャまたはモーション入力を遂行するか、通信モジュール120を通じて無線で特定命令を入力することができる。このような命令は、アプリケーション実行命令であり得、このようなアプリケーションは、任意のアプリケーションであり得、例えば、連絡先アプリケーション、音声認識アプリケーション、スケジュール管理アプリケーション、文書作成アプリケーション、ミュージックアプリケーション、インターネットアプリケーション、地図アプリケーション、カメラアプリケーション、電子メールアプリケーション、写真アプリケーション、イメージ編集アプリケーション、検索アプリケーション、ファイル探索アプリケーション、ビデオアプリケーション、ゲームアプリケーション、SNSアプリケーション、電話アプリケーション、メッセージアプリケーションなどであり得る。ジェスチャまたはモーション入力は、例えば、ユーザが手または指でカメラモジュール150に向けて原形、三角形、四角形などの予め設定されたパターンの軌跡を描く場合を意味する。この例では、ユーザ入力によってアプリケーションを実行すると例示しているが、このようなアプリケーションは、メッセージ受信、コール受信、アラームイベント発生などのようなイベントの発生によって自動で実行されることもできる。
図6Aは、連絡先アプリケーション311が実行されたタッチスクリーン画面310を例示する。ユーザが新たな連絡先追加ボタン312を選択すると、図6Bに示したように、新たな連絡先追加画面320が表示される。
ステップS120は、発音受信段階として、制御部110はユーザから発音データを受信する。図6Bを参考すると、ユーザは新たな連絡先追加画面320の名前入力ウィンドウ321に名前を入力することができる。
ステップS130は、テキスト変換及び発音データ保存段階として、制御部110は、保存部175の漢字辞典保存部210を検索して発音データにマッチングされるテキスト、すなわち漢字を確認する。制御部110は、確認された漢字に基づいて、少なくとも一つの候補テキストを表示する。
図7Aを参照すると、ユーザは名前入力ウィンドウ321に“ninomiya”(322)を入力し、制御部110は、漢字辞典保存部210を検索して“nomi”に該当する“飲”という漢字、“ninomiya”に該当する“二宮”という漢字、“ni”及び“miya”に該当する“二”及び“宮”という漢字を確認する。制御部110は、“にのみや“(331)、“に飲みや”(332)、“二の宮”(333)及び“二宮”(334)という候補テキストを表示する。
図7Bを参照すると、ユーザが“二宮”(334)という候補テキストを選択すると、制御部は“ninomiya”という入力発音を“二宮”(323)という漢字に置き換えて名前入力ウィンドウ321に表示する。また、制御部110は、“ninomiya”という入力発音及び“二宮”(323)という漢字を発音保存部220に互いにマッピングして保存する。
図8Aを参照すると、ユーザは“ninomiya”という姓に続き名前を入力するために、名前入力ウィンドウ321に“二宮”に続いて“kazunari”(324)を入力する。
図8Bを参照すると、“ninomiya”と関連して上述した方式と同様に、制御部110は、ユーザの選択によって“kazunari”という入力発音を“和也”(325)という漢字に置き換えて名前入力ウィンドウ321に表示する。また、制御部110は、“kazunari”という入力発音及び“和也”という漢字を発音保存部220に互いにマッピングして保存する。
ステップS140は、変換されたテキストを保存する段階として、ユーザは電話番号入力ウィンドウ340に“二宮和也”の電話番号である“01012345678“(341)を入力し、保存ボタン350を押して“二宮和也”の連絡先を保存部175に保存する。保存部175は、連絡先保存部230を含み、“二宮和也”の連絡先は連絡先保存部230に保存されることができる。
この例では、テキストが漢字であり、発音データがローマ字であることを例示しているが、本発明は、表記文字と発音文字が異なる任意の状況に適用されることができる。例えば、テキストは、中国語、ロシア語などであり、発音データは、ローマ字(すなわち、アルファベット)、ひらがな、カタカナ、ハングルなどであり得る。
この例では、漢字変換毎に発音データ及び漢字を発音データ保存部220に保存することを例示しているが、全体名前の漢字変換が完了した後、発音データ及び漢字を発音データ保存部220に保存することもできる。例えば、漢字変換の完了は、ユーザが他の入力ウィンドウを選択した場合、または保存ボタン350を選択した場合と判断することもできる。
この例では、制御部110は、“ninomiya kazunari”という全体発音に対して、“ninomiya”という入力発音及び“二宮”という漢字を発音データ保存部220に互いにマッピングして保存した後、“kazunari”という入力発音及び“和也”という漢字を発音データ保存部220に互いにマッピングして保存している。
下記の<表1>の第1の例によって、発音データ保存部220は、複数の発音情報を複数のレコード形態で保存することができる。
Figure 2015004977
各レコードAi(1≦i≦n、nは1以上の整数)は、漢字フィールドBi、発音フィールドCiなどの情報を含むことができる。
これとは異なり、制御部110は、“ninomiya”という発音データ及び“二宮”という漢字を発音データ保存部220に互いにマッピングして保存した後、“kazunari”という発音データを“ninomiya”という発音データに追加し、“和也”という漢字を“二宮”という漢字に追加して保存することもできる。
これとは異なり、制御部110は、“ninomiya kazunari”という発音データ及び“二宮和也”という漢字を発音データ保存部220に互いにマッピングして保存することもできる。
下記の<表2>は、発音データ保存部220の第2の例を示す。
Figure 2015004977
または、発音データ保存部220は、第1の例のレコードA1及びA2、第2の例のレコードA1の両方を含むこともできる。
下記の<表3>のように、漢字辞典保存部210も複数の漢字情報を複数のレコード形態で保存することができる。
Figure 2015004977
各レコードAiは、漢字フィールドBi、第1の発音フィールドCi、第2の発音フィールドCiなどの情報を含むことができる。
下記の表4のように、連絡先保存部230も複数の連絡先情報を複数のレコード形態で保存することができる。
Figure 2015004977
各レコードAiは、名前フィールドBi、電話番号フィールドCiなどの情報を含むことができる。
上述した例とは異なり、下記の<表5>のように、発音データ保存部220は、連絡先保存部230に統合されることもできる。
Figure 2015004977
例えば、漢字変換が完了した後、ユーザが名前入力ウィンドウ321以外の他の入力ウィンドウを選択するか、保存ボタン350を選択すると、制御部110は、発音データを自動で連絡先保存部230に保存することもできる。
さらに図7Aを参照すると、ユーザが候補テキスト331〜334でなく、直接入力アイテム335を選択すると、ユーザは、直接“ninomiya”(322)という発音データを“二宮”(323)という漢字に置き換えて入力することができる。このような場合にも、制御部110は、“ninomiya”という入力発音及び“二宮”という漢字を発音データ保存部220に互いにマッピングして保存する。例えば、ユーザはインターネットアプリケーション、辞書アプリケーションなどの漢字検索が可能なアプリケーションを利用して、“ninomiya”という入力発音に対応する漢字を検索することができ、検索された漢字をコピーして名前入力ウィンドウ321に貼り付けることができる。ユーザが直接入力アイテム335を選択すると、インターネットアプリケーション、辞書アプリケーションなどの漢字検索が可能なアプリケーションに自動接続されることもできる。
図9Aを参照すると、ユーザはインターネットアプリケーション画面360の検索ウィンドウ362に“ninomiya”(322)を入力し、検索ボタン364を選択することによって“ninomiya”という発音データに対応する漢字を検索することができる。また、ユーザは検索された“二宮”という漢字をコピーすることができる。
図9Bを参照すると、ユーザは名前入力ウィンドウの“ninomiya”(322a)を選択し、選択された“ninomiya”(322a)をペーストアイテム371またはクリップボードアイテム372を利用して検索された漢字である“二宮”に置き換える。“ninomiya”の代わりに“二宮”が表示された画面は、図7Bのようである。制御部110は、“ninomiya”という発音データ及び“二宮”という漢字を発音データ保存部220に互いにマッピングして保存する。
図10は、本発明の望ましい第1の実施形態によるオーディオ及びテキスト間の変換方法を示すフローチャートである。
ステップS210は、イベント検出または確認段階として、制御部110は、文字メッセージ受信、コール受信、文書/文字列リーディング命令などのようなテキストをオーディオで出力することを要請するイベント(またはこのような要請)を検出または確認する。このようなイベントは、テキストのオーディオ変換が設定された任意のイベントを示す。
ステップS220は、ユーザ入力保存部検索段階として、確認されたイベントが文字メッセージ受信またはコールメッセージ受信(またはコール受信)である場合に、制御部110は、文字メッセージまたはコールメッセージで電話番号を抽出し、抽出された電話番号を連絡先保存部230で確認する。また、連絡先保存部230で確認された電話番号にマッピングされた名前が漢字を含む場合に、制御部110は、漢字を発音データ保存部220で確認する。
検出されたイベントが文書/文字列リーディング命令である場合に、制御部110は、文書または文字列に含まれた漢字を発音データ保存部220で検索する。
ステップS230は、検索確認段階として、制御部110は、発音保存部220で漢字の発音データが確認された場合、ステップS240を遂行し、発音保存部220で漢字の発音データが確認されない場合、ステップS250を遂行する。
ステップS240は、発音保存部で確認された発音データを出力する段階として、制御部110は、発音データ保存部220で確認された発音データをオーディオで出力する。
ステップS250は、漢字辞典保存部で確認された発音データを出力する段階として、制御部110は、漢字を漢字辞典保存部210で確認し、漢字辞典保存部210で確認された発音を出力する。漢字辞典保存部210で漢字にマッピングされた複数の発音が確認された場合に、制御部110は、複数の発音のうち、文脈に合う発音を出力するか、複数の発音のうち、代表発音を出力する。
図11は、本発明の望ましい第1の実施形態によるオーディオ及びテキスト間の変換方法を説明するための図である。図11は電話着信画面410を示し、制御部110は、電話着信画面410にコールメッセージから抽出された相手方の電話番号420と、連絡先保存部230で確認された名前425を表示する。制御部110は、予め設定された案内文句430(すなわち、“…から電話がきました”)に発音保存部220で確認された“Ninomiya kazunari”(435)という発音データを合成してオーディオで出力する。
図12は、本発明の望ましい第2の実施形態によるオーディオ及びテキスト間の変換方法を示すフローチャートであり、図13は、本発明の望ましい第2の実施形態によるオーディオ及びテキスト間の変換方法を説明するための図である。
ステップS310は、音声認識アプリケーションを実行する段階であり、ユーザはタッチスクリーン190、入/出力モジュール160またはカメラモジュール150を通じてボタン、アイコンまたはメニュー項目の選択、音声命令、ジェスチャまたはモーション入力、タッチパターンの入力などを遂行することによって、音声認識アプリケーションを実行する。
例えば、ユーザは、ホームボタン161aをダブルクリックすることによって、音声認識アプリケーションを実行することができる。
図13Aは、音声認識アプリケーションの画面510を示す図である。
音声認識アプリケーションは、初期駆動されると、“どんな作業を実行しましょうか?”、または“What would you like to do?”という使用案内文句551をアプリケーション画面510に表示する。
アプリケーション画面510の下部には、クリックした場合に使用方法を音声で案内する音声案内ボタン520と、クリックした場合に音声認識モードを実行する音声認識ボタン530と、クリックした場合に使用方法の例を表示するヘルプボタン540が提供される。
ステップS320は、音声をテキストに変換する段階であり、制御部110は、ユーザの音声をテキストに変換する。
例えば、ユーザは“通話Ninomiya kazunari”という音声命令を入力することができ、制御部110は、ユーザの音声をテキストに変換する。
ステップS330は、発音データ保存部検索段階として、制御部110は、変換されたテキストで“Ninomiya kazunari”という発音データを抽出し、制御部110は、発音データを発音データ保存部220で検索する。
ステップS340は、検索確認段階として、制御部は、発音データ保存部220で発音データが確認された場合、ステップS360を遂行し、発音データ保存部220で発音データが確認されない場合、ステップS350を遂行する。
ステップS350は、漢字辞典保存部検索段階として、制御部110は、発音データを漢字辞典保存部210で検索する。
ステップS360は、連絡先保存部検索段階として、制御部110は、発音保存部220で確認された発音データにマッピングされたテキスト(すなわち、“二宮和也”)または漢字辞典保存部210で確認された発音データにマッピングされたテキストを連絡先保存部230で確認する。制御部は、連絡先保存部230で発音データにマッピングされたテキストが確認された場合、ステップS370を遂行し、連絡先保存部230で発音データにマッピングされたテキストが確認されない場合、この方法を終了する。
ステップS370は、命令実行段階として、制御部110は、“二宮和也”というテキストにマッピングされた電話番号を利用して“二宮和也”に電話をかける動作を遂行する。
図13Bを参照すると、制御部110は、“通話Ninomiya kazunari”というユーザの音声命令をテキストに変換した結果552と、実行する動作を表すテキスト553(すなわち、“二宮和也様に電話をかけます”)をアプリケーション画面510に表示する。該当変換されたテキスト552は、“Ninomiya kazunari”(554)という発音データを含み、該当実行する動作を示すテキスト553は、発音データにマッピングされた“二宮和也”というテキスト620を含む。
図14は、電話発信画面610を示し、制御部110は、電話発信画面610に発音データ保存部220及び/または連絡先保存部230で確認された電話番号630及び名前620を表示する。
この例とは異なり、制御部は、連絡先保存部230で発音データにマッピングされたテキストが確認されない場合にも、命令実行が不可能であることを示すテキスト(例えば、“二宮和也様の連絡先を探すことができません”)をアプリケーション画面510に表示することもできる。
上述した例において、画面を表示するディスプレイユニットの代表的な例として、タッチスクリーンを例示しているが、タッチスクリーンの代りにタッチ感知機能がない液晶表示装置(Liquid Crystal Display:LCD)、有機発光ダイオード(Organic Light Emitting Diodes:OLED)、LEDなどのような通常のディスプレイユニットを使用することもできる。
本発明によって、テキストをオーディオに変換するか、オーディオをテキストに変換する場合において、複数の発音を有することができるテキストをユーザの意図によって正確に発音するか、ユーザの意図に従う発音に基づいて該当テキストを正確に検索することができる方法が提供される。
また、本発明によって、日本語漢字、特に固有名詞に関連した漢字を正確に発音または認識することができる方法が提供される。
さらに、本発明によって、ユーザに追加要請せずに漢字入力時に使用されるひらがな、ローマ字などの発音データをそのまま利用することによって、電子装置でユーザが知っている通りの漢字発音を正確に予測できるようになる。
上記した本発明による実施形態は、ハードウェア、ソフトウェア、又はこれらの組み合わせで実現することができる。このような任意のソフトウェアは、例えば、削除可能、又は再記録可能の可否と関係なく、ROM(Read−Only Memory)、RAM(Random−Access Memory)のような揮発性又は非揮発性格納装置、あるいはCD(Compact Disc)、DVD(Digital Versatile Disc)、磁気ディスク、又は磁気テープのような光学あるいは磁気的に記録可能であると同時に、機械読み取り可能な記録媒体に格納され得る。電子装置内に含まれるメモリは、本発明の実施形態を実現する指示を含むプログラム又はプログラムを記録するのに適合した機械で読み取り可能な記録媒体の一例であることがわかる。したがって、本発明は、本明細書の任意の請求項に記載された装置又は方法を実現するためのコードを含むプログラム及びこのようなプログラムを記録する機械(コンピュータなど)で読み取れる格納媒体を含む。また、このようなプログラムは、有線又は無線接続を通じて伝達される通信信号のような任意の媒体を通じて、電子的に移送することができ、本発明は、これと均等であるものを適切に含む。
また、上記電子装置は、有線または無線で連結するプログラムの提供装置から、上記プログラムを受信して保存することができる。上記プログラムの提供装置は、上記電子装置が既に設定されたオーディオ及びテキスト間の変換のための方法を遂行するようにする指示を含むプログラム、オーディオ及びテキスト間の変換のための方法に必要な情報などを保存するためのメモリと、上記電子装置との有線または無線通信を遂行するための通信部と、上記電子装置の要請または自動で該当プログラムを上記電子装置へ送信する制御部とを含むことができる。
以上、本発明の詳細な説明においては具体的な実施形態に関して説明したが、特許請求の範囲の記載及びこれと均等なものに基づいて定められる本発明の範囲及び精神を逸脱することなく、形式や細部の様々な変更が可能であることは、当該技術分野における通常の知識を持つ者には明らかである。
100 電子装置
101 前面
102 側面
103 後面
110 制御部
112 ロム
113 ラム
120 通信モジュール
121 移動通信モジュール
130 サブ通信モジュール
131 無線ランモジュール
132 近距離通信モジュール
140 マルチメディアモジュール
141 放送通信モジュール
141a アンテナ
142 オーディオ再生モジュール
143 動画再生モジュール
150 カメラモジュール
151 第1のカメラ
152 第2のカメラ
153 フラッシュ
154 モータ部
155 円筒部
157 モジュール
160 出力モジュール
161 ボタン
162 マイク
163 スピーカ
164 振動素子
165 コネクタ
166 キーパッド
167 イヤホン接続ジャック
168 入力ユニット
169 付着認識スイッチ
170 センサモジュール
180 電源供給部
190 タッチスクリーン
191−1、191−2、191−3 短縮アイコン
191−4 キー
192 状態バー(Status Bar)
195 タッチスクリーンコントローラ

Claims (20)

  1. テキストをオーディオに変換する方法であって、
    テキストをオーディオで出力するための要請を感知するステップと、
    前記テキストをユーザ入力保存部で確認するステップと、
    確認された前記テキストに対応する発音データを前記ユーザ入力保存部で確認するステップと、
    前記確認された発音データに該当するオーディオ信号を出力するステップと、を含むことを特徴とする方法。
  2. 前記テキストの発音データが前記ユーザ入力保存部に存在しない場合に、前記テキストの発音データを予め設定された辞書保存部で検索するステップと、
    前記辞書保存部で確認された発音データをオーディオで出力するステップと、を含むことを特徴とする請求項1に記載の方法。
  3. 前記テキストは漢字列であることを特徴とする請求項1に記載の方法。
  4. 前記テキストをオーディオで出力するための要請は、メッセージの受信によって発生し、前記ユーザ入力保存部は、連絡先保存部及び発音保存部うちの少なくとも一つを含むことを特徴とする請求項1に記載の方法。
  5. 前記テキストの発音データを前記ユーザ入力保存部で確認するステップは、
    前記メッセージから電話番号を抽出するステップと、
    前記抽出された電話番号にマッピングされた前記テキストの発音データを前記ユーザ入力保存部で検索するステップと、を含むことを特徴とする請求項4に記載の方法。
  6. 前記テキストの発音データを前記ユーザ入力保存部で確認するステップは、
    前記メッセージから電話番号を抽出するステップと、
    前記抽出された電話番号にマッピングされた前記テキストを前記連絡先保存部で検索するステップと、
    前記連絡先保存部で確認された前記テキストの発音データを前記発音保存部で検索するステップと、を含むことを特徴とする請求項4に記載の方法。
  7. 前記テキストをオーディオで出力するための要請を感知するステップの前に、
    ユーザから前記発音データを受信するステップと、
    前記発音データを前記テキストに変換するステップと、
    自動で前記発音データ及び前記テキストを前記ユーザ入力保存部に保存するステップと、をさらに含むことを特徴とする請求項1に記載の方法。
  8. 前記ユーザから前記発音データを受信するステップの前に、ディスプレイユニットの画面に前記発音データを入力できるウィンドウを表示するステップをさらに含むことを特徴とする請求項7に記載の方法。
  9. 前記発音データにマッチングされる少なくとも一つのテキストを前記ディスプレイユニットの画面に表示するステップをさらに含み、
    前記発音データを前記少なくとも一つのテキストのうちで前記ユーザが選択したテキストに変換することを特徴とする請求項8に記載の方法。
  10. 前記発音データを入力できるウィンドウは、連絡先アプリケーションを通じて提供されることを特徴とする請求項8に記載の方法。
  11. 前記発音データ及び前記テキストは、発音データ保存部に互いにマッピングされ保存され、前記テキストは、連絡先と共に連絡先保存部に保存されることを特徴とする請求項10に記載の方法。
  12. 前記発音データに対する複数の候補テキストをユーザに表示するステップと、
    前記発音データを前記複数の候補テキストのうちで前記ユーザが選択した候補テキストに置き換え、置き換えられた前記候補テキストを前記ユーザに表示するステップと、をさらに含むことを特徴とする請求項1に記載の方法。
  13. 請求項1乃至請求項12のうちいずれか一項に従うテキストをオーディオで出力する方法を実行するためのプログラムを記録した機械で読むことができる保存媒体。
  14. 請求項13に記載の機械で読むことができる保存媒体を含む電子装置。
  15. テキストをオーディオに変換する電子装置であって、
    ユーザ入力保存部を有する保存部と、
    テキストのオーディオ出力を必要とするイベントを確認し、前記テキストの発音データを前記ユーザ入力保存部で確認し、前記テキストの発音データが前記ユーザ入力保存部に存在する場合に、前記ユーザ入力保存部で確認された発音データをオーディオで出力する制御部と、を含むことを特徴とする電子装置。
  16. 前記制御部は、
    前記テキストの発音データが前記ユーザ入力保存部に存在しない場合に、前記テキストの発音データを予め設定された辞書保存部で検索し、前記辞書保存部で確認された発音データをオーディオで出力することを特徴とする請求項15に記載の電子装置。
  17. 前記テキストは漢字列であることを特徴とする請求項15に記載の電子装置。
  18. オーディオをテキストに変換する電子装置であって、
    ユーザ入力保存部を有する保存部と、
    オーディオを発音データに変換し、前記発音データにマッピングされたテキストを前記ユーザ入力保存部で確認し、前記テキストが前記ユーザ入力保存部に存在する場合に、前記ユーザ入力保存部で確認されたテキストを出力する制御部と、を含むことを特徴とする電子装置。
  19. 前記制御部は、前記オーディオが示すユーザの命令を実行することを特徴とする請求項18に記載の電子装置。
  20. 前記ユーザの命令は、コールメッセージまたは文字メッセージの送信命令であり、前記ユーザ入力保存部は、連絡先保存部及び発音保存部うちの少なくとも一つを含むことを特徴とする請求項19に記載の電子装置。
JP2014125070A 2013-06-18 2014-06-18 オーディオ及びテキスト間の変換のための方法及び電子装置 Pending JP2015004977A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2013-0069505 2013-06-18
KR1020130069505A KR20140146785A (ko) 2013-06-18 2013-06-18 오디오 및 텍스트 간의 변환을 위한 방법 및 전자 장치

Publications (1)

Publication Number Publication Date
JP2015004977A true JP2015004977A (ja) 2015-01-08

Family

ID=52019977

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014125070A Pending JP2015004977A (ja) 2013-06-18 2014-06-18 オーディオ及びテキスト間の変換のための方法及び電子装置

Country Status (3)

Country Link
US (1) US20140372123A1 (ja)
JP (1) JP2015004977A (ja)
KR (1) KR20140146785A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180001032U (ko) * 2016-10-06 2018-04-16 이한결 다용도 원목 좌탁

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI619115B (zh) * 2014-12-30 2018-03-21 鴻海精密工業股份有限公司 會議記錄裝置及其自動生成會議記錄的方法
US20170109332A1 (en) * 2015-10-16 2017-04-20 Successfactors, Inc. Matching user input provided to an input method editor with text
KR20170052190A (ko) * 2015-11-04 2017-05-12 엘지전자 주식회사 단말 장치 및 그 제어 방법
US10616199B2 (en) * 2015-12-01 2020-04-07 Integem, Inc. Methods and systems for personalized, interactive and intelligent searches
GB2549117B (en) * 2016-04-05 2021-01-06 Intelligent Voice Ltd A searchable media player
KR20220036529A (ko) 2020-09-16 2022-03-23 주식회사 투아트 뉴스 기사를 오디오로 출력하는 방법 및 장치

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7050834B2 (en) * 2003-12-30 2006-05-23 Lear Corporation Vehicular, hands-free telephone system
TWI305345B (en) * 2006-04-13 2009-01-11 Delta Electronics Inc System and method of the user interface for text-to-phone conversion
US8972268B2 (en) * 2008-04-15 2015-03-03 Facebook, Inc. Enhanced speech-to-speech translation system and methods for adding a new word
US8719027B2 (en) * 2007-02-28 2014-05-06 Microsoft Corporation Name synthesis
CN104268131B (zh) * 2007-11-27 2017-11-17 诺基亚技术有限公司 用于加速中文输入中的候选选择的方法
CN102117614B (zh) * 2010-01-05 2013-01-02 索尼爱立信移动通讯有限公司 个性化文本语音合成和个性化语音特征提取
CN102985959A (zh) * 2010-04-07 2013-03-20 麦克斯价值解决方案国际有限公司 用于姓名发音指导服务的方法和系统
US10134385B2 (en) * 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180001032U (ko) * 2016-10-06 2018-04-16 이한결 다용도 원목 좌탁

Also Published As

Publication number Publication date
KR20140146785A (ko) 2014-12-29
US20140372123A1 (en) 2014-12-18

Similar Documents

Publication Publication Date Title
KR102129374B1 (ko) 사용자 인터페이스 제공 방법 및 기계로 읽을 수 있는 저장 매체 및 휴대 단말
US20230040146A1 (en) User device and method for creating handwriting content
JP5865936B2 (ja) 発信者電話番号を用いた付加情報提供装置及び方法
US11669240B2 (en) Mobile apparatus displaying end effect and control method thereof
KR102035305B1 (ko) 휴대 단말에서 햅틱 효과를 제공하는 방법 및 기계로 읽을 수 있는 저장 매체 및 휴대 단말
JP2015004977A (ja) オーディオ及びテキスト間の変換のための方法及び電子装置
KR20140143555A (ko) 휴대 장치의 잠금 화면 상에서 빠른 어플리케이션 실행 방법 및 이를 위한 휴대 장치
KR102022042B1 (ko) 데이터 전송 방법 및 시스템
KR20140143526A (ko) 카메라에 기반한 전자 장치의 제어 방법, 저장 매체 및 전자 장치
KR20140134018A (ko) 화면상에서 사용자 입력과 관련된 기능을 실행하기 위한 장치, 방법 및 컴퓨터 판독 가능한 기록 매체
US20150019522A1 (en) Method for operating application and electronic device thereof
US20150067615A1 (en) Method, apparatus, and recording medium for scrapping content
KR20140137616A (ko) 다자간 대화를 제어하는 휴대 단말 및 방법
KR20150007577A (ko) 데이터 병합을 제어하는 휴대 단말 및 방법
EP3660635A1 (en) Integration of smart tags into handwriting input
KR102184797B1 (ko) 리스트 스크롤 바 제어 방법 및 모바일 장치
US20220360659A1 (en) Mobile terminal and method for controlling the same
US20150067493A1 (en) Method of modifying text input from user and electronic device therefor

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20141226