JP4651613B2 - マルチメディアおよびテキストエディタを用いた音声起動メッセージ入力方法および装置 - Google Patents

マルチメディアおよびテキストエディタを用いた音声起動メッセージ入力方法および装置 Download PDF

Info

Publication number
JP4651613B2
JP4651613B2 JP2006506254A JP2006506254A JP4651613B2 JP 4651613 B2 JP4651613 B2 JP 4651613B2 JP 2006506254 A JP2006506254 A JP 2006506254A JP 2006506254 A JP2006506254 A JP 2006506254A JP 4651613 B2 JP4651613 B2 JP 4651613B2
Authority
JP
Japan
Prior art keywords
text
message
input
database
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006506254A
Other languages
English (en)
Other versions
JP2006523988A (ja
Inventor
ノースカット、ジョン、ダブリュ.
Original Assignee
ソニー エリクソン モバイル コミュニケーションズ, エービー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー エリクソン モバイル コミュニケーションズ, エービー filed Critical ソニー エリクソン モバイル コミュニケーションズ, エービー
Publication of JP2006523988A publication Critical patent/JP2006523988A/ja
Application granted granted Critical
Publication of JP4651613B2 publication Critical patent/JP4651613B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. short messaging services [SMS] or e-mails

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)

Description

(背景技術)
移動電話機の最も使用される特徴の1つはメッセージング、ショートメッセージングサービス(SMS)テキストメッセージングまたはマルチメディア・メッセージングサービス(MMS)メッセージングである。加入者は相手方に電話をかける代わりに、しばしば、これらのサービスを使用する。さらに、MMSはメッセージに可聴および視覚アタッチメントを含める能力を提供する。
メッセージングは相手方の電話呼出し手段を中断しないため望ましい。受話者は会議中の他人に迷惑をかけずに会議中にメッセージを別個に受信することができる。
移動電話機を介してSMSまたはMMSメッセージングを使用することの最大の欠点は、移動電話機のキーパッドが比較的小さいサイズであるためメッセージの入力が困難となることである。さらに、数字キーパッドはテキストを入力するのにぎこちない手段となる。テキスト入力を容易にするキーパッド付属品が移動電話機用として入手できるが、それらも極めて小型で有効に管理するのが困難である。
相手方へのSMSまたはMMSメッセージの作成および送信を簡単にするシステムおよび方法が必要とされている。
移動電話機メーカは電話機のメモリ内にしばしば「予め準備された(canned)」メッセージを含めることがある。これらの予め準備されたメッセージは頻繁に反復されるものである。ユーザは予め準備されたメッセージのリストをスクロールしてその1つを選んで送るだけである。スクロールして予め準備されたメッセージを選択する行為は、恐らく、同じメッセージをスクラッチから編集するよりも時間がかからない。また、ユーザは予め準備されたメッセージのリストに自分等で作成したものを付与することができる。
予め準備されたメッセージはメッセージの開始点を与える時にはうまく働くが、常にメッセージの詳細を提供することはできない。例えば、予め準備されたメッセージは「_に_で私と会おう」とすることができ、最初の空欄は時間(例えば、今日、今夜、明日)を指定することができ、第2の空欄は場所(例えば、家、工場、学校)を指定することができる。明らかに、単一の予め準備されたメッセージでは所望するメッセージの全ての順列をカバーすることはできない。また、各順列に対して予め準備されたメッセージを生成するのは実際的でない。最も効率的な解決策はユーザのその時のニーズに適するように編集することができる一般的な予め準備されたメッセージを使用することである。
しかし、予め準備されたメッセージの編集により前記したのと同じ移動電話機データ入力問題が起こる。1つの解決策はSMSおよびMMSメッセージの編集をアシストするスピーチ・ツー・テキスト処理を内蔵することである。
本発明の一実施例では、MMSメッセージの音声部がテキスト部の逐語的表現である、マルチメディア音声およびテキストメッセージを移動電話機上に生成するシステムおよび方法が記述される。移動電話機は音声およびテキストに応答するメッセージング機能を含んでいる。メッセージ作成者は移動電話機のメッセージング機能にアクセスしてメッセージを話し込む。話し込まれたメッセージは記録されテキストメッセージに変換される。最後に、テキスト部と話し込まれた部分とが結合されてMMSメッセージとなり、移動電話機のメッセージング機能を使用して受取人へ送られる。
本発明のもう1つの実施例では、MMSメッセージの音声部とテキスト部とが異なる場合にマルチメディア音声およびテキストメッセージを移動電話機上に生成するシステムおよび方法が記述される。それにより、メッセージ作成者はテキスト部または音声部をパーソナライズすることができる。メッセージ作成者は移動電話機のメッセージング機能にアクセスしてメッセージを話し込む。話し込まれたメッセージは記録されテキストメッセージに変換される。このとき、メッセージ作成者は文脈上テキストメッセージに関連する第2の話し込まれたメッセージを記録する。ここで、テキスト部と第2の話し込まれたメッセージが結合されてMMSメッセージとなり、移動電話機のメッセージング機能を使用して受取人へ送られる。
本発明のさらにもう1つの実施例では、予め準備されたメッセージおよびそれを編集するスピーチ・ツー・テキストアシスタンスを利用してMMSメッセージを移動電話機上に生成するシステムおよび方法が記述される。メッセージ作成者は移動電話機のメッセージング機能にアクセスして、音声またはテキストにより、メッセージの一部を入力する。移動電話機はこの入力をデータベースと比較して入力とごく近く一致するテキストメッセージのリストを表示する。テキストメッセージは特定の情報を記入してメッセージを完成するための少なくとも1つのオープンフィールドを含んでいる。メッセージ作成者は表示されたテキストメッセージの1つを選択する。次に、このメッセージは完成できるようにテキスト編集機能内で特徴づけられる。
選択されたテキストメッセージの編集はスピーチ・ツー・テキストアシスタンスにより達成される。選択されたテキストメッセージ内の最初/次のオープンフィールドに対して音声入力が受信される。音声入力はテキスト入力に変換される。テキスト入力は一致を見つけるためにデータベースと比較される。
一致すれば、その一致は語(句)、イメージ、または両方に対応するかどうか確認される。一致が語(句)であれば、オープンフィールドに語(句)が記入される。一致がイメージであれば、オープンフィールドにイメージが記入される。一致が語(句)またはイメージの両方に対応すれば、メッセージ作成者は語(句)またはイメージを選択してオープンフィールドに選択したものを記入する。予め準備されたメッセージ内にさらにオープンフィールドがあるかどうか調べられる。さらにオープンフィールドがあれば、制御は音声入力ステップに戻りプロセスが繰り返される。そうでなければ、編集プロセスは終結する。
一致しなければ、移動電話機はデータベース内の最も近い一致を表示して、それを使用するかどうかメッセージ作成者に尋ねる。
最も近い一致を使用する場合には、オープンフィールドに最も近い一致が記入される。予め準備されたメッセージ内にさらにオープンフィールドがあるかどうか調べられる。さらにオープンフィールドがあれば、制御は音声入力ステップに戻りプロセスが繰り返される。そうでなければ、編集プロセスは終結する。
最も近い一致が使用されなければ、移動電話機は現在のテキスト入力をデータベースに加えるようメッセージ作成者に促す。現在の入力がオープンフィールドに入れられる。予め準備されたメッセージ内にさらにオープンフィールドがあるかどうか調べられる。さらにオープンフィールドがあれば、制御は音声入力ステップに戻りプロセスが繰り返される。そうでなければ、編集プロセスは終結する。
(発明を実施するための最善のモード)
図1は予め準備されたメッセージからSMSまたはMMSメッセージを生成して送ることを記述するフロー図である。ユーザ(メッセージ作成者)は移動電話機のメッセージング機能(105)にアクセスする。これは典型的に移動電話機内にプログラムされたグラフィカル・ユーザインターフェイス(GUI)メニュー構造をナビゲートして行われる。あるいは、移動電話機は音声入力に応答してメッセージング機能をナビゲートするようにプログラムすることができる。メッセージ作成者は移動電話機のマイクロホンにメッセージ(110)を話し込んで移動電話機の画面が話し込まれたメッセージに最もごく近く一致する予め準備されたメッセージのリスト(115)を表示するようにする。
これは最初に話し込まれたメッセージをテキストへ変換しそれを予め準備されたテキストメッセージのデータベースと比較して達成される。あるいは、話し込まれたメッセージをテキスト解釈と関連付けられる話し込まれた「予め準備された」メッセージのデータベースと比較することができる。いずれにせよ、結果はメッセージ作成者の話し込まれたメッセージにごく近く一致するテキストメッセージの表示されたリストである。
次に、ユーザはリストに載せられた予め準備されたメッセージの中から選択する(120)。次に、このメッセージは編集できる画面上に単独で特徴づけられる(125)。編集が完了すると、メッセージ作成者はテキストメッセージに音声タグまたはイメージを加えるよう促される(130)。メッセージに音声タグもイメージも加えられなければ、メッセージはSMSメッセージ(テキストのみ)として受取人へ送られる(135)。そうでなければ、テキストおよび音声および/またはイメージはMMSメッセージとされ移動電話機のMMS機能を使用して送られる(140)。
ステップ110(電話機内にメッセージを話し込む)および115(予め準備されたメッセージのリストを表示する)はスピーチ・ツー・テキスト処理を必要とする。このスピーチ・ツー・テキスト処理は移動電話機内のデジタル信号プロセッサ(DSP)により達成される。DSPはテキストベース、音ベース、またはその両方とすることができる予め準備されたメッセージのデータベースだけでなく移動電話機のマイクロホン、画面ディスプレイに接続される。DSPはその処理を音や音素ではなく語や句に限定することにより単純化することができる。これはあまりロバストなインプリメンテーションではないが、消費電力を含む処理要求条件に関して遥かに楽なシステムである。しかし、より大きなスピーチ・ツー・テキスト処理能力を提供する、より複雑なDSPをインプリメントすることができる。
前記したように、SMSまたはMMSメッセージを生成して送るための最も効率的な妥協策は「予め準備された」メッセージテンプレートを開始点として利用することである。これらのメッセージは空欄フィールドに特定のデータを記入して完成する必要がある。これらのフィールドはテキスト入力または音声入力を介して記入することができる。音声入力は前記したスピーチ・ツー・テキスト処理能力を使用する。
図2は音声および/または予測テキスト入力を使用して予め準備されたメッセージを編集する図1のステップ125のプロセスを記述するフロー図である。テキストおよび音声入力プロセスは非常に類似しているため、適切であれば特に音声またはテキストを参照して一緒に記述される。さらに、予め準備されたメッセージの編集プロセスはテキストおよび/または音声入力の混成プロセスとすることができる。
予め準備されたメッセージテンプレートは選択されると(図1ステップ120)、テキストエディタ内へ持ち込まれる。これは予め準備されたメッセージが移動電話機により編集できるように表示されることを意味する。テキストエディタは予め準備されたメッセージ内の第1の空欄フィールドにカーソルを動かして(205)音声またはテキスト入力を待つ(210)。音声または予測テキスト入力は一致を見つけるために入力のデータベースと比較される(215,220)。
入力が音声入力であれば、スピーチ・ツー・テキスト処理を利用して音声をテキストへ変換しテキストベース・データベースと比較する。あるいは、音声入力を音ベースデータベースと比較することができる。データベース内の各音(語または句)は音声一致が見つかればテキスト応答が返えされるように語または句のテキスト表現と関連付けられる。データベースはイメージに対するポインタも含むことができる。例えば、「鳥」という語はテキストを表すことができ、あるいは鳥のイメージを表すことができる。
データベース内で正確な一致が見つかれば、その一致は語(または句)、イメージ、またはその両方に関するものかどうか確認される(225)。語とイメージの両方がデータ入力に一致する場合、メッセージ作成者は現在のメッセージに対してどちらを使用するか選択するよう促される(230)。選択がなされると、それは予め準備されたメッセージフィールド内に置かれる(235)。現在のメッセージ内にさらに空欄フィールドがあるかどうか調べられる。そうであれば、制御はステップ205へ戻されメッセージ作成者は予め準備されたメッセージ内の次のオープンフィールドに入力を提供できるようにされる。現在のメッセージ内にこれ以上空欄フィールドがなければ、メッセージ作成者はメッセージをさらに編集したいかどうかを確認するチェックがなされる(245)。そうであれば、メッセージ作成者はテキストまたは音声入力を介してメッセージを編集し(250)、その後編集プロセスを終結する(255)。追加メッセージ編集を望まなければ、編集プロセスが終結される(255)。
ステップ215,220を実施した後で一致が見つからなければ、データベースはデータベース内の最も近い一致を捜し(260)、最も近い一致が許容限界内であるかどうかを調べる(265)。データベースは全ての許容一致を表示し(270)、メッセージ作成者は最も近い一致の1つを選択するよう求められる(275)。最も近い一致の1つが選択されると、制御はステップ(235)へ送られ空欄フィールドに選択されたものが記入される。メッセージ作成者が最も近い一致を拒絶すると、その入力はデータベースに加えられる(280)。入力が音声入力でありかつ音データベースがあれば、それは音データベースに記録されたものとして加えられ文脈連関が生成される。音声入力もテキストに変換されてテキストデータベースに加えられる。次に、新しい入力がテキストとして現在の空欄フィールド内に置かれ(285)、制御は前記したような処理を行うためにステップ(240)へ送られる。
ステップ265を実施した後で許容限界内に一致がなければ、メッセージ作成者は現在の入力をデータベースに加えたいかどうかさらに調べられる(290)。そうであれば、制御はステップ280へ送られそこでメッセージ作成者は新しい入力をデータベースに加えるよう促され、処理は前記したように進む。現在の入力がメッセージ作成者にとって不満足なものでありそれをデータベース内に入力したくなければ、制御はステップ210へ戻され新しい音声またはテキスト入力が受信される。
データベースはユーザが別々に操作して既存の入力の追加、削除、または修正を行うことができる。データベース入力に対してイメージまたは音ポインタを生成することもできる。さらに、メッセージ受取人が移動電話機の電話帳の中にあり、たまたま電話帳エントリに付されたイメージを有する場合には、受取人の音声入力時にそのイメージをポップアップすることができる。これは移動電話機がメッセージ作成者の音声入力を正しく解釈したことを検証する手段を提供する。
前記したように、スピーチ・ツー・テキスト機能は音や音素とは異なり語や句のサブセットに対する語彙を限定することにより単純化することができる。正味の効果はMIP、メモリ、およびスピーチ・ツー・テキスト処理をインプリメントするのに必要な電力要求条件を低減することである。この目標を達成するために、スピーチ・ツー・テキスト機能は予め準備されたメッセージエディタ・アプリケーションに限定することができる。これによりデジタル信号プロセッサ(DSP)サーチテーブル(データベース)は少数の予め準備された句に低減される。これらの句の文脈内に論理的に適合する語数も低減される。同様に、関連付けられるイメージおよび音の数も低減される。この低減によりスピーチ・ツー・テキストアルゴリズムの必要な学習も相応して低減される。アルゴリズム学習は製作プロセス中(移動電話機がエンドユーザの手に渡る前)に実施することができる。学習は予め準備されたメッセージ・アプリケーションにより指示されるテーブル(データベース)エントリを認識する。これによりアプリケーションを実施するのに必要なMIP数が低減される。さらに、スピーチ・ツー・テキストアルゴリズムは予め準備されたメッセージ・アプリケーションがアクティブであるときしか活性化する必要がない。これにより、非使用時にバックグラウンドで実行する電力消費プロセスを持つことが回避される。
本発明のもう1つの実施例は「予め準備された」メッセージテンプレートを使用しないインプリメンテーションである。図3はスピーチ・ツー・テキストアシスタンスによりSMSまたはMMSメッセージを生成して送ることを記述するフロー図である。この実施例では、メッセージが生成され音声タグまたはイメージがテキストメッセージと結合されてMMSメッセージを形成する。得られるMMSメッセージは、次に、受取人に送られる。音声タグはメッセージを読むか聴くかのオプションを受取人に与えるテキストメッセージの逐語的表現である。あるいは、音声タグはテキストメッセージを伴うパーソナル化されたメッセージとすることができる。
音声タグやイメージをメッセージに加えるオプションによりメッセージング・ユーティリティは著しく向上する。例えば、標準テキストメッセージは受取人に聴いてから応答するよう告げる音声タグを伴うことができる。パーソナル化されたメッセージの例はテキスト成分および音声タグ成分を有するMMSメッセージであり、音声タグは、例えば、「ジョン、これを読んで話し合いのため電話してくれ」とすることができる。あるいは、音声タグは「ジョン、この新しい歌は好きかい」と尋ねるテキスト成分を有するコンテンツ(MP3断片のような)を含むことができる。同様に、「ジョン、この絵をどう思う」のような返答を求めるテキスト成分を有するMMSメッセージとすることができる。
このプロセスも移動電話機のメッセージング機能にアクセスして開始する(305)。キーパッドテキスト入力またはスピーチ・ツー・テキスト音声入力を使用してテキストメッセージが生成される(310)。音声入力が選択された方法であれば、メッセージ作成者のスピーチはテキストに変換されるだけでなく記録される。
メッセージ作成者がテキストメッセージの音素コピーを欲しいだけであれば、テキストメッセージおよび音声記録は結合されてMMSメッセージとなる(315)。次に、MMSメッセージは受取人へ送られる(320)。
メッセージ作成者はテキストメッセージをパーソナル化したい場合、テキストメッセージに付随するメモを話し込み記録する(325)。テキストメッセージおよびパーソナル化された音声記録は結合されてMMSメッセージとなり(330)、受取人へ送られる(335)。
発明の特定実施例がここに開示されている。当業者ならば本発明は他の環境において他の応用を有することが容易に判る。事実、多くの実施例およびインプリメンテーションが可能である。特許請求の範囲は決して本発明の範囲を前記した特定の実施例に限定するものではない。さらに、「−する手段(meams for)」のいかなる詳述も要素の手段プラス機能としての解釈を喚起するものであり、「−する手段(meams for)」の詳述を特に使用しない任意の要素は、たとえ特許請求の範囲に「手段」という用語が含まれていても、手段プラス機能要素として解釈すべきものではない。
予め準備されたメッセージからSMSまたはMMSメッセージを生成して送るプロセスを記述するフロー図である。 音声および/または予測テキスト入力を使用して予め準備されたメッセージを編集するプロセスを記述するフロー図である。 スピーチ・ツー・テキストアシスタンスによりSMSまたはMMSメッセージを生成して送るプロセスを記述するフロー図である。

Claims (12)

  1. 移動電話機上でメッセージを生成する方法であって,移動電話機は音声およびテキスト入力に応答するメッセージング機能を含み,前記方法は,
    メッセージング機能にアクセスし(105),
    音声入力からメッセージの一部を受信し(110),
    少なくとも1つのオープンフィールドを含み,入力にごく近く一致するテキストメッセージのリストを表示し(115),
    表示されたテキストメッセージの内の選択された1つを受信し(120),
    選択されたテキストメッセージを編集する(125),
    ステップを含む方法において,
    選択されたテキストメッセージを編集するステップにおいて,
    (a)選択されたテキストメッセージを表示し(205),
    (b)選択されたテキストメッセージ内のオープンフィールドに対する音声入力を受信し(210),
    (c)音声入力をテキスト入力へ変換し,
    (d)変換された音声入力とテキストのデータベースとの間の一致を捜し(215),
    一致があれば(220),
    (e)一致は語,イメージ,またはその両方に対応するかどうかを確認し(225),
    語またはイメージだけであれば,
    (f)オープンフィールドに対応する語または対応するイメージを記入し(235),
    両方であれば,
    (g)対応する語または対応するイメージを選択して(230)オープンフィールドに選択したものを記入し,
    (h)さらにオープンフィールドを調べ(240),
    さらにオープンフィールドがあれば,
    (i)ステップ(b)に戻り,そうでなければ編集プロセスを終結し(255),
    一致がなければ,
    (j)データベース内の最も近い一致を見つけ(260),
    (k)最も近い一致を使用するかどうかを促し(275),
    最も近い一致を使用するならば,
    (l)オープンフィールドに最も近い一致を記入し(235),
    (m)さらにオープンフィールドを調べ(240),さらにオープンフィールドがあれば,ステップ(b)に戻り,そうでなければ編集プロセスを終結し(255),
    最も近い一致を使用しなければ,
    (o)現在のテキスト入力をデータベースに加えるよう促し(280),
    (p)オープンフィールドに現在のテキスト入力を記入し(285),
    (q)さらにオープンフィールドを調べ(240),さらにオープンフィールドがあれば,ステップ(b)に戻り,そうでなければ編集プロセスを終結する(255),
    ステップを含む方法。
  2. 請求項1に記載の方法であって,さらに,編集されたテキストメッセージに音声タグを随意加え(130),編集されたテキストメッセージと音声タグを結合してMMSメッセージを形成する(135),ステップを含む方法。
  3. 請求項1に記載の方法であって,さらに,編集されたテキストメッセージにイメージを随意加え(130),編集されたテキストメッセージとイメージを結合してMMSメッセージを形成する(135),ステップを含む方法。
  4. 請求項1に記載の方法であって,さらに,見つかった最も近い一致が許容限界内のテキスト入力に対応するかどうかを調べる(265)ステップを含む方法。
  5. 請求項4に記載の方法であって,見つかった最も近い一致が許容限界内のテキスト入力に対応しなければ,現在のテキスト入力をデータベースに加えるよう促す(290)方法。
  6. 請求項1に記載の方法であって,さらに,全てのオープンフィールドに記入がなされたらメッセージをさらに編集する(245,250)ステップを含む方法。
  7. 移動電話機上でメッセージを生成するシステムであって,移動電話機は音声およびテキスト入力に応答するメッセージング機能を含み,前記システムは,
    メッセージング機能にアクセスする手段(105),
    音声入力からメッセージの一部を受信する手段(110),
    少なくとも1つのオープンフィールドを含み,入力にごく近く一致するテキストメッセージのリストを表示する手段(115),
    表示されたテキストメッセージの内の選択された1つを受信する手段(120),および,
    選択されたテキストメッセージを編集する手段(125),
    を含むシステムにおいて,
    選択されたテキストメッセージを編集する手段は,
    選択されたテキストメッセージを表示する手段(205),
    選択されたテキストメッセージ内のオープンフィールドに対する音声入力を受信する手段(210),
    音声入力をテキスト入力へ変換する手段,
    変換されたボイス・ツー・テキスト入力とデータベースとの間の一致を捜す手段(215),
    一致がデータベース内の語,イメージ,またはその両方に対応するかどうかを確認する手段(225),
    データベースから語またはイメージを選択する手段(230),
    オープンフィールドに語またはイメージを記入する手段(235),
    データベース内の変換されたボイス・ツー・テキスト入力に最も近い一致を見つける手段(260),
    最も近い一致を使用するかどうかを促す手段(275),
    オープンフィールドに最も近い一致を記入する手段(235),
    変換されたボイス・ツー・テキスト入力をデータベースに加える手段(280),
    変換されたボイス・ツー・テキスト入力をオープンフィールドに記入する手段(285),
    選択されたテキスト内でさらにオープンフィールドを調べる手段(240),
    選択されたテキストメッセージ内のオープンフィールドに対する音声入力を受信する手段に制御を戻す手段,および,
    編集プロセスを終結する手段(255),
    を含むシステム。
  8. 請求項7に記載のシステムであって,さらに,編集されたテキストメッセージに音声タグを加える手段(130),および編集されたテキストメッセージと音声タグを結合してMMSメッセージを形成する手段(135),を含むシステム。
  9. 請求項7に記載のシステムであって,さらに,編集されたテキストメッセージにイメージを加える手段(130),および編集されたテキストメッセージとイメージを結合してMMSメッセージを形成する手段(135)を含むシステム。
  10. 請求項7に記載のシステムであって,さらに,見つかった最も近い一致が許容限界内のテキスト入力に対応するかどうかを調べる手段(265)を含むシステム。
  11. 請求項10に記載のシステムであって,さらに,見つかった最も近い一致が許容限界内のテキスト入力に対応しなければ,現在のテキスト入力をデータベースに加えるよう促す手段(290)を含むシステム。
  12. 請求項7に記載のシステムであって,さらに,全てのオープンフィールドに記入がなされたらメッセージをさらに編集する手段(245,250)を含むシステム。
JP2006506254A 2003-03-06 2004-01-05 マルチメディアおよびテキストエディタを用いた音声起動メッセージ入力方法および装置 Expired - Fee Related JP4651613B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/248,982 US20040176114A1 (en) 2003-03-06 2003-03-06 Multimedia and text messaging with speech-to-text assistance
PCT/IB2004/000041 WO2004080095A1 (en) 2003-03-06 2004-01-05 Multimedia and text messaging with speech-to-text assistance

Publications (2)

Publication Number Publication Date
JP2006523988A JP2006523988A (ja) 2006-10-19
JP4651613B2 true JP4651613B2 (ja) 2011-03-16

Family

ID=32926020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006506254A Expired - Fee Related JP4651613B2 (ja) 2003-03-06 2004-01-05 マルチメディアおよびテキストエディタを用いた音声起動メッセージ入力方法および装置

Country Status (6)

Country Link
US (1) US20040176114A1 (ja)
EP (1) EP1600018B1 (ja)
JP (1) JP4651613B2 (ja)
CN (1) CN100409700C (ja)
DE (1) DE602004012071T2 (ja)
WO (1) WO2004080095A1 (ja)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0213021D0 (en) * 2002-06-07 2002-07-17 Hewlett Packard Co Telephone communication with silent response feature
FI113995B (fi) * 2002-12-11 2004-07-15 Nokia Corp Menetelmä ja laitteisto parannellun ääniviestin toteuttamiseksi
US8229086B2 (en) * 2003-04-01 2012-07-24 Silent Communication Ltd Apparatus, system and method for providing silently selectable audible communication
WO2004095197A2 (en) 2003-04-22 2004-11-04 Voice Genesis, Inc. Omnimodal messaging system
US7277697B2 (en) * 2003-05-23 2007-10-02 Adesh Desai Method and system for establishing a teleconference over a telephony network
US20050149327A1 (en) * 2003-09-11 2005-07-07 Voice Signal Technologies, Inc. Text messaging via phrase recognition
WO2005027478A1 (en) * 2003-09-11 2005-03-24 Voice Signal Technologies, Inc. Automatic voice addressing and messaging methods and apparatus
US20050154587A1 (en) * 2003-09-11 2005-07-14 Voice Signal Technologies, Inc. Voice enabled phone book interface for speaker dependent name recognition and phone number categorization
EP1517495A1 (en) * 2003-09-18 2005-03-23 Hewlett-Packard Development Company, L.P. Email delivery in telecommunications networks
GB2433002A (en) * 2003-09-25 2007-06-06 Canon Europa Nv Processing of Text Data involving an Ambiguous Keyboard and Method thereof.
GB0322516D0 (en) * 2003-09-25 2003-10-29 Canon Europa Nv Cellular mobile communication device
US20050266829A1 (en) * 2004-04-16 2005-12-01 Lg Elcectronics, Inc. Speech-to-text messaging system and method
US20070054678A1 (en) * 2004-04-22 2007-03-08 Spinvox Limited Method of generating a sms or mms text message for receipt by a wireless information device
EP1743493B1 (en) * 2004-05-03 2009-04-08 Research In Motion Limited System and method for interrupt control on a handheld device
US7583974B2 (en) * 2004-05-27 2009-09-01 Alcatel-Lucent Usa Inc. SMS messaging with speech-to-text and text-to-speech conversion
KR100605959B1 (ko) * 2004-06-21 2006-08-02 삼성전자주식회사 음성을 이용한 번호입력방법
US7551751B2 (en) * 2004-08-30 2009-06-23 Pitney Bowes Inc. Watermarking images with wavepackets encoded by intensity and/or phase variations
JP4527493B2 (ja) * 2004-10-20 2010-08-18 ソフトバンクモバイル株式会社 移動体通信端末
US8117540B2 (en) 2005-05-18 2012-02-14 Neuer Wall Treuhand Gmbh Method and device incorporating improved text input mechanism
US9606634B2 (en) * 2005-05-18 2017-03-28 Nokia Technologies Oy Device incorporating improved text input mechanism
US8036878B2 (en) * 2005-05-18 2011-10-11 Never Wall Treuhand GmbH Device incorporating improved text input mechanism
US8374846B2 (en) 2005-05-18 2013-02-12 Neuer Wall Treuhand Gmbh Text input device and method
CN1901041B (zh) * 2005-07-22 2011-08-31 康佳集团股份有限公司 语音字典形成方法、语音识别系统及其方法
US9042921B2 (en) * 2005-09-21 2015-05-26 Buckyball Mobile Inc. Association of context data with a voice-message component
US8275399B2 (en) 2005-09-21 2012-09-25 Buckyball Mobile Inc. Dynamic context-data tag cloud
US8077838B2 (en) * 2005-09-28 2011-12-13 Cisco Technology, Inc. Method and voice communicator to provide a voice communication
US20070100619A1 (en) * 2005-11-02 2007-05-03 Nokia Corporation Key usage and text marking in the context of a combined predictive text and speech recognition system
WO2007135475A1 (en) * 2006-05-24 2007-11-29 Al Hallami, Omran Voice transmission application via short message service (sms), multimedia messaging service (mms) and/or general packet radio service (gprs)
WO2007140023A2 (en) * 2006-06-01 2007-12-06 Voxpixel, Inc. Methods and systems for incorporating a voice-attached, tagged rich media package from a wireless camera-equipped handheld mobile device into a collaborative workflow
US20080016158A1 (en) * 2006-07-13 2008-01-17 Comverse Ltd. Method for appending a signature to a size limited text message
US20080282154A1 (en) * 2006-09-11 2008-11-13 Nurmi Mikko A Method and apparatus for improved text input
GB2443461A (en) * 2006-11-02 2008-05-07 George Rath Mobile phone
TW200822676A (en) * 2006-11-08 2008-05-16 Benq Corp Method and communication device for transmitting message
US7742774B2 (en) * 2007-01-11 2010-06-22 Virgin Mobile Usa, L.P. Location-based text messaging
WO2008102365A2 (en) 2007-02-22 2008-08-28 Silent Communication Ltd. System and method for telephone communication
US8494490B2 (en) * 2009-05-11 2013-07-23 Silent Communicatin Ltd. Method, circuit, system and application for providing messaging services
JP2008270914A (ja) * 2007-04-16 2008-11-06 Ntt Docomo Inc 制御装置、移動通信システム及び通信端末
TWI360109B (en) * 2008-02-05 2012-03-11 Htc Corp Method for setting voice tag
ATE501478T1 (de) * 2008-06-11 2011-03-15 Exb Asset Man Gmbh Vorrichtung und verfahren mit verbessertem texteingabemechanismus
US8145484B2 (en) * 2008-11-11 2012-03-27 Microsoft Corporation Speech processing with predictive language modeling
US9292565B2 (en) 2010-06-30 2016-03-22 International Business Machines Corporation Template-based recognition of food product information
CN102377869B (zh) * 2010-08-23 2016-07-06 联想(北京)有限公司 一种移动终端及通信方法
US20120284659A1 (en) * 2010-09-21 2012-11-08 Sony Ericsson Mobile Communications Ab System and method of enhancing messages
CN103546623B (zh) * 2012-07-12 2018-11-13 百度在线网络技术(北京)有限公司 用于发送语音信息及其文本描述信息的方法、装置与设备
CN103150645A (zh) * 2013-02-26 2013-06-12 深圳市中兴移动通信有限公司 录音方式添加日志的方法和装置
CN103369477B (zh) 2013-07-02 2016-12-07 华为技术有限公司 显示媒体信息方法、装置、客户端,图形控件显示方法和装置
CN104375997A (zh) * 2013-08-13 2015-02-25 腾讯科技(深圳)有限公司 一种为即时通讯音频信息添加备注信息的方法和装置
US20150172285A1 (en) * 2013-12-17 2015-06-18 Mei Ling LO Method for Accessing E-Mail System
US9854439B2 (en) 2014-02-07 2017-12-26 First Principles, Inc. Device and method for authenticating a user of a voice user interface and selectively managing incoming communications
US9860200B1 (en) 2014-08-27 2018-01-02 Google Llc Message suggestions
US9449442B2 (en) * 2014-10-23 2016-09-20 Vivint, Inc. Interface of an automation system
US9978370B2 (en) * 2015-07-31 2018-05-22 Lenovo (Singapore) Pte. Ltd. Insertion of characters in speech recognition
CN105869654B (zh) 2016-03-29 2020-12-04 阿里巴巴集团控股有限公司 音频消息的处理方法及装置
US10922668B2 (en) * 2016-09-23 2021-02-16 Ncr Corporation Point-of-sale (POS) bot
US11853649B2 (en) 2019-10-15 2023-12-26 Google Llc Voice-controlled entry of content into graphical user interfaces

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0476759A (ja) * 1990-07-18 1992-03-11 Brother Ind Ltd スペルチェック機能付き文書処理装置
JPH09185615A (ja) * 1995-12-27 1997-07-15 Toshiba Corp かな漢字変換方法
JP2000148748A (ja) * 1998-11-13 2000-05-30 Nec Corp 仮名漢字変換及び画像検索表示システム
JP2001223823A (ja) * 2000-02-09 2001-08-17 Kenwood Corp 移動体通信端末
JP2002010358A (ja) * 2000-06-26 2002-01-11 Sony Corp 携帯型補助端末及びハンズフリーヘッドセット
US20020142787A1 (en) * 2001-03-27 2002-10-03 Koninklijke Philips Electronics N.V. Method to select and send text messages with a mobile
JP2003507805A (ja) * 1999-08-12 2003-02-25 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 無線通信システムにおけるテキストメッセージのマルチメディア添付ファイルを送信するシステム及び方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19959903A1 (de) * 1999-12-07 2001-06-13 Bruno Jentner Modul zur Unterstützung der Text-Mitteilungs-Kommunikation in Mobilfunknetzen
DE10004260A1 (de) * 2000-02-02 2001-08-09 Bosch Gmbh Robert Verfahren zum Übertragen von Nachrichten in einem Telekommunikationsnetzwerk
JP2002101178A (ja) * 2000-09-21 2002-04-05 Sony Corp 携帯通信端末および画面表示方法
EP1350377A4 (en) * 2000-12-14 2005-01-12 Xcitel Ltd METHOD AND SYSTEM FOR PROCESSING MULTIPLE-PART MESSAGES BY CELLULAR TELEPHONE USERS
JP4358511B2 (ja) * 2001-01-18 2009-11-04 シーメンス アクチエンゲゼルシヤフト 移動無線ネットワークにおけるデータ伝送のための方法および移動通信装置
US6990180B2 (en) * 2001-04-05 2006-01-24 Nokia Mobile Phones Limited Short voice message (SVM) service method, apparatus and system
DE10235548B4 (de) * 2002-03-25 2012-06-28 Agere Systems Guardian Corp. Verfahren und Vorrichtung für die Prädiktion einer Textnachrichteneingabe
US20040176139A1 (en) * 2003-02-19 2004-09-09 Motorola, Inc. Method and wireless communication device using voice recognition for entering text characters
FI116168B (fi) * 2003-03-03 2005-09-30 Flextronics Odm Luxembourg Sa Datan syöttö

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0476759A (ja) * 1990-07-18 1992-03-11 Brother Ind Ltd スペルチェック機能付き文書処理装置
JPH09185615A (ja) * 1995-12-27 1997-07-15 Toshiba Corp かな漢字変換方法
JP2000148748A (ja) * 1998-11-13 2000-05-30 Nec Corp 仮名漢字変換及び画像検索表示システム
JP2003507805A (ja) * 1999-08-12 2003-02-25 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 無線通信システムにおけるテキストメッセージのマルチメディア添付ファイルを送信するシステム及び方法
JP2001223823A (ja) * 2000-02-09 2001-08-17 Kenwood Corp 移動体通信端末
JP2002010358A (ja) * 2000-06-26 2002-01-11 Sony Corp 携帯型補助端末及びハンズフリーヘッドセット
US20020142787A1 (en) * 2001-03-27 2002-10-03 Koninklijke Philips Electronics N.V. Method to select and send text messages with a mobile

Also Published As

Publication number Publication date
US20040176114A1 (en) 2004-09-09
EP1600018B1 (en) 2008-02-27
EP1600018A1 (en) 2005-11-30
WO2004080095A1 (en) 2004-09-16
DE602004012071D1 (en) 2008-04-10
JP2006523988A (ja) 2006-10-19
DE602004012071T2 (de) 2008-06-12
CN1739309A (zh) 2006-02-22
CN100409700C (zh) 2008-08-06

Similar Documents

Publication Publication Date Title
JP4651613B2 (ja) マルチメディアおよびテキストエディタを用いた音声起動メッセージ入力方法および装置
US10720145B2 (en) Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system
CN100424632C (zh) 用于高级交互接口的语义对象同步理解
US7778397B2 (en) Dynamic video generation in interactive voice response systems
US7062437B2 (en) Audio renderings for expressing non-audio nuances
US20090012793A1 (en) Text-to-speech assist for portable communication devices
US20040054539A1 (en) Method and system for voice control of software applications
US20060143007A1 (en) User interaction with voice information services
US20090006097A1 (en) Pronunciation correction of text-to-speech systems between different spoken languages
US20020128837A1 (en) Voice binding for user interface navigation system
AU2004201992A1 (en) Semantic object synchronous understanding implemented with speech application language tags
JP2006501509A (ja) 個人適応音声セグメントを備える音声合成装置
KR20070026452A (ko) 음성 인터랙티브 메시징을 위한 방법 및 장치
CN111325039B (zh) 基于实时通话的语言翻译方法、系统、程序和手持终端
KR20010076508A (ko) Mp3 플레이어 겸용 휴대폰에서 음성 인식에 의한 선곡방법
US20060190260A1 (en) Selecting an order of elements for a speech synthesis
US20040098266A1 (en) Personal speech font
US20090055167A1 (en) Method for translation service using the cellular phone
KR100380829B1 (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
JPH04175049A (ja) 音声応答装置
CN111274828B (zh) 基于留言的语言翻译方法、系统、计算机程序和手持终端
JP2015052745A (ja) 情報処理装置、制御方法、及びプログラム
KR20220050342A (ko) 음성 합성 서비스를 제공하는 장치, 단말기 및 방법
CN116343743A (zh) 一种基于xtts的语音合成方法及系统
TWI425811B (zh) 文本簡訊語音播放系統及方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100526

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101025

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20101101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101119

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101214

R150 Certificate of patent or registration of utility model

Ref document number: 4651613

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees