JP2013101637A - テキスト専用アプリケーションのための娯楽オーディオ - Google Patents

テキスト専用アプリケーションのための娯楽オーディオ Download PDF

Info

Publication number
JP2013101637A
JP2013101637A JP2012276836A JP2012276836A JP2013101637A JP 2013101637 A JP2013101637 A JP 2013101637A JP 2012276836 A JP2012276836 A JP 2012276836A JP 2012276836 A JP2012276836 A JP 2012276836A JP 2013101637 A JP2013101637 A JP 2013101637A
Authority
JP
Japan
Prior art keywords
audio
text
tag
sound
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012276836A
Other languages
English (en)
Inventor
Kirkeby Ole
オレ キルケビー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2013101637A publication Critical patent/JP2013101637A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. short messaging services [SMS] or e-mails

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】特にステレオ又は3Dオーディオを使用して、SMS及びe−メールのようなテキストアプリケーションをより面白い且つ楽しいものにする方法を提供する。
【解決手段】テキスト専用のアプリケーションのためのオーディオを発生する方法は、発生されたオーディオにサウンド効果を追加するのに使用できるタグを入力テキストに追加し、このタグを処理して、オーディオを発生するためのインストラクションを形成し、テキストが提示される間にこのインストラクションに基づいて前記サウンド効果を伴うオーディオを発生するステップを含む。本発明は、テキストアプリケーションに娯楽価値を追加し、従来のマルチメディアに比して非常にコンパクトなフォーマットを提供し、又、娯楽サウンドを使用して、SMS及びe−メールのようなテキスト専用アプリケーションをより面白い且つ楽しいものにする。
【選択図】図1

Description

本発明は、一般的に、SMS、e−メール、書籍及び新聞のようなテキスト専用アプリケーションにおけるオーディオの使用及び発生に係る。
大多数のテキストコンテンツは、移動装置のマルチメディア能力に益々焦点が当てられているのも関わらず、グラフィックやサウンドを含むように更新されることがありそうもない。書籍や新聞のような「アーカイブド」フォーマット及びSMSやe−メールのようなメッセージフォーマットは、非常に長い期間にわたり現在の形態で普及し続けている。それ自身あまり興奮することのないテキストフォーマットにマルチメディアの魅力を追加できる技術が、現在、第一歩を踏み出している。
この問題に対するほとんどの明確な解決策は、追加のマルチメディアコンテンツをオリジナルテキストコンテンツと共に記憶及び/又は送信することである。しかしながら、これは、テキストフォーマットがグラフィックやサウンドよりも著しくコンパクトであるために、少なくとも一桁、データ量を増加する。米国特許第7,103,548号は、テキストメッセージをオーディオ形態へ変換するシステムを開示しており、テキストメッセージは、感情指示子と、特徴形式の指示を埋め込んでおり、後者は、感情指示子により指示された感情をテキストメッセージのオーディオ形態で表現するために、複数のオーディオ形態プレゼンテーション特徴形式のどれを使用すべきか決定するように働く。又、現在、MSNメッセンジャーは、送信者がテキストにタグを書き込み、これを受信端でピクチャーへと変換できるようにする。しかしながら、コンテンツを前もって準備することは、コンテクスト依存の「サプライズ効果」の可能性を排除する。更に、ある周囲のサウンドスケープ、例えば、雨や風がスピーチに追加されて、従来の移動装置の1つのスピーカを通して再生された場合には、妨害となるバックグランドノイズのような音を発し、明瞭さを低減させる。
マルチメディアコンテンツを記憶し提示するのに適したフォーマットは多数ある。知られている最良のものは、SMIL(同期マルチメディアインテグレーション言語)である。ワールドワイドウェブにおいて公衆に向けられる資料の場合、ACSS(オーディオカスケード型スタイルシート)を使用して、サウンドの幾つかのプロパティを定義することができる。SSML(W3により推奨されるスピーチ合成マークアップ言語)との組み合わせにおいて、サウンド及びスピーチのある基本的なリアルタイムレンダリングを行うことができる。
従って、リアルタイムサウンド合成及びサウンド効果のレンダリング、特に、ステレオ又は3Dサウンドをテキストベースアプリケーションにおいて遂行するのに適したマークアップ言語又はそれに対応するソフトウェアアーキテクチャーが存在しない。
そこで、本発明の目的は、娯楽サウンド、特に、ステレオ又は3Dオーディオを使用して、SMS及びe−メールのようなテキストアプリケーションを、より面白い且つ楽しいものにする方法を提供することである。
この目的を達成するために、本発明は、テキスト専用アプリケーションのためのオーディオを発生する方法において、発生されたオーディオにサウンド効果を追加するのに使用できるタグを入力テキストに追加し、このタグを処理して、オーディオを発生するためのインストラクションを形成し、テキストが提示される間にこのインストラクションに基づいて前記サウンド効果を伴うオーディオを発生することを含む方法を提供する。
又、本発明は、テキスト専用アプリケーションのためのオーディオを発生する装置において、発生されたオーディオにサウンド効果を追加するのに使用できるタグを入力テキストに追加するためのタグ追加器と、このタグを処理して、オーディオを発生するインストラクションを形成するためのタグプロセッサと、テキストが提示される間にこのインストラクションに基づいて前記サウンド効果を伴うオーディオを発生するためのオーディオジェネレータと、を備えた装置も提供する。
又、本発明は、テキスト専用アプリケーションのためのオーディオを発生することのできる通信ターミナルにおいて、入力テキストに追加されるタグであって発生されたオーディオにサウンド効果を追加するのに使用できるタグを処理して、オーディオを発生するインストラクションを形成するタグプロセッサと、テキストが提示される間にこのインストラクションに基づいてサウンド効果を伴うオーディオを発生するためのオーディオジェネレータと、を備えた通信ターミナルも提供する。
通信ターミナルは、更に、入力テキストにタグを追加するためのタグ追加器を備えることもできる。
本発明を使用することで、3D、空間的増強及び効果の形態でオーディオを発生することができる。例えば、ステレオ又は3Dオーディオを使用すると、スピーチにサウンドを非嵌入的に追加することができ、サウンドスケープがステレオ又は3D効果に対して処理されて、ステレオヘッドホーン又は2つの至近離間されたスピーカを経て再生された場合に、スピーチを妨げることがないように空間分離化(spatialize)することができる。例えば、聴取者が傍らで雨や風を聞き中央でスピーチを聞いた場合には、明瞭さに影響が及ぶことはない。
又、本発明は、例えば、オーディオがオンザフライで発生されるときに、レンダリングアルゴリズムが時間(朝/昼/夕方、平日/週末、夏/冬)又はユーザの位置(家/車/オフィス、国)に関する情報を考慮できるように、発生されるオーディオ効果にランダムさを追加することにより、コンテクスト依存の「サプライズ効果又は価値」を高めることが意図される。
更に、本発明は、カスタマイズのための優れた可能性を許し、テキストアプリケーションに娯楽的価値を付加し、且つ平易テキストにマルチメディア「クラス」を追加する。又、本発明は、従来のマルチメディアに比して非常にコンパクトなフォーマットを与える。本発明は、プラットホーム特有ではないから、本発明の装置は、どのようにレンダリングするか判断する。
本発明の前記及び他の目的、特徴及び効果は、添付図面を参照した好ましい実施形態の以下の詳細な説明から明らかとなろう。
本発明によりテキスト専用アプリケーションのためにオーディオを発生する方法のフローチャートである。 本発明によりテキスト専用アプリケーションのためにオーディオを発生する装置のブロック図である。
以下、添付図面を参照して、本発明を詳細に説明する。
図1は、本発明によりテキスト専用アプリケーションのためにオーディオを発生する方法のフローチャートである。
ステップ100において、SMS、e−メール、オーディオブック、等のテキストアプリケーションが入力される。
ステップ110において、入力テキストからタグが発生される。好ましくは、2セットのタグがオーディオ処理(以下に述べる)のために発生される。これらのタグは、特殊なケースでは、例えば、ユーザにより手で挿入することもできるし、或いは移動電話、PDA(パーソナルデジタルアシスタント)、ラップトップコンピュータ、及びタグをテキストに追加できる他の装置を含むターミナルによって発生することもできる。このステップを実施するために、VoiceXML(ボイスUI及びウェブページのオーディオレンダリングのための)、JSML(Jスピーチマークアップ言語(Java(登録商標)、Sunによる))、STML(スポークンテキストマークアップ言語)、サーブル(JSMLとSTMLを結合する試み)、SSML(W3により推奨されるスピーチ合成マークアップ言語)、SMIL(マルチメディアプレゼンテーションのための同期マルチメディアインテグレーション言語)を含む複数のマークアップ言語を使用することができるが、これらに限定されない。このステップには、ACSS(オーディオカスケード型スタイルシート)を含むこともできる。これは、サウンドの幾つかのプロパティを定義し、スピーチ合成及びオーディオの両方を指定し、そしてボイスをオーディオとオーバーラップするのに使用できる。更に、ACSSは、幾つかの空間的オーディオ特徴(例えば、方位、仰角)を有する。本発明によれば、スピーチ、音楽及びオーディオ効果に適用されるタグを含むオーディオXMLフォーマットのような新規なマークアップ言語を確立して、ステレオ又は3Dサウンド効果のようなサウンド効果をオーディオに追加するように使用することができる。例えば、入力メッセージは、‘Sorry I missed your call. I was playing tennis at the time. I won. (ごめん、あなたの電話を取り損なった。そのとき、テニスをしていた。私が勝った。)’である。例示的な擬似タグは、<continuous play: background music> Sorry I sassed your <audio substitute: call>. I was playing tennis <audio icon: tennis> at the time. W won! <audio icon: fireworks><end play: background music>である。
ステップ120において、ステップ110で追加されたタグがコマンドへと変換され、コマンドは、サウンドを合成すると共にメッセージを発生するのに使用でき、メッセージは、オーディオ処理を制御するか、オーディオ処理の入力として使用できる。サウンドを合成する場合には、MIDIメッセージを使用することができる。スピーチを合成する場合には、SSMLの拡張バージョンを使用することができる(ここでは、図1のSSML+を参照)。ステップ120は、特徴:ランダム化を含むことができる。サウンドを厳密に繰り返すだけでは、聴取者にとって直ちに退屈になるか又はうるさいだけである。例えば、ゲームのオーディオ設計では、ユーザが全く同じサンプルを何回も聴取する必要がないように、アクターが同じラインを数回繰り返すことを記録するのが通常である。ランダムさは、多数の異なる方法で挿入することができる。幾つかの例を以下に示す。
・一般的
・低レベルのレンダリングパラメータ(ボイス、楽器)を変える
・「サウンドアイコン」(「スマイル」と同等の短いサウンド)の選択を変える
・空間的効果及び後処理を変える
・スピーチ
・発音
・イベント(スピーチリズム、休止)のタイミングを変える
・意味を変更せずにテキストを変更する
・音楽
・アルゴリズム音楽発生を使用する
・サウンドサンプルのピッチ及び/又はテンポを変更する
・効果
・同様のサウンドを異なる仕方でレンダリングする
オーディオレンダリングは、幾つかのレンダリングパラメータ(例えば、IMDIメッセージに埋め込まれた値)の低レベル制御をサポートすることができ、例えば、足音は、同じイベントの異なる発生のようなサウンドを常に発するように、タイミング、ピッチ、及び巾を変化させることができる。
ランダム化の効果は明らかであり、サプライズの価値を付加し、ユーザが厳密な繰り返しで退屈又はうるさくなるのを防止し、レンダリングされるオーディオが予想可能になり過ぎるのを防止し、更に、個人の好みに基づいて設定を調整する優れた可能性を得ることである。
ステップ130において、ステップ120からの入力が出力オーディオへと処理される。スピーチ合成の場合は、TTS(テキスト対スピーチ)エンジンを使用して、タグ付きテキスト(例えば、SSML+)をスピーチへと変換することができる。TTSシステムは、最近の数年間に劇的に改良された。アーチファクトは、スピーチサウンドを「ロボチック(robotic)」ではなく、「チョップアップ(chopped up)」にする。スピーチの質は、非常に自然なものとすることができるが、良質なTTSは、MIPS及びメモリの両方において集中的な計算を意味する。オーディオ合成の場合は、音楽及び効果(例えば、足音、海辺の波音及び鳥のさえずり)を含む2つの形式の合成オーディオが必要とされる。コントロール言語として適当なMIDIは、効果設定(残響、合唱、等)、優先順位(SP−MIDI)、タイムスタンプ、及びサウンドに影響する幾つかの低レベルパラメータを含むことができる。MIDIに使用されるウェーブテーブル合成は、音楽及び効果の両方に合理的である。ウェーブテーブル合成エンジン(オーディオ合成エンジン)(図1を参照)は、GMI準拠(一般的MIDI)であり、又、GM2準拠とすることができ、DLS(ダウンロード可能なサウンド)フォーマット及び全てのメインサンプリングレートをサポートする。
次いで、フローは、ステップ140へ進み、ステップ130からの出力オーディオが更に処理される。
図2を参照すれば、本発明によるテキスト専用アプリケーションのためのオーディオを発生する装置であって、図1にフローチャートに示された方法を対応的に遂行するための装置が示されている。テキスト専用アプリケーションを受信すると、タグ追加手段は、入力テキストのためのタグのセットを発生する。又、これらのタグは、特殊なケースでは、例えば、ユーザにより手で挿入することもできるし、或いは移動電話、PDA(パーソナルデジタルアシスタント)、ラップトップコンピュータ、及びタグをテキストに追加できる他の装置を含むターミナルによって発生することもできる。好ましくは、タグ追加手段により2つのセットが発生される。一方のセットは、TTSエンジンにとって有効であり、このため、SSMLのようなフォーマットを使用することができる。他方は、サウンド効果及び音楽の両方発生できるオーディオ合成エンジンにとって有効である。このようなフォーマットは、オーディオXMLと称することができる(図2を参照)。SMSのようなアプリケーションの場合には、タグ追加手段は、送信者又は受信者のいずれかのターミナルにおいて動作することができる。
次いで、タグ処理手段は、タグを低レベルコマンドへ変換し、コマンドは、サウンドを合成すると共にメッセージを発生するのに使用でき、このメッセージは、オーディオ処理を制御し、「サプライズ価値」を付加する。サウンド合成の場合には、MIDIメッセージを使用することができる。TTSの場合、SSMLの若干拡張されたバージョンを使用することができる(ここでは、図2のSSML+を参照)。タグ処理手段は、聴取者のターミナルで動作されねばならない。タグ処理手段は、特徴:ランダム化を含むことができる。サウンド合成エンジンでは、低レベルコマンドを僅かに変更することで微妙な変化を実施することができる。例えば、足音は、同じイベントの異なる発生のようなサウンドを常に発するように、タイミング、ピッチ、及び巾を変化させることができる。
オーディオ発生手段(図2の破線部を参照)は、タグ処理手段からの出力を受信する。スピーチ合成の場合は、TTSエンジンが、処理を遂行するように効果的に使用される。オーディオ合成の場合は、ウェーブテーブル合成エンジンが、音楽及び効果の両方を合理的に行うように効果的に使用される。
オーディオ処理手段は、例えば、3Dアルゴリズム及び後効果をTTSからの出力及びオーディオ合成エンジンで遂行する。オーディオ処理手段は、次のファンクション、即ち位置的オーディオ、モノ/3D空間的増強、ステレオ拡幅、残響、EQ(イコライザ)、及びDRC(ダイナミックレンジコントロール)のうちの少なくとも1つを実施することができる。更に、オーディオ処理手段は、任意であるが、サンプルレート変換、ミキシング、パラメータ(3D位置、残響に対するT60)のリアルタイム変化をサポートする。
本発明の装置は、テキスト専用アプリケーションのためのオーディオを発生することのできる通信ターミナルにおいて、入力テキストに追加されるタグであって発生されたオーディオにサウンド効果を追加するのに使用できるタグを処理して、オーディオを発生するインストラクションを形成するタグプロセッサと、テキストが提示される間にこのインストラクションに基づいてサウンド効果を伴うオーディオを発生するためのオーディオ発生手段と、を備えた通信ターミナルにおいて実施することができる。或いは又、この通信ターミナルは、更に、入力テキストにタグを追加するためのタグ追加手段を備えることもできる。この通信ターミナルは、例えば、移動ターミナルである。
以上、本発明の特定の実施形態を開示したが、当業者であれば、本発明の精神及び範囲から逸脱せずに、特定の実施形態に対し変更をなし得ることが理解できよう。本発明は、オーディオに焦点を当てたが、テキストアプリケーションにグラフィックを追加する等しく強力なケースも考えられる。それ故、本発明の範囲は、特定の実施形態に限定されず、特許請求の範囲は、本発明の範囲内に入るそのような全てのアプリケーション、変更及び実施形態も包含するものとする。
100、110、120、130、140:方法のステップ

Claims (27)

  1. テキスト専用アプリケーションのためのオーディオを発生する方法において、
    発生されたオーディオにサウンド効果を追加するのに使用できるタグを入力テキストに追加するステップと、
    前記タグを処理して、オーディオを発生するためのインストラクションを形成するステップと、
    テキストが提示される間に前記インストラクションに基づいて前記サウンド効果を伴うオーディオを発生するステップと、
    を備えた方法。
  2. 前記サウンド効果は、ステレオ効果である、請求項1に記載の方法。
  3. 前記サウンド効果は、3Dサウンド効果である、請求項1に記載の方法。
  4. 前記テキストは、表示されることにより提示されるか、又はテキスト/スピーチ変換の仕方で提示される、請求項1に記載の方法。
  5. 前記タグは、入力テキストから発生されるか、又は手で挿入される、請求項1に記載の方法。
  6. 前記タグは、スピーチ、音楽又はオーディオ効果に適用される、請求項1に記載の方法。
  7. サウンド効果を伴うオーディオを発生する前記ステップにおいて、前記インストラクションを使用してサウンドを合成すると共に、オーディオ処理を制御する、請求項1に記載の方法。
  8. タグを処理する前記ステップにおいて、ランダムさを追加するステップを更に含む、請求項1に記載の方法。
  9. ランダムさを追加する前記ステップは、インストラクションの変更によって実行され、この変更は、オーディオを発生する仕方又はパラメータを変化させる、請求項8に記載の方法。
  10. 前記仕方又はパラメータは、低レベルレンダリングパラメータ、サウンドアイコンの選択、空間的効果及び後処理、発音、イベントのタイミング、意味の変更を伴わないテキストの変更、アルゴリズム音楽発生の使用、及び同様のサウンドの異なるレンダリング、の少なくとも1つを含む、請求項9に記載の方法。
  11. サウンド効果を伴うオーディオを発生する前記ステップは、TTSエンジンでスピーチ合成を遂行する段階を含む、請求項1に記載の方法。
  12. サウンド効果を伴うオーディオを発生する前記ステップは、オーディオ合成エンジンでオーディオ合成を遂行する段階を含む、請求項1に記載の方法。
  13. サウンド効果を伴うオーディオを発生する前記ステップは、オーディオ処理を遂行する段階を含む、請求項1に記載の方法。
  14. テキスト専用アプリケーションのためのオーディオを発生する装置において、
    発生されたオーディオにサウンド効果を追加するのに使用できるタグを入力テキストに追加するためのタグ追加器と、
    前記タグを処理して、オーディオを発生するインストラクションを形成するためのタグプロセッサと、
    テキストが提示される間に前記インストラクションに基づいて前記サウンド効果を伴うオーディオを発生するためのオーディオジェネレータと、
    を備えた装置。
  15. 前記サウンド効果は、ステレオ効果である、請求項14に記載の装置。
  16. 前記サウンド効果は、3Dサウンド効果である、請求項14に記載の装置。
  17. 前記テキストは、表示されることにより提示されるか、又はテキスト/スピーチ変換の仕方で提示される、請求項14に記載の装置。
  18. 前記タグは、入力テキストから発生されるか、又は手で挿入される、請求項14に記載の装置。
  19. 前記タグは、スピーチ、音楽又はオーディオ効果に適用される、請求項14に記載の装置。
  20. 前記オーディオジェネレータは、前記インストラクションを使用してサウンドを合成すると共に、オーディオ処理を制御する、請求項14に記載の装置。
  21. 前記タグプロセッサは、ランダムさを追加する、請求項14に記載の装置。
  22. 前記タグプロセッサは、インストラクションの変更によって前記ランダムさを実行し、この変更は、オーディオを発生する仕方又はパラメータを変化させる、請求項21に記載の装置。
  23. 前記仕方又はパラメータは、低レベルレンダリングパラメータ、サウンドアイコンの選択、空間的効果及び後処理、発音、イベントのタイミング、意味の変更を伴わないテキストの変更、アルゴリズム音楽発生の使用、及び同様のサウンドの異なるレンダリング、の少なくとも1つを含む、請求項22に記載の装置。
  24. 前記オーディオジェネレータは、スピーチ合成を遂行するためのTTSエンジン、及びオーディオ合成を遂行するためのオーディオ合成エンジン、の少なくとも1つを含む、請求項14に記載の装置。
  25. 前記オーディオジェネレータは、オーディオ処理を遂行するためのオーディオプロセッサを更に備えた、請求項14に記載の装置。
  26. テキスト専用アプリケーションのためのオーディオを発生することのできる通信ターミナルにおいて、
    入力テキストに追加されるタグであって発生されたオーディオにサウンド効果を追加するのに使用できるタグを処理して、オーディオを発生するインストラクションを形成するタグプロセッサと、
    テキストが提示される間にこのインストラクションに基づいてサウンド効果を伴うオーディオを発生するためのオーディオジェネレータと、
    を備えた通信ターミナル。
  27. 入力テキストに前記タグを追加するためのタグ追加器を更に備えた、請求項26に記載の通信ターミナル。
JP2012276836A 2007-04-28 2012-12-19 テキスト専用アプリケーションのための娯楽オーディオ Pending JP2013101637A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200710107719.5 2007-04-28
CN2007101077195A CN101295504B (zh) 2007-04-28 2007-04-28 用于仅文本的应用的娱乐音频

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2010504890A Division JP2010529519A (ja) 2007-04-28 2008-04-24 テキスト専用アプリケーションのための娯楽オーディオ

Publications (1)

Publication Number Publication Date
JP2013101637A true JP2013101637A (ja) 2013-05-23

Family

ID=39926170

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2010504890A Pending JP2010529519A (ja) 2007-04-28 2008-04-24 テキスト専用アプリケーションのための娯楽オーディオ
JP2012276836A Pending JP2013101637A (ja) 2007-04-28 2012-12-19 テキスト専用アプリケーションのための娯楽オーディオ

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2010504890A Pending JP2010529519A (ja) 2007-04-28 2008-04-24 テキスト専用アプリケーションのための娯楽オーディオ

Country Status (6)

Country Link
US (1) US8694320B2 (ja)
EP (1) EP2143100A4 (ja)
JP (2) JP2010529519A (ja)
KR (1) KR20090132631A (ja)
CN (1) CN101295504B (ja)
WO (1) WO2008132579A2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5300074B2 (ja) * 2009-09-02 2013-09-25 Necカシオモバイルコミュニケーションズ株式会社 端末装置及びプログラム
US9164983B2 (en) 2011-05-27 2015-10-20 Robert Bosch Gmbh Broad-coverage normalization system for social media language
US9037467B2 (en) * 2012-01-02 2015-05-19 International Business Machines Corporation Speech effects
GB2501067B (en) * 2012-03-30 2014-12-03 Toshiba Kk A text to speech system
CN103516582A (zh) * 2012-06-28 2014-01-15 北京神州泰岳软件股份有限公司 一种即时通讯中进行信息提示的方法和系统
US9047784B2 (en) 2012-08-02 2015-06-02 International Business Machines Corporation Automatic eBook reader augmentation
CN103839550A (zh) * 2012-11-26 2014-06-04 阿尔卡特朗讯 一种用于对会话中的语音进行处理的方法、装置和系统
US10020001B2 (en) 2014-10-01 2018-07-10 Dolby International Ab Efficient DRC profile transmission
CN105791079B (zh) * 2014-12-24 2019-05-07 瞬联软件科技(北京)有限公司 基于动态图格的即时通信方法、客户端及系统
CN106547511B (zh) * 2015-09-16 2019-12-10 广州市动景计算机科技有限公司 一种语音播读网页信息的方法、浏览器客户端及服务器
CN106898341B (zh) * 2017-01-04 2021-03-09 清华大学 一种基于共同语义空间的个性化音乐生成方法及装置
CN107731219B (zh) * 2017-09-06 2021-07-20 百度在线网络技术(北京)有限公司 语音合成处理方法、装置及设备
CN110148393B (zh) * 2018-02-11 2023-12-15 阿里巴巴集团控股有限公司 音乐生成方法、装置和系统以及数据处理方法
CN108877766A (zh) * 2018-07-03 2018-11-23 百度在线网络技术(北京)有限公司 歌曲合成方法、装置、设备及存储介质
CN112334973B (zh) * 2018-07-19 2024-04-26 杜比国际公司 用于创建基于对象的音频内容的方法和系统
US11114085B2 (en) 2018-12-28 2021-09-07 Spotify Ab Text-to-speech from media content item snippets
CN109933576B (zh) * 2019-03-04 2021-06-11 百度在线网络技术(北京)有限公司 音效sdk库建立方法及装置、电子设备和计算机可读介质
JP6935452B2 (ja) * 2019-05-29 2021-09-15 株式会社バンダイ システム、装置、方法及びプログラム
CN113903325B (zh) * 2021-05-31 2022-10-18 北京荣耀终端有限公司 文本转3d音频的方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0713581A (ja) * 1993-06-04 1995-01-17 Internatl Business Mach Corp <Ibm> 音声への空間情報提供方法及びシステム
JP2000081892A (ja) * 1998-09-04 2000-03-21 Nec Corp 効果音付加装置および効果音付加方法
JP2000099074A (ja) * 1998-09-21 2000-04-07 Ricoh Co Ltd 文書読み上げ装置
JP2002221980A (ja) * 2001-01-25 2002-08-09 Oki Electric Ind Co Ltd テキスト音声変換装置
JP2002311979A (ja) * 2001-04-17 2002-10-25 Sony Corp 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
JP2003030113A (ja) * 2001-07-19 2003-01-31 Sharp Corp 通信端末装置およびプログラム記憶媒体
JP2005092829A (ja) * 2003-09-22 2005-04-07 Yokogawa Electric Corp 測定システム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020002458A1 (en) * 1997-10-22 2002-01-03 David E. Owen System and method for representing complex information auditorially
JP2001127900A (ja) 1999-10-26 2001-05-11 Matsushita Electric Ind Co Ltd 通信装置、電話機および通信処理プログラムを記録した記録媒体
US20030028380A1 (en) * 2000-02-02 2003-02-06 Freeland Warwick Peter Speech system
US6865533B2 (en) * 2000-04-21 2005-03-08 Lessac Technology Inc. Text to speech
GB0113570D0 (en) * 2001-06-04 2001-07-25 Hewlett Packard Co Audio-form presentation of text messages
US6810378B2 (en) * 2001-08-22 2004-10-26 Lucent Technologies Inc. Method and apparatus for controlling a speech synthesis system to provide multiple styles of speech
JP2003150522A (ja) 2001-11-19 2003-05-23 Casio Comput Co Ltd 電子メールサーバ、電子メールサービス提供方法および電子メールサービス提供プログラム
JP2003295882A (ja) * 2002-04-02 2003-10-15 Canon Inc 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム
US8978090B2 (en) * 2003-03-12 2015-03-10 Qualcomm Incorporated Multimedia transcoding proxy server for wireless telecommunication system
JP2005166039A (ja) * 2003-11-14 2005-06-23 Matsushita Electric Ind Co Ltd メールプログラム、電子メール装置、および電子メールの管理方法
US20050144002A1 (en) * 2003-12-09 2005-06-30 Hewlett-Packard Development Company, L.P. Text-to-speech conversion with associated mood tag
JP3822883B2 (ja) 2004-04-27 2006-09-20 株式会社コナミデジタルエンタテインメント ゲームソフトウエア及びゲーム装置
KR100677319B1 (ko) 2004-04-29 2007-02-02 엘지전자 주식회사 이동통신단말기의 3d 사운드 구현장치
JP2006338335A (ja) * 2005-06-02 2006-12-14 Fujitsu Ltd 即時発声メール送受信機能を備えた携帯端末装置
KR100724868B1 (ko) 2005-09-07 2007-06-04 삼성전자주식회사 다수의 합성기를 제어하여 다양한 음성 합성 기능을제공하는 음성 합성 방법 및 그 시스템
CN101046956A (zh) * 2006-03-28 2007-10-03 国际商业机器公司 交互式音效产生方法及系统
US8438032B2 (en) * 2007-01-09 2013-05-07 Nuance Communications, Inc. System for tuning synthesized speech

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0713581A (ja) * 1993-06-04 1995-01-17 Internatl Business Mach Corp <Ibm> 音声への空間情報提供方法及びシステム
JP2000081892A (ja) * 1998-09-04 2000-03-21 Nec Corp 効果音付加装置および効果音付加方法
JP2000099074A (ja) * 1998-09-21 2000-04-07 Ricoh Co Ltd 文書読み上げ装置
JP2002221980A (ja) * 2001-01-25 2002-08-09 Oki Electric Ind Co Ltd テキスト音声変換装置
JP2002311979A (ja) * 2001-04-17 2002-10-25 Sony Corp 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
JP2003030113A (ja) * 2001-07-19 2003-01-31 Sharp Corp 通信端末装置およびプログラム記憶媒体
JP2005092829A (ja) * 2003-09-22 2005-04-07 Yokogawa Electric Corp 測定システム

Also Published As

Publication number Publication date
EP2143100A4 (en) 2012-03-14
KR20090132631A (ko) 2009-12-30
CN101295504A (zh) 2008-10-29
JP2010529519A (ja) 2010-08-26
WO2008132579A3 (en) 2009-02-12
WO2008132579A2 (en) 2008-11-06
US20100145705A1 (en) 2010-06-10
EP2143100A2 (en) 2010-01-13
US8694320B2 (en) 2014-04-08
CN101295504B (zh) 2013-03-27

Similar Documents

Publication Publication Date Title
US8694320B2 (en) Audio with sound effect generation for text-only applications
US10720145B2 (en) Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system
US7706510B2 (en) System and method for personalized text-to-voice synthesis
JP4651613B2 (ja) マルチメディアおよびテキストエディタを用いた音声起動メッセージ入力方法および装置
US20160379611A1 (en) Systems and Method for Music Remixing
US9065931B2 (en) Systems and methods for portable audio synthesis
CA2539649C (en) System and method for personalized text-to-voice synthesis
JP2017021125A (ja) 音声対話装置
US20060224385A1 (en) Text-to-speech conversion in electronic device field
JP2001109487A (ja) 電子メールの音声再生装置、その音声再生方法、及び音声再生プログラムを記録した記録媒体
JP2005062420A (ja) コンテンツ生成システム、コンテンツ生成方法およびコンテンツ生成プログラム
JP2001051688A (ja) 音声合成を用いた電子メール読み上げ装置
CN103200309A (zh) 用于仅文本的应用的娱乐音频
JP2005107320A (ja) 音声再生用データ生成装置
GB2395631A (en) Audio file reproduction in a mobile telecommunications device
JP4514513B2 (ja) 音楽メール出力方法、音楽メール出力システム、及び音楽出力装置
JP2006301063A (ja) コンテンツ提供システム、コンテンツ提供装置および端末装置
JP2005107136A (ja) 音声および楽曲再生装置
JP2005156946A (ja) 楽曲再生装置、音声再生装置、楽曲及び音声を再生する方法及びそのプログラム
WO2006067981A1 (ja) 電子メール送信端末および電子メールシステム
JP2002118624A (ja) 携帯移動端末における鳴動効果音声発生方式
JP2004282545A (ja) 携帯端末装置
JP2004064640A (ja) 文字通話機能付き通信端末装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140121

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140825