JP2010528372A - パーソナリティベース装置 - Google Patents

パーソナリティベース装置 Download PDF

Info

Publication number
JP2010528372A
JP2010528372A JP2010509495A JP2010509495A JP2010528372A JP 2010528372 A JP2010528372 A JP 2010528372A JP 2010509495 A JP2010509495 A JP 2010509495A JP 2010509495 A JP2010509495 A JP 2010509495A JP 2010528372 A JP2010528372 A JP 2010528372A
Authority
JP
Japan
Prior art keywords
personality
predetermined
prompt
font
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010509495A
Other languages
English (en)
Inventor
ティーガン,ヒュー・エイ
バドガー,エリック・エヌ
ラインルード,ドリュー・イー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2010528372A publication Critical patent/JP2010528372A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • G10L2021/0135Voice conversion or morphing

Abstract

パーソナリティベーステーマが提供され得る。アプリケーションプログラムが、パーソナリティに対応するプロンプトに関してパーソナリティリソースファイルにクエリーし得る。その後、プロンプトが、音声合成エンジンにおいて受信され得る。次に、音声合成エンジンは、パーソナリティに対応する音声フォントに関してパーソナリティ音声フォントデータベースにクエリーし得る。その後、音声合成エンジンは、プロンプトに音声フォントを適用し得る。音声フォントが適用されたプロンプトが、その後、出力装置に作成され得る。
【選択図】 図1

Description

本発明は、対象個人を表現するテーマを計算機に与える方法に関する。
モバイル装置が、多くの活動のための主要な計算装置として使用され得る。例えば、モバイル装置は、連絡、約束、及び仕事を管理するための携帯用計算機を含み得る。モバイル装置は、通常、氏名及び住所データベース、カレンダー、予定リスト、及び記録係を含んでいて、これらの機能を個人情報マネージャーに含み得る。無線モバイル装置は、電子メール、ウェブ閲覧、及び携帯電話サービス(例えば、スマートフォン)も提供し得る。データは、有線接続又は無線接続を介し、モバイル装置とデスクトップ計算機の間で同期され得る。
本発明の目的は、単一又は複数のマルチメディアパーソナリティテーマを表現する装置を提供することである。
この発明の概要は、発明を実施するための形態に更に後述されている選定された概念を簡易形式で紹介するために提供されている。この発明の概要は、請求項記対象の主要な特徴も実質的な機能も特定することを意図されていない。この発明の概要は、請求項記載対象の範囲を限定するように使用されることも意図されていない。
パーソナリティベーステーマが提供され得る。アプリケーションプログラムが、パーソナリティに対応するプロンプトに関してパーソナリティリソースファイルにクエリーし得る。その後、プロンプトが、音声合成エンジンにおいて受信され得る。次に、音声合成エンジンは、パーソナリティに対応する音声フォントに関してパーソナリティ音声フォントデータベースにクエリーし得る。その後、音声合成エンジンは、プロンプトに音声フォントを適用し得る。音声フォントが適用されたプロンプトが、その後、出力装置に作成され得る。
上記の概説及び以下の詳細説明双方は、例を提供していて説明的に過ぎない。したがって、上記の概説及び以下の詳細説明を制限的であると考えるべきでない。更に、本明細書に詳細に説明されたものに追加の機能又は変形が提供され得る。例えば、実施形態は、詳細説明に記載されている様々な機能の組み合わせ及び下位の組み合わせを対象にし得る。
この開示に取り入れられ、この開示の一部を構成する添付図面が、本発明の様々な実施形態を例示している。
動作環境のブロック図である。 別の動作環境のブロック図である。 パーソナリティベーステーマを提供するための方法の流れ図である。 計算装置を含むシステムのブロック図である。
以下の詳細説明は、添付の図面を参照している。可能な限り、同一の参照番号が、同一又は同様のエレメントを参照するために、図面及び以下の説明において使用され得る。本発明の実施形態を説明するが、修正、適用、及び別の実装が可能である。例えば、代替、追加、又は修正が、図面に例示されたエレメントに実行され得、本明細書に記載されている方法は、段階の代用、再順序化、又は追加によって開示された方法に対し変更され得る。したがって以下の詳細説明は、本発明を制限しない。その代わりに本発明の適切な範囲が、添付の請求項によって定義されている。
本発明の実施形態は、パーソナリティテーマの組み込みを介し装置(例えば、モバイル装置又は組み込まれた装置)の魅力を増大させ得る。パーソナリティは、個人パーソナリティであり得、有名人物のパーソナリティであり得る。このパーソナリティテーマを提供するために、本発明の実施形態は、合成音声、楽曲、及びビジュアルエレメントを使用し得る。更に、本発明の実施形態は、単一のパーソナリティ又は複数のパーソナリティさえも表現する装置を提供し得る。
本発明の実施形態と一致する音声合成は、例えば、対象個人又は個人(複数)によって作成された録音から生成される「音声フォント」の使用を介し、対象個人(例えば、パーソナリティ)を表現し得る。この音声フォントによって、装置が「話す」とき、装置は、特定の個人らしく聞こえ得る。言い換えれば、音声フォントが、カスタマイズされた音声を装置に作成させ得る。カスタマイズされた音声に加えて、メッセージプロンプトが、対象個人の文法的な表現方法を反映するようにカスタマイズされ得る。更に、合成音声は、対象個人から記録された言葉又はメッセージによる補強もされ得る。
更に、楽曲が対象個人を表現するために、装置によって使用され得る。対象個人が、例えば、音楽家である場合、対象個人による歌が、例えば着信音、通知などに対し使用され得る。対象個人による歌も、媒体機能を有する装置に対しパーソナリティテーマと共に含まれ得る。対象個人として俳優を表現する装置は、その俳優が出演した映画又はテレビ番組が提供するテーマ音楽を使用し得る。
パーソナリティテーマ内部のビジュアルエレメントは、例えば、対象個人の画像、対象個人に関連付けられたオブジェクト、及びエンドユーザーが対象個人、又は対象個人の仕事と共に識別し得るカラーテーマを含み得る。「ショーンアレクサンダーの電話」に関する例は、フットボールの画像であり得る。ビジュアルエレメントは、モバイル装置画面の背景に、ウィンドウ境界に、いくつかのアイコンに、又は電話の外観(場合によっては取り外し可能な前面板)に印刷されたイベントに、見え得る。
したがって、本発明の実施形態は、パーソナリティテーマを送信するために使用される「パーソナリティスキンパッケージ」を提供するために、1つ以上のパーソナリティ、場合によっては有名人の(「パーソナリティスキン」)の方々の装置に対しパーソナリティテーマをカスタマイズし得る。例えば、本発明の実施形態は、対象個人の発話形式に一致するように標準のプロンプトを文法的に変更し得る。更に、本発明の実施形態は、例えば、ユーザーが、パーソナリティスキンの切り替え、パーソナリティスキンパッケージの取り外し、又は新しいパーソナリティスキンパッケージのダウンロード、を可能にする「パーソナリティスキンマネージャー」を含み得る。
「パーソナリティスキン」は、例えば、
i)対象個人が提供する録音から生成されたカスタマイズされた音声フォント
ii)対象個人の発話形式に一致するようにカスタマイズされた音声プロンプト
iii)パーソナリティ特有の音声クリップ又はファイル
iv)パーソナリティ特有の画像又は他のビジュアルエレメント
を含み得る。これらのエレメント(又は他のエレメント)が、単一のパッケージに一緒に送信されるところでは、それらがパーソナリティスキンパッケージとして参照され得る。
図1は、パーソナリティベーステーマシステム(100)を示す。図1に示されているように、システム(100)は、第1のアプリケーションプログラム(105)、第2のアプリケーションプログラム(110)、第3のアプリケーションプログラム(115)、第1のパーソナリティリソースファイル(120)、第1のデフォルトリソースファイル(125)、第2のパーソナリティリソースファイル(130)、及び第3のデフォルトリソースファイル(135)を含み得る。更に、システム(100)は、音声合成エンジン(140)、パーソナリティ音声フォントデータベース(150)、デフォルト音声フォントデータベース(155)、及び出力装置(160)を含み得る。第1のアプリケーションプログラム(105)、第2のアプリケーションプログラム(110)、又は第3のアプリケーションプログラム(115)のいずれかは、電子メール及び連絡アプリケーション、文書処理アプリケーション、スプレッドシートアプリケーション、データベースアプリケーション、スライド表示アプリケーション、描画又は計算機支援アプリケーションプログラムなどのいずれかを含み得るがこれらに限定しない。出力装置(160)は、例えば、図4に関して更に詳細に後述されているような出力装置(414)のいずれかを含み得る。図4に関して更に詳細に後述されているように、システム(100)は、システム(400)を使用して実装され得る。更に、もっと詳細に後述されているように、システム(100)は、図3に関して更に詳細に後述されているように、方法(300)の1つ以上の段階を実装するために使用され得る。
更に、システム(100)は、モバイル装置を含むか又はそうでなければそれに実装され得る。モバイル装置(105)は、移動電話、携帯電話、無線電話、無線装置、携帯用パーソナルコンピューター、携帯用計算装置、マルチプロセッサーシステム、ミイクロプロセッサーベース又はプログラマブル家電装置、携帯情報端末(PDA)、電話、ポケットベル、又は情報を受信し処理し送信するように構成される別の任意の装置を含み得るがこれらに限定しない。例えば、モバイル装置は、無線通信するように構成される電子装置を含み得、ユーザーが電子装置を容易に持ち運ぶのに十分小型であり得る。言い換えれば、モバイル装置は、ノートブックコンピューターよりも小型であり得、例えば、移動電話又はPDAを含み得る。
図2は、パーソナリティベーステーマ管理システム(200)を示す。図2に示されているように、システム(200)は、第1のアプリケーションプログラム(105)、第2のアプリケーションプログラム(110)、パーソナリティマネージャー(205)、インターフェース(210)、及びレジストリー(215)を含み得るがこれらに限定しない。図4に関連して更に詳細に後述されているように、システム(200)は、システム(400)を使用して実装され得る。図2の動作を更に詳細に後述する。
図3は、パーソナリティベーステーマを提供するための本発明の実施形態と一致する方法(300)に含まれる一般的な段階を詳細に説明する流れ図である。方法(300)は、図4に関連して更に詳細に後述されているように、計算装置(400)を使用して実装され得る。方法(300)の段階を実施するための方法を更に詳細に後述する。開始ブロック(305)において、方法(300)が始まり、計算装置(400)が、パーソナリティに対応するプロンプトに関して第1のパーソナリティリソースファイル(120)に(例えば、ユーザーが起動した入力に応答し第1のアプリケーションプログラム(105)によって)クエリーし得る段階(310)に進み得る。例えば、第1のアプリケーションプログラム(105)のプロンプトが、第1のパーソナリティリソースファイル(120)にストアされ得る。音声アプリケーションそれぞれ(例えば、第1のアプリケーションプログラム(105)、第2のアプリケーションプログラム(110)、第3のアプリケーションプログラム(115)など)が、パーソナリティスキンそれぞれに関するパーソナリティ特有のリソースファイルを提供し得る。音声アプリケーションが、所与のパーソナリティに関するパーソナリティ特有のリソースファイルを提供しないことを選択した場合、デフォルトリソースファイル(例えば、第1のデフォルトリソースファイル(125)、第3のデフォルトリソースファイル(135))が使用され得る。パーソナリティ特有のリソースファイルが、パーソナリティスキンパッケージそれぞれに提供され得る。インストールされるとき、パーソナリティスキンパッケージが、アプリケーションそれぞれに関する新しいリソースファイルをインストールし得る。
計算装置(400)が第1のパーソナリティリソースファイル(120)にクエリーする段階(310)から、方法(300)は、計算装置(400)が音声合成エンジン(140)においてプロンプトを受信し得る段階(320)に進み得る。例えば、第1のアプリケーションプログラム(105)、第2のアプリケーションプログラム(110)、又は第3のアプリケーションプログラム(115)が、音声サービス(145)を介し音声合成エンジン(140)にプロンプトを提供し得る。
段階(320)において、一旦、計算装置(400)が音声合成エンジン(140)においてプロンプトを受信すると、方法(300)は、計算装置(400)(例えば、音声合成エンジン(140))が、パーソナリティに対応する音声フォントに関してパーソナリティ音声フォントデータベース(150)にクエリーし得る段階(330)へ継続し得る。例えば、音声フォントが、パーソナリティの音声録音に基づいて生成され得る。更に、音声フォントは、作成されるとき、プロンプトにパーソナリティらしく聞こえさせるように構成され得る。カスタマイズされたパーソナリティスキンの音声機能を実装するために、音声合成(又はテキストから音声)エンジン(140)が使用され得る。音声フォントは、その対象個人によって作成された一連の録音を処理することによって、対象個人用に生成され得る。一旦、フォントが作成されると、それは、所望されている対象個人らしく聞こえる音声を作成するために、合成エンジン(140)によって使用され得る。
段階(330)において、計算装置(400)がパーソナリティ音声フォントデータベース(150)にクエリーした後、方法(300)は、計算装置(400)(例えば、音声合成エンジン(140))がプロンプトに音声フォントを適用し得る段階(340)に進み得る。例えば、プロンプトへの音声フォントの適用は、更に、パーソナリティ(例えば、対象個人)の記録された言葉を用いて音声フォントが適用されたプロンプトを補強することを含み得る。更に、プロンプトは、パーソナリティ(例えば、対象個人)の文法的な表現方法に従うように変更され得る。
合成音声は、聴覚上、対象個人らしく聞こえ得るが、対話又は通知のためにシステム(100)によって使用される単語は、対象個人の発話形式を正確に反映し得ない。対象個人の発話形式に更に密接に一致させるために、(例えば、第1のアプリケーションプログラム(105)、第2のアプリケーションプログラム(110)、第3のアプリケーションプログラム(115)など)アプリケーションは、装置のユーザーが使用する対象個人を予想し得る単語及び音律の特性を、それらが使用するように話される特定のメッセージ(例えば、プロンプト)を変更することも選択し得る。これらの変更は、話される言葉を(音律タグを含み)変更することによって作成され得る。音声アプリケーションそれぞれは、話されるそれらのプロンプトそれぞれに対してこれらの変更を実行する必要があり得る。
段階(340)において、一旦、計算装置(400)が、プロンプトに音声フォントを適用すると、方法(300)は、計算装置(400)が出力装置(160)に音声フォントが適用されたプロンプトを作成し得る段階(350)に進み得る。例えば、出力装置(160)は、モバイル装置内部に配置され得る。出力装置(160)は、例えば、図4に関連し更に詳細に後述されているような出力装置(414)のいずれかを含み得る。段階(350)において、一旦、計算装置(400)が出力装置(160)に音声フォントが適用されたプロンプトを作成すると、段階(360)において、方法(300)は、その後、終了し得る。
パーソナリティスキンパッケージを支援し得るシステムは、「パーソナリティスキンマネージャー」を含み得る。前述されたように、図2は、パーソナリティベーステーマ管理システム(200)を示す。パーソナリティベーステーマ管理システム(200)は、ユーザーが、例えばパーソナリティスキン間の切り替え、インストールされたパーソナリティスキンパッケージの取り外し、新しいパーソナリティスキンパッケージの購入及びダウンロードを可能にするインターフェース(210)を提供し得る。
第1のアプリケーション(105)及び第2のアプリケーション(110)は、現在の音声フォントによる適切なリソースファイルをロードし得る。現在の音声フォントが、レジストリーキーを介し実行時に第1のアプリケーション(105)又は第2のアプリケーション(110)に利用可能にされ得る。更に、パーソナリティマネージャー(205)は、現在のスキン(及びその結果の現在の音声フォント)が更新されたとき、第1のアプリケーション(105)又は第2のアプリケーション(110)に通知し得る。この通知を受信すると、第1のアプリケーション(105)又は第2のアプリケーション(110)は、必要に応じてそれらのリソースをリロードし得る。
プロンプトのカスタマイズに加えて、アプリケーション設計者は、エンドユーザーが対象個人の発話形式で音声命令を発行し得るように、音声認識(SR)文法のカスタマイズを所望し得又は個人名による装置の記述を所望し得る。そのような文法更新は、前述されたカスタマイズされたプロンプトと同様の方法でリソースファイルにストアされて送信され得る。これらの文法更新は、後述される多重パーソナリティシナリオにおいて特に重要であり得る。
パーソナリティスキンパッケージ(音声フォント、プロンプト、及び場合によっては文法)の音声のコンポーネント管理に加えて、パーソナリティマネージャー(205)は、ビジュアル及び音声パーソナリティスキンコンポーネントも管理し得、ユーザーが異なるパーソナリティスキンに切り替えたとき、装置の外観及び音が、その音声と共に更新され得る。いくつかの可能な動作は、装置の背景画像の更新、及びデフォルト着信音の設定を含むがこれらに限定しない。
本発明の実施形態と一致するパーソナリティ概念も拡張され得、単一の装置が多重パーソナリティを表現し得る。したがって、一度に多重パーソナリティを支援することは、追加のRAM、ROM、又はプロセッサーリソースを要求し得る。多重パーソナリティは、多くの方法でパーソナリティベース装置の概念を拡張し得る。前述されたように、多重パーソナリティスキンは、装置にストアされ得、エンドユーザーによって実行時に選択され得るか又は生成された若しくはユーザーに定義されたスケジュールに基づいて、パーソナリティマネージャー(205)によって自動的に変更され得る。このシナリオにおいては、追加のROMだけが、非アクティブな音声フォントデータベース及びアプリケーションリソースをストアするために要求され得る。このアプローチは、個人に関する特定のモードも、モード特有のパーソナリティスキンを介して表現され得るようにモードを装置が変更可能なように使用され得る。モードを装置パーソナリティに適用することは、装置をもっと楽しませるものにし得、エンドユーザーに(例えば、パーソナリティスキンマネージャーが、装置バッテリーが低下したとき、「スリープ」モードに切り替え得る)情報を伝達するためにも使用され得る。
本発明の多重パーソナリティ実施形態と一致する複数のパーソナリティが、一度にアクティブになり得る。例えば、パーソナリティそれぞれは、装置における機能又は機能セットと関連付けされ得る。その後、エンドユーザーは、関連付けられたパーソナリティと対話することによって、(例えばメール)機能又は(例えば通信)機能セットと対話し得る。このアプローチは、ユーザーが、その人が(例えば、「ショーン、私のバッテリーレベルは?」、「ジーナ、私の次の約束は?」)との対話を所望している機能性に関連付けられるパーソナリティ名によって、装置を記載する場合、文法的な抑制も支援し得る。更に、ユーザーが装置から通知を取得したとき使用される音声は、メッセージが属する機能的領域をユーザーに示し得る。例えば、ユーザーは、その通知が電子メールに関連付けられていることを述べることが可能であって、なぜならば、その人は、電子メール通知に関連付けられたパーソナリティに属しているものとして、その音声を認識するからである。システムアーキテクチャは、この状況においてわずかに変更し得、なぜならば、アプリケーションが装置の通知に関して使用されるように、音声を指定し得るからである。パーソナリティマネージャー(205)は、アプリケーションそれぞれが使用し得、アプリケーションが適切なエンジン実体を使用し話すために必要とし得る音声を割り当て得る。
本発明と一致する実施形態は、パーソナリティベーステーマを提供するためのシステムを含み得る。本システムは、メモリー記憶装置及びメモリー記憶装置に接続された処理ユニットを含み得る。処理ユニットは、アプリケーションプログラムによって、パーソナリティに対応するプロンプトに関してパーソナリティリソースファイルにクエリーし、音声合成エンジンにおいてプロンプトを受信するように作動し得る。更に、処理ユニットは、音声合成エンジンによって、パーソナリティに対応する音声フォントに関してパーソナリティ音声フォントデータベースにクエリーするように作動し得る。更に、処理ユニットは、音声合成エンジンによって、プロンプトに音声フォントを適用し、音声フォントが、出力装置において適用されたプロンプトを作成するように作動し得る。
本発明と一致する別の実施形態は、パーソナリティベーステーマを提供するためのシステムを含み得る。本システムは、メモリー記憶装置及びメモリー記憶装置に接続された処理ユニットを含み得る。処理ユニットは、所定のパーソナリティに対応する少なくとも1つの音声コンテンツを作成し、所定のパーソナリティに対応する少なくとも1つの映像コンテンツを作成するように作動し得る。
本発明と一致する更に別の実施形態は、パーソナリティベーステーマを提供するためのシステムを含み得る。本システムは、メモリー記憶装置及びメモリー記憶装置に接続された処理ユニットを含み得る。処理ユニットは、パーソナリティマネージャーにおいて、ユーザーが起動したパーソナリティを示す入力を受信し、パーソナリティの少なくとも1つのアプリケーションに通知するように作動し得る。更に、処理ユニットは、パーソナリティに通知されている少なくとも1つのアプリケーションに応答してパーソナリティリソースファイルをリクエストする少なくとも1つのアプリケーションに応答し、パーソナリティリソースファイルを受信するように作動し得る。
図4は、計算装置(400)を含むシステムのブロック図である。本発明の実施形態と一致する前述のメモリー記憶装置及び処理ユニットは、図4の計算装置(400)のような計算装置に実装され得る。ハードウェア、ソフトウェア、又はファームウェアの適切な任意の組み合わせが、メモリー記憶装置及び処理ユニットを実装するために使用され得る。例えば、メモリー記憶装置及び処理ユニットは、計算装置(400)、又は計算装置(400)と組み合わせた別の任意の計算装置(418)を用いて実装され得る。前述されたシステム、装置、及びプロセッサーは例であって、別のシステム、装置、及びプロセッサーは、本発明の実施形態と一致する前述されたメモリー記憶装置及び処理ユニットを含み得る。更に、計算装置(400)は、前述されたように、システム(100)及び(200)に対する動作環境を含み得る。システム(100)及び(200)は、別の環境において作動し得、計算装置(400)に限定しない。
図4に関連する本発明の実施形態と一致するシステムは、計算装置(400)のような計算装置を含み得る。基本構成において計算装置(400)は、少なくとも1つの処理ユニット(402)及びシステムメモリー(404)を含み得る。計算装置の構成及びタイプによって、システムメモリー(404)は、揮発性メモリー(例えばランダムアクセスメモリー(RAM))、不揮発性メモリー(例えば読み出し専用メモリー(ROM))、フラッシュメモリー、又はその任意の組み合わせを含み得るがこれらに限定しない。システムメモリー(404)は、オペレーティングシステム(405)、1つ以上のプログラムミングモジュール(406)を含み得、第1のパーソナリティリソースファイル(120)、第1のデフォルトリソースファイル(125)、第2のパーソナリティリソースファイル(130)、第3のデフォルトリソースファイル(135)、及びパーソナリティ音声フォントデータベース(150)のようなプログラムデータを含み得る。オペレーティングシステム(405)は、例えば、計算装置(400)の動作を制御するために適切であり得る。一実施形態において、プログラミングモジュール(406)は、第1のアプリケーションプログラム(105)、第2のアプリケーションプログラム(110)、第3のアプリケーションプログラム(115)、及び音声合成エンジン(140)を含み得る。更に、本発明の実施形態は、グラフィックスライブラリ、別のオペレーティングシステム、又は別の任意のアプリケーションプログラムに関連し実施され得、特定のいかなるアプリケーション又はシステムに限定されない。この基本構成を、破線(408)内のコンポーネントによって図4に例示する。
計算装置(400)は、追加の特徴又は機能性を有し得る。例えば、また、計算装置(400)は、追加の例えば、磁気ディスク、光ディスク、又はテープのような(取り外し可能及び/又は取り外し不可能)データ記憶装置も含み得る。そのような追加の記憶装置を、取り外し可能記憶装置(409)及び取り外し不可能記憶装置(410)によって、図4に例示する。計算機記憶媒体は、計算機可読命令、データ構造、プログラムモジュール、又は他のデータのような情報記憶装置に関する任意の方法又は技術で実装された揮発性及び不揮発性、取り外し可能及び取り外し不可能媒体を含み得る。システムメモリー(404)、取り外し可能記憶装置(409)、及び取り外し不可能記憶装置(410)はすべて、計算機記憶媒体の例(すなわちメモリー記憶装置)である。計算機記憶媒体は、RAM、ROM、電気的消去可能読み出し専用メモリー(EEPROM)、フラッシュメモリー、又は他のメモリー技術、CD−ROM、デジタル多用途ディスク(DVD)、又は他の光記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置、又は他の磁気記憶装置、又は情報をストアするために使用され得、計算装置(400)によってアクセスされ得る他の任意の媒体を含み得るがこれらに限定しない。そのような任意の計算機記憶媒体は、装置(400)の一部であり得る。計算装置(400)は、キーボード、マウス、ペン、音声入力装置、接触入力装置その他のような入力装置(単数又は複数)(412)も有し得る。ディスプレイ、スピーカー(複数)、プリンターその他のような出力装置(単数又は複数)(414)も含まれ得る。前述された装置は例であって、別のものが使用され得る。
計算装置(400)は、装置(400)が分散計算環境におけるネットワーク、例えば、イントラネット又はインターネットなどを介し他の計算装置(418)を通信可能にする通信接続(416)も含み得る。通信接続(416)は、通信媒体の一例である。通信媒体は、通常、計算機可読命令、データ構造、プログラムモジュール、又は他の搬送波若しくは別の移送機構のような変調データ信号データによって具現され得、任意の情報通信媒体を含む。用語「変調データ信号」は、信号中の情報を符号化する方法で設定又は変更された1つ以上の特性を有する信号を記述し得る。制限ではなく例として、通信媒体は、有線ネットワーク、又は直接有線接続のような有線媒体、及び音響、無線通信周波数(RF)、赤外線、及び他の無線媒体のような無線媒体を含み得る。本明細書に使用されている用語の計算機可読媒体は、記憶媒体及び通信媒体双方を含み得る。
前述されたように、プログラムモジュール及びデータファイルの大多数は、オペレーティングシステム(405)を含むシステムメモリー(404)にストアされ得る。処理ユニット(402)において実行中、プログラミングモジュール(406)(例えば、第1のアプリケーションプログラム(105)、第2のアプリケーションプログラム(110)、第3のアプリケーションプログラム(115)、及び音声合成エンジン(140))が、例えば、前述されたように、方法(300)の1つ以上の段階を含むプロセスを実行し得る。前述されたプロセスは、例であって、処理ユニット(402)は、別のプロセスを実行し得る。本発明の実施形態に従って使用され得る別のプログラミングモジュールは、電子メール及び連絡アプリケーション、文書処理アプリケーション、スプレッドシートアプリケーション、データベースアプリケーション、スライド表示アプリケーション、描画又は計算機支援アプリケーションプログラムなどを含み得る。
一般に、本発明の実施形態と一致するプログラムモジュールは、ルーチン、プログラム、コンポーネント、データ構造、及び特定のタスクを実行し得るか又は特定の抽象データタイプを実装し得る別のタイプの構造を含み得る。更に、本発明の実施形態は、携帯装置、マルチプロセッサーシステム、マイクロプロセッサーベース又はプログラマブル家電、ミニコンピューター、メインフレームコンピューターなどを含む別の計算機システム構成を用いて実施され得る。本発明の実施形態は、タスクが、通信ネットワークを介し接続されているリモート処理装置によって、実行される分散計算環境においても実施され得る。分散計算環境において、プログラムモジュールは、ローカルメモリー記憶装置及びリモートメモリー記憶装置双方に配置され得る。
更に、本発明の実施形態は、別々の電子エレメントを含む電気回路、論理ゲート、マイクロプロセッサーを利用する回路を含むパッケージ若しくは集積電子チップ、又は電子エレメント若しくはマイクロプロセッサーを含む単一チップ、において実施され得る。本発明の実施形態は、機械的、光学的、流体及び量子技術を含むがこれらに限定せずに、例えば、AND、OR、及びNOTのような論理演算を実行することが可能な別の技術を使用しても実施され得る。更に、本発明の実施形態は、汎用計算機内部又は別の任意の回路若しくはシステムにおいて、実施され得る。更に、本発明の実施形態は、インスタントメッセージング(IM)、SMS、カレンダー、メディアプレーヤー、及び(発信者−識別)電話のような技術に関連しても実施され得る。
発明の実施形態は、例えば、計算機のプロセス(メソッド)、計算システム、又は計算機プログラム製品又は計算機可読媒体のような作成品として実装され得る。計算機プログラム製品は、計算機システムによって可読な計算機記憶媒体及び計算機プロセスを実行するための命令に関する計算機プログラムの符号化であり得る。計算機プログラム製品は、計算システムによって可読な搬送波上の伝播信号及び計算機プロセスを実行するための命令に関する計算機プログラムの符号化であり得る。したがって本発明は、ハードウェアにおいて及び/又は(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)ソフトウェアにおいて、具現され得る。言い換えれば、本発明の実施形態は、命令実行システムによって使用するためか又はそれに関連して媒体において具現される、計算機利用可能又は計算機可読プログラムコードを有する計算機利用可能又は計算機可読記憶媒体上の計算機プログラム製品の形式を取り得る。計算機利用可能又は計算機可読媒体は、命令実行システム、器具又は装置によって使用するためか又はそれに関連するプログラムを含んでいて、ストアし、通信し、伝播し、又は輸送し得る任意の媒体であり得る。
計算機利用可能又は計算機可読媒体は、限定しないが例えば、電子、磁気、光学、電磁気、赤外線、又は半導体システム、器具、装置、又は伝搬媒体であり得る。更に特定(限定的なリスト)の計算機可読媒体例の計算機可読媒体は、以下、1つ以上の線を有する電気的接続、携帯用計算機ディスケット、ランダムアクセスメモリー(RAM)、読み出し専用メモリー(ROM)、消去可能プログラマブル読み出し専用メモリー(EPROM又はフラッシュメモリー)、光ファイバー、及びポータブルコンパクトディスク読み出し専用メモリー(CD−ROM)、を含み得る。計算機利用可能又は計算機可読媒体は、プログラムが、例えば、紙又は他の媒体の光学的スキャニングを介し電子的にキャプチャされ得、その後、適切な方法でコンパイルされ、インタープリトされ、又は別の方法で処理され、必要な場合、計算機メモリーにストアされるように、プログラムが印刷されている紙又は別の適切な媒体でもあり得ることに留意されたい。
本発明の実施形態は、例えば、方法、システム、及び本発明の実施形態による計算機プログラム製品のブロック図及び/又は動作図を参照し、前述されている。ブロックに記載された機能/動作は、任意の流れ図に示されているような順番を超えて生じ得る。例えば、連続して示されている2つのブロックは、事実上、実質的に同時に実行され得るか又はブロックが時として、関与する機能性/動作によって逆の順番で実行され得る。
本発明のいくつかの実施形態を説明したが、別の実施形態が存在し得る。更に、本発明の実施形態は、メモリー及び別の記憶媒体にストアされたデータに関連付けられて説明されているが、データは、補助記憶装置、ハードディスク、フロッピー(登録商標)ディスク、又はCD−ROM、インターネット又は別のRAM若しくはROM形式が提供する搬送波のような別のタイプの計算機可読媒体にストアされるか又はそれらから読み出され得る。更に、開示された方法の段階は、本発明から逸脱せずに、段階の再順序化及び/又は段階の挿入若しくは削除を含む任意の方法で変更され得る。
本明細書に含まれているコードに含む著作権すべては、出願人に与えられ、出願人の所有物である。出願人は、本明細書に含まれているコードのすべての権利を保有し保持していて、本特許が認めた複製物だけに関連して材料を再生することを許可するのであって、他のいかなる目的に対しても与えない。
本明細書は例を含むと同時に、本発明の範囲を以下の請求項によって示す。更に、本明細書は、構造上の機能及び/又は動作方法を特定の言語で説明しているが、請求項は、前述された機能又は動作に限定されない。もっと具体的に言えば、前述された特定の特徴及び動作は、本発明の実施形態に対する例として開示されている。
100 パーソナリティベーステーマシステム
105 第1のアプリケーション
110 第2のアプリケーション
115 第3のアプリケーション
120 第1のパーソナリティリソース
125 第1のデフォルトリソース
130 第2のパーソナリティリソース
135 第3のデフォルトリソース
140 音声合成エンジン
145 音声サービス
150 パーソナリティ音声フォントデータベース
155 デフォルト音声フォントデータベース
160 スピーカー(複数)
200 パーソナリティベーステーマ管理システム
205 パーソナリティマネージャー
210 インターフェース
215 レジストリー
400 計算装置
402 処理ユニット
404 システムメモリー
406 プログラミングモジュール
408 基本構成
410 取り外し不可能記憶装置
412 入力装置(単数又は複数)
414 出力装置(単数又は複数)
416 通信接続(単数又は複数)
418 その他の計算装置(複数)

Claims (20)

  1. パーソナリティベーステーマを提供するための方法であって、
    アプリケーションプログラムによって、パーソナリティに対応するプロンプトに関してパーソナリティリソースファイルにクエリーするステップと、
    音声合成エンジンにおいて前記プロンプトを受信するステップと、
    前記音声合成エンジンによって、前記パーソナリティに対応する音声フォントに関してパーソナリティ音声フォントデータベースにクエリーするステップと、
    前記音声合成エンジンによって、前記プロンプトに前記音声フォントを適用するステップと、
    前記音声フォントが適用されたプロンプトを出力装置に作成するステップと、を含む方法。
  2. 前記パーソナリティに対応する前記プロンプトに関して前記パーソナリティリソースファイルにクエリーするステップが、ユーザーによって事前に決定されている前記パーソナリティに対応する前記プロンプトに関して、前記パーソナリティリソースファイルにクエリーするステップを含むことを特徴とする請求項1記載の方法。
  3. 前記音声フォントに関して前記パーソナリティ音声フォントデータベースにクエリーするステップが、前記パーソナリティの音声の録音に基づいて生成された前記音声フォントに関して、前記パーソナリティ音声フォントデータベースにクエリーするステップを含むことを特徴とする請求項1記載の方法。
  4. 前記音声フォントに関して前記パーソナリティ音声フォントデータベースにクエリーするステップが、前記プロンプトが作成されるとき、前記パーソナリティのように聞こえるように構成される前記音声フォントに関して、前記パーソナリティ音声フォントデータベースにクエリーするステップを含むことを特徴とする請求項1記載の方法。
  5. 前記プロンプトに前記音声フォントを適用するステップが更に、前記パーソナリティの記録された言葉を有する前記音声フォントが適用されたプロンプトを補強するステップを含むことを特徴とする請求項1記載の方法。
  6. 前記出力装置に前記音声フォントが適用されたプロンプトを作成するステップが、モバイル装置に配置された前記出力装置において前記音声フォントが適用されたプロンプトを作成するステップを含むことを特徴とする請求項1記載の方法。
  7. 前記出力装置に前記音声フォントが適用されたプロンプトを作成するステップが、
    移動電話、携帯電話、無線電話、無線装置、携帯用パーソナルコンピューター、携帯用計算装置、マルチプロセッサーシステム、マイクロプロセッサーベース又はプログラマブル家電装置、携帯情報端末(PDA)、電話、及びポケットベル、の1つに配置される前記出力装置に前記音声フォントが適用されたプロンプトを作成するステップを含むことを特徴とする請求項1記載の方法。
  8. 更に、前記パーソナリティの文法的な表現方法に従うように前記プロンプトを変更するステップを含む請求項1記載の方法。
  9. パーソナリティベーステーマを提供するためのシステムであって、
    メモリー記憶装置と、
    前記メモリー記憶装置に接続される処理ユニットであって、前記処理ユニットが、
    所定のパーソナリティに対応する少なくとも1つの音声コンテンツを作成し、
    前記所定のパーソナリティに対応する少なくとも1つの映像コンテンツを作成する、
    ように作動可能であるものと、を含むシステム。
  10. 前記少なくとも1つの音声コンテンツが、着信音を含むことを特徴とする請求項9記載のシステム。
  11. 前記少なくとも1つの音声コンテンツが、前記所定のパーソナリティから再符号化されたコンテンツを含むことを特徴とする請求項9記載のシステム。
  12. 前記少なくとも1つの音声コンテンツが、前記所定のパーソナリティのように聞こえるように構成された合成音声を含むことを特徴とする請求項9記載のシステム。
  13. 前記少なくとも1つの音声コンテンツが、前記所定のパーソナリティのように聞こえるように構成された合成音声を含んでいて、前記合成音声が、前記所定のパーソナリティの文法的な表現方法に従うように変更されているもの、を特徴とする請求項9記載のシステム。
  14. 前記少なくとも1つの音声コンテンツが、
    前記所定のパーソナリティによって実行される音声コンテンツ、前記所定のパーソナリティによって構成される音声コンテンツ、前記所定のパーソナリティによって書き込まれたサウンドコンテンツ、前記所定のパーソナリティによって記録されたサウンドコンテンツ、前記所定のパーソナリティに関連付けられた映画に関するサウンドコンテンツ、及び前記所定のパーソナリティに関連付けられたテレビ番組に関するサウンドコンテンツ、の少なくとも1つを含むことを特徴とする請求項9記載のシステム。
  15. 前記少なくとも1つの映像コンテンツが、
    前記所定のパーソナリティに関連付けられた画像及び前記所定のパーソナリティに関連付けられた映像クリップ、の少なくとも1つを含むことを特徴とする請求項9記載のシステム。
  16. 前記少なくとも1つの映像コンテンツが、
    前記所定のパーソナリティに関連付けられたオブジェクト、前記所定のパーソナリティ写真、及び前記所定のパーソナリティに関連付けられたカラースキーム、の少なくとも1つを含むことを特徴とする請求項9記載のシステム。
  17. 前記少なくとも1つの映像コンテンツが、
    前記所定のパーソナリティによって実行される映像コンテンツ、前記所定のパーソナリティによって構成される映像コンテンツ、前記所定のパーソナリティによって書き込まれる映像コンテンツ、前記所定のパーソナリティによって記録される映像コンテンツ、前記所定のパーソナリティに関連付けられた映画に関する映像コンテンツ、及び前記所定のパーソナリティに関連付けられたテレビ番組に関する映像コンテンツ、の少なくとも1つを含むことを特徴とする請求項9記載のシステム。
  18. 前記システムの少なくとも外部の一部が、前記所定のパーソナリティに関連付けられたカバーを含むことを特徴とする請求項9記載のシステム。
  19. 前記処理ユニットが更に、
    別のパーソナリティに対応する少なくとも1つの音声コンテンツを作成し、
    前記別のパーソナリティに対応する少なくとも1つの映像コンテンツ作成する、
    ように作動可能なことを特徴とする請求項9記載のシステム。
  20. 実行時に、パーソナリティベーステーマを提供するための方法を実行する命令セットをストアする計算機可読媒体であって、前記方法が、
    パーソナリティマネージャーにおいて、ユーザーが起動したパーソナリティを示す入力を受信するステップと、
    前記少なくとも1つのパーソナリティをアプリケーションに通知するステップと、
    前記パーソナリティを通知された前記少なくとも1つのアプリケーションに応答し、パーソナリティリソースファイルをリクエストする前記少なくとも1つのアプリケーションに応答して前記パーソナリティリソースファイルを受信するステップと、を含む前記命令セットによって実行される方法。
JP2010509495A 2007-05-24 2008-05-19 パーソナリティベース装置 Pending JP2010528372A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/752,989 US8131549B2 (en) 2007-05-24 2007-05-24 Personality-based device
PCT/US2008/064151 WO2008147755A1 (en) 2007-05-24 2008-05-19 Personality-based device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013190387A Division JP5782490B2 (ja) 2007-05-24 2013-09-13 パーソナリティベース装置

Publications (1)

Publication Number Publication Date
JP2010528372A true JP2010528372A (ja) 2010-08-19

Family

ID=40072030

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2010509495A Pending JP2010528372A (ja) 2007-05-24 2008-05-19 パーソナリティベース装置
JP2013190387A Active JP5782490B2 (ja) 2007-05-24 2013-09-13 パーソナリティベース装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013190387A Active JP5782490B2 (ja) 2007-05-24 2013-09-13 パーソナリティベース装置

Country Status (12)

Country Link
US (2) US8131549B2 (ja)
EP (1) EP2147429B1 (ja)
JP (2) JP2010528372A (ja)
KR (1) KR101376954B1 (ja)
CN (1) CN101681620A (ja)
AU (1) AU2008256989B2 (ja)
BR (1) BRPI0810906B1 (ja)
CA (2) CA2903536C (ja)
IL (1) IL201652A (ja)
RU (1) RU2471251C2 (ja)
TW (1) TWI446336B (ja)
WO (1) WO2008147755A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014021136A (ja) * 2012-07-12 2014-02-03 Yahoo Japan Corp 音声合成システム

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100699050B1 (ko) * 2006-06-30 2007-03-28 삼성전자주식회사 문자정보를 음성정보로 출력하는 이동통신 단말기 및 그방법
US8131549B2 (en) 2007-05-24 2012-03-06 Microsoft Corporation Personality-based device
EP3296992B1 (en) * 2008-03-20 2021-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for modifying a parameterized representation
US8655660B2 (en) * 2008-12-11 2014-02-18 International Business Machines Corporation Method for dynamic learning of individual voice patterns
US20100153116A1 (en) * 2008-12-12 2010-06-17 Zsolt Szalai Method for storing and retrieving voice fonts
US20100324895A1 (en) * 2009-01-15 2010-12-23 K-Nfb Reading Technology, Inc. Synchronization for document narration
US8370151B2 (en) * 2009-01-15 2013-02-05 K-Nfb Reading Technology, Inc. Systems and methods for multiple voice document narration
US10088976B2 (en) * 2009-01-15 2018-10-02 Em Acquisition Corp., Inc. Systems and methods for multiple voice document narration
US8645140B2 (en) * 2009-02-25 2014-02-04 Blackberry Limited Electronic device and method of associating a voice font with a contact for text-to-speech conversion at the electronic device
US20110025816A1 (en) * 2009-07-31 2011-02-03 Microsoft Corporation Advertising as a real-time video call
US8782556B2 (en) 2010-02-12 2014-07-15 Microsoft Corporation User-centric soft keyboard predictive technologies
US9253306B2 (en) 2010-02-23 2016-02-02 Avaya Inc. Device skins for user role, context, and function and supporting system mashups
US9009040B2 (en) * 2010-05-05 2015-04-14 Cisco Technology, Inc. Training a transcription system
US9564120B2 (en) * 2010-05-14 2017-02-07 General Motors Llc Speech adaptation in speech synthesis
US8392186B2 (en) 2010-05-18 2013-03-05 K-Nfb Reading Technology, Inc. Audio synchronization for document narration with user-selected playback
US20120046948A1 (en) * 2010-08-23 2012-02-23 Leddy Patrick J Method and apparatus for generating and distributing custom voice recordings of printed text
US20120226500A1 (en) * 2011-03-02 2012-09-06 Sony Corporation System and method for content rendering including synthetic narration
US9077813B2 (en) * 2012-02-29 2015-07-07 International Business Machines Corporation Masking mobile message content
US9356904B1 (en) * 2012-05-14 2016-05-31 Google Inc. Event invitations having cinemagraphs
US9570066B2 (en) * 2012-07-16 2017-02-14 General Motors Llc Sender-responsive text-to-speech processing
US8700396B1 (en) * 2012-09-11 2014-04-15 Google Inc. Generating speech data collection prompts
US9698999B2 (en) * 2013-12-02 2017-07-04 Amazon Technologies, Inc. Natural language control of secondary device
US9472182B2 (en) 2014-02-26 2016-10-18 Microsoft Technology Licensing, Llc Voice font speaker and prosody interpolation
CN103888611B (zh) * 2014-03-20 2016-01-27 联想(北京)有限公司 一种输出方法及通信设备
EP2933070A1 (en) * 2014-04-17 2015-10-21 Aldebaran Robotics Methods and systems of handling a dialog with a robot
US9412358B2 (en) 2014-05-13 2016-08-09 At&T Intellectual Property I, L.P. System and method for data-driven socially customized models for language generation
US9390706B2 (en) 2014-06-19 2016-07-12 Mattersight Corporation Personality-based intelligent personal assistant system and methods
US9715873B2 (en) 2014-08-26 2017-07-25 Clearone, Inc. Method for adding realism to synthetic speech
CN104464716B (zh) * 2014-11-20 2018-01-12 北京云知声信息技术有限公司 一种语音播报系统和方法
CN104714826B (zh) * 2015-03-23 2018-10-26 小米科技有限责任公司 应用主题的加载方法及装置
US20160336003A1 (en) * 2015-05-13 2016-11-17 Google Inc. Devices and Methods for a Speech-Based User Interface
RU2591640C1 (ru) * 2015-05-27 2016-07-20 Александр Юрьевич Бредихин Способ модификации голоса и устройство для его осуществления (варианты)
RU2617918C2 (ru) * 2015-06-19 2017-04-28 Иосиф Исаакович Лившиц Способ формирования образа человека с учетом характеристик его психологического портрета, полученных под контролем полиграфа
US20170017987A1 (en) * 2015-07-14 2017-01-19 Quasar Blu, LLC Promotional video competition systems and methods
US9965837B1 (en) 2015-12-03 2018-05-08 Quasar Blu, LLC Systems and methods for three dimensional environmental modeling
US10607328B2 (en) 2015-12-03 2020-03-31 Quasar Blu, LLC Systems and methods for three-dimensional environmental modeling of a particular location such as a commercial or residential property
US11087445B2 (en) 2015-12-03 2021-08-10 Quasar Blu, LLC Systems and methods for three-dimensional environmental modeling of a particular location such as a commercial or residential property
CN106487900B (zh) * 2016-10-18 2019-04-09 北京博瑞彤芸文化传播股份有限公司 用户终端个性化主页面的首次配置方法
CN107665259A (zh) * 2017-10-23 2018-02-06 四川虹慧云商科技有限公司 一种界面自动换肤方法及系统
CN108231059B (zh) * 2017-11-27 2021-06-22 北京搜狗科技发展有限公司 处理方法和装置、用于处理的装置
US11830485B2 (en) * 2018-12-11 2023-11-28 Amazon Technologies, Inc. Multiple speech processing system with synthesized speech styles
US11094311B2 (en) 2019-05-14 2021-08-17 Sony Corporation Speech synthesizing devices and methods for mimicking voices of public figures
US11141669B2 (en) 2019-06-05 2021-10-12 Sony Corporation Speech synthesizing dolls for mimicking voices of parents and guardians of children
US11380094B2 (en) 2019-12-12 2022-07-05 At&T Intellectual Property I, L.P. Systems and methods for applied machine cognition
US11228682B2 (en) * 2019-12-30 2022-01-18 Genesys Telecommunications Laboratories, Inc. Technologies for incorporating an augmented voice communication into a communication routing configuration
US11140360B1 (en) 2020-11-10 2021-10-05 Know Systems Corp. System and method for an interactive digitally rendered avatar of a subject person
US11582424B1 (en) 2020-11-10 2023-02-14 Know Systems Corp. System and method for an interactive digitally rendered avatar of a subject person
US11463657B1 (en) 2020-11-10 2022-10-04 Know Systems Corp. System and method for an interactive digitally rendered avatar of a subject person
US11594226B2 (en) * 2020-12-22 2023-02-28 International Business Machines Corporation Automatic synthesis of translated speech using speaker-specific phonemes
US11922938B1 (en) 2021-11-22 2024-03-05 Amazon Technologies, Inc. Access to multiple virtual assistants

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06162167A (ja) * 1992-11-20 1994-06-10 Fujitsu Ltd 合成画像表示システム
JPH1138996A (ja) * 1997-07-10 1999-02-12 Internatl Business Mach Corp <Ibm> 音声メールシステム、音声合成装置およびこれらの方法
JP2002108378A (ja) * 2000-10-02 2002-04-10 Nippon Telegraph & Telephone East Corp 文書読み上げ装置
JP2002526855A (ja) * 1998-10-02 2002-08-20 インターナショナル・ビジネス・マシーンズ・コーポレーション 会話型バーチャル・マシンによる会話型コンピューティング
JP2002271512A (ja) * 2001-03-14 2002-09-20 Hitachi Kokusai Electric Inc 携帯電話端末
JP2004233709A (ja) * 2003-01-31 2004-08-19 Hitachi Ltd 情報処理装置、コンテンツ提供方法及び端末装置

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7006881B1 (en) * 1991-12-23 2006-02-28 Steven Hoffberg Media recording device with remote graphic user interface
WO1993018505A1 (en) * 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
ATE277405T1 (de) * 1997-01-27 2004-10-15 Microsoft Corp Stimmumwandlung
US6336092B1 (en) * 1997-04-28 2002-01-01 Ivl Technologies Ltd Targeted vocal transformation
TW430778B (en) * 1998-06-15 2001-04-21 Yamaha Corp Voice converter with extraction and modification of attribute data
US20030028380A1 (en) * 2000-02-02 2003-02-06 Freeland Warwick Peter Speech system
US20020010584A1 (en) * 2000-05-24 2002-01-24 Schultz Mitchell Jay Interactive voice communication method and system for information and entertainment
JP4531962B2 (ja) * 2000-10-25 2010-08-25 シャープ株式会社 電子メールシステム並びに電子メール出力処理方法およびそのプログラムが記録された記録媒体
US6934756B2 (en) * 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
US6964023B2 (en) * 2001-02-05 2005-11-08 International Business Machines Corporation System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input
US6970820B2 (en) * 2001-02-26 2005-11-29 Matsushita Electric Industrial Co., Ltd. Voice personalization of speech synthesizer
US20040018863A1 (en) * 2001-05-17 2004-01-29 Engstrom G. Eric Personalization of mobile electronic devices using smart accessory covers
JP2002358092A (ja) * 2001-06-01 2002-12-13 Sony Corp 音声合成システム
GB0113587D0 (en) * 2001-06-04 2001-07-25 Hewlett Packard Co Speech synthesis apparatus
DE10127558A1 (de) * 2001-06-06 2002-12-12 Philips Corp Intellectual Pty Verfahren zur Verarbeitung einer Text-, Gestik-, Mimik- und/oder Verhaltensbeschreibung mit Überprüfung der Benutzungsberechtigung von Sprach-, Gestik-, Mimik- und/oder Verhaltensprofilen zur Synthese
EP1271469A1 (en) * 2001-06-22 2003-01-02 Sony International (Europe) GmbH Method for generating personality patterns and for synthesizing speech
US6810378B2 (en) * 2001-08-22 2004-10-26 Lucent Technologies Inc. Method and apparatus for controlling a speech synthesis system to provide multiple styles of speech
US7483832B2 (en) * 2001-12-10 2009-01-27 At&T Intellectual Property I, L.P. Method and system for customizing voice translation of text to speech
US20060069567A1 (en) * 2001-12-10 2006-03-30 Tischer Steven N Methods, systems, and products for translating text to speech
JP2003337592A (ja) 2002-05-21 2003-11-28 Toshiba Corp 音声合成方法及び音声合成装置及び音声合成プログラム
JP2006501509A (ja) 2002-10-04 2006-01-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 個人適応音声セグメントを備える音声合成装置
US20040098266A1 (en) * 2002-11-14 2004-05-20 International Business Machines Corporation Personal speech font
RU2251149C2 (ru) * 2003-02-18 2005-04-27 Вергильев Олег Михайлович Способ вергильева о.м. по созданию и использованию системы информационного поиска и обеспечения специалистов сферы материального производства
US6999763B2 (en) * 2003-08-14 2006-02-14 Cisco Technology, Inc. Multiple personality telephony devices
US20050086328A1 (en) * 2003-10-17 2005-04-21 Landram Fredrick J. Self configuring mobile device and system
EP1719337A1 (en) * 2004-02-17 2006-11-08 Voice Signal Technologies Inc. Methods and apparatus for replaceable customization of multimodal embedded interfaces
WO2006053256A2 (en) * 2004-11-10 2006-05-18 Voxonic, Inc. Speech conversion system and method
US7571189B2 (en) * 2005-02-02 2009-08-04 Lightsurf Technologies, Inc. Method and apparatus to implement themes for a handheld device
US20070011009A1 (en) * 2005-07-08 2007-01-11 Nokia Corporation Supporting a concatenative text-to-speech synthesis
US20070213987A1 (en) * 2006-03-08 2007-09-13 Voxonic, Inc. Codebook-less speech conversion method and system
US7693717B2 (en) * 2006-04-12 2010-04-06 Custom Speech Usa, Inc. Session file modification with annotation using speech recognition or text to speech
US20080082320A1 (en) * 2006-09-29 2008-04-03 Nokia Corporation Apparatus, method and computer program product for advanced voice conversion
US8131549B2 (en) 2007-05-24 2012-03-06 Microsoft Corporation Personality-based device

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06162167A (ja) * 1992-11-20 1994-06-10 Fujitsu Ltd 合成画像表示システム
JPH1138996A (ja) * 1997-07-10 1999-02-12 Internatl Business Mach Corp <Ibm> 音声メールシステム、音声合成装置およびこれらの方法
JP2002526855A (ja) * 1998-10-02 2002-08-20 インターナショナル・ビジネス・マシーンズ・コーポレーション 会話型バーチャル・マシンによる会話型コンピューティング
JP2002108378A (ja) * 2000-10-02 2002-04-10 Nippon Telegraph & Telephone East Corp 文書読み上げ装置
JP2002271512A (ja) * 2001-03-14 2002-09-20 Hitachi Kokusai Electric Inc 携帯電話端末
JP2004233709A (ja) * 2003-01-31 2004-08-19 Hitachi Ltd 情報処理装置、コンテンツ提供方法及び端末装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014021136A (ja) * 2012-07-12 2014-02-03 Yahoo Japan Corp 音声合成システム

Also Published As

Publication number Publication date
CA2685602C (en) 2016-11-01
AU2008256989B2 (en) 2012-07-19
US8285549B2 (en) 2012-10-09
JP2014057312A (ja) 2014-03-27
TWI446336B (zh) 2014-07-21
CA2903536A1 (en) 2008-12-04
JP5782490B2 (ja) 2015-09-24
US20080291325A1 (en) 2008-11-27
KR101376954B1 (ko) 2014-03-20
TW200905668A (en) 2009-02-01
RU2471251C2 (ru) 2012-12-27
RU2009143358A (ru) 2011-05-27
WO2008147755A1 (en) 2008-12-04
AU2008256989A1 (en) 2008-12-04
IL201652A0 (en) 2010-05-31
US20120150543A1 (en) 2012-06-14
BRPI0810906B1 (pt) 2020-02-18
BRPI0810906A2 (pt) 2014-10-29
EP2147429A1 (en) 2010-01-27
CA2903536C (en) 2019-11-26
EP2147429B1 (en) 2014-01-01
EP2147429A4 (en) 2011-10-19
US8131549B2 (en) 2012-03-06
KR20100016107A (ko) 2010-02-12
IL201652A (en) 2014-01-30
CA2685602A1 (en) 2008-12-04
CN101681620A (zh) 2010-03-24

Similar Documents

Publication Publication Date Title
JP5782490B2 (ja) パーソナリティベース装置
CN102750270B (zh) 扩充的对话理解代理
RU2417408C2 (ru) Динамический опыт пользователя посредством семантически богатых объектов
CN105830150B (zh) 基于意图的用户体验
US9891963B2 (en) System and method for optimizing user notifications for small computer devices
US7616131B2 (en) Method and apparatus for allowing runtime creation of a user experience for a wireless device
US9794400B2 (en) Mobile terminal and ringtone playing method thereof
CN108701127A (zh) 电子设备及其操作方法
CN109428968B (zh) 控制终端的方法、装置及存储介质
CN114020197B (zh) 跨应用的消息的处理方法、电子设备及可读存储介质
AU2012244080B2 (en) Personality-based Device
JP2022065601A (ja) 人工知能デバイスと連動して音声記録を管理する方法、システム、およびコンピュータ読み取り可能な記録媒体
JP2003202890A (ja) 音声認識装置及びその方法、プログラム
US20230092783A1 (en) Botcasts - ai based personalized podcasts
Lassila Semantic web approach to personal information management on mobile devices
WO2023048803A1 (en) Botcasts - ai based personalized podcasts

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110408

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121015

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130111

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130516