JP2008529345A - 個人化メディアの生成及び配布のためのシステム及び方法 - Google Patents

個人化メディアの生成及び配布のためのシステム及び方法 Download PDF

Info

Publication number
JP2008529345A
JP2008529345A JP2007552101A JP2007552101A JP2008529345A JP 2008529345 A JP2008529345 A JP 2008529345A JP 2007552101 A JP2007552101 A JP 2007552101A JP 2007552101 A JP2007552101 A JP 2007552101A JP 2008529345 A JP2008529345 A JP 2008529345A
Authority
JP
Japan
Prior art keywords
clip
media
system
master
clips
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007552101A
Other languages
English (en)
Inventor
ロウェ,フレデリック
Original Assignee
ロウェ,フレデリックLOWE, Frederick
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ロウェ,フレデリックLOWE, Frederick filed Critical ロウェ,フレデリックLOWE, Frederick
Priority to PCT/US2005/001853 priority Critical patent/WO2006078246A1/en
Publication of JP2008529345A publication Critical patent/JP2008529345A/ja
Application status is Pending legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/036Insert-editing

Abstract

個人化メディアは、所定の挿入点を有する(203)マスタークリップの取得(201)、挿入クリップの取得(202)及び、接合されたクリップ間に検知され得る移行を示すことのない個人化メディアクリップを生成するための、選択されたマスタークリップへの挿入クリップのシームレス合体(204)により、生成される。挿入クリップ(202)はマスタークリップに、名前、場所、時刻、性別、製品名またはその他いずれかの所望の情報のような、変数を付加する目的のために用いられる。動的情況データを付加してクライアント再生デバイスに送信することができる。配布プロセスは実時間またはリクエストされるまでの非同期とすることができる。再生デバイスは、電話呼出音、折返し電話呼出音または音声メッセージあるいはその他いずれかの目的のためにクリップを用いることができる。マスタークリップ及び/または挿入クリップの内容には創作者の声を含むいかなる声も用いることができるが、著名人の声または著名声優の声を利用することができる。マスタークリップ及び挿入クリップは与えられたフォーマットの非圧縮データまたは圧縮データを用いてシームレスに合体させることができる。

Description

本発明の実施形態はコンピュータシステムの分野に関する。さらに詳しくは、本発明はコンピュータを用いる個人化メディアの生成及び配布のためのシステム及び方法に向けられる。

最近のシステムは複数の相異なる態様でマルチメディアデータを生成及び利用する。例えば、ユーザは同時に、オーディオデータを生成し、そのデータを、電話を通してユーザに送り返すシステムに情報を送信し、そのシステムからの応答を聞くことができる。一般に、既存のシステムはデータの一形態(例えば、数値情報またはテキストデータ)と再生のためにオーディオファイルを生成するためのオーディオファイルセットの間のマッピングを利用する。これを行う普通のシナリオの1つは、銀行預金残高のチェックまたは送金を行うために銀行に電話をかける場合である。銀行のシステムは、例えば、プッシュボタン式電話器入力によりユーザの口座情報を取得し、確認の目的のためにユーザの口座情報を音声再生する。そのようなオーディオファイルを構築し、配布するための既存のシステムは、その入力を用いて、あらかじめ録音されたオーディオトラックのセットをマッピングし、再生用メッセージをまとめ上げる。最終結果は、あらかじめ録音されたオーディオトラックをシームレスにまとめ上げることができていないぎこちなく聞こえるメッセージになることが多い。クリップ間の明白な移行に加えて、無声の空白及び抑揚の相違によって、このタイプの個人化メディアは人間の耳に不快に聞こえる。

生成されたファイルがコンピュータ生成メッセージではなく、検知され得る移行を示さない、原録音のように聞こえさせる態様で複数のオーディオファイルをシームレスにまとめ上げる、オーディオファイルを生成するための方法を提供する解決策はいまのところ存在しない。さらに、現行システムは、ユーザに関係付けられるシステム情報及び/または情況情報にアクセスするために利用されるデバイスまたはソフトウエアプログラムから自動的に得られるユーザ情報に基づいて生成されるオーディオファイルの内容を個人化しない。例えば、現行システムは、個人化された電話呼出音または折返し電話呼出音を実時間で、または非同期態様で、自動的に生成及び配布するための機構を提供しない。

上記及びその他の限界の結果として、実時間及び非同期配布のためにメディアクリップをシームレスにまとめ上げることができる、個人化メディアを生成及び配布するためのシステム及び方法が必要とされている。

本発明の1つまたはそれより多くの実施形態は、個人化メディアを生成及び配布するためのシステム及び方法に向けられる。個人化メディアは、本発明の1つまたはそれより多くの実施形態により、所定の空白を有する1つまたはそれより多くのマスタークリップを選択し、挿入データ(例えば挿入クリップ)を取得し、挿入データを選択されたマスタークリップとシームレスに合体させて接合されたデータ間に検知され得る移行を示さないメディアクリップを生成することによって生成される。個人化メディアは、本発明の1つまたはそれより多くの実施形態により、必要に応じてメディアクリップに動的情況データを付加し、メディアクリップを与えられたクライアントデバイス用にフォーマットし、生成メディアクリップをクライアントデバイスに送信することによって配布される。この配布プロセスは実時間とすることができ、あるいは後刻メディアクリップがリクエストされるまで遅延させることができる。本発明の実施形態は単プロセッサコンピュータシステムから、圧縮メディアのシームレス接合または所望のスケーラビリティを達成することができるその他いずれかのアーキテクチャを有する高度に最適化されたマルチスレッドサーバプロセスに至るいかなるコンピュータ環境も利用することができる。

挿入クリップにはいかなるタイプのデータも含めることができる。しかし、ほとんどの場合、挿入クリップは、名前、場所、時刻、性別、製品名またはその他いずれかの所望の情報のような変数をマスタークリップに付加する目的のために利用される。マスタークリップと挿入クリップの間のまとめ上げは、メディアクリップにおける挿入点の間に人間が検知できる移行がないという意味でシームレスである。挿入クリップのサイズにかかわらず、完成メディアクリップには、いかなる気付かれ得る空白も抑揚変化もない。メディアクリップが複数の相異なるクリップを用いて生成されたとしても、メディアクリップは元々一回の音取りで録音されたかのように聞こえる。フラッシュアニメーションまたは、ビデオのような、その他のタイプのマルチメディアデータをメディアクリップに付加して再生中にユーザが受ける印象を強めることができる。動的情況データを含む挿入クリップには、例えば、時刻、日付、場所、温度または送出時刻になるまで入手できないその他いずれかの情報を含めることができる。

マスタークリップ及び/または挿入クリップの内容には創作者の声を含むいかなる音声も用いることができるが、多くの場合、著名人の声または著名声優の声が利用される。例えば、マスタークリップは著名人によって録音し、挿入クリップは芸能人の声を用いて録音することができよう。すなわち、本発明の実施形態は著名人の声のように聞こえる、及び/または著名人の声である、声を用いて個人化メディアクリップを生成及び配布するための機構を提供する。例えば、システムが1つまたはそれより多くのマスタークリップを1つまたはそれより多くの挿入クリップと合体させ、よってメディアクリップを生成すると、システムはメディアクリップを実時間再生または後刻の再生のための非同期取出しのためにデバイス及び/またはプログラムに提供することができる。さらに、本発明の実施形態はコンピュータ合成及び/または音声をシミュレートするための様々に複雑なTTS(発声テキスト)ソフトウエアを用いることができる。

メディアクリップの再生は、多くの様々なタイプのデバイスで行われ、多くの様々なイベントで起発させることができる。本明細書の1つまたはそれより多くの実施形態にしたがって用いられる、(本明細書では宛先クライアントとしても知られる)再生デバイスのタイプのいくつかの例には、ブラウザを介してネットワーク(例えばワールドワイドウエッブ(WWW))にアクセスするように構成されたコンピュータデバイス、電子メールクライアントまたは何か別のネットワークインターフェースがある(ただし、これらには限定されない)。(例えば、オーディオ、ビデオ等の)メディアクリップを出力するように構成されたセル式携帯電話あるいはその他いずれかのタイプの(衛星、デジタルケーブル及び/または衛星無線の)携帯型または非携帯型デバイスも、再生デバイスとして機能することができる。セル式携帯電話は個人化電話呼出音、個人化折返し電話呼出音またはセルゲートウエイサーバを介していずれかのセル式携帯電話機能に関して用いるための個人化メディアクリップを取得することができる。あるいは、セル式携帯電話自体が、電話呼出または折返し電話呼出中に、あるいはいずれか別の時に、本発明の1つまたはそれより多くの実施形態における個人化メディアを再生するためにローカルにメディアクリップを生成することができる。電話サーバ上でのまたはローカルな個人化メディアの生成のいかなる組合せも本発明の精神の範囲にある。

別のタイプの再生デバイスには、例えば、SpeedPass(登録商標)のような、RFIDベースデバイスを介してユーザを識別するガソリンポンプ、顧客を識別するためのクレジットカード読取器を備えるキャッシュレジスター、宿泊客を識別するためのホテルルームキー読取器を備えるスロットマシンまたはホテルドア、あるいは、ユーザを識別でき、メディアクリップを再生できるその他いずれかのデバイスを含めることができる。

以下の説明においては、本発明の実施形態のさらに完全な説明を与えるために多くの特定の詳細が述べられる。しかし、本発明はそれらの特定の詳細がなくとも実施できることが当業者には明らかであろう。また、よく知られている様相は本発明を曖昧にしないように詳細が説明されることはない。

本発明の1つまたはそれより多くの実施形態は個人化メディアを生成及び配布するためのシステム及び方法に向けられる。個人化メディアは、本発明の1つまたはそれより多くの実施形態により、所定の空白またはスロットを有するマスタークリップを含む1つまたはそれより多くの静的クリップを選択し、挿入データ(例えば挿入クリップ)を取得し、選択されたマスタークリップに挿入データをシームレスに合体させて、接合されたクリップ間に検知され得る移行を示さないメディアクリップを生成することによって、生成される。個人化メディアは、本発明の1つまたはそれより多くの実施形態により、必要に応じてメディアクリップに動的情況データを付加し、与えられたクライアントデバイス用にメディアクリップをフォーマットし、生成メディアクリップをクライアントデバイスに送信することによって、配布される。この配布プロセスは実時間とすることができ、あるいは後刻メディアクリップがリクエストされるまで遅延させることができる。本発明の実施形態は、単プロセッサコンピュータシステムから、圧縮メディアのシームレス接合または所望のスケーラビリティを達成することができるその他いずれかのアーキテクチャを有する高度に最適化されたマルチスレッドサーバプロセスに至るいかなるコンピュータ環境も利用することができる。

図6は、アプリケーション間で維持される静的セグメント及び、マスタークリップへの挿入のためのトークンまたは挿入クリップが入る、継続時間が固定長または可変長のスロットまたは挿入点を指定するテンプレートとしても知られる、「アプリケーション」を示す。

挿入クリップにはいかなるデータも含めることができる。しかし、ほとんどの場合、挿入クリップは、名前、場所、時刻、性別、製品名またはその他いずれかの所望の情報のような変数をマスタークリップに付加する目的のために利用される。マスタークリップと挿入クリップの間のまとめ上げは、メディアクリップにおける挿入点の間に人間が検知できる移行がないという意味でシームレスである。挿入クリップのサイズにかかわらず、完成メディアクリップには、いかなる気付かれ得る空白も抑揚変化もない。メディアクリップが複数の相異なるクリップを用いて生成されたとしても、メディアクリップは元々一回の音取りで録音されたかのように聞こえる。フラッシュアニメーションまたは、ビデオのような、その他のタイプのマルチメディアデータをメディアクリップに付加して再生中にユーザが受ける印象を強めることができる。動的情況データを含む挿入クリップには、例えば、時刻、日付、場所、温度または送出時刻になるまで入手できないその他いずれかの情報を含めることができる。

マスタークリップ及び/または挿入クリップの内容には創作者の声を含むいかなる音声も用いることができるが、多くの場合、著名人の声または著名声優の声が利用される。例えば、マスタークリップは著名人によって録音し、挿入クリップは芸能人の声を用いて録音することができる。すなわち、本発明の実施形態は著名人の声のように聞こえる、及び/または著名人の声である、声を用いて個人化メディアクリップを生成及び配布するための機構を提供する。例えば、システムが1つまたはそれより多くのマスタークリップを1つまたはそれより多くの挿入クリップと合体させ、よってメディアクリップを生成すると、システムはメディアクリップを実時間再生または後刻の再生のための非同期取出しのためにデバイス及び/またはプログラムに提供することができる。さらに、本発明の実施形態はコンピュータ合成及び/または音声をシミュレートするための様々に複雑なTTS(発声テキスト)ソフトウエアを用いることができる。

(例えば、オーディオ、ビデオ等の)メディアクリップを出力するように構成されたセル式携帯電話あるいはその他いずれかのタイプの(衛星、デジタルケーブル及び/または衛星無線の)携帯型または非携帯型デバイスも、再生デバイスとして機能することができる。本発明の実施形態は、発信者識別証明及びダイアルされた発信者相手先電話番号に基づいて、個人化電話呼出音及び個人化折返し電話呼出音を生成及び配布することができる。メディアクリップまたは電話呼出クリップの一例は、著名人の声を利用して「[ユーザ名]さん、あなたの[親族関係名]さんからお電話です」と告知することができよう。ここで、[ユーザ名]は著名人の声で発声されるユーザ名であり、[親族関係名]は{兄弟、母、父、息子、等}のリストから選ばれる。さらに、別のユーザが電話に出るために待っているときのユーザ呼出しに再生される音を含む折返し電話呼出音を、呼出し相手先に基づいて、すなわち発信者識別番号を用いて個人化することができる。折返し電話呼出音を再生している電話サーバはANI及びDNIS、すなわち、それぞれ発信者識別番号及びダイアルされた呼出し相手先電話番号、を利用して再生するために個人化クリップをクエリーすることができる。

本発明の電話関連実施形態において、(ポータルオペレータとしても知られる)セルゲートウエイ自体あるいはセルゲートウエイトに接続されたその他いずれかの電話コンピュータシステムまたはサーバが、呼び出されたときに受信側セル式携帯電話で鳴る生成電話呼出音あるいは別のユーザが出るために待っているときに発信側セル式携帯電話で鳴る生成折返し電話呼出音を生成することができる。あるいは、セル式携帯電話自体上でのローカルに、電話呼出音、折返し電話呼出音及び個人化変数を含むメッセージの生成は、本発明の精神の範疇にある。

本発明の一実施形態では、この場合は再生デバイスであろう、ガソリンポンプ電子インターフェースユニットによって再生されるべき個人化メッセージを提供するRFID読取器に一意的な識別証明を与えるための、SpeedPassのような、RFIDベースデバイスが可能になる。本発明のこの実施形態において、ガソリンスタンドのローカルサーバまたは会社のメインサーバは個人化変数情報を有することができる。一意的な識別証明がいずれかのサーバに提示されるといずれかのサーバ上で生成出力メディアクリップが構成され、ガソリンポンプ電子インターフェースユニット上で再生され得る。ガソリンポンプ電子インターフェースユニットがWiFiまたはメディア出力をリクエストするように構成されたその他の無線技術で構成されていれば、自動車内の、またはユーザに結合された、ブルートゥースデバイスが出力メディアクリップを再生することもできる。

本発明の別の実施形態は、航空券または雑貨を購入するためのキオスクのような再生デバイスによるユーザへの個人化メディアメッセージの識別及び再生を可能にする。本発明の実施形態に用いられる再生デバイスの別の例には、ポイントカード読取器、ATM機、航空機及び自動車のGPS装置がある。ホテルの電子ドアは、宿泊客用ドアに電子キーを挿入すると、「[ユーザ名字][敬称]、いらっしゃいませ」のようなメッセージを再生する、別の再生デバイス例である。この例では、ユーザ名字及び称号はそれぞれ「スミス」及び「様」である。再生デバイスはコンピュータリソースを有する本発明の実施形態に接続することができ、あるいは再生デバイス自体が十分なコンピュータパワー及び個人化情報を収める記憶装置を有しているかまたはユーザに関連付けられた識別子から個人化情報を得ることができれば、個人化メディアクリップの構成及び再生に関して本発明の実施形態として作用することができる。本例において、ホテルの電子ドアはホテルのコンピュータシステムとのネットワーク接続を有することができる。この接続は無線または有線とすることができる。本例において、ホテルのコンピュータシステムは電子キーまたはクレジットカード様の磁気キーを検出してホテル宿泊客の識別証明を判定することができる。次いで「[ユーザ名字][敬称]、いらっしゃいませ」メディアクリップを含む個人化メッセージがホテルのコンピュータシステム上で生成され、電子ドアに送られて、電子ドアに組み込まれた小さなスピーカで再生されることになろう。

別の再生デバイスは、ユーザがクレジットカードで自身を識別した後に、買い物客に対して個人化メッセージを再生するように構成されたクレジットカード読取器とすることができる。例えば、この場合のメディア出力には、ユーザ名及び「いらっしゃいませ[ユーザ名]、[製品名]の[時間帯]セールをお見逃しなく」というフレーズをもつオーディオトラックを含むフラッシュアニメーションを含めることができる。ここで、[ユーザ名]、[時間帯]及び[製品名]は出力メディアクリップを生成するためにマスタークリップとシームレスに結合される挿入クリップである。

再生デバイスの別の例は、クレジットカード、RFIDまたはホテルのルームキーによってユーザを識別できるスロットマシンとすることができる。スロットマシンは「[ユーザ名]、[賞金額]ドルの当り!」のようなメッセージを再生することができよう。本例において、スロットマシンはコンピュータパワー及び出力メディアクリップを生成するために必要な個人化クリップを有するサーバにネットワーク接続されることができ、あるいはスロットマシン自体がユーザに関連付けられた識別子を得てメディアクリップ自体を構成することができる。

再生デバイスの別の例は、個人化がケーブルシステムサーバ上で行われてケーブルセットトップボックスのIPアドレスに送られるかまたはデータチャネル上のメッセージをエンコードするために加入者IDを用いる、デジタルケーブルセットトップボックスとすることができる。

再生デバイスの別の例は、オンライン購入時には工場で、あるいはネットワーク接続されているかまたは本発明の実施形態を実施するように構成されたローカルコンピュータへのネットワーク接続を介するかまたは無線インターフェースを介して家庭で、個人化することができる玩具とすることができる。インターネットショッピングの場合、購入者は出荷前に玩具に挿入されるべき個人化クリップを選ぶことができる。例えば、これによって玩具が有名な漫画キャラクターのような声を出すことが可能になり、あらかじめロードされて子供に届けられるであろう。安価なネットワークデバイスが利用できれば、ネットワーク対応玩具に個人化出力メディアクリップを動的にロードすることができるであろう。処理ユニットを備える玩具は、兄弟姉妹の年上の子と年下の子のどちらが玩具で遊んでいるかを判定するために用いることができる加速度計に基づいて出力メディアクリップを切り換えることができるであろう。例えば、玩具は「[ユーザ名]、優しくしてよ」と叫ぶことができ、この例では[ユーザ名]は2人の子供の内の荒っぽい方であろう。本発明のこの実施形態においては親によって設定されるような情況情報を用いることができる。ハッカーが玩具に望ましくない音、単語または身振りをさせることを防止するため、デバイスのメディアクリップ保持部内で暗号化を利用することができる。

本発明の少なくとも1つの実施形態において、再生開始はデバイスの情況に依存する。あるウエブサイトを表示すること、特定の電子メールを読むこと、特定の個人に電話をかけることまたはある場所にいることが再生を起動し得る様々な情況の例のいくつかである。これらの非個人的イベントまたは値は最終再生のためにどのクリップを接合するかの決定における分岐を生じさせ得る。例えば、システムのユーザはあるウエッブページ(または何か別のタイプのオンライン文書またはオンラインプログラム)を訪れることによって再生を開始させることができ、ユーザは著名人からの個人化された挨拶を聞くであろう。例えば、ユーザがオンライン書店を訪れた場合、そのユーザはユーザの好みの作家の1人からの個人的挨拶を受けることができ、その作家は次いで彼の最新作を売込みにかかるであろう。例えば一日の内の時刻に関係付けられた情況情報が、相異なるマスタークリップ、すなわち、朝にはより夜よりも短い作家からのクリップが再生されるべきであることを示せば、本発明の実施形態はこの情況情報に基づく分岐アクションをとることができる。その他の例には、電子メール、セル式携帯電話または何か別の再生デバイスを介する個人化メッセージがある。さらに、タイマー機能またはカレンダー機能がメディアクリップ送信を開始することができる。ユーザの介在なしにメディアクリップの非同期開始を行わせる情況機能の別の例には、電話器または自動車内のGPS受信機が場所に基づくメディアメッセージを開始する、場所情況を含めることができる。いかなる非個人化情報または情報源も情況源として用いることができる。HTTPは状態をもたないプロトコルであり、リクエストを出すデバイスによって必要とされるときに接続がなされ、よってこのプロトコルを通じる本発明のデバイスアクセス実施形態は、別個の通信プロトコルを通じるポーリングまたはオープン接続の維持のような非同期通知を認識するための別の手段を用いなければならない。

本発明の別の実施形態は、例えば、管理者による、月曜日にミーティングがあることの管理者のチームメンバー全員への個人化態様での通知を可能にし、多数の電話メッセージの節約を可能にするであろう。この例において、マスタークリップは録音して、同様にセル式電話上に記録されたそれぞれの個人名とともに、セル式携帯電話にセーブすることができよう。本発明の実施形態は、ユーザが、マスタークリップの録音時に与えられたボタンを押さえることでマスタークリップを実質的に作成し、それぞれの可変挿入クリップの録音時には別のボタンを行使することを可能にする、ソフトウエアインターフェースを含むことができる。あるいは、ユーザはセーブされたバルク個人化メッセージに単にアクセスし、スタッフミーティングの場合におけるように、必要なときにそれらを一括して送信できるであろう。あるいは本発明の実施形態は、スタッフミーティングに招聘されるべきグループがサーバ内に収められ、管理サーバ上のカレンダー機能がミーティングの所定の時間前に出席者に個人化メディアクリップを送信することで、管理者の介在なしに動作することができる。

メディアクリップがWWWを介して配布される場合、ユーザが特定のウエッブページを訪れたときにメディアクリップを生成して自動的に送信することができる。本発明は、メディアクリップを動的に生成するために様々な相異なる手法の使用を考慮している。一実施形態において、システムは個人化マルチメディアファイルを即時に再生するためにクッキーファイルからユーザ情報を取得する。別の場合、ユーザデータは既にシステムによって知られているかまたは、ログイン過程で取得され、確認される。

メディアクリップが電子メール、セル式携帯電話または何か別の遠距離通信機構を介して配布されるべきであれば、本発明の実施形態はメディアクリップをまとめ上げるためにユーザ情報のデータベースを利用することができる。メディアクリップ(例えば、個人化広告または何か別の個人化メディアクリップ)を配布したいコンテンツプロバイダは、処理のためにシステムにリクエストを出すことができよう。システムは、再生のために用意されるべき少なくとも1つのマスタークリップを識別するかまたは含み、挿入クリップがマスタークリップに合体させられるべき場所のそれぞれに関連付けられたタイプ情報を含む、そのリクエストを利用する。タイプ情報は次いでシステムデータベースからユーザ情報を得るために利用され、続いてユーザ情報はメディアファイルを生成する目的に該当する挿入クリップを得るために用いられる。挿入クリップが得られると、システムはそれらをマスタークリップと合体させ、電子メールまたは何か別の配布手段を介して完成メディアクリップをユーザに配付する。セル式携帯電話の場合、電話呼出音または折返し電話呼出音を本発明の実施形態によって生成し、ユーザを電話で呼び出すときに再生するため、あるいは、折返し電話呼出音の場合は、別のユーザを電話で呼び出すユーザに対して再生するために、電話会社サーバに格納される。システム内の情報は、それぞれ発信者識別番号及びダイアルされた呼出し相手先電話番号である、ANI及びDNISでクエリーすることができる。

図1は個人化メディアを生成及び配布するための本発明の一実施形態のアーキテクチャ図を示す。本発明の実施形態は、送信者100のようなユーザに、メディアクリップを生成して受信者107のような1人またはそれより多くの受取人への配布する手段を提供する。本明細書で用いられるように、「ユーザ」、「送信者」及び「受信者」という用語は、本発明の一実施形態を使用している個人及び/または特定の時点で実行されるようにプログラムされ、プログラムされた作業を実行する、コンピュータアプリケーションのようなプロセスを指すことに読者は注意すべきである。一般に、送信者100は受信者107と接続するクライアントを利用する。クライアントは一般に1つまたはそれより多くのタイプのネットワークを含むネットワークを介して交信できるコンピュータデバイスである。本アーキテクチャのこの実施形態に示されるようなクライアントの一例はセル式携帯電話101または106である。あるいはクライアントには、少なくとも1つのプロセッサ、メモリ及び記憶媒体が装備されたコンピュータのようなコンピュータデバイスを含めることができる。コンピュータデバイスは少なくとも1つのネットワーク通信手段を用いて交信するように装備及び構成される。例えば、クライアントは(固定または携帯)電話サービスを介して交信するためのモデムを装備することができ、あるいは、インターネットを通じて、インターネットプロトコル(IP)と組み合された通信制御プロトコル(TCP)のような1つまたはそれより多くのネットワークプロトコルを介して交信するように構成することができる。

コンピュータデバイスには、セル式携帯電話、電子手帳(PDA)、デスクトップコンピュータ、ラップトップコンピュータまたは、有線ベース及び/または無線ネットワークを介して交信でき、クライアントとして利用することができる、その他いずれかの電子装置がある。例えば、クライアントは、ハイパーテキストマークアップ言語(HTML)を表現できるブラウザ、リモートサーバから受け取ったアプレットを実行できるJAVA(登録商標)仮想マシン及びユーザとリモートマシンの間の交信をサポートするその他いずれかのコンピュータプログラムコードが装備された電子手帳とすることができる。別のアプリケーションは、ユーザによる、電子メールクライアント、クライアントによってサポートされるストリーミングサービス、ハイパーテキストトランスポートプロトコル(HTTP)ポスティング及びユーザによるメディア生成サーバ104へのメディアクリップポスティングを可能にするその他いずれかの手段のような、個人化メディアクリップのアップロードを可能にする。

(再生デバイスとも称される)クライアント106はメディアプレイヤーを含む。例えば、クライアント106は、1人またはそれより多くのユーザによるメディアクリップ再生のためのメディアデータベース103へのアクセスを可能にする、セル式携帯電話とすることが可能である。別のタイプのマルチメディア宛先クライアントには、マルチメディアプレイヤーが装備されたデスクトップコンピュータ、メディアクリップを再生できるかまたはメディアクリップを送配するネットワーク場所へのアクセスを可能にする、電子手帳及びその他いずれかの電子デバイスを含めることができる。

メディアサーバはメディアクリップへのアクセス及びメディアクリップの送配を扱うように構成され、一般にメディア送配の目的のための送信者及び受信者への送信を扱うことができる。メディアサーバの例はセルゲートウエイ102または105である。カレンダー情報、場所情報またはメディアクリップへの情況情報の挿入に利用できるその他いずれかの情報のような、その他の情況情報は、メディアサーバまたはメディアデータベース(またはメディアデータベースに接続されたその他のサーバ)によって複数のソースから検索することができる。

メディアサーバ105は、情況情報及び/またはメディアクリップ情報を収集するために、サードパーティサーバ(例えば別のウエッブサイト)、ローカルデータベースあるいはリモートデータベースに接続することができる。クライアント106はメディアサーバ105からのメディアサークリップに対するポーリングのためにスケジューラコンポーネントを備えることもできる。

本発明を具現化しているシステムは、必要に応じて、メディア生成エンジン104を利用してメディアクリップを処理することができる。例えば、メディアサーバ105が出力メディアクリップの生成に用いるための情況クリップ及びマスタークリップ及び挿入クリップを決定した後、メディアサーバ105はその情報をメディア生成エンジン104に送信することができ、よってメディア生成エンジン104はメディアデータベース103の1つまたはそれより多くの格納場所からメディアクリップのためのデータを検索することができる。メディアサーバ105は入力情報を用いて1つまたはそれより多くのメディアクリップを生成する。

メディアクリップ生成は、入力データへの1つまたはそれより多くの処理アルゴリズムの適用を含む。一般的な処理は、合体/混成、オーディオダビング、メディアクリップ挿入及び、情況情報に基づいて1つまたはそれより多くのメディアクリップをとり、1つまたはそれより多くの新しいメディアクリップを生成する、その他いずれかのタイプの処理を含む。メディアサーバ105は、接続数、ネットワークスループット及びメディアサーバ105当り単位時間当りに処理することができるメディアクリップ数を最大化するために、高度最適化マルチスレッド圧縮メディアシームレス接合プロセスを用いることができる。さらに、本発明の実施形態は、後のアクセスのそれぞれがメディアデータベース103へのアクセス及び、メモリの直接読出に対して、データベースへのアクセスにともなう遅延を回避する、反復アクセスアプリケーションにかかわる処理をさらに最小限に抑えるためにキャッシュを用いることができる。キャッシュは、様々な静的クリップ及び挿入クリップから構成された単一の連結メディアクリップを含むことができ、あるいはシームレス出力クリップをつくるために実時間で送信または構成される個別のクリップを含むことができる。

本発明の実施形態において、メディアデータベース103は一般に、市販されているかまたはフリーウエアのリレーショナルデータベース管理システム(RDBMS)である。格納場所は、ローカルにあるいはネットワークまたはメモリキャッシュを介してアクセスできる、いずれかのファイルシステムとすることもできる。

本発明を具現化しているシステムは、クライアント101または送信者100がアクセスできるその他いずれかのクライアント上で、あるいはメディア生成エンジン104上で実行されるメディア作成ソフトウエアコンポーネントを備えることができる。一般に、メディア作成システムにより、本発明の実施形態とともに利用するためのメディアクリップの編集及びメディアクリップの作成を行うために、新しく記録されたメディアクリップまたは既存のメディアクリップをユーザが利用することが可能になる。作成段階は以下でさらに詳細に開示され、後の段階における、マルチメディア生成エンジンによる1つまたはそれより多くの出力メディアクリップを生成するための複数のメディアクリップの結合を可能にするための、メディアクリップの特性、属性及びシンボルの作成を含む。別個の作成システムをメディア生成エンジン104とは独立に利用することができる。作成が行われる場所にかかわらず、生成は作成者による、現実の生活の記録あるいはオーディオ、ビデオまたはその他いずれかの電子データフォーマットを含むコンピュータ生成メディアを用いるクリップの作成を可能にする。作成に用いられるシステムは、ユーザによるマスタークリップの生成を可能にし、同時に、挿入点、これらの挿入点に対する変数名及びマスタークリップを情況情報及びメディアクリップ間の関係と関連付けるその他の属性の節約を可能にする。

図2は本発明の1つまたはそれより多くの実施形態にしたがう個人化メディアを生成するための方法を示す。プロセスはステップ200で開始される。システムは少なくとも1つのマスタークリップをステップ201で取得し、(1つまたは複数の)関連付けられたいかなる挿入クリップもステップ202で取得する。システムは次いで(1つまたは複数の)挿入クリップが挿入されるべき(1つまたは複数の)マスタークリップ内の挿入点を決定する(ステップ203)。(1つまたは複数の)挿入点の決定は、挿入点の場所の詳細を示すメタデータを得ることによるか、あるいは挿入クリップが挿入されるべき場所を示すその他いずれかの方法によって達成される。マスタークリップ及び挿入クリップは次いで、マスタークリップと挿入クリップの間のいかなる移行点も覆い隠すために、シームレスに混成されてメディアクリップにされる(ステップ204)。これは以下でさらに十分に説明される。必要に応じて、個々のクリップは後のアクセスのためにキャッシュまたはデータベースに格納することができる。メディアクリップがステップ205で判定されるように直ちに送信されるべきであれば、メディアクリップがステップ207で配布される(図3を見よ)。メディアクリップが、例えばセル式携帯電話に対する電話呼出音または折返し電話呼出音に用いられるような、非同期取出しのために作成されていれば、メディアクリップはステップ206でセーブされる。システムは次いで別のメディアクリップ生成がリクエストされるときにステップ200でプロセスを開始するために待機する。

本発明は多くの様々なインターフェース(例えば、ウエッブインターフェース、電子メールクライアント及び/またはメディアクリップの再生を実行するように構成されたその他いずれかのタイプのデバイス)の使用を考慮しているが、それぞれのタイプのインターフェースの使用に関連付けられるいくつかの特定の詳細及び一般則がある。例えば、ウエッブインターフェース及び/または電子メールインターフェースは、コンピュータネットワークのような相互接続網を介して、1つまたはそれより多くのサーバサイトにアクセスするための手段をユーザに提供する。この目的のため、クライアント及びサーバシステムは、無線ネットワーク、電話システムのような遠距離通信システムを介するネットワーク、光ネットワーク及びクライアントシステムによるサーバシステムとの交信を可能にするその他いずれかのデータ伝送機構を含むがこれらには限定されない、いずれかのタイプのネットワーク通信をサポートする。ユーザインターフェースは、ブラウザプラグイン、マルチメディアプレイヤー及び/またはマルチメディアを再生できるいずれかのタイプのハードウエアデバイスへのマルチメディアデータのストリーミングを行う場合のように、データストリーミングもサポートする。さらに、本発明の他の実施形態はウエッブサービスインターフェースを利用することができ、あるいはクリップを取得して互いに接合し、それらを1人または多数のユーザに送配するためにピアトゥピアアーキテクチャを利用することができる。

本発明の1つまたはそれより多くの実施形態にしたがえば、ユーザインターフェースはシステムにアクセスするそれぞれのユーザに関係付けられた一意的な識別子を得るための機構を提供する。ユーザまたはデバイスを一意的に識別するいかなるデータアイテムも一意的識別子と称される。電話での使用に向けられた本発明の実施形態については、ANI及びDNIS(それぞれ発信者識別番号及びダイアルされた呼出し相手先電話番号)を、所望の送信者及び受信者に一意的なメディアクリップについて図1のメディアデータベース103にクエリーするために利用することができる。これは、例えば、特定の電話呼出人に、ただし別の電話呼出人にではなく、音楽のある一部または個人化メッセージを再生するために利用することができる。個人化メッセージまたは音楽の一部の再生に加えて、折返し電話呼出音の場合、受信者の電話が実際に鳴っており、保留状態にはなっていないことを送信者がわかるように、可聴標準電話呼出のオーバーレイを実施することができる。本発明の他の実施形態において、シリアル番号及び/またはユーザ名及びパスワードが一意的識別子として作用し、よってシステムへのアクセスを提供すると同時に不正アクセスを排除する。本発明の少なくとも1つの実施形態において、一意的識別子は、ユーザ情報(例えば、ユーザ名、年齢及びユーザに関するその他いずれかの情報)またはURLまたは適切なユーザ情報へのポインタを含むクッキーファイルである。システムがクッキー情報を得ると、その情報は個人化マルチメディアファイルを表現する目的のために用いられる。例えば、システムは、メディアクリップを表現する目的のためにどの挿入クリップをマスタークリップに関連付けるかを決定するためにクッキーファイル内に含まれる情報を利用することができる。ユーザを識別することにより、本発明の実施形態はユーザのタイプ及びユーザの好みのようなユーザ情報に基づいてマルチメディアデータの内容を選択的に決定するように構成される。

システムは、マスタークリップ、挿入クリップ及び/またはその他のマルチメディアクリップを様々な場所から得ることができる。そのような場所には、データベース格納システム、データファイル、ネットワークロケーション、ハードディスク、光記憶デバイス及び、ウエッブサービス及びピアトゥピアネットワークを含むネットワークリソースを含むがこれらには限定されない、データを格納できるいずれかの媒体がある。本発明の一実施形態において、格納場所はリレーショナルデータベースシステムである。データベースシステムは、メディアクリップを生成するために用いられるマスタークリップ及び/または挿入クリップ、及び/またはそれぞれのメディアクリップに関係付けられる様々なその他のデータ及びメタデータを保持することができる。メディアクリップに関係付けられるデータは属性に基づくメディアクリップの類別、種別及び検索を可能にする。さらに、メタデータは、挿入点、挿入点における変数名、継続時間及びその他の項目を含む、クリップに関する情報をさらに含む。データベースシステムはデータベース内の特定の情報を検索するプロセスを速める目的のためにデータベース内のデータに索引をつけるように構成することができる。データベースは多数のユーザを同時に扱うためのシステムのスケールアップを可能にするために複数のミラーを備えることができる。

図3は、本発明の1つまたはそれより多くの実施形態にしたがう個人化メディアを配布するための、ステップ300で開始される方法を示す。ステップ301において、図1に示されるようなメディアデータベース103からメディアクリップが取得される。ステップ302で判定されるように、送信前に挿入されるべき動的情況データがメディアクリップに必要であれば、ステップ303で情況クリップが取得される。ステップ304で1つまたは複数の情況クリップに対する挿入点が決定される。ステップ305で情況クリップは入力メディアクリップとシームレスに混成されて、情況情報を含むメディアクリップが得られる。ステップ302で判定されるように、メディアクリップが情況情報を含まないか、あるいは情況情報が挿入されると、ステップ306でメディアクリップが受信再生デバイス用にフォーマットされる。これは、例えば与えられたオーディオフォーマットへのメディアクリップのフォーマッティングを含むことができる。メディアクリップは次いでステップ307でクライアントに送信される。

情況情報はいかなる数のソースからも取得できる。例えば、マルチメディア属性はデータベースシステムから、時刻は計時システムから、イベント情報はカレンダーシステムから、地理情報は全地球測位システムから取得することができ、情況情報は本発明の実施形態に情況情報を提供できるその他いずれかのシステムから取得することができる。情況情報には再生を開始するための手段及び時刻を決定するために属性情報及び規則情報を組み合せることができる。例えば、カレンダーシステムに基づくイベントは、一日の時刻、イベントのタイプ、イベントに先立つ(または後続する)イベントまたはユーザの所在地に依存して、出力メディアクリップを送配するためにどの送配手段を用いるかを指定することができる。ユーザがオンラインであれば、ウエッブインターフェースを介する再生とすることができ、またユーザが電子メールを用いていれば、電子メールの形態での再生とすることができる。ユーザが再生時刻にそのような行動を実際にとっていなければ、再生をセル式携帯電話にリダイレクトすることができる。システムはメディアクリップ間の排他規則を判定するためにその他の情況属性を用いることができる。インテリジェントツールを用いて情況規則を解釈することにより、本発明の実施形態は個人の代りに作業を自動的に扱うことができるエンジンを提供できる。

図4は、本発明の1つまたはそれより多くの実施形態にしたがって構成された、1つまたはそれより多くのメディアクリップの要素を表すブロック図を示す。水平軸では左から右に時間が経過している。マスタークリップ410は、オーディオ及び/またはビデオを含むがこれらには限定されない、いずれかのタイプのマルチメディアデータを含む。1つまたはそれより多くのマスタークリップは合体させて再生準備ができているメディアクリップを生成することができる。挿入クリップ420もいずれかのタイプ(例えば、オーディオ、ビデオ等)のデータを含むことができる。システムは2つまたはそれより多くのメディアクリップを、それらのクリップが少なくとも1つの特性を共通に有する限り、結合させてマスタークリップまたは挿入クリップを形成することができる。例えば、オーディオクリップはビデオクリップと、ビデオクリップに含まれるオーディオトラックが挿入されるべきオーディオクリップと同じ特性を有していれば、合体させることができる。クリップのサンプリングレートまたはフォーマットが合っていなければ、結合させる前にクリップを規格化することができる。長さの異なるクリップは、所望のスロット内にクリップを適合させるために、前側または後側を切り捨てるか、あるいはより速いかまたはより遅いレートでクロスサンプリングすることができる。あるいは、マスタークリップは、クリップは非シームレス接合を生じさせるバックグラウンドサウンド情報ではないから、クリップを単に次々に連結することができることを意味する、挿入クリップを適合させるためのタイムスロットが定まっていないことを示すメタデータを含むことができる。これは、例えば、与えられたマスタークリップに定められた空白時間が残されておらず、挿入クリップのような別のクリップがまた別のマスタークリップの前にアペンドされるべきであれば、マスタークリップをバックトゥバック態様でアペンドすると考えることもできる。呼び方はどうであれ、アイデアは単一録音クリップとして知覚される出力クリップを作成するために独立クリップがシームレスに接合されることである。システムが挿入クリップ420を1つまたはそれより多くのマスタークリップ410とインターリーブする場所は、開始点及び終了点あるいは開始点及び継続時間で印される。挿入クリップは開始点と終了点の間の継続時間全体を用いるように録音/録画され、よって挿入クリップがマスタークリップとシームレスに統合されているように聞こえるかまたは見えるようにする。

マスタークリップまたは挿入クリップの取得にはライブ演奏(例えば、バンドの営業または芸術活動での演奏)の録音あるいはコンピュータ合成音の取込を含めることができる。プロデューサーはマスタークリップとなるべきクリップを識別し、クリップあるいは1つまたはそれより多くのクリップの音声トラックを編集して、1つまたはそれより多くの挿入クリップを落とし込むための空白を入れる。特定のクリップの検索を補助する目的のため、プロデューサーはメディアクリップ内のサウンドまたは画像を説明するための属性を入力することもできる。属性として役立ち得るデータのいくつかの例は、テキストキーワード及びキーフレーズ、サウンドクリッププレビュー、画像プレビューまたはメディアクリップの特徴を示すことができるその他いずれかのデータフォーマットである。プロデューサーは全ての利用できるメディアクリップの中から挿入クリップになると指定されるクリップの決定も行う。挿入クリップは、本発明の実施形態において、1つまたはそれより多くのメディアクリップ(例えばマスタークリップ)の1つまたはそれより多くの場所において挿入または混成されるべき態様に整えられる。いくつかの例において、挿入クリップは所定の継続時間を埋めるように巧みに録音/録画される。マスタークリップに人名を入れるために3秒の空白があけてあれば、挿入クリップは3秒全部を埋めるように録音される。すなわち、バックグラウンドミュージックトラックがマスタークリップを挿入クリップとシームレスに統合する。挿入クリップが他のメディアクリップとの混成用に構成されていれば、挿入クリップ自体がマスタークリップになることができる。システムは挿入クリップを、キーワード、キーフレーズ、サウンドプレビュー、画像プレビュー及び、データ管理の目的のための挿入クリップの識別、種別、ソートまたはその他の操作を可能にするその他いずれかのデータフォーマットと関連付けるための機構も提供し、この情報は一般にメタデータとして知られている。プロデューサーはクリップに挿入点をマークする。本発明は挿入点のマーキングのための様々な手法の使用を考慮している。システムは、例えば、別のタイプのメディアクリップのマスタークリップの特定の場所をマークするために識別可能なパターンを有する信号を埋め込むことができる。この信号は、システムが挿入クリップを入れるための場所を探し求めているときに、チェックされる。別の手法には、場所情報を定め、この場所情報をメディアクリップとともにクリップに関係付けられたメタデータの形態で(例えばデータベースシステムに)格納する手法がある。あるいは、システムは、挿入クリップが入れられるべき点においてそれぞれが開始され、及び/または終了する、複数のマスタークリップを利用することができる。マスタークリップが1つまたはそれより多くの適切な挿入クリップと合体させられると、結果は再生準備ができているシームレスメディアクリップである。この手法を用いれば、唄または何か別のタイプの録音/録画された情報が圧縮または非圧縮シーケンシャルファイル(例えば、WAV,AVI,MP3,OGG等)のセットに分割され、あるファイルは挿入ファイルとして識別され、音声トラックが挿入ファイルから抜き取られ、挿入クリップが挿入ファイルにかぶせて録音/録画される。音声が個人化されているか情況が関連付けられたフレーズがメディアクリップに挿入されている間はずっとバックグラウンドミュージックが再生され続けているから、これは原録音/録画のように感じることができる。本発明の別の実施形態においては、挿入クリップが音声のような情報無しに録音/録画されるから、音声トラックを抜き取る必要はない。すなわち、プロデューサーは単に適切な音声データをクリップに付加することによって挿入クリップを作成することができる。いずれの場合にも、マスタークリップ及び挿入クリップは次いで、ファイナライズされたメディアクリップを作成するために合体させられる。システムは適切なマスタークリップ及び挿入クリップを統合することによって短時間でメディアクリップを生成することができ、あるいは先に作成されたメディアクリップをデータベースから検索することができる。メディアクリップのプロデューサーは混成及び挿入特性を定めることができる。システムは挿入クリップを1つまたはそれより多くのマスタークリップと合体させる仕方を定めるためにそのような特性を使用することができる。例えば、特性によって、システムは、挿入クリップのシームレス統合を可能にするために、マスタークリップ信号をいつフェードさせるか、及び挿入クリップ終了後にいつ緩やかに常態に戻すかを知ることができる。分割場所及び合体場所を示すマーキングは、埋め込まれたコードまたはクリップとは別に格納されたメタデータとすることができる。

本発明の実施形態によって生成されたアプリケーションは自然言語のフローを反映する。これは、アプリケーションの創作者が、アプリケーション内の全てのスロットに対して少なくとも1つの「ジェネリック」フィラーを書き、及び/または高度に可変な情報(例えば、名前)をもつスロットに対して「ジェネリック」フィラーのアルファベットのセットを提供し、接近して話されるフレーズにわたって生じる音素混成を考慮する場合に達成される。書き手が、ある音素混成が「濁りのある」後成結果を生じるであろうと判定し、スロットに前後するコンテンツを含めると決定したとすれば、スタジオガイドは変数の読み毎に前後コンテンツを組み入れるべきである。「濁りのある」混成は自然言語において後続の単語に音素(発声される母音または子音)がかぶる場合には必ず生じる。例えば、アプリケーション:「Hey [叙述], it’s Hilary again.」を考える。このアプリケーションにおいてスロットは「叙述」であるが、自然に聞こえるフローは「Hey」の読みをトークン(挿入クリップ)内に入れることによって最善に達成される。いくつかの「ジェネリック」フィラー:「guy」, 「girl」及び「friend」があると仮定すると、スタジオガイドは、例えば、「hey guy」, 「hey girl」及び「hey friend」のようなそれぞれの読みをもつ「Hey」を著名声優に対して示す。

上例において、英語を用いる諸国民のほとんどは、「Hey」と後続単語の間に有意な休止を決して挿入しないであろう。代りに単語は混成されて、やや「Heyguy」または「Heygirl」のように聞こえる単一の発声を形成する。濁りのある混成を判定する2つの規則は、スクリプト内の隣接する2つの単語の内の少なくとも1つが可変であり、自然に聞こえる休止が生じないと思われれば、それは濁りのある混成であり、スクリプト内の先行単語が後続単語と同じ子音音または母音音で終れば(例えば、first student, selling ingot)、それは濁りのある混成である。スクリプト内のこの種の混成を見いだすには、書き手がそれを読むように声優に指示することにしている速度と同じ速度でそれを大声で読むことであり、次いで必要であれば、スクリプト及びスタジオガイドを変数の前後に録音を入れるように調整する。

図5は本発明の電話呼出音及び折返し電話呼出音実施形態のためのシステムコンポーネントの相互作用を示すフローチャートを示す。ステップ500でユーザが個人化コンテンツを選択する。これは、電話会社ポータルのようなオペレータポータルを訪れて個人化コンテンツを選択しているユーザに関連付けられた左側のクライアントコンピュータとしてブロックに示される。ステップ501で、どの個人化アプリケーションが利用できるかを決定するため並びに関連付けられた変数名の取得及び、例えば特定のセル式携帯電話のような特定のターゲット電話クライアントへの送配のための所望のビットレートのような、その他いずれかの所要情報の提供または受領を行うために、オペレータポータルがメディアサーバと交信する。ステップ502でユーザが電話呼出音または折返し電話呼出音を構成する。これには、個人化クリップに対して用いるための特定の著名人の声の選択及び、所要挿入クリップ、例えば、電話受信者名、電話発信者名または生成クリップの生成に必要なその他いずれかの変数を報告するためのフォームの記入を含めることができる。このステップでユーザはオペレータポータルと対話する。オペレータポータルがメディアサーバからのクリップへのユーザのアクセスを可能にするためにユーザをプレビューウインドウにリダイレクトしたときに、ユーザはステップ503でクリップをプレビューする。ステップ504でユーザはオペレータポータルを介してトランザクションを確認する。ステップ504でトランザクションが完了すると、オペレータポータルは完成した1つまたはそれより多くのクリップを取り戻し、それらのクリップを適切であるとして、電話呼出音、折返し電話呼出音または応答メッセージに用いる。

アプリケーションのXML実施形態の一例は、送配されるべきオーディオファイル、クリップまたは複数のクリップの構造を記述するために利用できる単一ドキュメントである。アプリケーションXMLが表1及び表2:

に説明される。

HTTP GETまたはHTTP POSTオペレーションを行っているクライアントについては、HTTPクエリー文字列に値をアペンドするかまたはHTTP POSTペイロードにそれらを含めることによって、アプリケーション内のアプリケーションパラメータのいくつかをリクエスト時にオーバーライドすることができる。オーバーライドは表3:

に説明される。

電話発信者名、電話受信者名及び3つの静的セグメントを組み入れている電話呼出音についてのサンプルアプリケーションファイルが表4:

に示される。このサンプルアプリケーションに対する音声表記は:
「[受取人名]ダフィ・ダックよ![発信者名]があなたに電話しているわ。電話にはでないなんて言わないでちょうだい...わかった?電話にはでないの?まあ結構なことね!さあ私のいい子ちゃん、電話にでなさい!」
である。個人化されたMP3プレビューを検索すると:
「ジョン!ねえジョン!ダフィ・ダックよ!ボブがあなたに電話しているわ。電話にはでないなんて言わないでちょうだい...わかった?電話にはでないの?まあ結構なことね!さあ私のいい子ちゃん、電話にでなさい!」
となる。インテグレーターはHTTPリクエスト:
http://audio.MEDIASEVERNAME.com/?app_id=111&recipient_name=john&caller_name=bob
を出すであろう。

メディアサーバまたはメディア生成エンジンは多くの様々なタイプのハードウエアを備えることができる。一例のハードウエア構成のタイプは、それぞれが、512K L2キャッシュをもつデュアルPentium(登録商標)IIIXeonプロセッサを有する、Dell PowerEdge2400サーバを備えることができる。それぞれのサーバは、1GBのメインメモリ及びソフトウエアRAID0+1で構成された42GB(6×7GB)記憶装置をもって構成することができる。あるいは、システムは高密度ブレードサーバ上に展開することができる。論理的に、MPEG3エンコードを採用するシステムは、プロセッサが高速になるほど性能上かなりの恩恵を得る。圧縮フォーマットのシームレス接合を用いる実施形態は、そのような実施形態の処理要件がかなり低いから、より多くのユーザにサービスを供給することができる。これは、生挿入クリップが生マスタークリップに付加される場合とは違い、出力データのエンコードが出力メディアクリップ全体にわたって行われる必要はないという事実による。いくつかの圧縮フォーマットでは、フレームを別のフレームの中程に前後のフレームの位置を変えることなく挿入することができる。そのような圧縮フォーマットはマスタークリップを先にエンコードし、挿入クリップを先にエンコードしてからそれらを接合するために用いることができる。この最適化は、キャッシュされていない生マスタークリップ及び生挿入クリップを接合し、引き続いて圧縮及びネットワーク送信する方法に対して、毎秒サービスを受けるユーザ数を2桁多くすることができる。

スケーラブルアーキテクチャを用いる本発明の実施形態はメディアクリップをコード変換及び/または圧縮を行うことができ、この結果、そのような圧縮によって提供されるネットワーク負荷を大きく低減することができる。システムは、LAMEまたはデータを本発明の実施形態による出力に必要なフォーマットに圧縮できるその他いずれかのエンコーダを用いて、WAVのMPEG3へのコード変換を行うことができる。この方式はオーディオ品質を劇的に高め、及び/または劇的比(10:1)だけネットワーク需要を低減するが、コード変換及び圧縮は情況クリップ混成の場合にメディア生成エンジンまたはメディアサーバに多大の負荷をかける。

本発明の別の実施形態は、圧縮メディアのシームレス接合を可能にするように設計された構成をもつエンコーダを利用する。これにより、メディアクリップ圧縮専用圧縮エンジンレイヤーが必要ではなくなり、力づくのWAVE→MPEG3メディアクリップキャッシュレス個人化システムよりほぼ300倍速いシステムがつくられる。

メディアクリップのシームレス接合はいくつかのメディアタイプについて実施することができる。WAV,AIFF及びAUフォーマットファイルのような生データタイプは、前後のフレームからのビットの借入なしに、時間的に順序付けられ、よって、何事もなくスライス抜取及び付加を行うことができる。高度に圧縮されたフォーマットは、一般に圧縮困難なフレームに属すべきデータを単純な波形を表す圧縮容易なフレームに入れるから、個々のデータフレームのそのようなタイプの操作ができることもできないこともある。このデータインターレースはフレームを相互に依存させる。

MPEG3は現在のフレームに対してのみ情報を保持するようにフレームをエンコードすることによって高周波端スペクトルがわずかに劣化する圧縮を可能にする。これは、ビットリザーバーを使用しないようにエンコーダを構成し、よって周波数応答を若干悪化させることにより、達成される。さらに、オーバーラップエンコードを含む可変ビットレートエンコードを用い、フレーム独立を達成することは可能であるが一層複雑になり、録音/録画を時間的にオーバーラップさせなければならない。周波数応答における利得は最小であり、計算及びビット操作が一層複雑になるから、ビットリザーバー無しの定ビットレートエンコードを用いる本発明の実施形態は最高の音質が要求されない状況において用いることができ、最高の音質が要求される状況ではより高度に複雑なビット操作アルゴリズムが関与する可変ビットレートエンコードを用いることができる。

与えられたフォーマットに用いられるエンコーダに依存して、エンコード時に様々なアーティファクトが生じ得る。例えば、LAMEエンコーダソフトウエアでは、クリップをデコードするために用いられるアルゴリズムにより、エンコードされたクリップの前端及び終端に様々な空白点が生じる。いくつかのエンコーダはデコーダルーチンと機能的に同様のMDCT/フィルタバンクルーチンを用い、エンコーダされたファイルの前端に528サンプル遅延が入る。

LAMEを用いる本発明の実施形態については、MDCT係数を含むLAMEソフトウエアを用いる挿入クリップエンコードの第1グラニュール(576ビット)をクリッピングし、ファイルからのID3メタデータ及び挿入クリップの後端において最終288ビットを排除することによってシームレス接合メディアクリップをつくることができる。得られるメディアクリップは、前端アーティファクトまたは後端アーティファクト、メタデータまたは、マスタークリップへの無依存挿入を妨げるような、データ依存性を持たない。

一シナリオにおいて、ユーザは1人またはそれより多くの別のユーザ(例えば受取人)に特化メッセージ(例えば、招待、広告、喚起等)を送るために本発明を具現化しているシステムを利用する。本例において、ユーザはサーバに接続して特化メッセージを受け取るべき他のユーザのリストを入力できる。送り側ユーザは配布のためのマスタークリップを選択でき、システムは(1つまたはそれより多くの)適切な挿入クリップを識別してマスタークリップと合体させるためにユーザ情報リストを用いて配布のためのマルチメディアクリップをまとめ上げる。システムは受取人及び/または受取人が利用できる手段に届けるための最善の通信経路を決定するために情況情報を検索することもできる。システムは、利用可能性情報、個人情報(例えば住所及び電話番号)及び、マルチメディアクリップのまとめ上げ及びばらしの目的のために有用なその他いずれかの情況情報のような、その他の情況情報を取得することができる。システムはいくつかの仕方で情況情報を利用する。例えば、システムは、それぞれの受取人の居住地とミーティング開催場所の間の距離に依存する様々な時点でメッセージを送ることができる。システムは受取人がどこにいるかに依存する様々な伝送機構を用いてメッセージを送ることもできる。ユーザが現時点でインターネットを用いていれば、システムは電子メールでのメッセージ送付を選択することができる。そうでなければ、システムは、ボイスメールシステムにオーディオメッセージを送信するか、またはセル式携帯電話にかけることによってユーザと接触するかを選択することができる。

別のシナリオにおいて、システムは受取人情報(例えば、姓名、彼/彼女の敬称、等)を検索し、それぞれのユーザに適切なマルチメディアクリップをまとめ上げる。システムはユーザの特性に依存して、例えば、言語、性別、音調または音声トラックのその他いずれかの修正可能な態様を変えることができる。システムはマルチメディアクリップに適切な機構及びフォーマットを選択し、よってそれぞれのユーザに特化したマルチメディアクリップを作成することもできる。

本発明の1つまたはそれより多くの実施形態において、個人化変数または挿入変数は既存の挿入クリップにマッピングされる。例えば、名前変数を含むアプリケーション及びメッセージを個人化する場合にある個人についてのユーザによる名前のタイプ入力が可能であるアプリケーションについては、あり得る最も近い名前に実在しない名前をマッピングすることができる。この態様において、ユーザ名「ジョセフ」に対する個人化メッセージは「ジョー」にマッピングすることができる。さらに、例えばユーザが挿入クリップにふさわしくない単語、例えば悪態語をタイプ入力した(または言った)場合に品位規準を適用して、不快ではない受容できる単語にマッピングすることができる。米国の人口の80%は1300の名前でカバーできるから、見つからない名前に「サー」または「マダム」のような汎用名に残りの名前の全てをマッピングすることによって少ない処理費用で80%の適用範囲が得られる。

メディアクリップの生成はそれらの実際の送信に関して非同期で行うことができるから、本発明の実施形態は、例えば著名人の声におけるボタン音声化のような、その他の個人化メディアとともに電話呼出音及び折返し電話呼出音を得るために、セル式携帯電話会社が利用することができる。個人化メディアの生成は、例えばユーザが個人化折返し電話呼出音を購入したときに行われるから、与えられた電話発信者IDに対して与えられた入り電話番号に対するメディアクリップの生成はクリップが実際に使われる前のいつでも行うことができる。個人化メディアクリップの売上から発生する収益は、クライアントに様々な料金、または生成メディアクリップの使用毎の料金を、課金できる電話会社から得られる。

以上、個人化メディアクリップのセットを生成するための装置及び方法を説明した。しかし、特許請求の範囲が、及びいかなる等価物の全範囲も、本発明を定める範囲である。

個人化メディアを生成及び配布するための本発明の一実施形態のアーキテクチャ図を示す 本発明の1つまたはそれより多くの実施形態にしたがう個人化メディアを生成するための方法を示す 本発明の1つまたはそれより多くの実施形態にしたがう個人化メディアを配布するための方法を示す 本発明の1つまたはそれより多くの実施形態にしたがって構成された1つまたはそれより多くのメディアクリップの要素を表すブロック図を示す 本発明の電話呼出音及び/または折返し電話呼出音実施形態についてのシステムコンポーネントの相互作用を示すフローチャートを示す マスタークリップ及び、マスタークリップの与えられた継続時間のスロットまたは挿入点に挿入するためのトークンという別称でも知られる、挿入クリップからなる静的クリップを含むアプリケーションを示す

符号の説明

100 送信者
101,106 セル式携帯電話
102,105 セルゲートウエイ
103 メディアデータベース
104 メディア生成エンジン
107 受信者

Claims (10)

  1. 個人化メディアを生成及び配布するためのシステムにおいて、
    個人化メディアを含む挿入クリップ、
    挿入点を有するマスタークリップ、
    ネットワークインターフェース、
    前記ネットワークインターフェースに結合され、さらに前記挿入クリップ及び前記マスタークリップを収めるメモリデバイスを備える、コンピュータ、
    RFID,クレジットカード番号、ANI及びDNISからなる群から選ばれる識別子によって前記コンピュータに識別される再生デバイス、及び
    前記コンピュータ上で実行される、前記挿入クリップを前記マスタークリップに前記挿入点において結合して前記挿入点においてシームレスに接合している、前記再生デバイスのために生成される、個人化メディアクリップを生成するように構成された、プロセス、
    を有することを特徴とするシステム。
  2. 前記再生デバイスが前記個人化メディアクリップによって電話呼出を行うように構成されることを特徴とする請求項1に記載のシステム。
  3. 前記個人化電話呼出メディアクリップが著名人の声を含むことを特徴とする請求項2に記載のシステム。
  4. 前記再生デバイスが前記個人化メディアクリップにより折返し電話呼出を行うように構成されることを特徴とする請求項1に記載のシステム。
  5. 前記個人化電話呼出メディアクリップが著名人の声を含むことを特徴とする請求項4に記載のシステム。
  6. 前記挿入クリップ及び前記マスタークリップが圧縮メディアを含み、前記プロセスがさらに前記挿入点における圧縮シームレス接合によって前記個人化メディアクリップを生成するように構成されることを特徴とする請求項1に記載のシステム。
  7. 前記圧縮メディアが、MP3,OGG,フラッシュ及びビデオデータからなる群から選ばれるフォーマットを有することを特徴とする請求項6に記載のシステム。
  8. 情況情報を含む情況クリップをさらに有し、前記マスタークリップが第2の挿入点をさらに有し、前記コンピュータがさらに前記第2の挿入点において前記情況クリップを前記マスタークリップと、前記第2の挿入点において検知され得る移行を示すことなく、結合するように構成されることを特徴とする請求項1に記載のシステム。
  9. 前記情況情報が、時刻、日付、場所及び温度情報からなる群から選ばれることを特徴とする請求項8に記載のシステム。
  10. 前記挿入クリップ、前記マスタークリップ及び前記情況クリップが著名人の声を含むことを特徴とする請求項8に記載のシステム。
JP2007552101A 2005-01-20 2005-01-20 個人化メディアの生成及び配布のためのシステム及び方法 Pending JP2008529345A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/US2005/001853 WO2006078246A1 (en) 2005-01-20 2005-01-20 System and method for generating and distributing personalized media

Publications (1)

Publication Number Publication Date
JP2008529345A true JP2008529345A (ja) 2008-07-31

Family

ID=36692538

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007552101A Pending JP2008529345A (ja) 2005-01-20 2005-01-20 個人化メディアの生成及び配布のためのシステム及び方法

Country Status (3)

Country Link
EP (1) EP1847102A4 (ja)
JP (1) JP2008529345A (ja)
WO (1) WO2006078246A1 (ja)

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
JP4780679B2 (ja) * 2008-05-12 2011-09-28 カタリスト・モバイル株式会社 移動式小型通信機器及びプログラム
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
GB2481573A (en) 2010-06-15 2012-01-04 Nds Ltd Splicng of encoded media content
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
EP2954514A2 (en) 2013-02-07 2015-12-16 Apple Inc. Voice trigger for a digital assistant
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
JP6259911B2 (ja) 2013-06-09 2018-01-10 アップル インコーポレイテッド デジタルアシスタントの2つ以上のインスタンスにわたる会話持続を可能にするための機器、方法、及びグラフィカルユーザインタフェース
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3008964B1 (en) 2013-06-13 2019-09-25 Apple Inc. System and method for emergency calls initiated by voice command
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
CN106471570B (zh) 2014-05-30 2019-10-01 苹果公司 多命令单一话语输入方法
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (da) 2016-06-09 2019-02-22 Apple Inc. Intelligent automated assistant in a home environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
DK179496B1 (da) 2017-05-12 2019-01-15 Apple Inc. Bruger-specifikke akustiske modeller
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10419790B2 (en) 2018-01-19 2019-09-17 Infinite Designs, LLC System and method for video curation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001119473A (ja) * 1999-10-20 2001-04-27 Shimadzu Business Systems Corp メッセージ発信システム
JP2003110655A (ja) * 2001-09-28 2003-04-11 Brother Ind Ltd 音声合成機能付き電話装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5821874A (en) * 1996-03-19 1998-10-13 Sony Corporation Messaging terminal with voice notification
US20020001371A1 (en) * 1998-05-29 2002-01-03 Randy G. Goldberg Method and apparatus for delivering personalized broadcast messages
US20020116716A1 (en) * 2001-02-22 2002-08-22 Adi Sideman Online video editor
US20020138302A1 (en) * 2001-03-21 2002-09-26 David Bodnick Prepaid telecommunication card for health care compliance
FR2845235A1 (fr) * 2002-10-01 2004-04-02 Cegetel Procede de messagerie vocale instantanee et dispositif de mise en oeuvre d'un tel procede
GB2395866A (en) * 2002-11-28 2004-06-02 Edward O'connor Mobile telephony enabled handset audio message application

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001119473A (ja) * 1999-10-20 2001-04-27 Shimadzu Business Systems Corp メッセージ発信システム
JP2003110655A (ja) * 2001-09-28 2003-04-11 Brother Ind Ltd 音声合成機能付き電話装置

Also Published As

Publication number Publication date
EP1847102A4 (en) 2009-04-08
WO2006078246A1 (en) 2006-07-27
EP1847102A1 (en) 2007-10-24

Similar Documents

Publication Publication Date Title
US8209385B2 (en) Multimedia mood messages
US9230561B2 (en) Method for sending multi-media messages with customized audio
US6895084B1 (en) System and method for generating voice pages with included audio files for use in a voice page delivery system
US7457397B1 (en) Voice page directory system in a voice page creation and delivery system
US7177811B1 (en) Method for sending multi-media messages using customizable background images
US7844215B2 (en) Mobile audio content delivery system
RU2488970C2 (ru) Способ связи, система связи и продукты для связи
US20020110248A1 (en) Audio renderings for expressing non-audio nuances
US20110153330A1 (en) System and method for rendering text synchronized audio
US8091028B2 (en) Method and apparatus for annotating a line-based document
Geoghegan et al. Podcast solutions
EP1160714A1 (en) System and method enabling remote access to and customization of multimedia
US20090254826A1 (en) Portable Communications Device
US7293060B2 (en) Electronic disc jockey service
RU2490821C2 (ru) Портативное устройство связи и способ для медийно-расширенных сообщений
US8244589B2 (en) Personalized audio controlled shopping information service for a mobile device
US20100050064A1 (en) System and method for selecting a multimedia presentation to accompany text
US7853664B1 (en) Method and system for purchasing pre-recorded music
EP1743286B1 (en) Feature extraction in a networked portable device
US9639855B2 (en) Dynamic embedded recognizer and preloading on client devices grammars for recognizing user inquiries and responses
KR100841026B1 (ko) 사용자 신청에 응답하는 동적 내용 전달
US5915001A (en) System and method for providing and using universally accessible voice and speech data files
US7523036B2 (en) Text-to-speech synthesis system
US20130231931A1 (en) System, method, and apparatus for generating, customizing, distributing, and presenting an interactive audio publication
US20090055186A1 (en) Method to voice id tag content to ease reading for visually impaired

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101117

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101125

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101217

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101227

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110117

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110124

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110412