JP2013511214A - 電子視覚作品のためのサウンドトラックの動的音声再生 - Google Patents

電子視覚作品のためのサウンドトラックの動的音声再生 Download PDF

Info

Publication number
JP2013511214A
JP2013511214A JP2012538959A JP2012538959A JP2013511214A JP 2013511214 A JP2013511214 A JP 2013511214A JP 2012538959 A JP2012538959 A JP 2012538959A JP 2012538959 A JP2012538959 A JP 2012538959A JP 2013511214 A JP2013511214 A JP 2013511214A
Authority
JP
Japan
Prior art keywords
computer
audio
electronic visual
visual work
cue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012538959A
Other languages
English (en)
Inventor
ヘンシャル,ウィリアム,ラッセル
リュス,グラハム,エドワード
Original Assignee
ダルセッタ・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ダルセッタ・インコーポレイテッド filed Critical ダルセッタ・インコーポレイテッド
Publication of JP2013511214A publication Critical patent/JP2013511214A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/062Combinations of audio and printed presentations, e.g. magnetically striped cards, talking books, magnetic tapes with printed texts thereon
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

電子書籍は、読者が電子書籍を読んでいる間に聴くことができるサウンドトラックを備える。サウンドトラックは、読書体験を添付し拡張し、ここでは読者が、ストーリー又は電子書籍の一部である他の視覚媒体に基づいて一般的に頭の中にイメージを抱く。サウンドトラックの再生は、電子書籍の視覚表示と同期される。音声キューが、テキストの種々のポイントに関連付けられており、これらのキューが、電子書籍とのユーザのインタラクションに基づいて電子書籍の視覚表示と同期して動的に再生される。動的再生は、キューが同期される電子書籍の一部分の持続時間の予測に基づく持続時間を動的再生が有するように音声キューを編集及び再生することを含む。本システムが音声キューの再生を開始すると、システムは、次の音声キューを開始すべき時間を予測する。現在のキューは、予測された持続時間で再生され、次の音声キューへの移行が適切な時間に起動される。
【選択図】 図1

Description

関連出願
(関連出願の相互参照)
本出願は、米国特許法119条に基づき、引用により本明細書に組み込まれる2009年11月10日出願の米国仮特許出願第61/259,995号の優先権及びこの利益を請求する出願である。
電子書籍は、主としてテキストから構成されるマルチメディア作品の一種であるが、グラフィック及び画像などの他の視覚的媒体を含むこともできる。電子書籍におけるテキストは、他の視覚的媒体を添付することができ、一般的には、電子書籍は、必ずしも一度ではなく、最初から最後まで読まれることを意図している。
限定ではないが、種々のタイプのマークアップ言語文書タイプ(例えば、SGML、HTML、XML、LaTex及び同様のものなど)、及びpdfファイル、プレーンテキストファイル、その他のような他のデータファイルタイプを含む、電子書籍で使用される幾つかのファイルフォーマットがある。種々のファイルフォーマットは、Amazon.comのKINDLEリーダなどの電子書籍リーダと共に使用される。このような電子書籍リーダは、一般的に、パーソナルコンピュータ、ノートブックコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、モバイルデバイス又は電子書籍を読み取るための専用ハードウェアシステム(KINDLEリーダなど)のようなプラットフォーム上で実行されるよう設計されたコンピュータプログラムである。
Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing(2005年10月)の会報におけるCecilia Ovesdotter Alm等による「Emotions from text: machine learning for text−based emotion prediction」、579〜586頁
電子書籍は、電子書籍を読んでいる間に読者が聴くことのできるサウンドトラックを備えている。サウンドトラックの目的は、読書体験に同伴し且つこれを増強することであり、ここでは、読者は、一般に、ストーリー又は電子書籍の一部である他の視覚的媒体に基づいて頭の中にイメージを抱く。サウンドトラックの再生は、電子書籍の視覚表示と同期されている。
書籍が読者によって読まれている間にサウンドトラックの再生を電子書籍の視覚表示に同期させることは、困難な問題がある。個人毎に読む速度が異なるので、それぞれ別の時間に異なる速度で読書することになる。電子書籍の一部分の視覚表示の持続時間は、読者毎及び時間によって異なる。換言すると、電子書籍の一部分の視覚表示の持続時間は、電子書籍とのユーザインタラクションに応じて可変である。更に、サウンドトラック、つまり一種の時間依存媒体の再生は、この視覚表示と同期される。
複数の読者に適用可能な方法で良好な読書体験にサウンドトラックを提供するために、音声キューが、テキストの種々のポイントに関連付けられており、これらのキューは、電子書籍とのユーザのインタラクションに基づいて電子書籍の視覚表示と同期して動的に再生される。動的再生は、キューが同期される電子書籍の一部分の持続時間の予測に基づく持続時間を動的再生が有するように音声キューを編集及び再生することを含む。システムが音声キューの再生を開始すると、システムは、次の音声キューを開始すべき時間を予測する。現在のキューは、予測された持続時間で再生され、次の音声キューへの移行が適切な時間に起動される。
このようなサウンドトラックは、一般的に、単に普通の音楽又は音声だけではなく、ある音楽及び音声は、読書体験を拡張する代わりに読者の気を逸らすことができる。或いは、サウンドトラックは、テキストによって呼び起される感情と同様の感情を読者に呼び起こすよう設計された音楽及び音声を含む。一般的には、電子書籍用のサウンドトラックは、明るい瞬間的な音声が少ない、声がない、及び音楽に対する幾らかの予備的な催眠状態のような感覚のときに役立つ。ジャンルに関しては、速すぎるか又は強烈すぎる音楽は、気を逸らし読書するのが難しくなる可能性がある。
種々の態様において、本発明は、コンピュータに実装された処理、機械(電子装置、又は汎用コンピュータ、或いはコンピュータプログラムを実行することができるプラットフォームを提供する他の装置など)、これらの機械によって実行される処理、或いは製造物品において具現化することができる。このような製品は、コンピュータプログラム命令又はコンピュータ可読データが記憶されたコンピュータ可読記憶媒体を収容するコンピュータプログラム製品又はデジタル情報製品、及びこれらの製造物品を生成し使用する処理及び機械を含むことができる。
従って、1つの態様では、音声の動的再生は、電子視覚作品の一部分とのユーザインタラクションに関するデータを受信する段階を含む。電子視覚作品の一部分に関連付けられた再生される音声のセクションは、電子視覚作品とのユーザインタラクションに従って動的に長さが調整される。1つの実施構成では、電子視覚作品の一部分の視覚表示の持続時間は、電子視覚作品の一部分とのユーザインタラクションに関する受信されたデータに従って推定される。電子視覚作品の一部分に関連付けられた音声のサブミックスのシーケンスは、推定された持続時間に一致する音声要素を提供するように選択される。この推定は、読書速度の履歴を使用して行うことができる。
別の態様では、サウンドトラックは、電子視覚作品の表示と同期して再生される。電子視覚作品はメモリ内に受け入れられる。電子視覚作品の一部分をタグに関連付ける情報がメモリ内に受け入れられる。電子視覚作品の一部分は、ユーザインタラクションに応答して表示される。タグの付いた音声ファイルがアクセスされる。電子視覚作品の一部分に関連付けられる音声ファイルは、電子視覚作品の一部分に関連付けられたタグに従って選択される。電子視覚作品の一部分とのユーザインタラクションに関するデータが受信され、電子視覚作品のその特定の部分に関連付けられた音声の再生の持続時間が、ユーザインタラクションに従って動的に調整される。
別の態様では、電子視覚作品用のサウンドトラックが生成される。電子視覚作品は、メモリ内に受け入れられる。電子視覚作品は、電子視覚作品の一部分がタグ付けされた音声ファイルの特定の部分に関連付けるタグでマーク付けされるように、メモリにおいて処理される。次に適切なタグの付いた音声ファイルがアクセスされ、電子視覚作品の一部分に対する目標音声ファイルが選択されて関連付けられ、結果として生じるサウンドトラックを作成し再生する。電子視覚作品は、テキストを含むことができ、処理段階は、テキストを処理する段階を含む。タグは、感情記述子を含むことができる。
別の態様では、キューリストは、電子視覚作品の各部分に対して感情記述子を含み、ここで感情記述子は、音声データにも関連付けられた感情記述子に対応する。
別の態様では、音声キューは、音声データを提供するためにミックスすることができる音楽作品の複数のサブミックス(「ステム」と呼ばれる)に対する音声データと、ステムをどのように繰り返して結合して読者が聴く最終結果を作成できるかを示す情報とを含む。
別の態様では、サウンドトラック及びその関連の電子視覚作品の配信は、サウンドトラックが利用可能でないかのように電子視覚作品を同じ方式で視聴することができるようにして行われる。読者が電子視覚作品にアクセスした後、キューリストが識別されて読み取られる。バックグラウンドタスクとして、音声データは、サウンドトラックにおける第1のキューが電子視覚作品の表示と同期して再生されている間にダウンロードされる。
更に他の態様は、以下の詳細な説明において記載され、本発明のこれらの異なる態様の種々の組合せによって提供される。
動的音声プレーヤを備えた電子書籍リーダを示すデータフロー図である。 図1の動的音声プレーヤの詳細を示すデータフロー図である。 キューリストを示す図である。 音声キューファイルを示す図である。 電子書籍が開かれたときのセットアップ処理を示すフロー図である。 所望持続時間の音声データを作成するために音声キューファイルがどのように使用されるかを示すフロー図である。 読書速度がどのように計算されるかを示すフロー図である。 サウンドトラックを電子書籍に対して自動的に作成することができる方法を示すデータフロー図である。 コンピュータシステムを示すブロック図である。
以下の説明では、実施形態の完全な理解を提供するために特定の詳細事項が与えられている。しかしながら、この実施形態をこれらの特定の詳細事項なしに実施できることは、当業者には理解されるであろう。例えば、ソフトウェアモジュール、機能、回路、その他は、実施形態を不必要に曖昧にしないために、ブロック図で示すことができる。場合によっては、公知のモジュール、構造及び技術は、実施形態を曖昧にしないために詳細には示されていないことがある。
また、実施形態は、フローチャート、フロー図、構造図、又はブロック図として示される処理として記述できる点に留意されたい。フローチャートは、連続した処理として動作を記述することができるが、この動作の多くは、並行して或いは同時に実行することができる。更に、動作の順序は再配列することができる。処理は、その動作が完了したときに終了する。処理は、コンピュータプログラムにおける、方法、機能、手順、サブルーチン、サブプログラム、その他に対応することができる。処理が機能に対応する場合、その終了は、当該機能の呼出し機能又は主機能への復帰に対応する。
以下に説明するシステム及び方法の態様は、限定ではないが、デスクトップ、ラップトップ、ノートブック、タブレット又はモバイルデバイスを含む汎用コンピュータシステム又はコンピュータ装置のいずれのタイプでも動作することができる。「モバイルデバイス」という用語は、限定ではないが、無線装置、移動電話、移動通信装置、ユーザ通信装置、携帯情報端末、移動ハンドヘルドコンピュータ、ラップトップコンピュータ、電子書籍リーダ、及び電子コンテンツを読み取ることができる読取装置、及び/又は一般的に個人によって持ち運ばれ及び/又はある種の通信機能を有する(例えば、無線、赤外線、短距離無線、その他)他のタイプのモバイルデバイスを含む。
図9は、以下で更に詳細に説明するシステム及び方法の1つ又はそれ以上の態様で使用可能なコンピュータシステム900の内部機能アーキテクチャを示すブロック図である。図9に示すように、コンピュータシステム900は、コンピュータ実行可能処理ステップを実行するための中央処理ユニット(CPU)914を含むことができ、コンピュータバス916に相互接続する。図9にはまた、ネットワークインターフェイス918、ディスプレイ装置インターフェイス920、キーボード又は入力インターフェイス922、ポインティングデバイスインターフェイス924、音声インターフェイス926、ビデオインターフェイス932、及びハードディスクドライブ934又は他の永続記憶装置が示されている。
上述のように、ディスク934は、オペレーティングシステムプログラムファイル、アプリケーションプログラムファイル、ウェブブラウザ、及び他のファイルを記憶することができる。これらのファイルの幾つかは、インストールプログラムを使用してディスク934に記憶することができる。例えば、CPU914は、インストールプログラムのコンピュータ実行可能処理ステップを実行することができ、これによって、CPU914は、アプリケーションプログラムを適切に実行することができるようになる。
ランダムアクセスメインメモリ(「RAM」)936もまた、コンピュータバス916に相互接続され、CPU914がメモリ記憶装置へアクセスできるようにすることができる。ディスク934から記憶されたコンピュータ実行可能処理ステップを実行すると、CPU914は、RAM936から処理ステップを記憶し実行する。処理されることになるデータはまた、このようなメモリ936又は記憶装置934から読み取られて、このようなメモリ936又は記憶装置934に記憶することができる。読出し専用メモリ(「ROM」)938は、起動命令シーケンス又はキーボード922の動作のための基本入力/出力オペレーティングシステム(BIOS)シーケンスなどの、不変命令シーケンスを記憶するために設けることができる。
電子書籍リーダ、又は電子書籍及び他のマルチメディア作品の視覚表示を提供するための他のアプリケーションは、図9に示されるようなプラットフォーム上に実装することができる。
以下の説明では、電子書籍及び電子書籍リーダは、一種のマルチメディア作品及びサウンドトラックの再生を同期させることができる対応するビューワの実施例として使用される。作品の一部分の視覚表示の持続時間が作品とのユーザインタラクションに依存するマルチメディア作品の他の種類も、この種類の同期を使用することができる。電子書籍という用語は、主としてテキストであるか、或いはグラフィック又は他の視覚媒体を伴うテキストである、書籍、雑誌、ニュースレター、新聞、定期刊行物、地図、論文、及び他の作品を包含するものとする。
サウンドトラックは、電子書籍を含む多種多様な電子視覚作品のいずれにも関連付けることができる。使用することができる音楽又は音声のタイプは、作品のタイプに依存することになる。例えば、フィクション作品に対しては、サウンドトラックは、映画のサウンドトラックと類似した目的のものとなり、すなわち、サスペンスを創造し、恋愛対象を土台とし、或いは重要なクライマックスに至るようにストーリーを支えるものである。子供向けの本では、音楽は、場合によってはページをめくる時のようなより多くの音響効果を含む、漫画で使用されるものと類似することができる。教科書では、サウンドトラックは、毎分約128又は132ビートで及び重要なモード音調を使用した素材など、知識保持を増強するのに公知のリズム及び調性を含むことができる。瞑想を助けるよう設計された一部の書籍は、自然、周囲の僅かな音楽、柔らかい音調を有する楽器、及び同様のものの音を備えたサウンドトラックを有することができる。旅行書籍は、記載されている場所に固有の音楽及び音を有することができる。雑誌及び新聞では、種々の欄又は記事は、種々のサウンドトラック及び/又は種々のスタイルの音楽を備えることができる。同じページの異なるパスを読む場合でも、異なるサウンドトラックを有することができる。広告主はまた、これらの作品の読書中に再生されるその音声テーマを有することができる。このような場合、サウンドトラックは、テキストベースの広告が他の材料を伴うためにどのように選択されるかに類似した方式で選択することができる。
詳細には、ここで図1を参照すると、電子書籍110が、電子書籍リーダ112に入力され、電子書籍リーダ112は、電子書籍の視覚表示をエンドユーザ又は読者に提供する。電子書籍110は、少なくともテキストを含み、コンピュータプログラムがテキストを読み取り、フォーマット化し、表示できるように設計されたファイルフォーマットである1つ又はそれ以上のコンピュータデータファイルである。限定ではないが、マークアップ言語文書タイプの種々のタイプ(SGML、HTML、XML、LaTex及び同様のものなど)、及び他の文書タイプを含む電子書籍の種々のファイルフォーマットがあり、その実施例には、限定ではないが、EPUB、FictionBook、Plucker、PalmDoc、zTxt、TCR、CHM、RTF、OEB、PDF、mobipocket、Calibre、Stanza、及びプレーンテキストが含まれる。一部のファイルフォーマットは、所有権によって保護されており、専用電子書籍リーダと共に使用されるよう設計されている。本発明は、どのような特定のファイルフォーマットにも限定されない。
電子書籍リーダ112は、図9に関して上述されるようなコンピュータプラットフォーム上で実行されるよう設計されたあらゆるコンピュータプログラムとすることができ、その実施例は、限定ではないが、パーソナルコンピュータ、タブレットコンピュータ、電子書籍を読み取り、電子書籍110のコンテンツを受信して表示するモバイルデバイス又は専用ハードウェアシステムを含む。多くの商用又は公共の電子書籍リーダが存在し、その実施例には、限定ではないが、Amazon.comのKINDLEリーダ、Barnes&NobleのNookリーダ、Stanzaリーダ、及びFBリーダソフトウェア、オープンソースプロジェクトが含まれる。しかしながら、本発明は、いずれの特定の電子書籍リーダにも限定されない。
電子書籍リーダ112はまた、電子書籍リーダ112とのユーザインタラクションを示すデータ114を出力し、これによってこのようなデータを動的音声プレーヤ116が使用することができるようになる。商用又は公共の電子書籍リーダは、これらの出力を提供するために本明細書の説明に従って修正することができる。
テキストとのユーザインタラクションに関するデータは、多種多様な形式で提供することができる。例えば、読み取られる書籍の識別子(ISBN、e−ISBN番号又はハッシュコードなど)、及びテキストにおける現在の位置を提供することができる。一般的には、現在の位置は、表示されている電子書籍の現在の「ページ」又は部分として電子書籍リーダによって追跡される。電子書籍リーダは、この情報が変化したときにこの情報を出力することができる。電子書籍リーダ112によって提供される場合に有用とすることができる他の情報には、限定ではないが、表示されている文書の現在の範囲に対するワードカウント、ユーザが電子書籍リーダアプリケーションを終了させた時間の表示、及びリーダが読書を中断するか或いは中断後に読書を再開したかどうかの表示が含まれる。
電子書籍リーダと動的音声プレーヤとのの間で交換される情報及び命令は、アプリケーションプログラミングインターフェイス(API)を介して実行することができ、これによって、動的音声プレーヤは、電子書籍リーダがステータス情報を提供するか、又はある動作を実行することを要求することができるようになり、或いは、これによって電子書籍リーダが、他のアプリケーションプログラムを制御することができるようになる。動的音声プレーヤは、このAPIも同様に実行するようプログラムすることができる。APIの例示的な実施構成は、限定ではないが、2つのインターフェイス、すなわち、電子書籍リーダアプリケーションからの呼出しのためのインターフェイスと、電子書籍リーダアプリケーションの呼出しのためのもう1つのインターフェイスとを含む。
電子書籍リーダが動的音声プレーヤに対して実施できる例示的な呼出しは、以下を含む。
「ebookOpenedwithUniquelD」−この機能は、アプリケーションが電子書籍を開いたときに電子書籍リーダによって呼び出される。この機能は、電子書籍の固有識別子及び電子書籍が以前に開かれていたかどうかを指定するパラメータを有する。この情報に応答して、動的音声プレーヤは、現在のキューを設定する。電子書籍を最初に開いたときに、現在の位置は、第1キューの開始に設定されることになる。
「ebookClosed」−この機能は、アプリケーションが電子書籍を閉じたときに電子書籍リーダによって呼び出される。この呼び出しに応答して、動的音声プレーヤは、メモリを開放して内部データをリセットすることができる。
「ebookRemoved」−この機能は、電子書籍リーダがライブラリから電子書籍を取り除いたときに呼び出され、これによって、サウンドトラック及び音声ファイルも取り除くことができる。
「displayedPositionRangeChanged」−この機能は、電子書籍リーダが、例えば、ページめくり、向き変更、フォント変更又は同様のものに起因してその表示を変更したときに呼び出され、新しく表示される作品の範囲のパラメータを提供する。この呼び出しに応答して、動的音声プレーヤは、作品の新しく表示される範囲の音声キューを設定することができる。
「readingResumed」−この機能は、電子書籍リーダが、読書が「休止」されていると判定された後、ユーザからの様々な入力(ページめくりコマンドなど)のいずれかを受信することによって検出する、非作動の拡張期間後にユーザが読書を再開したときに呼び出される。
「fetchSoundtrack」−この機能は、特定の固有識別子(この機能のパラメータとして提供される)を有する電子書籍に対して、サウンドトラックファイル、又はキューリストをフェッチ及びインポートするよう動的音声プレーヤに指示するために電子書籍リーダによって呼び出される。
「audio Volume」−この機能は、音声再生の音量を設定するよう動的音声プレーヤに指示するために電子書籍リーダによって呼び出される。
「getCueLists」−この機能は、現在開かれている電子書籍が利用可能なキューリスト及びグループに関する動的音声プレーヤからの情報を検索するために電子書籍リーダによって呼び出される。この機能によって、電子書籍リーダは、例えば、この情報を読者に提示することができる。
「cueListEnabled」−この機能は、特定のキューリスト、例えば、代替えのサウンドトラック、音響効果、記録されたリーダ又はテキスト対音声変換を有効又は無効にするよう動的音声プレーヤに指示するために電子書籍リーダによって呼び出される。
「audioIntensity」−この機能は、例えば、音声合成防音機構を形成又はドラムステム(サブミックス)を消音するために、音声再生の強さを設定するよう動的音声プレーヤに指示するために電子書籍リーダによって呼び出される。
「audioPreloadDefault」−この機能は、一般的に電子書籍をダウンロードし提供し続けるための音声のデフォルト時間数を設定するために呼び出される。
「audioPreloadForEbook」−この機能は、特定の書籍に対してダウンロードし維持するための音声の時間数を設定するために呼び出される。
「downloadEnabled」−この機能は、音声ダウンロードを有効又は無効にするために呼び出される。
動的音声プレーヤが電子書籍リーダに対して行うことができる例示的な呼び出しは以下を含む。
「readingPaused」−この機能は、予想される時間内に電子書籍リーダから「displayedPositionRangeChanged」を受信しなかった場合に動的音声プレーヤによって呼び出される。この情報から、ユーザがもはや読書していないことが動的音声プレーヤによって仮定される。この機能を呼び出した後、電子書籍リーダは、ユーザが再度読書を開始したときに「読書再開」機能を呼び出さなくてはならない。
「gotoPosition」−この機能は、「ebookOpenedAtPath」機能が呼び出されたことに応答して電子書籍が最初に開かれたときに、通常は第1キューの始点に書籍の現在の位置を設定するよう電子書籍リーダに指示するために動的音声プレーヤによって呼び出される。
「wordCountForRange」−この機能は、以下で詳細に説明されるように、プレイリストをスケジュールし読書速度を追跡するのに使用されることになる、電子書籍の指定された範囲に対するワードの数を提供するよう電子書籍リーダに指示するために動的音声プレーヤによって呼び出される。
これらのAPI呼出しの使用は、以下で更に詳細に説明する。
電子書籍110は、テキストの一部分に音声キュー120を関連付ける関連キューリスト118を有し、これは図3に関して以下で更に詳細に説明される。一般に、電子書籍110を固有に識別するのに使用される識別子は、キューリストに識別子を埋め込むか、或いは書籍の識別子をキューリスト118に関連付けるルックアップテーブル又はマップの形式を有することによって、キューリスト118を書籍に関連付けるために使用される。音声キュー120は、音声データを含むコンピュータデータファイルである。一般に、キューリスト118によってテキストの一部分に関連付けられる音声キュー120は、読者がテキストの当該部分を読んでいる間に再生される。例えば、テキストの一部分は、音声キューが再生を開始すべきテキストのポイント、或いは音声キューが再生すべきテキストの範囲によって指示することができる。動的音声プレーヤ116は、1つの音声キューの再生を中止する、及び別の音声キューの再生を開始する時間及び方法を決定する。
動的音声プレーヤ116は、電子書籍リーダ112とのユーザインタラクションに関するデータ114、並びにキュー120及びキューリスト118を受信する。以下で更に詳細に説明するように、動的音声プレーヤ116は、ユーザインタラクションデータ114及びキューリスト118を使用して、再生される音声キュー120、及びこれらを再生する時間及び方法を選択し、出力音声信号122を提供する。
サウンドトラックの再生中、動的音声プレーヤは、テキストとのユーザインタラクションに関するデータに基づいて、現在読まれているテキストの一部分に関連付けられる現在のキューを再生し、再生されることになる次のキューに移行する方法及び時間を決定する。従って、図2に更に詳細に示されるように、動的音声プレーヤ200は、現在のキュー204及び次のキュー210を使用して、音声206を生成する。再生されることになるキュー204及び210は、ユーザインタラクションに関するデータ212及びキューリスト202を使用して、キュールックアップ208を介して決定される。動的音声プレーヤが現在のキュー204を再生している間、動的音声プレーヤは、着信データ212をモニタし、次のキューを再生すべき時間を決定する。現在のキュー204は、キューの実際の持続時間より長い又は短い時間で再生する必要がある。以下で更に詳細に説明するように、動的音声プレーヤは、ユーザがテキストの関連付けられた部分を読書するのに要する時間量に合わせるように現在のキューを長くするか又は短くし、次に、ユーザが次のキューに関連付けられたテキストに到達する推定時間にて、クロスフェードなどの移行を実行する。
ここで図3を参照し、図1のキューリスト118の例示的な実施構成を更に詳細に説明する。音声キュー(例えば、図1の120及び図2の204、210など)は、テキストの一部分に割り当てられている。この割り当ては、テキストの一部分を音声ファイルに関連付けるメタタグ情報ファイルを使用して行うことができる。音声ファイルとの関連付けは、直接又は間接とすることができ、静的又は動的に定義することができる。例えば、テキストの種々の部分には、テキストのこれらの部分に関連付けられる音楽の感情、ムード又はスタイルを示す種々のワード又は他のラベルを割り当てることができる。次に、音声ファイルには、このようなワード又はラベルを関連付けることができる。音声ファイルは、選択してテキストに静的に関連付けることができ、或いは、以下で更に詳細に説明するように、再生時に動的に選択することができる。代替として、テキストにおける種々のポイントに音声ファイルを直接関連付けることができる。
例示的なメタタグ情報ファイルが図3に示されている。メタタグ情報ファイルは、キューを表すデータのペア302のリスト300である。キューを表す各ペア302は、テキスト文書内のマークアップ言語要素へのリファレンスなどのテキストへのリファレンス304、テキスト文書の始めからのオフセット、或いはテキスト文書内の範囲を含む。ペア302はまた、キューを指定するデータ306を含む。このデータは、感情タグなどのワード又はラベル、或いはファイル名などの音声ファイルの表示、或いは音声ファイルを選択するために使用することができるいずれかの他のデータとすることができる。作成者又はコンピュータプログラムがこのようなキューリストをどのように作成できるかを、以下で更に詳細に説明する。
メタタグ情報ファイルは、複数のメタデータファイルを含むアーカイブであるファイルとして実装することができる。これらのファイルは、JavaScript(登録商標) Object Notation(JSON)フォーマットとすることができる。メタタグ情報ファイルは、関連付けられる電子書籍の固有識別子、電子書籍のタイトル、スキーマバージョン(将来フォーマットが変更される場合の互換性目的のため)、及びアーカイブ内の他のファイルのリストなど、サウンドトラックに関する一般情報を完全性チェックのためのチェックサムと共に包含するマニフェストファイルを含むことができる。マニフェストファイルに加えて、メタタグ情報ファイルはまた、サウンドトラックで利用可能なキューリスト記述子のリストを含むキューリストファイルを含む。各キューリスト記述子は、ディスプレイ名、ルックアップ目的のための固有識別子、及びキューリストの任意選択的なグループ名を含む。一実施例として、一回の再生を有することのみ意味する複数の排他的メインキューリストが存在することができる。これらのキューリストは、「メイン」のグループ名を有することができるが、音響効果又は「読み上げ」キューリストによって、これらを同時に全て再生することが承認され、従って、グループ名を利用しないことになる。
メタタグ情報ファイルはまた、キューリストの全てに対するキュー記述子のリストを包含するキューファイルを含む。各キュー記述子は、プロデューサによってキュー記述子に与えられた記述名を含む。この記述子は、この目的で別のアプリケーションを使用して入力することができ、キューファイルのリストにおけるキューファイルの位置を探すのに使用されるキューファイル名などの情報、及び電子書籍における入力及び出力ポイントを含むことができる。
最後に、メタタグ情報ファイルは、キューファイル記述子のリストを含む「キューファイル」ファイルを含む。キューファイルファイルは、キューファイルのネットワーク位置を指定する。各キューファイル記述子は、プロデューサによってキューファイルに与えられ且つキュー記述子におけるキューファイル名として使用される記述名、キューファイルを検索するためのユニフォームリソースロケータ(URL)、及びキューファイルのオリジナルのファイル名を含む。
このようなキューリストで参照される音声キュー(図1の120)は、AIFF、MP3、AAC、m4a又は他のファイルタイプなどの音声ファイルフォーマットで記憶することができる音声データを含む。ここで図4を参照し、音声キューファイルの例示的な実施構成を説明する。音声キューファイル400は、複数の「ステム」(サブミックス)402を含むことができ、この各々は、キューに対する複数部分音声ミックスの1つの部分を提供する別々の音声ファイルである。このようなステムの使用によって、動的音声プレーヤは、キューの再生時間を長くするために繰り返されるステムの中から選択することができる。音声キューファイルはまた、ループマーカ404、バーロケーション406及び推奨されるミックス情報408など、音声キューを再生する持続時間を修正するために動的音声プレーヤに有用な情報を含むことができる。推奨されるミックス情報は、音声ステムを結合するための命令のリストを含み、各命令は、使用されるステム及びセクション、及び適用されるいずれかの音声効果処理を示す。ジャンル、スタイル、楽器、感情、雰囲気、場所、時代を示す音声又はデータによって呼び起こされることが意図された感情又は気分を示すワード又はラベルなどの他の情報(記述子410とも呼ばれる)を提供することもできる。代替キーワード、キュー音量、クロスフェード又はフェード‐イン/アウトの形状/強さ、及び連続するキューに対する推奨される調和級数などの付加的な情報も含むことができる。
一実施例として、音声キューファイルは、JSONフォーマットでのメタデータファイル及びキューのステムに対する1つ又はそれ以上の音声ファイルを包含するアーカイブとして実装することができる。メタデータファイルは、バーロケーション、ループマーカ、推奨されるミックス情報、感情モード(感情コンテンツメタタグ)、音声動特性制御メタデータ(動的範囲圧縮)、楽器、雰囲気、及びジャンルを含む、音声ファイルに関連付けられるメタデータに対する記述子を含む。音声ファイルは、各ステムに対するデータ圧縮音声ファイル及び高解像度オリジナル音声ファイルを含むことができる。各ステムの高解像度版を保存することは、音楽制作ツールを用いた後編集を助ける。オリジナル音声ファイルのない音声キューファイルの複写は、電子書籍リーダへのより小さなダウンロードを可能にするために行うことができる。キューファイルは、エンドユーザアプリケーションにおける再生に使用されるファイルである、ステムに対する圧縮音声ファイルを含む。
キューファイルは、標準的な音声ステムのセットを入力し、別々のテキストファイルとして記述子、ループポイント及び推奨されるミックスメタ情報を追加し、ネットワーク配信のために音声を最適化し圧縮し、更にデータベースにアップロードすることができる単一のパッケージファイルを出力するソフトウェアツールを使用して作成することができる。音声ファイルは、種々の分析技術を使用して分析し、セクション、ビート、ラウドネス情報、フェード、ループポイント、及びリンクを位置付けることができる。キューは、記述子「ジャンル、スタイル、楽器、感情、場所、時代」を使用して選択することができ、読者によって使用されるときにネットワークを通じて配信することができる。
キューリスト及びキューファイルは、別個に暗号化して、そのためのサウンドトラックである特定の作品にリンクさせることができる。作品及びそのサウンドトラックにアクセスするために同じキーが使用される。従って、ファイルは、特定の作品、或いはそれを通じて作品がアクセスされる特定のビューイングデバイスに結び付けることができ、作品に関連付けられたデジタル著作権管理情報を使用することができる。
キューリスト、音声キュー、及び電子書籍リーダによって利用可能なインタラクションに関する前述の理解を得たと前提として、ここで動的音声プレーヤについて図5−7に関して更に詳細に説明する。
読者によって最初に書籍が開かれた(500)ときに再生を開始するために、電子書籍リーダは、書籍の固有識別子とこの書籍が以前開かれたかどうかを示す「ebookOpenedwithUniquelD」機能を呼び出す(502)。動的音声プレーヤは、電子書籍の識別子を受信し(504)、識別された書籍に対するキューリストをダウンロード又は読み取る(506)。電子書籍リーダは、「getCueLists」機能を呼び出す(508)ことによって、キューリストに関する情報を動的音声プレーヤに求める。動的音声プレーヤは、キューリストを送信(510)し、このキューリストを電子書籍リーダがユーザに提示して、書籍用のサウンドトラックの1つ(1つよりも多いサウンドトラックがある場合)を選択する(512)。このような選択は、ユーザがサウンドトラックを格付けできるようにする顧客フィードバック格付けシステムを使用することによって拡張することができ、これらの各付けは、サウンドトラックの選択がシステムによって要求されたときにユーザに表示することができる。次に「cueListEnabled」機能が呼び出され(514)、選択されたキューリストを動的音声プレーヤに通知し、該キューリストは、動的音声プレーヤが機能呼び出しを介して受信する(516)。「fetchSoundtrack」機能が呼び出され(518)、再生のためのキューをフェッチする(520)よう動的音声プレーヤに指示する。
このセットアップ処理が完了した後、動的音声プレーヤは、再生を開始するために開始キュー及びキューリスト、ひいては現在のキューを有する。再生は、電子書籍のこの部分が電子書籍リーダによって表示される時間付近で開始することができる。次に、動的プレーヤは、書籍とのユーザインタラクションに関するデータに基づいて、再生する次のキュー、キューを再生する時間、及び現在のキューから次のキューに移行する方法を決定する。
動的音声プレーヤは、推定総キュー持続時間に合うようにキューの音声ステムファイルの再生時間を延長又は短縮する。この推定キュー持続時間は、幾つかの方法で計算することができる。例示的な実施構成は、読書速度の推定値を使用し、この計算は、以下で更に詳細に説明する。現在のキュー持続時間は、「displayedPositionRangeChanged」機能呼出しを介して全てのページめくりで提供されるような電子書籍リーダとのユーザインタラクションを記述するデータに応答して更新される。
一般的には、キューの音声ステムファイルの再生時間は、音声ステムファイルのセクションを自動的にループすること、個々のステムミックスを変化させること、及びリバーブ、遅延及びコーラスなどの種々の効果を動的に追加することによって修正される。音声ステムファイルに固有のループポイント及び他のミックス自動化データは、キューファイルのメタデータに記憶される。キューファイルには幾つかの異なるループポイントを存在させることができる。音声ステムのセクションは、ループ及びリミックスされたときに、最も効果的で面白い音楽的エンドユーザ経験を提供できるように選択することができる。この処理は、明らかな繰り返しを有する音楽の生成を避け、音声のオリジナル部分の何倍もの持続時間を有することができる音楽的に心地よい結果を提供するように音楽コンテンツを最大化する。次のキューがトリガされたときに、発信及び着信音声間の移行もまた、シームレスな音楽的移行を生成するために適切なクロスフェードのスタイル及び配置を定義するキューファイルメタデータを使用して、同じ処理によって管理される。
一実施例として、キューファイルが4つの音声ステム(メロディトラック、持続和音又は「パッド」トラック、リズムパーカッション(ドラムであることが多い)トラック、及びリズムハーモニートラック)を含むと仮定し、これは、単一のパスで再生される場合に4分間実行されることになる。この記録が3つの別個のセクション、A、B及びCを有すると更に仮定する。キューファイルにおけるメタ情報は以下を含む。
1.以前のキューからキューに移行する方法。これは、移行スタイル(すなわち、スロー、中間又はクイックフェードイン、又はリバーブテールで以前のキューを中止して、キューの始めから新しいキューを開始する)、音楽バー、及びビートマーカを含み、これによってクロスフェードが音楽的にシームレスになる。
2.A、B及びCセクションの各々をループすることができる時間位置。
3.4つのステムをどのようにリミックスできるかに関するキュープロデューサの入力。例えば、セクションAだけを使用してステム1、2及び3を再生し、次にセクションAだけを使用してステム1、3及び4を再生し、ステム3にリバーブを追加し、更にセクションBを使用して単独で再生し、次いでセクションBからステム3及び4を再生するなどである。これらの種類の命令を有することは、音声の典型的な4分間部分を、明らかな繰り返しなしに40分又はそれ以上まで延長できることを意味する。更に、各ミックスは、ユーザにとって固有であり、サウンドトラックの許可されていない複製がより困難であるように再生時間に作成される。
一実施例として、ここで図6を参照し、この処理を更に詳細に説明する。キュー及び開始ポイントが与えられると、次のキューが再生されることになる持続時間が決定される(600)。この持続時間を計算するための例示的な方法を以下で更に詳細に提供する。持続時間が与えられると、キュー製作者の入力が処理され、所望の持続時間のプレイリストを作成する。換言すると、リミックス情報における第1の指示が選択され(602)、プレイリストに追加される。音声ステムのこのセクションが、符号604で決定された所望の持続時間よりも短い持続時間を有する場合、次の指示が選択され(606)、所望持続時間のプレイリストが終了する(608)まで処理が繰り返される。キューの最後において、次のキューについてのメタデータの移行情報を用いて、現在のプレイリストにおける開始ポイントを選択(610)し、現在のキューから次のキューへのクロスフェードを実施する。
キューの持続時間を推定する1つの方法は、読者の読書速度(1分当たりのワード単位で)を推定し、キューにおけるワード数が与えられた場合、読者が書籍のこの部分を読み終わるのに要するであろう時間を決定することである。この推定値は、読者に対する読書速度情報の履歴から計算することができる。
ユーザが書籍を読み始めたときに、1分当たりの特定数のワードである初期読書速度が仮定される。この初期速度は、以前の書籍の読書によるユーザの以前の読書速度履歴に関する多種多様なデータから計算することができ、このようなデータは、著者毎、ジャンル毎、一日の時間毎、場所毎、及び全ての書籍にわたって編成することができる。以前の読書履歴が利用可能でない場合、他のユーザがこのタイトルをどのように読書たかという匿名のグローバル集計を使用することができる。他の履歴が利用可能でない場合、1分当たり400ワードの一般的平均値が使用される。
ここで図7を参照すると、ユーザの読書速度は、「displayedPositionRangeChanged」機能呼出しによって示されるように、表示された位置範囲が変更される度に追跡される。この機能呼出しが受信された(700)場合、幾つかの条件がチェックされる(702)。これらの条件は、限定ではなく、必須でもないが、ユーザがアクティブに読書している、すなわち読書中断状態ではない、新しい表示された位置範囲が以前に表示された位置範囲よりも大きい、新しく表示された位置範囲の開始が以前に表示された位置範囲の最後に接する、及びワードカウントが最小数(現在のところ150ワード)を上回ることを含むことができる。また、最後の変化からの経過時間は、速度が正常な予想分散内にあるかどうかをチェックするための平均読書速度の標準偏差のような実用的範囲内になくてはならない。これらの条件が満足された場合、現在の時間が記録される(704)。表示される位置範囲への最後の変化からの経過時間は、以前に表示された位置範囲に対するワードカウントと共に計算されて記憶される(706)。このセクションにおける読書速度が計算される(708)。測定された読書速度のこの履歴データから、平均読書速度を計算し使用して、キュー持続時間を推定することができる。
ページpに対する読書速度Sp(1秒当たりのワードの単位)を計算するための式は以下の通りである。
Figure 2013511214
ここで、Wpはページに対するワードカウント、Tpは秒単位のページを読むのに必要な時間である。1つの実施構成では、平均読書速度に使用される統計値は、20周期指数移動平均(EMA)であり、これは、速度変動を平滑にし、同時に最新のページ速度をより重要であると考える。
EMAを計算するための式は以下の通りである。
Figure 2013511214
Figure 2013511214
ここで、nは周期数、すなわち20である。
読書速度の変動を計算するために、発明者らは、最後の20値にわたって変動を計算するためのWelfordの方法を用いている。
1=T1及びS1=0を初期化する。
Tの次の値に対して以下の再帰式を使用する。
Figure 2013511214
Figure 2013511214
≦k≦nの場合、変数の第k推定値は以下の通りである。
Figure 2013511214
この読書速度情報は、ユーザの電子書籍リーダアプリケーションプラットフォーム上にローカルで記憶することができる。複数のユーザについてのこのような情報は、コンパイルして匿名方式でサーバ上に記憶することができる。本アプリケーションは、読書速度情報統計値を調べ、他者が作品或いは作品の一部をどのくらいの速度で読んだかを判定することができる。
読書速度の代わりに、或いはこれに加えて他のタイプのユーザインタラクションを使用して、再生を制御することができる。
1つの実施構成では、電子書籍とのユーザインタラクションに関するデータは、読者が書籍内のあるポイントから読書を始めたことを示す。このことは、一般的には読者は最初から最後まで書籍を一回で読み終わることはないので、頻繁に起こることである。場合によっては、読者が書籍内のあるポイントで読書を再開したとき、そのポイントにおけるサウンドトラックの音声レベル、或いは音声の「興奮」の他のレベルが適切でない可能性がある。すなわち、音声は、実際には、そのポイントで気持ちが逸らされる可能性がある。動的音声プレーヤは、現在の読書位置を含む書籍の一部に対して選択されている音声キューから代わりの音声キューを選択する機会として、書籍内のある位置から読者が読書を始めたという表示を使用することができる。
別の実施例として、読者は、セクションからセクションにスキップすることによって書籍を読むことができる。他のマルチメディア作品は、このような読書方式を促進することができる。このような場合、作品のセクションに関連付けられた音声キューが、そのセクションの表示が開始されたときに再生される。以前に表示されたセクションの音声から新しく表示されるセクションに対する音声への簡素なクロスフェードを実行することができる。一部の用途では、作品の性質が、いずれの特定のセクションのビューイング時間も予測しにくいようなものである場合、動的再生エンジンは、単に持続時間が不定であると推測することができ、別の音声キューを始めるための指示が受信されるまでキューファイルにおける指示に基づいて音声の生成を続けることができる。
別の実施例として、ユーザ入力に応答してキューファイルの種々のセクションを再生するために音声キューファイルを使用することができる。例えば、ポピュラーソングを幾つかのセクションに分割することができる。音声再生を制御するためのユーザインターフェイスを設けて、ユーザ入力に応答してプレーヤに次のセクション又は指定セクションにジャンプするよう指示することができる。
このような作品及びそれに伴うサウンドトラックをどのように作成できるかを説明してきたが、ここでこれらの配信を説明する。
電子書籍のサウンドトラックを作成する段階は、音声ファイルを電子書籍のテキストの一部分に関連付ける段階を含む。サウンドラックを作成できる幾つかの方法がある。
1つの実施構成では、作曲家が、テキストの各部分に対するオリジナル音楽を作曲し記録する。テキストの各部分は、そのようにして作曲及び記録される個々の音声ファイルに関連付けることができる。代替として、以前に記録された音楽を選択し、テキストの一部分に直接関連付けることができる。これらの実施構成では、音声ファイルは、テキストの一部分に静的及び直接的に割り当てられる。
別の実施構成では、音声ファイルは、テキストの一部分に間接的に割り当てられる。ワード又は他のラベルなどのタグが、テキストの一部分に関連付けられる。このようなタグは、コンピュータデータファイル又はデータベース内に記憶され、上述されたキューリストと同様に電子書籍に関連付けることができる。対応するタグはまた、音声ファイルに関連付けられる。1人又はそれ以上の作曲家が、特定の感情又は気分を呼び起こすことを意図したオリジナル音楽を作曲し記録する。代替として、以前に記録された音楽を選択することができる。これらの音声ファイルはまた、このようなタグに関連付けられ、データベース内に記憶することができる。テキストの一部分に関連付けられたタグを使用して、同じタグを有する対応する音声ファイルを自動的に選択することができる。書籍の1つのタグに対して複数の音声ファイルが識別された場合、コンピュータによって或いは人間の介入によって音声ファイルの1つを選択することができる。この実施構成によって、音声ファイルをデータベースに集めることができ、電子書籍及び音声ファイルに関連付けられたタグが与えられた場合に、音声ファイルを選択する処理を自動化することによってサウンドトラックの作成を半自動的に完了させることができる。
音声ファイルが電子書籍に間接的に関連付けられる実施構成では、音声ファイルは、再生に近い時間のタグを使用して動的に選択することができる。
タグを電子書籍に関連付ける処理はまた自動化することができる。詳細には、コンピュータによってテキストを処理し、テキストのワードの意味分析に基づいて感情記述子をテキストの一部分に関連付けることができる。このような意味分析についての例示的な技術は、限定ではないが、引用により本明細書に組み込まれる、Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing(2005年10月)の会報におけるCecilia Ovesdotter Alm等による「Emotions from text: machine learning for text−based emotion prediction」、579〜586頁に記載されるものを含む。これらのタグは、視聴している作品のセクションを支援する感情的感覚又は他の感情を記述することができる。例えば、これらの感情的感覚は、限定ではないが、「中間的な緊張状態」、「恋愛対象」、「緊張状態」、「陽気な」、「男性的な」、「暗い」、「陰気な」、「幽霊のような」、「幸福な」、「悲しい」、「切ない」、「セクシーな瞬間」、「明るい」及び「快活な」を含むことができる。
図8は、タグが関連付けられた音声ファイルを仮定して、電子書籍のためのサウンドトラックを作成するための完全自動化処理の実施例を示すデータフロー図である。電子書籍800は、書籍の感情記述子及びテキスト範囲804を出力する感情記述子生成器802に入力される。感情記述子は、音声データベース806において、書籍の各範囲に対する感情記述子に一致する音声ファイル810を探すのに使用される。音声セレクタ808は、各テキスト範囲に対する音声ファイルの自動化された、ランダムな、或いは半自動化された選択を可能にし、キューリスト812を生成する。電子書籍に対して固有識別子が生成され、キューリスト812と共に記憶することができる。
このような電子書籍及びそのサウンドトラックは、限定ではないが、電子書籍の商用配信のために現在使用されている方法を含む、多種多様な方法のいずれかで配信することができる。1つの実施構成では、電子書籍及び電子書籍リーダは、従来の技術を使用してエンドユーザに配信される。付加的なサウンドトラック及び動的音声プレーヤの配信は、別々に完了される。サウンドトラックの配信は、一般的には2つのステップで完了され、最初にキューリストがダウンロードされ、次いで各音声ファイルがダウンロードされる。音声ファイルはオンデマンドでダウンロードすることができる。動的音声プレーヤは、電子書籍リーダが作動する同じデバイス上に記憶することができ、或いは遠隔で記憶することができる利用可能なキューファイルに関する情報を維持するファイルマネージャを含むことができる。
1つの実施構成では、電子書籍は、キューリスト及び動的音声プレーヤと共にエンドユーザに配信される。
別の実施構成では、電子書籍及びその関連のキューリストが一緒に配信される。次に、キューリストを用いて、バックグラウンドタスクとしてサウンドトラック用の音声ファイルをダウンロードする。1つの実施構成では、電子書籍が最初にダウンロードされて、キューリストのダウンロードがバックグラウンドタスクとして起動され、次に、第1キューに対する第1音声ファイルが直ちにダウンロードされる。
別の実施構成では、電子書籍リーダは、キューリストに従って再生のために選択することができる多種多様な感情記述子を有するローカルの汎用キューを含むローカル記憶装置を備えたデバイスである。これらの汎用キューは、リモート音声ファイルが利用できなくなった場合に音声の再生を可能にする。
1つの実施構成では、電子書籍リーダアプリケーションが、電子媒体の配信者とそれを介して通信することができるインターネットなどのネットワークへのアクセスが可能なプラットフォーム上にロードされる。このような配信者は、電子媒体を購入及び/又はダウンロードする要求をユーザから受信することができる。要求を受信した後、配信者は、データベースから要求された作品及びそれに伴うサウンドトラック情報を検索することができる。検索された電子書籍は暗号化され、電子書籍リーダアプリケーションのユーザに送信することができる。電子媒体は、電子媒体が単一の電子書籍リーダでのみ再生できるように暗号化することができる。一般的には、作品に関連付けられたデジタル著作権管理情報もまたサウンドトラック情報に加えられる。
上記において、記憶媒体は、読出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク記憶媒体、光学記憶媒体、フラッシュメモリ装置及び/又は情報を記憶するための他の機械可読媒体を含む、データを記憶するための1つ又はそれ以上の装置を表すことができる。「機械可読媒体」及び「コンピュータ可読媒体」という用語は、限定ではないが、携帯式又は固定記憶装置、光学記憶装置、及び/又は、命令及び/又はデータを記憶、包含、又は保持することができる種々の他の媒体を含む。
更に、実施形態は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、又はこれらのいずれかの組合せによって実施することができる。ソフトウェア、ファームウェア、ミドルウェア又はマイクロコードで実施されたときに、必要なタスクを実行するためのプログラムコード又はコードセグメントは、記憶媒体又は他の記憶装置などの機械可読媒体内に記憶することができる。プロセッサは、必要なタスクを実行することができる。コードセグメントは、手順、機能、サブプログラム、プログラム、ルーチン、サブルーチン、モジュール、ソフトウェアパッケージ、クラス、或いは、命令、データ構造、又はプログラム命令文のいずれかの組合せを表すことができる。コードセグメントは、情報、データ、引数、パラメータ、又はメモリコンテンツの受け渡し及び/又は受信によって、別のコードセグメント又はハードウェア回路に結合することができる。情報、引数、パラメータ、データなどは、メモリ共有、メッセージ受け渡し、トークン受け渡し、ネットワーク送信などを含む、いずれかの適切な手段を介して受け渡し、転送、又は送信を行うことができる。
本明細書で開示される実施例に関して説明された種々の例示的な論理ブロック、モジュール、回路、要素、及び/又は構成要素は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)又は他のプログラム可能論理構成要素、離散的ゲート又はトランジスタ論理回路、離散的ハードウェア構成要素、或いは本明細書で説明される機能を実行するよう設計されたこれらのいずれかの組合せによって実施又は実行することができる。汎用プロセッサは、マイクロプロセッサとすることができるが、代替として、プロセッサは、いずれかの従来のプロセッサ、コントローラ、マイクロコントローラ、回路、及び/又は状態機械とすることができる。プロセッサはまた、コンピュータ構成要素の組合せ、例えば、DSPとマイクロプロセッサの組合せ、幾つかのマイクロプロセッサ、DSPコアに連結した1つ又はそれ以上のマイクロプロセッサ、或いは他のいずれかのこのような構成として実装することができる。
本明細書で開示された実施例に関して説明された方法又はアルゴリズムは、ハードウェアにおいて、プロセッサによって実行可能なソフトウェアモジュールにおいて、或いは両方の組合せにおいて、処理ユニット、プログラミング命令、又は他の指示の形式で直接具現化することができ、単一の装置に包含するか、或いは複数の装置にわたって分散させることができる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバルディスク、CD−ROM、或いは当該技術分野で公知の記憶媒体の他のいずれかの形式で備えることができる。記憶媒体は、プロセッサに結合することができ、これによって、プロセッサは、記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができる。代替として、記憶媒体は、プロセッサに一体化してもよい。
図に示された構成要素及び機能の1つ又はそれ以上は、単一の構成要素に再構成及び/又は結合することができ、或いは本発明から逸脱することなく幾つかの構成要素に実装することができる。付加的な要素又は構成要素を本発明から逸脱することなく追加することもできる。更に、本明細書で説明された特徴は、ソフトウェア、ハードウェアにおいて、ビジネス方法として、及び/又はこれらの組合せで実施することができる。
特定の例示的な実施形態を説明し添付の図面に示してきたが、このような実施形態は、単に例証として提示され、広範囲な本発明を限定するものではなく、当業者には種々の他の修正形態が想起できるので、本発明は、図示され説明される特定の構造及び構成に限定されない点を理解されたい。
110 電子書籍
112 電子書籍リーダ
114 ユーザインタラクション情報
116 動的音声プレーヤ
118 キューリスト
120 キュー
122 音声出力

Claims (9)

  1. 音声の動的再生のためのコンピュータに実装された方法であって、
    電子視覚作品の一部分とのユーザインタラクションに関するデータを受信する段階と、
    前記ユーザインタラクションに従って前記電子視覚作品の一部分に関連付けられる音声の再生の持続時間を動的に調整する段階と、
    を含む、コンピュータに実装された方法。
  2. 前記電子視覚作品の一部分とのユーザインタラクションに関する前記受信されたデータに従って、前記電子視覚作品の一部分の視覚表示のための持続時間を推定する段階と、
    前記電子視覚作品の一部分に関連付けられた音声のステムのミックスのシーケンスを選択し、音声に前記推定された持続時間を提供するようにする段階と、
    を更に含む、請求項1に記載のコンピュータに実装された方法。
  3. 前記持続時間は、読書速度の履歴を使用して推定される、請求項2に記載のコンピュータに実装された方法。
  4. 電子視覚作品の表示と同期してサウンドトラックを再生するためのコンピュータに実装された方法であって、
    前記電子視覚作品をメモリ内に受け入れる段階と、
    前記電子視覚作品の一部分にタグを関連付ける情報をメモリ内に受け入れる段階と、
    ユーザインタラクションに応答して前記電子視覚作品の一部分を表示する段階と、
    タグの付いた音声ファイルにアクセスする段階と、
    前記プロセッサを使用して、前記電子視覚作品の一部分に関連付けられたタグに従って前記電子視覚作品の一部分に関連付けられる音声ファイルを選択する段階と、
    前記電子視覚作品の一部分とのユーザインタラクションに関するデータを受信する段階と、
    前記ユーザインタラクションに従って前記電子視覚作品の一部分に関連付けられた音声の再生の持続時間を動的に調整する段階と、
    を含む、コンピュータに実装された方法。
  5. 電子視覚作品用のサウンドトラックを生成するためのコンピュータに実装された方法であって、
    前記電子視覚作品をメモリ内に受け入れる段階と、
    プロセッサによって、前記メモリ内の前記電子視覚作品を処理し、メモリにおいてタグを前記電子視覚作品の一部分に関連付けることによって前記電子視覚作品の一部分にマーク付けする段階と、
    タグの付いた音声ファイルにアクセスする段階と、
    前記プロセッサを使用して、前記電子視覚作品の一部分に関連付けられたタグに従って前記電子視覚作品の一部分に対する音声ファイルを選択する段階と、
    を含む、コンピュータに実装された方法。
  6. 前記電子視覚作品がテキストを含み、前記処理段階が、前記テキストを処理する段階を含む、請求項5に記載のコンピュータに実装された方法。
  7. 前記タグが感情記述子を含む、請求項6に記載のコンピュータに実装された方法。
  8. デジタル情報製品であって、
    コンピュータ可読媒体と、
    前記コンピュータ可読媒体に記憶されたコンピュータ可読データと、
    を備え、前記コンピュータ可読データは、コンピュータによって処理されたときに前記コンピュータによって翻訳されて、電子視覚作品の各部分に対して感情記述子を有するキューリストを含むコンピュータ可読ファイルを定義し、前記感情記述子が、音声データにも関連付けられた感情記述子に対応する、デジタル情報製品。
  9. デジタル情報製品であって、
    コンピュータ可読媒体と、
    前記コンピュータ可読媒体に記憶されコンピュータ可読データと、
    を備え、前記コンピュータ可読データは、コンピュータによって処理されたときに前記コンピュータによって翻訳されて、ミックスして音声データを提供できる複数のステムの音声データとステムをどのように繰り返して結合できるかを示す及び情報とを含む、音声キューを定義するデータを有するコンピュータ可読ファイルを定義する、デジタル情報製品。
JP2012538959A 2009-11-10 2010-11-10 電子視覚作品のためのサウンドトラックの動的音声再生 Pending JP2013511214A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US25999509P 2009-11-10 2009-11-10
US61/259,995 2009-11-10
PCT/US2010/056281 WO2011060106A1 (en) 2009-11-10 2010-11-10 Dynamic audio playback of soundtracks for electronic visual works

Publications (1)

Publication Number Publication Date
JP2013511214A true JP2013511214A (ja) 2013-03-28

Family

ID=43868382

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012538959A Pending JP2013511214A (ja) 2009-11-10 2010-11-10 電子視覚作品のためのサウンドトラックの動的音声再生

Country Status (6)

Country Link
US (2) US8527859B2 (ja)
EP (1) EP2499626A1 (ja)
JP (1) JP2013511214A (ja)
KR (1) KR20120091325A (ja)
CN (1) CN102687182A (ja)
WO (1) WO2011060106A1 (ja)

Cited By (174)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014519058A (ja) * 2011-06-03 2014-08-07 アップル インコーポレイテッド テキストデータとオーディオデータとの間のマッピングの自動作成
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9535906B2 (en) 2008-07-31 2017-01-03 Apple Inc. Mobile device having human language translation capability with positional feedback
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US9633674B2 (en) 2013-06-07 2017-04-25 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9798393B2 (en) 2011-08-29 2017-10-24 Apple Inc. Text correction processing
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US10568032B2 (en) 2007-04-03 2020-02-18 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10607140B2 (en) 2010-01-25 2020-03-31 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10643611B2 (en) 2008-10-02 2020-05-05 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10789945B2 (en) 2017-05-12 2020-09-29 Apple Inc. Low-latency intelligent automated assistant
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US11023513B2 (en) 2007-12-20 2021-06-01 Apple Inc. Method and apparatus for searching using an active ontology
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US12010262B2 (en) 2013-08-06 2024-06-11 Apple Inc. Auto-activating smart responses based on activities from remote devices
US12014118B2 (en) 2017-05-15 2024-06-18 Apple Inc. Multi-modal interfaces having selection disambiguation and text modification capability

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5816085B2 (ja) 2008-07-04 2015-11-17 ブックトラック ホールディングス リミテッド サウンドトラックを作成してプレイする方法及びシステム
KR101702659B1 (ko) * 2009-10-30 2017-02-06 삼성전자주식회사 동영상 콘텐츠와 전자책 콘텐츠의 동기화 장치와 방법 및 시스템
US20130297599A1 (en) * 2009-11-10 2013-11-07 Dulcetta Inc. Music management for adaptive distraction reduction
US8527859B2 (en) * 2009-11-10 2013-09-03 Dulcetta, Inc. Dynamic audio playback of soundtracks for electronic visual works
US20120001923A1 (en) * 2010-07-03 2012-01-05 Sara Weinzimmer Sound-enhanced ebook with sound events triggered by reader progress
KR101058268B1 (ko) * 2010-08-03 2011-08-22 안명환 비가독부를 구비한 이동단말기
US9535884B1 (en) 2010-09-30 2017-01-03 Amazon Technologies, Inc. Finding an end-of-body within content
US9645986B2 (en) 2011-02-24 2017-05-09 Google Inc. Method, medium, and system for creating an electronic book with an umbrella policy
US8935259B2 (en) 2011-06-20 2015-01-13 Google Inc Text suggestions for images
EP2737481A4 (en) * 2011-07-26 2016-06-22 Booktrack Holdings Ltd TONGUE FOR ELECTRONIC TEXTS
US8612584B2 (en) * 2011-08-29 2013-12-17 Google Inc. Using eBook reading data to generate time-based information
US9141404B2 (en) 2011-10-24 2015-09-22 Google Inc. Extensible framework for ereader tools
US20130117670A1 (en) * 2011-11-04 2013-05-09 Barnesandnoble.Com Llc System and method for creating recordings associated with electronic publication
GB2510744A (en) * 2011-11-04 2014-08-13 Barnesandnoble Com Llc System and method for creating recordings associated with electronic publication
US9031493B2 (en) 2011-11-18 2015-05-12 Google Inc. Custom narration of electronic books
US20130131849A1 (en) * 2011-11-21 2013-05-23 Shadi Mere System for adapting music and sound to digital text, for electronic devices
US9229231B2 (en) 2011-12-07 2016-01-05 Microsoft Technology Licensing, Llc Updating printed content with personalized virtual data
US9183807B2 (en) 2011-12-07 2015-11-10 Microsoft Technology Licensing, Llc Displaying virtual data as printed content
US9182815B2 (en) 2011-12-07 2015-11-10 Microsoft Technology Licensing, Llc Making static printed content dynamic with virtual data
US9213705B1 (en) 2011-12-19 2015-12-15 Audible, Inc. Presenting content related to primary audio content
EP2608002A1 (en) * 2011-12-21 2013-06-26 France Telecom Method for determining a reading speed of a section of an electronic content
US20130268826A1 (en) * 2012-04-06 2013-10-10 Google Inc. Synchronizing progress in audio and text versions of electronic books
US9165381B2 (en) 2012-05-31 2015-10-20 Microsoft Technology Licensing, Llc Augmented books in a mixed reality environment
US8933312B2 (en) * 2012-06-01 2015-01-13 Makemusic, Inc. Distribution of audio sheet music as an electronic book
US9141257B1 (en) * 2012-06-18 2015-09-22 Audible, Inc. Selecting and conveying supplemental content
US9535885B2 (en) 2012-06-28 2017-01-03 International Business Machines Corporation Dynamically customizing a digital publication
US20140040715A1 (en) * 2012-07-25 2014-02-06 Oliver S. Younge Application for synchronizing e-books with original or custom-created scores
CN103680562B (zh) * 2012-09-03 2017-03-22 腾讯科技(深圳)有限公司 音频文件的布点实现方法和装置
US9047356B2 (en) 2012-09-05 2015-06-02 Google Inc. Synchronizing multiple reading positions in electronic books
US9544204B1 (en) * 2012-09-17 2017-01-10 Amazon Technologies, Inc. Determining the average reading speed of a user
US9575960B1 (en) * 2012-09-17 2017-02-21 Amazon Technologies, Inc. Auditory enhancement using word analysis
US9123053B2 (en) 2012-12-10 2015-09-01 Google Inc. Analyzing reading metrics to generate action information
CN103020226A (zh) * 2012-12-12 2013-04-03 北京百度网讯科技有限公司 一种获取搜索结果的方法和装置
US20140173441A1 (en) * 2012-12-19 2014-06-19 Hcl Technologies Limited Method and system for inserting immersive contents into eBook
US9900720B2 (en) * 2013-03-28 2018-02-20 Dolby Laboratories Licensing Corporation Using single bitstream to produce tailored audio device mixes
CN104168174A (zh) * 2013-05-16 2014-11-26 阿里巴巴集团控股有限公司 一种传输信息的方法及装置
US9317486B1 (en) 2013-06-07 2016-04-19 Audible, Inc. Synchronizing playback of digital content with captured physical content
US9836271B2 (en) 2013-07-17 2017-12-05 Booktrack Holdings Limited Delivery of synchronised soundtracks for electronic media content
US9898077B2 (en) 2013-09-18 2018-02-20 Booktrack Holdings Limited Playback system for synchronised soundtracks for electronic media content
US20150269133A1 (en) * 2014-03-19 2015-09-24 International Business Machines Corporation Electronic book reading incorporating added environmental feel factors
US10049477B1 (en) 2014-06-27 2018-08-14 Google Llc Computer-assisted text and visual styling for images
CN104166689B (zh) * 2014-07-28 2018-04-06 小米科技有限责任公司 电子书籍的呈现方法及装置
US20160182435A1 (en) * 2014-12-23 2016-06-23 Sony Corporation Socially acceptable display of messaging
CN105261374A (zh) * 2015-09-23 2016-01-20 海信集团有限公司 跨媒体的情感关联方法和系统
US20170116047A1 (en) * 2015-10-25 2017-04-27 Khozem Z. Dohadwala Further applications of Reading State control - A method for repositioning reading material on electronic devices
CN106708894B (zh) * 2015-11-17 2019-12-20 腾讯科技(深圳)有限公司 电子书配置背景音乐的方法和装置
US10261963B2 (en) * 2016-01-04 2019-04-16 Gracenote, Inc. Generating and distributing playlists with related music and stories
US10042880B1 (en) * 2016-01-06 2018-08-07 Amazon Technologies, Inc. Automated identification of start-of-reading location for ebooks
US20180032305A1 (en) * 2016-07-29 2018-02-01 Paul Charles Cameron Systems and methods for automatic-creation of soundtracks for text
US20180032611A1 (en) * 2016-07-29 2018-02-01 Paul Charles Cameron Systems and methods for automatic-generation of soundtracks for live speech audio
US10698951B2 (en) 2016-07-29 2020-06-30 Booktrack Holdings Limited Systems and methods for automatic-creation of soundtracks for speech audio
CN106960051B (zh) * 2017-03-31 2019-12-10 掌阅科技股份有限公司 基于电子书的音频播放方法、装置和终端设备
CN110998726B (zh) * 2017-06-29 2021-09-17 杜比国际公司 用于使外部内容适配视频流的方法、系统和计算机可读媒体
CN109543671B (zh) * 2018-09-30 2021-03-02 阿里巴巴(中国)有限公司 点读方法、点读笔、服务器数据处理方法及点读系统
CN109493839B (zh) * 2018-11-12 2024-01-23 平安科技(深圳)有限公司 基于语音合成的空气质量展示方法、装置及终端设备
CN109994000B (zh) * 2019-03-28 2021-10-19 掌阅科技股份有限公司 一种伴读方法、电子设备及计算机存储介质
US12051133B2 (en) * 2021-06-01 2024-07-30 Apple Inc. Color treatment and color normalization for digital assets

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4305131A (en) * 1979-02-05 1981-12-08 Best Robert M Dialog between TV movies and human viewers
US5484292A (en) * 1989-08-21 1996-01-16 Mctaggart; Stephen I. Apparatus for combining audio and visual indicia
US5209665A (en) * 1989-10-12 1993-05-11 Sight & Sound Incorporated Interactive audio visual work
JP3120085B2 (ja) * 1991-11-21 2000-12-25 株式会社セガ 電子装置及び情報担体
US5437552A (en) * 1993-08-13 1995-08-01 Western Publishing Co., Inc. Interactive audio-visual work
US5649234A (en) * 1994-07-07 1997-07-15 Time Warner Interactive Group, Inc. Method and apparatus for encoding graphical cues on a compact disc synchronized with the lyrics of a song to be played back
US6199076B1 (en) * 1996-10-02 2001-03-06 James Logan Audio program player including a dynamic program selection controller
US5897324A (en) * 1997-02-03 1999-04-27 Atop Technologies, Inc. Multimedia-book operable with removable data storage media implemented with universal interfacing book-adapting processor
US6424996B1 (en) * 1998-11-25 2002-07-23 Nexsys Electronics, Inc. Medical network system and method for transfer of information
US6529920B1 (en) * 1999-03-05 2003-03-04 Audiovelocity, Inc. Multimedia linking device and method
US7149690B2 (en) * 1999-09-09 2006-12-12 Lucent Technologies Inc. Method and apparatus for interactive language instruction
US6598074B1 (en) * 1999-09-23 2003-07-22 Rocket Network, Inc. System and method for enabling multimedia production collaboration over a network
WO2001091028A1 (en) * 2000-05-20 2001-11-29 Leem Young Hie On demand contents providing method and system
US7478047B2 (en) * 2000-11-03 2009-01-13 Zoesis, Inc. Interactive character system
FI20002828A (fi) * 2000-12-22 2002-06-23 Nokia Corp Menetelmä ja järjestelmä tunnetilan ilmaisemiseksi puhelimella tapahtuvassa viestinnässä
US20060292049A1 (en) * 2003-09-04 2006-12-28 Tetsuya Nagasaka Process for producing rutile
US20050186548A1 (en) * 2004-02-25 2005-08-25 Barbara Tomlinson Multimedia interactive role play system
NO320758B1 (no) * 2004-07-23 2006-01-23 Telenor Asa Anordning og fremgangsmate for gjengivelse av audiovisuelt innhold
US7735012B2 (en) * 2004-11-04 2010-06-08 Apple Inc. Audio user interface for computing devices
US20080141180A1 (en) * 2005-04-07 2008-06-12 Iofy Corporation Apparatus and Method for Utilizing an Information Unit to Provide Navigation Features on a Device
US20080120342A1 (en) * 2005-04-07 2008-05-22 Iofy Corporation System and Method for Providing Data to be Used in a Presentation on a Device
JP4382045B2 (ja) * 2006-01-24 2009-12-09 シャープ株式会社 データ出力装置、データ出力方法、データ出力プログラム、および記録媒体
US7790974B2 (en) * 2006-05-01 2010-09-07 Microsoft Corporation Metadata-based song creation and editing
US20100149933A1 (en) 2007-08-23 2010-06-17 Leonard Cervera Navas Method and system for adapting the reproduction speed of a sound track to a user's text reading speed
WO2009086308A1 (en) 2007-12-21 2009-07-09 Booksync, Llc Method and apparatus for integrating audio and/or video with a book
JP5816085B2 (ja) * 2008-07-04 2015-11-17 ブックトラック ホールディングス リミテッド サウンドトラックを作成してプレイする方法及びシステム
US9386139B2 (en) * 2009-03-20 2016-07-05 Nokia Technologies Oy Method and apparatus for providing an emotion-based user interface
US20100332225A1 (en) * 2009-06-29 2010-12-30 Nexidia Inc. Transcript alignment
US8527859B2 (en) * 2009-11-10 2013-09-03 Dulcetta, Inc. Dynamic audio playback of soundtracks for electronic visual works
US20110153330A1 (en) * 2009-11-27 2011-06-23 i-SCROLL System and method for rendering text synchronized audio
US8634701B2 (en) * 2009-12-04 2014-01-21 Lg Electronics Inc. Digital data reproducing apparatus and corresponding method for reproducing content based on user characteristics
US8564421B2 (en) * 2010-04-30 2013-10-22 Blackberry Limited Method and apparatus for generating an audio notification file
US8434001B2 (en) * 2010-06-03 2013-04-30 Rhonda Enterprises, Llc Systems and methods for presenting a content summary of a media item to a user based on a position within the media item

Cited By (301)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US11928604B2 (en) 2005-09-08 2024-03-12 Apple Inc. Method and apparatus for building an intelligent automated assistant
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11979836B2 (en) 2007-04-03 2024-05-07 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10568032B2 (en) 2007-04-03 2020-02-18 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US11023513B2 (en) 2007-12-20 2021-06-01 Apple Inc. Method and apparatus for searching using an active ontology
US10381016B2 (en) 2008-01-03 2019-08-13 Apple Inc. Methods and apparatus for altering audio output signals
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US9535906B2 (en) 2008-07-31 2017-01-03 Apple Inc. Mobile device having human language translation capability with positional feedback
US10108612B2 (en) 2008-07-31 2018-10-23 Apple Inc. Mobile device having human language translation capability with positional feedback
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10643611B2 (en) 2008-10-02 2020-05-05 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10475446B2 (en) 2009-06-05 2019-11-12 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US9548050B2 (en) 2010-01-18 2017-01-17 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US12087308B2 (en) 2010-01-18 2024-09-10 Apple Inc. Intelligent automated assistant
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US11410053B2 (en) 2010-01-25 2022-08-09 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US10984327B2 (en) 2010-01-25 2021-04-20 New Valuexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US10607141B2 (en) 2010-01-25 2020-03-31 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US10984326B2 (en) 2010-01-25 2021-04-20 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US10607140B2 (en) 2010-01-25 2020-03-31 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US10692504B2 (en) 2010-02-25 2020-06-23 Apple Inc. User profiling for voice input processing
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10102359B2 (en) 2011-03-21 2018-10-16 Apple Inc. Device access using voice authentication
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10672399B2 (en) 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
JP2014519058A (ja) * 2011-06-03 2014-08-07 アップル インコーポレイテッド テキストデータとオーディオデータとの間のマッピングの自動作成
US9798393B2 (en) 2011-08-29 2017-10-24 Apple Inc. Text correction processing
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US11321116B2 (en) 2012-05-15 2022-05-03 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US11636869B2 (en) 2013-02-07 2023-04-25 Apple Inc. Voice trigger for a digital assistant
US12009007B2 (en) 2013-02-07 2024-06-11 Apple Inc. Voice trigger for a digital assistant
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9633674B2 (en) 2013-06-07 2017-04-25 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US10657961B2 (en) 2013-06-08 2020-05-19 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US11048473B2 (en) 2013-06-09 2021-06-29 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US12073147B2 (en) 2013-06-09 2024-08-27 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US12010262B2 (en) 2013-08-06 2024-06-11 Apple Inc. Auto-activating smart responses based on activities from remote devices
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US12067990B2 (en) 2014-05-30 2024-08-20 Apple Inc. Intelligent assistant for home automation
US11699448B2 (en) 2014-05-30 2023-07-11 Apple Inc. Intelligent assistant for home automation
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US11670289B2 (en) 2014-05-30 2023-06-06 Apple Inc. Multi-command single utterance input method
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10657966B2 (en) 2014-05-30 2020-05-19 Apple Inc. Better resolution when referencing to concepts
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10714095B2 (en) 2014-05-30 2020-07-14 Apple Inc. Intelligent assistant for home automation
US12118999B2 (en) 2014-05-30 2024-10-15 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10431204B2 (en) 2014-09-11 2019-10-01 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10390213B2 (en) 2014-09-30 2019-08-20 Apple Inc. Social reminders
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US11556230B2 (en) 2014-12-02 2023-01-17 Apple Inc. Data detection
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10311871B2 (en) 2015-03-08 2019-06-04 Apple Inc. Competing devices responding to voice triggers
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US12001933B2 (en) 2015-05-15 2024-06-04 Apple Inc. Virtual assistant in a communication session
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10681212B2 (en) 2015-06-05 2020-06-09 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US12051413B2 (en) 2015-09-30 2024-07-30 Apple Inc. Intelligent device identification
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10942703B2 (en) 2015-12-23 2021-03-09 Apple Inc. Proactive assistance based on dialog communication between devices
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US11657820B2 (en) 2016-06-10 2023-05-23 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10942702B2 (en) 2016-06-11 2021-03-09 Apple Inc. Intelligent device arbitration and control
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
US10580409B2 (en) 2016-06-11 2020-03-03 Apple Inc. Application integration with a digital assistant
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US10847142B2 (en) 2017-05-11 2020-11-24 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10789945B2 (en) 2017-05-12 2020-09-29 Apple Inc. Low-latency intelligent automated assistant
US11862151B2 (en) 2017-05-12 2024-01-02 Apple Inc. Low-latency intelligent automated assistant
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US12014118B2 (en) 2017-05-15 2024-06-18 Apple Inc. Multi-modal interfaces having selection disambiguation and text modification capability
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10909171B2 (en) 2017-05-16 2021-02-02 Apple Inc. Intelligent automated assistant for media exploration
US12026197B2 (en) 2017-05-16 2024-07-02 Apple Inc. Intelligent automated assistant for media exploration
US11675829B2 (en) 2017-05-16 2023-06-13 Apple Inc. Intelligent automated assistant for media exploration
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US11360577B2 (en) 2018-06-01 2022-06-14 Apple Inc. Attention aware virtual assistant dismissal
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US12067985B2 (en) 2018-06-01 2024-08-20 Apple Inc. Virtual assistant operations in multi-device environments
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US12061752B2 (en) 2018-06-01 2024-08-13 Apple Inc. Attention aware virtual assistant dismissal
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US10984798B2 (en) 2018-06-01 2021-04-20 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10720160B2 (en) 2018-06-01 2020-07-21 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US11630525B2 (en) 2018-06-01 2023-04-18 Apple Inc. Attention aware virtual assistant dismissal
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US12080287B2 (en) 2018-06-01 2024-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11360739B2 (en) 2019-05-31 2022-06-14 Apple Inc. User activity shortcut suggestions
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11924254B2 (en) 2020-05-11 2024-03-05 Apple Inc. Digital assistant hardware abstraction
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11750962B2 (en) 2020-07-21 2023-09-05 Apple Inc. User identification using headphones
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones

Also Published As

Publication number Publication date
CN102687182A (zh) 2012-09-19
US20130346838A1 (en) 2013-12-26
KR20120091325A (ko) 2012-08-17
WO2011060106A1 (en) 2011-05-19
EP2499626A1 (en) 2012-09-19
US20110195388A1 (en) 2011-08-11
US8527859B2 (en) 2013-09-03

Similar Documents

Publication Publication Date Title
US8527859B2 (en) Dynamic audio playback of soundtracks for electronic visual works
US11914919B2 (en) Listener-defined controls for music content generation
AU2021204836B2 (en) Rhythmic Synchronization Of Cross Fading For Musical Audio Section Replacement For Multimedia Playback
US9355627B2 (en) System and method for combining a song and non-song musical content
US20130297599A1 (en) Music management for adaptive distraction reduction
US7394011B2 (en) Machine and process for generating music from user-specified criteria
AU2016330618A1 (en) Machines, systems and processes for automated music composition and generation employing linguistic and/or graphical icon based musical experience descriptors
CN106708894B (zh) 电子书配置背景音乐的方法和装置
WO2012114329A1 (en) System and method for seamless multimedia assembly
JP2005321668A (ja) 情報処理装置および方法、並びにプログラム
US9626148B2 (en) Creating an event driven audio file
Sporka et al. Design and implementation of a non-linear symphonic soundtrack of a video game
Collins BBCut2: Integrating beat tracking and on-the-fly event analysis
Goto OngaCREST Project: building a similarity-aware information environment for a content-symbiotic society
US20160212242A1 (en) Specification and deployment of media resources
US9471205B1 (en) Computer-implemented method for providing a media accompaniment for segmented activities
Meng MashupMuse: A Web Application for Easier Music Mashup Creation
Vlieg et al. The Noisy Cat