JP2013511214A - 電子視覚作品のためのサウンドトラックの動的音声再生 - Google Patents
電子視覚作品のためのサウンドトラックの動的音声再生 Download PDFInfo
- Publication number
- JP2013511214A JP2013511214A JP2012538959A JP2012538959A JP2013511214A JP 2013511214 A JP2013511214 A JP 2013511214A JP 2012538959 A JP2012538959 A JP 2012538959A JP 2012538959 A JP2012538959 A JP 2012538959A JP 2013511214 A JP2013511214 A JP 2013511214A
- Authority
- JP
- Japan
- Prior art keywords
- computer
- audio
- electronic visual
- visual work
- cue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000007 visual effect Effects 0.000 title claims abstract description 67
- 230000003993 interaction Effects 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims description 41
- 230000008451 emotion Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 9
- 230000007704 transition Effects 0.000 abstract description 6
- 230000001360 synchronised effect Effects 0.000 abstract description 5
- 230000001960 triggered effect Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 37
- 238000003860 storage Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 8
- 239000000203 mixture Substances 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 230000002996 emotional effect Effects 0.000 description 3
- 230000036651 mood Effects 0.000 description 3
- 230000033764 rhythmic process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004836 empirical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000763 evoking effect Effects 0.000 description 2
- 239000004816 latex Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000035807 sensation Effects 0.000 description 2
- 241001342895 Chorus Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 1
- 230000000147 hypnotic effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/06—Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/06—Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
- G09B5/062—Combinations of audio and printed presentations, e.g. magnetically striped cards, talking books, magnetic tapes with printed texts thereon
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Electrically Operated Instructional Devices (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
電子書籍は、読者が電子書籍を読んでいる間に聴くことができるサウンドトラックを備える。サウンドトラックは、読書体験を添付し拡張し、ここでは読者が、ストーリー又は電子書籍の一部である他の視覚媒体に基づいて一般的に頭の中にイメージを抱く。サウンドトラックの再生は、電子書籍の視覚表示と同期される。音声キューが、テキストの種々のポイントに関連付けられており、これらのキューが、電子書籍とのユーザのインタラクションに基づいて電子書籍の視覚表示と同期して動的に再生される。動的再生は、キューが同期される電子書籍の一部分の持続時間の予測に基づく持続時間を動的再生が有するように音声キューを編集及び再生することを含む。本システムが音声キューの再生を開始すると、システムは、次の音声キューを開始すべき時間を予測する。現在のキューは、予測された持続時間で再生され、次の音声キューへの移行が適切な時間に起動される。
【選択図】 図1
【選択図】 図1
Description
(関連出願の相互参照)
本出願は、米国特許法119条に基づき、引用により本明細書に組み込まれる2009年11月10日出願の米国仮特許出願第61/259,995号の優先権及びこの利益を請求する出願である。
本出願は、米国特許法119条に基づき、引用により本明細書に組み込まれる2009年11月10日出願の米国仮特許出願第61/259,995号の優先権及びこの利益を請求する出願である。
電子書籍は、主としてテキストから構成されるマルチメディア作品の一種であるが、グラフィック及び画像などの他の視覚的媒体を含むこともできる。電子書籍におけるテキストは、他の視覚的媒体を添付することができ、一般的には、電子書籍は、必ずしも一度ではなく、最初から最後まで読まれることを意図している。
限定ではないが、種々のタイプのマークアップ言語文書タイプ(例えば、SGML、HTML、XML、LaTex及び同様のものなど)、及びpdfファイル、プレーンテキストファイル、その他のような他のデータファイルタイプを含む、電子書籍で使用される幾つかのファイルフォーマットがある。種々のファイルフォーマットは、Amazon.comのKINDLEリーダなどの電子書籍リーダと共に使用される。このような電子書籍リーダは、一般的に、パーソナルコンピュータ、ノートブックコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、モバイルデバイス又は電子書籍を読み取るための専用ハードウェアシステム(KINDLEリーダなど)のようなプラットフォーム上で実行されるよう設計されたコンピュータプログラムである。
Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing(2005年10月)の会報におけるCecilia Ovesdotter Alm等による「Emotions from text: machine learning for text−based emotion prediction」、579〜586頁
電子書籍は、電子書籍を読んでいる間に読者が聴くことのできるサウンドトラックを備えている。サウンドトラックの目的は、読書体験に同伴し且つこれを増強することであり、ここでは、読者は、一般に、ストーリー又は電子書籍の一部である他の視覚的媒体に基づいて頭の中にイメージを抱く。サウンドトラックの再生は、電子書籍の視覚表示と同期されている。
書籍が読者によって読まれている間にサウンドトラックの再生を電子書籍の視覚表示に同期させることは、困難な問題がある。個人毎に読む速度が異なるので、それぞれ別の時間に異なる速度で読書することになる。電子書籍の一部分の視覚表示の持続時間は、読者毎及び時間によって異なる。換言すると、電子書籍の一部分の視覚表示の持続時間は、電子書籍とのユーザインタラクションに応じて可変である。更に、サウンドトラック、つまり一種の時間依存媒体の再生は、この視覚表示と同期される。
複数の読者に適用可能な方法で良好な読書体験にサウンドトラックを提供するために、音声キューが、テキストの種々のポイントに関連付けられており、これらのキューは、電子書籍とのユーザのインタラクションに基づいて電子書籍の視覚表示と同期して動的に再生される。動的再生は、キューが同期される電子書籍の一部分の持続時間の予測に基づく持続時間を動的再生が有するように音声キューを編集及び再生することを含む。システムが音声キューの再生を開始すると、システムは、次の音声キューを開始すべき時間を予測する。現在のキューは、予測された持続時間で再生され、次の音声キューへの移行が適切な時間に起動される。
このようなサウンドトラックは、一般的に、単に普通の音楽又は音声だけではなく、ある音楽及び音声は、読書体験を拡張する代わりに読者の気を逸らすことができる。或いは、サウンドトラックは、テキストによって呼び起される感情と同様の感情を読者に呼び起こすよう設計された音楽及び音声を含む。一般的には、電子書籍用のサウンドトラックは、明るい瞬間的な音声が少ない、声がない、及び音楽に対する幾らかの予備的な催眠状態のような感覚のときに役立つ。ジャンルに関しては、速すぎるか又は強烈すぎる音楽は、気を逸らし読書するのが難しくなる可能性がある。
種々の態様において、本発明は、コンピュータに実装された処理、機械(電子装置、又は汎用コンピュータ、或いはコンピュータプログラムを実行することができるプラットフォームを提供する他の装置など)、これらの機械によって実行される処理、或いは製造物品において具現化することができる。このような製品は、コンピュータプログラム命令又はコンピュータ可読データが記憶されたコンピュータ可読記憶媒体を収容するコンピュータプログラム製品又はデジタル情報製品、及びこれらの製造物品を生成し使用する処理及び機械を含むことができる。
従って、1つの態様では、音声の動的再生は、電子視覚作品の一部分とのユーザインタラクションに関するデータを受信する段階を含む。電子視覚作品の一部分に関連付けられた再生される音声のセクションは、電子視覚作品とのユーザインタラクションに従って動的に長さが調整される。1つの実施構成では、電子視覚作品の一部分の視覚表示の持続時間は、電子視覚作品の一部分とのユーザインタラクションに関する受信されたデータに従って推定される。電子視覚作品の一部分に関連付けられた音声のサブミックスのシーケンスは、推定された持続時間に一致する音声要素を提供するように選択される。この推定は、読書速度の履歴を使用して行うことができる。
別の態様では、サウンドトラックは、電子視覚作品の表示と同期して再生される。電子視覚作品はメモリ内に受け入れられる。電子視覚作品の一部分をタグに関連付ける情報がメモリ内に受け入れられる。電子視覚作品の一部分は、ユーザインタラクションに応答して表示される。タグの付いた音声ファイルがアクセスされる。電子視覚作品の一部分に関連付けられる音声ファイルは、電子視覚作品の一部分に関連付けられたタグに従って選択される。電子視覚作品の一部分とのユーザインタラクションに関するデータが受信され、電子視覚作品のその特定の部分に関連付けられた音声の再生の持続時間が、ユーザインタラクションに従って動的に調整される。
別の態様では、電子視覚作品用のサウンドトラックが生成される。電子視覚作品は、メモリ内に受け入れられる。電子視覚作品は、電子視覚作品の一部分がタグ付けされた音声ファイルの特定の部分に関連付けるタグでマーク付けされるように、メモリにおいて処理される。次に適切なタグの付いた音声ファイルがアクセスされ、電子視覚作品の一部分に対する目標音声ファイルが選択されて関連付けられ、結果として生じるサウンドトラックを作成し再生する。電子視覚作品は、テキストを含むことができ、処理段階は、テキストを処理する段階を含む。タグは、感情記述子を含むことができる。
別の態様では、キューリストは、電子視覚作品の各部分に対して感情記述子を含み、ここで感情記述子は、音声データにも関連付けられた感情記述子に対応する。
別の態様では、音声キューは、音声データを提供するためにミックスすることができる音楽作品の複数のサブミックス(「ステム」と呼ばれる)に対する音声データと、ステムをどのように繰り返して結合して読者が聴く最終結果を作成できるかを示す情報とを含む。
別の態様では、サウンドトラック及びその関連の電子視覚作品の配信は、サウンドトラックが利用可能でないかのように電子視覚作品を同じ方式で視聴することができるようにして行われる。読者が電子視覚作品にアクセスした後、キューリストが識別されて読み取られる。バックグラウンドタスクとして、音声データは、サウンドトラックにおける第1のキューが電子視覚作品の表示と同期して再生されている間にダウンロードされる。
更に他の態様は、以下の詳細な説明において記載され、本発明のこれらの異なる態様の種々の組合せによって提供される。
以下の説明では、実施形態の完全な理解を提供するために特定の詳細事項が与えられている。しかしながら、この実施形態をこれらの特定の詳細事項なしに実施できることは、当業者には理解されるであろう。例えば、ソフトウェアモジュール、機能、回路、その他は、実施形態を不必要に曖昧にしないために、ブロック図で示すことができる。場合によっては、公知のモジュール、構造及び技術は、実施形態を曖昧にしないために詳細には示されていないことがある。
また、実施形態は、フローチャート、フロー図、構造図、又はブロック図として示される処理として記述できる点に留意されたい。フローチャートは、連続した処理として動作を記述することができるが、この動作の多くは、並行して或いは同時に実行することができる。更に、動作の順序は再配列することができる。処理は、その動作が完了したときに終了する。処理は、コンピュータプログラムにおける、方法、機能、手順、サブルーチン、サブプログラム、その他に対応することができる。処理が機能に対応する場合、その終了は、当該機能の呼出し機能又は主機能への復帰に対応する。
以下に説明するシステム及び方法の態様は、限定ではないが、デスクトップ、ラップトップ、ノートブック、タブレット又はモバイルデバイスを含む汎用コンピュータシステム又はコンピュータ装置のいずれのタイプでも動作することができる。「モバイルデバイス」という用語は、限定ではないが、無線装置、移動電話、移動通信装置、ユーザ通信装置、携帯情報端末、移動ハンドヘルドコンピュータ、ラップトップコンピュータ、電子書籍リーダ、及び電子コンテンツを読み取ることができる読取装置、及び/又は一般的に個人によって持ち運ばれ及び/又はある種の通信機能を有する(例えば、無線、赤外線、短距離無線、その他)他のタイプのモバイルデバイスを含む。
図9は、以下で更に詳細に説明するシステム及び方法の1つ又はそれ以上の態様で使用可能なコンピュータシステム900の内部機能アーキテクチャを示すブロック図である。図9に示すように、コンピュータシステム900は、コンピュータ実行可能処理ステップを実行するための中央処理ユニット(CPU)914を含むことができ、コンピュータバス916に相互接続する。図9にはまた、ネットワークインターフェイス918、ディスプレイ装置インターフェイス920、キーボード又は入力インターフェイス922、ポインティングデバイスインターフェイス924、音声インターフェイス926、ビデオインターフェイス932、及びハードディスクドライブ934又は他の永続記憶装置が示されている。
上述のように、ディスク934は、オペレーティングシステムプログラムファイル、アプリケーションプログラムファイル、ウェブブラウザ、及び他のファイルを記憶することができる。これらのファイルの幾つかは、インストールプログラムを使用してディスク934に記憶することができる。例えば、CPU914は、インストールプログラムのコンピュータ実行可能処理ステップを実行することができ、これによって、CPU914は、アプリケーションプログラムを適切に実行することができるようになる。
ランダムアクセスメインメモリ(「RAM」)936もまた、コンピュータバス916に相互接続され、CPU914がメモリ記憶装置へアクセスできるようにすることができる。ディスク934から記憶されたコンピュータ実行可能処理ステップを実行すると、CPU914は、RAM936から処理ステップを記憶し実行する。処理されることになるデータはまた、このようなメモリ936又は記憶装置934から読み取られて、このようなメモリ936又は記憶装置934に記憶することができる。読出し専用メモリ(「ROM」)938は、起動命令シーケンス又はキーボード922の動作のための基本入力/出力オペレーティングシステム(BIOS)シーケンスなどの、不変命令シーケンスを記憶するために設けることができる。
電子書籍リーダ、又は電子書籍及び他のマルチメディア作品の視覚表示を提供するための他のアプリケーションは、図9に示されるようなプラットフォーム上に実装することができる。
以下の説明では、電子書籍及び電子書籍リーダは、一種のマルチメディア作品及びサウンドトラックの再生を同期させることができる対応するビューワの実施例として使用される。作品の一部分の視覚表示の持続時間が作品とのユーザインタラクションに依存するマルチメディア作品の他の種類も、この種類の同期を使用することができる。電子書籍という用語は、主としてテキストであるか、或いはグラフィック又は他の視覚媒体を伴うテキストである、書籍、雑誌、ニュースレター、新聞、定期刊行物、地図、論文、及び他の作品を包含するものとする。
サウンドトラックは、電子書籍を含む多種多様な電子視覚作品のいずれにも関連付けることができる。使用することができる音楽又は音声のタイプは、作品のタイプに依存することになる。例えば、フィクション作品に対しては、サウンドトラックは、映画のサウンドトラックと類似した目的のものとなり、すなわち、サスペンスを創造し、恋愛対象を土台とし、或いは重要なクライマックスに至るようにストーリーを支えるものである。子供向けの本では、音楽は、場合によってはページをめくる時のようなより多くの音響効果を含む、漫画で使用されるものと類似することができる。教科書では、サウンドトラックは、毎分約128又は132ビートで及び重要なモード音調を使用した素材など、知識保持を増強するのに公知のリズム及び調性を含むことができる。瞑想を助けるよう設計された一部の書籍は、自然、周囲の僅かな音楽、柔らかい音調を有する楽器、及び同様のものの音を備えたサウンドトラックを有することができる。旅行書籍は、記載されている場所に固有の音楽及び音を有することができる。雑誌及び新聞では、種々の欄又は記事は、種々のサウンドトラック及び/又は種々のスタイルの音楽を備えることができる。同じページの異なるパスを読む場合でも、異なるサウンドトラックを有することができる。広告主はまた、これらの作品の読書中に再生されるその音声テーマを有することができる。このような場合、サウンドトラックは、テキストベースの広告が他の材料を伴うためにどのように選択されるかに類似した方式で選択することができる。
詳細には、ここで図1を参照すると、電子書籍110が、電子書籍リーダ112に入力され、電子書籍リーダ112は、電子書籍の視覚表示をエンドユーザ又は読者に提供する。電子書籍110は、少なくともテキストを含み、コンピュータプログラムがテキストを読み取り、フォーマット化し、表示できるように設計されたファイルフォーマットである1つ又はそれ以上のコンピュータデータファイルである。限定ではないが、マークアップ言語文書タイプの種々のタイプ(SGML、HTML、XML、LaTex及び同様のものなど)、及び他の文書タイプを含む電子書籍の種々のファイルフォーマットがあり、その実施例には、限定ではないが、EPUB、FictionBook、Plucker、PalmDoc、zTxt、TCR、CHM、RTF、OEB、PDF、mobipocket、Calibre、Stanza、及びプレーンテキストが含まれる。一部のファイルフォーマットは、所有権によって保護されており、専用電子書籍リーダと共に使用されるよう設計されている。本発明は、どのような特定のファイルフォーマットにも限定されない。
電子書籍リーダ112は、図9に関して上述されるようなコンピュータプラットフォーム上で実行されるよう設計されたあらゆるコンピュータプログラムとすることができ、その実施例は、限定ではないが、パーソナルコンピュータ、タブレットコンピュータ、電子書籍を読み取り、電子書籍110のコンテンツを受信して表示するモバイルデバイス又は専用ハードウェアシステムを含む。多くの商用又は公共の電子書籍リーダが存在し、その実施例には、限定ではないが、Amazon.comのKINDLEリーダ、Barnes&NobleのNookリーダ、Stanzaリーダ、及びFBリーダソフトウェア、オープンソースプロジェクトが含まれる。しかしながら、本発明は、いずれの特定の電子書籍リーダにも限定されない。
電子書籍リーダ112はまた、電子書籍リーダ112とのユーザインタラクションを示すデータ114を出力し、これによってこのようなデータを動的音声プレーヤ116が使用することができるようになる。商用又は公共の電子書籍リーダは、これらの出力を提供するために本明細書の説明に従って修正することができる。
テキストとのユーザインタラクションに関するデータは、多種多様な形式で提供することができる。例えば、読み取られる書籍の識別子(ISBN、e−ISBN番号又はハッシュコードなど)、及びテキストにおける現在の位置を提供することができる。一般的には、現在の位置は、表示されている電子書籍の現在の「ページ」又は部分として電子書籍リーダによって追跡される。電子書籍リーダは、この情報が変化したときにこの情報を出力することができる。電子書籍リーダ112によって提供される場合に有用とすることができる他の情報には、限定ではないが、表示されている文書の現在の範囲に対するワードカウント、ユーザが電子書籍リーダアプリケーションを終了させた時間の表示、及びリーダが読書を中断するか或いは中断後に読書を再開したかどうかの表示が含まれる。
電子書籍リーダと動的音声プレーヤとのの間で交換される情報及び命令は、アプリケーションプログラミングインターフェイス(API)を介して実行することができ、これによって、動的音声プレーヤは、電子書籍リーダがステータス情報を提供するか、又はある動作を実行することを要求することができるようになり、或いは、これによって電子書籍リーダが、他のアプリケーションプログラムを制御することができるようになる。動的音声プレーヤは、このAPIも同様に実行するようプログラムすることができる。APIの例示的な実施構成は、限定ではないが、2つのインターフェイス、すなわち、電子書籍リーダアプリケーションからの呼出しのためのインターフェイスと、電子書籍リーダアプリケーションの呼出しのためのもう1つのインターフェイスとを含む。
電子書籍リーダが動的音声プレーヤに対して実施できる例示的な呼出しは、以下を含む。
「ebookOpenedwithUniquelD」−この機能は、アプリケーションが電子書籍を開いたときに電子書籍リーダによって呼び出される。この機能は、電子書籍の固有識別子及び電子書籍が以前に開かれていたかどうかを指定するパラメータを有する。この情報に応答して、動的音声プレーヤは、現在のキューを設定する。電子書籍を最初に開いたときに、現在の位置は、第1キューの開始に設定されることになる。
「ebookClosed」−この機能は、アプリケーションが電子書籍を閉じたときに電子書籍リーダによって呼び出される。この呼び出しに応答して、動的音声プレーヤは、メモリを開放して内部データをリセットすることができる。
「ebookRemoved」−この機能は、電子書籍リーダがライブラリから電子書籍を取り除いたときに呼び出され、これによって、サウンドトラック及び音声ファイルも取り除くことができる。
「displayedPositionRangeChanged」−この機能は、電子書籍リーダが、例えば、ページめくり、向き変更、フォント変更又は同様のものに起因してその表示を変更したときに呼び出され、新しく表示される作品の範囲のパラメータを提供する。この呼び出しに応答して、動的音声プレーヤは、作品の新しく表示される範囲の音声キューを設定することができる。
「readingResumed」−この機能は、電子書籍リーダが、読書が「休止」されていると判定された後、ユーザからの様々な入力(ページめくりコマンドなど)のいずれかを受信することによって検出する、非作動の拡張期間後にユーザが読書を再開したときに呼び出される。
「fetchSoundtrack」−この機能は、特定の固有識別子(この機能のパラメータとして提供される)を有する電子書籍に対して、サウンドトラックファイル、又はキューリストをフェッチ及びインポートするよう動的音声プレーヤに指示するために電子書籍リーダによって呼び出される。
「audio Volume」−この機能は、音声再生の音量を設定するよう動的音声プレーヤに指示するために電子書籍リーダによって呼び出される。
「getCueLists」−この機能は、現在開かれている電子書籍が利用可能なキューリスト及びグループに関する動的音声プレーヤからの情報を検索するために電子書籍リーダによって呼び出される。この機能によって、電子書籍リーダは、例えば、この情報を読者に提示することができる。
「cueListEnabled」−この機能は、特定のキューリスト、例えば、代替えのサウンドトラック、音響効果、記録されたリーダ又はテキスト対音声変換を有効又は無効にするよう動的音声プレーヤに指示するために電子書籍リーダによって呼び出される。
「audioIntensity」−この機能は、例えば、音声合成防音機構を形成又はドラムステム(サブミックス)を消音するために、音声再生の強さを設定するよう動的音声プレーヤに指示するために電子書籍リーダによって呼び出される。
「audioPreloadDefault」−この機能は、一般的に電子書籍をダウンロードし提供し続けるための音声のデフォルト時間数を設定するために呼び出される。
「audioPreloadForEbook」−この機能は、特定の書籍に対してダウンロードし維持するための音声の時間数を設定するために呼び出される。
「downloadEnabled」−この機能は、音声ダウンロードを有効又は無効にするために呼び出される。
動的音声プレーヤが電子書籍リーダに対して行うことができる例示的な呼び出しは以下を含む。
「readingPaused」−この機能は、予想される時間内に電子書籍リーダから「displayedPositionRangeChanged」を受信しなかった場合に動的音声プレーヤによって呼び出される。この情報から、ユーザがもはや読書していないことが動的音声プレーヤによって仮定される。この機能を呼び出した後、電子書籍リーダは、ユーザが再度読書を開始したときに「読書再開」機能を呼び出さなくてはならない。
「gotoPosition」−この機能は、「ebookOpenedAtPath」機能が呼び出されたことに応答して電子書籍が最初に開かれたときに、通常は第1キューの始点に書籍の現在の位置を設定するよう電子書籍リーダに指示するために動的音声プレーヤによって呼び出される。
「wordCountForRange」−この機能は、以下で詳細に説明されるように、プレイリストをスケジュールし読書速度を追跡するのに使用されることになる、電子書籍の指定された範囲に対するワードの数を提供するよう電子書籍リーダに指示するために動的音声プレーヤによって呼び出される。
これらのAPI呼出しの使用は、以下で更に詳細に説明する。
電子書籍110は、テキストの一部分に音声キュー120を関連付ける関連キューリスト118を有し、これは図3に関して以下で更に詳細に説明される。一般に、電子書籍110を固有に識別するのに使用される識別子は、キューリストに識別子を埋め込むか、或いは書籍の識別子をキューリスト118に関連付けるルックアップテーブル又はマップの形式を有することによって、キューリスト118を書籍に関連付けるために使用される。音声キュー120は、音声データを含むコンピュータデータファイルである。一般に、キューリスト118によってテキストの一部分に関連付けられる音声キュー120は、読者がテキストの当該部分を読んでいる間に再生される。例えば、テキストの一部分は、音声キューが再生を開始すべきテキストのポイント、或いは音声キューが再生すべきテキストの範囲によって指示することができる。動的音声プレーヤ116は、1つの音声キューの再生を中止する、及び別の音声キューの再生を開始する時間及び方法を決定する。
動的音声プレーヤ116は、電子書籍リーダ112とのユーザインタラクションに関するデータ114、並びにキュー120及びキューリスト118を受信する。以下で更に詳細に説明するように、動的音声プレーヤ116は、ユーザインタラクションデータ114及びキューリスト118を使用して、再生される音声キュー120、及びこれらを再生する時間及び方法を選択し、出力音声信号122を提供する。
サウンドトラックの再生中、動的音声プレーヤは、テキストとのユーザインタラクションに関するデータに基づいて、現在読まれているテキストの一部分に関連付けられる現在のキューを再生し、再生されることになる次のキューに移行する方法及び時間を決定する。従って、図2に更に詳細に示されるように、動的音声プレーヤ200は、現在のキュー204及び次のキュー210を使用して、音声206を生成する。再生されることになるキュー204及び210は、ユーザインタラクションに関するデータ212及びキューリスト202を使用して、キュールックアップ208を介して決定される。動的音声プレーヤが現在のキュー204を再生している間、動的音声プレーヤは、着信データ212をモニタし、次のキューを再生すべき時間を決定する。現在のキュー204は、キューの実際の持続時間より長い又は短い時間で再生する必要がある。以下で更に詳細に説明するように、動的音声プレーヤは、ユーザがテキストの関連付けられた部分を読書するのに要する時間量に合わせるように現在のキューを長くするか又は短くし、次に、ユーザが次のキューに関連付けられたテキストに到達する推定時間にて、クロスフェードなどの移行を実行する。
ここで図3を参照し、図1のキューリスト118の例示的な実施構成を更に詳細に説明する。音声キュー(例えば、図1の120及び図2の204、210など)は、テキストの一部分に割り当てられている。この割り当ては、テキストの一部分を音声ファイルに関連付けるメタタグ情報ファイルを使用して行うことができる。音声ファイルとの関連付けは、直接又は間接とすることができ、静的又は動的に定義することができる。例えば、テキストの種々の部分には、テキストのこれらの部分に関連付けられる音楽の感情、ムード又はスタイルを示す種々のワード又は他のラベルを割り当てることができる。次に、音声ファイルには、このようなワード又はラベルを関連付けることができる。音声ファイルは、選択してテキストに静的に関連付けることができ、或いは、以下で更に詳細に説明するように、再生時に動的に選択することができる。代替として、テキストにおける種々のポイントに音声ファイルを直接関連付けることができる。
例示的なメタタグ情報ファイルが図3に示されている。メタタグ情報ファイルは、キューを表すデータのペア302のリスト300である。キューを表す各ペア302は、テキスト文書内のマークアップ言語要素へのリファレンスなどのテキストへのリファレンス304、テキスト文書の始めからのオフセット、或いはテキスト文書内の範囲を含む。ペア302はまた、キューを指定するデータ306を含む。このデータは、感情タグなどのワード又はラベル、或いはファイル名などの音声ファイルの表示、或いは音声ファイルを選択するために使用することができるいずれかの他のデータとすることができる。作成者又はコンピュータプログラムがこのようなキューリストをどのように作成できるかを、以下で更に詳細に説明する。
メタタグ情報ファイルは、複数のメタデータファイルを含むアーカイブであるファイルとして実装することができる。これらのファイルは、JavaScript(登録商標) Object Notation(JSON)フォーマットとすることができる。メタタグ情報ファイルは、関連付けられる電子書籍の固有識別子、電子書籍のタイトル、スキーマバージョン(将来フォーマットが変更される場合の互換性目的のため)、及びアーカイブ内の他のファイルのリストなど、サウンドトラックに関する一般情報を完全性チェックのためのチェックサムと共に包含するマニフェストファイルを含むことができる。マニフェストファイルに加えて、メタタグ情報ファイルはまた、サウンドトラックで利用可能なキューリスト記述子のリストを含むキューリストファイルを含む。各キューリスト記述子は、ディスプレイ名、ルックアップ目的のための固有識別子、及びキューリストの任意選択的なグループ名を含む。一実施例として、一回の再生を有することのみ意味する複数の排他的メインキューリストが存在することができる。これらのキューリストは、「メイン」のグループ名を有することができるが、音響効果又は「読み上げ」キューリストによって、これらを同時に全て再生することが承認され、従って、グループ名を利用しないことになる。
メタタグ情報ファイルはまた、キューリストの全てに対するキュー記述子のリストを包含するキューファイルを含む。各キュー記述子は、プロデューサによってキュー記述子に与えられた記述名を含む。この記述子は、この目的で別のアプリケーションを使用して入力することができ、キューファイルのリストにおけるキューファイルの位置を探すのに使用されるキューファイル名などの情報、及び電子書籍における入力及び出力ポイントを含むことができる。
最後に、メタタグ情報ファイルは、キューファイル記述子のリストを含む「キューファイル」ファイルを含む。キューファイルファイルは、キューファイルのネットワーク位置を指定する。各キューファイル記述子は、プロデューサによってキューファイルに与えられ且つキュー記述子におけるキューファイル名として使用される記述名、キューファイルを検索するためのユニフォームリソースロケータ(URL)、及びキューファイルのオリジナルのファイル名を含む。
このようなキューリストで参照される音声キュー(図1の120)は、AIFF、MP3、AAC、m4a又は他のファイルタイプなどの音声ファイルフォーマットで記憶することができる音声データを含む。ここで図4を参照し、音声キューファイルの例示的な実施構成を説明する。音声キューファイル400は、複数の「ステム」(サブミックス)402を含むことができ、この各々は、キューに対する複数部分音声ミックスの1つの部分を提供する別々の音声ファイルである。このようなステムの使用によって、動的音声プレーヤは、キューの再生時間を長くするために繰り返されるステムの中から選択することができる。音声キューファイルはまた、ループマーカ404、バーロケーション406及び推奨されるミックス情報408など、音声キューを再生する持続時間を修正するために動的音声プレーヤに有用な情報を含むことができる。推奨されるミックス情報は、音声ステムを結合するための命令のリストを含み、各命令は、使用されるステム及びセクション、及び適用されるいずれかの音声効果処理を示す。ジャンル、スタイル、楽器、感情、雰囲気、場所、時代を示す音声又はデータによって呼び起こされることが意図された感情又は気分を示すワード又はラベルなどの他の情報(記述子410とも呼ばれる)を提供することもできる。代替キーワード、キュー音量、クロスフェード又はフェード‐イン/アウトの形状/強さ、及び連続するキューに対する推奨される調和級数などの付加的な情報も含むことができる。
一実施例として、音声キューファイルは、JSONフォーマットでのメタデータファイル及びキューのステムに対する1つ又はそれ以上の音声ファイルを包含するアーカイブとして実装することができる。メタデータファイルは、バーロケーション、ループマーカ、推奨されるミックス情報、感情モード(感情コンテンツメタタグ)、音声動特性制御メタデータ(動的範囲圧縮)、楽器、雰囲気、及びジャンルを含む、音声ファイルに関連付けられるメタデータに対する記述子を含む。音声ファイルは、各ステムに対するデータ圧縮音声ファイル及び高解像度オリジナル音声ファイルを含むことができる。各ステムの高解像度版を保存することは、音楽制作ツールを用いた後編集を助ける。オリジナル音声ファイルのない音声キューファイルの複写は、電子書籍リーダへのより小さなダウンロードを可能にするために行うことができる。キューファイルは、エンドユーザアプリケーションにおける再生に使用されるファイルである、ステムに対する圧縮音声ファイルを含む。
キューファイルは、標準的な音声ステムのセットを入力し、別々のテキストファイルとして記述子、ループポイント及び推奨されるミックスメタ情報を追加し、ネットワーク配信のために音声を最適化し圧縮し、更にデータベースにアップロードすることができる単一のパッケージファイルを出力するソフトウェアツールを使用して作成することができる。音声ファイルは、種々の分析技術を使用して分析し、セクション、ビート、ラウドネス情報、フェード、ループポイント、及びリンクを位置付けることができる。キューは、記述子「ジャンル、スタイル、楽器、感情、場所、時代」を使用して選択することができ、読者によって使用されるときにネットワークを通じて配信することができる。
キューリスト及びキューファイルは、別個に暗号化して、そのためのサウンドトラックである特定の作品にリンクさせることができる。作品及びそのサウンドトラックにアクセスするために同じキーが使用される。従って、ファイルは、特定の作品、或いはそれを通じて作品がアクセスされる特定のビューイングデバイスに結び付けることができ、作品に関連付けられたデジタル著作権管理情報を使用することができる。
キューリスト、音声キュー、及び電子書籍リーダによって利用可能なインタラクションに関する前述の理解を得たと前提として、ここで動的音声プレーヤについて図5−7に関して更に詳細に説明する。
読者によって最初に書籍が開かれた(500)ときに再生を開始するために、電子書籍リーダは、書籍の固有識別子とこの書籍が以前開かれたかどうかを示す「ebookOpenedwithUniquelD」機能を呼び出す(502)。動的音声プレーヤは、電子書籍の識別子を受信し(504)、識別された書籍に対するキューリストをダウンロード又は読み取る(506)。電子書籍リーダは、「getCueLists」機能を呼び出す(508)ことによって、キューリストに関する情報を動的音声プレーヤに求める。動的音声プレーヤは、キューリストを送信(510)し、このキューリストを電子書籍リーダがユーザに提示して、書籍用のサウンドトラックの1つ(1つよりも多いサウンドトラックがある場合)を選択する(512)。このような選択は、ユーザがサウンドトラックを格付けできるようにする顧客フィードバック格付けシステムを使用することによって拡張することができ、これらの各付けは、サウンドトラックの選択がシステムによって要求されたときにユーザに表示することができる。次に「cueListEnabled」機能が呼び出され(514)、選択されたキューリストを動的音声プレーヤに通知し、該キューリストは、動的音声プレーヤが機能呼び出しを介して受信する(516)。「fetchSoundtrack」機能が呼び出され(518)、再生のためのキューをフェッチする(520)よう動的音声プレーヤに指示する。
このセットアップ処理が完了した後、動的音声プレーヤは、再生を開始するために開始キュー及びキューリスト、ひいては現在のキューを有する。再生は、電子書籍のこの部分が電子書籍リーダによって表示される時間付近で開始することができる。次に、動的プレーヤは、書籍とのユーザインタラクションに関するデータに基づいて、再生する次のキュー、キューを再生する時間、及び現在のキューから次のキューに移行する方法を決定する。
動的音声プレーヤは、推定総キュー持続時間に合うようにキューの音声ステムファイルの再生時間を延長又は短縮する。この推定キュー持続時間は、幾つかの方法で計算することができる。例示的な実施構成は、読書速度の推定値を使用し、この計算は、以下で更に詳細に説明する。現在のキュー持続時間は、「displayedPositionRangeChanged」機能呼出しを介して全てのページめくりで提供されるような電子書籍リーダとのユーザインタラクションを記述するデータに応答して更新される。
一般的には、キューの音声ステムファイルの再生時間は、音声ステムファイルのセクションを自動的にループすること、個々のステムミックスを変化させること、及びリバーブ、遅延及びコーラスなどの種々の効果を動的に追加することによって修正される。音声ステムファイルに固有のループポイント及び他のミックス自動化データは、キューファイルのメタデータに記憶される。キューファイルには幾つかの異なるループポイントを存在させることができる。音声ステムのセクションは、ループ及びリミックスされたときに、最も効果的で面白い音楽的エンドユーザ経験を提供できるように選択することができる。この処理は、明らかな繰り返しを有する音楽の生成を避け、音声のオリジナル部分の何倍もの持続時間を有することができる音楽的に心地よい結果を提供するように音楽コンテンツを最大化する。次のキューがトリガされたときに、発信及び着信音声間の移行もまた、シームレスな音楽的移行を生成するために適切なクロスフェードのスタイル及び配置を定義するキューファイルメタデータを使用して、同じ処理によって管理される。
一実施例として、キューファイルが4つの音声ステム(メロディトラック、持続和音又は「パッド」トラック、リズムパーカッション(ドラムであることが多い)トラック、及びリズムハーモニートラック)を含むと仮定し、これは、単一のパスで再生される場合に4分間実行されることになる。この記録が3つの別個のセクション、A、B及びCを有すると更に仮定する。キューファイルにおけるメタ情報は以下を含む。
1.以前のキューからキューに移行する方法。これは、移行スタイル(すなわち、スロー、中間又はクイックフェードイン、又はリバーブテールで以前のキューを中止して、キューの始めから新しいキューを開始する)、音楽バー、及びビートマーカを含み、これによってクロスフェードが音楽的にシームレスになる。
2.A、B及びCセクションの各々をループすることができる時間位置。
3.4つのステムをどのようにリミックスできるかに関するキュープロデューサの入力。例えば、セクションAだけを使用してステム1、2及び3を再生し、次にセクションAだけを使用してステム1、3及び4を再生し、ステム3にリバーブを追加し、更にセクションBを使用して単独で再生し、次いでセクションBからステム3及び4を再生するなどである。これらの種類の命令を有することは、音声の典型的な4分間部分を、明らかな繰り返しなしに40分又はそれ以上まで延長できることを意味する。更に、各ミックスは、ユーザにとって固有であり、サウンドトラックの許可されていない複製がより困難であるように再生時間に作成される。
一実施例として、ここで図6を参照し、この処理を更に詳細に説明する。キュー及び開始ポイントが与えられると、次のキューが再生されることになる持続時間が決定される(600)。この持続時間を計算するための例示的な方法を以下で更に詳細に提供する。持続時間が与えられると、キュー製作者の入力が処理され、所望の持続時間のプレイリストを作成する。換言すると、リミックス情報における第1の指示が選択され(602)、プレイリストに追加される。音声ステムのこのセクションが、符号604で決定された所望の持続時間よりも短い持続時間を有する場合、次の指示が選択され(606)、所望持続時間のプレイリストが終了する(608)まで処理が繰り返される。キューの最後において、次のキューについてのメタデータの移行情報を用いて、現在のプレイリストにおける開始ポイントを選択(610)し、現在のキューから次のキューへのクロスフェードを実施する。
キューの持続時間を推定する1つの方法は、読者の読書速度(1分当たりのワード単位で)を推定し、キューにおけるワード数が与えられた場合、読者が書籍のこの部分を読み終わるのに要するであろう時間を決定することである。この推定値は、読者に対する読書速度情報の履歴から計算することができる。
ユーザが書籍を読み始めたときに、1分当たりの特定数のワードである初期読書速度が仮定される。この初期速度は、以前の書籍の読書によるユーザの以前の読書速度履歴に関する多種多様なデータから計算することができ、このようなデータは、著者毎、ジャンル毎、一日の時間毎、場所毎、及び全ての書籍にわたって編成することができる。以前の読書履歴が利用可能でない場合、他のユーザがこのタイトルをどのように読書たかという匿名のグローバル集計を使用することができる。他の履歴が利用可能でない場合、1分当たり400ワードの一般的平均値が使用される。
ここで図7を参照すると、ユーザの読書速度は、「displayedPositionRangeChanged」機能呼出しによって示されるように、表示された位置範囲が変更される度に追跡される。この機能呼出しが受信された(700)場合、幾つかの条件がチェックされる(702)。これらの条件は、限定ではなく、必須でもないが、ユーザがアクティブに読書している、すなわち読書中断状態ではない、新しい表示された位置範囲が以前に表示された位置範囲よりも大きい、新しく表示された位置範囲の開始が以前に表示された位置範囲の最後に接する、及びワードカウントが最小数(現在のところ150ワード)を上回ることを含むことができる。また、最後の変化からの経過時間は、速度が正常な予想分散内にあるかどうかをチェックするための平均読書速度の標準偏差のような実用的範囲内になくてはならない。これらの条件が満足された場合、現在の時間が記録される(704)。表示される位置範囲への最後の変化からの経過時間は、以前に表示された位置範囲に対するワードカウントと共に計算されて記憶される(706)。このセクションにおける読書速度が計算される(708)。測定された読書速度のこの履歴データから、平均読書速度を計算し使用して、キュー持続時間を推定することができる。
ページpに対する読書速度Sp(1秒当たりのワードの単位)を計算するための式は以下の通りである。
ここで、Wpはページに対するワードカウント、Tpは秒単位のページを読むのに必要な時間である。1つの実施構成では、平均読書速度に使用される統計値は、20周期指数移動平均(EMA)であり、これは、速度変動を平滑にし、同時に最新のページ速度をより重要であると考える。
EMAを計算するための式は以下の通りである。
ここで、nは周期数、すなわち20である。
読書速度の変動を計算するために、発明者らは、最後の20値にわたって変動を計算するためのWelfordの方法を用いている。
M1=T1及びS1=0を初期化する。
Tの次の値に対して以下の再帰式を使用する。
≦k≦nの場合、変数の第k推定値は以下の通りである。
この読書速度情報は、ユーザの電子書籍リーダアプリケーションプラットフォーム上にローカルで記憶することができる。複数のユーザについてのこのような情報は、コンパイルして匿名方式でサーバ上に記憶することができる。本アプリケーションは、読書速度情報統計値を調べ、他者が作品或いは作品の一部をどのくらいの速度で読んだかを判定することができる。
読書速度の代わりに、或いはこれに加えて他のタイプのユーザインタラクションを使用して、再生を制御することができる。
1つの実施構成では、電子書籍とのユーザインタラクションに関するデータは、読者が書籍内のあるポイントから読書を始めたことを示す。このことは、一般的には読者は最初から最後まで書籍を一回で読み終わることはないので、頻繁に起こることである。場合によっては、読者が書籍内のあるポイントで読書を再開したとき、そのポイントにおけるサウンドトラックの音声レベル、或いは音声の「興奮」の他のレベルが適切でない可能性がある。すなわち、音声は、実際には、そのポイントで気持ちが逸らされる可能性がある。動的音声プレーヤは、現在の読書位置を含む書籍の一部に対して選択されている音声キューから代わりの音声キューを選択する機会として、書籍内のある位置から読者が読書を始めたという表示を使用することができる。
別の実施例として、読者は、セクションからセクションにスキップすることによって書籍を読むことができる。他のマルチメディア作品は、このような読書方式を促進することができる。このような場合、作品のセクションに関連付けられた音声キューが、そのセクションの表示が開始されたときに再生される。以前に表示されたセクションの音声から新しく表示されるセクションに対する音声への簡素なクロスフェードを実行することができる。一部の用途では、作品の性質が、いずれの特定のセクションのビューイング時間も予測しにくいようなものである場合、動的再生エンジンは、単に持続時間が不定であると推測することができ、別の音声キューを始めるための指示が受信されるまでキューファイルにおける指示に基づいて音声の生成を続けることができる。
別の実施例として、ユーザ入力に応答してキューファイルの種々のセクションを再生するために音声キューファイルを使用することができる。例えば、ポピュラーソングを幾つかのセクションに分割することができる。音声再生を制御するためのユーザインターフェイスを設けて、ユーザ入力に応答してプレーヤに次のセクション又は指定セクションにジャンプするよう指示することができる。
このような作品及びそれに伴うサウンドトラックをどのように作成できるかを説明してきたが、ここでこれらの配信を説明する。
電子書籍のサウンドトラックを作成する段階は、音声ファイルを電子書籍のテキストの一部分に関連付ける段階を含む。サウンドラックを作成できる幾つかの方法がある。
1つの実施構成では、作曲家が、テキストの各部分に対するオリジナル音楽を作曲し記録する。テキストの各部分は、そのようにして作曲及び記録される個々の音声ファイルに関連付けることができる。代替として、以前に記録された音楽を選択し、テキストの一部分に直接関連付けることができる。これらの実施構成では、音声ファイルは、テキストの一部分に静的及び直接的に割り当てられる。
別の実施構成では、音声ファイルは、テキストの一部分に間接的に割り当てられる。ワード又は他のラベルなどのタグが、テキストの一部分に関連付けられる。このようなタグは、コンピュータデータファイル又はデータベース内に記憶され、上述されたキューリストと同様に電子書籍に関連付けることができる。対応するタグはまた、音声ファイルに関連付けられる。1人又はそれ以上の作曲家が、特定の感情又は気分を呼び起こすことを意図したオリジナル音楽を作曲し記録する。代替として、以前に記録された音楽を選択することができる。これらの音声ファイルはまた、このようなタグに関連付けられ、データベース内に記憶することができる。テキストの一部分に関連付けられたタグを使用して、同じタグを有する対応する音声ファイルを自動的に選択することができる。書籍の1つのタグに対して複数の音声ファイルが識別された場合、コンピュータによって或いは人間の介入によって音声ファイルの1つを選択することができる。この実施構成によって、音声ファイルをデータベースに集めることができ、電子書籍及び音声ファイルに関連付けられたタグが与えられた場合に、音声ファイルを選択する処理を自動化することによってサウンドトラックの作成を半自動的に完了させることができる。
音声ファイルが電子書籍に間接的に関連付けられる実施構成では、音声ファイルは、再生に近い時間のタグを使用して動的に選択することができる。
タグを電子書籍に関連付ける処理はまた自動化することができる。詳細には、コンピュータによってテキストを処理し、テキストのワードの意味分析に基づいて感情記述子をテキストの一部分に関連付けることができる。このような意味分析についての例示的な技術は、限定ではないが、引用により本明細書に組み込まれる、Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing(2005年10月)の会報におけるCecilia Ovesdotter Alm等による「Emotions from text: machine learning for text−based emotion prediction」、579〜586頁に記載されるものを含む。これらのタグは、視聴している作品のセクションを支援する感情的感覚又は他の感情を記述することができる。例えば、これらの感情的感覚は、限定ではないが、「中間的な緊張状態」、「恋愛対象」、「緊張状態」、「陽気な」、「男性的な」、「暗い」、「陰気な」、「幽霊のような」、「幸福な」、「悲しい」、「切ない」、「セクシーな瞬間」、「明るい」及び「快活な」を含むことができる。
図8は、タグが関連付けられた音声ファイルを仮定して、電子書籍のためのサウンドトラックを作成するための完全自動化処理の実施例を示すデータフロー図である。電子書籍800は、書籍の感情記述子及びテキスト範囲804を出力する感情記述子生成器802に入力される。感情記述子は、音声データベース806において、書籍の各範囲に対する感情記述子に一致する音声ファイル810を探すのに使用される。音声セレクタ808は、各テキスト範囲に対する音声ファイルの自動化された、ランダムな、或いは半自動化された選択を可能にし、キューリスト812を生成する。電子書籍に対して固有識別子が生成され、キューリスト812と共に記憶することができる。
このような電子書籍及びそのサウンドトラックは、限定ではないが、電子書籍の商用配信のために現在使用されている方法を含む、多種多様な方法のいずれかで配信することができる。1つの実施構成では、電子書籍及び電子書籍リーダは、従来の技術を使用してエンドユーザに配信される。付加的なサウンドトラック及び動的音声プレーヤの配信は、別々に完了される。サウンドトラックの配信は、一般的には2つのステップで完了され、最初にキューリストがダウンロードされ、次いで各音声ファイルがダウンロードされる。音声ファイルはオンデマンドでダウンロードすることができる。動的音声プレーヤは、電子書籍リーダが作動する同じデバイス上に記憶することができ、或いは遠隔で記憶することができる利用可能なキューファイルに関する情報を維持するファイルマネージャを含むことができる。
1つの実施構成では、電子書籍は、キューリスト及び動的音声プレーヤと共にエンドユーザに配信される。
別の実施構成では、電子書籍及びその関連のキューリストが一緒に配信される。次に、キューリストを用いて、バックグラウンドタスクとしてサウンドトラック用の音声ファイルをダウンロードする。1つの実施構成では、電子書籍が最初にダウンロードされて、キューリストのダウンロードがバックグラウンドタスクとして起動され、次に、第1キューに対する第1音声ファイルが直ちにダウンロードされる。
別の実施構成では、電子書籍リーダは、キューリストに従って再生のために選択することができる多種多様な感情記述子を有するローカルの汎用キューを含むローカル記憶装置を備えたデバイスである。これらの汎用キューは、リモート音声ファイルが利用できなくなった場合に音声の再生を可能にする。
1つの実施構成では、電子書籍リーダアプリケーションが、電子媒体の配信者とそれを介して通信することができるインターネットなどのネットワークへのアクセスが可能なプラットフォーム上にロードされる。このような配信者は、電子媒体を購入及び/又はダウンロードする要求をユーザから受信することができる。要求を受信した後、配信者は、データベースから要求された作品及びそれに伴うサウンドトラック情報を検索することができる。検索された電子書籍は暗号化され、電子書籍リーダアプリケーションのユーザに送信することができる。電子媒体は、電子媒体が単一の電子書籍リーダでのみ再生できるように暗号化することができる。一般的には、作品に関連付けられたデジタル著作権管理情報もまたサウンドトラック情報に加えられる。
上記において、記憶媒体は、読出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク記憶媒体、光学記憶媒体、フラッシュメモリ装置及び/又は情報を記憶するための他の機械可読媒体を含む、データを記憶するための1つ又はそれ以上の装置を表すことができる。「機械可読媒体」及び「コンピュータ可読媒体」という用語は、限定ではないが、携帯式又は固定記憶装置、光学記憶装置、及び/又は、命令及び/又はデータを記憶、包含、又は保持することができる種々の他の媒体を含む。
更に、実施形態は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、又はこれらのいずれかの組合せによって実施することができる。ソフトウェア、ファームウェア、ミドルウェア又はマイクロコードで実施されたときに、必要なタスクを実行するためのプログラムコード又はコードセグメントは、記憶媒体又は他の記憶装置などの機械可読媒体内に記憶することができる。プロセッサは、必要なタスクを実行することができる。コードセグメントは、手順、機能、サブプログラム、プログラム、ルーチン、サブルーチン、モジュール、ソフトウェアパッケージ、クラス、或いは、命令、データ構造、又はプログラム命令文のいずれかの組合せを表すことができる。コードセグメントは、情報、データ、引数、パラメータ、又はメモリコンテンツの受け渡し及び/又は受信によって、別のコードセグメント又はハードウェア回路に結合することができる。情報、引数、パラメータ、データなどは、メモリ共有、メッセージ受け渡し、トークン受け渡し、ネットワーク送信などを含む、いずれかの適切な手段を介して受け渡し、転送、又は送信を行うことができる。
本明細書で開示される実施例に関して説明された種々の例示的な論理ブロック、モジュール、回路、要素、及び/又は構成要素は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)又は他のプログラム可能論理構成要素、離散的ゲート又はトランジスタ論理回路、離散的ハードウェア構成要素、或いは本明細書で説明される機能を実行するよう設計されたこれらのいずれかの組合せによって実施又は実行することができる。汎用プロセッサは、マイクロプロセッサとすることができるが、代替として、プロセッサは、いずれかの従来のプロセッサ、コントローラ、マイクロコントローラ、回路、及び/又は状態機械とすることができる。プロセッサはまた、コンピュータ構成要素の組合せ、例えば、DSPとマイクロプロセッサの組合せ、幾つかのマイクロプロセッサ、DSPコアに連結した1つ又はそれ以上のマイクロプロセッサ、或いは他のいずれかのこのような構成として実装することができる。
本明細書で開示された実施例に関して説明された方法又はアルゴリズムは、ハードウェアにおいて、プロセッサによって実行可能なソフトウェアモジュールにおいて、或いは両方の組合せにおいて、処理ユニット、プログラミング命令、又は他の指示の形式で直接具現化することができ、単一の装置に包含するか、或いは複数の装置にわたって分散させることができる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバルディスク、CD−ROM、或いは当該技術分野で公知の記憶媒体の他のいずれかの形式で備えることができる。記憶媒体は、プロセッサに結合することができ、これによって、プロセッサは、記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができる。代替として、記憶媒体は、プロセッサに一体化してもよい。
図に示された構成要素及び機能の1つ又はそれ以上は、単一の構成要素に再構成及び/又は結合することができ、或いは本発明から逸脱することなく幾つかの構成要素に実装することができる。付加的な要素又は構成要素を本発明から逸脱することなく追加することもできる。更に、本明細書で説明された特徴は、ソフトウェア、ハードウェアにおいて、ビジネス方法として、及び/又はこれらの組合せで実施することができる。
特定の例示的な実施形態を説明し添付の図面に示してきたが、このような実施形態は、単に例証として提示され、広範囲な本発明を限定するものではなく、当業者には種々の他の修正形態が想起できるので、本発明は、図示され説明される特定の構造及び構成に限定されない点を理解されたい。
110 電子書籍
112 電子書籍リーダ
114 ユーザインタラクション情報
116 動的音声プレーヤ
118 キューリスト
120 キュー
122 音声出力
112 電子書籍リーダ
114 ユーザインタラクション情報
116 動的音声プレーヤ
118 キューリスト
120 キュー
122 音声出力
Claims (9)
- 音声の動的再生のためのコンピュータに実装された方法であって、
電子視覚作品の一部分とのユーザインタラクションに関するデータを受信する段階と、
前記ユーザインタラクションに従って前記電子視覚作品の一部分に関連付けられる音声の再生の持続時間を動的に調整する段階と、
を含む、コンピュータに実装された方法。 - 前記電子視覚作品の一部分とのユーザインタラクションに関する前記受信されたデータに従って、前記電子視覚作品の一部分の視覚表示のための持続時間を推定する段階と、
前記電子視覚作品の一部分に関連付けられた音声のステムのミックスのシーケンスを選択し、音声に前記推定された持続時間を提供するようにする段階と、
を更に含む、請求項1に記載のコンピュータに実装された方法。 - 前記持続時間は、読書速度の履歴を使用して推定される、請求項2に記載のコンピュータに実装された方法。
- 電子視覚作品の表示と同期してサウンドトラックを再生するためのコンピュータに実装された方法であって、
前記電子視覚作品をメモリ内に受け入れる段階と、
前記電子視覚作品の一部分にタグを関連付ける情報をメモリ内に受け入れる段階と、
ユーザインタラクションに応答して前記電子視覚作品の一部分を表示する段階と、
タグの付いた音声ファイルにアクセスする段階と、
前記プロセッサを使用して、前記電子視覚作品の一部分に関連付けられたタグに従って前記電子視覚作品の一部分に関連付けられる音声ファイルを選択する段階と、
前記電子視覚作品の一部分とのユーザインタラクションに関するデータを受信する段階と、
前記ユーザインタラクションに従って前記電子視覚作品の一部分に関連付けられた音声の再生の持続時間を動的に調整する段階と、
を含む、コンピュータに実装された方法。 - 電子視覚作品用のサウンドトラックを生成するためのコンピュータに実装された方法であって、
前記電子視覚作品をメモリ内に受け入れる段階と、
プロセッサによって、前記メモリ内の前記電子視覚作品を処理し、メモリにおいてタグを前記電子視覚作品の一部分に関連付けることによって前記電子視覚作品の一部分にマーク付けする段階と、
タグの付いた音声ファイルにアクセスする段階と、
前記プロセッサを使用して、前記電子視覚作品の一部分に関連付けられたタグに従って前記電子視覚作品の一部分に対する音声ファイルを選択する段階と、
を含む、コンピュータに実装された方法。 - 前記電子視覚作品がテキストを含み、前記処理段階が、前記テキストを処理する段階を含む、請求項5に記載のコンピュータに実装された方法。
- 前記タグが感情記述子を含む、請求項6に記載のコンピュータに実装された方法。
- デジタル情報製品であって、
コンピュータ可読媒体と、
前記コンピュータ可読媒体に記憶されたコンピュータ可読データと、
を備え、前記コンピュータ可読データは、コンピュータによって処理されたときに前記コンピュータによって翻訳されて、電子視覚作品の各部分に対して感情記述子を有するキューリストを含むコンピュータ可読ファイルを定義し、前記感情記述子が、音声データにも関連付けられた感情記述子に対応する、デジタル情報製品。 - デジタル情報製品であって、
コンピュータ可読媒体と、
前記コンピュータ可読媒体に記憶されコンピュータ可読データと、
を備え、前記コンピュータ可読データは、コンピュータによって処理されたときに前記コンピュータによって翻訳されて、ミックスして音声データを提供できる複数のステムの音声データとステムをどのように繰り返して結合できるかを示す及び情報とを含む、音声キューを定義するデータを有するコンピュータ可読ファイルを定義する、デジタル情報製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US25999509P | 2009-11-10 | 2009-11-10 | |
US61/259,995 | 2009-11-10 | ||
PCT/US2010/056281 WO2011060106A1 (en) | 2009-11-10 | 2010-11-10 | Dynamic audio playback of soundtracks for electronic visual works |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013511214A true JP2013511214A (ja) | 2013-03-28 |
Family
ID=43868382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012538959A Pending JP2013511214A (ja) | 2009-11-10 | 2010-11-10 | 電子視覚作品のためのサウンドトラックの動的音声再生 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8527859B2 (ja) |
EP (1) | EP2499626A1 (ja) |
JP (1) | JP2013511214A (ja) |
KR (1) | KR20120091325A (ja) |
CN (1) | CN102687182A (ja) |
WO (1) | WO2011060106A1 (ja) |
Cited By (174)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014519058A (ja) * | 2011-06-03 | 2014-08-07 | アップル インコーポレイテッド | テキストデータとオーディオデータとの間のマッピングの自動作成 |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9535906B2 (en) | 2008-07-31 | 2017-01-03 | Apple Inc. | Mobile device having human language translation capability with positional feedback |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
US9620104B2 (en) | 2013-06-07 | 2017-04-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9626955B2 (en) | 2008-04-05 | 2017-04-18 | Apple Inc. | Intelligent text-to-speech conversion |
US9633674B2 (en) | 2013-06-07 | 2017-04-25 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9633660B2 (en) | 2010-02-25 | 2017-04-25 | Apple Inc. | User profiling for voice input processing |
US9646614B2 (en) | 2000-03-16 | 2017-05-09 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9798393B2 (en) | 2011-08-29 | 2017-10-24 | Apple Inc. | Text correction processing |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9953088B2 (en) | 2012-05-14 | 2018-04-24 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US9966068B2 (en) | 2013-06-08 | 2018-05-08 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US10083690B2 (en) | 2014-05-30 | 2018-09-25 | Apple Inc. | Better resolution when referencing to concepts |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10089072B2 (en) | 2016-06-11 | 2018-10-02 | Apple Inc. | Intelligent device arbitration and control |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10169329B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Exemplar-based natural language processing |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10185542B2 (en) | 2013-06-09 | 2019-01-22 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10283110B2 (en) | 2009-07-02 | 2019-05-07 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10297253B2 (en) | 2016-06-11 | 2019-05-21 | Apple Inc. | Application integration with a digital assistant |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US10332518B2 (en) | 2017-05-09 | 2019-06-25 | Apple Inc. | User interface for correcting recognition errors |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10403283B1 (en) | 2018-06-01 | 2019-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10521466B2 (en) | 2016-06-11 | 2019-12-31 | Apple Inc. | Data driven natural language event detection and classification |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US10568032B2 (en) | 2007-04-03 | 2020-02-18 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10607140B2 (en) | 2010-01-25 | 2020-03-31 | Newvaluexchange Ltd. | Apparatuses, methods and systems for a digital conversation management platform |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10643611B2 (en) | 2008-10-02 | 2020-05-05 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10684703B2 (en) | 2018-06-01 | 2020-06-16 | Apple Inc. | Attention aware virtual assistant dismissal |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10714117B2 (en) | 2013-02-07 | 2020-07-14 | Apple Inc. | Voice trigger for a digital assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10748546B2 (en) | 2017-05-16 | 2020-08-18 | Apple Inc. | Digital assistant services based on device capabilities |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10789945B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Low-latency intelligent automated assistant |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11010127B2 (en) | 2015-06-29 | 2021-05-18 | Apple Inc. | Virtual assistant for media playback |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US11023513B2 (en) | 2007-12-20 | 2021-06-01 | Apple Inc. | Method and apparatus for searching using an active ontology |
US11070949B2 (en) | 2015-05-27 | 2021-07-20 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display |
US11069336B2 (en) | 2012-03-02 | 2021-07-20 | Apple Inc. | Systems and methods for name pronunciation |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11217251B2 (en) | 2019-05-06 | 2022-01-04 | Apple Inc. | Spoken notifications |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US11237797B2 (en) | 2019-05-31 | 2022-02-01 | Apple Inc. | User activity shortcut suggestions |
US11269678B2 (en) | 2012-05-15 | 2022-03-08 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US11388291B2 (en) | 2013-03-14 | 2022-07-12 | Apple Inc. | System and method for processing voicemail |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11468282B2 (en) | 2015-05-15 | 2022-10-11 | Apple Inc. | Virtual assistant in a communication session |
US11467802B2 (en) | 2017-05-11 | 2022-10-11 | Apple Inc. | Maintaining privacy of personal information |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11495218B2 (en) | 2018-06-01 | 2022-11-08 | Apple Inc. | Virtual assistant operation in multi-device environments |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11532306B2 (en) | 2017-05-16 | 2022-12-20 | Apple Inc. | Detecting a trigger of a digital assistant |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11657813B2 (en) | 2019-05-31 | 2023-05-23 | Apple Inc. | Voice identification in digital assistant systems |
US11696060B2 (en) | 2020-07-21 | 2023-07-04 | Apple Inc. | User identification using headphones |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11765209B2 (en) | 2020-05-11 | 2023-09-19 | Apple Inc. | Digital assistant hardware abstraction |
US11790914B2 (en) | 2019-06-01 | 2023-10-17 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11798547B2 (en) | 2013-03-15 | 2023-10-24 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US11809483B2 (en) | 2015-09-08 | 2023-11-07 | Apple Inc. | Intelligent automated assistant for media search and playback |
US11838734B2 (en) | 2020-07-20 | 2023-12-05 | Apple Inc. | Multi-device audio adjustment coordination |
US11853536B2 (en) | 2015-09-08 | 2023-12-26 | Apple Inc. | Intelligent automated assistant in a media environment |
US11886805B2 (en) | 2015-11-09 | 2024-01-30 | Apple Inc. | Unconventional virtual assistant interactions |
US11914848B2 (en) | 2020-05-11 | 2024-02-27 | Apple Inc. | Providing relevant data items based on context |
US12010262B2 (en) | 2013-08-06 | 2024-06-11 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US12014118B2 (en) | 2017-05-15 | 2024-06-18 | Apple Inc. | Multi-modal interfaces having selection disambiguation and text modification capability |
Families Citing this family (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5816085B2 (ja) | 2008-07-04 | 2015-11-17 | ブックトラック ホールディングス リミテッド | サウンドトラックを作成してプレイする方法及びシステム |
KR101702659B1 (ko) * | 2009-10-30 | 2017-02-06 | 삼성전자주식회사 | 동영상 콘텐츠와 전자책 콘텐츠의 동기화 장치와 방법 및 시스템 |
US20130297599A1 (en) * | 2009-11-10 | 2013-11-07 | Dulcetta Inc. | Music management for adaptive distraction reduction |
US8527859B2 (en) * | 2009-11-10 | 2013-09-03 | Dulcetta, Inc. | Dynamic audio playback of soundtracks for electronic visual works |
US20120001923A1 (en) * | 2010-07-03 | 2012-01-05 | Sara Weinzimmer | Sound-enhanced ebook with sound events triggered by reader progress |
KR101058268B1 (ko) * | 2010-08-03 | 2011-08-22 | 안명환 | 비가독부를 구비한 이동단말기 |
US9535884B1 (en) | 2010-09-30 | 2017-01-03 | Amazon Technologies, Inc. | Finding an end-of-body within content |
US9645986B2 (en) | 2011-02-24 | 2017-05-09 | Google Inc. | Method, medium, and system for creating an electronic book with an umbrella policy |
US8935259B2 (en) | 2011-06-20 | 2015-01-13 | Google Inc | Text suggestions for images |
EP2737481A4 (en) * | 2011-07-26 | 2016-06-22 | Booktrack Holdings Ltd | TONGUE FOR ELECTRONIC TEXTS |
US8612584B2 (en) * | 2011-08-29 | 2013-12-17 | Google Inc. | Using eBook reading data to generate time-based information |
US9141404B2 (en) | 2011-10-24 | 2015-09-22 | Google Inc. | Extensible framework for ereader tools |
US20130117670A1 (en) * | 2011-11-04 | 2013-05-09 | Barnesandnoble.Com Llc | System and method for creating recordings associated with electronic publication |
GB2510744A (en) * | 2011-11-04 | 2014-08-13 | Barnesandnoble Com Llc | System and method for creating recordings associated with electronic publication |
US9031493B2 (en) | 2011-11-18 | 2015-05-12 | Google Inc. | Custom narration of electronic books |
US20130131849A1 (en) * | 2011-11-21 | 2013-05-23 | Shadi Mere | System for adapting music and sound to digital text, for electronic devices |
US9229231B2 (en) | 2011-12-07 | 2016-01-05 | Microsoft Technology Licensing, Llc | Updating printed content with personalized virtual data |
US9183807B2 (en) | 2011-12-07 | 2015-11-10 | Microsoft Technology Licensing, Llc | Displaying virtual data as printed content |
US9182815B2 (en) | 2011-12-07 | 2015-11-10 | Microsoft Technology Licensing, Llc | Making static printed content dynamic with virtual data |
US9213705B1 (en) | 2011-12-19 | 2015-12-15 | Audible, Inc. | Presenting content related to primary audio content |
EP2608002A1 (en) * | 2011-12-21 | 2013-06-26 | France Telecom | Method for determining a reading speed of a section of an electronic content |
US20130268826A1 (en) * | 2012-04-06 | 2013-10-10 | Google Inc. | Synchronizing progress in audio and text versions of electronic books |
US9165381B2 (en) | 2012-05-31 | 2015-10-20 | Microsoft Technology Licensing, Llc | Augmented books in a mixed reality environment |
US8933312B2 (en) * | 2012-06-01 | 2015-01-13 | Makemusic, Inc. | Distribution of audio sheet music as an electronic book |
US9141257B1 (en) * | 2012-06-18 | 2015-09-22 | Audible, Inc. | Selecting and conveying supplemental content |
US9535885B2 (en) | 2012-06-28 | 2017-01-03 | International Business Machines Corporation | Dynamically customizing a digital publication |
US20140040715A1 (en) * | 2012-07-25 | 2014-02-06 | Oliver S. Younge | Application for synchronizing e-books with original or custom-created scores |
CN103680562B (zh) * | 2012-09-03 | 2017-03-22 | 腾讯科技(深圳)有限公司 | 音频文件的布点实现方法和装置 |
US9047356B2 (en) | 2012-09-05 | 2015-06-02 | Google Inc. | Synchronizing multiple reading positions in electronic books |
US9544204B1 (en) * | 2012-09-17 | 2017-01-10 | Amazon Technologies, Inc. | Determining the average reading speed of a user |
US9575960B1 (en) * | 2012-09-17 | 2017-02-21 | Amazon Technologies, Inc. | Auditory enhancement using word analysis |
US9123053B2 (en) | 2012-12-10 | 2015-09-01 | Google Inc. | Analyzing reading metrics to generate action information |
CN103020226A (zh) * | 2012-12-12 | 2013-04-03 | 北京百度网讯科技有限公司 | 一种获取搜索结果的方法和装置 |
US20140173441A1 (en) * | 2012-12-19 | 2014-06-19 | Hcl Technologies Limited | Method and system for inserting immersive contents into eBook |
US9900720B2 (en) * | 2013-03-28 | 2018-02-20 | Dolby Laboratories Licensing Corporation | Using single bitstream to produce tailored audio device mixes |
CN104168174A (zh) * | 2013-05-16 | 2014-11-26 | 阿里巴巴集团控股有限公司 | 一种传输信息的方法及装置 |
US9317486B1 (en) | 2013-06-07 | 2016-04-19 | Audible, Inc. | Synchronizing playback of digital content with captured physical content |
US9836271B2 (en) | 2013-07-17 | 2017-12-05 | Booktrack Holdings Limited | Delivery of synchronised soundtracks for electronic media content |
US9898077B2 (en) | 2013-09-18 | 2018-02-20 | Booktrack Holdings Limited | Playback system for synchronised soundtracks for electronic media content |
US20150269133A1 (en) * | 2014-03-19 | 2015-09-24 | International Business Machines Corporation | Electronic book reading incorporating added environmental feel factors |
US10049477B1 (en) | 2014-06-27 | 2018-08-14 | Google Llc | Computer-assisted text and visual styling for images |
CN104166689B (zh) * | 2014-07-28 | 2018-04-06 | 小米科技有限责任公司 | 电子书籍的呈现方法及装置 |
US20160182435A1 (en) * | 2014-12-23 | 2016-06-23 | Sony Corporation | Socially acceptable display of messaging |
CN105261374A (zh) * | 2015-09-23 | 2016-01-20 | 海信集团有限公司 | 跨媒体的情感关联方法和系统 |
US20170116047A1 (en) * | 2015-10-25 | 2017-04-27 | Khozem Z. Dohadwala | Further applications of Reading State control - A method for repositioning reading material on electronic devices |
CN106708894B (zh) * | 2015-11-17 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 电子书配置背景音乐的方法和装置 |
US10261963B2 (en) * | 2016-01-04 | 2019-04-16 | Gracenote, Inc. | Generating and distributing playlists with related music and stories |
US10042880B1 (en) * | 2016-01-06 | 2018-08-07 | Amazon Technologies, Inc. | Automated identification of start-of-reading location for ebooks |
US20180032305A1 (en) * | 2016-07-29 | 2018-02-01 | Paul Charles Cameron | Systems and methods for automatic-creation of soundtracks for text |
US20180032611A1 (en) * | 2016-07-29 | 2018-02-01 | Paul Charles Cameron | Systems and methods for automatic-generation of soundtracks for live speech audio |
US10698951B2 (en) | 2016-07-29 | 2020-06-30 | Booktrack Holdings Limited | Systems and methods for automatic-creation of soundtracks for speech audio |
CN106960051B (zh) * | 2017-03-31 | 2019-12-10 | 掌阅科技股份有限公司 | 基于电子书的音频播放方法、装置和终端设备 |
CN110998726B (zh) * | 2017-06-29 | 2021-09-17 | 杜比国际公司 | 用于使外部内容适配视频流的方法、系统和计算机可读媒体 |
CN109543671B (zh) * | 2018-09-30 | 2021-03-02 | 阿里巴巴(中国)有限公司 | 点读方法、点读笔、服务器数据处理方法及点读系统 |
CN109493839B (zh) * | 2018-11-12 | 2024-01-23 | 平安科技(深圳)有限公司 | 基于语音合成的空气质量展示方法、装置及终端设备 |
CN109994000B (zh) * | 2019-03-28 | 2021-10-19 | 掌阅科技股份有限公司 | 一种伴读方法、电子设备及计算机存储介质 |
US12051133B2 (en) * | 2021-06-01 | 2024-07-30 | Apple Inc. | Color treatment and color normalization for digital assets |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4305131A (en) * | 1979-02-05 | 1981-12-08 | Best Robert M | Dialog between TV movies and human viewers |
US5484292A (en) * | 1989-08-21 | 1996-01-16 | Mctaggart; Stephen I. | Apparatus for combining audio and visual indicia |
US5209665A (en) * | 1989-10-12 | 1993-05-11 | Sight & Sound Incorporated | Interactive audio visual work |
JP3120085B2 (ja) * | 1991-11-21 | 2000-12-25 | 株式会社セガ | 電子装置及び情報担体 |
US5437552A (en) * | 1993-08-13 | 1995-08-01 | Western Publishing Co., Inc. | Interactive audio-visual work |
US5649234A (en) * | 1994-07-07 | 1997-07-15 | Time Warner Interactive Group, Inc. | Method and apparatus for encoding graphical cues on a compact disc synchronized with the lyrics of a song to be played back |
US6199076B1 (en) * | 1996-10-02 | 2001-03-06 | James Logan | Audio program player including a dynamic program selection controller |
US5897324A (en) * | 1997-02-03 | 1999-04-27 | Atop Technologies, Inc. | Multimedia-book operable with removable data storage media implemented with universal interfacing book-adapting processor |
US6424996B1 (en) * | 1998-11-25 | 2002-07-23 | Nexsys Electronics, Inc. | Medical network system and method for transfer of information |
US6529920B1 (en) * | 1999-03-05 | 2003-03-04 | Audiovelocity, Inc. | Multimedia linking device and method |
US7149690B2 (en) * | 1999-09-09 | 2006-12-12 | Lucent Technologies Inc. | Method and apparatus for interactive language instruction |
US6598074B1 (en) * | 1999-09-23 | 2003-07-22 | Rocket Network, Inc. | System and method for enabling multimedia production collaboration over a network |
WO2001091028A1 (en) * | 2000-05-20 | 2001-11-29 | Leem Young Hie | On demand contents providing method and system |
US7478047B2 (en) * | 2000-11-03 | 2009-01-13 | Zoesis, Inc. | Interactive character system |
FI20002828A (fi) * | 2000-12-22 | 2002-06-23 | Nokia Corp | Menetelmä ja järjestelmä tunnetilan ilmaisemiseksi puhelimella tapahtuvassa viestinnässä |
US20060292049A1 (en) * | 2003-09-04 | 2006-12-28 | Tetsuya Nagasaka | Process for producing rutile |
US20050186548A1 (en) * | 2004-02-25 | 2005-08-25 | Barbara Tomlinson | Multimedia interactive role play system |
NO320758B1 (no) * | 2004-07-23 | 2006-01-23 | Telenor Asa | Anordning og fremgangsmate for gjengivelse av audiovisuelt innhold |
US7735012B2 (en) * | 2004-11-04 | 2010-06-08 | Apple Inc. | Audio user interface for computing devices |
US20080141180A1 (en) * | 2005-04-07 | 2008-06-12 | Iofy Corporation | Apparatus and Method for Utilizing an Information Unit to Provide Navigation Features on a Device |
US20080120342A1 (en) * | 2005-04-07 | 2008-05-22 | Iofy Corporation | System and Method for Providing Data to be Used in a Presentation on a Device |
JP4382045B2 (ja) * | 2006-01-24 | 2009-12-09 | シャープ株式会社 | データ出力装置、データ出力方法、データ出力プログラム、および記録媒体 |
US7790974B2 (en) * | 2006-05-01 | 2010-09-07 | Microsoft Corporation | Metadata-based song creation and editing |
US20100149933A1 (en) | 2007-08-23 | 2010-06-17 | Leonard Cervera Navas | Method and system for adapting the reproduction speed of a sound track to a user's text reading speed |
WO2009086308A1 (en) | 2007-12-21 | 2009-07-09 | Booksync, Llc | Method and apparatus for integrating audio and/or video with a book |
JP5816085B2 (ja) * | 2008-07-04 | 2015-11-17 | ブックトラック ホールディングス リミテッド | サウンドトラックを作成してプレイする方法及びシステム |
US9386139B2 (en) * | 2009-03-20 | 2016-07-05 | Nokia Technologies Oy | Method and apparatus for providing an emotion-based user interface |
US20100332225A1 (en) * | 2009-06-29 | 2010-12-30 | Nexidia Inc. | Transcript alignment |
US8527859B2 (en) * | 2009-11-10 | 2013-09-03 | Dulcetta, Inc. | Dynamic audio playback of soundtracks for electronic visual works |
US20110153330A1 (en) * | 2009-11-27 | 2011-06-23 | i-SCROLL | System and method for rendering text synchronized audio |
US8634701B2 (en) * | 2009-12-04 | 2014-01-21 | Lg Electronics Inc. | Digital data reproducing apparatus and corresponding method for reproducing content based on user characteristics |
US8564421B2 (en) * | 2010-04-30 | 2013-10-22 | Blackberry Limited | Method and apparatus for generating an audio notification file |
US8434001B2 (en) * | 2010-06-03 | 2013-04-30 | Rhonda Enterprises, Llc | Systems and methods for presenting a content summary of a media item to a user based on a position within the media item |
-
2010
- 2010-11-10 US US12/943,917 patent/US8527859B2/en not_active Expired - Fee Related
- 2010-11-10 EP EP10810833A patent/EP2499626A1/en not_active Withdrawn
- 2010-11-10 JP JP2012538959A patent/JP2013511214A/ja active Pending
- 2010-11-10 KR KR1020127014737A patent/KR20120091325A/ko not_active Application Discontinuation
- 2010-11-10 CN CN2010800607993A patent/CN102687182A/zh active Pending
- 2010-11-10 WO PCT/US2010/056281 patent/WO2011060106A1/en active Application Filing
-
2013
- 2013-08-26 US US14/010,286 patent/US20130346838A1/en not_active Abandoned
Cited By (301)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9646614B2 (en) | 2000-03-16 | 2017-05-09 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US11928604B2 (en) | 2005-09-08 | 2024-03-12 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US11671920B2 (en) | 2007-04-03 | 2023-06-06 | Apple Inc. | Method and system for operating a multifunction portable electronic device using voice-activation |
US11979836B2 (en) | 2007-04-03 | 2024-05-07 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10568032B2 (en) | 2007-04-03 | 2020-02-18 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US11023513B2 (en) | 2007-12-20 | 2021-06-01 | Apple Inc. | Method and apparatus for searching using an active ontology |
US10381016B2 (en) | 2008-01-03 | 2019-08-13 | Apple Inc. | Methods and apparatus for altering audio output signals |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US9626955B2 (en) | 2008-04-05 | 2017-04-18 | Apple Inc. | Intelligent text-to-speech conversion |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
US9535906B2 (en) | 2008-07-31 | 2017-01-03 | Apple Inc. | Mobile device having human language translation capability with positional feedback |
US10108612B2 (en) | 2008-07-31 | 2018-10-23 | Apple Inc. | Mobile device having human language translation capability with positional feedback |
US11900936B2 (en) | 2008-10-02 | 2024-02-13 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10643611B2 (en) | 2008-10-02 | 2020-05-05 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11348582B2 (en) | 2008-10-02 | 2022-05-31 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10475446B2 (en) | 2009-06-05 | 2019-11-12 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US10283110B2 (en) | 2009-07-02 | 2019-05-07 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US9548050B2 (en) | 2010-01-18 | 2017-01-17 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US12087308B2 (en) | 2010-01-18 | 2024-09-10 | Apple Inc. | Intelligent automated assistant |
US10741185B2 (en) | 2010-01-18 | 2020-08-11 | Apple Inc. | Intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US11410053B2 (en) | 2010-01-25 | 2022-08-09 | Newvaluexchange Ltd. | Apparatuses, methods and systems for a digital conversation management platform |
US10984327B2 (en) | 2010-01-25 | 2021-04-20 | New Valuexchange Ltd. | Apparatuses, methods and systems for a digital conversation management platform |
US10607141B2 (en) | 2010-01-25 | 2020-03-31 | Newvaluexchange Ltd. | Apparatuses, methods and systems for a digital conversation management platform |
US10984326B2 (en) | 2010-01-25 | 2021-04-20 | Newvaluexchange Ltd. | Apparatuses, methods and systems for a digital conversation management platform |
US10607140B2 (en) | 2010-01-25 | 2020-03-31 | Newvaluexchange Ltd. | Apparatuses, methods and systems for a digital conversation management platform |
US9633660B2 (en) | 2010-02-25 | 2017-04-25 | Apple Inc. | User profiling for voice input processing |
US10692504B2 (en) | 2010-02-25 | 2020-06-23 | Apple Inc. | User profiling for voice input processing |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
US10417405B2 (en) | 2011-03-21 | 2019-09-17 | Apple Inc. | Device access using voice authentication |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10102359B2 (en) | 2011-03-21 | 2018-10-16 | Apple Inc. | Device access using voice authentication |
US11120372B2 (en) | 2011-06-03 | 2021-09-14 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US11350253B2 (en) | 2011-06-03 | 2022-05-31 | Apple Inc. | Active transport based notifications |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10672399B2 (en) | 2011-06-03 | 2020-06-02 | Apple Inc. | Switching between text data and audio data based on a mapping |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
JP2014519058A (ja) * | 2011-06-03 | 2014-08-07 | アップル インコーポレイテッド | テキストデータとオーディオデータとの間のマッピングの自動作成 |
US9798393B2 (en) | 2011-08-29 | 2017-10-24 | Apple Inc. | Text correction processing |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US11069336B2 (en) | 2012-03-02 | 2021-07-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9953088B2 (en) | 2012-05-14 | 2018-04-24 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US11321116B2 (en) | 2012-05-15 | 2022-05-03 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US11269678B2 (en) | 2012-05-15 | 2022-03-08 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
US10714117B2 (en) | 2013-02-07 | 2020-07-14 | Apple Inc. | Voice trigger for a digital assistant |
US11862186B2 (en) | 2013-02-07 | 2024-01-02 | Apple Inc. | Voice trigger for a digital assistant |
US11636869B2 (en) | 2013-02-07 | 2023-04-25 | Apple Inc. | Voice trigger for a digital assistant |
US12009007B2 (en) | 2013-02-07 | 2024-06-11 | Apple Inc. | Voice trigger for a digital assistant |
US10978090B2 (en) | 2013-02-07 | 2021-04-13 | Apple Inc. | Voice trigger for a digital assistant |
US11557310B2 (en) | 2013-02-07 | 2023-01-17 | Apple Inc. | Voice trigger for a digital assistant |
US11388291B2 (en) | 2013-03-14 | 2022-07-12 | Apple Inc. | System and method for processing voicemail |
US11798547B2 (en) | 2013-03-15 | 2023-10-24 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
US9633674B2 (en) | 2013-06-07 | 2017-04-25 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9620104B2 (en) | 2013-06-07 | 2017-04-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US10657961B2 (en) | 2013-06-08 | 2020-05-19 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US9966068B2 (en) | 2013-06-08 | 2018-05-08 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US11727219B2 (en) | 2013-06-09 | 2023-08-15 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10185542B2 (en) | 2013-06-09 | 2019-01-22 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US12073147B2 (en) | 2013-06-09 | 2024-08-27 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US12010262B2 (en) | 2013-08-06 | 2024-06-11 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US10497365B2 (en) | 2014-05-30 | 2019-12-03 | Apple Inc. | Multi-command single utterance input method |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US10169329B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Exemplar-based natural language processing |
US12067990B2 (en) | 2014-05-30 | 2024-08-20 | Apple Inc. | Intelligent assistant for home automation |
US11699448B2 (en) | 2014-05-30 | 2023-07-11 | Apple Inc. | Intelligent assistant for home automation |
US10417344B2 (en) | 2014-05-30 | 2019-09-17 | Apple Inc. | Exemplar-based natural language processing |
US11133008B2 (en) | 2014-05-30 | 2021-09-28 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10878809B2 (en) | 2014-05-30 | 2020-12-29 | Apple Inc. | Multi-command single utterance input method |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US11257504B2 (en) | 2014-05-30 | 2022-02-22 | Apple Inc. | Intelligent assistant for home automation |
US10083690B2 (en) | 2014-05-30 | 2018-09-25 | Apple Inc. | Better resolution when referencing to concepts |
US11670289B2 (en) | 2014-05-30 | 2023-06-06 | Apple Inc. | Multi-command single utterance input method |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US11810562B2 (en) | 2014-05-30 | 2023-11-07 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10657966B2 (en) | 2014-05-30 | 2020-05-19 | Apple Inc. | Better resolution when referencing to concepts |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10714095B2 (en) | 2014-05-30 | 2020-07-14 | Apple Inc. | Intelligent assistant for home automation |
US12118999B2 (en) | 2014-05-30 | 2024-10-15 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11838579B2 (en) | 2014-06-30 | 2023-12-05 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US11516537B2 (en) | 2014-06-30 | 2022-11-29 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9668024B2 (en) | 2014-06-30 | 2017-05-30 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10431204B2 (en) | 2014-09-11 | 2019-10-01 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10390213B2 (en) | 2014-09-30 | 2019-08-20 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10453443B2 (en) | 2014-09-30 | 2019-10-22 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US11556230B2 (en) | 2014-12-02 | 2023-01-17 | Apple Inc. | Data detection |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US11842734B2 (en) | 2015-03-08 | 2023-12-12 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10311871B2 (en) | 2015-03-08 | 2019-06-04 | Apple Inc. | Competing devices responding to voice triggers |
US10930282B2 (en) | 2015-03-08 | 2021-02-23 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US11087759B2 (en) | 2015-03-08 | 2021-08-10 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US11468282B2 (en) | 2015-05-15 | 2022-10-11 | Apple Inc. | Virtual assistant in a communication session |
US12001933B2 (en) | 2015-05-15 | 2024-06-04 | Apple Inc. | Virtual assistant in a communication session |
US11070949B2 (en) | 2015-05-27 | 2021-07-20 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10681212B2 (en) | 2015-06-05 | 2020-06-09 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11947873B2 (en) | 2015-06-29 | 2024-04-02 | Apple Inc. | Virtual assistant for media playback |
US11010127B2 (en) | 2015-06-29 | 2021-05-18 | Apple Inc. | Virtual assistant for media playback |
US11809483B2 (en) | 2015-09-08 | 2023-11-07 | Apple Inc. | Intelligent automated assistant for media search and playback |
US11550542B2 (en) | 2015-09-08 | 2023-01-10 | Apple Inc. | Zero latency digital assistant |
US11500672B2 (en) | 2015-09-08 | 2022-11-15 | Apple Inc. | Distributed personal assistant |
US11126400B2 (en) | 2015-09-08 | 2021-09-21 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US11853536B2 (en) | 2015-09-08 | 2023-12-26 | Apple Inc. | Intelligent automated assistant in a media environment |
US11954405B2 (en) | 2015-09-08 | 2024-04-09 | Apple Inc. | Zero latency digital assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US12051413B2 (en) | 2015-09-30 | 2024-07-30 | Apple Inc. | Intelligent device identification |
US11526368B2 (en) | 2015-11-06 | 2022-12-13 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11809886B2 (en) | 2015-11-06 | 2023-11-07 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11886805B2 (en) | 2015-11-09 | 2024-01-30 | Apple Inc. | Unconventional virtual assistant interactions |
US10354652B2 (en) | 2015-12-02 | 2019-07-16 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10942703B2 (en) | 2015-12-23 | 2021-03-09 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US11069347B2 (en) | 2016-06-08 | 2021-07-20 | Apple Inc. | Intelligent automated assistant for media exploration |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11037565B2 (en) | 2016-06-10 | 2021-06-15 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US11657820B2 (en) | 2016-06-10 | 2023-05-23 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11749275B2 (en) | 2016-06-11 | 2023-09-05 | Apple Inc. | Application integration with a digital assistant |
US10297253B2 (en) | 2016-06-11 | 2019-05-21 | Apple Inc. | Application integration with a digital assistant |
US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
US10942702B2 (en) | 2016-06-11 | 2021-03-09 | Apple Inc. | Intelligent device arbitration and control |
US11152002B2 (en) | 2016-06-11 | 2021-10-19 | Apple Inc. | Application integration with a digital assistant |
US10521466B2 (en) | 2016-06-11 | 2019-12-31 | Apple Inc. | Data driven natural language event detection and classification |
US11809783B2 (en) | 2016-06-11 | 2023-11-07 | Apple Inc. | Intelligent device arbitration and control |
US10580409B2 (en) | 2016-06-11 | 2020-03-03 | Apple Inc. | Application integration with a digital assistant |
US10089072B2 (en) | 2016-06-11 | 2018-10-02 | Apple Inc. | Intelligent device arbitration and control |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10553215B2 (en) | 2016-09-23 | 2020-02-04 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11656884B2 (en) | 2017-01-09 | 2023-05-23 | Apple Inc. | Application integration with a digital assistant |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10741181B2 (en) | 2017-05-09 | 2020-08-11 | Apple Inc. | User interface for correcting recognition errors |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10332518B2 (en) | 2017-05-09 | 2019-06-25 | Apple Inc. | User interface for correcting recognition errors |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US11467802B2 (en) | 2017-05-11 | 2022-10-11 | Apple Inc. | Maintaining privacy of personal information |
US11599331B2 (en) | 2017-05-11 | 2023-03-07 | Apple Inc. | Maintaining privacy of personal information |
US10847142B2 (en) | 2017-05-11 | 2020-11-24 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10789945B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Low-latency intelligent automated assistant |
US11862151B2 (en) | 2017-05-12 | 2024-01-02 | Apple Inc. | Low-latency intelligent automated assistant |
US11837237B2 (en) | 2017-05-12 | 2023-12-05 | Apple Inc. | User-specific acoustic models |
US11380310B2 (en) | 2017-05-12 | 2022-07-05 | Apple Inc. | Low-latency intelligent automated assistant |
US11538469B2 (en) | 2017-05-12 | 2022-12-27 | Apple Inc. | Low-latency intelligent automated assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US11580990B2 (en) | 2017-05-12 | 2023-02-14 | Apple Inc. | User-specific acoustic models |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US12014118B2 (en) | 2017-05-15 | 2024-06-18 | Apple Inc. | Multi-modal interfaces having selection disambiguation and text modification capability |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10909171B2 (en) | 2017-05-16 | 2021-02-02 | Apple Inc. | Intelligent automated assistant for media exploration |
US12026197B2 (en) | 2017-05-16 | 2024-07-02 | Apple Inc. | Intelligent automated assistant for media exploration |
US11675829B2 (en) | 2017-05-16 | 2023-06-13 | Apple Inc. | Intelligent automated assistant for media exploration |
US11532306B2 (en) | 2017-05-16 | 2022-12-20 | Apple Inc. | Detecting a trigger of a digital assistant |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10748546B2 (en) | 2017-05-16 | 2020-08-18 | Apple Inc. | Digital assistant services based on device capabilities |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US11217255B2 (en) | 2017-05-16 | 2022-01-04 | Apple Inc. | Far-field extension for digital assistant services |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US11710482B2 (en) | 2018-03-26 | 2023-07-25 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US11907436B2 (en) | 2018-05-07 | 2024-02-20 | Apple Inc. | Raise to speak |
US11854539B2 (en) | 2018-05-07 | 2023-12-26 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11900923B2 (en) | 2018-05-07 | 2024-02-13 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11169616B2 (en) | 2018-05-07 | 2021-11-09 | Apple Inc. | Raise to speak |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11487364B2 (en) | 2018-05-07 | 2022-11-01 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US11360577B2 (en) | 2018-06-01 | 2022-06-14 | Apple Inc. | Attention aware virtual assistant dismissal |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US12067985B2 (en) | 2018-06-01 | 2024-08-20 | Apple Inc. | Virtual assistant operations in multi-device environments |
US11009970B2 (en) | 2018-06-01 | 2021-05-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US12061752B2 (en) | 2018-06-01 | 2024-08-13 | Apple Inc. | Attention aware virtual assistant dismissal |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11431642B2 (en) | 2018-06-01 | 2022-08-30 | Apple Inc. | Variable latency device coordination |
US11495218B2 (en) | 2018-06-01 | 2022-11-08 | Apple Inc. | Virtual assistant operation in multi-device environments |
US10984798B2 (en) | 2018-06-01 | 2021-04-20 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10720160B2 (en) | 2018-06-01 | 2020-07-21 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10684703B2 (en) | 2018-06-01 | 2020-06-16 | Apple Inc. | Attention aware virtual assistant dismissal |
US11630525B2 (en) | 2018-06-01 | 2023-04-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US10403283B1 (en) | 2018-06-01 | 2019-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US12080287B2 (en) | 2018-06-01 | 2024-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10944859B2 (en) | 2018-06-03 | 2021-03-09 | Apple Inc. | Accelerated task performance |
US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11893992B2 (en) | 2018-09-28 | 2024-02-06 | Apple Inc. | Multi-modal inputs for voice commands |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11783815B2 (en) | 2019-03-18 | 2023-10-10 | Apple Inc. | Multimodality in digital assistant systems |
US11705130B2 (en) | 2019-05-06 | 2023-07-18 | Apple Inc. | Spoken notifications |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11217251B2 (en) | 2019-05-06 | 2022-01-04 | Apple Inc. | Spoken notifications |
US11675491B2 (en) | 2019-05-06 | 2023-06-13 | Apple Inc. | User configurable task triggers |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11888791B2 (en) | 2019-05-21 | 2024-01-30 | Apple Inc. | Providing message response suggestions |
US11360739B2 (en) | 2019-05-31 | 2022-06-14 | Apple Inc. | User activity shortcut suggestions |
US11657813B2 (en) | 2019-05-31 | 2023-05-23 | Apple Inc. | Voice identification in digital assistant systems |
US11237797B2 (en) | 2019-05-31 | 2022-02-01 | Apple Inc. | User activity shortcut suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11790914B2 (en) | 2019-06-01 | 2023-10-17 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11765209B2 (en) | 2020-05-11 | 2023-09-19 | Apple Inc. | Digital assistant hardware abstraction |
US11924254B2 (en) | 2020-05-11 | 2024-03-05 | Apple Inc. | Digital assistant hardware abstraction |
US11914848B2 (en) | 2020-05-11 | 2024-02-27 | Apple Inc. | Providing relevant data items based on context |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11838734B2 (en) | 2020-07-20 | 2023-12-05 | Apple Inc. | Multi-device audio adjustment coordination |
US11750962B2 (en) | 2020-07-21 | 2023-09-05 | Apple Inc. | User identification using headphones |
US11696060B2 (en) | 2020-07-21 | 2023-07-04 | Apple Inc. | User identification using headphones |
Also Published As
Publication number | Publication date |
---|---|
CN102687182A (zh) | 2012-09-19 |
US20130346838A1 (en) | 2013-12-26 |
KR20120091325A (ko) | 2012-08-17 |
WO2011060106A1 (en) | 2011-05-19 |
EP2499626A1 (en) | 2012-09-19 |
US20110195388A1 (en) | 2011-08-11 |
US8527859B2 (en) | 2013-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8527859B2 (en) | Dynamic audio playback of soundtracks for electronic visual works | |
US11914919B2 (en) | Listener-defined controls for music content generation | |
AU2021204836B2 (en) | Rhythmic Synchronization Of Cross Fading For Musical Audio Section Replacement For Multimedia Playback | |
US9355627B2 (en) | System and method for combining a song and non-song musical content | |
US20130297599A1 (en) | Music management for adaptive distraction reduction | |
US7394011B2 (en) | Machine and process for generating music from user-specified criteria | |
AU2016330618A1 (en) | Machines, systems and processes for automated music composition and generation employing linguistic and/or graphical icon based musical experience descriptors | |
CN106708894B (zh) | 电子书配置背景音乐的方法和装置 | |
WO2012114329A1 (en) | System and method for seamless multimedia assembly | |
JP2005321668A (ja) | 情報処理装置および方法、並びにプログラム | |
US9626148B2 (en) | Creating an event driven audio file | |
Sporka et al. | Design and implementation of a non-linear symphonic soundtrack of a video game | |
Collins | BBCut2: Integrating beat tracking and on-the-fly event analysis | |
Goto | OngaCREST Project: building a similarity-aware information environment for a content-symbiotic society | |
US20160212242A1 (en) | Specification and deployment of media resources | |
US9471205B1 (en) | Computer-implemented method for providing a media accompaniment for segmented activities | |
Meng | MashupMuse: A Web Application for Easier Music Mashup Creation | |
Vlieg et al. | The Noisy Cat |