JPH11327870A - ドキュメント読み上げ装置、読み上げ制御方法及び記 録媒体 - Google Patents
ドキュメント読み上げ装置、読み上げ制御方法及び記 録媒体Info
- Publication number
- JPH11327870A JPH11327870A JP10134085A JP13408598A JPH11327870A JP H11327870 A JPH11327870 A JP H11327870A JP 10134085 A JP10134085 A JP 10134085A JP 13408598 A JP13408598 A JP 13408598A JP H11327870 A JPH11327870 A JP H11327870A
- Authority
- JP
- Japan
- Prior art keywords
- reading
- document
- attribute
- aloud
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Abstract
ための属性を予め文書中で指定する必要のないようにす
る。 【解決手段】属性付きのドキュメントを利用することに
着眼し、属性の内容を解析して、音声合成手段によりド
キュメント中のテキスト部分を読み上げる装置であり、
前記属性は、読み上げ条件とは無関係に定められたもの
であり、ドキュメント全体に対する読み上げ条件を基本
読み上げ条件設定手段3で設定し、属性毎の読み上げ条
件を個別読み上げ条件設定手段5で設定し、ドキュメン
ト読み上げの際に、原則として前記基本読み上げ条件設
定手段で設定した基本読み上げ条件を参照してテキスト
部分を読み上げるとともに、個別読み上げ条件を有する
テキスト部分では基本読み上げ条件に優先して個別読み
上げ条件を参照して読み分け手段15で読み分ける。
Description
力されたドキュメントのテキスト文書を読み上げるドキ
ュメント読み上げ装置及び読み上げ制御方法に関する。
て、例えば、特開平8−272388号公報に記載され
た装置が知られている。
データを合成音声にして出力する音声合成装置として、
テキストデータに制御情報を組み込む組み込み手段と、
前記制御情報に対応した音質で前記テキストデータに基
づく音声を合成し出力する出力手段を備えている。
置では、ある音質である部分を読み上げるようにするた
め、予めテキストデータに制御情報を組み込む必要があ
る。
TML文を読み込んだとき、その一分を男声で読み上
げ、他の部分を女声で読み上げたい場合など、その所望
の部分に制御情報をいちいちドキュメント中に書き込む
必要があり、きわめて面倒であった。
ので、読み上げ条件を付与する制御情報をドキュメント
中にいちいち組み込む必要のない技術を提供することを
課題とする。
決するため、以下の手段を採用した。
TF文などでは、音声の読み上げとは関係なく、予め、
ドキュメント中のテキスト文についての修飾条件等を定
める属性データ(以下、これをタグということがある)
が含まれていることに着眼し、このタグを読み上げの制
御情報として利用することに着眼したものである。
置では、属性付きのドキュメントの内容を解析して、音
声合成手段によりドキュメント中のテキスト部分を読み
上げる装置において、前記属性は、読み上げ条件とは無
関係に定められたものであり、ドキュメント全体に対す
る読み上げ条件を設定する基本読み上げ条件設定手段
と、属性毎に読み上げ条件を設定する個別読み上げ条件
設定手段と、ドキュメント読み上げの際に、原則として
前記基本読み上げ条件設定手段で設定した基本読み上げ
条件を参照してテキスト部分を読み上げるとともに、個
別読み上げ条件を有するテキスト部分では基本読み上げ
条件に優先して個別読み上げ条件を参照して読み分け
る、読み分け手段と、を備えたことを特徴とする。
も、読み上げ音声の音質(例えば、声の高さ、男声、女
声の区別)、音量(声の大きさ)、アクセント(声の抑
揚や方言)、読み上げる・読み上げないことの選択、の
いずれかである。例えば、HTML文書で、「<h2>本ホ
ームページの紹介</h2>」という文があったすると、<h2
></h2>は、その間に存在する文字の表示時の大きさを指
定するタグである。そこで、この<h2></h2>に関連付け
て、その間の文字を男声にて読むというようにする。
性毎に設定される読み上げ条件は、前記属性の本来の意
味と関連付けられ、読み上げた音声から、属性が指定す
る本来の意味を想起可能とするようにすることが好適で
ある。
を示し、h2はh3より大きく、h1より小さく表示される。
そこで、h2で指定された文書を読み上げるとき、h3より
大きく、h1より小さい音声で読み上げるようにすると、
HTMLの取り決めに従った読み上げが可能であり、読
み上げ音声を聞くだけで視覚上の文書を想起することが
可能となる。
み上げ条件記憶手段を備えることが好ましい。
ドキュメント全体に対する読み上げ条件を基本読み上げ
条件設定手段で設定し、次いで、個別読み上げ条件設定
手段と属性毎に読み上げ条件を設定する。
ない部分では、原則として前記基本読み上げ条件設定手
段で設定した基本読み上げ条件を参照してテキスト部分
を読み上げる。
情報がわかる。HTMLの場合だと、ページのタイトル
部、見出し、内容のテキスト、リンク、メール宛先他、
いろいろなタグがドキュメント中に記述され、画面上で
は、タグに応じて文字サイズや色など書き分けられてい
る。しかしながら、従来の読み上げ装置では、すべて同
一の音声によって読み上げるため、これらの情報が欠落
してしまう。本発明では、タグの本来の情報に対応して
読み上げ条件を設定すれば、タグ情報を音声として確認
できる。
えば、ドキュメントの表示を制御するためのものであ
る。また、ドキュメントに付与される属性は、例えば、
ドキュメントがHTML文書である場合は、タグ情報で
ある。
音声合成手段によるドキュメント中のテキスト部分の読
み上げを制御する方法であって、前記ドキュメント中の
該ドキュメントの表示を制御するための属性を判定し、
前記判定結果に基づいて前記属性により表示制御される
テキスト部分の読み上げ条件を変更することを特徴とす
る。
種類に応じて読み上げ条件を変更するようにしてもよ
い。
手段によりドキュメント中のテキスト部分を読み上げさ
せるコンピュータに、前記ドキュメント中の該ドキュメ
ントの表示を制御するための属性を判定させる手順と、
前記判定結果に基づいて前記属性により表示制御される
テキスト部分の読み上げ条件を変更させる手順と、を実
行させるプログラムを記録した記録媒体である。
じて読み上げ条件を変更する手順を実行させるプログラ
ムが更に記録されていてもよい。
を示したものである。
このプログラムをコンピュータのCPU上で実行するこ
とにより、CPU上に図1の機能実現手段が実現され
る。
クやCD−ROMなどの記憶媒体や、インターネット等
のメディアを介してコンピュータに読み込まれたドキュ
メント情報を管理するドキュメント管理手段1が設けら
れている。
ば、HTML文や、RTF文などのドキュメントの読み
込みやダウンロードなどを行うソフトウェアである。
り、コンピュータに読み込まれたドキュメントを解析し
てその属性部分である「タグ」を検出する属性解析手段
2を備えている。そして、ドキュメント管理手段1で読
み込まれたドキュメントと属性解析手段2で解析された
タグを、それぞれ読み上げ対象情報として管理する読み
上げ対象情報管理手段3が設けられている。
ュメント全体に対する読み上げ条件を設定する基本読み
上げ条件設定手段4と、属性毎に読み上げ条件を設定す
る個別読み上げ条件設定手段5と、この個別読み上げ条
件設定手段5に含まれる概念ではあるが、個別読み上げ
条件として特別に、指定した属性のテキスト文書につい
て「読み上げる(ON)」、「読み上げない(OF
F)」の設定を行う個別読み上げON・OFF指定手段
6とが設けられている。
個別読み上げ条件設定手段5と、個別読み上げON・O
FF指定手段6とで設定された各条件を管理し、基本読
み上げ条件I/O手段7と、個別読み上げ条件I/O手
段8と、個別読み上げON・OFF情報I/O手段9を
介して、読み上げ条件記憶手段10としてのハードディ
スクに、前記各条件を書き込み、あるいは、読み出す、
基本読み上げ条件管理手段11、個別読み上げ条件管理
手段12、個別読み上げON・OFF情報管理手段13
がそれぞれ設けられている。
本読み上げ条件管理手段11、個別読み上げ条件管理手
段12、個別読み上げON・OFF情報管理手段13
は、それぞれ、基本読み上げ条件I/O手段7と、個別
読み上げ条件I/O手段8と、個別読み上げON・OF
F情報I/O手段9を介して、読み上げ条件記憶手段1
0としてのハードディスクから前記各条件を読み出し、
音声合成手段14へとその情報を送る。
報管理手段3で管理しているドキュメント情報と、属性
部分である「タグ」とを読み上げ対象とし、まず、前記
基本読み上げ条件設定手段4で設定した基本読み上げ条
件を参照してテキスト部分を読み上げるとともに、個別
読み上げ条件を有するテキスト部分では基本読み上げ条
件に優先して個別読み上げ条件を参照して読み分ける、
読み分け手段15を備えている。
法は、従来より知られた手法を用いるので、ここでは特
に言及しない。
設定した場合の例を示す。図2では、読み上げ条件とし
て、声の大きさ、声の高さ、声の種類(男声・女声)、
声の抑揚である。
件設定手段4により、声の大きさ、声の高さ、声の種類
(男声・女声)、声の抑揚が図2のように設定され、さ
らに、個別読み上げ条件設定手段5により、タグ1〜4
について、それぞれ図2に示した条件が設定される。
から相対指定した場合の図である。ここでは、基本設定
値を標準にして、相対的に示した図である。
読み上げ条件設定手段5と、個別読み上げON・OFF
指定手段6とは、具体的には図4、図5に示したよう
な、入力画面から入力される。
る設定例である。図5は、個別読み上げ条件設定手段5
と、個別読み上げON・OFF指定手段6とによる設定
を示す。ここでは、HTML文書の各タグの名前を読み
分けの対象という欄R1に表示しており、この欄に表示
した名前の実際のタグを欄R1の下の欄R2に表示する
ようになっている。欄R1、R2の右には、読み分け対
象であるタグについて、個々に読み上げるか否かを設定
する個別読み上げON・OFF指定手段6として、読み
上げ指定をするチェックボックスR3を備えている。さ
らに、チェックボックスR3の下には、個別読み上げ条
件設定手段5として、声の大きさ、声の高さ、声の種類
を設定する個別設定チェックボックスR4が設けられ、
個別設定チェックボックスR4は、チェックボックスR
3が「読む」とされた場合に活性化するようになってい
る。
2のように具体的値の設定でもよいし、図3のような基
本設定からの相対指定でもよい。図2の場合は、基本設
定に左右されることなく、タグごとの設定値が保持され
る利点があり、図3の場合は、基本設定からの相対的指
定で行うことができるため、具体的な数値を指示せずに
「普通の部分よりは大きくて高い声で読むようにしよ
う」などという感覚的な指定が可能になる。これらの情
報を用いて、図1のドキュメント管理手段1を用いて入
手したドキュメントデータに対して、属性解析手段2が
タグの解析を行い、その結果を読み上げ対象データとし
て、音声合成手段14に渡す。
設定およびタグ毎の読み上げ音声設定を用いて、音声合
成手段14は、指定された音声属性を用いて、与えられ
た読み上げ対象データを読み上げる。
トに従って説明する。
書の読み上げの例である。図7はHTML文書をブラウ
ザで表示した例であり、図8はそのソースデータであ
る。この例では、すでにHTMLのタグごとの読み上げ
音声の設定は済んでおり、ここでは、図9に示した、お
すすめパターンが設定されているものとする。このおす
すめパターンは、標準モデルとして、読み上げ条件記憶
手段10に予め設定されたパターンである。
理手段1によって図8に示したソースデータをダウンロ
ードしてHTMLファイルとして読み込む。次に、HT
ML属性解析手段2で、HTMLファイルのデータの冒
頭より文字単位で解析を行う。データの中で、“<”と
“>”に挟まれた部分をタグと解釈し、読み分け対象
のタグでなければ無視し、読み分け対象のタグであれ
ば、図10に示した読み上げ対象のテキストを読み上げ
対象情報管理手段3でメモリに格納するとともに(ステ
ップ103)、図11に示した読み上げ補助情報を読み
上げ対象情報管理手段3でメモリに格納する(ステップ
104)。ここで、読み分け補助情報とは、読み上げ対
象テキスト情報での位置と声の設定情報である。
ブル(図9)の「その他のタグ」欄に記載された情報
[男声、大きさ=3,高さ=3]を登録する。最初はこ
の状態で読む。
グは、読み上げ対象外なので、無視する。
グは、読み上げ対象外なので、無視する。次の〈tit
le〉タグは、声の設定テーブル(図9)において、
[読み上げOFF]のため、対応する〈/title〉
タグまで読み飛ばす。次の〈/head〉タグも読み上
げ対象外なので無視する。
グは、読み上げ対象外なので、無視する。
は、読み上げ対象外なので、無視する。次の文章は、読
み上げ対象として、「読み上げ対象テキスト情報」に追
加登録する。
対象として追加登録する。 (7)6行目を処理する。〈comment〉タグは、
声の設定テーブルで[読み上げOFF]設定なので、対
応する〈/comment〉タグまで読み飛ばす。
nter〉の両タグを読み飛ばす。次の〈font s
ize=2〉により、声設定を、(男声、大きさ=2、
高さ=3)に変更して、「読み上げ補助情報」に格納、
また、〈/font〉タグの終了までのテキストを読み
上げ対象として追加登録する。
ze=5〉に対応して(男声、大きさ=5、高さ=4)
に変更して「読み上げ補助情報」に格納、また、〈/f
ont〉タグの終了までのテキストを読み上げ対象とし
て登録する。
て、(男声、大きさ=3,高さ=3)に戻して、テキス
トも登録。
〈br〉タグは無視。 (12)10行目は、「それには、」までを読み上げ対
象テキスト情報に登録。次に〈a href〉に対応し
て、声の設定を初期状態に戻して、以降のテキストを登
録。
〈br〉タグは無視。 (14)12、13行目は、タグを無視して、終了。こ
の結果、「読み上げ対象テキスト情報」、「読み上げ補
助情報」には、下記の情報が格納される。音声合成部
は、これらの情報を解釈しながら、音声合成を行う。
キュメントを構成するタグの情報を用いて、きめ細かい
読み分けが可能となる。例えば、HTMLの「見出し」
部分のみ「読む」指定にしておけば、一般的には大事と
思われる部分だけ抽出して読み上げることになる。ま
た、フォントの大きいところは大きい声で読み上げ、小
さいところは小さい声で読み上げるなどの指定も可能に
なるため、画面を見なくても、一様に読み上げたのでは
伝わらない文章のニュアンスまで音声合成で読み上げる
ことが可能になる。
ント中のタグを解析することにより、さまざまな情報が
わかる。HTMLの場合だと、ページのタイトル部、見
出し、内容のテキスト、リンク、メール宛先他、いろい
ろなタグがドキュメント中に記述され、画面上では、タ
グに応じて文字サイズや色など書き分けられている。
件を、タグの意味内容に応じて、設定する。その設定を
タグ対応であらかじめ図示しないテーブルに記憶してお
けば、タグの解析毎にテーブルを参照して、同一のタグ
は常に同一の音声で読み出したり、文字の大きさに対応
して読み出し音声を大きくしたり小さくすることができ
るので、タグの本来の情報内容に対応して読み上げ条件
を設定することができ、タグ情報を音声として確認でき
る。
定してある属性情報をそのまま利用して、ドキュメント
の読み分けが可能であり、読み分けのための属性情報を
ドキュメント中にいちいち設定する必要がない。
り属性毎に設定される読み上げ条件が、前記属性の本来
の意味と関連付けた場合、読み上げた音声から、属性が
指定する本来の意味を想起可能であり、音声によりドキ
ュメントの読み上げ内容を視覚的に理解できる。
定)を示す図
N・OFF指定手段を示した図
を示した図
た図
図
Claims (10)
- 【請求項1】 属性付きのドキュメントの内容を解析し
て、音声合成手段によりドキュメント中のテキスト部分
を読み上げる装置において、 前記属性は、読み上げ条件とは無関係に定められたもの
であり、 ドキュメント全体に対する読み上げ条件を設定する基本
読み上げ条件設定手段と、 属性毎に読み上げ条件を設定する個別読み上げ条件設定
手段と、 ドキュメント読み上げの際に、原則として前記基本読み
上げ条件設定手段で設定した基本読み上げ条件を参照し
てテキスト部分を読み上げるとともに、個別読み上げ条
件を有するテキスト部分では基本読み上げ条件に優先し
て個別読み上げ条件を参照して読み分ける、読み分け手
段と、 を備えたことを特徴とするドキュメント読み上げ装置。 - 【請求項2】 前記読み上げ条件とは、少なくとも、読
み上げ音声の音質、音量、アクセント、読み上げる・読
み上げないことの選択、のいずれかであることを特徴と
する請求項1記載のドキュメント読み上げ装置。 - 【請求項3】 個別読み上げ条件設定手段により属性毎
に設定される読み上げ条件は、前記属性の本来の意味と
関連付けられ、読み上げた音声から、属性が指定する本
来の意味を想起可能とすることを特徴とする請求項1記
載のドキュメント読み上げ装置。 - 【請求項4】 前記読み上げ条件を記憶しておく読み上
げ条件記憶手段を備えたことを特徴とする請求項1記載
のドキュメント読み上げ装置。 - 【請求項5】 前記属性は、前記ドキュメントの表示を
制御するためのものであることを特徴とする請求項1記
載のドキュメント読み上げ装置。 - 【請求項6】 前記ドキュメントは、HTML文書であ
り、前記属性はタグ情報であることを特徴とする請求項
1記載のドキュメント読み上げ装置。 - 【請求項7】 音声合成手段によるドキュメント中のテ
キスト部分の読み上げを制御する方法であって、 前記ドキュメント中の該ドキュメントの表示を制御する
ための属性を判定し、前記判定結果に基づいて前記属性
により表示制御されるテキスト部分の読み上げ条件を変
更することを特徴とする読み上げ制御方法。 - 【請求項8】 前記属性の種類に応じて前記読み上げ条
件を変更することを特徴とする請求項7記載の読み上げ
制御方法。 - 【請求項9】 音声合成手段によりドキュメント中のテ
キスト部分を読み上げさせるコンピュータに、 前記ドキュメント中の該ドキュメントの表示を制御する
ための属性を判定させる手順と、 前記判定結果に基づいて前記属性により表示制御される
テキスト部分の読み上げ条件を変更させる手順と、を実
行させるプログラムを記録したコンピュータが読み取り
可能な記録媒体。 - 【請求項10】 前記属性の種類に応じて前記読み上げ
条件を変更する手順を実行させる前記プログラムを記録
した請求項9記載のコンピュータ読み取り可能な記録媒
体。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10134085A JPH11327870A (ja) | 1998-05-15 | 1998-05-15 | ドキュメント読み上げ装置、読み上げ制御方法及び記 録媒体 |
PCT/JP1999/001760 WO1999060474A1 (fr) | 1998-05-15 | 1999-04-02 | Dispositif de lecture a haute voix, procede de commande de lecture a haute voix et support d'enregistrement |
EP99910830A EP1077403A4 (en) | 1998-05-15 | 1999-04-02 | HIGH VOICE READING DEVICE, HIGH VOICE READING CONTROL METHOD, AND RECORDING MEDIUM |
US09/709,458 US6397183B1 (en) | 1998-05-15 | 2000-11-13 | Document reading system, read control method, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10134085A JPH11327870A (ja) | 1998-05-15 | 1998-05-15 | ドキュメント読み上げ装置、読み上げ制御方法及び記 録媒体 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006287466A Division JP2007128506A (ja) | 2006-10-23 | 2006-10-23 | ドキュメント読み上げ装置、読み上げ制御方法及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH11327870A true JPH11327870A (ja) | 1999-11-30 |
Family
ID=15120071
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10134085A Pending JPH11327870A (ja) | 1998-05-15 | 1998-05-15 | ドキュメント読み上げ装置、読み上げ制御方法及び記 録媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6397183B1 (ja) |
EP (1) | EP1077403A4 (ja) |
JP (1) | JPH11327870A (ja) |
WO (1) | WO1999060474A1 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002123445A (ja) * | 2000-10-12 | 2002-04-26 | Ntt Docomo Inc | 情報配信サーバおよび情報配信システムならびに情報配信方法 |
WO2003052370A1 (en) * | 2001-12-14 | 2003-06-26 | Canon Kabushiki Kaisha | Information processing apparatus and method, and program |
WO2006008871A1 (ja) * | 2004-07-21 | 2006-01-26 | Matsushita Electric Industrial Co., Ltd. | 音声合成装置 |
WO2006137166A1 (ja) * | 2005-06-20 | 2006-12-28 | Hitachi Government And Public Corporation System Engineering, Ltd. | クライアント端末 |
US7346042B2 (en) | 2000-02-21 | 2008-03-18 | Ntt Docomo, Inc. | Information distributing method, information distributing system, information distributing server, mobile communication network system and communication service providing method |
US9466225B2 (en) | 2012-08-16 | 2016-10-11 | Kabushiki Kaisha Tosihba | Speech learning apparatus and method |
JPWO2015052817A1 (ja) * | 2013-10-10 | 2017-03-09 | 株式会社東芝 | 音訳作業支援装置、音訳作業支援方法及びプログラム |
US10373606B2 (en) | 2015-03-24 | 2019-08-06 | Kabushiki Kaisha Toshiba | Transliteration support device, transliteration support method, and computer program product |
Families Citing this family (129)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
JP2001343989A (ja) * | 2000-03-31 | 2001-12-14 | Tsukuba Seiko Co Ltd | 朗読装置 |
JP2002062889A (ja) * | 2000-08-14 | 2002-02-28 | Pioneer Electronic Corp | 音声合成方法 |
US6856958B2 (en) * | 2000-09-05 | 2005-02-15 | Lucent Technologies Inc. | Methods and apparatus for text to speech processing using language independent prosody markup |
US6513008B2 (en) * | 2001-03-15 | 2003-01-28 | Matsushita Electric Industrial Co., Ltd. | Method and tool for customization of speech synthesizer databases using hierarchical generalized speech templates |
US20040260551A1 (en) * | 2003-06-19 | 2004-12-23 | International Business Machines Corporation | System and method for configuring voice readers using semantic analysis |
US20050096909A1 (en) * | 2003-10-29 | 2005-05-05 | Raimo Bakis | Systems and methods for expressive text-to-speech |
US8103505B1 (en) * | 2003-11-19 | 2012-01-24 | Apple Inc. | Method and apparatus for speech synthesis using paralinguistic variation |
US20060106618A1 (en) | 2004-10-29 | 2006-05-18 | Microsoft Corporation | System and method for converting text to speech |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US20120311585A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Organizing task items that represent tasks to perform |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8996384B2 (en) * | 2009-10-30 | 2015-03-31 | Vocollect, Inc. | Transforming components of a web page to voice prompts |
US9811602B2 (en) * | 2009-12-30 | 2017-11-07 | International Business Machines Corporation | Method and apparatus for defining screen reader functions within online electronic documents |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US20130124190A1 (en) * | 2011-11-12 | 2013-05-16 | Stephanie Esla | System and methodology that facilitates processing a linguistic input |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
BR112015018905B1 (pt) | 2013-02-07 | 2022-02-22 | Apple Inc | Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
KR101759009B1 (ko) | 2013-03-15 | 2017-07-17 | 애플 인크. | 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것 |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
CN105264524B (zh) | 2013-06-09 | 2019-08-02 | 苹果公司 | 用于实现跨数字助理的两个或更多个实例的会话持续性的设备、方法、和图形用户界面 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
JP6163266B2 (ja) | 2013-08-06 | 2017-07-12 | アップル インコーポレイテッド | リモート機器からの作動に基づくスマート応答の自動作動 |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9398392B2 (en) * | 2014-06-30 | 2016-07-19 | Microsoft Technology Licensing, Llc | Audio calibration and adjustment |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9912800B2 (en) | 2016-05-27 | 2018-03-06 | International Business Machines Corporation | Confidentiality-smart voice delivery of text-based incoming messages |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10891939B2 (en) * | 2018-11-26 | 2021-01-12 | International Business Machines Corporation | Sharing confidential information with privacy using a mobile phone |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2740510B2 (ja) * | 1988-02-09 | 1998-04-15 | 株式会社リコー | テキスト音声合成方式 |
JPH02289071A (ja) * | 1989-03-22 | 1990-11-29 | Ricoh Co Ltd | 音声出力機能付ワードプロセッサ |
US5500919A (en) * | 1992-11-18 | 1996-03-19 | Canon Information Systems, Inc. | Graphics user interface for controlling text-to-speech conversion |
JPH06337876A (ja) * | 1993-05-28 | 1994-12-06 | Toshiba Corp | 文章読み上げ装置 |
JPH08272388A (ja) | 1995-03-29 | 1996-10-18 | Canon Inc | 音声合成装置及びその方法 |
JP3094896B2 (ja) | 1996-03-11 | 2000-10-03 | 日本電気株式会社 | 文章読み上げ方式 |
US5850629A (en) * | 1996-09-09 | 1998-12-15 | Matsushita Electric Industrial Co., Ltd. | User interface controller for text-to-speech synthesizer |
US6006187A (en) * | 1996-10-01 | 1999-12-21 | Lucent Technologies Inc. | Computer prosody user interface |
US6018710A (en) * | 1996-12-13 | 2000-01-25 | Siemens Corporate Research, Inc. | Web-based interactive radio environment: WIRE |
US5924068A (en) * | 1997-02-04 | 1999-07-13 | Matsushita Electric Industrial Co. Ltd. | Electronic news reception apparatus that selectively retains sections and searches by keyword or index for text to speech conversion |
US6216104B1 (en) * | 1998-02-20 | 2001-04-10 | Philips Electronics North America Corporation | Computer-based patient record and message delivery system |
-
1998
- 1998-05-15 JP JP10134085A patent/JPH11327870A/ja active Pending
-
1999
- 1999-04-02 WO PCT/JP1999/001760 patent/WO1999060474A1/ja active Application Filing
- 1999-04-02 EP EP99910830A patent/EP1077403A4/en not_active Ceased
-
2000
- 2000-11-13 US US09/709,458 patent/US6397183B1/en not_active Expired - Fee Related
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7346042B2 (en) | 2000-02-21 | 2008-03-18 | Ntt Docomo, Inc. | Information distributing method, information distributing system, information distributing server, mobile communication network system and communication service providing method |
JP2002123445A (ja) * | 2000-10-12 | 2002-04-26 | Ntt Docomo Inc | 情報配信サーバおよび情報配信システムならびに情報配信方法 |
WO2003052370A1 (en) * | 2001-12-14 | 2003-06-26 | Canon Kabushiki Kaisha | Information processing apparatus and method, and program |
WO2006008871A1 (ja) * | 2004-07-21 | 2006-01-26 | Matsushita Electric Industrial Co., Ltd. | 音声合成装置 |
US7257534B2 (en) | 2004-07-21 | 2007-08-14 | Matsushita Electric Industrial Co., Ltd. | Speech synthesis system for naturally reading incomplete sentences |
WO2006137166A1 (ja) * | 2005-06-20 | 2006-12-28 | Hitachi Government And Public Corporation System Engineering, Ltd. | クライアント端末 |
US9466225B2 (en) | 2012-08-16 | 2016-10-11 | Kabushiki Kaisha Tosihba | Speech learning apparatus and method |
JPWO2015052817A1 (ja) * | 2013-10-10 | 2017-03-09 | 株式会社東芝 | 音訳作業支援装置、音訳作業支援方法及びプログラム |
US10373606B2 (en) | 2015-03-24 | 2019-08-06 | Kabushiki Kaisha Toshiba | Transliteration support device, transliteration support method, and computer program product |
Also Published As
Publication number | Publication date |
---|---|
WO1999060474A1 (fr) | 1999-11-25 |
US6397183B1 (en) | 2002-05-28 |
EP1077403A4 (en) | 2001-10-31 |
EP1077403A1 (en) | 2001-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH11327870A (ja) | ドキュメント読み上げ装置、読み上げ制御方法及び記 録媒体 | |
JP3142803B2 (ja) | テキストを音声に変換するシンセサイザ | |
US8340956B2 (en) | Information provision system, information provision method, information provision program, and information provision program recording medium | |
US20060129927A1 (en) | HTML e-mail creation system, communication apparatus, HTML e-mail creation method, and recording medium | |
JP2012133659A (ja) | ファイルフォーマット、サーバ、電子コミックのビューワ装置および電子コミック生成装置 | |
JP2007128506A (ja) | ドキュメント読み上げ装置、読み上げ制御方法及び記録媒体 | |
JP4311710B2 (ja) | 音声合成制御装置 | |
JPH06119144A (ja) | 文書読み上げ装置 | |
JP2007219219A (ja) | 語学学習用電子機器および学習用文章リスト作成方法 | |
JPH09258763A (ja) | 音声合成装置 | |
JP2001027926A (ja) | 文書表示方法及びその実施装置並びにその処理プログラムを記録した記録媒体 | |
JPH09185629A (ja) | 機械翻訳方法 | |
JPS62242272A (ja) | ワ−ドプロセツサの文末表現統一装置 | |
KR20010100690A (ko) | 휴대용 전자 성경 단말기 및 그 운용 방법 | |
JPH0727528B2 (ja) | シラブルハイフン表示・非表示制御方式 | |
JP2007207182A (ja) | 電子辞書 | |
JPH052464A (ja) | 画面再表示方式 | |
JPH07114537A (ja) | 音声出力処理方式 | |
JPH10254861A (ja) | 音声合成装置 | |
JPH05298299A (ja) | 階層構造設定方法 | |
JPH05174026A (ja) | 文書処理装置およびデータ処理方法 | |
JPH08137880A (ja) | 文書処理装置 | |
JPH04288665A (ja) | テキスト文書作成方式 | |
JPS62156767A (ja) | メモ機能を有するワ−ド・プロセツサ | |
JPH0589124A (ja) | 文書作成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060731 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060822 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061023 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20061212 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20070608 |