JP4478647B2 - 音声応答システム、音声応答方法、音声サーバ、音声ファイル処理方法、プログラム及び記録媒体 - Google Patents
音声応答システム、音声応答方法、音声サーバ、音声ファイル処理方法、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP4478647B2 JP4478647B2 JP2005506746A JP2005506746A JP4478647B2 JP 4478647 B2 JP4478647 B2 JP 4478647B2 JP 2005506746 A JP2005506746 A JP 2005506746A JP 2005506746 A JP2005506746 A JP 2005506746A JP 4478647 B2 JP4478647 B2 JP 4478647B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- file
- audio
- variable
- grammar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000004044 response Effects 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims description 44
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000012545 processing Methods 0.000 claims abstract description 68
- 238000004590 computer program Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 230000008569 process Effects 0.000 description 25
- 241000209094 Oryza Species 0.000 description 18
- 235000007164 Oryza sativa Nutrition 0.000 description 18
- 235000009566 rice Nutrition 0.000 description 18
- 238000013507 mapping Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 235000015429 Mirabilis expansa Nutrition 0.000 description 4
- 244000294411 Mirabilis expansa Species 0.000 description 4
- 235000013536 miso Nutrition 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Studio Devices (AREA)
- Computer And Data Communications (AREA)
Description
より具体的に説明すれば、VoiceXMLアプリケーションの場合を考えた場合、従来の音声サーバ上で、アプリケーションが音声ファイルに変数を挿入しようとした場合、アプリケーションの作業と実装は、あらかじめ、文を変数位置で分割した音声ファイルを用意して、変数から音声ファイル名を決定し、その音声ファイルを再生するVXMLドキュメントを動的に生成する、という機能を持つサーブレットを開発し、VXMLドキュメントでは、変数前後の音声ファイルをふたつの〈audio〉タグで指定し、適切なタイミングでサーブレットをサブ音声情報として呼ぶ、というような実装が一例として考えられる。
まず、アプリケーションの実装に関して問題がある。すなわち、実行時に変数部の音声ファイルを特定し再生するためのロジックを、アプリケーションが独自に開発しなくてはならくなる。つまり、アプリケーションを複雑かつ大量に開発する必要があり問題となる。さらに、文章の変更に応じて、アプリケーションの変更を必要とすることも問題となる。
前記アプリケーション・サーバから前記音声情報と前記第1の音声ファイルを受け取り、前記音声情報に基づいてグラマーを生成し、前記グラマーに基づいて、前記第1の音声ファイルを音声認識し、複数の音声ファイルに分割し、前記分割された音声ファイルの内の少なくとも1の音声ファイルを前記第2の音声ファイルに置き換えるように動作させるものであるプログラムを提供する。
さらに、本発明は、このようなプログラムを格納したコンピュータが読み取り可能な記録媒体を提供する。
さらに、本発明は、このようなプログラムを格納したコンピュータが読み取り可能な記録媒体を提供する。
(1)変数処理を要求する目印となる、Audioタグの’#’記号を調べ、なければ通常のオーディを処理を行う。
(2)Audioタグより、全文録音音声ファイル名と、全文録音音声ファイルに対応する代替テキストを抽出する。
(3)全文録音音声ファイルが存在しない場合は、’#’をとり、通常のオーディオ処理を行う。必要により音声合成される。
(4)代替テキストがなければ、エラーとなり処理は終了。
(5)既に処理済の場合は、キャッシュされた音声ファイルを利用する。なお、変数部のみ変更されたものなら、変数録音ファイルのみアプリケーション・サーバから取得する。
(6)代替テキストと決められた変数部の文字列からグラマーを作成する。
(7)グラマーと全文録音音声ファイルを音声認識エンジンにより認識させ、全文録音音声ファイルを分割する。
(8)変数録音音声ファイルがない場合は、変数の部分は音声合成する。
(9)得られた音声ファイル(と場合によっては音声合成結果)を連結して再生できるようにする。
全文録音音声ファイルは、変数を含む全文をひとつのファイルとして録音する。変数部分は、ある特定の単語に置き換えて録音する。この単語は、音声サーバと了解し合った特定のものにする。例えば、”変数”という単語とする。
変数録音音声ファイル名は、″{変数の内容}.wav″とする。なお、変数文字列が、音声ファイルを格納する環境においてファイル名として許されない文字を含む場合は、変数対音声ファイル名を、CSV形式でマッピングした、マッピングリストファイルを作成する。マッピングリストファイル名は、音声サーバと了解し合った固定のものにする。例えば、″value−wav.map″とする。
全文録音音声ファイル対応して、その全文録音音声ファイルが変数を持つかどうかを示す目印を音声情報につける。さらに、変数を持つ全文録音音声ファイルに対応して、音声情報に少なくとも変数部を含むテキスト全文(代替テキスト)と挿入する変数名の情報を格納する。さらに必要により、変数用音声ファイルが属するクラス名を格納する。場合により、マッピングリストファイルはカレントパス、あるいは、クラス専用フォルダに置く。
音声アプリケーションは通常、最終的には人の声を録音した音声ファイルを用いて運用されることが多いが、開発中は音声ファイルがない状態で開発を行う必要があるので、音声合成を利用する。VoiceXMLが音声ファイルを再生するために定義している〈audio〉タグは、そのような利用環境に対応するために、音声ファイル名と文字列を記述して、音声ファイルが存在すれば音声ファイルを再生し、音声ファイルが再生不可能な状態である場合には、文字列を音声合成する、という仕様になっている。
記述例:”〈audio src=″wav/sample.wav″〉ご注文の商品〈/audio〉”
機能的にもフォーマット的にも、〈audio〉タグ本来の仕様に則った状態で、今回の発明を適用する。
変数部を持つ全文録音音声ファイルに情報を付加するために、〈audio〉タグの代替テキスト部を利用する。代替テキスト部に、変数を含むテキスト全文を記述する。挿入する変数を、〈value〉タグで指定し、挿入位置に、〈value〉タグを挿入する。クラスに属する場合は、クラス名をclass属性で指定した〈sayas〉タグで、〈value〉タグを囲む。マッピングリストファイルは、クラス専用パス、あるいは、カレントパスに置く。
全文録音音声ファイルとして、「ご注文の商品は、変数です」と録音した
″wav¥sample.wav″音声ファイル
変数録音音声ファイルとして、「お米」と録音した″カレントパス¥product¥お米.wav″音声ファイル
VXMLドキュメントの記述(音声情報に対応する)
〈audio src=″#wav/sample.wav″〉
ご注文の商品は、
〈sayas class=″product″〉
〈value expr=″ProductName″/〉
〈/sayas〉
です。
〈/audio〉
ここで、#によって、変数処理の必要性を表し、「wav/sample.wav」は全文録音音声ファイル名である。そして、
「ご注文の商品は、
〈sayas class=″product″〉
〈value expr=″ProductName″/〉
〈/sayas〉
です。」
の部分が代替テキストとなる。
なお、これらの記述は、アプリケーション・サーバで実行されるアプリケーション・プログラムの一部として記述されるものである。
全文録音音声ファイルが変数を持つかどうか、音声ファイル指定の目印の有無で判断して、単純な再生処理か、変数挿入が必要な再生処理か、適切な方の処理に分岐する。単純な音声ファイル再生は、従来の動作どおりである。引き続き、以下に、変数挿入処理を記述する。なお、全て実行時の処理である。
〈audio src=″#confirm.wav″〉
ご注文は、〈value expr=″Product″/〉でよろしいですか?
〈/audio〉
グラマーにしていく過程は以下のとおりである。
1.変数部を変数部用テキストで置換する。
(変換前)ご注文は、〈value expr=″Product″/〉でよろしいですか
(変換後)ご注文は変数でよろしいですか
2.テキストファイル(BNFファイル)を生成する。この時、音声認識エンジンが認識できるように単語分割する必要がある。その結果、この例では以下のようになる。
〈_rule1〉=ご注文は変数でよろしいですか
3.受け入れ可能な発話文を、音声認識エンジンに伝えるために、音声認識エンジンが理解できる形式にする。具体的には、BNFファイルを、グラマーコンパイルして、グラマーボキャブラリ(FSGファイル)を生成する。グラマーコンパイルとは、グラマーを音声認識エンジンが理解できる形式にすることである。例えば、グラマーコンパイラAPIを使って、音声認識エンジンが理解できるFSGファイル形式にコンパイルする。FSG(finite state grammar)ファイル形式とは、音声認識エンジンが理解できる形式の、コンパイル済みグラマーファイルである。なお、FSG形式は、W3C Speech Interface Frameworkでもサポートされる形式である。
以上によって生成されたグラマーを音声認識エンジンに渡し、そのグラマーを登録する。
変数に対応するテキストは、アプリケーションの変数の値である。その値は実行時に決定される。この変数の値が、いつどこで決まるかはアプリケーションロジックによる。例えば、Product=″’変数値’″として、いつでもその値をいれるようにすることができ、また例えば注文を聞いた時に認識した語句を、その値とするように書いておくこともできる。
″変数値がいつどのような形で決まるか″は、アプリケーションのデザインにより、大きく次の2タイプある。(1)認識対象に名前をつけておき、それが変数名となり、ユーザの発声を認識した時に認識した語句が変数値になるようにする。(2)あらかじめ変数を宣言しておき、好きなタイミングで変数値をいれるようにする。
System:お名前をどうぞ
User: 加藤 :この発声を認識した時に、UserName変数値=”加藤”となります。
System:加藤様ですね:この後、〈assign〉タグにより、Address変数値=getUserAddress関数の返り値;”東京都渋谷区”などとなります。
System:ご注文をどうぞ
User: お米 :この発声を認識した時に、Product変数値=”お米”となります。
System:ご注文はお米ですね。
タイプ(1)の例は、UserName変数、Product変数、answer変数である。タイプ(2)の例は、Address変数である。変数値を参照する時は、〈value〉タグを使う。SCRIPT関数へのパラメータとして使う時は直接変数名を使う。
本実施例の1つでは、変数録音ファイル名は、″変数値″+″.wav″とした。例えば、変数が、変数”Product”の時、Productの変数値が″お米″だったら、変部録音ファイル名=″お米.wav″である、ということである。これに関連して、以下の表9に示す例を基に、さらに詳細に説明する。
System: ご注文をどうぞ
User: お米
System: ご注文はお米ですね。
[図2]本発明を機能ブロックを用いて示した図である。
[図3]音声ファイル処理部231におけるグラマーの生成ロジックを示す図である。
[図4]グラマーの生成ロジックの詳細を示す図である。
[図5]音声認識エンジン232における音声認識による音声ファイルの分割ロジックについて示す図である。
[図6]音声認識エンジン232における音声認識による音声ファイルの分割結果について示す図である。
[図7]本発明の音声サーバ230における処理の流れについての一例を記述したフローチャートを示す図である。
102 M/Bチップセット
103 メインメモリ
104 ビデオカード
105 ハードディスク
106 ネットワークインターフェイス
107 USB
108 ブリッジ回路
109 フレキシブルディスクドライブ
110 キーボード/マウス
210 音声応答システム
221 全文録音音声ファイル
222 変数録音音声ファイル
223 変数録音音声ファイル
224 音声情報
220 アプリケーション・サーバ
231 音声ファイル処理部
232 音声認識エンジン
233 音声化処理部
230 音声サーバ
240 音声出力装置
Claims (29)
- アプリケーション・サーバ及び音声サーバとを備える音声応答システムであって、
前記アプリケーション・サーバは、第1の音声ファイルと、第2の音声ファイルと、音声情報を有するものであり、
前記音声サーバは、
前記アプリケーション・サーバから前記音声情報と前記第1の音声ファイルを受け取り、前記音声情報に基づいてグラマーを生成する音声ファイル処理手段と、
前記グラマーに基づいて、前記第1の音声ファイルを音声認識し、複数の音声ファイルに分割する音声認識手段と、
前記分割された音声ファイルの内の少なくとも1の音声ファイルを前記第2の音声ファイルに置き換える音声処理手段と
を有する音声応答システム。 - 前記第1の音声ファイルは、変数が入ることを示す変数部を含む全文を一つのファイルとして録音されたものである、請求項1記載の音声応答システム。
- 前記第2の音声ファイルは、変数部に入る音声をファイルとして録音したものである、請求項2記載の音声応答システム。
- 前記音声情報には、前記第1の音声ファイルのファイル名が含まれ、前記音声ファイル処理手段は前記ファイル名に基づいて前記第1の音声ファイルを抽出するものである、請求
項1乃至3のいずれかに記載の音声応答システム。 - 前記音声情報には、代替テキストが含まれ、前記音声ファイル処理手段は前記代替テキストに基づいてグラマーを生成するものである、請求項1乃至4のいずれかに記載の音声応答システム。
- 前記音声情報には、変数についての処理を行う必要があるかどうかを示す変数情報が含まれる、請求項1乃至5のいずれかに記載の音声応答システム。
- さらに、音声を出力する音声出力手段を有する請求項1乃至6のいずれかに記載の音声応答システム。
- アプリケーション・サーバ及び音声サーバとを備える音声応答システムにおける音声応答方法であって、前記アプリケーション・サーバは、第1の音声ファイルと、第2の音声ファ
イルと、音声情報を有するものであり、前記音声応答方法は、
前記音声サーバが、
前記アプリケーション・サーバから前記音声情報と前記第1の音声ファイルを受け取り、前記音声情報に基づいてグラマーを生成するステップと、
前記グラマーに基づいて、前記第1の音声ファイルを音声認識し、複数の音声ファイルに分割するステップと、
前記分割された音声ファイルの内の少なくとも1の音声ファイルを前記第2の音声ファイルに置き換えるステップと
を有する音声応答方法。 - 前記第1の音声ファイルは、変数が入ることを示す変数部を含む全文を一つのファイルとして録音されたものである、請求項8記載の音声応答方法。
- 前記第2の音声ファイルは、変数部に入る音声をファイルとして録音されたものである、請求項9記載の音声応答方法。
- 前記音声情報には、前記第1の音声ファイルのファイル名が含まれ、前記第1の音声ファイルを前記ファイル名に基づいて抽出する、請求項8乃至10のいずれかに記載の音声応答方法。
- 前記音声情報には、代替テキストが含まれ、前記グラマーを前記代替テキストに基づいて生成する、請求項8乃至11のいずれかに記載の音声応答方法。
- 前記音声情報には、変数についての処理を行う必要があるかどうかを示す変数情報が含まれる、請求項8乃至12のいずれかに記載の音声応答方法。
- アプリケーション・サーバ及び音声サーバとを備える音声応答システムに音声応答を実行させるためのコンピュータ・プログラムであって、当該音声応答システムに請求項8乃至13のいずれかに記載の方法を実行させるコンピュータ・プログラム。
- 請求項14に記載のコンンピュータ・プログラムを格納したコンピュータ読み取り可能な記憶媒体。
- 自動的に音声処理を行うための音声サーバであって、
代替テキストからグラマーを生成する手段と、
前記グラマーに基づいて、第1の音声ファイルを音声認識し、複数の音声ファイルに分割する手段と、
前記分割された音声ファイルの内の少なくとも1の音声ファイルを第2の音声ファイルに置き換える手段と
を有する音声サーバ。 - 前記第1の音声ファイルは、変数が入ることを示す変数部を含む全文を一つのファイルとして録音されたものである、請求項16記載の音声サーバ。
- 前記第2の音声ファイルは、変数部に入る音声をファイルとして録音したものである、請求項17記載の音声サーバ。
- 前記第2の音声ファイルは、変数部に入る音声を合成音声により生成したものである、請求項17記載の音声サーバ。
- 前記グラマーを生成する手段は、代替テキストを変数部と変数部以外に分割し、変数部を予め定められた単語に置き換えることにより、グラマーを生成する請求項16乃至19のいずれかに記載の音声サーバ。
- 前記グラマーを生成する手段は、さらに前記単語の置き換えにより生成されたテキストファイルを分割し、音声認識が可能な形式にすることにより、グラマーを生成する請求項16乃至20のいずれかに記載の音声サーバ。
- 音声サーバによって自動的に音声ファイルの処理を行うための方法であって、
前記音声サーバが
代替テキストからグラマーを生成するステップと、
前記グラマーに基づいて、第1の音声ファイルを音声認識し、複数の音声ファイルに分割するステップと、
前記分割された音声ファイルの内の少なくとも1の音声ファイルを第2の音声ファイルに置き換えるステップと
を有する音声ファイル処理方法。 - 前記第1の音声ファイルは、変数が入ることを示す変数部を含む全文を一つのファイルとして録音されたものである、請求項22に記載の音声ファイル処理方法。
- 前記第2の音声ファイルは、変数部に入る音声をファイルとして録音されたものである、請求項23記載の音声ファイル処理方法。
- 前記第2の音声ファイルは、変数部に入る音声を合成音声により生成したものである、請求項23記載の音声ファイル処理方法。
- 前記グラマーを生成するステップは、代替テキストを変数部と変数部以外に分割し、変数部を予め定められた単語に置き換えることにより、グラマーを生成する請求項22乃至25のいずれかに記載の音声ファイル処理方法。
- 前記単語の置き換えにより生成されたテキストファイルを分割し、音声認識が可能な形式にすることにより、グラマーを生成する請求項26記載の音声ファイル処理方法。
- 音声サーバによって自動的に音声ファイルの処理を実行させるためのコンピュータ・プログラムであって、当該音声サーバに請求項22乃至27のいずれかに記載の方法を実行させるコンピュータ・プログラム。
- 請求項28に記載のコンンピュータ・プログラムを格納したコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003156714 | 2003-06-02 | ||
JP2003156714 | 2003-06-02 | ||
PCT/JP2004/007368 WO2004109658A1 (ja) | 2003-06-02 | 2004-05-28 | 音声応答システム、音声応答方法、音声サーバ、音声ファイル処理方法、プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2004109658A1 JPWO2004109658A1 (ja) | 2006-07-20 |
JP4478647B2 true JP4478647B2 (ja) | 2010-06-09 |
Family
ID=33508327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005506746A Expired - Lifetime JP4478647B2 (ja) | 2003-06-02 | 2004-05-28 | 音声応答システム、音声応答方法、音声サーバ、音声ファイル処理方法、プログラム及び記録媒体 |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP1632932B1 (ja) |
JP (1) | JP4478647B2 (ja) |
KR (1) | KR100834363B1 (ja) |
CN (1) | CN1830022B (ja) |
AT (1) | ATE381755T1 (ja) |
AU (1) | AU2004246451A1 (ja) |
DE (1) | DE602004010804T2 (ja) |
WO (1) | WO2004109658A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7181397B2 (en) | 2005-04-29 | 2007-02-20 | Motorola, Inc. | Speech dialog method and system |
WO2010068882A2 (en) * | 2008-12-11 | 2010-06-17 | Nortel Networks Limited | Automated text-based messaging interaction using natural language understanding technologies |
JP5787794B2 (ja) * | 2012-03-05 | 2015-09-30 | 株式会社東芝 | 音声合成システム、音声変換支援装置および音声変換支援方法 |
WO2018133307A1 (zh) | 2017-01-20 | 2018-07-26 | 华为技术有限公司 | 一种实现语音控制的方法和终端 |
JP7013172B2 (ja) * | 2017-08-29 | 2022-01-31 | 株式会社東芝 | 音声合成辞書配信装置、音声合成配信システムおよびプログラム |
CN108090051A (zh) * | 2017-12-20 | 2018-05-29 | 深圳市沃特沃德股份有限公司 | 连续长语音文件的翻译方法与翻译机 |
KR102293772B1 (ko) * | 2018-08-02 | 2021-08-25 | 주식회사 케이티 | 음성 합성 서비스를 제공하는 서버, 사용자 단말 및 방법 |
KR102304993B1 (ko) * | 2018-11-01 | 2021-09-27 | 주식회사 케이티 | Tts 서비스 제공 방법 및 이를 위한 중계 서버 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2554116B2 (ja) * | 1988-01-30 | 1996-11-13 | 日本電気ホームエレクトロニクス株式会社 | テレビジョン受像機 |
US5652789A (en) * | 1994-09-30 | 1997-07-29 | Wildfire Communications, Inc. | Network based knowledgeable assistant |
AU1987097A (en) * | 1996-03-07 | 1997-09-22 | American Express Travel Related Services Company, Inc. | Methods and apparatus for providing a prepaid, remote memory transaction account with voice indicia |
US5970449A (en) * | 1997-04-03 | 1999-10-19 | Microsoft Corporation | Text normalization using a context-free grammar |
JP3472101B2 (ja) * | 1997-09-17 | 2003-12-02 | 株式会社東芝 | 音声入力解釈装置及び音声入力解釈方法 |
US6144938A (en) * | 1998-05-01 | 2000-11-07 | Sun Microsystems, Inc. | Voice user interface with personality |
US6499013B1 (en) * | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
KR100287905B1 (ko) * | 1998-12-31 | 2001-05-02 | 서평원 | 실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법 |
CZ299508B6 (cs) * | 1999-02-19 | 2008-08-20 | Custom Speech Usa, Inc. | Systém automatické transkripce a zpusob užití dvou stupnu konverze reci a pocítacem podporovaná korekce |
JP2001265376A (ja) * | 2000-03-22 | 2001-09-28 | Pioneer Electronic Corp | 音声合成出力装置ならびに方法および同方法が記録される記録媒体 |
KR100364546B1 (ko) * | 2000-12-29 | 2002-12-18 | 엘지전자 주식회사 | 음성 메일링 시스템의 음성자원 교체방법 |
JP2002221980A (ja) * | 2001-01-25 | 2002-08-09 | Oki Electric Ind Co Ltd | テキスト音声変換装置 |
US7711570B2 (en) * | 2001-10-21 | 2010-05-04 | Microsoft Corporation | Application abstraction with dialog purpose |
JP4554561B2 (ja) * | 2006-06-20 | 2010-09-29 | 株式会社シマノ | 釣り用グローブ |
JP2008002005A (ja) * | 2006-06-21 | 2008-01-10 | Shimada Shoji Kk | 衣服用パッド |
JP4880379B2 (ja) * | 2006-06-23 | 2012-02-22 | 粕谷 普烈 | 型板の緊張度が調節自在な枠体 |
-
2004
- 2004-05-28 WO PCT/JP2004/007368 patent/WO2004109658A1/ja active IP Right Grant
- 2004-05-28 DE DE602004010804T patent/DE602004010804T2/de not_active Expired - Lifetime
- 2004-05-28 KR KR1020057021113A patent/KR100834363B1/ko not_active IP Right Cessation
- 2004-05-28 JP JP2005506746A patent/JP4478647B2/ja not_active Expired - Lifetime
- 2004-05-28 EP EP04745404A patent/EP1632932B1/en not_active Expired - Lifetime
- 2004-05-28 AU AU2004246451A patent/AU2004246451A1/en not_active Abandoned
- 2004-05-28 AT AT04745404T patent/ATE381755T1/de not_active IP Right Cessation
- 2004-05-28 CN CN200480021899XA patent/CN1830022B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
ATE381755T1 (de) | 2008-01-15 |
JPWO2004109658A1 (ja) | 2006-07-20 |
KR100834363B1 (ko) | 2008-06-02 |
DE602004010804T2 (de) | 2008-12-04 |
EP1632932A1 (en) | 2006-03-08 |
DE602004010804D1 (de) | 2008-01-31 |
AU2004246451A1 (en) | 2004-12-16 |
CN1830022B (zh) | 2010-05-05 |
WO2004109658A1 (ja) | 2004-12-16 |
KR20060014043A (ko) | 2006-02-14 |
EP1632932A4 (en) | 2007-05-09 |
EP1632932B1 (en) | 2007-12-19 |
CN1830022A (zh) | 2006-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6801897B2 (en) | Method of providing concise forms of natural commands | |
JP4558308B2 (ja) | 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム | |
US8594995B2 (en) | Multilingual asynchronous communications of speech messages recorded in digital media files | |
JP4478939B2 (ja) | 音声処理装置およびそのためのコンピュータプログラム | |
JP3232289B2 (ja) | 記号挿入装置およびその方法 | |
US8626489B2 (en) | Method and apparatus for processing data | |
JP4901155B2 (ja) | 音声認識装置が使用するのに適した文法を生成するための方法、媒体、およびシステム | |
JP2010160316A (ja) | 情報処理装置及びテキスト読み上げ方法 | |
JP2013072957A (ja) | 文書読み上げ支援装置、方法及びプログラム | |
US20220036005A1 (en) | Tokenization of text data to facilitate automated discovery of speech disfluencies | |
JP4478647B2 (ja) | 音声応答システム、音声応答方法、音声サーバ、音声ファイル処理方法、プログラム及び記録媒体 | |
JP3936351B2 (ja) | 音声応答サービス装置 | |
JP5693834B2 (ja) | 音声認識装置及び音声認識方法 | |
JP2006236037A (ja) | 音声対話コンテンツ作成方法、装置、プログラム、記録媒体 | |
US20210142784A1 (en) | Speech synthesis system, method and non-transitory computer readable medium | |
JP4286583B2 (ja) | 波形辞書作成支援システムおよびプログラム | |
JP2011150169A (ja) | 音声認識装置 | |
WO2022196087A1 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
JPS6083136A (ja) | プログラム読上装置 | |
JP4206253B2 (ja) | 自動音声応答装置及び自動音声応答方法 | |
JP3958908B2 (ja) | 書き起こしテキスト自動生成装置、音声認識装置および記録媒体 | |
US20020042040A1 (en) | Talking book method and system | |
JP2007127994A (ja) | 音声合成方法及び音声合成装置並びにプログラム | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
JP2000214874A (ja) | 音声合成装置及びその方法、コンピュ―タ可読メモリ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070525 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100309 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100315 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130319 Year of fee payment: 3 |