JPS61252596A - 文字音声通信方式及び装置 - Google Patents
文字音声通信方式及び装置Info
- Publication number
- JPS61252596A JPS61252596A JP60093611A JP9361185A JPS61252596A JP S61252596 A JPS61252596 A JP S61252596A JP 60093611 A JP60093611 A JP 60093611A JP 9361185 A JP9361185 A JP 9361185A JP S61252596 A JPS61252596 A JP S61252596A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- function
- information
- text
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 23
- 238000003786 synthesis reaction Methods 0.000 claims description 22
- 230000005540 biological transmission Effects 0.000 claims description 20
- 230000006835 compression Effects 0.000 claims description 9
- 238000007906 compression Methods 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000003595 spectral effect Effects 0.000 description 21
- 230000006870 function Effects 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 10
- 238000001228 spectrum Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000013139 quantization Methods 0.000 description 4
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 240000000220 Panda oleosa Species 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000001308 synthesis method Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0018—Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の利用分野〕
音声及び文字を対象とした総合的な情報変換。
通信方式に関する。
通信回線のデジタル化の進展やワードプロセッサのよう
な文字入出力技術の進歩に伴い1文字と音声の自由な相
互変換可能な通信手段の実現が望まれている。このよう
なものとしては1発明者の一人が共同発明者となってい
る特公昭59−19358゛音声内容伝送方式”のよう
に、テレックスと音声タイプ、音声規則合成を組み合せ
たシステムがある。しかしながら、音声伝送では、発声
者の個人性の音色を伝えたいという要求も強い、しかし
前記のスシテムでは文字伝送のため実現が困難でである
。一方、ワードプロセッサ技術の進展に合せ、ワードプ
ロセッサを通信端末としたシステムや、それに電話を併
合した総合音声データ端末(IVDT)なども提案され
ているが、音声とデータは一つの端末に組み込まれては
いるものの、情報のあつかいとしては独立となっている
のが実態であり、両者の情報としての有機的結合につい
ては配慮されていなかった。
な文字入出力技術の進歩に伴い1文字と音声の自由な相
互変換可能な通信手段の実現が望まれている。このよう
なものとしては1発明者の一人が共同発明者となってい
る特公昭59−19358゛音声内容伝送方式”のよう
に、テレックスと音声タイプ、音声規則合成を組み合せ
たシステムがある。しかしながら、音声伝送では、発声
者の個人性の音色を伝えたいという要求も強い、しかし
前記のスシテムでは文字伝送のため実現が困難でである
。一方、ワードプロセッサ技術の進展に合せ、ワードプ
ロセッサを通信端末としたシステムや、それに電話を併
合した総合音声データ端末(IVDT)なども提案され
ているが、音声とデータは一つの端末に組み込まれては
いるものの、情報のあつかいとしては独立となっている
のが実態であり、両者の情報としての有機的結合につい
ては配慮されていなかった。
本発明は、この点に鑑み、音声と文字を有機的に結びつ
けた通信方式実現の技術を提供することにある。
けた通信方式実現の技術を提供することにある。
上記目的を達成するため本発明では、音声タイプライタ
と規則合成を持つ音声ワープロと、音声情報圧縮伝送機
能とを有機的に一体化し、音声分析部と音声合成部とを
共用することを特徴とする。
と規則合成を持つ音声ワープロと、音声情報圧縮伝送機
能とを有機的に一体化し、音声分析部と音声合成部とを
共用することを特徴とする。
更に詳述すれば、高能率高圧縮な音声伝送方式において
は、音声情報をスペクトル概形情報とスペクトル微細情
報に分け、各々に対しそれぞれに適した圧縮符号化を行
ない伝送を行なう場合が多い、スペクトル概形情報は主
に言語的情報(音韻的情報)を持ち、スペクトル微細情
報は声の抑揚(アクセントやイントネーション)や発声
者の個外的特徴の情報を主に有している。
は、音声情報をスペクトル概形情報とスペクトル微細情
報に分け、各々に対しそれぞれに適した圧縮符号化を行
ない伝送を行なう場合が多い、スペクトル概形情報は主
に言語的情報(音韻的情報)を持ち、スペクトル微細情
報は声の抑揚(アクセントやイントネーション)や発声
者の個外的特徴の情報を主に有している。
規則合成においては堵、任意の文字列を高品質の音声に
変換するためには、文字列の言語とじての情報の他に、
アクセントやイントネーションも実現する必要があり、
雨(71差)と飴(工丁ア)の例のように言語的、高韻
的情報と抑揚を独立に制御して組み合せることのできる
方式を合成部に用いることが必要である。一方音声タイ
ブライタは主に音声から言語的、音韻的情報を抽出して
文字情報に変換することを目的としており1個人的特徴
は出来るだけ除くことのできる分析手法を用いる必要が
ある。抑揚情報は連続音声中の単語の切り出しや立形の
確認等に補助的に用いることができる。
変換するためには、文字列の言語とじての情報の他に、
アクセントやイントネーションも実現する必要があり、
雨(71差)と飴(工丁ア)の例のように言語的、高韻
的情報と抑揚を独立に制御して組み合せることのできる
方式を合成部に用いることが必要である。一方音声タイ
ブライタは主に音声から言語的、音韻的情報を抽出して
文字情報に変換することを目的としており1個人的特徴
は出来るだけ除くことのできる分析手法を用いる必要が
ある。抑揚情報は連続音声中の単語の切り出しや立形の
確認等に補助的に用いることができる。
このようにして、音声情報をスペクトル概形情報とスペ
クトル微細情報に分離/再合成する技術を通して、音声
圧縮伝送、音声規則合成、音声タイプライタの王者の情
報を有機的に結びつけることが可能となる。
クトル微細情報に分離/再合成する技術を通して、音声
圧縮伝送、音声規則合成、音声タイプライタの王者の情
報を有機的に結びつけることが可能となる。
以下、本発明の一実施例を図をもって説明する。
第1図は音声圧縮伝送、音声規則合成、音声タイプライ
タの王者にワードプロセッサ機能とテレテックス機能を
組み合せた端末の機能を説明するブロック図である。
タの王者にワードプロセッサ機能とテレテックス機能を
組み合せた端末の機能を説明するブロック図である。
先ず機能動作について説明する。音声の圧縮伝送端末と
しては、入力された音声はスペクトル概形情報とスペク
トル微細情報に分析され、各々適切な情報に圧縮され、
伝送用コードに変換後、モデム等の回線インターフェー
スを通して送出される。受信されると、音声波形に再合
成され、音声として出力される。圧縮された情報をメモ
リに一時的に入れておけば、ボイス・メールとして機能
する。
しては、入力された音声はスペクトル概形情報とスペク
トル微細情報に分析され、各々適切な情報に圧縮され、
伝送用コードに変換後、モデム等の回線インターフェー
スを通して送出される。受信されると、音声波形に再合
成され、音声として出力される。圧縮された情報をメモ
リに一時的に入れておけば、ボイス・メールとして機能
する。
音声タイプとして用いる場合は、主にスペクトル情報を
用いて音声を認識し、カナコード列に変換する。この段
階ではキー人力されたカナ文字列と同じレベルの信号と
して取り扱うことが可能となる。従ってカナ漢字変換等
のワードプロセッサの諸機能を用いることができる。カ
ナ漢字変換した結果をディスプレーに表示したり、テレ
テックス機能を用いて文字情報として伝送することも可
能となる。また、文字情報を用いたメール機能を持たせ
ることも同様に可能である。
用いて音声を認識し、カナコード列に変換する。この段
階ではキー人力されたカナ文字列と同じレベルの信号と
して取り扱うことが可能となる。従ってカナ漢字変換等
のワードプロセッサの諸機能を用いることができる。カ
ナ漢字変換した結果をディスプレーに表示したり、テレ
テックス機能を用いて文字情報として伝送することも可
能となる。また、文字情報を用いたメール機能を持たせ
ることも同様に可能である。
大量な文字コード文書情報は、ディスプレーで一々目を
通すのは面倒なことが多い0重要な情報を目で確認した
り1図表を見たりする場合はディスプレーに出力しても
良いが、文章情報の多くは音声で聞き流しても良い場合
が多い、この場合は規則合成機能を用いて文字情報列を
スペクトル概情報とスペクトル微細情報の時系列に変換
し、音声合成部(音声圧縮伝送の復合部)で音声波形に
変換し、音声として出力することが可能である。
通すのは面倒なことが多い0重要な情報を目で確認した
り1図表を見たりする場合はディスプレーに出力しても
良いが、文章情報の多くは音声で聞き流しても良い場合
が多い、この場合は規則合成機能を用いて文字情報列を
スペクトル概情報とスペクトル微細情報の時系列に変換
し、音声合成部(音声圧縮伝送の復合部)で音声波形に
変換し、音声として出力することが可能である。
このように文字と音声を有機的に相互に変換しかつ、そ
れぞれの部分での各種の処理機能を共有することによっ
て経済的な装置の構成が可能となる。
れぞれの部分での各種の処理機能を共有することによっ
て経済的な装置の構成が可能となる。
さて、各部の具体的機能の実現は、すでに公知の技術に
よって実現することができる。たとえば。
よって実現することができる。たとえば。
音声の分析合成技術については、線形予測分析合成法に
よって、スペクトル概形情報は線形予測係数として、ス
ペクトル微細情報は予測残差情報として求めることがで
きる(たとえば日本音響学会音声研究会資料584−7
5 (1985−1)、武田他、″残差情報を利用した
音声合成法の検討”など)、さらにベクトル量子化技術
等と組み合せれば大幅を情報圧縮が可能であることは言
うまでもない、このような技術を用いれば音声圧縮伝送
はそのまま実現することが可能である。
よって、スペクトル概形情報は線形予測係数として、ス
ペクトル微細情報は予測残差情報として求めることがで
きる(たとえば日本音響学会音声研究会資料584−7
5 (1985−1)、武田他、″残差情報を利用した
音声合成法の検討”など)、さらにベクトル量子化技術
等と組み合せれば大幅を情報圧縮が可能であることは言
うまでもない、このような技術を用いれば音声圧縮伝送
はそのまま実現することが可能である。
音声タイプライタはすでに音節単位で発声したものを入
力するものは幾つかの商品が発表されており、連続音声
に対しても、たとえば発明者の一人が同一である特開昭
57−54999などの手法により実現することができ
る。
力するものは幾つかの商品が発表されており、連続音声
に対しても、たとえば発明者の一人が同一である特開昭
57−54999などの手法により実現することができ
る。
規則合成技術については、たとえば、電子通信学会論文
誌Vol 6l−Dp858の佐藤他“PARCOR−
VCV連鎖を用いた音声合成方式”などあり、スペクト
ルに概形情報(パーコール(PARCOR)情報の形に
なっている)を用いた規則合成が可能である。ワードプ
ロセッサ及びテレテックスは広く製品が出まわったり、
CCITTの国際規格もあり。
誌Vol 6l−Dp858の佐藤他“PARCOR−
VCV連鎖を用いた音声合成方式”などあり、スペクト
ルに概形情報(パーコール(PARCOR)情報の形に
なっている)を用いた規則合成が可能である。ワードプ
ロセッサ及びテレテックスは広く製品が出まわったり、
CCITTの国際規格もあり。
その実現方法は改めて言及する必要はなかろう。
第2図は実施の一構成例を示す。
入力音声1は線形予測分析を行なうスペクトル概形分析
部2によりスペクトル概形情報(ここでは線形予測パラ
メータ)に分析される一方、バッファメモリ3でタイミ
ング合せをした後、スペクトル微細構造分析部(ここで
は線形予測逆フィルタ)に加えられる。スペクトル概形
情報は圧縮伝送の場合はスペクトル概形情報量子化部で
量子化され送信部8に送られる一方、スペクトル微細構
造分析部4に送られる。スペクトル微細情報分析部4の
出力はスペクトル微細構造情報量子化部で量子化機送信
部8に送られ、量子化スペクトル概形情報とまとめられ
て送信される。音声タイプライタとして機能する場合は
、スペクトル概形情報は音声タイプライタ認識部7でカ
ナ文字列候補に変換され、プロセッサ部9に送られ、プ
ロセッサ部9に構成されているワードプロセッサ機能の
入力として用いられる。キーボード部10からの文字列
入力も同様にプロセッサ部8で使用される。
部2によりスペクトル概形情報(ここでは線形予測パラ
メータ)に分析される一方、バッファメモリ3でタイミ
ング合せをした後、スペクトル微細構造分析部(ここで
は線形予測逆フィルタ)に加えられる。スペクトル概形
情報は圧縮伝送の場合はスペクトル概形情報量子化部で
量子化され送信部8に送られる一方、スペクトル微細構
造分析部4に送られる。スペクトル微細情報分析部4の
出力はスペクトル微細構造情報量子化部で量子化機送信
部8に送られ、量子化スペクトル概形情報とまとめられ
て送信される。音声タイプライタとして機能する場合は
、スペクトル概形情報は音声タイプライタ認識部7でカ
ナ文字列候補に変換され、プロセッサ部9に送られ、プ
ロセッサ部9に構成されているワードプロセッサ機能の
入力として用いられる。キーボード部10からの文字列
入力も同様にプロセッサ部8で使用される。
ワードプロセッサ処理経過や結果は必要に応じてディス
プレ一部11に表示される6作成した文書データはメモ
リ12に記録される。他の端末に文字データとして送る
場合はプロ示ツサ部9より送信部8を経由して通信回線
に送出される。
プレ一部11に表示される6作成した文書データはメモ
リ12に記録される。他の端末に文字データとして送る
場合はプロ示ツサ部9より送信部8を経由して通信回線
に送出される。
他の端末から送られて来た圧縮伝送データは、スペクト
ル概形情報復号部14とスペクトル微細構造復号部15
で合成パラメータに復号後、音声波形合成部16で音声
波形に合成され、合成音声18として出力される。
ル概形情報復号部14とスペクトル微細構造復号部15
で合成パラメータに復号後、音声波形合成部16で音声
波形に合成され、合成音声18として出力される。
メモリ12中の文書データを音声で出力したい場合は、
プロセッサ部9内に構成される規則合成用プログラムに
より音声合成用パラメータに変換され、音声合成パラメ
ータバッファ部17に送られ、復号部14,15を経て
音声波形合成部16により合成音声18に変換され出力
される。音声合成パラメータバッファ17は合成部の実
時間性を保持するためのもので、規則合成のパラメータ
生成処理の時間的ユラギを吸収するためのものであり、
復号部14.15と合成部16の間においても良い。
プロセッサ部9内に構成される規則合成用プログラムに
より音声合成用パラメータに変換され、音声合成パラメ
ータバッファ部17に送られ、復号部14,15を経て
音声波形合成部16により合成音声18に変換され出力
される。音声合成パラメータバッファ17は合成部の実
時間性を保持するためのもので、規則合成のパラメータ
生成処理の時間的ユラギを吸収するためのものであり、
復号部14.15と合成部16の間においても良い。
他の端末から送られて来た文字データはプロセッサ部9
を経由してディスプレ一部11に表示される。
を経由してディスプレ一部11に表示される。
メールとして使用する場合は音声データにしても、文字
データにしてもメモリ一部12を用いて必要な時点まで
内容を保持することができる。
データにしてもメモリ一部12を用いて必要な時点まで
内容を保持することができる。
以上説明したごとく、本発明によれば、音声と文字の情
報を自由に有機的に結びつけた様々な形態の通信及び処
理が可能となり、かつ、その処理を共通の機能で実行す
るため、極めて経済的に実現するこができる。
報を自由に有機的に結びつけた様々な形態の通信及び処
理が可能となり、かつ、その処理を共通の機能で実行す
るため、極めて経済的に実現するこができる。
第1図は本発明の一実施例を説明するためのブロック図
、第2図は一実施例を説明するための構成図である。 1・・・入力音声、2・・・スペクトル概形分析部、3
・・・バッファメモリ、4・・・スペクトル微細構造分
析部。 5・・・スペクトル概形情報量子化部、6・・・スペク
トル微m構造情報量子化部、7・・・音声タイプライタ
認識部、8・・・送信部、9・・・プロセッサ部、1o
・・・キーボード部、11・・・ディスプレ一部、12
・・・メモリ部、13・・・受信部、14・・・スペク
トル概形情報復号部、15・・・スペクトル微細構造復
号部、16・・・音声波形合成部、17・・・音声合成
バラメー9 A ″″“・18“°唱”音丸
、47−代理人 弁理士 小川勝馬j・・′ ゝ・、t、I: 暮 II¥1
、第2図は一実施例を説明するための構成図である。 1・・・入力音声、2・・・スペクトル概形分析部、3
・・・バッファメモリ、4・・・スペクトル微細構造分
析部。 5・・・スペクトル概形情報量子化部、6・・・スペク
トル微m構造情報量子化部、7・・・音声タイプライタ
認識部、8・・・送信部、9・・・プロセッサ部、1o
・・・キーボード部、11・・・ディスプレ一部、12
・・・メモリ部、13・・・受信部、14・・・スペク
トル概形情報復号部、15・・・スペクトル微細構造復
号部、16・・・音声波形合成部、17・・・音声合成
バラメー9 A ″″“・18“°唱”音丸
、47−代理人 弁理士 小川勝馬j・・′ ゝ・、t、I: 暮 II¥1
Claims (1)
- 【特許請求の範囲】 1、音声情報圧縮伝送端末機能と音声の規則合成機能と
を有し、前記音声情報圧縮伝送端末機能の復号機能の一
部と前記音声規則合成機能の音声波形合成機能の一部と
が共有されることを特徴とする文字音声通信方式及び装
置。 2、上記声音の規則合成機能は、音声入力を文字列に変
換する音声タイプライタ機能を併せ有し、該声音タイプ
ライタ機能の音声分祈機能の一部と前記音声情報圧縮伝
送端末機能の符号化部の一部とが共有されることを特徴
とする特許請求の範囲第1項記載の文字音声通信方式及
び装置。 3、上記音声情報圧縮伝送機能と文字情報伝送機能とは
切り換え使用できる機能とを有する特許請求の範囲第1
項又は第2項記載の文字音声通信方式及び装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60093611A JPS61252596A (ja) | 1985-05-02 | 1985-05-02 | 文字音声通信方式及び装置 |
US07/343,892 US4975957A (en) | 1985-05-02 | 1989-04-24 | Character voice communication system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60093611A JPS61252596A (ja) | 1985-05-02 | 1985-05-02 | 文字音声通信方式及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61252596A true JPS61252596A (ja) | 1986-11-10 |
Family
ID=14087121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60093611A Pending JPS61252596A (ja) | 1985-05-02 | 1985-05-02 | 文字音声通信方式及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US4975957A (ja) |
JP (1) | JPS61252596A (ja) |
Families Citing this family (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5077798A (en) * | 1988-09-28 | 1991-12-31 | Hitachi, Ltd. | Method and system for voice coding based on vector quantization |
US5146538A (en) * | 1989-08-31 | 1992-09-08 | Motorola, Inc. | Communication system and method with voice steering |
DE69028072T2 (de) * | 1989-11-06 | 1997-01-09 | Canon Kk | Verfahren und Einrichtung zur Sprachsynthese |
US5263118A (en) * | 1990-03-13 | 1993-11-16 | Applied Voice Technology, Inc. | Parking ticket enforcement system |
JPH06195326A (ja) * | 1992-12-25 | 1994-07-15 | Canon Inc | 文書入力方法及び装置 |
US5278943A (en) * | 1990-03-23 | 1994-01-11 | Bright Star Technology, Inc. | Speech animation and inflection system |
US5157759A (en) * | 1990-06-28 | 1992-10-20 | At&T Bell Laboratories | Written language parser system |
US5271089A (en) * | 1990-11-02 | 1993-12-14 | Nec Corporation | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits |
US5226084A (en) * | 1990-12-05 | 1993-07-06 | Digital Voice Systems, Inc. | Methods for speech quantization and error correction |
US5305421A (en) * | 1991-08-28 | 1994-04-19 | Itt Corporation | Low bit rate speech coding system and compression |
EP0542628B1 (en) * | 1991-11-12 | 2001-10-10 | Fujitsu Limited | Speech synthesis system |
US5384893A (en) * | 1992-09-23 | 1995-01-24 | Emerson & Stern Associates, Inc. | Method and apparatus for speech synthesis based on prosodic analysis |
US5640490A (en) * | 1994-11-14 | 1997-06-17 | Fonix Corporation | User independent, real-time speech recognition system and method |
US5680506A (en) * | 1994-12-29 | 1997-10-21 | Lucent Technologies Inc. | Apparatus and method for speech signal analysis |
JP3499625B2 (ja) * | 1995-01-11 | 2004-02-23 | 富士通株式会社 | 電子コミュニティシステム |
US5677739A (en) * | 1995-03-02 | 1997-10-14 | National Captioning Institute | System and method for providing described television services |
JP3086151B2 (ja) * | 1995-05-18 | 2000-09-11 | シャープ株式会社 | 二次元バーコード処理機能付き情報処理装置 |
AU5738296A (en) * | 1995-05-26 | 1996-12-11 | Applied Language Technologies | Method and apparatus for dynamic adaptation of a large vocab ulary speech recognition system and for use of constraints f rom a database in a large vocabulary speech recognition syst em |
US5696879A (en) * | 1995-05-31 | 1997-12-09 | International Business Machines Corporation | Method and apparatus for improved voice transmission |
JPH098752A (ja) * | 1995-06-26 | 1997-01-10 | Matsushita Electric Ind Co Ltd | 多重情報受信装置及びナビゲーション装置 |
US6072467A (en) * | 1996-05-03 | 2000-06-06 | Mitsubishi Electric Information Technology Center America, Inc. (Ita) | Continuously variable control of animated on-screen characters |
US5915238A (en) * | 1996-07-16 | 1999-06-22 | Tjaden; Gary S. | Personalized audio information delivery system |
US5764851A (en) * | 1996-07-24 | 1998-06-09 | Industrial Technology Research Institute | Fast speech recognition method for mandarin words |
FR2752477B1 (fr) * | 1996-08-16 | 1998-09-25 | Vernois Goulven Jean Alain | Systeme de transmission de messages oraux |
JP3537965B2 (ja) * | 1996-08-28 | 2004-06-14 | 日本電気株式会社 | 多段式フロントエンド・プロセッサ装置 |
US5774857A (en) * | 1996-11-15 | 1998-06-30 | Motorola, Inc. | Conversion of communicated speech to text for tranmission as RF modulated base band video |
US6138096A (en) * | 1996-11-26 | 2000-10-24 | Add Value Holdings Pte Ltd. | Apparatus for speech-based generation, audio translation, and manipulation of text messages over voice lines |
US5875427A (en) * | 1996-12-04 | 1999-02-23 | Justsystem Corp. | Voice-generating/document making apparatus voice-generating/document making method and computer-readable medium for storing therein a program having a computer execute voice-generating/document making sequence |
US5924068A (en) * | 1997-02-04 | 1999-07-13 | Matsushita Electric Industrial Co. Ltd. | Electronic news reception apparatus that selectively retains sections and searches by keyword or index for text to speech conversion |
JPH10319947A (ja) * | 1997-05-15 | 1998-12-04 | Kawai Musical Instr Mfg Co Ltd | 音域制御装置 |
US6064957A (en) * | 1997-08-15 | 2000-05-16 | General Electric Company | Improving speech recognition through text-based linguistic post-processing |
IL125289A (en) | 1998-07-09 | 2004-03-28 | Ehud Ezroni | Aircraft communication system |
US6813601B1 (en) * | 1998-08-11 | 2004-11-02 | Loral Spacecom Corp. | Highly compressed voice and data transmission system and method for mobile communications |
US6490563B2 (en) * | 1998-08-17 | 2002-12-03 | Microsoft Corporation | Proofreading with text to speech feedback |
WO2000058949A1 (en) | 1999-03-25 | 2000-10-05 | Kent Ridge Digital Labs | Low data transmission rate and intelligible speech communication |
US6671672B1 (en) * | 1999-03-30 | 2003-12-30 | Nuance Communications | Voice authentication system having cognitive recall mechanism for password verification |
JP3408461B2 (ja) * | 1999-07-09 | 2003-05-19 | エヌイーシーインフロンティア株式会社 | 電話システム |
US6446042B1 (en) | 1999-11-15 | 2002-09-03 | Sharp Laboratories Of America, Inc. | Method and apparatus for encoding speech in a communications network |
US6754619B1 (en) * | 1999-11-15 | 2004-06-22 | Sony Corporation | Digital recording and playback system with voice recognition capability for concurrent text generation |
JP2002207671A (ja) * | 2001-01-05 | 2002-07-26 | Nec Saitama Ltd | 携帯電話機及び電子メール文章送信/再生方法 |
US6625576B2 (en) * | 2001-01-29 | 2003-09-23 | Lucent Technologies Inc. | Method and apparatus for performing text-to-speech conversion in a client/server environment |
JP2002244688A (ja) * | 2001-02-15 | 2002-08-30 | Sony Computer Entertainment Inc | 情報処理方法及び装置、情報伝送システム、情報処理プログラムを情報処理装置に実行させる媒体、情報処理プログラム |
US20030039340A1 (en) * | 2001-08-24 | 2003-02-27 | Intel Corporation | Adaptive instant messaging |
ATE310302T1 (de) * | 2001-09-28 | 2005-12-15 | Cit Alcatel | Kommunikationsvorrichtung und verfahren zum senden und empfangen von sprachsignalen unter kombination eines spracherkennungsmodules mit einer kodiereinheit |
US7177801B2 (en) * | 2001-12-21 | 2007-02-13 | Texas Instruments Incorporated | Speech transfer over packet networks using very low digital data bandwidths |
US7272564B2 (en) * | 2002-03-22 | 2007-09-18 | Motorola, Inc. | Method and apparatus for multimodal communication with user control of delivery modality |
US7072684B2 (en) * | 2002-09-27 | 2006-07-04 | International Business Machines Corporation | Method, apparatus and computer program product for transcribing a telephone communication |
US7774694B2 (en) | 2002-12-06 | 2010-08-10 | 3M Innovation Properties Company | Method and system for server-based sequential insertion processing of speech recognition results |
US7444285B2 (en) * | 2002-12-06 | 2008-10-28 | 3M Innovative Properties Company | Method and system for sequential insertion of speech recognition results to facilitate deferred transcription services |
US20050096910A1 (en) * | 2002-12-06 | 2005-05-05 | Watson Kirk L. | Formed document templates and related methods and systems for automated sequential insertion of speech recognition results |
JP3938033B2 (ja) * | 2002-12-13 | 2007-06-27 | 株式会社日立製作所 | 通信端末およびそれを用いたシステム |
US7676722B2 (en) * | 2004-03-31 | 2010-03-09 | Sony Corporation | Multimedia content delivery using pre-stored multiple description coded video with restart |
FR2868586A1 (fr) * | 2004-03-31 | 2005-10-07 | France Telecom | Procede et systeme ameliores de conversion d'un signal vocal |
CN112634858B (zh) * | 2020-12-16 | 2024-01-23 | 平安科技(深圳)有限公司 | 语音合成方法、装置、计算机设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58197951A (ja) * | 1982-05-13 | 1983-11-17 | Nec Corp | 文字音声通信端末装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4301329A (en) * | 1978-01-09 | 1981-11-17 | Nippon Electric Co., Ltd. | Speech analysis and synthesis apparatus |
GB2102254B (en) * | 1981-05-11 | 1985-08-07 | Kokusai Denshin Denwa Co Ltd | A speech analysis-synthesis system |
US4661915A (en) * | 1981-08-03 | 1987-04-28 | Texas Instruments Incorporated | Allophone vocoder |
NL8200726A (nl) * | 1982-02-24 | 1983-09-16 | Philips Nv | Inrichting voor het genereren van de auditieve informatie van een verzameling karakters. |
NL8202318A (nl) * | 1982-06-09 | 1984-01-02 | Koninkl Philips Electronics Nv | Systeem voor de overdracht van spraak over een gestoorde transmissieweg. |
US4624008A (en) * | 1983-03-09 | 1986-11-18 | International Telephone And Telegraph Corporation | Apparatus for automatic speech recognition |
US4707858A (en) * | 1983-05-02 | 1987-11-17 | Motorola, Inc. | Utilizing word-to-digital conversion |
US4799261A (en) * | 1983-11-03 | 1989-01-17 | Texas Instruments Incorporated | Low data rate speech encoding employing syllable duration patterns |
US4692941A (en) * | 1984-04-10 | 1987-09-08 | First Byte | Real-time text-to-speech conversion system |
-
1985
- 1985-05-02 JP JP60093611A patent/JPS61252596A/ja active Pending
-
1989
- 1989-04-24 US US07/343,892 patent/US4975957A/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58197951A (ja) * | 1982-05-13 | 1983-11-17 | Nec Corp | 文字音声通信端末装置 |
Also Published As
Publication number | Publication date |
---|---|
US4975957A (en) | 1990-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS61252596A (ja) | 文字音声通信方式及び装置 | |
US6098041A (en) | Speech synthesis system | |
US6810379B1 (en) | Client/server architecture for text-to-speech synthesis | |
US6219641B1 (en) | System and method of transmitting speech at low line rates | |
US7124082B2 (en) | Phonetic speech-to-text-to-speech system and method | |
JP3446764B2 (ja) | 音声合成システム及び音声合成サーバ | |
US20070088547A1 (en) | Phonetic speech-to-text-to-speech system and method | |
TW521265B (en) | Relative pulse position in CELP vocoding | |
JP2001242896A (ja) | 音声符号化/復号装置およびその方法 | |
EP1298647B1 (en) | A communication device and a method for transmitting and receiving of natural speech, comprising a speech recognition module coupled to an encoder | |
JP3092653B2 (ja) | 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置 | |
JP2000356995A (ja) | 音声通信システム | |
JPH0561637A (ja) | 音声合成メールシステム | |
JPH03241399A (ja) | 音声送受信装置 | |
JP2005309164A (ja) | 読み上げ用データ符号化装置および読み上げ用データ符号化プログラム | |
JPH0475100A (ja) | 符号化装置 | |
JP2003202884A (ja) | 音声合成システム | |
JP3099844B2 (ja) | 音声符号化復号化方式 | |
JPS6073699A (ja) | 音声伝送装置 | |
JPH03288898A (ja) | 音声合成装置 | |
JP2024017475A (ja) | 音声通信方式 | |
WO2001042875A2 (en) | Language translation voice telephony | |
KR940002855B1 (ko) | 음성규칙합성 lsi 장치 | |
JP2000112845A (ja) | 音声通知付電子メールシステム | |
JPH0682280B2 (ja) | 音声符号化方式 |