JPH10285275A - 通話方法、音声送信装置及び音声受信装置 - Google Patents
通話方法、音声送信装置及び音声受信装置Info
- Publication number
- JPH10285275A JPH10285275A JP9093448A JP9344897A JPH10285275A JP H10285275 A JPH10285275 A JP H10285275A JP 9093448 A JP9093448 A JP 9093448A JP 9344897 A JP9344897 A JP 9344897A JP H10285275 A JPH10285275 A JP H10285275A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- data
- terminal
- transmitting
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 49
- 238000004891 communication Methods 0.000 claims abstract description 60
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 36
- 238000003786 synthesis reaction Methods 0.000 claims description 36
- 238000006243 chemical reaction Methods 0.000 claims description 28
- 230000006866 deterioration Effects 0.000 abstract description 3
- 230000005540 biological transmission Effects 0.000 description 17
- 238000007906 compression Methods 0.000 description 15
- 230000006835 compression Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000013500 data storage Methods 0.000 description 6
- 230000006837 decompression Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 230000000192 social effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0018—Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/253—Telephone sets using digital voice transmission
- H04M1/2535—Telephone sets using digital voice transmission adapted for voice communication over an Internet Protocol [IP] network
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S379/00—Telephonic communications
- Y10S379/90—Internet, e.g. Internet phone, webphone, internet-based telephony
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
(57)【要約】
【課題】 本発明は、非ギャランティー型ネットワーク
を介した通話方法において、通信の不安定性や負荷変動
に起因する音声劣化、言葉の不自然な分断、音飛び等を
極力排して理解容易な会話を可能にすると共に、自然な
会話をすることができる、通話方法、音声送信装置及び
音声受信装置を提供する。 【解決手段】 話者の音声は、マイクロフォン1a等の
音声−電気変換手段を介して音声入力部1に入力され、
音声信号がこれに対応する音声データ電気信号に変換さ
れる。音声データは音声認識変換部2に入力され、音声
認識により文字コードデータ信号に変換される。
を介した通話方法において、通信の不安定性や負荷変動
に起因する音声劣化、言葉の不自然な分断、音飛び等を
極力排して理解容易な会話を可能にすると共に、自然な
会話をすることができる、通話方法、音声送信装置及び
音声受信装置を提供する。 【解決手段】 話者の音声は、マイクロフォン1a等の
音声−電気変換手段を介して音声入力部1に入力され、
音声信号がこれに対応する音声データ電気信号に変換さ
れる。音声データは音声認識変換部2に入力され、音声
認識により文字コードデータ信号に変換される。
Description
【発明の属する技術分野】本発明は、インターネット等
の非ギャランティー型ネットワークを介して通話を行う
通話方法、音声送信装置及び音声受信装置に関する。
の非ギャランティー型ネットワークを介して通話を行う
通話方法、音声送信装置及び音声受信装置に関する。
【0001】
【従来の技術】インターネットの普及に伴い、このイン
ターネット網を介して音声を相互に伝送して公衆電話回
線と同様に双方向の通話を行う技術が提案されている。
このような技術はインターネットホンサービスと呼ばれ
る。
ターネット網を介して音声を相互に伝送して公衆電話回
線と同様に双方向の通話を行う技術が提案されている。
このような技術はインターネットホンサービスと呼ばれ
る。
【0002】現在のインターネットホンサービスは、コ
ンピュータとルータによるネットワークを多段に経由す
るため、各接続点でのサ一バの負荷による遅延の影響を
受け、遅延と言葉の不自然な分断、音飛び等が発生し完
全な通話が出来ないのが普通である。これは、インター
ネットは情報の時間、到達を保証しない非ギャランティ
ー型ネットワーク(ベストエフォート型ともいう)であ
ることに要因がある。
ンピュータとルータによるネットワークを多段に経由す
るため、各接続点でのサ一バの負荷による遅延の影響を
受け、遅延と言葉の不自然な分断、音飛び等が発生し完
全な通話が出来ないのが普通である。これは、インター
ネットは情報の時間、到達を保証しない非ギャランティ
ー型ネットワーク(ベストエフォート型ともいう)であ
ることに要因がある。
【0003】この点を解決するために、リアルタイムプ
ロトコルや回線を確保するリザーブプロトコルが提案さ
れているが、基本的に多数の通話者がネットワークを共
用する事からお互いの完全な意図疎通を保証するに至っ
ていない。
ロトコルや回線を確保するリザーブプロトコルが提案さ
れているが、基本的に多数の通話者がネットワークを共
用する事からお互いの完全な意図疎通を保証するに至っ
ていない。
【0004】上述の間題の原因にインタ一ネット自体の
伝送能力が深く関わることは当然であるが、音声データ
の圧縮能力の問題も関わっている。音声データの圧縮に
は、圧縮率を上げると音声品質が劣化し、圧縮率を低く
押さえると音声品質は上がるが伝送路の帯域を大幅に消
費する事から遅延が生じ音声の取りこぼし音飛び・空白
等が生じて、いずれのケースでも所望の通話品質が得ら
れない。
伝送能力が深く関わることは当然であるが、音声データ
の圧縮能力の問題も関わっている。音声データの圧縮に
は、圧縮率を上げると音声品質が劣化し、圧縮率を低く
押さえると音声品質は上がるが伝送路の帯域を大幅に消
費する事から遅延が生じ音声の取りこぼし音飛び・空白
等が生じて、いずれのケースでも所望の通話品質が得ら
れない。
【0005】狭帯域で多くの音声情報を送る手法とし
て、入力された通話者の音声を音声認識技術により文字
データに変換し、文字データを受話側に送信する技術が
ある。音声情報に比較して文字データの情報量は格段に
少ないので、通信遅延を短くすることができ、加えて音
声圧縮に伴う問題も生じない。このような技術の一例と
しては、特開昭60−136450号公報、特開昭61
−256848号公報が従来知られている。
て、入力された通話者の音声を音声認識技術により文字
データに変換し、文字データを受話側に送信する技術が
ある。音声情報に比較して文字データの情報量は格段に
少ないので、通信遅延を短くすることができ、加えて音
声圧縮に伴う問題も生じない。このような技術の一例と
しては、特開昭60−136450号公報、特開昭61
−256848号公報が従来知られている。
【0006】前者はパケット交換機の端末間で、入力音
声を認識した後該交換機のパケット形式のデータに変換
し伝送する方式を示しており、交換機の処理効率を向上
させる手段として提案されている。本方式では、単一の
パケット交換網内における伝送のため、多くの未知の接
続点を経て伝達されるインターネット網で生ずる大幅な
遅延や、負荷変動に対する対処はされておらず、また、
同公報にも記載されているように、画一の音色での再生
にとどまっており自然な音声への配慮はなされていない
等フレキシブル且つ広範囲の情報伝送への適用は困難で
ある。
声を認識した後該交換機のパケット形式のデータに変換
し伝送する方式を示しており、交換機の処理効率を向上
させる手段として提案されている。本方式では、単一の
パケット交換網内における伝送のため、多くの未知の接
続点を経て伝達されるインターネット網で生ずる大幅な
遅延や、負荷変動に対する対処はされておらず、また、
同公報にも記載されているように、画一の音色での再生
にとどまっており自然な音声への配慮はなされていない
等フレキシブル且つ広範囲の情報伝送への適用は困難で
ある。
【0007】後者は、送話端末で音声認識を行い文字コ
ードを交換機を通じて相手端末に送り、受話端末で音声
合成を行う構成を示している。本方式も、単一の通信回
線内における伝送のため、上述した前者の方式と同様
に、多くの未知の接続点を経て伝達されるインターネッ
ト網で生ずる大幅な遅延や、負荷変動に対する対処はさ
れておらず、また、リアルタイムあるいは自然な音声へ
の変換の工夫は成されていない。
ードを交換機を通じて相手端末に送り、受話端末で音声
合成を行う構成を示している。本方式も、単一の通信回
線内における伝送のため、上述した前者の方式と同様
に、多くの未知の接続点を経て伝達されるインターネッ
ト網で生ずる大幅な遅延や、負荷変動に対する対処はさ
れておらず、また、リアルタイムあるいは自然な音声へ
の変換の工夫は成されていない。
【0008】
【発明が解決しようとする課題】従って、上述した従来
の技術には次のような課題が存する。
の技術には次のような課題が存する。
【0009】第1の課題は、インターネット網自体の伝
送能力、多段に構成されているサ一バ等未知の通信路を
経るための通信の不安定性や負荷変動に起因する、音声
の劣化と言葉の不自然な分断、音飛び等により意味の理
解できる会話が出来にくいことである。
送能力、多段に構成されているサ一バ等未知の通信路を
経るための通信の不安定性や負荷変動に起因する、音声
の劣化と言葉の不自然な分断、音飛び等により意味の理
解できる会話が出来にくいことである。
【0010】第2の課題は、音声認識を用いた音声伝送
システムにおいても、文字コードによる伝達のみでは、
機械的な音声が再生されるため自然な会話が出来にくく
意味の取り違えなどの問題が発生する可能性があること
である。
システムにおいても、文字コードによる伝達のみでは、
機械的な音声が再生されるため自然な会話が出来にくく
意味の取り違えなどの問題が発生する可能性があること
である。
【0011】本発明は上述した課題に鑑みてなされたも
ので、その目的とするところは、非ギャランティー型ネ
ットワークを介した通話方法において、通信の不安定性
や負荷変動に起因する音声劣化、言葉の不自然な分断、
音飛び等を極力排して理解容易な会話を可能にすると共
に、自然な会話をすることができる、通話方法、音声送
信装置及び音声受信装置を提供する点にある。
ので、その目的とするところは、非ギャランティー型ネ
ットワークを介した通話方法において、通信の不安定性
や負荷変動に起因する音声劣化、言葉の不自然な分断、
音飛び等を極力排して理解容易な会話を可能にすると共
に、自然な会話をすることができる、通話方法、音声送
信装置及び音声受信装置を提供する点にある。
【0012】
【課題を解決するための手段】本発明は、非ギャランテ
ィー型ネットワークを介して話者の音声を通話する方法
に適用される。
ィー型ネットワークを介して話者の音声を通話する方法
に適用される。
【0013】そして、上述の課題は、送話側端末におい
て話者の音声を音声データに変換した後、この音声デー
タを音声認識して文字データに変換し、受話側端末の識
別データに基づいて送話側端末を非ギャランティー型ネ
ットワークを介して受話側端末に接続し、送話側端末と
受話側端末との接続後、文字データをパケット化して受
話側端末に向けて送信し、受話側端末において受信した
パケット化文字データを音声合成により音声データに変
換した後、音声として出力することにより解決される。
て話者の音声を音声データに変換した後、この音声デー
タを音声認識して文字データに変換し、受話側端末の識
別データに基づいて送話側端末を非ギャランティー型ネ
ットワークを介して受話側端末に接続し、送話側端末と
受話側端末との接続後、文字データをパケット化して受
話側端末に向けて送信し、受話側端末において受信した
パケット化文字データを音声合成により音声データに変
換した後、音声として出力することにより解決される。
【0014】本発明によれば、次のようなことが達成で
きる。まず第1に、認識によるデータ量の削減により通
信の遅延を無くすことができる。話言葉の文節毎に意味
を解釈し、文字データというデータ量の非常に少ない形
式に変換してしまう為、通信の遅延を非常に短くするこ
とが出来る。この為、早いタイミングで正しい情報を得
ることが出来る。
きる。まず第1に、認識によるデータ量の削減により通
信の遅延を無くすことができる。話言葉の文節毎に意味
を解釈し、文字データというデータ量の非常に少ない形
式に変換してしまう為、通信の遅延を非常に短くするこ
とが出来る。この為、早いタイミングで正しい情報を得
ることが出来る。
【0015】第2に、認識による意味情報の相手への確
実な伝達が可能になる。話し言葉を認識し、まとまった
文字情報にする事により、音というノイズの影響を受け
易い曖昧な情報でなく明瞭に意味のある言葉として再生
する事により話者の意志を正しく伝えることが出来る。
実な伝達が可能になる。話し言葉を認識し、まとまった
文字情報にする事により、音というノイズの影響を受け
易い曖昧な情報でなく明瞭に意味のある言葉として再生
する事により話者の意志を正しく伝えることが出来る。
【0016】この際、相手に正しい情報を伝えるために
は、多少の遅延があっても正確な文章がやりとりきれる
ことが必要である。従来の方式では、言葉の内容に依存
しないでコード化していた為通信の遅延、とぎれ等が有
ると意味が全く通じなくなる恐れがあった。この為、音
声をより、わかりやすく確実に伝えるための手段とし
て、下記のような構成を採用してもよい。
は、多少の遅延があっても正確な文章がやりとりきれる
ことが必要である。従来の方式では、言葉の内容に依存
しないでコード化していた為通信の遅延、とぎれ等が有
ると意味が全く通じなくなる恐れがあった。この為、音
声をより、わかりやすく確実に伝えるための手段とし
て、下記のような構成を採用してもよい。
【0017】すなわち、上述の通話方法において、音声
データを所定語数毎に分割して音声認識し、文字データ
に変換してもよい。この場合、音声データを文節毎に分
割して音声認識し、文字データに変換してもよい。
データを所定語数毎に分割して音声認識し、文字データ
に変換してもよい。この場合、音声データを文節毎に分
割して音声認識し、文字データに変換してもよい。
【0018】また、上述の通話方法において、音声認識
に並行して、音声データを所定語単位で分割してデータ
圧縮した圧縮音声データを作成し、音声認識が不十分又
は不成立の場合は圧縮音声データをパケット化して送出
するようにしてもよい。
に並行して、音声データを所定語単位で分割してデータ
圧縮した圧縮音声データを作成し、音声認識が不十分又
は不成立の場合は圧縮音声データをパケット化して送出
するようにしてもよい。
【0019】さらに、送話側端末に入力される音声の特
徴を示す音声プロファイルをこの送話側端末から受話側
端末に予め送信しておき、受話側端末において、音声合
成時に音声プロファイルに基づいて文字データを音声デ
ータに変換するようにしてもよい。あるいは、送話側端
末及び受話側端末の双方において、標準音声に対する音
声合成標準パターンを用意しておき、送話側端末におい
て、この送話側端末に入力された音声と標準音声との差
分データを作成してパケット化文字データとともに送出
し、受話側端末において、音声合成標準パターン及び差
分データに基づいて音声合成するようにしてもよい。
徴を示す音声プロファイルをこの送話側端末から受話側
端末に予め送信しておき、受話側端末において、音声合
成時に音声プロファイルに基づいて文字データを音声デ
ータに変換するようにしてもよい。あるいは、送話側端
末及び受話側端末の双方において、標準音声に対する音
声合成標準パターンを用意しておき、送話側端末におい
て、この送話側端末に入力された音声と標準音声との差
分データを作成してパケット化文字データとともに送出
し、受話側端末において、音声合成標準パターン及び差
分データに基づいて音声合成するようにしてもよい。
【0020】さらに、送話側端末において背景音に対応
する背景音源データをパケット化文字データとともに送
出し、受話側端末において、音声データと背景音とを重
畳して出力してもよいし、送話側端末に、サンプル音声
データを予め用意しておき、送話側端末に話者から最初
の音声入力があった際に音声データとサンプル音声デー
タとを比較して、音声データとサンプル音声データとが
同一話者によるものであるか否かを確認し、同一話者に
よるものであることが確認されたときにのみ通話を許可
するようにしてもよい。送話側端末において、話者を撮
像した画像データを作成してこれを受話側端末に送出
し、受話側端末において、受信した画像データに基づい
て画像を表示してもよい。受話側端末において、受信し
たパケット化文字データを文字形式で表示し、また、受
話側端末において、受信したパケット化文字データを電
子メール形式に変換してもよい。
する背景音源データをパケット化文字データとともに送
出し、受話側端末において、音声データと背景音とを重
畳して出力してもよいし、送話側端末に、サンプル音声
データを予め用意しておき、送話側端末に話者から最初
の音声入力があった際に音声データとサンプル音声デー
タとを比較して、音声データとサンプル音声データとが
同一話者によるものであるか否かを確認し、同一話者に
よるものであることが確認されたときにのみ通話を許可
するようにしてもよい。送話側端末において、話者を撮
像した画像データを作成してこれを受話側端末に送出
し、受話側端末において、受信した画像データに基づい
て画像を表示してもよい。受話側端末において、受信し
たパケット化文字データを文字形式で表示し、また、受
話側端末において、受信したパケット化文字データを電
子メール形式に変換してもよい。
【0021】また、本発明は、話者の音声を音声に関す
るデータに変換して送信する音声送信装置に適用され、
そして、上述の課題は、話者の音声を音声データに変換
する音声入力手段と、音声データを音声認識して文字デ
ータに変換する音声認識手段と、非ギャランティーネッ
トワーク上の特定の通話相手を識別するための識別デー
タを入力する識別データ入力手段と、識別データに基づ
いて非ギャランティー型ネットワークを介して特定の通
話相手に接続するネットワーク接続手段と、文字データ
をパケット化して非ギャランティー型ネットワークに送
出する送信手段とを設けることにより達成される。
るデータに変換して送信する音声送信装置に適用され、
そして、上述の課題は、話者の音声を音声データに変換
する音声入力手段と、音声データを音声認識して文字デ
ータに変換する音声認識手段と、非ギャランティーネッ
トワーク上の特定の通話相手を識別するための識別デー
タを入力する識別データ入力手段と、識別データに基づ
いて非ギャランティー型ネットワークを介して特定の通
話相手に接続するネットワーク接続手段と、文字データ
をパケット化して非ギャランティー型ネットワークに送
出する送信手段とを設けることにより達成される。
【0022】音声認識手段によって音声を認識して文字
データに変換する際、文字データの変換に成功した場合
には変換に成功した文字データをパケット化し、認識に
失敗した場合には認識に失敗した音声データを圧縮符号
化してパケット化することもできる。
データに変換する際、文字データの変換に成功した場合
には変換に成功した文字データをパケット化し、認識に
失敗した場合には認識に失敗した音声データを圧縮符号
化してパケット化することもできる。
【0023】また、本発明は、音声に関するデータを受
信して音声に変換する音声受信装置に適用され、そし
て、上述の課題は、自身を特定する識別信号に基づいて
非ギャランティー型ネットワークと接続するネットワー
ク接続手段と、非ギャランティー型ネットワークからパ
ケット化された文字データを受信する受信手段と、受信
されたパケット化文字データを音声合成により音声デー
タに変換する音声合成変換手段と、変換された音声デー
タに基づいて音声を出力する音声出力手段とを設けるこ
とにより達成される。
信して音声に変換する音声受信装置に適用され、そし
て、上述の課題は、自身を特定する識別信号に基づいて
非ギャランティー型ネットワークと接続するネットワー
ク接続手段と、非ギャランティー型ネットワークからパ
ケット化された文字データを受信する受信手段と、受信
されたパケット化文字データを音声合成により音声デー
タに変換する音声合成変換手段と、変換された音声デー
タに基づいて音声を出力する音声出力手段とを設けるこ
とにより達成される。
【0024】
【発明の実施の形態】次に本発明の実施形態について、
図面を参照して説明する。
図面を参照して説明する。
【0025】―第1実施形態― 図1(a)は、本発明の通話方法が適用される音声送信
装置及び受信装置の第1実施形態を示すブロック図であ
る。
装置及び受信装置の第1実施形態を示すブロック図であ
る。
【0026】この図において、話者の音声は、マイクロ
フォン1a等の音声−電気変換手段を介して音声入力部
1に入力され、音声信号がこれに対応する音声データ電
気信号に変換される。音声データは音声認識変換部2に
入力され、音声認識により文字コードデータ信号に変換
される。たとえばモデム又はターミナルアダプタからな
る網制御・アクセス部4は、公衆電話回線51、インタ
ーネットサービスプロバイダ52を経由しインターネッ
ト101に接続する。この網制御・アクセス部4が通話
相手の受信側端末の網制御・アクセス部4とインターネ
ットプロトコルにより接続を確立した後、音声認識によ
り通話に入る。この際、送信側端末は受信側端末の識別
番号、一般的にはIP(Internet Protocol)アドレス
を事前に知っており、このIPアドレスを用いて受信側
端末との接続を確立する。
フォン1a等の音声−電気変換手段を介して音声入力部
1に入力され、音声信号がこれに対応する音声データ電
気信号に変換される。音声データは音声認識変換部2に
入力され、音声認識により文字コードデータ信号に変換
される。たとえばモデム又はターミナルアダプタからな
る網制御・アクセス部4は、公衆電話回線51、インタ
ーネットサービスプロバイダ52を経由しインターネッ
ト101に接続する。この網制御・アクセス部4が通話
相手の受信側端末の網制御・アクセス部4とインターネ
ットプロトコルにより接続を確立した後、音声認識によ
り通話に入る。この際、送信側端末は受信側端末の識別
番号、一般的にはIP(Internet Protocol)アドレス
を事前に知っており、このIPアドレスを用いて受信側
端末との接続を確立する。
【0027】受信側端末との接続確立後、パケット送信
および通信制御部5aは文字コードデータ信号を適当な
長さに区切ってパケット化して、 IPアドレス、デー
タ番号等を付して網制御・アクセス部4を介して受信側
端末に伝送する。受信側端末では受信したパケットデー
タをパケット受信および通信制御部5bで文字コードデ
ータ信号に復調した後、音声合成・変換部2で音声合成
により音声データ信号に変換する。そして、音声出力部
1は、音声データ信号をスピーカ1b等の電気−音声変
換手段を介して音声として出力する。
および通信制御部5aは文字コードデータ信号を適当な
長さに区切ってパケット化して、 IPアドレス、デー
タ番号等を付して網制御・アクセス部4を介して受信側
端末に伝送する。受信側端末では受信したパケットデー
タをパケット受信および通信制御部5bで文字コードデ
ータ信号に復調した後、音声合成・変換部2で音声合成
により音声データ信号に変換する。そして、音声出力部
1は、音声データ信号をスピーカ1b等の電気−音声変
換手段を介して音声として出力する。
【0028】図1(b)は、本発明の通話方法が適用さ
れる音声送信装置及び受信装置の第1実施形態の変形例
を示すブロック図である。
れる音声送信装置及び受信装置の第1実施形態の変形例
を示すブロック図である。
【0029】この変形例では、インターネット網101
内のインターネットホンサービスプロバイダ102に送
信側、受信側端末がそれぞれ接続されている状況におい
て、送信側が出した相手識別番号をインターネットホン
サービスプロバイダ102が受け取り、インターネット
ホンサービスプロバイダ102が受信側への接続プロセ
スを実行した後、端末間の音声認識による通話を開始す
る。
内のインターネットホンサービスプロバイダ102に送
信側、受信側端末がそれぞれ接続されている状況におい
て、送信側が出した相手識別番号をインターネットホン
サービスプロバイダ102が受け取り、インターネット
ホンサービスプロバイダ102が受信側への接続プロセ
スを実行した後、端末間の音声認識による通話を開始す
る。
【0030】本接続は、相手側端末がダイヤルアップ接
続によりインターネットサービスプロバイダ52に接続
している場合のように、相手側端末が固定の識別番号
(IPアドレス)を持たない場合に適用される。この
際、それぞれの端末側で事前にインターネットホンサー
ビスプロバイダ102に自分の電話番号やメールアドレ
スなど接続に必要な識別ID情報を登録しておき、送信
側端末が受信側端末の識別ID情報を入力するとこの識
別ID情報からインターネットホンサービスプロバイダ
102がモデム、ターミナルアダプタ等のアクセスデバ
イスを介し受信側端末に発呼することにより受信側端末
への接続を確立する。あるいは、双方の端末が同時期に
インターネットホンサービスプロバイダ102に接続し
ている場合にも接続確立が可能である。
続によりインターネットサービスプロバイダ52に接続
している場合のように、相手側端末が固定の識別番号
(IPアドレス)を持たない場合に適用される。この
際、それぞれの端末側で事前にインターネットホンサー
ビスプロバイダ102に自分の電話番号やメールアドレ
スなど接続に必要な識別ID情報を登録しておき、送信
側端末が受信側端末の識別ID情報を入力するとこの識
別ID情報からインターネットホンサービスプロバイダ
102がモデム、ターミナルアダプタ等のアクセスデバ
イスを介し受信側端末に発呼することにより受信側端末
への接続を確立する。あるいは、双方の端末が同時期に
インターネットホンサービスプロバイダ102に接続し
ている場合にも接続確立が可能である。
【0031】図1に示す装置は、パーソナルコンピュー
タ(PC)等の処理装置に通信装置を付加し組み合わせ
て構成するタイプと、処理部、通信部を一体としたタイ
プのいずれか又はそれぞれの特長を合わせたタイプが可
能である。
タ(PC)等の処理装置に通信装置を付加し組み合わせ
て構成するタイプと、処理部、通信部を一体としたタイ
プのいずれか又はそれぞれの特長を合わせたタイプが可
能である。
【0032】−第2実施形態− 図2は、本発明の通話方法が適用される音声送信装置及
び受信装置の第2実施形態を示すブロック図である。
び受信装置の第2実施形態を示すブロック図である。
【0033】本装置、すなわち送信側端末20a及び受
信側端末20bはそれぞれ、マイクロフォン1a、スピ
ーカ1bを内蔵する音声入出力部(音声入力手段、音声
出力手段)1と、音声入出力部1からの音声データを音
声認識し文字コードデータに変換する音声認識・合成変
換部(音声認識手段、音声合成変換手段)2と、通信制
御手順の全体を制御する通信制御部(送信手段、受信手
段)3と、網制御装置(ネットワーク接続手段)4と、
モデム5と、各種データが入力される入力操作部6と、
音声又はデータ蓄積・表示部7を備える。
信側端末20bはそれぞれ、マイクロフォン1a、スピ
ーカ1bを内蔵する音声入出力部(音声入力手段、音声
出力手段)1と、音声入出力部1からの音声データを音
声認識し文字コードデータに変換する音声認識・合成変
換部(音声認識手段、音声合成変換手段)2と、通信制
御手順の全体を制御する通信制御部(送信手段、受信手
段)3と、網制御装置(ネットワーク接続手段)4と、
モデム5と、各種データが入力される入力操作部6と、
音声又はデータ蓄積・表示部7を備える。
【0034】音声認識・合成変換部2は、図3に示すよ
うに、音声認識回路2aと、圧縮符号化回路2bと、選
択回路2cを有する。音声認識回路2aは、音声認識さ
れた音声データを予め記憶された登録辞書の用語と比較
することで「もしもし」のような音節単位に認識し、認
識結果を文字コードとして選択回路2cに出力する。ま
た、認識が成功したか失敗した(登録辞書に登録された
音声ではなかった)のかを示す信号が選択回路2cに出
力される。圧縮符号化回路2bは、音声信号を圧縮符号
化し選択回路2cに出力する。選択回路2cは、通常、
音声認識回路2aの出力を選択しており、認識が失敗し
たことを示す信号が供給されると、圧縮符号化回路2b
の出力を選択する。
うに、音声認識回路2aと、圧縮符号化回路2bと、選
択回路2cを有する。音声認識回路2aは、音声認識さ
れた音声データを予め記憶された登録辞書の用語と比較
することで「もしもし」のような音節単位に認識し、認
識結果を文字コードとして選択回路2cに出力する。ま
た、認識が成功したか失敗した(登録辞書に登録された
音声ではなかった)のかを示す信号が選択回路2cに出
力される。圧縮符号化回路2bは、音声信号を圧縮符号
化し選択回路2cに出力する。選択回路2cは、通常、
音声認識回路2aの出力を選択しており、認識が失敗し
たことを示す信号が供給されると、圧縮符号化回路2b
の出力を選択する。
【0035】送信側端末20aの入力操作部6から入力
された受信側端末20bの識別番号に基づき、電話回線
51及びイン夕ーネットサービスプロバイダ(ISP)
52を経由し送信側端末20aがインターネット網10
1に接続される。そして、同様の手順によりインターネ
ット網101に接続された相手端末20bとインターネ
ットプロトコルにより接続を確立した後、送話時には、
音声認識・合成変換部2にて、音声を認識し文字コード
に変換し、この文字コードをパケット化してIPアドレ
スを付し受信側端末20bにTCP/IPで送り、相手
端末20bにおいては文字コードを音声合成により音声
に変換する事により音声を相手に伝え、受話に際しては
相手端末20bから送られたパケットデータを送信側端
末20aで順次音声に合成し、話者は互いに連続した文
章で会話できる。
された受信側端末20bの識別番号に基づき、電話回線
51及びイン夕ーネットサービスプロバイダ(ISP)
52を経由し送信側端末20aがインターネット網10
1に接続される。そして、同様の手順によりインターネ
ット網101に接続された相手端末20bとインターネ
ットプロトコルにより接続を確立した後、送話時には、
音声認識・合成変換部2にて、音声を認識し文字コード
に変換し、この文字コードをパケット化してIPアドレ
スを付し受信側端末20bにTCP/IPで送り、相手
端末20bにおいては文字コードを音声合成により音声
に変換する事により音声を相手に伝え、受話に際しては
相手端末20bから送られたパケットデータを送信側端
末20aで順次音声に合成し、話者は互いに連続した文
章で会話できる。
【0036】本構成を有する通信装置の動作を同図を用
いて詳しく説明する。送信側端末20aの音声入出力部
1はマイクロフォン1aから入った音声をまずアナログ
からデジタルに変換し、音声認識・合成変換部2に送
る。音声認識・合成変換部2においては、音声パターン
及び登録辞書を用いて入力音声を文字コードに変換す
る。入力が完了したら通信制御部3は直ちに、文字コー
ドをパケット化しIPアドレスを付してモデム5、網制
御装置4、通信回線を経て、相手端末に転送する。
いて詳しく説明する。送信側端末20aの音声入出力部
1はマイクロフォン1aから入った音声をまずアナログ
からデジタルに変換し、音声認識・合成変換部2に送
る。音声認識・合成変換部2においては、音声パターン
及び登録辞書を用いて入力音声を文字コードに変換す
る。入力が完了したら通信制御部3は直ちに、文字コー
ドをパケット化しIPアドレスを付してモデム5、網制
御装置4、通信回線を経て、相手端末に転送する。
【0037】ここで音声は単語毎にされ、識別した内容
が極力遅延無きよう相手端末に送られるが、互いに接続
されたインターネットサービスプロバイダ52、イン夕
ーネット網101を経由して相手に届く為こうした網の
遅延時間が影響し相手には1呼吸以上遅れて到着する。
が極力遅延無きよう相手端末に送られるが、互いに接続
されたインターネットサービスプロバイダ52、イン夕
ーネット網101を経由して相手に届く為こうした網の
遅延時間が影響し相手には1呼吸以上遅れて到着する。
【0038】尚、本図中音声認識・合成変換部2は、音
声テキスト変換の他にフォーマット変換あるいは圧縮符
号化等の機能も有する物とする。
声テキスト変換の他にフォーマット変換あるいは圧縮符
号化等の機能も有する物とする。
【0039】図4は図2に示す音声送信装置・音声受信
装置の具体的な動作を示すフローチャートである。
装置の具体的な動作を示すフローチャートである。
【0040】まず、発呼側(送信側)端末20aからま
ずダイヤルアップ等によるインターネット呼接続を着呼
側(受信側)端末20bに対して行う。
ずダイヤルアップ等によるインターネット呼接続を着呼
側(受信側)端末20bに対して行う。
【0041】イン夕ーネット呼接続とは、まず発呼側端
末20aの網制御装置4が公衆電話回線51経由でイン
ターネットサービスプロバイダ52にログオンしインタ
ーネット網101に接続する。
末20aの網制御装置4が公衆電話回線51経由でイン
ターネットサービスプロバイダ52にログオンしインタ
ーネット網101に接続する。
【0042】次いで、通信制御部3から網制御装置4、
モデム5を経由してインターネットホンサーバ102に
接続し、つなぎたい相手、すなわち着呼側端末20bの
識別番号を送出する。
モデム5を経由してインターネットホンサーバ102に
接続し、つなぎたい相手、すなわち着呼側端末20bの
識別番号を送出する。
【0043】インターネットホンサーバ102は識別番
号と相手IPアドレスを変換する表を保有しており着呼
側端末20bにIPアドレスを利用して接続要求する。
着呼側端末20bは、その制御のもとにあらかじめダイ
ヤルアップ等によりインターネット網101にログオン
し同一のインターネットホンサービスプロバイダ102
に接続するか、あるいはインターネットホンサービスプ
ロバイダ102が着呼側端末20bに最も近いアクセス
点を経由し電話接続して、着呼側端末20bが自動応答
等により電話呼接続とインターネット網接続を完了して
いるものとする。
号と相手IPアドレスを変換する表を保有しており着呼
側端末20bにIPアドレスを利用して接続要求する。
着呼側端末20bは、その制御のもとにあらかじめダイ
ヤルアップ等によりインターネット網101にログオン
し同一のインターネットホンサービスプロバイダ102
に接続するか、あるいはインターネットホンサービスプ
ロバイダ102が着呼側端末20bに最も近いアクセス
点を経由し電話接続して、着呼側端末20bが自動応答
等により電話呼接続とインターネット網接続を完了して
いるものとする。
【0044】インターネット呼接続は、上述のように中
間にインターネットホンサービスプロバイダ102のよ
うなIPアドレスと個人名を読み替える機構を介する
か、あるいは相手が固定のIPアドレスを持っており発
呼側がそのアドレスをあらかじめ知っていて、そのIP
を送出するかいずれかの方法により行う。
間にインターネットホンサービスプロバイダ102のよ
うなIPアドレスと個人名を読み替える機構を介する
か、あるいは相手が固定のIPアドレスを持っており発
呼側がそのアドレスをあらかじめ知っていて、そのIP
を送出するかいずれかの方法により行う。
【0045】以上の手順は図4のステップS101、S
201において実行される。
201において実行される。
【0046】インターネット呼接続完了後、以下に示す
手順により会話を行う。
手順により会話を行う。
【0047】相手との会話は、端末20a、20bの音
声認識・合成変換部2の音声認識、圧縮伸張機能を使っ
て行う。この場合音声認識が主であり、圧縮伸張機能は
予備として機能する。
声認識・合成変換部2の音声認識、圧縮伸張機能を使っ
て行う。この場合音声認識が主であり、圧縮伸張機能は
予備として機能する。
【0048】会話に先立って発呼側端末20aの通信制
御部3が相手側の音声合成再生時に、発呼者の発音に近
い音色で再生されるようにするためのデータ、音声プロ
ファイルを送出するか相手端末20bとのプロトコルに
より確認する。確認の結果、“送る”が選択された場合
には、発呼側端末20aの標準又は特に音色を変えたい
場合には特に指定した音声プロファイルを相手端末20
bに送出する。同様に受話側端末20bからも音声プロ
ファイルの送信の確認が行われ、“送る”が選択された
場合には、受話側端末20bから音声プロファイルが送
られ送話側端末20aは受信の動作を行う。送られた音
声プロファイルは受話・送話双方で組み込みの操作が行
われる。音声プロファイルとは、話者本人の声色などを
特徴づける、文字から音声に変換する際の規則(例えば
男声、女声など)を音波のデジタルパターンで示したも
のであり、送信側端末20aにおいて事前に学習された
ものであることから、受話端末側20bの音声認識・合
成変換部2においてこのパターンを組み込み送られた文
字コードデータを音声合成すると相手の声色に近い再生
音が得られる。
御部3が相手側の音声合成再生時に、発呼者の発音に近
い音色で再生されるようにするためのデータ、音声プロ
ファイルを送出するか相手端末20bとのプロトコルに
より確認する。確認の結果、“送る”が選択された場合
には、発呼側端末20aの標準又は特に音色を変えたい
場合には特に指定した音声プロファイルを相手端末20
bに送出する。同様に受話側端末20bからも音声プロ
ファイルの送信の確認が行われ、“送る”が選択された
場合には、受話側端末20bから音声プロファイルが送
られ送話側端末20aは受信の動作を行う。送られた音
声プロファイルは受話・送話双方で組み込みの操作が行
われる。音声プロファイルとは、話者本人の声色などを
特徴づける、文字から音声に変換する際の規則(例えば
男声、女声など)を音波のデジタルパターンで示したも
のであり、送信側端末20aにおいて事前に学習された
ものであることから、受話端末側20bの音声認識・合
成変換部2においてこのパターンを組み込み送られた文
字コードデータを音声合成すると相手の声色に近い再生
音が得られる。
【0049】以上の手順は図4のステップS102〜S
105及びS202〜S205において実行される。
105及びS202〜S205において実行される。
【0050】次に、実際の会話に入った段階の送信側端
末20aの手順をステップS106〜S110に示す。
末20aの手順をステップS106〜S110に示す。
【0051】会話においては、以下の操作が繰り返され
相手に言葉が伝わる。話された音声に対し、音声認識・
合成変換部2の音声認識回路2aにおいて文節単位の音
声データの切り出し、音声認識及び認識の成否確認を行
う。成功の場合には認識後の文字コードデータが選択回
路2cを介して着呼側端末20bにパケットデータとし
て送られる。音声認識は100%の成功率ではないた
め、発声不明瞭などの理由により認識失敗のケースもあ
る割合で発生する。失敗の場合に備え、音声認識と同一
の位置で切り出された圧縮データも圧縮符号化回路2b
で並行して作成され、音声認識に失敗した場合は認識さ
れたデータではなく圧縮データで失敗した部分を埋め
る。
相手に言葉が伝わる。話された音声に対し、音声認識・
合成変換部2の音声認識回路2aにおいて文節単位の音
声データの切り出し、音声認識及び認識の成否確認を行
う。成功の場合には認識後の文字コードデータが選択回
路2cを介して着呼側端末20bにパケットデータとし
て送られる。音声認識は100%の成功率ではないた
め、発声不明瞭などの理由により認識失敗のケースもあ
る割合で発生する。失敗の場合に備え、音声認識と同一
の位置で切り出された圧縮データも圧縮符号化回路2b
で並行して作成され、音声認識に失敗した場合は認識さ
れたデータではなく圧縮データで失敗した部分を埋め
る。
【0052】音声の「切り出し」は、通常の音節単位で
行う。即ち“こんにちは”、“私です”等の単位で順次
認識する。
行う。即ち“こんにちは”、“私です”等の単位で順次
認識する。
【0053】次いで音声認識回路2aは、発生音声を登
録辞書と比較し、類似度の大きいパターンを採用する。
比較して類似語のないデータは新語か認識できない語の
ため、圧縮符号化回路2bで作成された音声圧縮データ
を選択回路2cが前記の通り埋め込む。
録辞書と比較し、類似度の大きいパターンを採用する。
比較して類似語のないデータは新語か認識できない語の
ため、圧縮符号化回路2bで作成された音声圧縮データ
を選択回路2cが前記の通り埋め込む。
【0054】次に、実際の会話に入った段階の着呼側端
末20bの手順をステップS210〜S214に示す。
末20bの手順をステップS210〜S214に示す。
【0055】着呼側端末20bにおいては、発呼側端末
20aから送られてくるパケットデータをチェックし、
テキスト形式、すなわち文字コードデータの場合は、音
声認識・合成変換部2において既に組み込み済みの音声
プロファイルに基づく音声パターンを用い音声データに
変換しスピーカ1bを有する音声入出力部1に送出す
る。圧縮データの場合は音声認識・合成変換部2の伸張
機構を使い入力音声相当の音声データに変換し音声入出
力部1に送出する。
20aから送られてくるパケットデータをチェックし、
テキスト形式、すなわち文字コードデータの場合は、音
声認識・合成変換部2において既に組み込み済みの音声
プロファイルに基づく音声パターンを用い音声データに
変換しスピーカ1bを有する音声入出力部1に送出す
る。圧縮データの場合は音声認識・合成変換部2の伸張
機構を使い入力音声相当の音声データに変換し音声入出
力部1に送出する。
【0056】次に、図5を用い、話した言葉がどのよう
に受信側機器で再生されるかを説明する。図5はデータ
処理の時間的関係を示すタイムチャートである。
に受信側機器で再生されるかを説明する。図5はデータ
処理の時間的関係を示すタイムチャートである。
【0057】例えば、“もしもし田中です。田代さんを
お願いします”という言葉の場合には、4つの音節“も
しもし”“たなかです”“たしろさんを”“おねがいし
ます”となり、これらを順次認識しテキストとして送
出、インターネット・LAN等の伝送路を経由し受信側
に送信される。受信側では、受信信号を順次合成して音
声データとし、音声出力機器を経由し話者に音声を伝え
る。
お願いします”という言葉の場合には、4つの音節“も
しもし”“たなかです”“たしろさんを”“おねがいし
ます”となり、これらを順次認識しテキストとして送
出、インターネット・LAN等の伝送路を経由し受信側
に送信される。受信側では、受信信号を順次合成して音
声データとし、音声出力機器を経由し話者に音声を伝え
る。
【0058】(a)に示す正常時は、上記手続きにて音
声の再生が行われるが、(b)に示すように認識しにく
い言葉があり認識に失敗した場合は、予め並行して作成
されている圧縮データをテキストデータの代わりに受信
端末に送出、受信端末において伸張の処理を行い合成に
よって得られた他の言葉と順序関係を合わせ再生され
る。
声の再生が行われるが、(b)に示すように認識しにく
い言葉があり認識に失敗した場合は、予め並行して作成
されている圧縮データをテキストデータの代わりに受信
端末に送出、受信端末において伸張の処理を行い合成に
よって得られた他の言葉と順序関係を合わせ再生され
る。
【0059】本実施形態は以上のように構成されている
ので、以下に掲げる効果を奏する。
ので、以下に掲げる効果を奏する。
【0060】すなわち、本実施形態では、話言葉の文節
毎に意味を解釈し、文字データというデータ量の非常に
少ない形式に変換してしまう為、通信の遅延を非常に短
くすることが出来、且つ文字は単なる音の連続でなく明
瞭に意味のある言葉として再生される。この為、通信の
不安定性や負荷変動に起因する音声劣化、言葉の不自然
な分断、音飛び等を極力排して理解容易な会話を可能に
すると共に、自然な会話をすることができるまた、圧縮
機能を追加した音声認識との複合機能は、従来考えられ
ている音声認識の入力音声の不明瞭さや処理能力に起因
する認識性能・信頼度の問題を解決し、市販装置への適
用を実現し易くする事が可能である。
毎に意味を解釈し、文字データというデータ量の非常に
少ない形式に変換してしまう為、通信の遅延を非常に短
くすることが出来、且つ文字は単なる音の連続でなく明
瞭に意味のある言葉として再生される。この為、通信の
不安定性や負荷変動に起因する音声劣化、言葉の不自然
な分断、音飛び等を極力排して理解容易な会話を可能に
すると共に、自然な会話をすることができるまた、圧縮
機能を追加した音声認識との複合機能は、従来考えられ
ている音声認識の入力音声の不明瞭さや処理能力に起因
する認識性能・信頼度の問題を解決し、市販装置への適
用を実現し易くする事が可能である。
【0061】さらに、文字で蓄積転送できることによ
り、インターネット等の各種ネットワークの特性に応じ
た呼蓄積やメールとしての転送、同報、画像との組み合
わせへの応用が可能である。
り、インターネット等の各種ネットワークの特性に応じ
た呼蓄積やメールとしての転送、同報、画像との組み合
わせへの応用が可能である。
【0062】当然ながら、トータルで伝送するデータ量
が少ないと言うことは、インターネットサービスプロバ
イダの能力への影響も少なく、広い範囲での利用が可能
な他、インターネットトラフィックを下げ網全体の活用
の幅を広げる社会的効果もある。
が少ないと言うことは、インターネットサービスプロバ
イダの能力への影響も少なく、広い範囲での利用が可能
な他、インターネットトラフィックを下げ網全体の活用
の幅を広げる社会的効果もある。
【0063】−第3実施形態− 本発明の通信方法が適用される音声送信装置・受信装置
の第3実施形態を、図2及び図4を用いて説明する。
の第3実施形態を、図2及び図4を用いて説明する。
【0064】図2に示す構成の装置において、図4のス
テップS101、S201におけるインターネット呼接
続の段階で、音声認識・合成変換部2により最初に発声
する代表的な言葉“もしもし”等の発声音声波形を分析
し、予め登録した本人の音声パターンと比較する事によ
り本人であることを確認し、本人であることが確認され
た時にのみ以降の通話を可能としたり、あるいは認証結
果に基づいて登録音声パターンを自動選択して相手に送
出する。この他に、音声認識・合成変換部2による確証
結果を元に通話以外の各種サービスへのアクセスを可能
とするなどの多彩なサービスが可能である。
テップS101、S201におけるインターネット呼接
続の段階で、音声認識・合成変換部2により最初に発声
する代表的な言葉“もしもし”等の発声音声波形を分析
し、予め登録した本人の音声パターンと比較する事によ
り本人であることを確認し、本人であることが確認され
た時にのみ以降の通話を可能としたり、あるいは認証結
果に基づいて登録音声パターンを自動選択して相手に送
出する。この他に、音声認識・合成変換部2による確証
結果を元に通話以外の各種サービスへのアクセスを可能
とするなどの多彩なサービスが可能である。
【0065】−第4実施形態− 本発明の通信方法が適用される音声送信装置・受信装置
の第4実施形態を、図2及び図6を用いて説明する。
の第4実施形態を、図2及び図6を用いて説明する。
【0066】第1実施形態では、音声合成に際し、図6
(a)に示すように本人の特徴を反映した辞書(音声プ
ロファイル)を予め送出しておくことにより、基準辞書
を本人の音声に合わせてチューニングし本人の声に近い
形で再生している。この実施形態では、図6(b)に示
すように基準辞書は組み込まれている標準のものを使
い、文字コード作成の際の標準パターンとの差分データ
を添付して送出することにより、個々の音節のデータを
本人の声色に近づけるアルゴリズムを追加することによ
り、最初の音声パターンの送出を省略することが可能で
ある。
(a)に示すように本人の特徴を反映した辞書(音声プ
ロファイル)を予め送出しておくことにより、基準辞書
を本人の音声に合わせてチューニングし本人の声に近い
形で再生している。この実施形態では、図6(b)に示
すように基準辞書は組み込まれている標準のものを使
い、文字コード作成の際の標準パターンとの差分データ
を添付して送出することにより、個々の音節のデータを
本人の声色に近づけるアルゴリズムを追加することによ
り、最初の音声パターンの送出を省略することが可能で
ある。
【0067】−第5実施形態− 本発明の通信方法が適用される音声送信装置・受信装置
の第4実施形態を、図2を用いて説明する。この実施形
態では、上述の音声プロファイルとは別に背景音源コー
ドを文字データに添付して送ることにより、背景音を会
話に合成に際して再生することが可能である。すなわ
ち、上述の第1実施形態では音声認識後のデータを主と
して送信するため、受信側端末20bにおいて音声再生
した際に電話口に入る外界の音などの背景音はほとんど
再生されない。このような事態が不自然であると考える
場合は、あるいは話者の好みに応じて、背景音に関する
音源コードを送信し、背景音と話者の音声とを重畳して
再生する。あるいは、音楽、電車音等を背景音源コード
として送出してもよい。以上のことは、図2の音声認識
・合成変換部2に上記機能を追加することにより実現可
能である。
の第4実施形態を、図2を用いて説明する。この実施形
態では、上述の音声プロファイルとは別に背景音源コー
ドを文字データに添付して送ることにより、背景音を会
話に合成に際して再生することが可能である。すなわ
ち、上述の第1実施形態では音声認識後のデータを主と
して送信するため、受信側端末20bにおいて音声再生
した際に電話口に入る外界の音などの背景音はほとんど
再生されない。このような事態が不自然であると考える
場合は、あるいは話者の好みに応じて、背景音に関する
音源コードを送信し、背景音と話者の音声とを重畳して
再生する。あるいは、音楽、電車音等を背景音源コード
として送出してもよい。以上のことは、図2の音声認識
・合成変換部2に上記機能を追加することにより実現可
能である。
【0068】−第6実施形態− 音声による再生を避けたい会議室などにおいては、音声
認識・合成変換部2から直接文字データを出力してデー
タ蓄積・表示部7でこの文字データを文字出力・表示す
ることが可能である。また、通信制御部3の機能の一部
として、データ蓄積・表示部7を用い応答・蓄積機能を
備え、留守のため受信側の話者が応答できない場合、通
信制御部3が自動応答し、相手側の音声と本人の音声プ
ロファイルデータとを用いてボイスメールデータを作成
し、これをデータ蓄積・表示部7に蓄積する事が可能で
ある。あるいは、文字データを電子メール形式で蓄積す
る事も可能である。さらには、このデータ蓄積及び応答
機能を利用し、同様に受信側話者が留守のため応答でき
ない場合、通信制御部3を用いて文字データを電子メー
ルとして、あるいは必要時は音声プロファイルデータを
加えたボイスメールとして端末使用者の外出先等に転送
する事も可能である。
認識・合成変換部2から直接文字データを出力してデー
タ蓄積・表示部7でこの文字データを文字出力・表示す
ることが可能である。また、通信制御部3の機能の一部
として、データ蓄積・表示部7を用い応答・蓄積機能を
備え、留守のため受信側の話者が応答できない場合、通
信制御部3が自動応答し、相手側の音声と本人の音声プ
ロファイルデータとを用いてボイスメールデータを作成
し、これをデータ蓄積・表示部7に蓄積する事が可能で
ある。あるいは、文字データを電子メール形式で蓄積す
る事も可能である。さらには、このデータ蓄積及び応答
機能を利用し、同様に受信側話者が留守のため応答でき
ない場合、通信制御部3を用いて文字データを電子メー
ルとして、あるいは必要時は音声プロファイルデータを
加えたボイスメールとして端末使用者の外出先等に転送
する事も可能である。
【0069】−第7実施形態− カメラ及び画像処理及び表示ソフトウエアをデータ蓄積
・表示部7の機能として追加し、話者の顔等の映像デー
タを転送し音声と共に映像を相手側ディスプレイに表示
する事も可能である。
・表示部7の機能として追加し、話者の顔等の映像デー
タを転送し音声と共に映像を相手側ディスプレイに表示
する事も可能である。
【0070】
【発明の効果】本発明は上述のように構成されたので、
非ギャランティー型ネットワークを介した通話方法にお
いて、通信の不安定性や負荷変動に起因する音声劣化、
言葉の不自然な分断、音飛び等を極力排して理解容易な
会話を可能にすると共に、自然な会話を可能にすること
ができる。
非ギャランティー型ネットワークを介した通話方法にお
いて、通信の不安定性や負荷変動に起因する音声劣化、
言葉の不自然な分断、音飛び等を極力排して理解容易な
会話を可能にすると共に、自然な会話を可能にすること
ができる。
【図1】本発明の第1実施形態である音声送信装置・受
信装置を示すブロック図である。
信装置を示すブロック図である。
【図2】本発明の第2実施形態である音声送信装置・受
信装置を示すブロック図である。
信装置を示すブロック図である。
【図3】図2に示す音声認識・合成変換部のブロック図
である。
である。
【図4】第2実施形態の動作を説明するためのフローチ
ャートである。
ャートである。
【図5】第2実施形態の動作を示すデータタイムチャー
ト図である。
ト図である。
【図6】第2実施形態及び第4実施形態におけるデータ
送信手順を示す図である。
送信手順を示す図である。
1 音声入出力部 1a マイクロフォン 1b スピーカ 2 音声認識・合成変換部 2a 音声認識回路 2b 圧縮符号化回路 2c 選択回路 3 通信制御部 4 網制御部・アクセス部,網制御装置 5 モデム 5a パケット送信および通信制御部 5b パケット受信および通信制御部 6 入力操作部 7 データ蓄積・表示部 51 公衆電話回線 52 インターネットサービスプロバイダ 101 インターネット網 102 インターネットホンサービスプロバイダ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04Q 11/04 H04Q 11/04 R
Claims (14)
- 【請求項1】 非ギャランティー型ネットワークを介し
て話者の音声を通話する方法において、 送話側端末において話者の音声を音声データに変換した
後、この音声データを音声認識して文字データに変換
し、 受話側端末の識別データに基づいて前記送話側端末を前
記非ギャランティー型ネットワークを介して前記受話側
端末に接続し、 前記送話側端末と前記受話側端末との接続後、前記文字
データをパケット化して前記受話側端末に向けて送信
し、 前記受話側端末において受信したパケット化文字データ
を音声合成により音声データに変換した後、音声として
出力することを特徴とする通話方法。 - 【請求項2】 請求項1に記載の通話方法において、 前記音声データを所定語数毎に分割して音声認識し、前
記文字データに変換することを特徴とする通話方法。 - 【請求項3】 請求項2に記載の通話方法において、前
記音声データを文節毎に分割して音声認識し、前記文字
データに変換することを特徴とする通話方法。 - 【請求項4】 請求項2又は3に記載の通話方法におい
て、前記音声認識に並行して、前記音声データを前記所
定語単位で分割してデータ圧縮した圧縮音声データを作
成し、前記音声認識が不十分又は不成立の場合は前記圧
縮音声データをパケット化して送出することを特徴とす
る通話方法。 - 【請求項5】 請求項1〜4のいずれかに記載の通話方
法において、前記送話側端末に入力される音声の特徴を
示す音声プロファイルをこの送話側端末から前記受話側
端末に予め送信しておき、前記受話側端末において、音
声合成時に前記音声プロファイルに基づいて前記文字デ
ータを前記音声データに変換することを特徴とする通話
方法。 - 【請求項6】 請求項1〜4のいずれかに記載の通話方
法において、前記送話側端末及び前記受話側端末の双方
において、標準音声に対する音声合成標準パターンを用
意しておき、前記送話側端末において、この送話側端末
に入力された音声と前記標準音声との差分データを作成
して前記パケット化文字データとともに送出し、前記受
話側端末において、前記音声合成標準パターン及び前記
差分データに基づいて音声合成することを特徴とする通
話方法。 - 【請求項7】 請求項1〜6のいずれかに記載の通話方
法において、前記送話側端末において背景音に対応する
背景音源データを前記パケット化文字データとともに送
出し、前記受話側端末において、前記音声データと前記
背景音とを重畳して出力することを特徴とする通話方
法。 - 【請求項8】 請求項1〜7のいずれかに記載の通話方
法において、 前記送話側端末に、サンプル音声データを予め用意して
おき、 前記送話側端末に前記話者から最初の音声入力があった
際に前記音声データと前記サンプル音声データとを比較
して、前記音声データと前記サンプル音声データとが同
一話者によるものであるか否かを確認し、 同一話者によるものであることが確認されたときにのみ
通話を許可することを特徴とする通話方法。 - 【請求項9】 請求項1〜8のいずれかに記載の通話方
法において、 送話側端末において、前記話者を撮像した画像データを
作成してこれを受話側端末に送出し、 受話側端末において、受信した前記画像データに基づい
て画像を表示することを特徴とする通話方法。 - 【請求項10】 請求項1〜9のいずれかに記載の通話
方法において、 受話側端末において、受信したパケット化文字データを
文字形式で表示することを特徴とする通話方法。 - 【請求項11】 請求項1〜10のいずれかに記載の通
話方法において、 受話側端末において、受信したパケット化文字データを
電子メール形式に変換することを特徴とする通話方法。 - 【請求項12】 話者の音声を音声データに変換する音
声入力手段と、 前記音声データを音声認識して文字データに変換する音
声認識手段と、 非ギャランティーネットワーク上の特定の通話相手を識
別するための識別データを入力する識別データ入力手段
と、 前記識別データに基づいて前記非ギャランティー型ネッ
トワークを介して前記特定の通話相手に接続するネット
ワーク接続手段と、 前記文字データをパケット化して非ギャランティー型ネ
ットワークに送出する送信手段とを備えたことを特徴と
する音声送信装置。 - 【請求項13】 請求項12記載の音声送信装置におい
て、前記音声認識手段は、音声を認識して前記文字デー
タに変換する際、前記文字データの変換に成功した場合
には変換に成功した前記文字データをパケット化し、認
識に失敗した場合には認識に失敗した前記音声データを
圧縮符号化してパケット化することを特徴とする音声送
信装置。 - 【請求項14】 自身を特定する識別信号に基づいて非
ギャランティー型ネットワークと接続するネットワーク
接続手段と、 前記非ギャランティー型ネットワークからパケット化さ
れた文字データを受信する受信手段と、 受信された前記パケット化文字データを音声合成により
音声データに変換する音声合成変換手段と、 前記変換された音声データに基づいて音声を出力する音
声出力手段とを備えたことを特徴とする音声受信装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09344897A JP3237566B2 (ja) | 1997-04-11 | 1997-04-11 | 通話方法、音声送信装置及び音声受信装置 |
US09/058,782 US6226361B1 (en) | 1997-04-11 | 1998-04-13 | Communication method, voice transmission apparatus and voice reception apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09344897A JP3237566B2 (ja) | 1997-04-11 | 1997-04-11 | 通話方法、音声送信装置及び音声受信装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10285275A true JPH10285275A (ja) | 1998-10-23 |
JP3237566B2 JP3237566B2 (ja) | 2001-12-10 |
Family
ID=14082618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09344897A Expired - Fee Related JP3237566B2 (ja) | 1997-04-11 | 1997-04-11 | 通話方法、音声送信装置及び音声受信装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6226361B1 (ja) |
JP (1) | JP3237566B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001145103A (ja) * | 1999-11-18 | 2001-05-25 | Oki Electric Ind Co Ltd | 送信装置及び通信システム |
WO2001080020A1 (fr) * | 2000-04-17 | 2001-10-25 | Kenichi Ohmae | Dispositif d'emission et de reception de messages vocaux, production de ce dispositif, systeme de relais, procede d'emission, de reception et de relais et support d'enregistrement |
JP2002033851A (ja) * | 2000-07-13 | 2002-01-31 | Kyocera Corp | 携帯電話機 |
JP2005148152A (ja) * | 2003-11-11 | 2005-06-09 | Mitsubishi Electric Corp | メディア送信装置、メディア受信装置、メディア通信装置及びメディア再生装置 |
JP2006030609A (ja) * | 2004-07-16 | 2006-02-02 | Yamaha Corp | 音声合成データ生成装置、音声合成装置、音声合成データ生成プログラム及び音声合成プログラム |
JP2008042290A (ja) * | 2006-08-02 | 2008-02-21 | Fujitsu Ltd | 交換機、交換機制御プログラム、交換機制御方法 |
US7839893B2 (en) | 2002-12-02 | 2010-11-23 | Nec Infrontia Corporation | Voice data transmitting and receiving system |
JP2021022836A (ja) * | 2019-07-26 | 2021-02-18 | 株式会社リコー | 通信システム、通信端末、通信方法およびプログラム |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10304068A (ja) * | 1997-04-30 | 1998-11-13 | Nec Corp | 音声情報交換方式 |
US6795406B2 (en) | 1999-07-12 | 2004-09-21 | Genesys Telecommunications Laboratories, Inc. | Methods and apparatus for enhancing wireless data network telephony, including quality of service monitoring and control |
US6078566A (en) | 1998-04-28 | 2000-06-20 | Genesys Telecommunications Laboratories, Inc. | Noise reduction techniques and apparatus for enhancing wireless data network telephony |
US6144938A (en) * | 1998-05-01 | 2000-11-07 | Sun Microsystems, Inc. | Voice user interface with personality |
US6345047B1 (en) * | 1998-06-12 | 2002-02-05 | Northern Telecom Limited | Computer telephony adapter and method |
US6501751B1 (en) * | 1998-09-30 | 2002-12-31 | Symantec Corporation | Voice communication with simulated speech data |
GB2348566A (en) * | 1999-03-31 | 2000-10-04 | Ibm | Computer network telephony |
US6754619B1 (en) * | 1999-11-15 | 2004-06-22 | Sony Corporation | Digital recording and playback system with voice recognition capability for concurrent text generation |
JP3444486B2 (ja) * | 2000-01-26 | 2003-09-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識手段を使用する自動音声応答システムおよび方法 |
WO2001077866A1 (en) * | 2000-04-06 | 2001-10-18 | Voicenic Inc. | System, device and method for intermediating connection to the internet using voice domains, and generating a database used therefor |
US7072328B2 (en) * | 2001-01-12 | 2006-07-04 | Voicegenie Technologies Inc. | Computer-implemented voice markup language-based server |
US20020095330A1 (en) * | 2001-01-12 | 2002-07-18 | Stuart Berkowitz | Audio Advertising computer system and method |
US7379973B2 (en) | 2001-01-12 | 2008-05-27 | Voicegenie Technologies, Inc. | Computer-implemented voice application indexing web site |
US20020095473A1 (en) * | 2001-01-12 | 2002-07-18 | Stuart Berkowitz | Home-based client-side media computer |
US7155173B2 (en) * | 2001-03-14 | 2006-12-26 | Nokia Corporation | Method and system for providing a context for message compression |
US7539483B2 (en) * | 2001-05-02 | 2009-05-26 | Qualcomm Incorporated | System and method for entering alphanumeric characters in a wireless communication device |
US7031444B2 (en) * | 2001-06-29 | 2006-04-18 | Voicegenie Technologies, Inc. | Computer-implemented voice markup system and method |
US6876728B2 (en) | 2001-07-02 | 2005-04-05 | Nortel Networks Limited | Instant messaging using a wireless interface |
US8644475B1 (en) | 2001-10-16 | 2014-02-04 | Rockstar Consortium Us Lp | Telephony usage derived presence information |
US20030135624A1 (en) * | 2001-12-27 | 2003-07-17 | Mckinnon Steve J. | Dynamic presence management |
US8392609B2 (en) | 2002-09-17 | 2013-03-05 | Apple Inc. | Proximity detection for media proxies |
US7417981B2 (en) * | 2003-10-15 | 2008-08-26 | Vonage Holdings Corp. | Method and apparatus for enhanced Internet Telephony |
US9118574B1 (en) | 2003-11-26 | 2015-08-25 | RPX Clearinghouse, LLC | Presence reporting using wireless messaging |
US7386111B2 (en) * | 2004-02-10 | 2008-06-10 | Vonage Network Inc. | Method and apparatus for placing a long distance call based on a virtual phone number |
WO2006072950A2 (en) * | 2005-01-05 | 2006-07-13 | New Standard Telephony Ltd. | Telephony line unification |
US8683044B2 (en) | 2005-03-16 | 2014-03-25 | Vonage Network Llc | Third party call control application program interface |
US20060210040A1 (en) * | 2005-03-16 | 2006-09-21 | Jeffrey Citron | Transfer identification software enabling electronic communication system |
US20060210036A1 (en) | 2005-03-16 | 2006-09-21 | Jeffrey Citron | System for effecting a telephone call over a computer network without alphanumeric keypad operation |
US8511558B2 (en) * | 2005-04-12 | 2013-08-20 | Sandisk Il Ltd. | Smartcard power management |
CN101288281B (zh) * | 2005-10-13 | 2012-10-03 | 沃纳格控股公司 | 用于检测设备附加的变化的方法和系统 |
WO2007056577A2 (en) * | 2005-11-09 | 2007-05-18 | Vonage Holdings Corp. | Method and system for customized caller identification |
AU2007211267A1 (en) * | 2006-02-01 | 2007-08-09 | Vonage Holdings Corp. | Method and apparatus for communicating a status of a device in a packet-based communication network |
US8917717B2 (en) * | 2007-02-13 | 2014-12-23 | Vonage Network Llc | Method and system for multi-modal communications |
US7693176B2 (en) * | 2006-02-27 | 2010-04-06 | Vonage Network Llc | Method and system for bidirectional data transfer |
US8635069B2 (en) * | 2007-08-16 | 2014-01-21 | Crimson Corporation | Scripting support for data identifiers, voice recognition and speech in a telnet session |
US8260619B1 (en) | 2008-08-22 | 2012-09-04 | Convergys Cmg Utah, Inc. | Method and system for creating natural language understanding grammars |
US20110007732A1 (en) * | 2009-07-08 | 2011-01-13 | John Ward | Unified Communication System |
US20120016674A1 (en) * | 2010-07-16 | 2012-01-19 | International Business Machines Corporation | Modification of Speech Quality in Conversations Over Voice Channels |
US9129606B2 (en) * | 2011-09-23 | 2015-09-08 | Microsoft Technology Licensing, Llc | User query history expansion for improving language model adaptation |
JP6064629B2 (ja) * | 2013-01-30 | 2017-01-25 | 富士通株式会社 | 音声入出力データベース検索方法、プログラム、及び装置 |
CN103971687B (zh) * | 2013-02-01 | 2016-06-29 | 腾讯科技(深圳)有限公司 | 一种语音识别系统中的负载均衡实现方法和装置 |
US10033797B1 (en) | 2014-08-20 | 2018-07-24 | Ivanti, Inc. | Terminal emulation over HTML |
US11100278B2 (en) | 2016-07-28 | 2021-08-24 | Ivanti, Inc. | Systems and methods for presentation of a terminal application screen |
CN108305628B (zh) * | 2017-06-27 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置、计算机设备和存储介质 |
CN113178187A (zh) * | 2021-04-26 | 2021-07-27 | 北京有竹居网络技术有限公司 | 一种语音处理方法、装置、设备及介质、程序产品 |
GB202407231D0 (en) | 2024-05-21 | 2024-07-03 | Vodafone Group Services Ltd | A method for real-time voice communication |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60136450A (ja) | 1983-12-24 | 1985-07-19 | Fujitsu Ltd | パケツト交換用端末装置 |
JPS6171730A (ja) | 1984-09-14 | 1986-04-12 | Nec Corp | 音声デ−タ転送方式 |
JPS61256848A (ja) | 1985-05-09 | 1986-11-14 | Fujitsu Ltd | 文字コ−ド伝送方式 |
JP2568183B2 (ja) | 1986-10-23 | 1996-12-25 | キヤノン株式会社 | データ通信方法 |
JPS63138850A (ja) | 1986-11-29 | 1988-06-10 | Nec Corp | 電話機における通話方式 |
JPH0219057A (ja) | 1988-07-06 | 1990-01-23 | Nec Off Syst Ltd | 電話機 |
JPH0220148A (ja) | 1988-07-08 | 1990-01-23 | Nec Corp | 音声データパケット伝送装置 |
JPH02100441A (ja) | 1988-10-07 | 1990-04-12 | Hitachi Ltd | 電子伝言板方式 |
JPH0410734A (ja) | 1990-04-27 | 1992-01-14 | Canon Inc | 情報処理装置 |
US5163081A (en) * | 1990-11-05 | 1992-11-10 | At&T Bell Laboratories | Automated dual-party-relay telephone system |
US5500919A (en) * | 1992-11-18 | 1996-03-19 | Canon Information Systems, Inc. | Graphics user interface for controlling text-to-speech conversion |
JPH06276220A (ja) | 1993-03-19 | 1994-09-30 | Csk Corp | 無線電子メールによる音声伝言システム |
US5905476A (en) * | 1994-07-05 | 1999-05-18 | Nxi Communications, Inc. | ITU/TDD modem |
US5742905A (en) * | 1994-09-19 | 1998-04-21 | Bell Communications Research, Inc. | Personal communications internetworking |
US5790180A (en) * | 1995-12-28 | 1998-08-04 | At&T Corp. | Video telephone call handling system and method |
US5884262A (en) * | 1996-03-28 | 1999-03-16 | Bell Atlantic Network Services, Inc. | Computer network audio access and conversion system |
US5864814A (en) * | 1996-12-04 | 1999-01-26 | Justsystem Corp. | Voice-generating method and apparatus using discrete voice data for velocity and/or pitch |
-
1997
- 1997-04-11 JP JP09344897A patent/JP3237566B2/ja not_active Expired - Fee Related
-
1998
- 1998-04-13 US US09/058,782 patent/US6226361B1/en not_active Expired - Fee Related
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001145103A (ja) * | 1999-11-18 | 2001-05-25 | Oki Electric Ind Co Ltd | 送信装置及び通信システム |
WO2001080020A1 (fr) * | 2000-04-17 | 2001-10-25 | Kenichi Ohmae | Dispositif d'emission et de reception de messages vocaux, production de ce dispositif, systeme de relais, procede d'emission, de reception et de relais et support d'enregistrement |
JP2002033851A (ja) * | 2000-07-13 | 2002-01-31 | Kyocera Corp | 携帯電話機 |
US7839893B2 (en) | 2002-12-02 | 2010-11-23 | Nec Infrontia Corporation | Voice data transmitting and receiving system |
JP2005148152A (ja) * | 2003-11-11 | 2005-06-09 | Mitsubishi Electric Corp | メディア送信装置、メディア受信装置、メディア通信装置及びメディア再生装置 |
JP2006030609A (ja) * | 2004-07-16 | 2006-02-02 | Yamaha Corp | 音声合成データ生成装置、音声合成装置、音声合成データ生成プログラム及び音声合成プログラム |
JP2008042290A (ja) * | 2006-08-02 | 2008-02-21 | Fujitsu Ltd | 交換機、交換機制御プログラム、交換機制御方法 |
JP2021022836A (ja) * | 2019-07-26 | 2021-02-18 | 株式会社リコー | 通信システム、通信端末、通信方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3237566B2 (ja) | 2001-12-10 |
US6226361B1 (en) | 2001-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3237566B2 (ja) | 通話方法、音声送信装置及び音声受信装置 | |
US7027986B2 (en) | Method and device for providing speech-to-text encoding and telephony service | |
US9361888B2 (en) | Method and device for providing speech-to-text encoding and telephony service | |
US7822050B2 (en) | Buffering, pausing and condensing a live phone call | |
US20020097692A1 (en) | User interface for a mobile station | |
US6195358B1 (en) | Internet telephony signal conversion | |
US20060133583A1 (en) | Method and system for unifying phonebook for varied hearing disabilities | |
US20150100315A1 (en) | Methods and apparatus for conducting internet protocol telephony communications | |
US7177801B2 (en) | Speech transfer over packet networks using very low digital data bandwidths | |
US20050049879A1 (en) | Communication device capable of interworking between voice communications and text communications | |
US20030123621A1 (en) | Simple structured portable phone with video answerphone message function and portable phone system including the same | |
US20070177633A1 (en) | Voice speed adjusting system of voice over Internet protocol (VoIP) phone and method therefor | |
US6501751B1 (en) | Voice communication with simulated speech data | |
KR100544036B1 (ko) | 인터넷 영상전화기의 단문 서비스시스템 및 방법 | |
US6700901B1 (en) | System and method for digital telephones on H.323 networks | |
US6498834B1 (en) | Speech information communication system | |
JP2002101203A (ja) | 音声処理システム、音声処理方法およびその方法を記憶した記憶媒体 | |
US7313233B2 (en) | Tone clamping and replacement | |
JP5210788B2 (ja) | 音声信号通信システム、音声合成装置、音声合成処理方法、音声合成処理プログラム、並びに該プログラムを格納した記録媒体 | |
JP7454167B1 (ja) | 情報処理システム | |
US20240062750A1 (en) | Speech transmission from a telecommunication endpoint using phonetic characters | |
TWI278219B (en) | System for adjusting speech rate of voice over Internet protocol phone and method thereof | |
JP2000020683A (ja) | 通信会議システム | |
JP2001345804A (ja) | 電話システム、ターミナルアダプタ装置、及び電話機 | |
JPS5830799A (ja) | 音声メ−ルシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010904 |
|
LAPS | Cancellation because of no payment of annual fees |