JP3947871B2 - 音声データ送受信方式 - Google Patents
音声データ送受信方式 Download PDFInfo
- Publication number
- JP3947871B2 JP3947871B2 JP2002349621A JP2002349621A JP3947871B2 JP 3947871 B2 JP3947871 B2 JP 3947871B2 JP 2002349621 A JP2002349621 A JP 2002349621A JP 2002349621 A JP2002349621 A JP 2002349621A JP 3947871 B2 JP3947871 B2 JP 3947871B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- communication
- voice
- audio
- data transmission
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005540 biological transmission Effects 0.000 title claims description 67
- 238000004891 communication Methods 0.000 claims description 125
- 238000000034 method Methods 0.000 claims description 36
- 229920004880 RTP PEK Polymers 0.000 claims description 25
- 238000012544 monitoring process Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 230000006866 deterioration Effects 0.000 description 3
- 238000012806 monitoring device Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/64—Hybrid switching systems
- H04L12/6418—Hybrid transport
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
Description
【発明の属する技術分野】
本発明は、音声データ送受信方式に関し、例えば、インターネット等の非QoS保証ネットワーク等の通信経路を経由した音声通信における意味情報を確保した音声データ送受信方式に関する。
【0002】
【従来の技術】
国境を越え、全世界で共通利用されているインターネットは、ホームページ閲覧、電子メール、ファイル転送のような従来からのアプリケーション以外に電子商取引やインターネット電話(IP電話:インターネットプロトコル電話)が注目を浴びている。これは、電話網における回線交換を中心とするネットワークだけでなく、パケット交換によるIPネットワークの急激な進展が大きな原因となっている。
【0003】
IP電話通信は、音声(又はFAX)データを含む各種データ(静止画、動画、データ等)をIPパケットに変換し、IPベースのネットワーク内を転送する通信であり、ネットワークの一部または全部においてIPネットワーク技術を利用した音声電話サービスがIP電話、IP電話のうちwww等のアプリケーションに利用されているものと同じIPネットワーク(インターネットプロトコルにより通信を行う通信網)を利用するものがインターネット電話とされている。
【0004】
IP電話には、次のような3つの方式がある。第1の方式は、インターネット上にダイヤルアップ接続したパソコン間で音声メッセージをやり取りする両パソコンにはそのための同じソフトウエアをインストールし、同時にパソコンがサーバに接続されている必要がある。また、第2の方式は、パソコンから一般加入電話機に電話をかける(逆は不可)予め双方で約束しておかないと通話ができない。更に、第3の方式は、一般加入電話機間の通話を行なうインターネット網と公衆回線交換機との接続点にインターネット電話用ゲートウエイ経由でユーザIDとPINを入力して通信する方式と、インターネット直結型端末による通信があり、現在の電話通信方式に最も近く、その技術的進展は著しいものがある。
【0005】
一方、狭帯域で多くの音声情報を送信する方式として、入力音声を音声認識により文字データに変換し、得られた文字データをパケット化して送信し、受信側では、受信した文字データを音声データに変換し、更に音声合成した後に音声出力することにより、送信データ量を格段に少なくして通信遅延を避けた方式が提案されている(例えば、特許文献1参照)。しかし、この方式は、送信データ量の低減効果はあるものの、あくまでも文字データ伝送であるため、合成音声は一律的な音声で、会話者の音声とは異なる。
【0006】
【特許文献1】
特開平10−285275号公報(第4〜5頁、図1)
【0007】
【発明が解決しようとする課題】
ところで、通信品質QoS(Quality of Service)が保証されないインターネットやローカルネットワーク等のIPネットワークを介したIPによる音声通信においては、UDPプロトコルのRTPを用いた音声データの送受信が一般的である。このとき、音声通話や動画再生はデータのリアルタイム性を重要視してRTPを用いているが、RTPは通信経路で発生するパケットロスに対する対処が無く、途中で失われたパケットは再送されず、音声の途切れ等、音声品質に問題がある。
【0008】
この問題に対処するため、従来は、パケットがロスしても音声が途切れないように前後のパケットデータも付加して送信し、これらデータに基づく補間処理を行う方式が提案されている。しかしながら、音声以外のデータ通信が頻繁に流れている環境においては、音声パケットのロスが著しく、補間を用いても音声品質の劣化が大きすぎ、したがって、会話の意味を認識できない場合も生ずる。
【0009】
以上のように、パケット送信によるリアルタイム音声通信は、通信経路の環境の悪化によってRTPの欠除が起こり音声の虫食いが発生するため、これまでは通信環境が良い時にしか満足な通信を行えなかった。
【0010】
そこで、本発明の目的は、通信経路環境が劣化しても会話の意味を認識可能な音声データ送受信方式を提供することにある。
【0011】
本発明の目的は、通信経路に起因するパケットの欠落があっても会話の意味を認識可能な音声データ送受信方式を提供することにある。
【0012】
【課題を解決するための手段】
前述の課題を解決するため、本発明による音声データ送受信方式は、次のような特徴的な構成を採用している。
【0013】
(1)送信側では、
入力音声データに基づいてリアルタイム通信パケットのRTP音声データを生成する第1の生成手段と、
前記第1の生成手段で生成された前記入力音声データを文節単位に区分けする区分け手段と、
前記区分け手段で得られた前記文節単位の複数のRTP音声データを結合し、まとめて一つのパケットデータとして生成する第2の生成手段と、
前記第2の生成手段で得られたデータをファイル化したデータとして生成する第3の生成手段と、
通信状態を監視する監視手段と、
前記監視手段で得られた通信状態に応じて、通常時は前記第1の生成手段で得られたデータを通信経路に伝送し、通信状態の悪化時が前記第2の生成手段で得られたデータを通信経路に伝送し、通信状態の更なる悪化時には前記第3の生成手段で得られたデータを通信経路に伝送し、
受信側では、
前記通信経路を介して受信したRTP音声データを復元し、パケット化された受信データをパケット分割し文節単位のパケットデータを得て一文節と区別された複数のRTPを復元し、また前記ファイル化されたデータをそれぞれ復元して音声データを音声出力する音声データ送受信方式。
【0014】
(2)前記受信側では、受信ファイルデータに基づいて受信データの欠落を認識して再送依頼を送出するか、受信データの補間処理を実行する上記(1)の音声データ送受信方式。
【0015】
(3)前記送信側から送出するファイル化データには、識別情報が付与されている上記(1)の音声データ送受信方式。
【0016】
(4)前記受信では、受信ファイルデータから前記識別情報に基づいて送信側のデータを取り出す上記(1)の音声データ送受信方式。
【0017】
(5)前記音声の文節の区別は、音声認識により行われる上記(1)の音声データ送受信方式。
【0018】
(6)前記音声の文節の区別は、外部からの指示により行われる上記(1)の音声データ送受信方式。
【0019】
(7)前記音声の文節の区別は、入力音声の音量レベルに基づいて行われる上記(1)の音声データ送受信方式。
【0020】
(8)前記音声の文節の区別は、入力音声の高さレベルの変化に基づいて行われる上記(1)の音声データ送受信方式。
【0021】
(9)前記音声の文節の区別は、計測されたユーザの唇の動きに基づいて行われる上記(1)の音声データ送受信方式。
【0022】
(10)前記音声の文節の区別は、計測されたユーザの喉の振動に基づいて行われる上記(1)の音声データ送受信方式。
【0027】
【発明の実施の形態】
以下、本発明による音声データ送受信方式の好適実施形態例について添付図を参照して説明する。図1は本発明による音声データ送受信方式の第1の実施形態例を示すシステム構成図である。
【0028】
本実施形態では、送信側には、通信端末11、音声認識装置12及びパケット結合装置13を備え、送信側とインターネット等の通信経路を介して接続されている受信側には、パケット分割装置21及び通信端末22を備える。勿論、各ユーザは、会話のために送信機能と受信機能の両機能を有するが、ここでの説明は、送信側と受信側を別に行う。
【0029】
送信側においては、ユーザの発声した音声入力は、マイク等の音声入力装置により音声データとして通信端末11で処理される。受信側の通信端末22で音声処理された音声はスピーカ等の音声出力装置を介して音声出力される。
【0030】
送信側の通信端末11は、入力音声データに基づいてリアルタイム通信パケット(以後、RTPと称する)を生成する。音声認識装置12は、通信端末11から音声データを受信し、音声認識処理を実行して音声を文節単位に区分けする。パケット結合装置13は、こうして音声認識装置12で文節単位の複数のRTP音声データを結合し、まとめて一つのパケットデータとして通信経路にデータ伝送する。パケット結合装置13は、また上記文節単位のRTPデータをそのまま送信しても良い。
【0031】
通信経路を介して受信したパケット化された受信データは、受信側のパケット分割装置21でパケット分割されて文節単位のパケットデータRTPが得られ、一文節と区別された複数のRTPを復元する。通信端末22は、パケット分割装置21から受信した複数のRTPに基づいて送信側の音声データを生成してスピーカから音声出力する。
【0032】
以上のように、本実施形態では、音声文章の意味をもつ区切りとしての文節単位を識別し、識別された文節単位でのリアルタイム通信パケットで送受信しているので、通信回線の劣化等に起因する通信環境が悪化して通信系路上でのパケットの欠落が生じても文節毎の意味は伝達でき確実な情報伝達が可能となる。
【0033】
図2は本発明による音声データ送受信方式の第2の実施形態例を示すシステム構成図である。図2において、図1と同じ参照符号を付与された構成部は同様な機能を有する構成部である。
【0034】
本実施形態では、送信側には、通信端末11、音声認識装置12、パケット結合装置13及びファイル化装置14を備え、送信側とインターネット等の通信経路を介して接続されている受信側には、パケット分割装置21、通信端末22及びファイル受信装置23を備える。
【0035】
送信側の通信端末11は、入力音声データに基づいてRTPを生成する。音声認識装置12により、通信端末11から音声データに対して音声認識処理を実行して音声を文節単位に区分けし、パケット結合装置13により、文節単位の複数のRTP音声データを結合して一つのパケットデータとしてファイル化装置14に送出する。ファイル化装置14は、受信したパケットをファイル化して通信経路に伝送する。
【0036】
通信経路を介して受信したファイルデータは、受信側のファイル受信装置23で、パケットデータとしてパケット分割装置21に送出する。ファイル受信装置23は、また、受信したファイルデータから受信データの欠落を認識してデータの再送依頼を送信側に送出したり、受信データに補間処理を施してデータの欠落を防止する。
【0037】
パケット分割装置21は、ファイル受信装置23から受信したデータをパケット分割し、文節単位のパケットデータRTPを得て、一文節と区別された複数のRTPを復元する。通信端末22は、パケット分割装置21から受信した複数のRTPに基づいて送信側の音声データを生成してスピーカから音声出力する。
【0038】
以上の第2の実施形態では、第1の実施形態のような通信回線の劣化等に起因する通信環境が悪化して通信系路上でのパケットの欠落が生じても文節毎の意味は伝達でき確実な情報伝達が可能となるだけでなく、ファイル受信装置23が受信したファイルデータに基づいて受信データの欠落を認識してデータの再送依頼を出したり、受信データ補間処理によるデータ欠落を防止できるという効果も奏する。
【0039】
次に、本発明による音声データ送受信方式の第3の実施形態を図3のシステム構成図を参照して説明する。図3において、図2と同じ参照符号を付与された構成部は同様な機能を有する構成部である。
【0040】
本実施形態の構成と動作は基本的に図2に示す第2の実施形態と同様である。本実施形態は、ファイアウォール24が通信経路と受信側に存在する場合に効果が大きい。本実施形態では、ファイル化装置14が、ファイルデータを、一般的に開放されているHTTP、FTP等のポートを利用して送信し、他のファイルと区別するためにファイル化後に識別情報を付与する。
【0041】
インターネット等の通信経路を介して接続されている受信側のファイル受信装置23は、受信したファイル全部から識別情報を元にファイル化装置14が送信したファイルを取り出してパケット分割装置21に送出する。ファイル受信装置23は、上記と同様に、受信データの欠落を認識してデータ再送の指示を出したり、受信データの補間処理を施してデータの欠落を防止する。
【0042】
この第3の実施形態では、第1と第2の実施形態のような通信回線の劣化等に起因する通信環境が悪化して通信系路上でのパケットの欠落が生じても文節毎の意味は伝達でき確実な情報伝達が可能となる効果、受信ファイルデータに基づく受信データ欠落の認識によるデータの再送処理や受信データ補間処理によるデータ欠落の防止効果に加えて、ファイアウォール越えの通信端末との通信が可能になるという効果も奏することができる。
【0043】
以下に説明する本発明の更に他の実施形態は、音声の文節を区別(識別)する方式についての種々の形態である。
【0044】
本発明の第4の実施形態は、手動で文節区切りを示す信号を出力するものであり、手動で文節区切りの信号を送る装置を用いることにより、必要な区切りを人の判断で入力することができる。
【0045】
この実施形態によれば、如何なる環境下でも区切り情報を入力できるため、音声に限らず、音楽、連続音を送信する場合に用いることができるだけでなく、画像などの他のRTP通信にも用いることができる。
【0046】
本発明の第5の実施形態は、音声の文節区切りを計測した入力音量に基づいて決定するものである。すなわち、入力された音量を計測し、そのレベルが特定の値まで下がった時を区切りと判断する。この場合の特定の値とは発言が途切れた際の雑音レベルとすることができる。
【0047】
本実施形態によれば、発言中の自然な区切りで自動的に文節を区切ることができる。
【0048】
本発明の第6の実施形態は、音声の文節区切りを、計測された入力音の高さに基づいて決定するものである。すなわち、入力された音の高さを計測し、そのレベルが一定以上の落差を生じた時を区切りと判断する。
【0049】
本実施形態によれば、背景の雑音が大きくとも自動的に発言の区切りを識別することができる。
【0050】
本発明の第7の実施形態は、音声の文節区切りを、音声入力中の人物の顔を画像計測し、唇の動きに基づいて決定するものである。すなわち、音声入力中の人物の顔を画像計測し、唇の動きが停滞した時を区切りと判断する。
【0051】
本実施形態によれば、音声処理とは異なる機構で区切りの判断が行えるため、適切な音声識別装置がなくとも自動的に区切りの識別が行える。
【0052】
本発明の第8の実施形態は、音声の文節区切りを、計測された喉の振動に基づいて決定するものである。すなわち、喉の振動を計測し、振動が止んだ時を区切りと判断する。
【0053】
本実施形態によれば、音声処理とは異なる機構で区切りの判断が行えるため、適切な音声識別装置がなくとも自動的に区切りの識別が行える。また、音声の音量が極端に小さい場合にも用いることができる。
【0054】
本発明の第9の実施形態は、音声の文節区切りを、音声の文章としての識別、解析手法に基づいて決定するものである。すなわち、音声を文章として解析し、適切な区切りを判断する。音声の文章への解析技術は公知の技術を用いることがきる。
【0055】
本実施形態によれば、上述の手法を利用できない環境下、例えば平坦で長く連続した音声に対しても、意味から区切りを自動的に判断することができる。
【0056】
次に本発明の第10の実施形態について説明する。
本実施形態は、送信側(または受信側)に設置され、通信状況を観測して送受信両方の通信端末に通信の最適な手段の通達を行うものである。
【0057】
図4には本実施形態の構成ブロック図が示されている。
本実施形態は、通信の開始、終了を感知する送受信監視装置31と、通信時間を累算する通信時間記憶部32と、送信または受信の完了したデータ量を累算する通信量記憶部33と、通信手段切り替えの基準値とそれぞれの通信手段を保持する基準値、対応手段記憶部34と、通信時間記憶部32と通信量記憶部33から時間あたり通信量を計算し、基準値、対応手段記憶部34に記憶された基準と比較し、適切な通信手段を判別する比較演算装置35と、比較演算装置35から通信手段を受け取り、その切り替え命令を行う通信手段通達装置36を備える。
【0058】
本実施形態の動作を図5を参照して説明する。
通信が行われると送受信監視装置31が通信開始を感知し、通信時間記憶部32と通信量記憶部33にそれぞれの累算を開始させる。通信時間記憶部32が一定時間経過を感知するごとに通信量記憶部33のデータ量と共に記憶値を比較演算装置35に送り、同時に通信時間記憶部32、通信量記憶部33共に累積値を消去する。比較演算装置35は通信時間記憶部32と通信量記憶部33から送られた情報から時間あたり通信量を算出し、結果を基準値、対応手段記憶部34に記憶されている基準値と比較して、対応した通信手段を通信手段通達装置36に送出する。通信手段通達装置36は、選択された手段の切り替え命令を通信端末に通達する。また、通信が終了した際には送受信監視装置31がそれを感知し、通信時間記憶部32と通信量記憶部33に累算の終了と記憶値の消去を通知する。このように、本実施形態では、送信側と受信側との間の単位時間あたりの通信量に基づいて上記いずれかの方式を選択することができる。
【0059】
本実施形態によれば、送受信通信端末は通信経路の環境に合わせて最適な通信手段で通信を行うことができる。通信手段として例えば挙げられるのは、通常時がRTP通信、経路環境の悪化時が文節区切りパケット通信、経路環境が更に悪化した際にはファイル化通信を選択する、などとする。
【0060】
以上、本発明の好適実施形態の構成および動作を詳述した。しかし、斯かる実施形態は、本発明の単なる例示に過ぎず、何ら本発明を限定するものではない。本発明の要旨を逸脱することなく、特定用途に応じて種々の変形変更が可能であること、当業者には容易に理解できよう。
【0061】
【発明の効果】
以上説明したように、本発明の音声データ送受信方式によれば、通信回線の劣化等に起因する通信環境が悪化して通信系路上でのパケットの欠落が生じても文節毎の意味は伝達でき確実な情報伝達が可能となるだけでなく、受信したファイルデータに基づいて受信データの欠落を認識してデータの再送依頼を出したり、受信データ補間処理によるデータ欠落を防止でき、ファイアウォール越えの通信端末との通信が可能になるという効果を奏することができる。
【0062】
また、送受信通信端末は通信経路の環境に合わせて最適な通信手段で通信を行うことができる。
【図面の簡単な説明】
【図1】本発明による音声データ送受信方式の第1の実施形態例を示すシステム構成図である。
【図2】本発明による音声データ送受信方式の第2の実施形態例を示すシステム構成図である。
【図3】本発明による音声データ送受信方式の第3の実施形態例を示すシステム構成図である。
【図4】本発明による音声データ送受信方式の第10の実施形態例を示すシステム構成図である。
【図5】図4に示す実施形態の動作を説明するための図である。
【符号の説明】
11、22 通信端末
12 音声認識装置
13 パケット結合装置
14 ファイル化装置
21 パケット分割装置
23 ファイル受信装置
24 ファイアウォール
31 送受信監視装置
32 通信時間記憶部
33 通信量記憶部
34 基準値、対応手段記憶部
35 比較演算装置
36 通信手段通達装置
Claims (10)
- 送信側では、
入力音声データに基づいてリアルタイム通信パケットのRTP音声データを生成する第1の生成手段と、
前記第1の生成手段で生成された前記入力音声データを文節単位に区分けする区分け手段と、
前記区分け手段で得られた前記文節単位の複数のRTP音声データを結合し、まとめて一つのパケットデータとして生成する第2の生成手段と、
前記第2の生成手段で得られたデータをファイル化したデータとして生成する第3の生成手段と、
通信状態を監視する監視手段と、
前記監視手段で得られた通信状態に応じて、通常時は前記第1の生成手段で得られたデータを通信経路に伝送し、通信状態の悪化時が前記第2の生成手段で得られたデータを通信経路に伝送し、通信状態の更なる悪化時には前記第3の生成手段で得られたデータを通信経路に伝送し、
受信側では、
前記通信経路を介して受信したRTP音声データを復元し、パケット化された受信データをパケット分割し文節単位のパケットデータを得て一文節と区別された複数のRTPを復元し、また前記ファイル化されたデータをそれぞれ復元して音声データを音声出力することを特徴とする音声データ送受信方式。 - 前記受信側では、受信ファイルデータに基づいて受信データの欠落を認識して再送依頼を送出するか、受信データの補間処理を実行することを特徴とする請求項1に記載の音声データ送受信方式。
- 前記送信側から送出するファイル化データには、識別情報が付与されていることを特徴とする請求項1に記載の音声データ送受信方式。
- 前記受信では、受信ファイルデータから前記識別情報に基づいて送信側のデータを取り出すことを特徴とする請求項1に記載の音声データ送受信方式。
- 前記音声の文節の区別は、音声認識により行われることを特徴とする請求項1に記載の音声データ送受信方式。
- 前記音声の文節の区別は、外部からの指示により行われることを特徴とする請求項1に記載の音声データ送受信方式。
- 前記音声の文節の区別は、入力音声の音量レベルに基づいて行われることを特徴とする請求項1に記載の音声データ送受信方式。
- 前記音声の文節の区別は、入力音声の高さレベルの変化に基づいて行われることを特徴とする請求項1に記載の音声データ送受信方式。
- 前記音声の文節の区別は、計測されたユーザの唇の動きに基づいて行われることを特徴とする請求項1に記載の音声データ送受信方式。
- 前記音声の文節の区別は、計測されたユーザの喉の振動に基づいて行われることを特徴とする請求項1に記載の音声データ送受信方式。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002349621A JP3947871B2 (ja) | 2002-12-02 | 2002-12-02 | 音声データ送受信方式 |
US10/720,135 US7839893B2 (en) | 2002-12-02 | 2003-11-25 | Voice data transmitting and receiving system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002349621A JP3947871B2 (ja) | 2002-12-02 | 2002-12-02 | 音声データ送受信方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004186860A JP2004186860A (ja) | 2004-07-02 |
JP3947871B2 true JP3947871B2 (ja) | 2007-07-25 |
Family
ID=32376145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002349621A Expired - Lifetime JP3947871B2 (ja) | 2002-12-02 | 2002-12-02 | 音声データ送受信方式 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7839893B2 (ja) |
JP (1) | JP3947871B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103503402A (zh) * | 2011-12-12 | 2014-01-08 | 华为技术有限公司 | Rtp媒体数据的处理方法及设备 |
JP6155555B2 (ja) * | 2012-05-30 | 2017-07-05 | 日本電気株式会社 | 情報処理システム、情報処理方法、情報処理装置、携帯端末およびその制御方法と制御プログラム |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3855416A (en) * | 1972-12-01 | 1974-12-17 | F Fuller | Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment |
US4093821A (en) * | 1977-06-14 | 1978-06-06 | John Decatur Williamson | Speech analyzer for analyzing pitch or frequency perturbations in individual speech pattern to determine the emotional state of the person |
DE3879028T2 (de) * | 1987-07-16 | 1993-06-24 | Fujitsu Ltd | Spracherkennungseinrichtung. |
US5148429A (en) * | 1988-10-27 | 1992-09-15 | Kabushiki Kaisha Toshiba | Voice data transmission system and method |
JPH0338699A (ja) | 1989-07-05 | 1991-02-19 | Sharp Corp | 音声認識装置 |
US5444817A (en) * | 1991-10-02 | 1995-08-22 | Matsushita Electric Industrial Co., Ltd. | Speech recognizing apparatus using the predicted duration of syllables |
JPH07272447A (ja) | 1994-03-25 | 1995-10-20 | Toppan Printing Co Ltd | 音声データ編集システム |
US6161083A (en) * | 1996-05-02 | 2000-12-12 | Sony Corporation | Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation |
DE69629667T2 (de) * | 1996-06-07 | 2004-06-24 | Hewlett-Packard Co. (N.D.Ges.D.Staates Delaware), Palo Alto | Sprachsegmentierung |
US5943347A (en) * | 1996-06-07 | 1999-08-24 | Silicon Graphics, Inc. | Apparatus and method for error concealment in an audio stream |
JP2942736B2 (ja) * | 1996-09-03 | 1999-08-30 | オリンパス光学工業株式会社 | コード記録装置 |
JPH1097280A (ja) | 1996-09-19 | 1998-04-14 | Hitachi Ltd | 音声画像認識翻訳装置 |
JP2685429B2 (ja) | 1996-09-20 | 1997-12-03 | 株式会社東芝 | 音声認識装置 |
US5963551A (en) * | 1996-09-30 | 1999-10-05 | Innomedia Pte Ltd. | System and method for dynamically reconfigurable packet transmission |
JP3237566B2 (ja) * | 1997-04-11 | 2001-12-10 | 日本電気株式会社 | 通話方法、音声送信装置及び音声受信装置 |
JPH11234279A (ja) | 1998-02-09 | 1999-08-27 | Nec Eng Ltd | データ送受信システム |
US6445717B1 (en) * | 1998-05-01 | 2002-09-03 | Niwot Networks, Inc. | System for recovering lost information in a data stream |
US6775652B1 (en) * | 1998-06-30 | 2004-08-10 | At&T Corp. | Speech recognition over lossy transmission systems |
US6546009B1 (en) * | 1998-08-11 | 2003-04-08 | At&T Corp. | Method of reducing delays in packet data transmission |
US6754265B1 (en) * | 1999-02-05 | 2004-06-22 | Honeywell International Inc. | VOCODER capable modulator/demodulator |
JP2001024703A (ja) | 1999-07-08 | 2001-01-26 | Hitachi Ltd | 音声中継兼多重化装置 |
ATE453148T1 (de) * | 1999-10-13 | 2010-01-15 | Koninkl Philips Electronics Nv | Gerät mit sprachsignal und steuersignal eingabevorrichtung |
US6553021B1 (en) * | 1999-11-10 | 2003-04-22 | Motorola, Inc. | Call management in a TDMA system through variable packet formatting |
JP2001142488A (ja) | 1999-11-17 | 2001-05-25 | Oki Electric Ind Co Ltd | 音声認識通信システム |
US6480827B1 (en) * | 2000-03-07 | 2002-11-12 | Motorola, Inc. | Method and apparatus for voice communication |
JP2001358602A (ja) * | 2000-06-14 | 2001-12-26 | Nec Corp | 文字情報受信装置 |
US7117152B1 (en) * | 2000-06-23 | 2006-10-03 | Cisco Technology, Inc. | System and method for speech recognition assisted voice communications |
US6944591B1 (en) * | 2000-07-27 | 2005-09-13 | International Business Machines Corporation | Audio support system for controlling an e-mail system in a remote computer |
US6836804B1 (en) * | 2000-10-30 | 2004-12-28 | Cisco Technology, Inc. | VoIP network |
US7035803B1 (en) * | 2000-11-03 | 2006-04-25 | At&T Corp. | Method for sending multi-media messages using customizable background images |
US7069208B2 (en) * | 2001-01-24 | 2006-06-27 | Nokia, Corp. | System and method for concealment of data loss in digital audio transmission |
US7013267B1 (en) * | 2001-07-30 | 2006-03-14 | Cisco Technology, Inc. | Method and apparatus for reconstructing voice information |
JP4170217B2 (ja) * | 2001-08-31 | 2008-10-22 | 株式会社ケンウッド | ピッチ波形信号生成装置、ピッチ波形信号生成方法及びプログラム |
JP3821740B2 (ja) * | 2002-03-22 | 2006-09-13 | Necインフロンティア株式会社 | 音声データ送受信装置 |
US7136811B2 (en) * | 2002-04-24 | 2006-11-14 | Motorola, Inc. | Low bandwidth speech communication using default and personal phoneme tables |
-
2002
- 2002-12-02 JP JP2002349621A patent/JP3947871B2/ja not_active Expired - Lifetime
-
2003
- 2003-11-25 US US10/720,135 patent/US7839893B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US7839893B2 (en) | 2010-11-23 |
JP2004186860A (ja) | 2004-07-02 |
US20040105464A1 (en) | 2004-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7773511B2 (en) | Generic on-chip homing and resident, real-time bit exact tests | |
KR100501324B1 (ko) | 음성 품질 예측값을 이용한 보이스 오버 인터넷프로토콜에서의 콜 라우팅 방법 | |
US8018853B2 (en) | Using RTCP statistics for media system control | |
US7822018B2 (en) | Duplicate media stream | |
US20080205380A1 (en) | Switchboard for multiple data rate communication system | |
CN109600341B (zh) | 一种即时通信检测方法、设备和计算机存储介质 | |
US20130179160A1 (en) | System and Method for Improved Use of Voice Activity | |
JP3821740B2 (ja) | 音声データ送受信装置 | |
JP2000270024A (ja) | インターネット電話におけるフレームパケット化サイズ能力交換方法,インターネット電話利用端末装置,およびインターネット電話のプログラムを記録した記録媒体 | |
JP3947871B2 (ja) | 音声データ送受信方式 | |
JP3133296B2 (ja) | 通信装置及びdtmf転送方法 | |
US7299176B1 (en) | Voice quality analysis of speech packets by substituting coded reference speech for the coded speech in received packets | |
EP1295444B1 (en) | Method to reduce the distortion in a voice transmission over data networks | |
US7313233B2 (en) | Tone clamping and replacement | |
US20050169245A1 (en) | Arrangement and a method for handling an audio signal | |
CN103347004A (zh) | 一种提高vbd数据传输质量的方法 | |
JP2005167684A (ja) | 伝送制御装置 | |
US6952473B1 (en) | System and method for echo assessment in a communication network | |
JP3172774B2 (ja) | 音声の無音抑圧可変制御装置 | |
JP3305242B2 (ja) | 通信装置 | |
JP2005266411A (ja) | 音声圧縮方法および電話器 | |
JP4279169B2 (ja) | パケットロギングシステム | |
Vaighan | VoIp Voice Quality Measurement by Network Traffic Analysis | |
Lee et al. | Internet Telephony Gateway Server-Software Design | |
KR20020076578A (ko) | 음성전달 인터넷 프로토콜을 이용한 실시간 음성 전송방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040713 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070316 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3947871 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110427 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120427 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120427 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130427 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130427 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140427 Year of fee payment: 7 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |