JP2003046607A - 音声通信端末、及び音声通信システム - Google Patents

音声通信端末、及び音声通信システム

Info

Publication number
JP2003046607A
JP2003046607A JP2001234681A JP2001234681A JP2003046607A JP 2003046607 A JP2003046607 A JP 2003046607A JP 2001234681 A JP2001234681 A JP 2001234681A JP 2001234681 A JP2001234681 A JP 2001234681A JP 2003046607 A JP2003046607 A JP 2003046607A
Authority
JP
Japan
Prior art keywords
voice
communication terminal
voice communication
digital signal
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001234681A
Other languages
English (en)
Inventor
Masayuki Nemoto
正行 根本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Priority to JP2001234681A priority Critical patent/JP2003046607A/ja
Publication of JP2003046607A publication Critical patent/JP2003046607A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

(57)【要約】 【課題】 音声と同時に伝送するためのデータ量を減ら
すとともに、リアルタイムに音声の送受信が可能な音声
通信端末、及び音声通信システムを提供する。 【解決手段】 音声通信端末1へ入力された音声は、音
声認識部12によってテキストデータ化されたディジタ
ル信号列として制御部11へ入力される。無線部18
は、制御部11を介して取得したディジタル信号列によ
り無線電波を変調する。そして、無線部18は、ディジ
タル信号列を用いて変調された搬送波を、順次基地局へ
向けて送信する。一方、基地局から無線電波を受信した
音声通信端末1では、無線部18が変調された無線電波
を復調し、順次テキストデータのディジタル信号列を制
御部11へ出力する。音声合成部13は、制御部11か
ら取得したディジタル信号列を、音声合成パラメータ1
4に記憶された音声合成パラメータを利用して順次音声
合成し、音声出力として音声通信端末1から出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、通信網に接続され
た音声通信端末、及び音声通信端末と通信網によって構
築される音声通信システムに関する。
【0002】
【従来の技術】従来、携帯電話機等の端末においては、
アナログ信号の音声波形をA/D変換によりディジタル
信号化及び符号化し、符号化されたディジタル情報を無
線電波にのせて、相手方に送信する。受信する方では、
無線電波から符号化されたディジタル情報を取り出し、
復号化とD/A変換によりアナログ信号の音声波形へ戻
す。しかし、携帯電話機は、リアルタイムで通信が行え
る代わりに、音声波形の符号化、及び復号化が必要なた
め、近年の伝送するデータ量の増加に反して、接続する
回線の速度の制約を受けて、音声と同時に音声以外のデ
ータを伝送することが困難であった。そこで、近年、音
声と同時に伝送するデータ量を増やすために、音声認識
技術を用いて音声波形をテキストデータへ変換して伝送
し、受信した側は、音声合成技術を用いてテキストデー
タを音声波形へ変換して利用する技術が提案されてい
る。この技術は、音声波形をテキストデータへ変換した
ら、電子メールのシステムを利用して送受信する。
【0003】
【発明が解決しようとする課題】しかし、上述の技術で
は、音声波形から変換したテキストデータとともに伝送
するデータ量を増やせるものの、電子メールシステムを
利用しているため、リアルタイムに音声を送受信するこ
とができないという問題があった。
【0004】本発明は、上記問題点に鑑みてなされたも
ので、音声を伝送するためのデータ量を減らすととも
に、リアルタイムに音声の送受信が可能な音声通信端
末、及び音声通信システムを提供することを目的とす
る。
【0005】
【課題を解決するための手段】上記問題点を解決するた
めに、請求項1に記載の発明は、通話相手の端末と音声
信号をリアルタイムに送受信する音声通信端末であっ
て、入力された音声信号を順次テキストデータ化された
ディジタル信号列へ変換する音声認識手段(例えば実施
の形態の音声認識部12)と、前記音声認識手段が出力
するディジタル信号列を、該ディジタル信号列をリアル
タイムに通信可能な通信網(例えば実施の形態の通信網
20)に対して順次送信する通信手段(例えば実施の形
態の無線部18)とを備えたことを特徴とする。以上の
構成により、音声通信端末は、リアルタイムにユーザの
音声をテキストデータで表されたディジタル信号列とし
て送信することができるようになる。
【0006】請求項2に記載の発明は、請求項1に記載
の音声通信端末において、前記音声認識手段は、入力さ
れた音声信号をテキストデータ化されたディジタル信号
列へ変換する際に、音声信号から抽出された音声パラメ
ータを出力し、前記通信手段は、前記ディジタル信号列
とともに該音声パラメータを送信することを特徴とす
る。以上の構成により、音声通信端末は、音声信号から
生成されるディジタル信号列を送信する際に、ディジタ
ル信号列とともにこのディジタル信号列を元の音声信号
へ戻すための音声パラメータを同時に通信網へ送信する
ことができるようになる。
【0007】請求項3に記載の発明は、通話相手の端末
と音声信号をリアルタイムに送受信する音声通信端末で
あって、ディジタル信号列をリアルタイムに通信可能な
通信網(例えば実施の形態の通信網20)から、テキス
トデータで表されたディジタル信号列を順次受信する通
信手段(例えば実施の形態の無線部18)と、前記ディ
ジタル信号列を順次音声信号へ変換する音声合成手段
(例えば実施の形態の音声合成部13)とを備えたこと
を特徴とする。以上の構成により、音声通信端末は、リ
アルタイムにテキストデータで表されたディジタル信号
列を受信して、音声信号(音声、または音声に聞こえる
音)を出力することができるようになる。
【0008】請求項4に記載の発明は、請求項3に記載
の音声通信端末において、ディジタル信号列で表された
テキストデータを、音声信号へ変換するための音声合成
パラメータを記憶するパラメータ記憶手段(例えば実施
の形態の音声合成パラメータ記憶部14)を備え、前記
音声合成手段は、前記パラメータ記憶手段に記憶された
音声合成パラメータを用いて、ディジタル信号列で表さ
れたテキストデータを音声信号へ変換することを特徴と
する。以上の構成により、音声通信端末は、音声合成時
の音声の性質を音声合成パラメータを用いて制御できる
ようになる。
【0009】請求項5に記載の発明は、請求項4に記載
の音声通信端末において、前記パラメータ記憶手段に
は、前記音声合成パラメータが予め記憶され、前記音声
合成手段は、着信時に通知される発信元の音声通信端末
の識別番号に基づいて、前記パラメータ記憶手段から対
応する音声合成パラメータを抽出し、該音声合成パラメ
ータを用いてディジタル信号列で表されたテキストデー
タを音声信号へ変換することを特徴とする。以上の構成
により、音声通信端末は、通話相手を自動的に認識して
音声合成時の音声合成パラメータを指定できるようにな
る。
【0010】請求項6に記載の発明は、請求項4に記載
の音声通信端末において、前記パラメータ記憶手段に
は、前記通信網を介して受信した音声合成パラメータが
一時記憶され、前記音声合成手段は、前記パラメータ記
憶手段に記憶された音声合成パラメータを用いて、ディ
ジタル信号列で表されたテキストデータを音声信号へ変
換することを特徴とする。以上の構成により、音声通信
端末は、通信網に記憶された音声合成パラメータ、ある
いは通話相手が送信する音声合成パラメータを受信して
音声合成を行えば良く、音声合成パラメータを予めパラ
メータ記憶手段へ記憶しておく必要がないため、パラメ
ータ記憶手段のデータ量は、通信網を介して受信する音
声合成パラメータのデータ量だけ用意すれば良いことに
なる。
【0011】請求項7に記載の発明は、請求項3から請
求項6のいずれかに記載の音声通信端末において、前記
ディジタル信号列を受信した際、前記音声合成手段を作
動してディジタル信号列で表されたテキストデータを音
声信号へ変換して表示するか、そのままテキストデータ
で表示するかの選択手段を備えたことを特徴とする。以
上の構成により、受信した信号を音声から表示画面上の
テキストデータへ切り替えて出力できるようになる。
【0012】請求項8に記載の発明は、ディジタル信号
列を送受信可能な音声通信端末(例えば実施の形態の音
声通信端末1)と通信網(例えば実施の形態の通信網2
0)とからなる音声通信システムにおいて、前記通信網
に、音声合成に利用する音声合成パラメータを前記音声
通信端末へ送信するためのサーバ(例えば実施の形態の
サーバ23)を備えたことを特徴とする。以上の構成に
より、通信網側に音声合成パラメータを用意し、これを
音声通信端末へ送信して利用するようにできるので、音
声通信端末の1台1台に、音声合成パラメータを予め用
意する必要がなくなる。
【0013】請求項9に記載の発明は、請求項8に記載
の音声通信システムにおいて、前記サーバは、前記通信
網に接続された発信元の音声通信端末の識別番号に関連
づけられた音声合成パラメータを、着信元の音声通信端
末へ送信することを特徴とする。以上の構成により、サ
ーバは、通話相手を自動的に認識して音声合成時の音声
合成パラメータを指定し、音声通信端末へ送信できるよ
うになる。
【0014】請求項10に記載の発明は、請求項8に記
載の音声通信システムにおいて、前記サーバは、前記通
信網に接続された発信元の音声通信端末から指定された
音声合成パラメータを、着信元の音声通信端末へ送信す
ることを特徴とする。以上の構成により、サーバは、発
信元の希望に添った音声合成時の音声合成パラメータを
指定し、音声通信端末へ送信できるようになる。
【0015】請求項11に記載の発明は、ディジタル信
号列を送受信可能な音声通信端末と通信網とからなる音
声通信システムにおいて、前記通信網は、接続された一
方の前記音声通信端末から送信された音声合成パラメー
タを、接続された他方の前記音声通信端末へ中継するこ
とを特徴とする。以上の構成により、通信網の中に音声
合成パラメータを用意する必要がなくなる。また、音声
通信端末毎に異なる音声合成パラメータを保持し、通信
網を介してこれを通話相手へ送信して利用することがで
きる。
【0016】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について説明する。図1は、本発明の実施の形
態による音声通信端末1の構成を示すブロック図であ
る。図1において、本実施の形態の音声通信端末1は、
通信プロトコルを含む音声通信端末制御用のアプリケー
ションプログラムを実行することにより、音声通信端末
各部の動作を制御し、音声通信端末1が有する携帯電話
機能や音声認識及び音声合成機能を制御するCPU(中
央演算装置)を含む制御部11を備えている。また、制
御部11には、音声通信端末1のユーザの音声を、順次
音声認識によってテキストデータで表されたディジタル
信号列とする音声認識部12と、音声通信端末1が受信
したテキストデータで表されたディジタル信号列を、順
次音声合成によって可聴音声信号(音声、または音声に
聞こえる音)として出力する音声合成部13とが接続さ
れている。
【0017】ここで、音声認識部12は、まず、ユーザ
の音声からユーザの特性や雑音などを除去し、言語情報
の特徴量を抽出する。次に、認識対象の言語系に基づく
言語処理として、言語表記に対する文法的・意味的制約
を与えて可能な仮説を生成する。そして、予め決められ
た認識対象の語彙セットの音声データから求められた音
韻モデル等の標準パターンを用いて、入力音声に対する
類似度を求め、これを基に言語表記の仮説の中から、最
適な仮説を探索してテキストデータへ変換する。なお、
具体的な認識手法には、動的計画法(DP:Dynamic Pr
ogramming )を用いて、入力音声と標準パターンの時間
軸を非線形に伸縮させてパターンマッチングを行うもの
や、非定常信号である音声を、性質の異なる定常信号の
時系列モデルとしてモデル化したHMM(hidden Marko
v model )を利用して、確率統計計算を行うものなどが
ある。
【0018】また、音声合成部13は、まず、単語の読
みやアクセントなどを記憶した辞書を用いてテキストデ
ータを解析し、発音記号や係受けなどの情報を生成す
る。次に、この発音記号などの情報を基に、韻律処理や
音韻等に対する音響特性の実現処理を行い、可聴音声信
号を生成する。なお、韻律処理とは、アクセントやイン
トネーション、あるいはリズムやテンポ、ポーズなどの
ように、音素や音節より長い単位にかかわる音声の特徴
である韻律を、音声の基本周波数、時間長、強さ等によ
り適切に生成、制御することである。また、音韻等に対
する音響特性の実現処理とは、予め記録してある音素や
音節、あるいはこれらの連鎖を単位とする音声を、音声
モデルの各種音声合成パラメータに基づいて編集するこ
とである。ここで、音声合成パラメータは、音声の高低
を表すピッチ、発声速度、音韻や音色に関係する周波数
パワースペクトル、音声の強さを示す音声波形パワー
等、音声の性質を示すパラメータのことである。
【0019】更に、制御部11と音声合成部13には、
制御部11の指示で音声合成部13に音声合成パラメー
タを与える音声合成パラメータ記憶部14が接続されて
いる。なお、音声合成パラメータ記憶部14は、予め音
声合成パラメータを複数記憶していて音声合成部13に
音声合成パラメータを与える場合と、音声通信端末1が
接続される通信網や音声通信端末1の通話相手先端末
(通話相手先の音声通信端末1)から送信される音声合
成パラメータを、制御部11を介して受信して一時記憶
し、音声合成部13に音声合成パラメータを与える場合
とがある。音声合成パラメータ記憶部14に記憶される
音声合成パラメータの詳細は後述する。また、音声合成
パラメータ記憶部14は、ハードディスク装置や光磁気
ディスク装置、フラッシュメモリ等の不揮発性のメモリ
や、RAM(Random Access Memory)のような揮発性の
メモリ、あるいはこれらの組み合わせによるコンピュー
タ読み取り、書き込み可能な記録媒体より構成されるも
のとする。
【0020】また、制御部11には、ユーザが音声通信
端末を操作するために用意されたキーパッド、ボタン、
ポインティングデバイス等を含む入力操作部15と、音
声通信端末をユーザに操作させる場合に、文字(テキス
ト)やキャラクタを表示する表示画面や着信音などの音
を発する発音手段、更に振動によってユーザに情報を通
知するバイブレータ等を含む表示部16とが接続されて
いる。更に、制御部11には、音声通信端末1が携帯電
話機として無線通信網の基地局(図示せず)と通信する
ため、通信アンテナ17を介して無線電波を送信または
受信する無線部18も接続されている。なお、制御部1
1には、無線部18を介して送受信する信号の誤り訂正
を行うための符号化、復号化手段を含むものとする。
【0021】次に、本実施の形態の音声通信端末1を利
用する音声通信システムについて説明する。図2は、本
実施の形態の音声通信端末1を利用する音声通信システ
ムの構成を示す図である。ここで、音声通信システム
は、音声通信端末1の他、携帯電話機能の音声の送受信
を行う通信網20を構成する基地局21a、21b、及
び交換機22、更にはサーバ23とを含んでいる。図2
において、音声通信端末1aは、一方のユーザが使用す
る音声通信端末であって、その構成は図1に示した通り
である。また、音声通信端末1bは、音声通信端末1a
と同じ物であって、音声通信端末1aの通話相手のユー
ザが使用する音声通信端末である。基地局21a及び基
地局21bは、音声通信端末1a、1bの携帯電話機能
の基地局であって、図2では、音声通信端末1aは基地
局21aを経由して、音声通信端末1bは基地局21b
を経由して、お互いに通話を行う。
【0022】また、交換機22は、基地局21aと基地
局21bの回線交換を行い、2つの基地局間の回線接続
を行う。サーバ23は、音声通信端末1a、1bが受信
したテキストデータを音声合成部13によって可聴音声
信号へ変換する場合に利用する音声合成パラメータを記
憶し、交換機22を介して、音声通信端末1a、1bへ
音声合成パラメータを供給する。なお、サーバ23から
音声合成パラメータを供給するのは、先に図1の説明で
述べた「音声通信端末1が接続される通信網から送信さ
れる音声合成パラメータを、制御部11を介して受信し
て一時記憶し、音声合成部13に音声合成パラメータを
与える場合」に相当する。サーバ23と音声通信端末1
との関係は後述する。
【0023】次に、音声通信端末1の動作を、図1と図
2を用いて説明する。ここでは、図2の音声通信端末1
aのユーザが話す音声が、音声通信端末1bのユーザへ
伝わる場合を例にとって説明する。ユーザが通話のため
に話した音声は、順次音声通信端末1aの音声認識部1
2によってテキストデータ化されたディジタル信号列と
して制御部11へ入力される。制御部11では、これに
例えば受信側で誤り訂正を行うために必要な信号処理を
施して無線部18へ出力する。
【0024】無線部18は、制御部11を介して取得し
た音声認識部12の出力するテキストデータのディジタ
ル信号列により、例えばQPSK(Quadrature Phase S
hiftKeying )と称される変調方式を用いて搬送波(無
線電波)を変調する。ここで、PSK(Phase Shift Ke
ying)は搬送波の位相をディジタル信号列に応じて変化
させる変調方式であって、QPSKは、搬送波の4つの
位相状態によりディジタル信号列を区別して送受信する
変調方式である。そして、音声通信端末1aの無線部1
8は、音声信号から変換されたテキストデータのディジ
タル信号列を用いて変調された搬送波を、例えば1GH
zや2GHzといった高周波の無線電波へ変換し、順次
基地局21aへ向けて送信する。
【0025】基地局21aへ送信された無線電波は、1
度基地局21aで復調され、交換機22を経由して基地
局21bへ伝送される。また、基地局21bでは、これ
を再度高周波の無線電波へ変換し、音声通信端末1bへ
送信する。一方、基地局21bから無線電波を受信した
音声通信端末1bでは、無線部18が、例えばQPSK
で変調された無線電波を復調し、順次テキストデータの
ディジタル信号列を制御部11へ出力する。テキストデ
ータのディジタル信号列を入力された音声通信端末1b
の制御部11は、誤り訂正などの信号処理を行い、これ
を音声合成部13へ出力する。音声通信端末1bの音声
合成部13は、テキストデータのディジタル信号列を、
音声合成パラメータ14に記憶された音声合成パラメー
タを利用して順次音声合成し、音声出力として音声通信
端末1bから出力する。
【0026】なお、音声通信端末1が、音声合成パラメ
ータを保持する方法とそれを利用する方法には次のよう
な方法がある。 (1)音声合成パラメータ記憶部14には、音声合成パ
ラメータが予め記憶され、音声合成部13は、着信時に
通知される発信元の音声通信端末1の識別番号に基づい
て音声合成パラメータ記憶部14から音声合成パラメー
タを抽出し、該音声合成パラメータを用いてディジタル
信号列で表されたテキストデータを音声信号へ変換す
る。 (2)音声合成パラメータ記憶部14には、通信網20
を介して受信した音声合成パラメータが記憶され、音声
合成部13は、音声合成パラメータ記憶部14にに記憶
された音声合成パラメータを用いて、ディジタル信号列
で表されたテキストデータを音声信号へ変換する。
【0027】そこで、次に、音声通信端末1及び通信網
20における音声合成パラメータの保持及び利用する動
作と手順について、図面を用いて説明する。音声通信端
末1及び通信網20が、音声合成パラメータを保持する
方法には、次の2つがある。1つは音声通信端末1の音
声合成パラメータ記憶部14がその全てを記憶している
場合であり、もう一つは通信網20に設けられたサーバ
23が全てを記憶している場合である。以下、図2の音
声通信端末1aから音声通信端末1bへ電話をかけて通
話を行う場合を例にとって説明する。
【0028】図3は、音声合成パラメータを音声通信端
末1に保持する場合であって、交換機から通知される発
信元の音声通信端末1aの電話番号(発信元の音声通信
端末の識別番号)によって、着信元の音声通信端末1b
が保持している音声合成パラメータの中から自動的に音
声合成パラメータを選択して利用する場合の手順の一例
を示す図である。まず、音声通信端末1aが発呼する
(ステップS1)と、それを受信した基地局21aか
ら、選択信号送出許可が音声通信端末1aへ送信される
(ステップS2)。選択信号許可を受信した音声通信端
末1aは、自分の電話番号(音声通信端末1aの識別番
号)とともに、通話相手の音声通信端末1bの選択信号
を基地局21aへ送信する(ステップS3)。
【0029】次に、音声通信端末1aから選択信号を受
信した基地局21aは、交換機22へ、音声通信端末1
aの電話番号とともに回線接続要求を送信する(ステッ
プS4)。そして、交換機22は、選択信号によって指
示された音声通信端末1bと回線接続を行うように、基
地局21bへ回線接続の指示を行う(ステップS5)。
交換機22から回線接続の指示を受信した基地局21b
は、音声通信端末1bへ、音声通信端末1aの電話番号
とともに呼び出しを送信する(ステップS6)。基地局
21bから呼び出された音声通信端末1bは、着呼受付
けを基地局21bへ送信する(ステップS7)ととも
に、ステップS6の呼び出しの際に一緒に送信されてく
る発信元の音声通信端末1aの電話番号(発信元の音声
通信端末の識別番号)によって、音声通信端末1bが音
声合成パラメータ記憶部14に保持している音声合成パ
ラメータの中から自動的に音声合成パラメータを選択し
て、音声合成部13へ設定する(ステップS11)。
【0030】一方、音声通信端末1bから着呼受付けを
受信した基地局21bは、交換機22を介して基地局2
1aへ応答情報を送信する(ステップS12)。交換機
22を介して基地局21bから応答情報を受信した基地
局21aは、音声通信端末1aへ通話許可を送信し(ス
テップS13)、音声通信端末1aと音声通信端末1b
の通話が開始される(ステップS14)。
【0031】図4は、音声合成パラメータを音声通信端
末1に保持する場合であって、交換機から通知される発
信元の音声通信端末1aが、保持している音声合成パラ
メータの中から音声合成パラメータを選択し、着信元の
音声通信端末1bへ送信して利用する場合の手順の一例
を示す図である。図4において、ステップS1からステ
ップS7までの動作は、図3に示した動作と同じである
ので説明は省略する。この例では、音声通信端末1bが
着呼受付けを基地局21bへ送信する(ステップS7)
と、基地局21bは、交換機22を介して基地局21a
へ応答情報を送信する(ステップS21)。
【0032】交換機22を介して基地局21bから応答
情報を受信した基地局21aは、音声通信端末1aへ通
話許可を送信する(ステップS22)。音声通信端末1
aは、通話許可を受信すると、音声合成パラメータ記憶
部14に保持している音声合成パラメータの中から音声
合成パラメータを選択して、基地局21a及び交換機2
2、更には基地局21bを介して、音声通信端末1bへ
選択した音声合成パラメータを送信する(ステップS2
3)。そして、音声通信端末1aと音声通信端末1bの
通話が開始される(ステップS24)。
【0033】図5は、音声合成パラメータを通信網20
のサーバ23に保持する場合であって、交換機が発信元
の音声通信端末1aの電話番号(発信元の音声通信端末
の識別番号)によって、サーバ23が保持している音声
合成パラメータの中から自動的に音声合成パラメータを
選択し、発信元の音声通信端末1aと着信元の音声通信
端末1bへ送信して利用する場合の手順の一例を示す図
である。図5において、ステップS1からステップS7
までの動作は、図3に示した動作と同じであるので説明
は省略する。この例では、音声通信端末1bが着呼受付
けを基地局21bへ送信する(ステップS7)と、基地
局21bは、交換機22へ応答情報を送信する(ステッ
プS31)。
【0034】基地局21bから応答情報を受信した交換
機22は、交換機22に接続されたサーバ23へ、発信
元の音声通信端末1aの電話番号を送信して音声合成パ
ラメータを要求する(ステップS32)。サーバ23
は、保持している音声合成パラメータの中から、受信し
た発信元の音声通信端末1aの電話番号によって選択さ
れる音声合成パラメータを交換機22へ通知する(ステ
ップS33)。サーバ23から音声合成パラメータを通
知された交換機22は、基地局21bを介して、音声通
信端末1bへこれを送信する(ステップS34)。ま
た、交換機22は、基地局21aへ、基地局21bから
の応答情報とサーバ23から通知された音声合成パラメ
ータを送信する(ステップS35)。交換機22から応
答情報と音声合成パラメータを受信した基地局21a
は、音声通信端末1aへ通話許可と音声合成パラメータ
を送信し(ステップS36)、音声通信端末1aと音声
通信端末1bの通話が開始される(ステップS37)。
【0035】図6は、音声合成パラメータを通信網20
のサーバ23に保持する場合であって、交換機が発信元
の音声通信端末1aから指定された音声合成パラメータ
を、サーバ23が保持している音声合成パラメータの中
から選択し、発信元の音声通信端末1aと着信元の音声
通信端末1bへ送信して利用する場合の手順の一例を示
す図である。図6において、ステップS1からステップ
S7までの動作は、図3に示した動作と同じであるので
説明は省略する。この例では、音声通信端末1bが着呼
受付けを基地局21bへ送信する(ステップS7)と、
基地局21bは、交換機22を介して、基地局21aへ
応答情報を送信する(ステップS31)。
【0036】交換機22を介して基地局21bから応答
情報を受信した基地局21aは、音声通信端末1aへ通
話許可を送信する(ステップS42)。基地局21aか
ら通話許可を受信した音声通信端末1aは、基地局21
aを介して、交換機22へ音声合成パラメータの指定を
送信する(ステップS43)。基地局21aを介して、
音声通信端末1aから音声合成パラメータの指定を受信
した交換機22は、交換機22に接続されたサーバ23
へ、音声通信端末1aから受信した音声合成パラメータ
の指定を送信して音声合成パラメータを要求する(ステ
ップS44)。サーバ23は、保持している音声合成パ
ラメータの中から、音声通信端末1aから指定された音
声合成パラメータを交換機22へ通知する(ステップS
45)。
【0037】サーバ23から音声合成パラメータを通知
された交換機22は、基地局21bを介して、音声通信
端末1bへこれを送信する(ステップS46)。また、
交換機22は、基地局21aを介して、音声通信端末1
aへサーバ23から通知された音声合成パラメータを送
信し(ステップS47)、音声通信端末1aと音声通信
端末1bの通話が開始される(ステップS48)。な
お、図5、及び図6の例では、交換機22は、通話が開
始された後でも、音声通信端末1から音声合成パラメー
タの送信要求を受信した場合、サーバ23から音声合成
パラメータを取得して音声通信端末1へ送信しても良
い。
【0038】また、上述の実施の形態では、音声通信端
末1の音声認識部12は、ユーザの音声を、音声認識に
よってテキストデータ化して制御部11へ出力すると説
明したが、音声信号をテキストデータ化する際に、音声
信号から抽出した音声パラメータを、受信側の音声合成
パラメータとして利用するために、テキストデータで表
されたディジタル信号列とともに通話相手の音声通信端
末1へ送信しても良い。これにより、受信側では送信側
のユーザの声が再現できるようになる。
【0039】更に、基地局からテキストデータのディジ
タル信号列を受信した際、音声合成部13を作動してデ
ィジタル信号列で表されたテキストデータを音声信号へ
変換するか、そのままテキストデータで表示するかの選
択手段を備えても良い。これにより、音声出力では周囲
に迷惑がかかりそうな場所においては、受信した内容を
表示画面上のテキストデータで確認できるようになる。
また、目の不自由なユーザは音声で、耳の不自由なユー
ザはテキストデータで受信した信号を確認するというよ
うに、受信した内容の表示方法切り替えて利用できるよ
うになる。また、音声通信端末1は、通信機能を有する
PDA(Personal Digital Assistants :個人情報機
器)でも良い。
【0040】以上説明したように、本実施の形態の音声
通信端末は、従来の携帯電話のように音声の符号化、復
号化のための回路を必要とせず、音声通信端末の構成が
簡単になる。また、音声を送信する際に音声認識を用い
ることで、音声以外の背景雑音はテキストデータ化され
ないので、音声以外の雑音が送信されないという効果が
得られる。また、これを受信する側でも、受信したテキ
ストデータを音声合成する際に、通信網上で付加された
雑音は音声として合成されないので、音声以外の背景雑
音が出力されず聞き取り易くなる。更に、本実施の形態
の音声通信端末、及び音声通信システムによると、音声
合成パラメータをいろいろ変更することで、男性や女性
の声を使い分けたり、音声合成パラメータ自身を送受信
することで、通話相手の音声を受信側で忠実に再現でき
るようになる。
【0041】
【発明の効果】以上の如く請求項1に記載の発明によれ
ば、音声通信端末は、リアルタイムにユーザの音声をテ
キストデータで表されたディジタル信号列として送信す
ることができるようになる。従って、音声をリアルタイ
ムに送話または受話する公衆電話網のような通信網に対
して、送信する音声に関するデータ量を減らすことがで
きるため、通信網の負担を減らし、通信網は、従来と同
じ伝送量で多数の音声通信端末の通信を収容できるよう
になる。また、例えば音声と同時に他のデータを通信網
へ送信することができるという効果が得られる。更に、
送信時に音声から得られたテキストデータのみが送出さ
れるので、送信側の音声以外の雑音が通信網へ送信され
ることがないという効果が得られる。
【0042】請求項2に記載の発明によれば、音声通信
端末は、音声信号から生成されるディジタル信号列を送
信する際に、ディジタル信号列とともにこのディジタル
信号列を元の音声信号へ戻すための音声パラメータを同
時に通信網へ送信することができるようになる。従っ
て、通信網を介して、この音声通信端末が送信するディ
ジタル信号列を受信する場合、同時に送信されてくる音
声パラメータを用いてこのディジタル信号列を音声合成
することで、送信側の音声を再現できるという効果が得
られる。
【0043】請求項3に記載の発明によれば、音声通信
端末は、リアルタイムにテキストデータで表されたディ
ジタル信号列を受信して、音声信号(音声、または音声
に聞こえる音)を出力することができるようになる。従
って、音声をリアルタイムに送話または受話する公衆電
話網のような通信網から、受信する音声に関するデータ
量を減らすことができるため、通信網の負担を減らし、
通信網は、従来と同じ伝送量で多数の音声通信端末の通
信を収容できるようになる。また、例えば音声と同時に
他のデータを通信網から受信することができるという効
果が得られる。また、テキストデータで表されたディジ
タル信号列を音声合成により音声へ変換するので、通信
網において付加された雑音は音声合成時に削除され、音
声通信端末から雑音が出力されることがないという効果
が得られる。
【0044】また、請求項4に記載の発明によれば、音
声通信端末は、音声合成時の音声の性質を音声合成パラ
メータを用いて制御できるようになる。従って、いろい
ろな性質の音声を音声通信端末から出力できるようにな
るという効果が得られる。請求項5に記載の発明によれ
ば、音声通信端末は、通話相手を自動的に認識して音声
合成時の音声合成パラメータを指定できるようになる。
従って、音声通信端末は通話相手毎に異なる性質の音声
を、自動的に合成して出力できるようになるという効果
が得られる。
【0045】請求項6に記載の発明によれば、音声通信
端末は、通信網に記憶された音声合成パラメータ、ある
いは通話相手が送信する音声合成パラメータを受信して
音声合成を行えば良く、音声合成パラメータを予めパラ
メータ記憶手段へ記憶しておく必要がないため、パラメ
ータ記憶手段のデータ量は、通信網を介して受信する音
声合成パラメータのデータ量だけ用意すれば良いことに
なる。従って、パラメータ記憶手段に用いるメモリ等の
容量を削減し、音声通信端末を小型化できるという効果
が得られる。
【0046】更に、請求項7に記載の発明によれば、受
信した信号を音声から表示画面上のテキストデータへ切
り替えて出力できるようになる。従って、音声出力では
周囲に迷惑がかかりそうな場所においては、受信した内
容を表示画面上のテキストデータで確認できるようにな
る。また、目の不自由なユーザは音声で、耳の不自由な
ユーザはテキストデータで受信した信号を確認するとい
うように、受信した内容の表示方法切り替えて利用でき
るという効果が得られる。
【0047】請求項8に記載の発明によれば、通信網側
に音声合成パラメータを用意し、これを音声通信端末へ
送信して利用するようにできるので、音声通信端末の1
台1台に、音声合成パラメータを予め用意する必要がな
くなる。従って、パラメータ記憶手段に用いるメモリ等
の容量を削減し、音声通信端末を小型化できるという効
果が得られる。また、音声合成パラメータのメンテナン
ス等を行う場合、音声通信端末1台1台ではなく、通信
網側のサーバのみをメンテナンスすれば良く、効率的に
作業を行うことができるという効果が得られる。
【0048】また、請求項9に記載の発明によれば、サ
ーバは、通話相手を自動的に認識して音声合成時の音声
合成パラメータを指定し、音声通信端末へ送信できるよ
うになる。 従って、サーバから音声合成パラメータを
受信した音声通信端末は、通話相手毎に異なる性質の音
声を、自動的に合成して出力できるようになるという効
果が得られる。請求項10に記載の発明によれば、サー
バは、発信元の希望に添った音声合成時の音声合成パラ
メータを指定し、音声通信端末へ送信できるようにな
る。従って、サーバから音声合成パラメータを受信した
音声通信端末は、通話相手先の希望に添った性質の音声
を、自動的に合成して出力できるようになるという効果
が得られる。
【0049】請求項11に記載の発明によれば、通信網
の中に音声合成パラメータを用意する必要がなくなる。
また、音声通信端末毎に異なる音声合成パラメータを保
持し、通信網を介してこれを通話相手へ送信して利用す
ることができる。従って、通信網の設備負担を減らすこ
とができるという効果が得られる。また音声通信端末の
ユーザが好みの音声合成パラメータを通話相手へ送信し
て利用することができるという効果が得られる。
【図面の簡単な説明】
【図1】 本発明の一実施の形態の音声通信端末の構成
を示すブロック図である。
【図2】 同実施の形態の音声通信システムの構成を示
す図である。
【図3】 同実施の形態の音声通信端末、及び音声通信
システムの動作、通信手順の一例を示す図である。
【図4】 同実施の形態の音声通信端末、及び音声通信
システムの動作、通信手順の一例を示す図である。
【図5】 同実施の形態の音声通信端末、及び音声通信
システムの動作、通信手順の一例を示す図である。
【図6】 同実施の形態の音声通信端末、及び音声通信
システムの動作、通信手順の一例を示す図である。
【符号の説明】
1、1a、1b 音声通信端末 11 制御部 12 音声認識部 13 音声合成部 14 音声合成パラメータ記憶部 15 入力操作部 16 表示部 17 通信アンテナ 18 無線部 20 通信網 21a、21b 基地局 22 交換機 23 サーバ

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 通話相手の端末と音声信号をリアルタイ
    ムに送受信する音声通信端末であって、 入力された音声信号を順次テキストデータ化されたディ
    ジタル信号列へ変換する音声認識手段と、 前記音声認識手段が出力するディジタル信号列を、該デ
    ィジタル信号列をリアルタイムに通信可能な通信網に対
    して順次送信する通信手段とを備えたことを特徴とする
    音声通信端末。
  2. 【請求項2】 前記音声認識手段は、 入力された音声信号をテキストデータ化されたディジタ
    ル信号列へ変換する際に、音声信号から抽出された音声
    パラメータを出力し、 前記通信手段は、 前記ディジタル信号列とともに該音声パラメータを送信
    することを特徴とする請求項1に記載の音声通信端末。
  3. 【請求項3】 通話相手の端末と音声信号をリアルタイ
    ムに送受信する音声通信端末であって、 ディジタル信号列をリアルタイムに通信可能な通信網か
    ら、テキストデータで表されたディジタル信号列を順次
    受信する通信手段と、 前記ディジタル信号列を順次音声信号へ変換する音声合
    成手段とを備えたことを特徴とする音声通信端末。
  4. 【請求項4】 ディジタル信号列で表されたテキストデ
    ータを、音声信号へ変換するための音声合成パラメータ
    を記憶するパラメータ記憶手段を備え、 前記音声合成手段は、 前記パラメータ記憶手段に記憶された音声合成パラメー
    タを用いて、ディジタル信号列で表されたテキストデー
    タを音声信号へ変換することを特徴とする請求項3に記
    載の音声通信端末。
  5. 【請求項5】 前記パラメータ記憶手段には、 前記音声合成パラメータが予め記憶され、 前記音声合成手段は、 着信時に通知される発信元の音声通信端末の識別番号に
    基づいて、前記パラメータ記憶手段から対応する音声合
    成パラメータを抽出し、該音声合成パラメータを用いて
    ディジタル信号列で表されたテキストデータを音声信号
    へ変換することを特徴とする請求項4に記載の音声通信
    端末。
  6. 【請求項6】 前記パラメータ記憶手段には、 前記通信網を介して受信した音声合成パラメータが一時
    記憶され、 前記音声合成手段は、 前記パラメータ記憶手段に記憶された音声合成パラメー
    タを用いて、ディジタル信号列で表されたテキストデー
    タを音声信号へ変換することを特徴とする請求項4に記
    載の音声通信端末。
  7. 【請求項7】 前記ディジタル信号列を受信した際、前
    記音声合成手段を作動してディジタル信号列で表された
    テキストデータを音声信号へ変換して表示するか、その
    ままテキストデータで表示するかの選択手段を備えたこ
    とを特徴とする請求項3から請求項6のいずれかに記載
    の音声通信端末。
  8. 【請求項8】 ディジタル信号列を送受信可能な音声通
    信端末と通信網とからなる音声通信システムにおいて、 前記通信網に、音声合成に利用する音声合成パラメータ
    を前記音声通信端末へ送信するためのサーバを備えたこ
    とを特徴とする音声通信システム。
  9. 【請求項9】 前記サーバは、 前記通信網に接続された発信元の音声通信端末の識別番
    号に関連づけられた音声合成パラメータを、着信元の音
    声通信端末へ送信することを特徴とする請求項8に記載
    の音声通信システム。
  10. 【請求項10】 前記サーバは、 前記通信網に接続された発信元の音声通信端末から指定
    された音声合成パラメータを、着信元の音声通信端末へ
    送信することを特徴とする請求項8に記載の音声通信シ
    ステム。
  11. 【請求項11】 ディジタル信号列を送受信可能な音声
    通信端末と通信網とからなる音声通信システムにおい
    て、 前記通信網は、 接続された一方の前記音声通信端末から送信された音声
    合成パラメータを、接続された他方の前記音声通信端末
    へ中継することを特徴とする音声通信システム。
JP2001234681A 2001-08-02 2001-08-02 音声通信端末、及び音声通信システム Pending JP2003046607A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001234681A JP2003046607A (ja) 2001-08-02 2001-08-02 音声通信端末、及び音声通信システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001234681A JP2003046607A (ja) 2001-08-02 2001-08-02 音声通信端末、及び音声通信システム

Publications (1)

Publication Number Publication Date
JP2003046607A true JP2003046607A (ja) 2003-02-14

Family

ID=19066244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001234681A Pending JP2003046607A (ja) 2001-08-02 2001-08-02 音声通信端末、及び音声通信システム

Country Status (1)

Country Link
JP (1) JP2003046607A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005101796A1 (ja) * 2004-04-09 2005-10-27 Sharp Kabushiki Kaisha 情報通信端末、通信システム、情報通信端末プログラム、および記録媒体
JP2009239865A (ja) * 2008-03-28 2009-10-15 Fujitsu Telecom Networks Ltd 緊急通報システム
JP2012147284A (ja) * 2011-01-13 2012-08-02 Japan Radio Co Ltd 音声通信装置
JP2013098770A (ja) * 2011-11-01 2013-05-20 Ntt Docomo Inc ユーザ端末及び無線通信システム並びに通信方法
JP2014022938A (ja) * 2012-07-18 2014-02-03 Ntt Communications Corp 通信システム、端末、プログラムおよび通信方法
WO2019031710A1 (ko) * 2017-08-07 2019-02-14 시스템베이스 주식회사 저대역폭 무선 통신에 기반하는 음성처리 방법 및 그 장치
JP2020136784A (ja) * 2019-02-14 2020-08-31 株式会社ナカヨ インターカムシステム、インターカム端末、およびインターカム通話方法
CN113035226A (zh) * 2019-12-24 2021-06-25 中兴通讯股份有限公司 语音通话方法、通信终端和计算机可读介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005101796A1 (ja) * 2004-04-09 2005-10-27 Sharp Kabushiki Kaisha 情報通信端末、通信システム、情報通信端末プログラム、および記録媒体
JP2009239865A (ja) * 2008-03-28 2009-10-15 Fujitsu Telecom Networks Ltd 緊急通報システム
JP2012147284A (ja) * 2011-01-13 2012-08-02 Japan Radio Co Ltd 音声通信装置
JP2013098770A (ja) * 2011-11-01 2013-05-20 Ntt Docomo Inc ユーザ端末及び無線通信システム並びに通信方法
JP2014022938A (ja) * 2012-07-18 2014-02-03 Ntt Communications Corp 通信システム、端末、プログラムおよび通信方法
WO2019031710A1 (ko) * 2017-08-07 2019-02-14 시스템베이스 주식회사 저대역폭 무선 통신에 기반하는 음성처리 방법 및 그 장치
JP2020136784A (ja) * 2019-02-14 2020-08-31 株式会社ナカヨ インターカムシステム、インターカム端末、およびインターカム通話方法
JP7153841B2 (ja) 2019-02-14 2022-10-17 株式会社ナカヨ インターカムシステム、インターカム端末、およびインターカム通話方法
CN113035226A (zh) * 2019-12-24 2021-06-25 中兴通讯股份有限公司 语音通话方法、通信终端和计算机可读介质
CN113035226B (zh) * 2019-12-24 2024-04-23 中兴通讯股份有限公司 语音通话方法、通信终端和计算机可读介质

Similar Documents

Publication Publication Date Title
EP0933917B1 (en) Cellular phone with voice-programmed ringing melody
JP3879323B2 (ja) 電話端末装置
EP1255243A1 (en) Portable telephone and music reproducing method
GB2367723A (en) Identifying incoming mobile phone call
JP2003046607A (ja) 音声通信端末、及び音声通信システム
KR20020065645A (ko) 휴대 전화
EP1267323B1 (en) Portable telephone
JP3907935B2 (ja) 電子辞書機能を備えた携帯端末装置
JP2002156982A (ja) 携帯端末、携帯電話端末、携帯端末システム、音楽情報配信システム及び楽音データ配信方法
KR100468987B1 (ko) 휴대 단말 장치와 그의 효과 부여 방법 및 기록 매체
JP4100088B2 (ja) 通信端末、着信通知方法およびプログラム
JP2002111804A (ja) 楽音入力用鍵盤を備えた携帯電話機及び携帯電話システム
JP2003188948A (ja) 携帯端末装置
JP3945351B2 (ja) 携帯端末装置
JP2004271620A (ja) 携帯端末
JP4345603B2 (ja) 電話端末装置
JP3578132B2 (ja) 携帯端末装置
JP3885989B2 (ja) 音声補完方法及び音声補完装置ならびに電話端末装置
JP2002261873A (ja) 通信装置及び記憶媒体
JP2000216875A (ja) 電話装置と音声応答方法
KR20050121130A (ko) 음성 합성을 이용한 음성 메시지 전송 기능을 가지는무선통신 단말기 및 그 방법
JP2002330194A (ja) 電話装置、音声合成システム、音素情報登録装置、音素情報登録・音声合成装置
JP2000078246A (ja) 無線電話装置
JP2003099081A (ja) 音声送受信装置
JP2001007937A (ja) 文字列音声変換装置及び文字列音声変換方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090526

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091006