JPH10240283A - 音声処理装置及び電話装置 - Google Patents

音声処理装置及び電話装置

Info

Publication number
JPH10240283A
JPH10240283A JP6203497A JP6203497A JPH10240283A JP H10240283 A JPH10240283 A JP H10240283A JP 6203497 A JP6203497 A JP 6203497A JP 6203497 A JP6203497 A JP 6203497A JP H10240283 A JPH10240283 A JP H10240283A
Authority
JP
Japan
Prior art keywords
voice
unit
speech
original data
synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6203497A
Other languages
English (en)
Inventor
Ken Nakaoka
謙 中岡
Hiroshi Nakajima
洋 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP6203497A priority Critical patent/JPH10240283A/ja
Publication of JPH10240283A publication Critical patent/JPH10240283A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 送話者の周囲雑音を取り除くことにより、ク
リアな音声による品質のよい通話を行なうことができる
とともに、公衆の場において携帯電話等を使用しても迷
惑とならない音声処理装置等の電話装置を提供する。 【解決手段】 音声認識部102においては、音声認識
を行ない送話者の音声と周囲雑音とを含む音声信号から
周囲雑音を除去した音声合成用元データを出力する。ま
た、音声合成部103は、該音声合成用元データから可
聴合成音声を出力する。また、音声認識部102の代わ
りに、人間の口唇の形状から音声認識を行なう口唇形状
認識部を設ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声処理装置に関
するものであり、特に、送話者の音声とともに入力され
た周囲雑音を除去する機能を備えた電話装置に関するも
のである。
【0002】
【従来の技術】従来より電話装置は広く使用されている
が、送話者の周囲の雑音が音声とともに聞こえると、受
話者にとって送話者の音声が聞き取りにくい。この問題
を解決しようとするものとして、特開平1−10562
6号公報、特開平1−232864号公報、特開平2−
5675号公報、特開昭63−263865号公報に記
載の技術が挙げられる。
【0003】ここで、上記特開平1−105626号公
報には、送話者の音声信号の有無を検出する手段を設
け、無信号時には送信系音声信号処理部に音声信号をミ
ュートする回路を設けることにより、送話者が無音の場
合に送信される周囲雑音を軽減する点が開示されてい
る。また、上記特開平1−232864号公報には、送
信側の周囲雑音レベルの変化に応じて、送話信号を増幅
する可変利得増幅器の利得と受話信号を増幅する可変利
得増幅器の利得とを制御することにより、周囲雑音が大
きい場合でも受話音声を十分に聞き取れるようにする点
が開示されている。
【0004】また、特開平2−005675号公報に
は、送話者の音声の通過周波数帯数を制限し、上記音声
の特徴を抽出して登録し新たに音声を生成する場合、上
記音声における通過帯域のゲインを補正して出力するこ
とにより、周囲雑音を軽減する点が開示されている。ま
た、特開昭63−263865号公報には、送信器の周
囲雑音を拾うマイクと、上記マイクから入力した周囲雑
音信号を送信器からの周囲雑音信号と等価な信号にする
信号処理部を、上記送信器より入力した信号から信号処
理部より入力した周囲雑音信号を引算する演算部を設け
ることにより、周囲雑音を軽減する点が開示されてい
る。
【0005】
【発明が解決しようとする課題】しかし、上記公報に記
載の従来技術は、送信側に入力される周囲雑音の軽減、
もしくは送受話信号の増幅による受話音声の聞取り向上
を図ったものであり、周囲雑音の完全な除去には至って
いないという問題があった。また、携帯端末を公衆の場
において使用すると通話者の声が他人に迷惑となるとい
う問題がある。そこで、本発明は、送話者の周囲雑音を
取り除くことにより、クリアな音声による品質のよい通
話を行なうことができるとともに、公衆の場において携
帯電話等を使用しても迷惑とならない音声処理装置等の
電話装置を提供することを目的とするものである。
【0006】
【課題を解決するための手段】本発明は上記問題点を解
決するために創作されたものであって、第1には、音声
信号を処理する音声処理装置であって、送話者の音声と
周囲雑音とを含む音声信号の音声認識を行なうことによ
り、該音声信号から周囲雑音の成分が除去された音声合
成用元データを出力する音声認識部と、該音声認識部か
ら出力された音声合成用元データから可聴合成音声に変
換して出力する音声合成部と、上記音声合成部から出力
された可聴合成音声の音声信号を受信側に送信する送信
部とを有することを特徴とする。この第1の構成の音声
処理装置においては、音声認識部が、送話者の音声と周
囲雑音とを含む音声信号の音声認識を行なうことによ
り、該音声信号から周囲雑音の成分が除去された音声合
成用元データを出力する。また、音声合成部が、該音声
認識部から出力された音声合成用元データから可聴合成
音声に変換して出力する。そして、送信部が、可聴合成
音声の音声信号を受信側に送信する。よって、周囲雑音
の除去された音声の信号を出力することができ、クリア
な音声による通話を行なうことができる。
【0007】また、第2には、音声信号を処理する音声
処理装置であって、送話者の口唇形状の形状認識を行な
うことにより、音声合成用元データを出力する口唇形状
認識部と、該口唇形状認識部から出力された音声合成用
元データから可聴合成音声に変換して出力する音声合成
部と、上記音声合成部から出力された可聴合成音声の音
声信号を受信側に送信する送信部とを有することを特徴
とする。この第2の構成の音声処理装置においては、口
唇形状認識部が、送話者の口唇形状の形状認識を行なう
ことにより音声合成用元データを出力する。また、音声
合成部が、該口唇形状認識部から出力された音声合成用
元データから可聴合成音声に変換して出力する。そし
て、送信部が、可聴合成音声の音声信号を受信側に送信
する。よって、口唇形状から音声を得るので周囲雑音は
含まれず、クリアな音声による通話を行なうことができ
る。特に、口唇の形状から可聴合成音声が出力されるの
で、送話者は声に出して会話をする必要がなく、口唇を
動かすだけで通話を行なうことができる。よって、この
音声処理装置を携帯電話装置として公衆の場で使用して
も迷惑となることがない。
【0008】また、第3には、音声信号を処理する音声
処理装置であって、送信側から送信された音声信号であ
って、送話者の音声と周囲雑音とを含む音声信号を受信
する受信部と、該受信部で受信された音声信号の音声認
識を行なうことにより、該音声信号から周囲雑音の成分
が除去された音声合成用元データを出力する音声認識部
と、該音声認識部から出力された音声合成用元データか
ら可聴合成音声に変換して出力する音声合成部とを有す
ることを特徴とする。この第3の構成の音声処理装置に
おいては、受信部が送信側から送信された音声信号であ
って、送話者の音声と周囲雑音とを含む音声信号を受信
する。そして、音声認識部が、受信された音声信号の音
声認識を行なうことにより、該音声信号から周囲雑音の
成分が除去された音声合成用元データを出力する。ま
た、音声合成部が、該音声認識部から出力された音声合
成用元データから可聴合成音声に変換して出力する。よ
って、受信部で受信された音声信号から周囲雑音を除去
することができ、電話装置等の受信器に利用してクリア
な音声による通話を行なうことができる。
【0009】また、第4には、音声信号を処理する音声
処理装置であって、送話者の音声と周囲雑音とを含む音
声信号の音声認識を行なうことにより、該音声信号から
周囲雑音の成分が除去された音声合成用元データを出力
する音声認識部と、該音声認識部から出力された音声合
成用元データから可聴合成音声に変換して出力する音声
合成部と、上記音声合成部から出力された可聴合成音声
の音声信号を符号化する符号化部と、該符号化部で符号
化された音声信号を受信側に送信する送信部とを有する
ことを特徴とする。この第4の構成の音声処理装置にお
いては、音声認識部が、送話者の音声と周囲雑音とを含
む音声信号の音声認識を行なうことにより、該音声信号
から周囲雑音の成分が除去された音声合成用元データを
出力する。また、音声合成部が、該音声認識部から出力
された音声合成用元データから可聴合成音声に変換して
出力する。そして、該可聴合成音声が符号化部で符号化
され、この符号化された音声信号が送信部により送信さ
れる。よって、該音声処理装置をデジタル電話等の送信
器として利用することによりクリアな音声による通話を
行なうことができる。
【0010】また、第5には、音声信号を処理する音声
処理装置であって、送話者の口唇形状の形状認識を行な
うことにより、音声合成用元データを出力する口唇形状
認識部と、該口唇形状認識部から出力された音声合成用
元データから可聴合成音声に変換して出力する音声合成
部と、上記音声合成部から出力された可聴合成音声の音
声信号を符号化する符号化部と、該符号化部で符号化さ
れた音声信号を受信側に送信する送信部とを有すること
を特徴とする。この第5の構成の音声処理装置において
は、口唇形状認識部が、送話者の口唇形状の形状認識を
行なうことにより音声合成用元データを出力する。ま
た、音声合成部が、該口唇形状認識部から出力された音
声合成用元データから可聴合成音声に変換して出力す
る。そして、該可聴合成音声が符号化部で符号化され、
この符号化された音声信号が送信部により送信される。
よって、該音声処理装置をデジタル電話等の送信器とし
て利用することによりクリアな音声による通話を行なう
ことができる。
【0011】また、第6には、音声信号を処理する音声
処理装置であって、送信側から送信された符号データと
しての音声信号であって、送話者の音声と周囲雑音とを
含む音声信号を受信する受信部と、該受信部で受信され
た音声信号の復号化を行なう復号化部と、該復号化部で
復号化された音声信号の音声認識を行なうことにより、
該音声信号から周囲雑音の成分が除去された音声合成用
元データを出力する音声認識部と、該音声認識部から出
力された音声合成用元データから可聴合成音声に変換し
て出力する音声合成部とを有することを特徴とする。こ
の第6の構成の音声処理装置においては、受信部が送信
側から送信された符号データとしての音声信号であっ
て、送話者の音声と周囲雑音とを含む音声信号を受信す
る。そして、復号化部が該音声信号の復号化を行なう。
次に、音声認識部が、復号化された音声信号の音声認識
を行なうことにより、該音声信号から周囲雑音の成分が
除去された音声合成用元データを出力する。また、音声
合成部が、該音声認識部から出力された音声合成用元デ
ータから可聴合成音声に変換して出力する。よって、符
号データとしての音声信号が受信部で受信され、該音声
信号が復号化部で復号化されて音声認識部に出力される
ので、該音声処理装置をデジタル電話等の受信器として
利用することによりクリアな音声による通話を行なうこ
とができる。
【0012】また、第7には、音声信号を処理する音声
処理装置であって、送話者の音声と周囲雑音とを含む音
声信号の音声認識を行なうことにより、該音声信号から
周囲雑音の成分が除去された音声合成用元データを出力
する音声認識部と、該音声認識部から出力された音声合
成用データを受信側に送信する送信部とを有することを
特徴とする。この第7の構成の音声処理装置において
は、音声認識部が、送話者の音声と周囲雑音とを含む音
声信号の音声認識を行なうことにより、該音声信号から
周囲雑音の成分が除去された音声合成用元データを出力
し、送信部がこの音声合成用元データを送信する。よっ
て、受信側でこの音声合成用元データを合成音声に変換
することによりクリアな音声による通話を行なうことが
できる。
【0013】また、第8には、音声信号を処理する音声
処理装置であって、送信側から送信された音声合成用元
データであって、送話者の音声と周囲雑音とを含む音声
信号の音声認識を行なうことにより、該音声信号から周
囲雑音の成分が除去された音声合成用元データを受信す
る受信部と、該受信部で受信された音声合成用元データ
から可聴合成音声に変換して出力する音声合成部とを有
することを特徴とする。この第8の構成の音声処理装置
においては、周囲雑音の成分が除去された音声合成用元
データが受信部で受信され、これが音声合成部により可
聴合成音声に変換される。よって、クリアな音声による
通話を行なうことができる。
【0014】また、第9には、音声信号を処理する音声
処理装置であって、送信側から送信された音声合成用元
データであって、送話者の口唇形状の形状認識を行なう
ことにより得られた音声合成用元データを受信する受信
部と、該受信部で受信された音声合成用元データから可
聴合成音声に変換して出力する音声合成部とを有するこ
とを特徴とする。この第9の構成の音声処理装置におい
ては、送話者の口唇形状の形状認識を行なうことにより
得られた音声合成用元データが受信部で受信され、これ
が音声合成部により可聴合成音声に変換される。よっ
て、クリアな音声による通話を行なうことができる。ま
た、第10には、音声信号を処理する電話装置であっ
て、上記第1から第9までのいずれかに記載の音声処理
装置を有することを特徴とする。
【0015】
【発明の実施の形態】本発明の実施の形態としての実施
例を図面を利用して説明する。本発明の第1実施例に基
づく音声処理装置及び電話装置としての送信器101
は、図1に示されるように、音声認識部102と、音声
合成部103と、送信部104とを有している。
【0016】ここで、上記音声認識部102は、送話者
の音声と周囲雑音とを含む音の音声信号の音声認識を行
なうことにより周囲雑音が除去された音声合成用元デー
タを出力するものである。この音声合成用元データは、
デジタル的な符号データである。また、音声合成部10
3は、音声合成用元データから人間が聞き取ることがで
きる可聴合成音声としての合成音声を出力するものであ
る。この音声認識部102と音声合成部103の詳しい
構成は後述する。また、上記送信部104は、音声合成
部103から出力された合成音声を外部に送信するもの
であり、送信機やアンテナ等により構成される。
【0017】ここで、上記音声認識部102の構成を示
すと、図9に示すように構成される。つまり、音声認識
部102は、マイク10と、A/D変換部11と、メモ
リ部12と、制御部14と、データ出力部15とを有し
ている。ここで、マイク10は送話者の音声や周囲雑音
を含む音声を集音し電気信号としての自然音声信号に変
換するものである。また、A/D変換部11は、アナロ
グ信号としての自然音声信号をデジタル信号に変換す
る。また、メモリ部12は、各種プログラムやデータを
格納するものであり、例えば、入力された自然音声信号
等から送話者等の音声信号を抽出するためのプログラム
や音声合成用元データを出力するためのプログラムが格
納されている。また、メモリ部12はデータベース13
を有し、このデータベース13には、特に、抽出された
送話者等の音声信号に対応する音声合成用元データが格
納されている。また、制御部14は、音声認識部102
の各部の動作を制御するためのものであり、データ出力
部15は、A/D変換部11からの自然音声信号より送
話者等の音声信号を抽出するとともに、その音声信号に
応じた音声合成用元データを出力するものである。
【0018】また、上記音声合成部103の構成を示す
と、図10に示すように構成される。つまり、入力部2
0と、メモリ部21と、データ出力部23と、D/A変
換部24と、制御部25とを有している。ここで、上記
入力部20は、音声認識部102からの音声合成用元デ
ータを入力するものであり、入力部20に入力された音
声合成用元データはデータ出力部23に送られる。ま
た、メモリ部21は、各種プログラムやデータを格納す
るものであり、例えば、入力された音声合成用元データ
から合成音声信号を出力するためのプログラムが格納さ
れている。また、メモリ部21はデータベース22を有
し、このデータベース22には、特に、合成音声信号が
格納されている。この合成音声信号は機械的に生成した
データである。また、制御部25は、音声合成部103
の各部の動作を制御するためのものであり、データ出力
部23は、入力部20からの音声合成用元データより合
成音声信号を出力するものである。また、D/A変換部
24は、デジタル信号としての合成音声信号をアナログ
信号に変換する。つまり、この送信器101は、アナロ
グ電話の送信器に音声認識部102と音声合成部103
とを設けた構成となっている。
【0019】上記構成の送信器101の動作について説
明する。送話者の音声や周囲雑音を含む音声が音声認識
部102のマイク10に入力されると、この音声につい
ての自然音声信号はA/D変換部11において変換さ
れ、データ出力部15に送られる。データ出力部15
は、A/D変換部11からの自然音声信号より周囲雑音
を除去して送話者等の音声信号を抽出するとともに、そ
の音声信号に応じた音声合成用元データをデータベース
13より出力する。なお、送話者以外の他の者の音声も
音声合成用元データに変換されることになる。
【0020】次に、音声認識部102により出力された
音声合成用元データは、音声合成部103の入力部20
に入力されると、データ出力部23に送られ、データ出
力部23は合成音声信号をデータベース22より出力す
る。この合成音声信号はD/A変換部24においてアナ
ログ信号に変換されて出力される。こうして出力された
合成音声信号は、送信部104により外部に送信され
る。
【0021】以上のように、本実施例の送信器101に
おいては、音声認識部102において周囲雑音が除去さ
れ、音声合成部103において合成音声が出力されるの
で、アナログ電話の送信器に周囲雑音除去機能を持たせ
て、周囲雑音を除去した音声信号を送信することがで
き、受信側においても、送話者の音声をクリアに聞くこ
とができる。
【0022】次に、第2実施例について説明する。この
第2実施例は、上記第1実施例が音声を認識することに
よる周囲雑音除去の機能をアナログ電話に持たせたもの
であるのに対して、該機能をデジタル電話に持たせたも
のである。この第2実施例における電話システムS1
は、図2に示すように、音声処理装置及び電話装置とし
ての送信器201と、同じく音声処理装置及び電話装置
としての受信器202とを有している。
【0023】まず、上記送信器201について説明する
と、上記送信器201は、音声認識部203と、音声合
成部204と、音声符号化部205と、送信部206と
を有している。ここで、上記音声認識部203は、上記
第1実施例における音声認識部102と同様に、図9に
示すように構成されている。また、上記音声合成部20
4は、上記第1実施例における音声合成部103と同様
に、図10に示すように構成されている。また、上記音
声符号化部205は、音声合成部204において出力さ
れた合成音声信号を符号化するものである。また、送信
部206は、音声符号化部205で符号化された合成音
声信号を伝送路に送出するものであり、送信機やアンテ
ナ等により構成される。つまり、この送信器201は、
デジタル電話の送信器に音声認識部203と音声合成部
204とを設けた構成となっている。
【0024】次に、受信器202について説明すると、
受信器202は、受信部207と、音声復号化部208
とを有している。上記受信部207は、外部から送信さ
れた送信信号を受信するものであり、具体的には、送信
部206から伝送路を介して送信されたデジタル信号と
しての合成音声信号がこの受信部207において受信さ
れる。この受信部207は具体的には、アンテナや受信
機等により構成される。また、音声復号化部208は、
符号データとしての合成音声信号を復号化して音声とす
るものである。なお、実際には、音声復号化部208に
は、該音声を出力するためのスピーカ等が設けられる。
【0025】上記構成の電話システムS1の動作につい
て説明する。送話者の音声や周囲雑音を含む音声が音声
認識部203に入力されると、音声認識部203では、
音声を認識して周囲雑音を除去した状態の音声合成用元
データが出力される。そしてこの音声合成用元データは
音声合成部204に入力され、この音声合成部204
は、音声合成用元データから人間が聞き取ることができ
る合成音声信号を出力する。そして、この合成音声信号
は音声符号化部205において符号化され、送信部20
6から伝送路に送出される。一方、受信器202におい
ては、送信信号としての合成音声信号が受信部207で
受信され、音声復号化部208で復号化されて音声とし
て出力される。
【0026】以上のように、本実施例の電話システムS
1においては、音声認識部203において周囲雑音が除
去され、音声合成部204において合成音声が出力され
るので、デジタル電話の送信器に周囲雑音除去機能を持
たせて、周囲雑音を除去した音声信号を送信することが
でき、受信側において、送話者の音声をクリアに聞くこ
とができる。
【0027】次に、第3実施例について説明する。この
第3実施例は、上記第1実施例が音声認識による周囲雑
音除去の機能を送信側に設けたものであるのに対して、
該機能を受信側に設けたものである。第3実施例におけ
る音声処理装置及び電話装置としての受信器301は、
受信部302と、音声認識部303と、音声合成部30
4とを有している。
【0028】ここで、上記受信部302は、伝送路を介
して送信された音声信号で、周囲雑音を含んだアナログ
信号としての音声信号を受信するものである。つまり、
この受信部302は通常のアナログ電話の受信部と同様
の構成である。この受信部302は具体的には、アンテ
ナや受信機等により構成される。また、上記音声認識部
303は、上記各実施例における音声認識部と同様に、
図9に示すように構成されている。また、上記音声合成
部304は、上記各実施例における音声認識部と同様
に、図10に示すように構成されている。つまり、この
受信器301は、アナログ電話の受信器に音声認識部3
03と音声合成部304とを設けた構成となっている。
【0029】上記構成の受信器301の動作について説
明する。送話者の音声や周囲雑音を含む音声の音声信号
が伝送路を介して受信部302で受信されると、この音
声信号は音声認識部303に入力される。音声認識部3
03では、周囲雑音を除去した状態の音声合成用元デー
タが出力される。そしてこの音声合成用元データは音声
合成部304に入力され、この音声合成部304におい
ては、音声合成用元データから人間が聞き取ることがで
きる合成音声信号が出力され、音声として出力される。
なお、実際には、音声合成部304には、該音声を出力
するためのスピーカ等が設けられる。
【0030】以上のように、本実施例の受信器301に
おいては、音声認識部303において周囲雑音が除去さ
れ、音声合成部304において合成音声が出力されるの
で、アナログ電話の受信器に周囲雑音除去機能を持たせ
て、周囲雑音を除去したクリアな音声を聞くことができ
る。
【0031】次に、第4実施例について説明する。この
第4実施例は、上記第2実施例が音声認識による周囲雑
音除去の機能をデジタル電話における送信側に持たせた
ものであるのに対して、該機能を受信側に持たせたもの
である。この第4実施例における電話システムS2は、
図4に示すように、音声処理装置及び電話装置としての
送信器401と、同じく音声処理装置及び電話装置とし
ての受信器402とを有している。
【0032】まず、上記送信器401について説明する
と、上記送信器401は、音声符号化部403と、送信
部404とを有している。ここで、上記音声符号化部4
03は、送話者の音声や周囲雑音を含む音声についての
音声信号を符号化するものである。また、送信部404
は、音声符号化部403で符号化された音声信号を伝送
路に送出するものであり、送信機やアンテナ等により構
成される。
【0033】次に、受信器402について説明すると、
受信器402は、受信部405と、音声復号化部406
と、音声認識部407と、音声合成部408とを有して
いる。上記受信部405は、外部から送信された送信デ
ータを受信するものであり、具体的には、送信部404
から伝送路を介して送信されたデジタル信号としての音
声信号がこの受信部405において受信される。また、
音声復号化部406は、符号データとしての合成音声信
号を復号化して音声とするものである。また、音声認識
部407は、上記各実施例における音声認識部と同様
に、図9に示すように構成されている。また、上記音声
合成部408は、上記各実施例における音声認識部と同
様に、図10に示すように構成されている。つまり、こ
の受信器402は、デジタル電話の受信器に音声認識部
407と音声合成部408とを設けた構成となってい
る。
【0034】上記構成の電話システムS2の動作につい
て説明する。送話者の音声や周囲雑音を含む音声が音声
符号化部403に入力されると、この音声についての音
声信号は音声符号化部403において符号化され、送信
部404から伝送路に送出される。
【0035】一方、受信器402においては、送信信号
としての音声信号が受信部405で受信され、音声復号
化部406において復号される。復号された音声信号は
音声認識部407に送られ、音声認識部407では、こ
の復号された音声信号から周囲雑音を除去した状態の音
声合成用元データが出力される。そしてこの音声合成用
元データは音声合成部408に入力され、この音声合成
部408においては、音声合成用元データから人間が聞
き取ることができる合成音声信号が出力され、音声とし
て出力される。なお、実際には、音声合成部408に
は、該音声を出力するためのスピーカ等が設けられる。
【0036】以上のように、本実施例の電話システムS
2においては、音声認識部407において周囲雑音が除
去され、音声合成部408において合成音声が出力され
るので、デジタル電話の受信器に周囲雑音除去機能を持
たせて、周囲雑音を除去した音声を聞くことができる。
【0037】次に、第5実施例について説明する。この
第5実施例は、上記第1実施例が音声認識による周囲雑
音除去の機能を持たせたものであるのに対して、口唇形
状を認識することによる周囲雑音除去機能を持たせたも
のである。この第5実施例における音声処理装置及び電
話装置としての送信器501は、図5に示すように、口
唇形状認識部502と、音声合成部503と、送信部5
04とを有している。
【0038】ここで、上記口唇形状認識部502は、人
間の口唇の形状に基づき音声合成用元データを出力する
ものである。この口唇形状認識部502の詳しい構成は
後述する。また、上記音声合成部503は、上記各実施
例における音声合成部と同様に、図10に示すように構
成されている。また、送信部504は、音声合成部50
3から出力された合成音声信号を伝送路に送出するもの
であり、送信機やアンテナ等により構成される。つま
り、この送信器501は、アナログ電話の送信器に口唇
形状認識部502と音声合成部503とを設けた構成と
なっている。
【0039】ここで、上記口唇形状認識部502の構成
を示すと、図11に示すように構成される。つまり、口
唇形状認識部502は、入力部30と、メモリ部31
と、データ出力部33と、制御部34とを有している。
ここで、入力部30は送話者の口唇付近の形状を撮影し
て画像データを出力するものである。また、メモリ部3
1は、各種プログラムやデータを格納するものであり、
例えば、入力された画像データから音声合成用元データ
の出力に必要な画像データを抽出するためのプログラム
や入力された口唇の画像データから音声合成用元データ
を出力するためのプログラムが格納されている。また、
メモリ部31はデータベース32を有し、このデータベ
ース32には、特に、抽出された画像データに対応する
音声合成用元データが格納されている。また、制御部3
4は、口唇形状認識部502の各部の動作を制御するた
めのものであり、データ出力部33は、入力部30から
の画像データから音声合成用元データの出力に必要な画
像データを抽出するとともに、その画像データに応じた
音声合成用元データを出力するものである。
【0040】上記構成の送話器501の動作について説
明する。送話者の口唇の画像が入力部30に入力される
と、その画像データはデータ出力部33に送られる。デ
ータ出力部33においては、入力部30からの画像デー
タから音声合成用元データの出力に必要な画像データを
抽出するとともに、その画像データに応じた音声合成用
元データをデータベース32より出力する。
【0041】次に、口唇形状認識部502から出力され
た音声合成用元データは、音声合成部503の入力部2
0に入力されると、データ出力部23に送られ、データ
出力部23からは合成音声信号が出力される。この合成
音声信号はD/A変換部24においてアナログ信号に変
換されて出力される。こうして出力された合成音声信号
は、送信部504により外部に送信される。
【0042】以上のように、本実施例の送信器501に
おいては、口唇形状から合成音声が出力されるので、周
囲雑音の含まれない音声信号を送信することができ、受
信側においても、送話者の音声をクリアに聞くことがで
きる。特に、口唇の形状から音声が出力されるので、送
話者は声に出して会話をする必要がなく、口唇を動かす
だけで通話を行なうことができる。よって、公衆の場に
おける携帯端末の使用際して問題となる通話者の騒音問
題も解消することができる。
【0043】次に、第6実施例について説明する。この
第6実施例は、上記第5実施例が口唇形状を認識するこ
とによる周囲雑音除去の機能をアナログ電話に持たせた
ものであるのに対して、該機能をデジタル電話に持たせ
たものである。この第6実施例における電話システムS
3は、図6に示すように、音声処理装置及び電話装置と
しての送信器601と、同じく音声処理装置及び電話装
置としての受信器602とを有している。
【0044】まず、上記送信器601について説明する
と、上記送信器601は、口唇形状認識部603と、音
声合成部604と、音声符号化部605と、送信部60
6とを有している。ここで、上記口唇形状認識部603
は、上記第5実施例における口唇形状認識部502と同
様に、図11に示すように構成されている。また、上記
音声合成部604は、上記各実施例における音声合成部
と同様に、図10に示すように構成されている。また、
上記音声符号化部605は、音声合成部604により出
力された合成音声信号を符号化するものである。また、
送信部606は、音声符号化部605で符号化された合
成音声信号を伝送路に送出するものであり、送信機やア
ンテナ等により構成される。つまり、この送信器601
は、デジタル電話の送信器に口唇形状認識部603と音
声合成部604とを設けた構成となっている。
【0045】次に、受信器602について説明すると、
受信器602は、受信部607と音声復号化部608と
を有している。上記受信部607は、外部から送信され
た送信信号を受信するものであり、具体的には、送信部
606から伝送路を介して送信されたデジタル信号とし
ての合成音声信号がこの受信部607において受信され
る。また、音声復号化部608は、符号データとしての
合成音声信号を復号化して音声とするものである。つま
り、この受信器602は、上記第2実施例における受信
器202と同様の構成となっている。また、音声復号化
部608には、実際には、該音声を出力するためのスピ
ーカ等が設けられる。
【0046】上記構成の電話システムS3の動作につい
て説明する。送話者の口唇付近が画像が入力されると、
口唇形状認識部603から音声合成用元データが出力さ
れる。そしてこの音声合成用元データは音声合成部60
4に入力され、この音声合成部604は、音声合成用元
データから人間が聞き取ることができる合成音声信号を
出力する。そして、この合成音声信号は音声符号化部6
05において符号化され、送信部606から伝送路に送
出される。一方、受信器602においては、送信信号と
しての合成音声信号が受信部607で受信され、音声復
号化部608で復号化されて音声として出力される。
【0047】以上のように、本実施例の電話システムS
3においては、口唇形状から合成音声が出力されるの
で、周囲雑音の含まれない音声信号を送信することがで
き、受信側においても、送話者の音声をクリアに聞くこ
とができる。特に、声に出さなくても通話を行なうこと
ができる。
【0048】次に、第7実施例について説明する。この
第7実施例は、上記第1実施例から第4実施例が音声認
識部と音声合成部の両方が送信側又は受信側に設けられ
ているものであるのに対して、その一方を送信側に設
け、他方を受信側に設けたものである。この第7実施例
における電話システムS4は、図7に示すように、音声
処理装置及び電話装置としての送信器701と、同じく
音声処理装置及び電話装置としての受信器702とを有
している。
【0049】まず、上記送信器701について説明する
と、上記送信器701は、音声認識部703と、送信部
704とを有している。ここで、上記音声認識部703
は、上記各実施例における音声認識部と同様に、図9に
示すように構成されている。また、送信部704は、音
声認識部703から出力された音声合成用元データを伝
送路に送出するものであり、送信機やアンテナ等により
構成される。
【0050】次に、受信器702について説明すると、
受信器702は、受信部705と音声合成部706とを
有している。上記受信部705は、外部から送信された
送信信号を受信するものであり、具体的には、送信部7
04から伝送路を介して送信された合成音声用元データ
がこの受信部705において受信される。上記音声合成
部706は、上記各実施例における音声合成部と同様
に、図10に示すように構成されている。つまり、この
電話システムS4においては、送信器701は、アナロ
グ電話の送信器に音声認識部703を設けた構成で、受
信器702は、アナログ電話の受信器に音声合成部70
6を設けた構成となっている。
【0051】上記構成の電話システムS4の動作につい
て説明する。送話者の音声や周囲雑音を含む音声が音声
認識部703に入力されると、音声認識部703では、
音声を認識して周囲雑音を除去した状態の音声合成用元
データが出力される。そしてこの音声合成用元データは
送信部704から伝送路に送出される。
【0052】一方、受信器702においては、送信信号
としての音声合成用元データが受信部705で受信さ
れ、音声合成部706に入力され、この音声合成部70
6は、音声合成用元データから人間が聞き取ることがで
きる合成音声信号を出力する。なお、実際には、音声合
成部706には、該音声を出力するためのスピーカ等が
設けられる。
【0053】以上のように、本実施例の電話システムS
4においては、音声認識部703において周囲雑音が除
去され、音声合成部706において合成音声が出力され
るので、アナログ電話の送信器と受信機に周囲雑音除去
機能を持たせて、周囲雑音を除去した音声信号を送信す
ることができ、受信側において、送話者の音声をクリア
に聞くことができる。
【0054】次に、第8実施例について説明する。この
第8実施例は、上記第5実施例と第6実施例が、口唇形
状認識部と音声合成部の両方が送信側又は受信側に設け
られているものであるのに対して、その一方を送信側に
設け、他方を受信側に設けたものである。この第8実施
例における電話システムS5は、図8に示すように、音
声処理装置及び電話装置としての送信器801と、同じ
く音声処理装置及び電話装置としての受信器802とを
有している。
【0055】まず、上記送信器801について説明する
と、上記送信器801は、口唇形状認識部803と、送
信部804とを有している。ここで、上記口唇形状認識
部803は、上記各実施例における口唇形状認識部と同
様に、図11に示すように構成されている。また、送信
部804は、口唇形状認識部803から出力された音声
合成用元データを伝送路に送出するものであり、送信機
やアンテナ等により構成される。
【0056】次に、受信器802について説明すると、
受信器802は、受信部805と音声合成部806とを
有している。上記受信部805は、外部から送信された
送信信号を受信するものであり、具体的には、送信部8
04から伝送路を介して送信された合成音声用元データ
がこの受信部805において受信される。上記音声合成
部806は、上記各実施例における音声合成部と同様
に、図10に示すように構成されている。つまり、この
電話システムS5においては、送信器801は、アナロ
グ電話の送信器に口唇形状認識部803を設けた構成
で、受信器802は、アナログ電話の受信器に音声合成
部806を設けた構成となっている。
【0057】上記構成の電話システムS5の動作につい
て説明する。送話者の口唇の画像が入力されると、口唇
形状認識部803から音声合成用元データが出力され
る。そしてこの音声合成用元データは送信部804から
受信器802に送信される。受信器802では、該音声
合成用元データが受信部805で受信されると、音声合
成部806に入力され、この音声合成部806は、音声
合成用元データから人間が聞き取ることができる合成音
声信号を出力する。なお、実際には、音声合成部806
には、該音声を出力するためのスピーカ等が設けられ
る。
【0058】以上のように、本実施例の電話システムS
8においては、口唇形状から合成音声が出力されるの
で、周囲雑音の含まれない音声信号を送信することがで
き、受信側においても、送話者の音声をクリアに聞くこ
とができる。
【0059】なお、上記各実施例における送信部の送
信、受信部の受信及び両者間の送受信は無線通信でも有
線通信であってもよい。また、上記各実施例において、
音声合成部は機械的な合成音声を出力するものとして説
明したが、例えば、送話者の声のデータを登録してお
き、このデータに基づき合成音声を出力するようにして
もよい。
【0060】
【発明の効果】本発明に基づく音声処理装置、音声処理
システム及び電話装置によれば、送話者の周囲雑音を取
り除くことにより、クリアな音声による品質のよい通話
を行なうことができる。また、口唇形状により音声を出
力する場合には、声に出さずに通話を行なうことがで
き、この音声処理装置等を携帯電話装置として公衆の場
で使用しても迷惑となることがない。
【図面の簡単な説明】
【図1】本発明の第1実施例に基づく電話装置の構成を
示すブロック図である。
【図2】本発明の第2実施例に基づく電話システム及び
電話装置の構成を示すブロック図である。
【図3】本発明の第3実施例に基づく電話装置の構成を
示すブロック図である。
【図4】本発明の第4実施例に基づく電話システム及び
電話装置の構成を示すブロック図である。
【図5】本発明の第5実施例に基づく電話装置の構成を
示すブロック図である。
【図6】本発明の第6実施例に基づく電話システム及び
電話装置の構成を示すブロック図である。
【図7】本発明の第7実施例に基づく電話システム及び
電話装置の構成を示すブロック図である。
【図8】本発明の第8実施例に基づく電話システム及び
電話装置の構成を示すブロック図である。
【図9】音声認識部の構成を示すブロック図である。
【図10】音声合成部の構成を示すブロック図である。
【図11】口唇形状認識部の構成を示すブロック図であ
る。
【符号の説明】
S1、S2、S3、S4、S5 電話システム 10 マイク 101、201、401、501、601、701、8
01 送信器 102、203、303、407、703 音声認識部 103、204、304、408、503、604、7
06、806 音声合成部 104、206、404、504、606、704、8
04 送信部 11 A/D変換部 12、21、31 メモリ部 13、22、32 デ−タベ−ス 14、25、34 制御部 15、23、33 デ−タ出力部 20、30 入力部 202、301、402、602、702、802 受
信器 205、403、605 音声符号化部 207、302、405、607、705、805 受
信部 208、406、608 音声復号化部 24 D/A変換部 502、603、803 口唇形状認識部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を処理する音声処理装置であっ
    て、 送話者の音声と周囲雑音とを含む音声信号の音声認識を
    行なうことにより、該音声信号から周囲雑音の成分が除
    去された音声合成用元データを出力する音声認識部と、 該音声認識部から出力された音声合成用元データから可
    聴合成音声に変換して出力する音声合成部と、 上記音声合成部から出力された可聴合成音声の音声信号
    を受信側に送信する送信部とを有することを特徴とする
    音声処理装置。
  2. 【請求項2】 音声信号を処理する音声処理装置であっ
    て、 送話者の口唇形状の形状認識を行なうことにより、音声
    合成用元データを出力する口唇形状認識部と、 該口唇形状認識部から出力された音声合成用元データか
    ら可聴合成音声に変換して出力する音声合成部と、 上記音声合成部から出力された可聴合成音声の音声信号
    を受信側に送信する送信部とを有することを特徴とする
    音声処理装置。
  3. 【請求項3】 音声信号を処理する音声処理装置であっ
    て、 送信側から送信された音声信号であって、送話者の音声
    と周囲雑音とを含む音声信号を受信する受信部と、 該受信部で受信された音声信号の音声認識を行なうこと
    により、該音声信号から周囲雑音の成分が除去された音
    声合成用元データを出力する音声認識部と、 該音声認識部から出力された音声合成用元データから可
    聴合成音声に変換して出力する音声合成部とを有するこ
    とを特徴とする音声処理装置。
  4. 【請求項4】 音声信号を処理する音声処理装置であっ
    て、 送話者の音声と周囲雑音とを含む音声信号の音声認識を
    行なうことにより、該音声信号から周囲雑音の成分が除
    去された音声合成用元データを出力する音声認識部と、 該音声認識部から出力された音声合成用元データから可
    聴合成音声に変換して出力する音声合成部と、 上記音声合成部から出力された可聴合成音声の音声信号
    を符号化する符号化部と、 該符号化部で符号化された音声信号を受信側に送信する
    送信部とを有することを特徴とする音声処理装置。
  5. 【請求項5】 音声信号を処理する音声処理装置であっ
    て、 送話者の口唇形状の形状認識を行なうことにより、音声
    合成用元データを出力する口唇形状認識部と、 該口唇形状認識部から出力された音声合成用元データか
    ら可聴合成音声に変換して出力する音声合成部と、 上記音声合成部から出力された可聴合成音声の音声信号
    を符号化する符号化部と、 該符号化部で符号化された音声信号を受信側に送信する
    送信部とを有することを特徴とする音声処理装置。
  6. 【請求項6】 音声信号を処理する音声処理装置であっ
    て、 送信側から送信された符号データとしての音声信号であ
    って、送話者の音声と周囲雑音とを含む音声信号を受信
    する受信部と、 該受信部で受信された音声信号の復号化を行なう復号化
    部と、 該復号化部で復号化された音声信号の音声認識を行なう
    ことにより、該音声信号から周囲雑音の成分が除去され
    た音声合成用元データを出力する音声認識部と、 該音声認識部から出力された音声合成用元データから可
    聴合成音声に変換して出力する音声合成部とを有するこ
    とを特徴とする音声処理装置。
  7. 【請求項7】 音声信号を処理する音声処理装置であっ
    て、 送話者の音声と周囲雑音とを含む音声信号の音声認識を
    行なうことにより、該音声信号から周囲雑音の成分が除
    去された音声合成用元データを出力する音声認識部と、 該音声認識部から出力された音声合成用データを受信側
    に送信する送信部とを有することを特徴とする音声処理
    装置。
  8. 【請求項8】 音声信号を処理する音声処理装置であっ
    て、 送信側から送信された音声合成用元データであって、送
    話者の音声と周囲雑音とを含む音声信号の音声認識を行
    なうことにより、該音声信号から周囲雑音の成分が除去
    された音声合成用元データを受信する受信部と、 該受信部で受信された音声合成用元データから可聴合成
    音声に変換して出力する音声合成部とを有することを特
    徴とする音声処理装置。
  9. 【請求項9】 音声信号を処理する音声処理装置であっ
    て、 送信側から送信された音声合成用元データであって、送
    話者の口唇形状の形状認識を行なうことにより得られた
    音声合成用元データを受信する受信部と、 該受信部で受信された音声合成用元データから可聴合成
    音声に変換して出力する音声合成部とを有することを特
    徴とする音声処理装置。
  10. 【請求項10】 音声信号を処理する電話装置であっ
    て、 上記請求項1又は2又は3又は4又は5又は6又は7又
    は8又は9に記載の音声処理装置を有することを特徴と
    する電話装置。
JP6203497A 1997-02-27 1997-02-27 音声処理装置及び電話装置 Pending JPH10240283A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6203497A JPH10240283A (ja) 1997-02-27 1997-02-27 音声処理装置及び電話装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6203497A JPH10240283A (ja) 1997-02-27 1997-02-27 音声処理装置及び電話装置

Publications (1)

Publication Number Publication Date
JPH10240283A true JPH10240283A (ja) 1998-09-11

Family

ID=13188489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6203497A Pending JPH10240283A (ja) 1997-02-27 1997-02-27 音声処理装置及び電話装置

Country Status (1)

Country Link
JP (1) JPH10240283A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001056726A (ja) * 2000-01-01 2001-02-27 Sony Corp 情報処理装置
JP2002252682A (ja) * 2001-02-26 2002-09-06 Nippon Telegr & Teleph Corp <Ntt> 携帯電話機用入力方法、および携帯電話機
JP2003189000A (ja) * 2001-12-14 2003-07-04 Matsushita Electric Works Ltd 通話システム
JP2004015250A (ja) * 2002-06-05 2004-01-15 Nec Corp 携帯端末装置
JP2009251199A (ja) * 2008-04-04 2009-10-29 Oki Electric Ind Co Ltd 音声合成装置、方法及びプログラム
WO2012001730A1 (ja) * 2010-06-28 2012-01-05 三菱電機株式会社 音声認識装置
US9390725B2 (en) 2014-08-26 2016-07-12 ClearOne Inc. Systems and methods for noise reduction using speech recognition and speech synthesis

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001056726A (ja) * 2000-01-01 2001-02-27 Sony Corp 情報処理装置
JP2002252682A (ja) * 2001-02-26 2002-09-06 Nippon Telegr & Teleph Corp <Ntt> 携帯電話機用入力方法、および携帯電話機
JP2003189000A (ja) * 2001-12-14 2003-07-04 Matsushita Electric Works Ltd 通話システム
JP2004015250A (ja) * 2002-06-05 2004-01-15 Nec Corp 携帯端末装置
JP2009251199A (ja) * 2008-04-04 2009-10-29 Oki Electric Ind Co Ltd 音声合成装置、方法及びプログラム
WO2012001730A1 (ja) * 2010-06-28 2012-01-05 三菱電機株式会社 音声認識装置
US8990092B2 (en) 2010-06-28 2015-03-24 Mitsubishi Electric Corporation Voice recognition device
US9390725B2 (en) 2014-08-26 2016-07-12 ClearOne Inc. Systems and methods for noise reduction using speech recognition and speech synthesis

Similar Documents

Publication Publication Date Title
US6138040A (en) Method for suppressing speaker activation in a portable communication device operated in a speakerphone mode
US20080096515A1 (en) Mobile communication terminal with equalizer function
JP2002101156A (ja) 携帯電話機及び音声処理方法
KR20030006308A (ko) 이동통신 단말기의 음성 변조 장치 및 방법
EP1802082A1 (en) Information terminal
JPH05160773A (ja) 音声通信装置
JPH11298595A (ja) 通信装置
US6768914B1 (en) Full-duplex speakerphone with wireless microphone
JPH10240283A (ja) 音声処理装置及び電話装置
WO1998026525A1 (fr) Systeme de telephone radio portable et procede de commande de ce dernier
JP3075067B2 (ja) デジタル移動無線装置
WO2003103253A1 (ja) 送受話装置
KR970056594A (ko) 핸드프리 보청 전화기
JPH11194798A (ja) 音声認識電話機
JP2001285409A (ja) 電話機
JP3355585B2 (ja) エコーキャンセル方法
US5852774A (en) Sidetone level reduction circuit and method
KR101493459B1 (ko) 휴대용 단말기에서 에프엠 라디오의 음질 개선 장치 및 방법
JP2004343566A (ja) 移動電話端末及びプログラム
JP3838905B2 (ja) 携帯電話装置
JPH06326670A (ja) 音声通信装置
JP2974427B2 (ja) 音声通信システムとその音声通信装置
JP2000078246A (ja) 無線電話装置
JPH08167879A (ja) 音声付加雑音機能を有する送受信装置
KR20010091273A (ko) 배경음재생기능을 갖는 통신기기