JP2001350499A

JP2001350499A - 音声情報処理装置、通信装置、情報処理システム、音声情報処理方法、及び記憶媒体

Info

Publication number: JP2001350499A
Application number: JP2000168770A
Authority: JP
Inventors: 直人 ▲高▼橋; Naoto Takahashi
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2000-06-06
Filing date: 2000-06-06
Publication date: 2001-12-21

Abstract

(57)【要約】【課題】常に高音質の音声を提供できる構成とするこ
とで、常に高音質での通話が可能となる音声情報処理装
置を提供する。【解決手段】蓄積手段１０８は、第１の音声
（“あ”、“い”、…、“ん”の通常音声等の基本音
声）を学習等して予め当該音声の周波数特性を蓄積す
る。補正手段１０９，１１１は、第２の音声（ひそひそ
声等の音声）が入力された場合に、当該第２の音声の周
波数特性を、蓄積手段１０８の蓄積情報に基づき補正
（第２の音声の周波数特性が第１の音声の周波数特性に
近づくように補正する等）する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、例えば、携帯電話
や簡易携帯電話（パーソナル・ハンディフォン・システ
ム、以下、「ＰＨＳ」と言う）等に用いられる、音声情
報処理装置、通信装置、情報処理システム、音声情報処
理方法、及びそれを実施するための処理ステップをコン
ピュータが読出可能に格納した記憶媒体に関するもので
ある。

【０００２】

【従来の技術】近年では、端末装置の低価格化や通信料
金の値下げ競争に伴って、例えば、携帯電話やＰＨＳ等
の普及が飛躍的に伸びてきている。そして、その利用範
囲は場所をを選ばなくなってきている。

【０００３】

【発明が解決しようとする課題】しかしながら、上述の
ように、携帯電話やＰＨＳ等が多く利用されるようにな
るに従って、その使用マナーについては、悪化の傾向を
たどってきている。特に顕著なのが、例えば、会議中や
電車、或いはバスの中での突然の着信音や大声での通話
である。そこで、突然の着信音の対策として、携帯電話
やＰＨＳでの着信を、振動やランプで知らせるものが開
発されている。また、大声での通話の対策として、音声
の入力マイクのゲインを高く設定し、小声でも通話相手
に十分な音量で通話できるものが考案されている。

【０００４】しかしながら、大声での通話についての対
策は、単に、音声の入力マイクのゲインを高く設定し、
小声でも通話相手に十分な音量で通話できるように構成
されているに過ぎず、例えば、周囲が静寂な場所におい
て、通常通りの声で話そうとすると、通話相手には大声
で伝わってしまい、通話相手に通常の音量で伝わるよう
にするためには、小声で話す必要があった。この場合、
周囲が静寂な場所において小声で話すことになり、これ
はユーザにとって非常に抵抗がある。また、さらに小声
で話そうとすると、ひそひそ声（音声）となってしま
い、高音質で通話することは不可能となり、この結果、
通話相手が通話内容を理解できない場合もでてくる。

【０００５】そこで、本発明は、上記の欠点を除去する
ために成されたもので、常に高音質の音声を提供できる
構成とすることで、常に高音質での通話が可能となる、
音声情報処理装置、通信装置、情報処理システム、音声
情報処理方法、及びそれを実施するための処理ステップ
をコンピュータが読出可能に格納した記憶媒体を提供す
ることを目的とする。

【０００６】

【課題を解決するための手段】斯かる目的下において、
第１の発明は、入力された音声を処理して出力する音声
情報処理装置であって、第１の音声の周波数特性情報を
予め蓄積する蓄積手段と、上記蓄積手段へ蓄積された第
１の音声の周波数特性情報に基づいて、入力された第２
の音声の周波数特性を補正する補正手段とを備えること
を特徴とする。

【０００７】第２の発明は、上記第１の発明において、
上記第２の音声での音声入力を設定する設定手段を備
え、上記補正手段は、上記設定手段での設定に基づい
て、上記周波数特性の補正処理を行うことを特徴とす
る。

【０００８】第３の発明は、上記第１の発明において、
上記蓄積手段は、複数の上記第１の音声の周波数特性情
報を予め蓄積し、上記補正手段は、上記入力された第２
の音声に対応する第１の音声の周波数特性情報を上記蓄
積手段から取得し、当該周波数特性情報に基づいて、上
記第２の音声の周波数特性を補正することを特徴とす
る。

【０００９】第４の発明は、上記第１の発明において、
上記第１の音声での音声入力を設定する設定手段を備
え、上記蓄積手段は、上記設定手段での設定に基づい
て、入力された第１の音声の周波数特性情報を蓄積する
ことを特徴とする。

【００１０】第５の発明は、通話機能を有する通信装置
であって、請求項１〜４の何れかに記載の音声情報処理
装置の機能を有することを特徴とする。

【００１１】第６の発明は、上記第５の発明において、
携帯型であることを特徴とする。

【００１２】第７の発明は、複数の機器が互いに通信可
能に接続されてなる情報処理システムであって、上記複
数の機器のうち少なくとも１つの機器は、請求項１〜４
の何れかに記載の音声情報処理装置の機能、又は請求項
５及び６の何れかに記載の通信装置の機能を有すること
を特徴とする。

【００１３】第８の発明は、入力された音声を処理して
出力するための音声情報処理方法であって、第１の音声
を学習して当該音声の周波数特性情報を蓄積する蓄積ス
テップと、上記蓄積ステップにより蓄積された第１の音
声の周波数特性情報に基づいて、入力された第２の音声
の周波数特性を補正する補正ステップとを含むことを特
徴とする。

【００１４】第９の発明は、上記第８の発明において、
上記第２の音声での音声入力モードを設定するモード設
定ステップを含み、上記補正ステップは、上記モード設
定ステップでの設定に基づいて、上記周波数特性の補正
処理を実行するステップを含むことを特徴とする。

【００１５】第１０の発明は、上記第８の発明におい
て、上記蓄積ステップは、複数の第１の音声を学習して
得られた当該音声の周波数特性情報を蓄積するステップ
を含み、上記補正ステップは、上記入力された第２の音
声に対応する第１の音声の周波数特性情報を上記蓄積ス
テップでの蓄積情報から取得し、当該周波数特性情報に
基づいて、上記第２の音声の周波数特性を補正するステ
ップを含むことを特徴とする。

【００１６】第１１の発明は、上記第８の発明におい
て、上記第１の音声の学習モードを設定するモード設定
ステップを含み、上記蓄積ステップは、上記モード設定
ステップでの設定に基づいて、入力された第１の音声を
学習して得られた当該音声の周波数特性情報を蓄積する
ステップを含むことを特徴とする。

【００１７】第１２の発明は、請求項１〜４の何れかに
記載の音声情報処理装置の機能、又は請求項５及び６の
何れかに記載の通信装置の機能、又は請求項７記載の情
報処理システムの機能を実施するための処理プログラム
を、コンピュータが読出可能に格納した記憶媒体である
ことを特徴とする。

【００１８】第１３の発明は、請求項８〜１１の何れか
に記載の音声情報処理方法の処理ステップを、コンピュ
ータが読出可能に格納した記憶媒体であることを特徴と
する。

【００１９】

【発明の実施の形態】以下、本発明の実施の形態につい
て図面を用いて説明する。

【００２０】本発明は、例えば、図１に示すような携帯
電話１００に適用される。この携帯電話１００では、少
なくとも第１の周波数特性を有する音声及び第２の周波
数特性を有する音声により通話が行われる。ここでは、
その一例として、第１の周波数特性を有する音声を、通
常の音声（以下、「基本音声」又は「第１の音声」と言
う）とし、第２の周波数特性を有する音声を、基本音声
よりも十分に小さい声（ひそひそ声の音声、以下、「第
２の音声」とも言う）とする。

【００２１】携帯電話１００は、上記図１に示すよう
に、少なくとも第１の音声（基本音声）及び第２の音声
が入力されるマイク１０１と、マイク１０１から入力さ
れた音声が第２の音声であった場合に当該音声を増幅す
る増幅器１０２と、増幅器１０２での増幅後の音声の周
波数特性を分析する周波数特性分析部１０３と、増幅器
１０２での増幅後の音声がどのような言葉であるかを認
識する音声認識部１０４と、マイク１０１から入力され
た音声が第１の音声（基本音声）であった場合に当該音
声を増幅する増幅器１０５と、増幅器１０５での増幅後
の音声の周波数特性を分析する周波数特性分析部１０６
と、周波数特性分析部１０６での分析結果が蓄積される
基本音声周波数特性蓄積部１０８と、マイク１０１から
第２の音声が入力された場合に当該音声を第１の音声
（基本音声）に近づけるための処理を実行するＤＳＰ部
１０９と、増幅器１０２での増幅後の音声を一時的に蓄
積するメモリ１１０と、ＤＰＳ部１０９からの指示によ
りメモリ１１０内の音声に対して周波数変換処理を実行
する周波数変換部１１１と、周波数変換部１１１での処
理後の音声等を出力する通常音声出力部１１２と、携帯
電話１００全体の動作制御を司るＣＰＵ（中央演算装
置）１１３と、ＣＰＵ１１３での動作制御を実施するた
めの処理プログラム等が格納される１１５と、携帯電話
１００に対して各種動作指示を行うための操作部１０７
とを備えている。

【００２２】図２は、上記図１に示したような構成を備
える携帯電話１００の外観を示したものである。上記図
２に示すように、携帯電話１００の本体には、操作部１
０７及びマイク１０１が設けられている。

【００２３】操作部１０７は、第２の音声での通話を設
定するための第２音声モードボタン２０１と、テンキー
と共用であり第１の音声（基本音声）を学習させる際の
操作を行うための入力ボタン（以下、「学習ボタン」と
言う）２０２と、第１の音声（基本音声）を学習させる
際にどの言葉の音声を学習させているか等を表示する表
示器２０３と、第１の音声（基本音声）の学習を指示す
るための第１音声（基本音声）学習ボタン２０４とを含
んでいる。学習ボタン２０２は、通話相手にダイヤルす
る際に使用するテンキー（“０”〜“９”等）と兼用で
あり、学習させる第１の音声の言葉として、“あ”、
“い”、“う”、…、“ん”の言葉が選択可能になって
いる。

【００２４】図３は、“た”という言葉について、第１
の音声（基本音声）で発音した場合の当該音声の周波数
特性（第１の周波数特性）と、第２の音声（ひそひそ声
（音声））で発音した場合の当該音声の周波数特性（第
２の周波数特性）を表したものである。また、図４は、
“か”という言葉について、第１の音声（基本音声）で
発音した場合の当該音声の周波数特性（第１の周波数特
性）と、第２の音声（ひそひそ声（音声））で発音した
場合の当該音声の周波数特性（第２の周波数特性）を表
したものである。

【００２５】図５は、携帯電話１００の動作を示したも
のである。例えば、上記図５のフローチャートに従った
処理プログラムがプログラムメモリ１１５へ予め格納さ
れており、ＣＰＵ１１３がプログラムメモリ１１５内の
当該処理プログラムを読み出して実行することで、携帯
電話１００は、次のように動作する。

【００２６】ステップＳ３０１〜Ｓ３０２：ＣＰＵ１１
３は、携帯電話１００の電源スイッチ（図示せず）がユ
ーザからＯＮ状態にセットされたことを認識すると（ス
テップＳ３０１）、携帯電話１００を待機状態へ移行さ
せる（ステップＳ３０２）。

【００２７】ステップＳ３０３：ＣＰＵ１１３は、携帯
電話１００の待機状態において、操作部１０７の第１音
声（基本音声）学習ボタン２０４がユーザから押下され
たことを認識すると、携帯電話１００を第１音声（基本
音声）学習モードへ移行させ、当該モードによる動作を
行うように携帯電話１００全体を制御する。これによ
り、携帯電話１００では、次のステップＳ３０４からの
動作が実施される。

【００２８】ステップＳ３０４：操作部１０７の学習ボ
タン２０２において、“あ”、“い”、“う”、…
“ん”に対応したボタンのうちの、あるボタンがユーザ
から押下されると、操作部１０７の表示器２０３は、当
該押下ボタンに対応した文字を表示する。ここでは、一
例として、“た”のボタン（テンキーでは“４”のキ
ー）が押下されたものとする。したがって、“た”が表
示器２０３へ表示される。そして、マイク１０１から
“た”の音声が第１の音声（基本音声）として入力され
ると、“た”の学習が次のステップＳ３０５からの処理
により実行されることになる。

【００２９】尚、例えば、“ち”を選択したい場合、学
習ボタン２０４の“た”のボタンを２回押下すればよ
い。また、“つ”を選択したい場合には、学習ボタン２
０４の“た”のボタンを３回押下すればよい。すなわ
ち、“た”のボタンの、１回、２回、…、５回の押下に
より、“た”行の“た”、“ち”、“つ”、“て”、
“と”の選択が可能となっている。他の“あ”行、
“か”行、…についても同様である。

【００３０】ステップＳ３０５：マイク１０１から
“た”が第１の音声（基本音声）で入力されると、音声
増幅器１０５は、当該音声を増幅する。ステップＳ３０６：周波数分析部１０６は、音声増幅器
１０５での増幅後の第１の音声（基本音声）“た”の周
波数特性を分析する。ステップＳ３０７：基本音声周波数特性蓄積部１０８
は、周波数分析部１０６にて分析された第１の音声（基
本音声）“た”の周波数特性を蓄積する。このとき、基
本音声周波数特性蓄積部１０８は、ＣＰＵ１１３から供
給された、学習ボタン２０２で押下されたボタン
（“た”のボタン）を示す情報を、当該周波数特性と関
連付けて蓄積する。

【００３１】ステップＳ３０４〜Ｓ３０７の処理が繰り
返し実行されることで、５０音の全ての第１の音声（基
本音声）についての周波数特性が、基本音声周波数特性
蓄積部１０８へ蓄積されることになる。

【００３２】ステップＳ３０８：ＣＰＵ１１３は、携帯
電話１００が通話状態であり、且つ操作部１０７の第２
音声（ひそひそ声）モードボタン２０１がユーザから押
下された状態であるか否かを判別する。この判別の結
果、通話状態、且つ第２音声（ひそひそ声）モードボタ
ン２０１がユーザから押下された状態である場合、ＣＰ
Ｕ１１３は、携帯電話１００を第２音声モードへ移行さ
せ、当該モードによる動作を行うように携帯電話１００
全体を制御する。これにより、携帯電話１００では、
後述するステップＳ３１０からの動作が実施される。

【００３３】ステップＳ３０９：一方、ステップＳ３０
８の判別の結果、通話状態、且つ第２音声モードボタン
２０１がユーザから押下された状態でない場合、ＣＰＵ
１１３は、携帯電話１００を通常通話モードへ移行さ
せ、当該モードによる動作を行うように携帯電話１００
全体を制御する。

【００３４】ステップＳ３１０、ステップＳ３１１：携
帯電話１００が第２の音声（ひそひそ声）モードへ移行
した場合、マイク１０１から第２の音声が入力されると
（ステップＳ３１０）、音声増幅器１０２は、当該音声
を増幅する。このとき、増幅器１０２は、当該音声を、
オートレベルコントロール機能により、上述した第１の
音声（基本音声）が入力された際の音声増幅器１０５の
出力と同等のレベルに自動的に増幅する（ステップＳ３
１１）。音声増幅器１０２での増幅後の第２の音声（ひ
そひそ声）は、メモリ１１０へ一時的に蓄積されると共
に、音声認識部１０４及び周波数分析部１０３へ供給さ
れる。

【００３５】ステップＳ３１２：音声認識部１０４は、
音声増幅器１０２での増幅後の第２の音声（ひそひそ
声）が、どのような言葉の音声であるかを判断し、その
判断結果を音声データとしてＤＳＰ部１０９へ供給す
る。ステップＳ３１３：周波数分析部１０３は、音声増幅器
１０２での増幅後の第２の音声の周波数特性を分析し、
その結果をＤＳＰ部１０９へ供給する。

【００３６】ステップＳ３１４、ステップＳ３１５：Ｄ
ＳＰ部１０９は、音声認識部１０４からの音声データに
該当する第１の音声（基本音声）の周波数特性を、基本
音声周波数特性蓄積部１０８から取得（特定）し（ステ
ップＳ３１４）、当該取得周波数特性と、周波数分析部
１０３からの分析結果（第２の音声の周波数特性）とを
比較する（ステップＳ３１５）。

【００３７】ステップＳ３１６：ＤＳＰ部１０９は、ス
テップＳ３１４での比較結果に基づいて、周波数分析部
１０３からの分析結果、すなわち第２の音声（ひそひそ
声）の周波数特性が、基本音声周波数特性蓄積部１０８
から取得した第１の音声（基本音声）の周波数特性に極
力近くなるように、当該第２の音声（ひそひそ声）の周
波数特性を加工する指示を周波数変換部１１１へ発行す
る。これにより、周波数変換部１１１は、ＤＰＳ部１０
９からの指示に従って、メモリ１１０内の該当する第２
の音声に対して、周波数特性の加工処理を施す。

【００３８】ここで、周波数変換部１１１での周波数特
性の加工処理について、上記図３及び図４を用いて具体
的に説明する。

【００３９】まず、上記図３に示すように、第１の音声
（基本音声）の“た”の周波数特性と、第２の音声（ひ
そひそ声）の“た”の周波数特性とについて、３００Ｈ
ｚ〜８５０Ｈｚでは第１の音声（基本音声）の方が約１
０ｄｂレベルが高く、８５０Ｈｚ〜９００Ｈｚでは第１
の音声（基本音声）の方が約５ｄｂレベルが高い。これ
に対して、１．５ＫＨｚ〜４ＫＨｚでは第２の音声（ひ
そひそ声）の方が約１０ｄｂレベルが高くなっている。

【００４０】また、上記図４に示すように、第１の音声
（基本音声）の“か”の周波数特性と、第２の音声（ひ
そひそ声）の“か”の周波数特性とについて、３００Ｈ
ｚ〜９００Ｈｚでは第１の音声（基本音声）の方が約１
０ｄｂレベルが高く、１．１ＫＨｚ〜２．５ＫＨｚでは
第２の音声（ひそひそ声）の方が約１０ｄｂが高く、
３．２ＫＨｚ〜３．４ＫＨｚでは第２の音声（ひそひそ
声）の方が約１０ｄｂレベルが高い。

【００４１】上述のような、第１の音声（基本音声）
と、第２の音声（ひそひそ声）との間の周波数特性の差
を補正するのが、周波数変換部１１１である。したがっ
て、周波数変換部１１１により、メモリ１１０へ一時的
に格納されている上記図３及び図４に示したような第２
の音声（ひそひそ声）の周波数特性が、同図に示したよ
うな第１の音声（基本音声）の周波数特性へ補正され
る。

【００４２】ステップＳ３１７：通常音声出力部１１２
は、周波数変換部１１１での処理後の音声（マイク１０
１から入力された第２の音声（ひそひそ声））の周波数
特性が第１の音声（基本音声）の周波数特性に加工され
た結果である音声（通常音声）を出力する。

【００４３】ステップＳ３１８：ＣＰＵ１１３は、マイ
ク１０１から続けて音声入力がなされているか否か（通
話続行であるか否か）を判別する。この判別の結果、通
話続行である場合、ＣＰＵ１１３は、再びステップＳ３
１０からの動作を携帯電話１００が繰り返し行うよう
に、携帯電話１００を制御する。

【００４４】ステップＳ３１９：ステップＳ３１８の判
別の結果、通話続行でない場合、ＣＰＵ１１３は、携帯
電話１００を通話切断させ、次の通話に備えるための制
御処理等を実行して、本処理終了とする。

【００４５】上述のように、本実施の形態では、予め学
習しておいた第１の音声（基本音声）の周波数特性を蓄
積し、この蓄積情報を用いて、第２の音声（ひそひそ
声）が入力された場合には、当該音声の周波数特性を当
該音声に対応する第１の音声（基本音声）の周波数特性
に近づけるように補正するように構成したので、大きな
声が出せない場所において小さな声（ひそひそ声）で会
話する必要がある場合においても、通話相手には常に高
音質で通常の会話を行っているようにすることができ
る。また、大きな声が出せる場所において通常の声で会
話できる場合には、第２の音声での通話モードを設定し
なければよいので、状況に合わせた音声での通話を行う
ことができる。

【００４６】尚、本実施の形態では、第２の音声（ひそ
ひそ声）が入力されて、当該音声の周波数特性が第１の
音声（基本音声）の周波数特性に補正され出力されるま
での一連の動作は、数ミリ秒程度で終了するようになさ
れているので、ユーザに対して当該機能を用いることに
よる動作の遅延は全く感じさせない。

【００４７】また、本実施の形態では、本発明を携帯電
話へ適用したが、これに限られることはなく、音声情報
を処理する様々な装置或いはシステムへ適用可能であ
る。特に、本発明は、大きな声を出せない場所での通信
に対して適用可能であるため、その用途は無限に広がる
ことは言うまでもない。

【００４８】また、本発明の目的は、本実施の形態のホ
スト及び端末の機能を実現するソフトウェアのプログラ
ムコードを記憶した記憶媒体を、システム或いは装置に
供給し、そのシステム或いは装置のコンピュータ（又は
ＣＰＵやＭＰＵ）が記憶媒体に格納されたプログラムコ
ードを読みだして実行することによっても、達成される
ことは言うまでもない。この場合、記憶媒体から読み出
されたプログラムコード自体が本実施の形態の機能を実
現することとなり、そのプログラムコードを記憶した記
憶媒体は本発明を構成することとなる。プログラムコー
ドを供給するための記憶媒体としては、ＲＯＭ、フロッ
ピー（登録商標）ディスク、ハードディスク、光ディス
ク、光磁気ディスク、ＣＤ−ＲＯＭ、ＣＤ−Ｒ、磁気テ
ープ、不揮発性のメモリカード等を用いることができ
る。また、コンピュータが読みだしたプログラムコード
を実行することにより、本実施の形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼動しているＯＳ等が実際の処理の一
部又は全部を行い、その処理によって本実施の形態の機
能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み出されたプログラムコード
が、コンピュータに挿入された拡張機能ボードやコンピ
ュータに接続された機能拡張ユニットに備わるメモリに
書き込まれた後、そのプログラムコードの指示に基づ
き、その機能拡張ボードや機能拡張ユニットに備わるＣ
ＰＵなどが実際の処理の一部又は全部を行い、その処理
によって本実施の形態の機能が実現される場合も含まれ
ることは言うまでもない。

【００４９】

【発明の効果】以上説明したように本発明でば、第１の
音声（“あ”、“い”、…、“ん”の通常音声等の基本
音声）を学習等して予め当該音声の周波数特性を蓄積し
ておき、第２の音声（ひそひそ声等の音声）が入力され
た場合に、当該第２の音声の周波数特性を、上記蓄積情
報に基づき補正（第２の音声の周波数特性が第１の音声
の周波数特性に近づくように補正する等）するように構
成したので、例えば、本発明を携帯電話等へ適用した場
合、大きな声が出せない場所において小さな声（ひそひ
そ声）で会話する必要がある場合においても、通話相手
には常に高音質で通常の会話を行っているようにするこ
とができる。また、第２の音声での音声入力を設定でき
るように構成すれば、大きな声が出せる場所において通
常の声で会話できる場合には、当該設定しなければよい
ので、状況に合わせた音声での通話を行うことができ
る。

【図面の簡単な説明】

【図１】本発明を適用した携帯電話の構成を示すブロッ
ク図である。

【図２】上記携帯電話の操作部の構成を説明するための
図である。

【図３】“た”について、第１の音声（基本音声）で発
音した場合の当該音声の周波数特性と、第２の音声（ひ
そひそ声）で発音した場合の当該音声の周波数特性とを
説明するための図である。

【図４】“か”について、第１の音声（基本音声）で発
音した場合の当該音声の周波数特性と、第２の音声（ひ
そひそ声）で発音した場合の当該音声の周波数特性とを
説明するための図である。

【図５】上記携帯電話の動作を説明するためのフローチ
ャートである。

【符号の説明】

１００携帯電話１０１マイク１０２増幅器１０３周波数特性分析部１０４音声認識部１０５音声増幅器１０６周波数特性分析部１０７操作部１０８基本音声周波数特性蓄積部１０９ＤＳＰ部１１０メモリ１１１周波数変換器１１２通常音声出力部１１３ＣＰＵ（中央漬算装置１１５プログラムメモリ２０１第２音声（ひそひそ声）モードボタン２０２学習ボタン（テンキー）２０３表示器２０４第１音声（基本音声）学習ボタン

Claims

【特許請求の範囲】

【請求項１】入力された音声を処理して出力する音声
情報処理装置であって、第１の音声の周波数特性情報を予め蓄積する蓄積手段
と、上記蓄積手段へ蓄積された第１の音声の周波数特性情報
に基づいて、入力された第２の音声の周波数特性を補正
する補正手段とを備えることを特徴とする音声情報処理
装置。
【請求項２】上記第２の音声での音声入力を設定する
設定手段を備え、上記補正手段は、上記設定手段での設定に基づいて、上
記周波数特性の補正処理を行うことを特徴とする請求項
１記載の音声情報処理装置。
【請求項３】上記蓄積手段は、複数の上記第１の音声
の周波数特性情報を予め蓄積し、上記補正手段は、上記入力された第２の音声に対応する
第１の音声の周波数特性情報を上記蓄積手段から取得
し、当該周波数特性情報に基づいて、上記第２の音声の
周波数特性を補正することを特徴とする請求項１記載の
音声情報処理装置。
【請求項４】上記第１の音声での音声入力を設定する
設定手段を備え、上記蓄積手段は、上記設定手段での設定に基づいて、入
力された第１の音声の周波数特性情報を蓄積することを
特徴とする請求項１記載の音声情報処理装置。
【請求項５】通話機能を有する通信装置であって、請求項１〜４の何れかに記載の音声情報処理装置の機能
を有することを特徴とする通信装置。
【請求項６】携帯型であることを特徴とする請求項５
記載の通信装置。
【請求項７】複数の機器が互いに通信可能に接続され
てなる情報処理システムであって、上記複数の機器のうち少なくとも１つの機器は、請求項
１〜４の何れかに記載の音声情報処理装置の機能、又は
請求項５及び６の何れかに記載の通信装置の機能を有す
ることを特徴とする情報処理システム。
【請求項８】入力された音声を処理して出力するため
の音声情報処理方法であって、第１の音声を学習して当該音声の周波数特性情報を蓄積
する蓄積ステップと、上記蓄積ステップにより蓄積された第１の音声の周波数
特性情報に基づいて、入力された第２の音声の周波数特
性を補正する補正ステップとを含むことを特徴とする音
声情報処理方法。
【請求項９】上記第２の音声での音声入力モードを設
定するモード設定ステップを含み、上記補正ステップは、上記モード設定ステップでの設定
に基づいて、上記周波数特性の補正処理を実行するステ
ップを含むことを特徴とする請求項８記載の音声情報処
理方法。
【請求項１０】上記蓄積ステップは、複数の第１の音
声を学習して得られた当該音声の周波数特性情報を蓄積
するステップを含み、上記補正ステップは、上記入力された第２の音声に対応
する第１の音声の周波数特性情報を上記蓄積ステップで
の蓄積情報から取得し、当該周波数特性情報に基づい
て、上記第２の音声の周波数特性を補正するステップを
含むことを特徴とする請求項８記載の音声情報処理方
法。
【請求項１１】上記第１の音声の学習モードを設定す
るモード設定ステップを含み、上記蓄積ステップは、上記モード設定ステップでの設定
に基づいて、入力された第１の音声を学習して得られた
当該音声の周波数特性情報を蓄積するステップを含むこ
とを特徴とする請求項８記載の音声情報処理方法。
【請求項１２】請求項１〜４の何れかに記載の音声情
報処理装置の機能、又は請求項５及び６の何れかに記載
の通信装置の機能、又は請求項７記載の情報処理システ
ムの機能を実施するための処理プログラムを、コンピュ
ータが読出可能に格納したことを特徴とする記憶媒体。
【請求項１３】請求項８〜１１の何れかに記載の音声
情報処理方法の処理ステップを、コンピュータが読出可
能に格納したことを特徴とする記憶媒体。