JP2001350499A - 音声情報処理装置、通信装置、情報処理システム、音声情報処理方法、及び記憶媒体 - Google Patents

音声情報処理装置、通信装置、情報処理システム、音声情報処理方法、及び記憶媒体

Info

Publication number
JP2001350499A
JP2001350499A JP2000168770A JP2000168770A JP2001350499A JP 2001350499 A JP2001350499 A JP 2001350499A JP 2000168770 A JP2000168770 A JP 2000168770A JP 2000168770 A JP2000168770 A JP 2000168770A JP 2001350499 A JP2001350499 A JP 2001350499A
Authority
JP
Japan
Prior art keywords
voice
frequency characteristic
information processing
setting
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000168770A
Other languages
English (en)
Inventor
直人 ▲高▼橋
Naoto Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000168770A priority Critical patent/JP2001350499A/ja
Publication of JP2001350499A publication Critical patent/JP2001350499A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 常に高音質の音声を提供できる構成とするこ
とで、常に高音質での通話が可能となる音声情報処理装
置を提供する。 【解決手段】 蓄積手段108は、第1の音声
(“あ”、“い”、…、“ん”の通常音声等の基本音
声)を学習等して予め当該音声の周波数特性を蓄積す
る。補正手段109,111は、第2の音声(ひそひそ
声等の音声)が入力された場合に、当該第2の音声の周
波数特性を、蓄積手段108の蓄積情報に基づき補正
(第2の音声の周波数特性が第1の音声の周波数特性に
近づくように補正する等)する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば、携帯電話
や簡易携帯電話(パーソナル・ハンディフォン・システ
ム、以下、「PHS」と言う)等に用いられる、音声情
報処理装置、通信装置、情報処理システム、音声情報処
理方法、及びそれを実施するための処理ステップをコン
ピュータが読出可能に格納した記憶媒体に関するもので
ある。
【0002】
【従来の技術】近年では、端末装置の低価格化や通信料
金の値下げ競争に伴って、例えば、携帯電話やPHS等
の普及が飛躍的に伸びてきている。そして、その利用範
囲は場所をを選ばなくなってきている。
【0003】
【発明が解決しようとする課題】しかしながら、上述の
ように、携帯電話やPHS等が多く利用されるようにな
るに従って、その使用マナーについては、悪化の傾向を
たどってきている。特に顕著なのが、例えば、会議中や
電車、或いはバスの中での突然の着信音や大声での通話
である。そこで、突然の着信音の対策として、携帯電話
やPHSでの着信を、振動やランプで知らせるものが開
発されている。また、大声での通話の対策として、音声
の入力マイクのゲインを高く設定し、小声でも通話相手
に十分な音量で通話できるものが考案されている。
【0004】しかしながら、大声での通話についての対
策は、単に、音声の入力マイクのゲインを高く設定し、
小声でも通話相手に十分な音量で通話できるように構成
されているに過ぎず、例えば、周囲が静寂な場所におい
て、通常通りの声で話そうとすると、通話相手には大声
で伝わってしまい、通話相手に通常の音量で伝わるよう
にするためには、小声で話す必要があった。この場合、
周囲が静寂な場所において小声で話すことになり、これ
はユーザにとって非常に抵抗がある。また、さらに小声
で話そうとすると、ひそひそ声(音声)となってしま
い、高音質で通話することは不可能となり、この結果、
通話相手が通話内容を理解できない場合もでてくる。
【0005】そこで、本発明は、上記の欠点を除去する
ために成されたもので、常に高音質の音声を提供できる
構成とすることで、常に高音質での通話が可能となる、
音声情報処理装置、通信装置、情報処理システム、音声
情報処理方法、及びそれを実施するための処理ステップ
をコンピュータが読出可能に格納した記憶媒体を提供す
ることを目的とする。
【0006】
【課題を解決するための手段】斯かる目的下において、
第1の発明は、入力された音声を処理して出力する音声
情報処理装置であって、第1の音声の周波数特性情報を
予め蓄積する蓄積手段と、上記蓄積手段へ蓄積された第
1の音声の周波数特性情報に基づいて、入力された第2
の音声の周波数特性を補正する補正手段とを備えること
を特徴とする。
【0007】第2の発明は、上記第1の発明において、
上記第2の音声での音声入力を設定する設定手段を備
え、上記補正手段は、上記設定手段での設定に基づい
て、上記周波数特性の補正処理を行うことを特徴とす
る。
【0008】第3の発明は、上記第1の発明において、
上記蓄積手段は、複数の上記第1の音声の周波数特性情
報を予め蓄積し、上記補正手段は、上記入力された第2
の音声に対応する第1の音声の周波数特性情報を上記蓄
積手段から取得し、当該周波数特性情報に基づいて、上
記第2の音声の周波数特性を補正することを特徴とす
る。
【0009】第4の発明は、上記第1の発明において、
上記第1の音声での音声入力を設定する設定手段を備
え、上記蓄積手段は、上記設定手段での設定に基づい
て、入力された第1の音声の周波数特性情報を蓄積する
ことを特徴とする。
【0010】第5の発明は、通話機能を有する通信装置
であって、請求項1〜4の何れかに記載の音声情報処理
装置の機能を有することを特徴とする。
【0011】第6の発明は、上記第5の発明において、
携帯型であることを特徴とする。
【0012】第7の発明は、複数の機器が互いに通信可
能に接続されてなる情報処理システムであって、上記複
数の機器のうち少なくとも1つの機器は、請求項1〜4
の何れかに記載の音声情報処理装置の機能、又は請求項
5及び6の何れかに記載の通信装置の機能を有すること
を特徴とする。
【0013】第8の発明は、入力された音声を処理して
出力するための音声情報処理方法であって、第1の音声
を学習して当該音声の周波数特性情報を蓄積する蓄積ス
テップと、上記蓄積ステップにより蓄積された第1の音
声の周波数特性情報に基づいて、入力された第2の音声
の周波数特性を補正する補正ステップとを含むことを特
徴とする。
【0014】第9の発明は、上記第8の発明において、
上記第2の音声での音声入力モードを設定するモード設
定ステップを含み、上記補正ステップは、上記モード設
定ステップでの設定に基づいて、上記周波数特性の補正
処理を実行するステップを含むことを特徴とする。
【0015】第10の発明は、上記第8の発明におい
て、上記蓄積ステップは、複数の第1の音声を学習して
得られた当該音声の周波数特性情報を蓄積するステップ
を含み、上記補正ステップは、上記入力された第2の音
声に対応する第1の音声の周波数特性情報を上記蓄積ス
テップでの蓄積情報から取得し、当該周波数特性情報に
基づいて、上記第2の音声の周波数特性を補正するステ
ップを含むことを特徴とする。
【0016】第11の発明は、上記第8の発明におい
て、上記第1の音声の学習モードを設定するモード設定
ステップを含み、上記蓄積ステップは、上記モード設定
ステップでの設定に基づいて、入力された第1の音声を
学習して得られた当該音声の周波数特性情報を蓄積する
ステップを含むことを特徴とする。
【0017】第12の発明は、請求項1〜4の何れかに
記載の音声情報処理装置の機能、又は請求項5及び6の
何れかに記載の通信装置の機能、又は請求項7記載の情
報処理システムの機能を実施するための処理プログラム
を、コンピュータが読出可能に格納した記憶媒体である
ことを特徴とする。
【0018】第13の発明は、請求項8〜11の何れか
に記載の音声情報処理方法の処理ステップを、コンピュ
ータが読出可能に格納した記憶媒体であることを特徴と
する。
【0019】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を用いて説明する。
【0020】本発明は、例えば、図1に示すような携帯
電話100に適用される。この携帯電話100では、少
なくとも第1の周波数特性を有する音声及び第2の周波
数特性を有する音声により通話が行われる。ここでは、
その一例として、第1の周波数特性を有する音声を、通
常の音声(以下、「基本音声」又は「第1の音声」と言
う)とし、第2の周波数特性を有する音声を、基本音声
よりも十分に小さい声(ひそひそ声の音声、以下、「第
2の音声」とも言う)とする。
【0021】携帯電話100は、上記図1に示すよう
に、少なくとも第1の音声(基本音声)及び第2の音声
が入力されるマイク101と、マイク101から入力さ
れた音声が第2の音声であった場合に当該音声を増幅す
る増幅器102と、増幅器102での増幅後の音声の周
波数特性を分析する周波数特性分析部103と、増幅器
102での増幅後の音声がどのような言葉であるかを認
識する音声認識部104と、マイク101から入力され
た音声が第1の音声(基本音声)であった場合に当該音
声を増幅する増幅器105と、増幅器105での増幅後
の音声の周波数特性を分析する周波数特性分析部106
と、周波数特性分析部106での分析結果が蓄積される
基本音声周波数特性蓄積部108と、マイク101から
第2の音声が入力された場合に当該音声を第1の音声
(基本音声)に近づけるための処理を実行するDSP部
109と、増幅器102での増幅後の音声を一時的に蓄
積するメモリ110と、DPS部109からの指示によ
りメモリ110内の音声に対して周波数変換処理を実行
する周波数変換部111と、周波数変換部111での処
理後の音声等を出力する通常音声出力部112と、携帯
電話100全体の動作制御を司るCPU(中央演算装
置)113と、CPU113での動作制御を実施するた
めの処理プログラム等が格納される115と、携帯電話
100に対して各種動作指示を行うための操作部107
とを備えている。
【0022】図2は、上記図1に示したような構成を備
える携帯電話100の外観を示したものである。上記図
2に示すように、携帯電話100の本体には、操作部1
07及びマイク101が設けられている。
【0023】操作部107は、第2の音声での通話を設
定するための第2音声モードボタン201と、テンキー
と共用であり第1の音声(基本音声)を学習させる際の
操作を行うための入力ボタン(以下、「学習ボタン」と
言う)202と、第1の音声(基本音声)を学習させる
際にどの言葉の音声を学習させているか等を表示する表
示器203と、第1の音声(基本音声)の学習を指示す
るための第1音声(基本音声)学習ボタン204とを含
んでいる。学習ボタン202は、通話相手にダイヤルす
る際に使用するテンキー(“0”〜“9”等)と兼用で
あり、学習させる第1の音声の言葉として、“あ”、
“い”、“う”、…、“ん”の言葉が選択可能になって
いる。
【0024】図3は、“た”という言葉について、第1
の音声(基本音声)で発音した場合の当該音声の周波数
特性(第1の周波数特性)と、第2の音声(ひそひそ声
(音声))で発音した場合の当該音声の周波数特性(第
2の周波数特性)を表したものである。また、図4は、
“か”という言葉について、第1の音声(基本音声)で
発音した場合の当該音声の周波数特性(第1の周波数特
性)と、第2の音声(ひそひそ声(音声))で発音した
場合の当該音声の周波数特性(第2の周波数特性)を表
したものである。
【0025】図5は、携帯電話100の動作を示したも
のである。例えば、上記図5のフローチャートに従った
処理プログラムがプログラムメモリ115へ予め格納さ
れており、CPU113がプログラムメモリ115内の
当該処理プログラムを読み出して実行することで、携帯
電話100は、次のように動作する。
【0026】ステップS301〜S302:CPU11
3は、携帯電話100の電源スイッチ(図示せず)がユ
ーザからON状態にセットされたことを認識すると(ス
テップS301)、携帯電話100を待機状態へ移行さ
せる(ステップS302)。
【0027】ステップS303:CPU113は、携帯
電話100の待機状態において、操作部107の第1音
声(基本音声)学習ボタン204がユーザから押下され
たことを認識すると、携帯電話100を第1音声(基本
音声)学習モードへ移行させ、当該モードによる動作を
行うように携帯電話100全体を制御する。これによ
り、携帯電話100では、次のステップS304からの
動作が実施される。
【0028】ステップS304:操作部107の学習ボ
タン202において、“あ”、“い”、“う”、…
“ん”に対応したボタンのうちの、あるボタンがユーザ
から押下されると、操作部107の表示器203は、当
該押下ボタンに対応した文字を表示する。ここでは、一
例として、“た”のボタン(テンキーでは“4”のキ
ー)が押下されたものとする。したがって、“た”が表
示器203へ表示される。そして、マイク101から
“た”の音声が第1の音声(基本音声)として入力され
ると、“た”の学習が次のステップS305からの処理
により実行されることになる。
【0029】尚、例えば、“ち”を選択したい場合、学
習ボタン204の“た”のボタンを2回押下すればよ
い。また、“つ”を選択したい場合には、学習ボタン2
04の“た”のボタンを3回押下すればよい。すなわ
ち、“た”のボタンの、1回、2回、…、5回の押下に
より、“た”行の“た”、“ち”、“つ”、“て”、
“と”の選択が可能となっている。他の“あ”行、
“か”行、…についても同様である。
【0030】ステップS305:マイク101から
“た”が第1の音声(基本音声)で入力されると、音声
増幅器105は、当該音声を増幅する。 ステップS306:周波数分析部106は、音声増幅器
105での増幅後の第1の音声(基本音声)“た”の周
波数特性を分析する。 ステップS307:基本音声周波数特性蓄積部108
は、周波数分析部106にて分析された第1の音声(基
本音声)“た”の周波数特性を蓄積する。このとき、基
本音声周波数特性蓄積部108は、CPU113から供
給された、学習ボタン202で押下されたボタン
(“た”のボタン)を示す情報を、当該周波数特性と関
連付けて蓄積する。
【0031】ステップS304〜S307の処理が繰り
返し実行されることで、50音の全ての第1の音声(基
本音声)についての周波数特性が、基本音声周波数特性
蓄積部108へ蓄積されることになる。
【0032】ステップS308:CPU113は、携帯
電話100が通話状態であり、且つ操作部107の第2
音声(ひそひそ声)モードボタン201がユーザから押
下された状態であるか否かを判別する。この判別の結
果、通話状態、且つ第2音声(ひそひそ声)モードボタ
ン201がユーザから押下された状態である場合、CP
U113は、携帯電話100を第2音声モードへ移行さ
せ、当該モードによる動作を行うように携帯電話100
全体を制御する。 これにより、携帯電話100では、
後述するステップS310からの動作が実施される。
【0033】ステップS309:一方、ステップS30
8の判別の結果、通話状態、且つ第2音声モードボタン
201がユーザから押下された状態でない場合、CPU
113は、携帯電話100を通常通話モードへ移行さ
せ、当該モードによる動作を行うように携帯電話100
全体を制御する。
【0034】ステップS310、ステップS311:携
帯電話100が第2の音声(ひそひそ声)モードへ移行
した場合、マイク101から第2の音声が入力されると
(ステップS310)、音声増幅器102は、当該音声
を増幅する。このとき、増幅器102は、当該音声を、
オートレベルコントロール機能により、上述した第1の
音声(基本音声)が入力された際の音声増幅器105の
出力と同等のレベルに自動的に増幅する(ステップS3
11)。音声増幅器102での増幅後の第2の音声(ひ
そひそ声)は、メモリ110へ一時的に蓄積されると共
に、音声認識部104及び周波数分析部103へ供給さ
れる。
【0035】ステップS312:音声認識部104は、
音声増幅器102での増幅後の第2の音声(ひそひそ
声)が、どのような言葉の音声であるかを判断し、その
判断結果を音声データとしてDSP部109へ供給す
る。 ステップS313:周波数分析部103は、音声増幅器
102での増幅後の第2の音声の周波数特性を分析し、
その結果をDSP部109へ供給する。
【0036】ステップS314、ステップS315:D
SP部109は、音声認識部104からの音声データに
該当する第1の音声(基本音声)の周波数特性を、基本
音声周波数特性蓄積部108から取得(特定)し(ステ
ップS314)、当該取得周波数特性と、周波数分析部
103からの分析結果(第2の音声の周波数特性)とを
比較する(ステップS315)。
【0037】ステップS316:DSP部109は、ス
テップS314での比較結果に基づいて、周波数分析部
103からの分析結果、すなわち第2の音声(ひそひそ
声)の周波数特性が、基本音声周波数特性蓄積部108
から取得した第1の音声(基本音声)の周波数特性に極
力近くなるように、当該第2の音声(ひそひそ声)の周
波数特性を加工する指示を周波数変換部111へ発行す
る。これにより、周波数変換部111は、DPS部10
9からの指示に従って、メモリ110内の該当する第2
の音声に対して、周波数特性の加工処理を施す。
【0038】ここで、周波数変換部111での周波数特
性の加工処理について、上記図3及び図4を用いて具体
的に説明する。
【0039】まず、上記図3に示すように、第1の音声
(基本音声)の“た”の周波数特性と、第2の音声(ひ
そひそ声)の“た”の周波数特性とについて、300H
z〜850Hzでは第1の音声(基本音声)の方が約1
0dbレベルが高く、850Hz〜900Hzでは第1
の音声(基本音声)の方が約5dbレベルが高い。これ
に対して、1.5KHz〜4KHzでは第2の音声(ひ
そひそ声)の方が約10dbレベルが高くなっている。
【0040】また、上記図4に示すように、第1の音声
(基本音声)の“か”の周波数特性と、第2の音声(ひ
そひそ声)の“か”の周波数特性とについて、300H
z〜900Hzでは第1の音声(基本音声)の方が約1
0dbレベルが高く、1.1KHz〜2.5KHzでは
第2の音声(ひそひそ声)の方が約10dbが高く、
3.2KHz〜3.4KHzでは第2の音声(ひそひそ
声)の方が約10dbレベルが高い。
【0041】上述のような、第1の音声(基本音声)
と、第2の音声(ひそひそ声)との間の周波数特性の差
を補正するのが、周波数変換部111である。したがっ
て、周波数変換部111により、メモリ110へ一時的
に格納されている上記図3及び図4に示したような第2
の音声(ひそひそ声)の周波数特性が、同図に示したよ
うな第1の音声(基本音声)の周波数特性へ補正され
る。
【0042】ステップS317:通常音声出力部112
は、周波数変換部111での処理後の音声(マイク10
1から入力された第2の音声(ひそひそ声))の周波数
特性が第1の音声(基本音声)の周波数特性に加工され
た結果である音声(通常音声)を出力する。
【0043】ステップS318:CPU113は、マイ
ク101から続けて音声入力がなされているか否か(通
話続行であるか否か)を判別する。この判別の結果、通
話続行である場合、CPU113は、再びステップS3
10からの動作を携帯電話100が繰り返し行うよう
に、携帯電話100を制御する。
【0044】ステップS319:ステップS318の判
別の結果、通話続行でない場合、CPU113は、携帯
電話100を通話切断させ、次の通話に備えるための制
御処理等を実行して、本処理終了とする。
【0045】上述のように、本実施の形態では、予め学
習しておいた第1の音声(基本音声)の周波数特性を蓄
積し、この蓄積情報を用いて、第2の音声(ひそひそ
声)が入力された場合には、当該音声の周波数特性を当
該音声に対応する第1の音声(基本音声)の周波数特性
に近づけるように補正するように構成したので、大きな
声が出せない場所において小さな声(ひそひそ声)で会
話する必要がある場合においても、通話相手には常に高
音質で通常の会話を行っているようにすることができ
る。また、大きな声が出せる場所において通常の声で会
話できる場合には、第2の音声での通話モードを設定し
なければよいので、状況に合わせた音声での通話を行う
ことができる。
【0046】尚、本実施の形態では、第2の音声(ひそ
ひそ声)が入力されて、当該音声の周波数特性が第1の
音声(基本音声)の周波数特性に補正され出力されるま
での一連の動作は、数ミリ秒程度で終了するようになさ
れているので、ユーザに対して当該機能を用いることに
よる動作の遅延は全く感じさせない。
【0047】また、本実施の形態では、本発明を携帯電
話へ適用したが、これに限られることはなく、音声情報
を処理する様々な装置或いはシステムへ適用可能であ
る。特に、本発明は、大きな声を出せない場所での通信
に対して適用可能であるため、その用途は無限に広がる
ことは言うまでもない。
【0048】また、本発明の目的は、本実施の形態のホ
スト及び端末の機能を実現するソフトウェアのプログラ
ムコードを記憶した記憶媒体を、システム或いは装置に
供給し、そのシステム或いは装置のコンピュータ(又は
CPUやMPU)が記憶媒体に格納されたプログラムコ
ードを読みだして実行することによっても、達成される
ことは言うまでもない。この場合、記憶媒体から読み出
されたプログラムコード自体が本実施の形態の機能を実
現することとなり、そのプログラムコードを記憶した記
憶媒体は本発明を構成することとなる。プログラムコー
ドを供給するための記憶媒体としては、ROM、フロッ
ピー(登録商標)ディスク、ハードディスク、光ディス
ク、光磁気ディスク、CD−ROM、CD−R、磁気テ
ープ、不揮発性のメモリカード等を用いることができ
る。また、コンピュータが読みだしたプログラムコード
を実行することにより、本実施の形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼動しているOS等が実際の処理の一
部又は全部を行い、その処理によって本実施の形態の機
能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み出されたプログラムコード
が、コンピュータに挿入された拡張機能ボードやコンピ
ュータに接続された機能拡張ユニットに備わるメモリに
書き込まれた後、そのプログラムコードの指示に基づ
き、その機能拡張ボードや機能拡張ユニットに備わるC
PUなどが実際の処理の一部又は全部を行い、その処理
によって本実施の形態の機能が実現される場合も含まれ
ることは言うまでもない。
【0049】
【発明の効果】以上説明したように本発明でば、第1の
音声(“あ”、“い”、…、“ん”の通常音声等の基本
音声)を学習等して予め当該音声の周波数特性を蓄積し
ておき、第2の音声(ひそひそ声等の音声)が入力され
た場合に、当該第2の音声の周波数特性を、上記蓄積情
報に基づき補正(第2の音声の周波数特性が第1の音声
の周波数特性に近づくように補正する等)するように構
成したので、例えば、本発明を携帯電話等へ適用した場
合、大きな声が出せない場所において小さな声(ひそひ
そ声)で会話する必要がある場合においても、通話相手
には常に高音質で通常の会話を行っているようにするこ
とができる。また、第2の音声での音声入力を設定でき
るように構成すれば、大きな声が出せる場所において通
常の声で会話できる場合には、当該設定しなければよい
ので、状況に合わせた音声での通話を行うことができ
る。
【図面の簡単な説明】
【図1】本発明を適用した携帯電話の構成を示すブロッ
ク図である。
【図2】上記携帯電話の操作部の構成を説明するための
図である。
【図3】“た”について、第1の音声(基本音声)で発
音した場合の当該音声の周波数特性と、第2の音声(ひ
そひそ声)で発音した場合の当該音声の周波数特性とを
説明するための図である。
【図4】“か”について、第1の音声(基本音声)で発
音した場合の当該音声の周波数特性と、第2の音声(ひ
そひそ声)で発音した場合の当該音声の周波数特性とを
説明するための図である。
【図5】上記携帯電話の動作を説明するためのフローチ
ャートである。
【符号の説明】
100 携帯電話 101 マイク 102 増幅器 103 周波数特性分析部 104 音声認識部 105 音声増幅器 106 周波数特性分析部 107 操作部 108 基本音声周波数特性蓄積部 109 DSP部 110 メモリ 111 周波数変換器 112 通常音声出力部 113 CPU(中央漬算装置 115 プログラムメモリ 201 第2音声(ひそひそ声)モードボタン 202 学習ボタン(テンキー) 203 表示器 204 第1音声(基本音声)学習ボタン

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声を処理して出力する音声
    情報処理装置であって、 第1の音声の周波数特性情報を予め蓄積する蓄積手段
    と、 上記蓄積手段へ蓄積された第1の音声の周波数特性情報
    に基づいて、入力された第2の音声の周波数特性を補正
    する補正手段とを備えることを特徴とする音声情報処理
    装置。
  2. 【請求項2】 上記第2の音声での音声入力を設定する
    設定手段を備え、 上記補正手段は、上記設定手段での設定に基づいて、上
    記周波数特性の補正処理を行うことを特徴とする請求項
    1記載の音声情報処理装置。
  3. 【請求項3】 上記蓄積手段は、複数の上記第1の音声
    の周波数特性情報を予め蓄積し、 上記補正手段は、上記入力された第2の音声に対応する
    第1の音声の周波数特性情報を上記蓄積手段から取得
    し、当該周波数特性情報に基づいて、上記第2の音声の
    周波数特性を補正することを特徴とする請求項1記載の
    音声情報処理装置。
  4. 【請求項4】 上記第1の音声での音声入力を設定する
    設定手段を備え、 上記蓄積手段は、上記設定手段での設定に基づいて、入
    力された第1の音声の周波数特性情報を蓄積することを
    特徴とする請求項1記載の音声情報処理装置。
  5. 【請求項5】 通話機能を有する通信装置であって、 請求項1〜4の何れかに記載の音声情報処理装置の機能
    を有することを特徴とする通信装置。
  6. 【請求項6】 携帯型であることを特徴とする請求項5
    記載の通信装置。
  7. 【請求項7】 複数の機器が互いに通信可能に接続され
    てなる情報処理システムであって、 上記複数の機器のうち少なくとも1つの機器は、請求項
    1〜4の何れかに記載の音声情報処理装置の機能、又は
    請求項5及び6の何れかに記載の通信装置の機能を有す
    ることを特徴とする情報処理システム。
  8. 【請求項8】 入力された音声を処理して出力するため
    の音声情報処理方法であって、 第1の音声を学習して当該音声の周波数特性情報を蓄積
    する蓄積ステップと、 上記蓄積ステップにより蓄積された第1の音声の周波数
    特性情報に基づいて、入力された第2の音声の周波数特
    性を補正する補正ステップとを含むことを特徴とする音
    声情報処理方法。
  9. 【請求項9】 上記第2の音声での音声入力モードを設
    定するモード設定ステップを含み、 上記補正ステップは、上記モード設定ステップでの設定
    に基づいて、上記周波数特性の補正処理を実行するステ
    ップを含むことを特徴とする請求項8記載の音声情報処
    理方法。
  10. 【請求項10】 上記蓄積ステップは、複数の第1の音
    声を学習して得られた当該音声の周波数特性情報を蓄積
    するステップを含み、 上記補正ステップは、上記入力された第2の音声に対応
    する第1の音声の周波数特性情報を上記蓄積ステップで
    の蓄積情報から取得し、当該周波数特性情報に基づい
    て、上記第2の音声の周波数特性を補正するステップを
    含むことを特徴とする請求項8記載の音声情報処理方
    法。
  11. 【請求項11】 上記第1の音声の学習モードを設定す
    るモード設定ステップを含み、 上記蓄積ステップは、上記モード設定ステップでの設定
    に基づいて、入力された第1の音声を学習して得られた
    当該音声の周波数特性情報を蓄積するステップを含むこ
    とを特徴とする請求項8記載の音声情報処理方法。
  12. 【請求項12】 請求項1〜4の何れかに記載の音声情
    報処理装置の機能、又は請求項5及び6の何れかに記載
    の通信装置の機能、又は請求項7記載の情報処理システ
    ムの機能を実施するための処理プログラムを、コンピュ
    ータが読出可能に格納したことを特徴とする記憶媒体。
  13. 【請求項13】 請求項8〜11の何れかに記載の音声
    情報処理方法の処理ステップを、コンピュータが読出可
    能に格納したことを特徴とする記憶媒体。
JP2000168770A 2000-06-06 2000-06-06 音声情報処理装置、通信装置、情報処理システム、音声情報処理方法、及び記憶媒体 Pending JP2001350499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000168770A JP2001350499A (ja) 2000-06-06 2000-06-06 音声情報処理装置、通信装置、情報処理システム、音声情報処理方法、及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000168770A JP2001350499A (ja) 2000-06-06 2000-06-06 音声情報処理装置、通信装置、情報処理システム、音声情報処理方法、及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2001350499A true JP2001350499A (ja) 2001-12-21

Family

ID=18671728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000168770A Pending JP2001350499A (ja) 2000-06-06 2000-06-06 音声情報処理装置、通信装置、情報処理システム、音声情報処理方法、及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2001350499A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1553560A1 (en) * 2002-07-16 2005-07-13 Sony Corporation Transmission device, transmission method, reception device, reception method, transmission/reception device, communication device, communication method, recording medium, and program
JP2008129524A (ja) * 2006-11-24 2008-06-05 Nippon Telegr & Teleph Corp <Ntt> 音声再現装置及び音声再現方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1553560A1 (en) * 2002-07-16 2005-07-13 Sony Corporation Transmission device, transmission method, reception device, reception method, transmission/reception device, communication device, communication method, recording medium, and program
EP1553560A4 (en) * 2002-07-16 2005-12-21 Sony Corp SENDING DEVICE, TRANSMISSION PROCEDURE, RECEPTION DEVICE, RECEIVING METHOD, SENDING / RECEIVING DEVICE, COMMUNICATION DEVICE, COMMUNICATION PROCEDURE, RECORDING MEDIUM AND PROGRAM
US7515661B2 (en) 2002-07-16 2009-04-07 Sony Corporation Transmission device, transmission method, reception device, reception method, transmission/reception device, communication method, recording medium, and program
US7688922B2 (en) 2002-07-16 2010-03-30 Sony Corporation Transmitting apparatus and transmitting method, receiving apparatus and receiving method, transceiver apparatus, communication apparatus and method, recording medium, and program
US7688921B2 (en) 2002-07-16 2010-03-30 Sony Corporation Transmitting apparatus and transmitting method, receiving apparatus and receiving method, transceiver apparatus, communication apparatus and method, recording medium, and program
JP2008129524A (ja) * 2006-11-24 2008-06-05 Nippon Telegr & Teleph Corp <Ntt> 音声再現装置及び音声再現方法

Similar Documents

Publication Publication Date Title
US6708152B2 (en) User interface for text to speech conversion
US20050125235A1 (en) Method and apparatus for using earcons in mobile communication devices
JP2007520943A (ja) ノイズの大きい環境における電話機の拡張された使用
KR20080107376A (ko) 화자 독립 음성 인식을 구비한 통신 장치
US20070047708A1 (en) Voice call reply using voice recognition and text to speech
US8892173B2 (en) Mobile electronic device and sound control system
KR101367722B1 (ko) 휴대단말기의 통화 서비스 방법
JP3260324B2 (ja) メッセージ応答型携帯電話機
JP5251588B2 (ja) 携帯電話端末装置及び通話伝達の判断方法
KR20100081022A (ko) 전화번호부 업데이트 방법 및 이를 이용한 휴대 단말기
KR20070076942A (ko) 휴대용 무선단말기의 작곡 장치 및 방법
JP2001350499A (ja) 音声情報処理装置、通信装置、情報処理システム、音声情報処理方法、及び記憶媒体
KR20090027817A (ko) 배경음 출력 방법 및 이를 이용하는 이동통신 단말기
CN108735212A (zh) 语音控制方法及装置
JPH11194797A (ja) 音声認識作動装置
JP2003060737A (ja) 携帯電子機器及びその制御プログラム
US20200098363A1 (en) Electronic device
KR20010061331A (ko) 배경음악 기능을 갖는 이동 단말기
KR0134714B1 (ko) 응답전화기를 이용한 음성안내 전자계산 방법
KR100413270B1 (ko) 농아자의 의사소통을 위한 휴대전화기와 방법
KR100771647B1 (ko) 이동통신 단말기 및 이동통신 단말기의 음성신호 재생속도조절 방법
JP2013214924A (ja) 無線操作機、無線操作機の制御方法、およびプログラム
JP2000324223A (ja) 携帯電話機および情報端末装置
KR19990043026A (ko) 음성인식 한글입력장치
KR20190023889A (ko) 사용자 입력 패턴에 따른 스마트 단말기의 출력 설정 시스템