JP2003295899A - 音声入力装置 - Google Patents

音声入力装置

Info

Publication number
JP2003295899A
JP2003295899A JP2002093165A JP2002093165A JP2003295899A JP 2003295899 A JP2003295899 A JP 2003295899A JP 2002093165 A JP2002093165 A JP 2002093165A JP 2002093165 A JP2002093165 A JP 2002093165A JP 2003295899 A JP2003295899 A JP 2003295899A
Authority
JP
Japan
Prior art keywords
voice
man
voice input
machine interface
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002093165A
Other languages
English (en)
Inventor
Takeshi Otani
猛 大谷
Yasushi Yamazaki
泰 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002093165A priority Critical patent/JP2003295899A/ja
Priority to US10/292,504 priority patent/US7254537B2/en
Priority to DE60210739T priority patent/DE60210739T2/de
Priority to EP02257906A priority patent/EP1349149B1/en
Publication of JP2003295899A publication Critical patent/JP2003295899A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Noise Elimination (AREA)

Abstract

(57)【要約】 【課題】 マンマシンインタフェースが操作された場合
に発生する雑音としての操作音を効率良く除去し、音質
を向上させること。 【解決手段】 音声を入力するマイクロフォン60と、
マンマシンインタフェースとしてのキー部20の操作を
検出するキー入力検出部30と、キー入力検出部30に
より操作が検出された場合、検出期間内にマイクロフォ
ン60に入力された音声から操作音の成分を除去する雑
音除去部90とを備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、録音機器、携帯電
話端末やパーソナルコンピュータ等の音声入力を必要と
する音声入力装置に関するものであり、特に、音声入力
と並行してキーやマウス等のマンマシンインタフェース
が操作された場合に発生する雑音としての操作音(クリ
ック音等)を効率良く除去し、音質を向上させることが
できる音声入力装置に関するものである。
【0002】
【従来の技術】近年では、携帯電話端末や、PHS(Pe
rsonal Handyphone System)端末等の携帯端末には、通
話機能の他に、数百文字程度のテキストデータを送受信
するためのデータ通信機能が標準装備されている場合が
多い。
【0003】ここで、次世代通信方式であるIMT−2
000(International Mobile Telecommunications-20
00)方式においては、1台の携帯端末で同時に複数回線
を利用することによって、音声通信を行っている最中
に、当該音声通信を切断することなく、データ通信も行
うことができる。従って、かかる携帯端末では、通話し
ながら、キーを操作しつつテキストを入力した後、デー
タ通信も行うという利用形態も考えられる。
【0004】また、最近では、一般電話に比べて、通話
料金が安価なIP(Internet Protocol)電話システム
が注目されている。このIP電話システムは、インター
ネット電話システムと呼ばれており、マイクロフォンお
よびスピーカを備えたIP電話装置間で、IPネットワ
ークを介して音声データをやりとりすることにより、一
般電話と同様にして、通話が可能な通信システムであ
る。
【0005】ここで、上記IP電話装置は、ネットワー
ク通信が可能なコンピュータ装置であり、キーボードや
マウス等のマンマシンインタフェースの操作による電子
メールの送受信機能も備えている。
【0006】
【発明が解決しようとする課題】ところで、前述したよ
うに、従来の携帯端末やIP電話装置で通話をしながら
マンマシンインタフェース(キー、キーボード、マウ
ス)の操作が行われると、雑音としての操作音(クリッ
ク音等)がマイクロフォンに拾われ、音声に操作音が重
畳され、音質が著しく低下するという問題があった。
【0007】そこで、雑音除去装置を用いて、マイクロ
フォンに入力された音声の信号に含まれる雑音(操作
音)の成分を除去するという方法も考えられる。しかし
ながら、かかる方法では、雑音除去装置側で操作音がい
つ発生するかを予測できないため、常時、マイクロフォ
ンに入力された音声の信号に対して、雑音除去処理を実
行しなければならない。従って、上記方法では、雑音が
無い状態でも音声の信号に雑音除去処理が施されるた
め、音質の劣化が避けられないのである。
【0008】本発明は、上記に鑑みてなされたもので、
マンマシンインタフェースが操作された場合に発生する
雑音としての操作音を効率良く除去し、音質を向上させ
ることができる音声入力装置を提供することを目的とす
る。
【0009】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、音声を入力する音声入力手段と、マンマ
シンインタフェースの操作を検出する検出手段と、前記
検出手段により前記操作が検出された場合、検出期間内
に前記音声入力手段に入力された音声から前記マンマシ
ンインタフェースの操作音の成分を除去する雑音除去手
段とを備えたことを特徴とする。
【0010】この発明によれば、マンマシンインタフェ
ースの操作が検出された場合、検出期間内に入力された
音声からマンマシンインタフェースの操作音の成分を除
去することとしたので、マンマシンインタフェースが操
作された場合に発生する雑音としての操作音を効率良く
除去し、音質を向上させることができる。
【0011】また、本発明は、音声を入力する音声入力
手段と、マンマシンインタフェースの操作を検出し、操
作開始および操作終了に対応する操作時刻情報を出力す
る検出手段と、前記検出手段により前記操作が検出され
た場合、前記操作時刻情報により決定される検出期間内
に前記音声入力手段に入力された音声から前記マンマシ
ンインタフェースの操作音の成分を除去する雑音除去手
段とを備えたことを特徴とする。
【0012】この発明によれば、マンマシンインタフェ
ースの操作が検出された場合、操作時刻情報により決定
される検出期間内に入力された音声からマンマシンイン
タフェースの操作音の成分を除去することとしたので、
マンマシンインタフェースが操作された場合に発生する
雑音としての操作音を効率良く除去し、音質を向上させ
ることができる。
【0013】また、本発明は、音声を入力する音声入力
手段と、マンマシンインタフェースの操作を検出する検
出手段と、前記検出手段により前記操作が検出された場
合、検出期間内に前記音声入力手段に入力された音声に
おいて、前記マンマシンインタフェースの操作が検出さ
れた期間を抑制処理する抑制処理手段とを備えたことを
特徴とする。
【0014】この発明によれば、マンマシンインタフェ
ースの操作が検出された場合、検出期間内に入力された
音声において、検出期間を抑制処理することとしたの
で、マンマシンインタフェースが操作された場合に発生
する雑音としての操作音を効率良く除去することができ
る。
【0015】
【発明の実施の形態】以下、図面を参照して本発明にか
かる音声入力装置の実施の形態1〜7について詳細に説
明する。
【0016】(実施の形態1)図1は、本発明にかかる
実施の形態1の構成を示すブロック図である。この図に
は、通話機能とデータ通信機能とを兼ね備えた携帯端末
10の要部の構成が図示されている。図2は、図1に示
した携帯端末10の外観構成を示す図である。図2にお
いては、図1の各部に対応する部分には同一の符号を付
ける。
【0017】図1および図2に示したキー部20は、マ
ンマシンインタフェースであり、数字入力、テキスト入
力等に用いられる複数のキーから構成されている。この
キー部20は、電話番号の入力や、電子メールのテキス
ト入力時にユーザにより操作される。
【0018】この操作時には、操作音(クリック音)が
発生する。このキークリック音は、通話時に後述するマ
イクロフォン60に拾われ、話者の音声に重畳された状
態で入力される。
【0019】また、キー部20からは、操作時に、キー
コード等に対応するキー信号S1が出力される。キー入
力検出部30は、キー信号S1が入力されると、キーが
操作されたことを示すキー検出信号S2を出力する。
【0020】制御部40は、キー信号S1に基づいて、
制御信号(ディジタル)を生成し、各部を制御するもの
である。例えば、制御部40は、キー信号S1からテキ
ストを解読し、このテキストを表示部50(図2参照)
に表示させる等の制御を行う。
【0021】マイクロフォン60(図2参照)は、通話
時に話者の音声やキー部20からの操作音を音声信号に
変換する。A/D(Analog/Digital)変換部70は、マ
イクロフォン60からのアナログの音声信号をディジタ
ル化する。第1のメモリ80は、A/D変換部70から
出力される音声信号をバッファリングする。
【0022】雑音除去部90は、キー検出信号S2をト
リガとして、第1のメモリ80からの音声信号におい
て、操作音の成分が重畳された区間から操作音の成分を
雑音として除去する機能を備えている。
【0023】具体的には、後述するように、上記区間の
信号波形を、対応する音声信号波形に補間するという波
形補間(図5参照)により、雑音除去を行う。また、キ
ー検出信号S2が入力されていない間において、雑音除
去部90は、第1のメモリ80からの音声信号をスルー
で後段の書込部100へ出力する。
【0024】書込部100は、雑音除去部90からの音
声信号(または操作音成分が除去された音声信号)を第
2のメモリ110に書き込む。エンコーダ120は、第
2のメモリ110からの音声信号をエンコードする。送
信部130は、エンコーダ120の出力信号を送信す
る。
【0025】図3は、図1に示したキー部20の構成を
示す図である。この図において、キー21は、バネ22
を介して設けられている。キー21が操作されると、バ
イアス電源23(電圧V0)がオンとされ、キー信号S
1が出力される。なお、実際には、キー部20は、複数
のキーから構成されている。
【0026】図4は、図1に示したキー検出信号S2の
波形を示す図である。例えば、時刻t0〜t1までの間
でキー21(図3参照)が操作されると、キー信号S1
がキー入力検出部30に入力される。この場合、キー入
力検出部30からは、図4に示したキー検出信号S2が
出力される。
【0027】つぎに、実施の形態1の動作について、図
6および図7に示したフローチャートを参照しつつ説明
する。以下では、通話中に、キー部20が操作され、マ
イクロフォン60に拾われた操作音の成分を雑音として
除去する場合について説明する。
【0028】図6に示したステップSA1では、A/D
変換部70は、マイクロフォン60より音声信号が入力
されたか否かを判断し、この場合、判断結果を「No」
として、同判断を繰り返す。そして、通話が開始される
と、話者の音声がマイクロフォン60により音声信号と
してA/D変換部70に入力される。
【0029】これにより、A/D変換部70は、ステッ
プSA1の判断結果を「Yes」とする。ステップSA
2では、A/D変換部70は、アナログの音声信号をデ
ジタル化する。ステップSA3では、A/D変換部70
からの音声信号(ディジタル)が第1のメモリ80に格
納される。
【0030】ステップSA4では、雑音除去部90は、
キー入力検出部30よりキー検出信号S2が入力された
か否かを判断し、この場合、判断結果を「No」とし
て、第1のメモリ80からの音声信号をスルーで書込部
100へ出力する。ステップSA5では、書込部100
は、上記音声信号を第2のメモリ110に格納する。
【0031】ステップSA6では、エンコーダ120
は、第2のメモリ110からの音声信号をエンコードす
る。ステップSA7では、送信部130は、エンコード
された出力信号を送信する。以後、図5(a)に示した
波形の音声信号が入力されている間、上述した動作が繰
り返される。
【0032】そして、時刻t0(図5(a)参照)でキ
ー部20が操作されると、キー信号S1がキー入力検出
部30および制御部40に入力される。また、時刻t0
では、操作音がマイクロフォン60に拾われるため、音
声に操作音が重畳され、図5(a)に示した時刻t0の
ように音声信号の振幅が急激に高くなる。
【0033】これにより、雑音除去部90は、ステップ
SA4の判断結果を「Yes」として、ステップSA8
で波形補間処理を実行する。この波形補間処理では、操
作音が重畳される時刻t0〜時刻t1までの区間以上の
Nサンプル区間の波形を、時刻t0以前の波形であって
相関係数が高い波形(図5(b):波形D)で補間する
ことにより、雑音としての操作音の成分を音声信号から
除去する処理である。
【0034】具体的には、図7に示したステップSB1
では、雑音除去部90は、つぎの(1)式で表される相
関係数cor[k]のkに0を代入する。
【数1】
【0035】上記相関係数は、図5(a)に示した時刻
t0(図4参照)、すなわち、操作音が発生した時刻の
直前のMサンプル区間の波形Aと、Mサンプル区間の前
のkサンプル検索区間(始点ps〜終点pe)内の波形
(例えば、同図B波形:Mサンプル区間)の波形との相
関関係を表す係数である。この相関係数が高いほど、両
波形が似ていることを意味する。
【0036】また、以下に説明するステップSB1〜ス
テップSB5では、kサンプル検索区間においてMサン
プル区間を始点psから1サンプルずつ右にシフトしつ
つ、波形Aとkサンプル検索区間内の波形(Mサンプル
区間)との相関係数を(1)式から算出する。
【0037】ステップSB2では、雑音除去部90は、
波形Aと、k=0の場合の波形Bとの相関係数を(1)
式から算出する。ステップSB3では、雑音除去部90
は、上記相関係数を算出した算出区間情報(始点psか
らMサンプル分)および相関係数をメモリ(図示略)に
保存する。ステップSB4では、雑音除去部90は、波
形Aに対応する波形(この場合、波形B)がkサンプル
検索区間内であるか否かを判断し、この場合、判断結果
を「Yes」とする。
【0038】ステップSB5では、雑音除去部90は、
(1)式のkを1インクリメントする。これにより、図
5(a)に示した波形よりも1サンプル分右シフトした
波形が、波形Aとの相関係数の算出対象となる。以後、
ステップSB2〜ステップSB5が繰り返され、kサン
プル検索区間での波形(1サンプルずつ右シフト)と、
波形Aとの相関係数が順次算出される。
【0039】そして、ステップSB4の判断結果が「N
o」になると、ステップSB6では、雑音除去部90
は、つぎの(2)式から相関係数cor[k]が最大と
なる時刻tLを算出する。相関係数cor[k]は、
(1)式から算出されている。
【数2】
【0040】(2)式のarg max(cor
[k])は、図5に示した始点ps〜終点peにおい
て、相関係数cor[k]が最大となる時刻tLを算出
せよという関数である。すなわち、(2)式では、図5
(a)に示した波形Aと最も似ている波形を特定するた
めの時刻が算出される。この場合、図5(a)に示した
波形Aと波形Cとの相関係数が最大であるとすると、波
形Cの左端を示す時刻tLが算出される。
【0041】ステップSB7では、雑音除去部90は、
時刻t0からNサンプル区間の波形(操作音成分を含
む)を、波形Cの右端を示す時刻tmからNサンプル区
間の波形で補間する。これにより、図5(b)に示した
ように、実施の形態1では、波形Dで補間され、操作音
の成分が除去されることで、音質が向上する。なお、実
施の形態1においては、波形補間に代えて、当該Nサン
プル区間の音声信号の振幅をx倍(但し0≦x<1)す
る抑制処理を実行してもよい。
【0042】以上説明したように、実施の形態1によれ
ば、マンマシンインタフェースとしてのキー部20の操
作が検出された場合、図5(a)に示した波形補間によ
り、操作音の成分を除去することとしたので、雑音とし
ての操作音を効率良く除去し、音質を向上させることが
できる。
【0043】(実施の形態2)さて、前述した実施の形
態1では、図1に示したキー部20からのキー信号S1
に基づいて、キー検出信号S2を出力する構成例につい
て説明したが、制御部40からの制御信号に基づいて、
キー検出信号S2を出力する構成例としてもよい。以下
では、この構成例を実施の形態2として説明する。
【0044】図8は、本発明にかかる実施の形態2の構
成を示すブロック図である。この図において、図1の各
部に対応する部分には同一の符号を付け、その説明を省
略する。同図に示した携帯端末200においては、図1
に示したキー入力検出部30に代えて、キー入力検出部
210が設けられている。
【0045】このキー入力検出部210は、制御部40
からの制御信号(デジタル信号)からキー検出信号S2
を生成し、これを雑音除去部90へ出力する。なお、上
記動作を除く基本的な動作は、前述した実施の形態1の
動作と同様である。
【0046】以上説明したように、実施の形態2によれ
ば、実施の形態1と同様の効果が得られる。
【0047】(実施の形態3)さて、実施の形態2で
は、図8に示した第1のメモリ80が設けられた構成例
について説明したが、この第1のメモリ80を設けない
構成例としてもよい。以下では、この構成例を実施の形
態3として説明する。
【0048】図9は、本発明にかかる実施の形態3の構
成を示すブロック図である。この図において、図8の各
部に対応する部分には同一の符号を付け、その説明を省
略する。この図に示した携帯端末300においては、図
8に示した第1のメモリ80が設けられていない。な
お、上記動作を除く基本的な動作は、前述した実施の形
態1の動作と同様である。
【0049】以上説明したように、実施の形態3によれ
ば、実施の形態1と同様の効果が得られる。
【0050】(実施の形態4)さて、実施の形態1で
は、図1に示したキー部20からのキー信号S1に基づ
いて、キー検出信号S2を出力する構成例について説明
したが、A/D変換部、およびキー信号保持部を設け、
このキー信号保持部からのキー信号に基づいて、キー検
出信号S2を出力する構成例としてもよい。以下では、
この構成例を実施の形態4として説明する。
【0051】図10は、本発明にかかる実施の形態4の
構成を示すブロック図である。この図において、図1の
各部に対応する部分には同一の符号を付け、その説明を
省略する。この図に示した携帯端末400においては、
図1に示したキー入力検出部30に代えて、A/D変換
部410、キー信号保持部420およびキー入力検出部
430が設けられている。
【0052】A/D変換部410は、キー部20からの
キー信号S1(アナログ信号)をディジタル化する。キ
ー信号保持部420は、A/D変換部410からのキー
信号(ディジタル信号)を保持する。キー入力検出部4
30は、キー信号保持部420に保持されているキー信
号に基づいてキー検出信号S2を生成し、これを雑音除
去部90へ出力する。なお、上記動作を除く基本的な動
作は、前述した実施の形態1の動作と同様である。
【0053】以上説明したように、実施の形態4によれ
ば、実施の形態1と同様の効果が得られる。
【0054】(実施の形態5)さて、実施の形態1で
は、図1に示したキー入力検出部30から雑音除去部9
0へキー検出信号S2を直接出力する構成例について説
明したが、キー検出信号S2に基づいて操作の検出時刻
を監視し、検出時刻信号を雑音除去部90へ出力する構
成例としてもよい。以下では、この構成例を実施の形態
5として説明する。
【0055】図11は、本発明にかかる実施の形態5の
構成を示すブロック図である。この図において、図1の
各部に対応する部分には同一の符号を付け、その説明を
省略する。この図に示した携帯端末500においては、
図1に示したキー入力検出部30と雑音除去部90との
間に、検出時刻監視部510が介挿されている。
【0056】この検出時刻監視部510は、キー入力検
出部30からのキー検出信号S2(図4参照)の立ち上
がりおよび立ち下がりをトリガとして、キー入力を監視
しており、上記立ち上がりの時刻(操作開始時刻)、立
ち下がりの時刻(操作終了時刻)を検出時刻信号S3と
して雑音除去部90へ出力する。
【0057】雑音除去部90は、検出時刻信号S3から
得られる操作開始時刻および操作終了時刻に基づいて、
波形補間処理を実行する。なお、上記動作を除く基本的
な動作は、前述した実施の形態1の動作と同様である。
【0058】以上説明したように、実施の形態5によれ
ば、実施の形態1と同様の効果が得られる。
【0059】(実施の形態6)さて、実施の形態5で
は、図11に示した検出時刻監視部510から雑音除去
部90へ検出時刻信号S3を出力する構成例について説
明したが、検出時刻監視部510と雑音除去部90の双
方に基準信号を供給し、この基準信号により、同期をと
る構成例としてもよい。以下では、この構成例を実施の
形態6として説明する。
【0060】図12は、本発明にかかる実施の形態6の
構成を示すブロック図である。この図において、図11
の各部に対応する部分には同一の符号を付け、その説明
を省略する。この図に示した携帯端末600において
は、基準信号発生部610が設けられている。
【0061】基準信号発生部610は、図13に示した
一定周期(既知)の基準信号S4を発生し、これを検出
時刻監視部510および雑音除去部90の双方へ供給し
ている。検出時刻監視部510では、基準信号S4を基
準として、検出時刻信号S3を生成している。また、検
出時刻監視部510および雑音除去部90は、基準信号
S4で同期をとっている。なお、上記動作を除く基本的
な動作は、前述した実施の形態1の動作と同様である。
【0062】以上説明したように、実施の形態6によれ
ば、実施の形態1と同様の効果が得られる。
【0063】(実施の形態7)さて、前述した実施の形
態1〜6では、音声信号から操作音の成分を除去する構
成を携帯端末に適用した構成例について説明したが、I
P電話システムにも適用する構成例としてもよい。以下
では、この構成例を実施の形態7として説明する。
【0064】図14は、本発明にかかる実施の形態7の
概略構成を示すブロック図である。この図には、IP電
話システム700が図示されている。IP電話システム
700においては、IP電話装置710とIP電話装置
720との間でIP網730を介して通話に加えて、デ
ータ通信(電子メール通信)も行うことができるシステ
ムである。
【0065】IP電話装置710は、コンピュータ端末
711、キーボード712、マウス713、マイクロフ
ォン714、スピーカ715および表示部716から構
成されており、電話としての機能と、データ通信機能と
を備えている。キーボード712およびマウス713
は、データ通信時のテキストの入力や各種操作に用いら
れる。マイクロフォン714は、通話時に話者の音声を
音声信号に変換する。スピーカ715は、通話時に相手
の音声を出力する。
【0066】IP電話装置720は、IP電話装置71
0と同一構成とされており、コンピュータ端末721、
キーボード722、マウス723、マイクロフォン72
4、スピーカ725および表示部726から構成されて
おり、電話としての機能と、データ通信機能とを備えて
いる。キーボード722およびマウス723は、データ
通信時のテキストの入力や各種操作に用いられる。マイ
クロフォン724は、通話時に話者の音声を音声信号に
変換する。スピーカ725は、通話時に相手の音声を出
力する。
【0067】図15は、図14に示したIP電話装置7
10の構成を示すブロック図であり、この図において、
図14および図1の各部に対応する部分には同一の符号
を付ける。なお、同図には、通話、各種操作、操作音成
分の除去を行うための構成のみが図示されている。
【0068】キー/マウス入力検出部717は、キーボ
ード712が操作された場合のキー信号や、マウス71
3が操作された場合のマウス信号を検出し、検出結果を
キー/マウス検出信号として出力する。
【0069】また、実施の形態7では、通話中に、キー
ボード712またはマウス713が操作されると、操作
音がマイクロフォン714に拾われ、音声信号に操作音
が重畳される。制御部718は、キー信号やマウス信号
に基づいて、制御信号を生成する。また、制御部718
は、制御信号に基づいて、各部を制御する。
【0070】検出時刻監視部719は、キー/マウス入
力検出部717からのキー/マウス検出信号の立ち上が
りおよび立ち下がりをトリガとして、キー入力を監視し
ており、上記立ち上がりの時刻(操作開始時刻)、立ち
下がりの時刻(操作終了時刻)を検出時刻信号として雑
音除去部90へ出力する。雑音除去部90は、検出時刻
信号から得られる操作開始時刻および操作終了時刻に基
づいて、前述した波形補間処理を実行する。
【0071】なお、上記動作を除く基本的な動作は、前
述した実施の形態1の動作と同様である。すなわち、通
話中に、キーボード712またはマウス713が操作さ
れると、操作音がマイクロフォン714に拾われ、音声
信号に操作音が重畳される。これにより、雑音除去部9
0では、実施の形態1と同様にして、波形補間処理によ
り、操作音の成分が音声信号から除去され、音質が向上
する。
【0072】以上説明したように、実施の形態7によれ
ば、実施の形態1と同様の効果が得られる。
【0073】以上本発明にかかる実施の形態1〜7につ
いて図面を参照して詳述してきたが、具体的な構成例は
これらの実施の形態1〜7に限られるものではなく、本
発明の要旨を逸脱しない範囲の設計変更等があっても本
発明に含まれる。
【0074】例えば、前述した実施の形態1〜7におい
ては、携帯端末またはIP電話装置の機能(波形補間、
音声信号の波形抑制等)を実現するためのプログラムを
図16に示したコンピュータ読み取り可能な記録媒体9
00に記録して、この記録媒体900に記録されたプロ
グラムを同図に示したコンピュータ800に読み込ま
せ、実行することにより各機能を実現してもよい。
【0075】同図に示したコンピュータ800は、上記
プログラムを実行するCPU(Central Processing Uni
t)810と、キーボード、マウス等の入力装置820
と、各種データを記憶するROM(Read Only Memory)
830と、演算パラメータ等を記憶するRAM(Random
Access Memory)840と、記録媒体900からプログ
ラムを読み取る読取装置850と、ディスプレイ、プリ
ンタ等の出力装置860と、装置各部を接続するバス8
70とから構成されている。
【0076】CPU810は、読取装置850を経由し
て記録媒体900に記録されているプログラムを読み込
んだ後、プログラムを実行することにより、前述した機
能を実現する。なお、記録媒体900としては、光ディ
スク、フレキシブルディスク、ハードディスク等が挙げ
られる。
【0077】(付記1)音声を入力する音声入力手段
と、マンマシンインタフェースの操作を検出する検出手
段と、前記検出手段により前記操作が検出された場合、
検出期間内に前記音声入力手段に入力された音声から前
記マンマシンインタフェースの操作音の成分を除去する
雑音除去手段と、を備えたことを特徴とする音声入力装
置。 (付記2)音声を入力する音声入力手段と、マンマシン
インタフェースが操作された場合の操作信号に基づい
て、各部を制御する制御信号を出力する制御手段と、前
記制御信号に基づいて、前記マンマシンインタフェース
の操作を検出する検出手段と、前記検出手段により前記
操作が検出された場合、検出期間内に前記音声入力手段
に入力された音声から前記マンマシンインタフェースの
操作音の成分を除去する雑音除去手段と、を備えたこと
を特徴とする音声入力装置。 (付記3)前記マンマシンインタフェースの操作時の出
力されるアナログ情報をデジタル情報に変換する変換手
段を備え、前記検出手段は、前記デジタル情報に基づい
て、前記操作を検出することを特徴とする付記1または
2に記載の音声入力装置。 (付記4)音声を入力する音声入力手段と、前記音声入
力手段に入力された音声の情報を蓄積する音声情報蓄積
手段と、マンマシンインタフェースの操作を検出する検
出手段と、前記検出手段により前記操作が検出された場
合、前記音声情報蓄積手段から前記音声の情報を読み出
し、検出期間内に前記音声入力手段に入力された音声か
ら前記マンマシンインタフェースの操作音の成分を除去
する雑音除去手段と、を備えたことを特徴とする音声入
力装置。 (付記5)前記マンマシンインタフェースの操作時の出
力されるアナログ情報をデジタル情報に変換する変換手
段と、前記デジタル情報を蓄積するデジタル情報蓄積手
段とを備え、前記検出手段は、前記デジタル情報蓄積手
段から読み出した前記デジタル情報に基づいて、前記操
作を検出することを特徴とする付記4に記載の音声入力
装置。 (付記6)音声を入力する音声入力手段と、マンマシン
インタフェースの操作を検出し、操作開始および操作終
了に対応する操作時刻情報を出力する検出手段と、前記
検出手段により前記操作が検出された場合、前記操作時
刻情報により決定される検出期間内に前記音声入力手段
に入力された音声から前記マンマシンインタフェースの
操作音の成分を除去する雑音除去手段と、を備えたこと
を特徴とする音声入力装置。 (付記7)一定周期の基準信号を発生する基準信号発生
手段を備え、前記検出手段は、前記基準信号に基づいて
前記操作時刻情報を出力することを特徴とする付記6に
記載の音声入力装置。 (付記8)前記マンマシンインタフェースは、データ通
信機能および通話機能を備えた携帯端末のキーであるこ
とを特徴とする付記1〜7のいずれか一つに記載の音声
入力装置。 (付記9)前記マンマシンインタフェースは、データ通
信機能および通話機能を備えたコンピュータ装置のキー
ボードであることを特徴とする付記1〜7のいずれか一
つに記載の音声入力装置。 (付記10)前記マンマシンインタフェースは、前記コ
ンピュータのマウスであることを特徴とする付記1〜7
のいずれか一つに記載の音声入力装置。 (付記11)前記マンマシンインタフェースは、音声録
音機能を備えた録音機器の操作部であることを特徴とす
る付記1〜7のいずれか一つに記載の音声入力装置。 (付記12)前記雑音除去手段は、波形補間により、前
記音声入力手段に入力された音声から前記マンマシンイ
ンタフェースの操作音の成分を除去することを特徴とす
る付記1〜11のいずれか一つに記載の音声入力装置。 (付記13)音声を入力する音声入力工程と、マンマシ
ンインタフェースの操作を検出する検出工程と、前記検
出工程により前記操作が検出された場合、検出期間内に
前記音声入力工程で入力された音声から前記マンマシン
インタフェースの操作音の成分を除去する雑音除去工程
と、を含むことを特徴とする音声入力方法。 (付記14)コンピュータを、音声を入力する音声入力
手段、マンマシンインタフェースの操作を検出する検出
手段、前記検出手段により前記操作が検出された場合、
検出期間内に前記音声入力手段に入力された音声から前
記マンマシンインタフェースの操作音の成分を除去する
雑音除去手段、として機能させるための音声入力プログ
ラム。 (付記15)コンピュータを、音声を入力する音声入力
手段、マンマシンインタフェースが操作された場合の操
作信号に基づいて、各部を制御する制御信号を出力する
制御手段、前記制御信号に基づいて、前記マンマシンイ
ンタフェースの操作を検出する検出手段、前記検出手段
により前記操作が検出された場合、検出期間内に前記音
声入力手段に入力された音声から前記マンマシンインタ
フェースの操作音の成分を除去する雑音除去手段、とし
て機能させるための音声入力プログラム。 (付記16)コンピュータを、音声を入力する音声入力
手段、前記音声入力手段に入力された音声の情報を蓄積
する音声情報蓄積手段、マンマシンインタフェースの操
作を検出する検出手段、前記検出手段により前記操作が
検出された場合、前記音声情報蓄積手段から前記音声の
情報を読み出し、検出期間内に前記音声入力手段に入力
された音声から前記マンマシンインタフェースの操作音
の成分を除去する雑音除去手段、として機能させるため
の音声入力プログラム。 (付記17)コンピュータを、音声を入力する音声入力
手段、マンマシンインタフェースの操作を検出し、操作
開始および操作終了に対応する操作時刻情報を出力する
検出手段、前記検出手段により前記操作が検出された場
合、前記操作時刻情報により決定される検出期間内に前
記音声入力手段に入力された音声から前記マンマシンイ
ンタフェースの操作音の成分を除去する雑音除去手段、
として機能させるための音声入力プログラム。 (付記18)音声を入力する音声入力手段と、マンマシ
ンインタフェースの操作を検出する検出手段と、前記検
出手段により前記操作が検出された場合、検出期間内に
前記音声入力手段に入力された音声において、前記マン
マシンインタフェースの操作が検出された期間を抑制処
理する抑制処理手段と、を備えたことを特徴とする音声
入力装置。 (付記19)音声を入力する音声入力工程と、マンマシ
ンインタフェースの操作を検出する検出工程と、前記検
出工程により前記操作が検出された場合、検出期間内に
前記音声入力工程で入力された音声において、前記マン
マシンインタフェースの操作が検出された期間を抑制処
理する抑制処理工程と、を含むことを特徴とする音声入
力方法。 (付記20)コンピュータを、音声を入力する音声入力
手段、マンマシンインタフェースの操作を検出する検出
手段、前記検出手段により前記操作が検出された場合、
検出期間内に前記音声入力手段に入力された音声におい
て、前記マンマシンインタフェースの操作が検出された
期間を抑制処理する抑制処理手段、として機能させるた
めの音声入力プログラム。
【0078】
【発明の効果】以上説明したように、本発明によれば、
マンマシンインタフェースの操作が検出された場合、検
出期間内に入力された音声からマンマシンインタフェー
スの操作音の成分を除去することとしたので、マンマシ
ンインタフェースが操作された場合に発生する雑音とし
ての操作音を効率良く除去し、音質を向上させることが
できるという効果を奏する。
【0079】また、本発明によれば、マンマシンインタ
フェースの操作が検出された場合、操作時刻情報により
決定される検出期間内に入力された音声からマンマシン
インタフェースの操作音の成分を除去することとしたの
で、マンマシンインタフェースが操作された場合に発生
する雑音としての操作音を効率良く除去し、音質を向上
させることができるという効果を奏する。
【0080】また、本発明によれば、マンマシンインタ
フェースの操作が検出された場合、基準信号に基づいて
操作時刻情報を出力し、この操作時刻情報により決定さ
れる検出期間内に入力された音声からマンマシンインタ
フェースの操作音の成分を除去することとしたので、マ
ンマシンインタフェースが操作された場合に発生する雑
音としての操作音を効率良く除去し、音質を向上させる
ことができるという効果を奏する。
【0081】また、発明によれば、マンマシンインタフ
ェースの操作が検出された場合、検出期間内に入力され
た音声からマンマシンインタフェースの操作音の成分を
波形補間により除去することとしたので、マンマシンイ
ンタフェースが操作された場合に発生する雑音としての
操作音を効率良く除去し、音質を向上させることができ
るという効果を奏する。
【0082】また、発明によれば、マンマシンインタフ
ェースの操作が検出された場合、検出期間内に入力され
た音声において、検出期間を抑制処理することとしたの
で、マンマシンインタフェースが操作された場合に発生
する雑音としての操作音を効率良く除去することができ
るという効果を奏する。
【図面の簡単な説明】
【図1】本発明にかかる実施の形態1の構成を示すブロ
ック図である。
【図2】図1に示した携帯端末10の外観構成を示す図
である。
【図3】図1に示したキー部20の構成を示す図であ
る。
【図4】図1に示したキー検出信号S2の波形を示す図
である。
【図5】同実施の形態1における波形補間処理を説明す
る図である。
【図6】同実施の形態1の動作を説明するフローチャー
トである。
【図7】図6に示した波形補間処理を説明するフローチ
ャートである。
【図8】本発明にかかる実施の形態2の構成を示すブロ
ック図である。
【図9】本発明にかかる実施の形態3の構成を示すブロ
ック図である。
【図10】本発明にかかる実施の形態4の構成を示すブ
ロック図である。
【図11】本発明にかかる実施の形態5の構成を示すブ
ロック図である。
【図12】本発明にかかる実施の形態6の構成を示すブ
ロック図である。
【図13】図12に示した基準信号S4の波形を示す図
である。
【図14】本発明にかかる実施の形態7の概略構成を示
すブロック図である。
【図15】図14に示したIP電話装置710の構成を
示すブロック図である。
【図16】本発明にかかる実施の形態1〜7の変形例の
構成を示すブロック図である。
【符号の説明】
10 携帯端末 20 キー部 30 キー入力検出部 60 マイクロフォン 70 A/D変換部 80 第1のメモリ 90 雑音除去部 200 携帯端末 210 キー入力検出部 300 携帯端末 210 キー入力検出部 400 携帯端末 410 A/D変換部 420 キー信号保持部 430 キー入力検出部 500 携帯端末 510 キー入力検出部 520 検出時刻監視部 600 携帯端末 610 基準信号発生部 710 IP電話装置 711 コンピュータ端末 712 キーボード 713 マウス 714 マイクロフォン 717 キー/マウス入力検出部
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D015 EE05 5K052 AA01 BB01 DD21 EE00 EE17 FF12 FF27

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力する音声入力手段と、 マンマシンインタフェースの操作を検出する検出手段
    と、 前記検出手段により前記操作が検出された場合、検出期
    間内に前記音声入力手段に入力された音声から前記マン
    マシンインタフェースの操作音の成分を除去する雑音除
    去手段と、 を備えたことを特徴とする音声入力装置。
  2. 【請求項2】 音声を入力する音声入力手段と、 マンマシンインタフェースの操作を検出し、操作開始お
    よび操作終了に対応する操作時刻情報を出力する検出手
    段と、 前記検出手段により前記操作が検出された場合、前記操
    作時刻情報により決定される検出期間内に前記音声入力
    手段に入力された音声から前記マンマシンインタフェー
    スの操作音の成分を除去する雑音除去手段と、 を備えたことを特徴とする音声入力装置。
  3. 【請求項3】 一定周期の基準信号を発生する基準信号
    発生手段を備え、前記検出手段は、前記基準信号に基づ
    いて前記操作時刻情報を出力することを特徴とする請求
    項2に記載の音声入力装置。
  4. 【請求項4】 前記雑音除去手段は、波形補間により、
    前記音声入力手段に入力された音声から前記マンマシン
    インタフェースの操作音の成分を除去することを特徴と
    する請求項1〜3のいずれか一つに記載の音声入力装
    置。
  5. 【請求項5】 音声を入力する音声入力手段と、 マンマシンインタフェースの操作を検出する検出手段
    と、 前記検出手段により前記操作が検出された場合、検出期
    間内に前記音声入力手段に入力された音声において、前
    記マンマシンインタフェースの操作が検出された期間を
    抑制処理する抑制処理手段と、 を備えたことを特徴とする音声入力装置。
JP2002093165A 2002-03-28 2002-03-28 音声入力装置 Pending JP2003295899A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2002093165A JP2003295899A (ja) 2002-03-28 2002-03-28 音声入力装置
US10/292,504 US7254537B2 (en) 2002-03-28 2002-11-13 Speech input device
DE60210739T DE60210739T2 (de) 2002-03-28 2002-11-15 Spracheingabegerät mit Geräuschunterdrückung
EP02257906A EP1349149B1 (en) 2002-03-28 2002-11-15 Speech input device with noise reduction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002093165A JP2003295899A (ja) 2002-03-28 2002-03-28 音声入力装置

Publications (1)

Publication Number Publication Date
JP2003295899A true JP2003295899A (ja) 2003-10-15

Family

ID=27800534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002093165A Pending JP2003295899A (ja) 2002-03-28 2002-03-28 音声入力装置

Country Status (4)

Country Link
US (1) US7254537B2 (ja)
EP (1) EP1349149B1 (ja)
JP (1) JP2003295899A (ja)
DE (1) DE60210739T2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005045807A1 (ja) * 2003-11-05 2005-05-19 Sanyo Electric Co., Ltd. 電子機器
JP2006065067A (ja) * 2004-08-27 2006-03-09 Nec Corp 音声処理装置、音声処理方法及び音声処理プログラム
WO2007049696A1 (ja) 2005-10-26 2007-05-03 Nec Corporation 電話端末および信号処理方法
JP2011048369A (ja) * 2009-08-25 2011-03-10 Zarlink Semiconductor Inc オーディオデータストリーム中のクリック音の除去
JP2012093641A (ja) * 2010-10-28 2012-05-17 Toshiba Corp 携帯型電子機器
JP2012156625A (ja) * 2011-01-24 2012-08-16 Nec Saitama Ltd 携帯端末、ノイズ除去処理方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8243950B2 (en) * 2005-11-02 2012-08-14 Yamaha Corporation Teleconferencing apparatus with virtual point source production
US9922640B2 (en) * 2008-10-17 2018-03-20 Ashwin P Rao System and method for multimodal utterance detection
GB0919672D0 (en) * 2009-11-10 2009-12-23 Skype Ltd Noise suppression
GB0919673D0 (en) 2009-11-10 2009-12-23 Skype Ltd Gain control for an audio signal
JP5538918B2 (ja) * 2010-01-19 2014-07-02 キヤノン株式会社 音声信号処理装置、音声信号処理システム
US8867757B1 (en) * 2013-06-28 2014-10-21 Google Inc. Microphone under keyboard to assist in noise cancellation
JP7362766B2 (ja) * 2019-11-19 2023-10-17 株式会社ソニー・インタラクティブエンタテインメント 操作デバイス
CN114974320A (zh) * 2021-02-24 2022-08-30 瑞昱半导体股份有限公司 音频转接器的控制电路及控制方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5584010A (en) 1978-12-19 1980-06-24 Sharp Corp Code error correction system for pcm-system signal regenarator
CA1157939A (en) * 1980-07-14 1983-11-29 Yoshizumi Watatani Noise elimination circuit in a magnetic recording and reproducing apparatus
JPS57184334A (en) 1981-05-09 1982-11-13 Nippon Gakki Seizo Kk Noise eliminating device
JPH021661A (ja) 1988-06-10 1990-01-05 Oki Electric Ind Co Ltd パケット補間方式
AU633673B2 (en) * 1990-01-18 1993-02-04 Matsushita Electric Industrial Co., Ltd. Signal processing device
JPH05307432A (ja) 1992-04-30 1993-11-19 Nippon Telegr & Teleph Corp <Ntt> 時刻タグ付加による多チャネル間同期統合装置
JPH06314162A (ja) 1993-04-29 1994-11-08 Internatl Business Mach Corp <Ibm> マルチメディア・スタイラス
JPH09149157A (ja) 1995-11-24 1997-06-06 Casio Comput Co Ltd 通信端末装置
JPH09204290A (ja) 1996-01-25 1997-08-05 Nec Corp 操作音消去装置
US6240383B1 (en) * 1997-07-25 2001-05-29 Nec Corporation Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal
DE19736517A1 (de) 1997-08-22 1999-02-25 Alsthom Cge Alcatel Verfahren zur Reduzierung von Störungen bei der Übertragung eines elektrischen Nachrichtensignals
US6324499B1 (en) * 1999-03-08 2001-11-27 International Business Machines Corp. Noise recognizer for speech recognition systems
US6778959B1 (en) * 1999-10-21 2004-08-17 Sony Corporation System and method for speech verification using out-of-vocabulary models

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005045807A1 (ja) * 2003-11-05 2005-05-19 Sanyo Electric Co., Ltd. 電子機器
US7924324B2 (en) 2003-11-05 2011-04-12 Sanyo Electric Co., Ltd. Sound-controlled electronic apparatus
JP2006065067A (ja) * 2004-08-27 2006-03-09 Nec Corp 音声処理装置、音声処理方法及び音声処理プログラム
WO2007049696A1 (ja) 2005-10-26 2007-05-03 Nec Corporation 電話端末および信号処理方法
JP5182556B2 (ja) * 2005-10-26 2013-04-17 日本電気株式会社 電話端末および信号処理方法
JP2011048369A (ja) * 2009-08-25 2011-03-10 Zarlink Semiconductor Inc オーディオデータストリーム中のクリック音の除去
JP2012093641A (ja) * 2010-10-28 2012-05-17 Toshiba Corp 携帯型電子機器
JP2012156625A (ja) * 2011-01-24 2012-08-16 Nec Saitama Ltd 携帯端末、ノイズ除去処理方法

Also Published As

Publication number Publication date
EP1349149B1 (en) 2006-04-19
US20030187640A1 (en) 2003-10-02
DE60210739T2 (de) 2006-08-31
US7254537B2 (en) 2007-08-07
EP1349149A2 (en) 2003-10-01
DE60210739D1 (de) 2006-05-24
EP1349149A3 (en) 2004-05-19

Similar Documents

Publication Publication Date Title
JP2003295899A (ja) 音声入力装置
CN101207663A (zh) 网络通信装置及消除网络通信装置的噪音的方法
US7693293B2 (en) Sound processing device and input sound processing method
JP2003143683A (ja) コマンド入力装置
JP2009020291A (ja) 音声処理装置および通信端末装置
US8175525B2 (en) Conversion from note-based audio format to PCM-based audio format
KR20070031117A (ko) 데이터 검색기능이 구비된 이동통신 단말기 및 그 동작방법
JP2010010856A (ja) ノイズキャンセル装置、ノイズキャンセル方法、ノイズキャンセルプログラム、ノイズキャンセルシステム、及び、基地局
CN105718179B (zh) 信息处理方法及装置
JP2006325267A (ja) 携帯端末装置
CN105718061B (zh) 一种存储空间的清理方法和装置
JP6256342B2 (ja) Dtmf信号消去装置、dtmf信号消去方法、およびdtmf信号消去プログラム
CN105718557B (zh) 一种信息搜索方法及装置
EP1788553B1 (en) Conversion from note-based audio format to PCM-based audio format
JP4354038B2 (ja) デジタル信号レベル制御装置および制御方法
CN105118521B (zh) 噪音抑制方法、装置及系统
JP2008112056A (ja) 音声信号処理装置
JP2005274917A (ja) 音声復号装置
JP2003318674A (ja) ゲイン調整装置
JP2001237920A (ja) 入力レベル調整回路
JP2017049291A (ja) 雑音低減装置、雑音低減方法、雑音低減プログラム
JP2007189398A (ja) 音声録音装置
JP5046661B2 (ja) オーディオ装置
WO2009140792A1 (zh) 降低音频干扰的方法及其装置
JP2006166203A (ja) 通話制御装置及び通話制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041006

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070514

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070703