JPH069000B2 - 音声情報処理方法 - Google Patents
音声情報処理方法Info
- Publication number
- JPH069000B2 JPH069000B2 JP56134766A JP13476681A JPH069000B2 JP H069000 B2 JPH069000 B2 JP H069000B2 JP 56134766 A JP56134766 A JP 56134766A JP 13476681 A JP13476681 A JP 13476681A JP H069000 B2 JPH069000 B2 JP H069000B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- audio signal
- signal
- parameter
- processing method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
【発明の詳細な説明】 [技術分野] 本発明は、入力音声信号から除去したい音声信号を除去
する音声情報処理方法に関するものである。
する音声情報処理方法に関するものである。
[従来技術] 従来、音声信号から音声信号を波形レベルで差し引いた
り、音声パラメータから音声パラメータを差し引いたり
して所望の音声情報を入手しようとするものはあった。
り、音声パラメータから音声パラメータを差し引いたり
して所望の音声情報を入手しようとするものはあった。
しかしながら、従来の波形レベルでの音声信号の差し引
きは、両音声信号間の時間的遅延が非常に大きな影響を
与え、微小なずれでも音声信号の差し引き処理は全く効
果が得られないという結果になってしまう。
きは、両音声信号間の時間的遅延が非常に大きな影響を
与え、微小なずれでも音声信号の差し引き処理は全く効
果が得られないという結果になってしまう。
また、遅延時間の計算は非常に困難なものであり、距離
や環境条件を細かく考慮して行わなければならず、音声
信号レベルでの計算は事実上不可能なものであった。
や環境条件を細かく考慮して行わなければならず、音声
信号レベルでの計算は事実上不可能なものであった。
従来の、音声パラメータから音声パラメータを差し引く
処理は、差し引き処理をして得られる所望の音声情報が
差し引き処理を行ったパラメータに限定される為、その
音声情報の活用度が極めて限られたものとなってしまう
という欠点があった。
処理は、差し引き処理をして得られる所望の音声情報が
差し引き処理を行ったパラメータに限定される為、その
音声情報の活用度が極めて限られたものとなってしまう
という欠点があった。
[目的] 以上の点に鑑み、本発明は、第1の音声信号を入力し、
前記第1の音声信号が混入された第2の音声信号を入力
し、パラメータ分析により前記第1の音声信号の特徴パ
ラメータを抽出し、前記抽出した特徴パラメータを係数
と定めた逆フィルムを用いて、前記入力した第2の音声
信号から前記第1の音声信号を除去することのできる音
声情報処理方法を提供することにより、取り除きたい音
声を除去した所望の音声を活用度が高い音声信号の状態
で得ることを目的とする。
前記第1の音声信号が混入された第2の音声信号を入力
し、パラメータ分析により前記第1の音声信号の特徴パ
ラメータを抽出し、前記抽出した特徴パラメータを係数
と定めた逆フィルムを用いて、前記入力した第2の音声
信号から前記第1の音声信号を除去することのできる音
声情報処理方法を提供することにより、取り除きたい音
声を除去した所望の音声を活用度が高い音声信号の状態
で得ることを目的とする。
以上の点に鑑み、本発明は、第1の音声信号の特徴パラ
メータを抽出するパラメータ分析器にPARCOR型を用いる
ことにより、より二信号間の位相のずれに影響されない
音声信号の除去処理を実現することを目的とする。
メータを抽出するパラメータ分析器にPARCOR型を用いる
ことにより、より二信号間の位相のずれに影響されない
音声信号の除去処理を実現することを目的とする。
[実施例] 本発明による一実施例を図面を参照して説明する。
第1図において、1は音声認識装置で、第2図はその詳
細を示す。同図において、111はローパスフィルタ,
112はA/D変換器、113はPARCOR型逆フィルタ,
114は認識回路,211はローパスフィルタ,212
はA/D変換器,213はPARCOR型パラメータ分析器,
214は可変遅延回路である。2は被制御機器で、音声
発生回路21,音声発生器22,制御回路23等を有し
ている。
細を示す。同図において、111はローパスフィルタ,
112はA/D変換器、113はPARCOR型逆フィルタ,
114は認識回路,211はローパスフィルタ,212
はA/D変換器,213はPARCOR型パラメータ分析器,
214は可変遅延回路である。2は被制御機器で、音声
発生回路21,音声発生器22,制御回路23等を有し
ている。
以上の構成から成る実施例の作動を説明する。
音声認識装置1は認識用音声信号入力端子101から認
識用音声信号を受け、被制御機器2の具備する音声信号
発生回路21からの出力を補正音声信号入力端子201
から受けて音声認識処理を行い、被制御機器2の具備す
る制御回路23に対し制御信号出力端子301から制御
信号を出力する。
識用音声信号を受け、被制御機器2の具備する音声信号
発生回路21からの出力を補正音声信号入力端子201
から受けて音声認識処理を行い、被制御機器2の具備す
る制御回路23に対し制御信号出力端子301から制御
信号を出力する。
第2図を参照してさらに音声認識装置の作動を説明す
る。
る。
認識用音声信号入力端子101から入力された音声信号
は認識処理の前処理としてローパスフィルター111及
びA/D変換器112を経てディジタル化される。
は認識処理の前処理としてローパスフィルター111及
びA/D変換器112を経てディジタル化される。
ここでこの信号中には第1図における被制御機器2の具
備する音声発生器22からの音声情報が混在しているか
ら、このままでは認識処理に適さない。
備する音声発生器22からの音声情報が混在しているか
ら、このままでは認識処理に適さない。
そこで被制御機器2内の音声信号発生器21の出力を端
子201に印加する。補正用音声信号入力端子201か
ら入力された音声信号はローパスフィルター211にお
いて高周波成分を濾波され、次いでA/D変換器212
によりディジタル信号化された後、PARCOR型パラメータ
分析器213により適当な周期でパラメータ化される。
PARCOR分析器213により抽出されたパラメータを可変
遅延回路214を用いて適当な遅延を加えた後PARCOR型
逆フィルター113に印加し、これに上記A/D変換器
112によりディジタル化された認識用音声信号を通す
ことにより被制御機器2による音声情報を除去し純粋に
使用者だけの音声信号を得る。
子201に印加する。補正用音声信号入力端子201か
ら入力された音声信号はローパスフィルター211にお
いて高周波成分を濾波され、次いでA/D変換器212
によりディジタル信号化された後、PARCOR型パラメータ
分析器213により適当な周期でパラメータ化される。
PARCOR分析器213により抽出されたパラメータを可変
遅延回路214を用いて適当な遅延を加えた後PARCOR型
逆フィルター113に印加し、これに上記A/D変換器
112によりディジタル化された認識用音声信号を通す
ことにより被制御機器2による音声情報を除去し純粋に
使用者だけの音声信号を得る。
こうして得られた被制御機器からの混在のないディジタ
ル音声情報は認識回路114により高い認識率が認識処
理され、その結果としての制御信号が制御信号出力端子
301から出力される。
ル音声情報は認識回路114により高い認識率が認識処
理され、その結果としての制御信号が制御信号出力端子
301から出力される。
以上説明した様に本発明によれば、音声認識装置におい
て制御する対象の機器が音声発生機能を有し、それが音
声発生中であってもその影響を全く受けない音声認識処
理を行うことができるものである。
て制御する対象の機器が音声発生機能を有し、それが音
声発生中であってもその影響を全く受けない音声認識処
理を行うことができるものである。
又本発明の説明例ではPARCOR方式を用いたが、本発明は
それのみに限定されるものではなく音声を表わす特徴パ
ラメータを使用する分析方式であれば全く実現可能であ
る。
それのみに限定されるものではなく音声を表わす特徴パ
ラメータを使用する分析方式であれば全く実現可能であ
る。
[効果] 以上説明した様に本発明によれば、第1の音声信号を入
力し、前記第1の音声信号が混入された第2の音声信号
を入力し、パラメータ分析器により前記第1の音声信号
の特徴パラメータを抽出し、前記抽出した特徴パラメー
タを係数と定めた逆フィルタを用いて、前記入力した第
2の音声信号から前記第1の音声信号を除去することを
特徴とする音声情報処理方法を提供することにより、取
り除きたい音声を除去した所望の音声を、活用度の高い
音声信号の状態で得ることができるという効果が得られ
る。
力し、前記第1の音声信号が混入された第2の音声信号
を入力し、パラメータ分析器により前記第1の音声信号
の特徴パラメータを抽出し、前記抽出した特徴パラメー
タを係数と定めた逆フィルタを用いて、前記入力した第
2の音声信号から前記第1の音声信号を除去することを
特徴とする音声情報処理方法を提供することにより、取
り除きたい音声を除去した所望の音声を、活用度の高い
音声信号の状態で得ることができるという効果が得られ
る。
以上説明した様に本発明によれば、第1の音声信号の特
徴パラメータを抽出するパラメータ分析器にPARCOR型を
用いることにより、より二信号間の位相のずれに影響さ
れない音声信号の除去処理を実現するという効果が得ら
れる。
徴パラメータを抽出するパラメータ分析器にPARCOR型を
用いることにより、より二信号間の位相のずれに影響さ
れない音声信号の除去処理を実現するという効果が得ら
れる。
第1図は本発明に係る音声認識装置と被制御機器との結
線図であり、第2図は音声認識装置のブロック図であ
る。 1……音声認識装置、2……被制御機器 21……音声信号発生回路、22……音声発生器 23……制御回路 101……認識用音声信号入力端子 201……補正用音声信号入力端子 303……制御信号入力端子 111,201……ローパスフィルター 112,212……A/D変換器 213……PARCOR分析器 214……可変遅延回路 113……PARCOR逆フィルター 114……認識回路
線図であり、第2図は音声認識装置のブロック図であ
る。 1……音声認識装置、2……被制御機器 21……音声信号発生回路、22……音声発生器 23……制御回路 101……認識用音声信号入力端子 201……補正用音声信号入力端子 303……制御信号入力端子 111,201……ローパスフィルター 112,212……A/D変換器 213……PARCOR分析器 214……可変遅延回路 113……PARCOR逆フィルター 114……認識回路
Claims (2)
- 【請求項1】第1の音声信号を入力し、 前記第1の音声信号が混入された第2の音声信号を入力
し、 パラメータ分析により前記第1の音声信号の特徴パラメ
ータを抽出し、 前記抽出した特徴パラメータを係数と定めた逆フィルム
を用いて、前記入力した第2の音声信号から前記第1の
音声信号を除去することを特徴とする音声情報処理方
法。 - 【請求項2】前記パラメータ分析器はPARCOR型とするこ
とを特徴とする特許請求の範囲第1項に記載の音声情報
処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56134766A JPH069000B2 (ja) | 1981-08-27 | 1981-08-27 | 音声情報処理方法 |
US07/048,503 US4825384A (en) | 1981-08-27 | 1987-05-11 | Speech recognizer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56134766A JPH069000B2 (ja) | 1981-08-27 | 1981-08-27 | 音声情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5835600A JPS5835600A (ja) | 1983-03-02 |
JPH069000B2 true JPH069000B2 (ja) | 1994-02-02 |
Family
ID=15136057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56134766A Expired - Lifetime JPH069000B2 (ja) | 1981-08-27 | 1981-08-27 | 音声情報処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US4825384A (ja) |
JP (1) | JPH069000B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5265191A (en) * | 1991-09-17 | 1993-11-23 | At&T Bell Laboratories | Technique for voice-based security systems |
US6067521A (en) * | 1995-10-16 | 2000-05-23 | Sony Corporation | Interrupt correction of speech recognition for a navigation device |
US5765130A (en) * | 1996-05-21 | 1998-06-09 | Applied Language Technologies, Inc. | Method and apparatus for facilitating speech barge-in in connection with voice recognition systems |
AU753204B2 (en) * | 1998-05-25 | 2002-10-10 | White Consolidated Industries, Inc. | Network for voice controlled appliances |
US6246986B1 (en) * | 1998-12-31 | 2001-06-12 | At&T Corp. | User barge-in enablement in large vocabulary speech recognition systems |
US7035091B2 (en) * | 2002-02-28 | 2006-04-25 | Accenture Global Services Gmbh | Wearable computer system and modes of operating the system |
EP2107553B1 (en) * | 2008-03-31 | 2011-05-18 | Harman Becker Automotive Systems GmbH | Method for determining barge-in |
EP2148325B1 (en) * | 2008-07-22 | 2014-10-01 | Nuance Communications, Inc. | Method for determining the presence of a wanted signal component |
WO2013187932A1 (en) | 2012-06-10 | 2013-12-19 | Nuance Communications, Inc. | Noise dependent signal processing for in-car communication systems with multiple acoustic zones |
US9805738B2 (en) | 2012-09-04 | 2017-10-31 | Nuance Communications, Inc. | Formant dependent speech signal enhancement |
WO2014070139A2 (en) | 2012-10-30 | 2014-05-08 | Nuance Communications, Inc. | Speech enhancement |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3662108A (en) * | 1970-06-08 | 1972-05-09 | Bell Telephone Labor Inc | Apparatus for reducing multipath distortion of signals utilizing cepstrum technique |
US3784747A (en) * | 1971-12-03 | 1974-01-08 | Bell Telephone Labor Inc | Speech suppression by predictive filtering |
US3786188A (en) * | 1972-12-07 | 1974-01-15 | Bell Telephone Labor Inc | Synthesis of pure speech from a reverberant signal |
FR2412210A1 (fr) * | 1977-12-14 | 1979-07-13 | Cit Alcatel | Poste telephonique a haut-parleur |
JPS5511250A (en) * | 1978-07-11 | 1980-01-26 | Sanyo Electric Co | Voice discriminating circuit in remote controller |
JPS5579399U (ja) * | 1978-11-27 | 1980-05-31 | ||
JPS55155400A (en) * | 1979-05-24 | 1980-12-03 | Nissan Motor | Voice detector |
US4417098A (en) * | 1979-08-16 | 1983-11-22 | Sound Attenuators Limited | Method of reducing the adaption time in the cancellation of repetitive vibration |
JPS5683844U (ja) * | 1979-11-30 | 1981-07-06 | ||
JPS6057261B2 (ja) * | 1980-03-18 | 1985-12-13 | 日本電気株式会社 | 多回線音声入出力装置 |
US4348550A (en) * | 1980-06-09 | 1982-09-07 | Bell Telephone Laboratories, Incorporated | Spoken word controlled automatic dialer |
JPS57138696A (en) * | 1981-02-20 | 1982-08-27 | Canon Kk | Voice input/output apparatus |
DE3820728A1 (de) * | 1988-06-18 | 1989-12-21 | Philips Patentverwaltung | Verfahren zum pruefen eines festwertspeichers und anordnung zur durchfuehrung des verfahrens |
-
1981
- 1981-08-27 JP JP56134766A patent/JPH069000B2/ja not_active Expired - Lifetime
-
1987
- 1987-05-11 US US07/048,503 patent/US4825384A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US4825384A (en) | 1989-04-25 |
JPS5835600A (ja) | 1983-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR910006807A (ko) | 처리 제어 장치 | |
JPH069000B2 (ja) | 音声情報処理方法 | |
JPS54147708A (en) | Pre-processing method in audio recognizer | |
JPH1039886A (ja) | 特殊効果処理装置 | |
US8750530B2 (en) | Method and arrangement for processing audio data, and a corresponding corresponding computer-readable storage medium | |
JPH0237600B2 (ja) | ||
EP1786102A1 (en) | Digital filter | |
JPH0561464A (ja) | 楽音信号発生装置 | |
JPH06289898A (ja) | 音声信号処理装置 | |
US4686509A (en) | Digital to analog conversion method and system with the introduction and later removal of dither | |
JP2757740B2 (ja) | ディストーション回路 | |
JPH10149187A (ja) | 音声情報抽出装置 | |
Nishi et al. | Optimum harmonics tracking filter for auditory scene analysis | |
JPH057774Y2 (ja) | ||
JPH02294120A (ja) | デジタル信号のdcオフセット除去回路 | |
JPS6229798B2 (ja) | ||
JP2689765B2 (ja) | ノイズ付与装置 | |
JPS6367913A (ja) | 時系列数値デ−タ変換方法 | |
JPH03198100A (ja) | 音声分析合成装置 | |
JP2517709B2 (ja) | ディジタル信号処理装置 | |
JP3015477B2 (ja) | 音声認識方法 | |
WO2003001508A8 (es) | Método para identificación de secuencias de audio | |
JPS6331224A (ja) | A/d変換サンプル値の精度改善方式 | |
JPH01213699A (ja) | 音声信号処理装置 | |
JPH0727519Y2 (ja) | 音声認識装置 |