JPH069000B2 - 音声情報処理方法 - Google Patents

音声情報処理方法

Info

Publication number
JPH069000B2
JPH069000B2 JP56134766A JP13476681A JPH069000B2 JP H069000 B2 JPH069000 B2 JP H069000B2 JP 56134766 A JP56134766 A JP 56134766A JP 13476681 A JP13476681 A JP 13476681A JP H069000 B2 JPH069000 B2 JP H069000B2
Authority
JP
Japan
Prior art keywords
voice
audio signal
signal
parameter
processing method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56134766A
Other languages
English (en)
Other versions
JPS5835600A (ja
Inventor
穆 桜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP56134766A priority Critical patent/JPH069000B2/ja
Publication of JPS5835600A publication Critical patent/JPS5835600A/ja
Priority to US07/048,503 priority patent/US4825384A/en
Publication of JPH069000B2 publication Critical patent/JPH069000B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 [技術分野] 本発明は、入力音声信号から除去したい音声信号を除去
する音声情報処理方法に関するものである。
[従来技術] 従来、音声信号から音声信号を波形レベルで差し引いた
り、音声パラメータから音声パラメータを差し引いたり
して所望の音声情報を入手しようとするものはあった。
しかしながら、従来の波形レベルでの音声信号の差し引
きは、両音声信号間の時間的遅延が非常に大きな影響を
与え、微小なずれでも音声信号の差し引き処理は全く効
果が得られないという結果になってしまう。
また、遅延時間の計算は非常に困難なものであり、距離
や環境条件を細かく考慮して行わなければならず、音声
信号レベルでの計算は事実上不可能なものであった。
従来の、音声パラメータから音声パラメータを差し引く
処理は、差し引き処理をして得られる所望の音声情報が
差し引き処理を行ったパラメータに限定される為、その
音声情報の活用度が極めて限られたものとなってしまう
という欠点があった。
[目的] 以上の点に鑑み、本発明は、第1の音声信号を入力し、
前記第1の音声信号が混入された第2の音声信号を入力
し、パラメータ分析により前記第1の音声信号の特徴パ
ラメータを抽出し、前記抽出した特徴パラメータを係数
と定めた逆フィルムを用いて、前記入力した第2の音声
信号から前記第1の音声信号を除去することのできる音
声情報処理方法を提供することにより、取り除きたい音
声を除去した所望の音声を活用度が高い音声信号の状態
で得ることを目的とする。
以上の点に鑑み、本発明は、第1の音声信号の特徴パラ
メータを抽出するパラメータ分析器にPARCOR型を用いる
ことにより、より二信号間の位相のずれに影響されない
音声信号の除去処理を実現することを目的とする。
[実施例] 本発明による一実施例を図面を参照して説明する。
第1図において、1は音声認識装置で、第2図はその詳
細を示す。同図において、111はローパスフィルタ,
112はA/D変換器、113はPARCOR型逆フィルタ,
114は認識回路,211はローパスフィルタ,212
はA/D変換器,213はPARCOR型パラメータ分析器,
214は可変遅延回路である。2は被制御機器で、音声
発生回路21,音声発生器22,制御回路23等を有し
ている。
以上の構成から成る実施例の作動を説明する。
音声認識装置1は認識用音声信号入力端子101から認
識用音声信号を受け、被制御機器2の具備する音声信号
発生回路21からの出力を補正音声信号入力端子201
から受けて音声認識処理を行い、被制御機器2の具備す
る制御回路23に対し制御信号出力端子301から制御
信号を出力する。
第2図を参照してさらに音声認識装置の作動を説明す
る。
認識用音声信号入力端子101から入力された音声信号
は認識処理の前処理としてローパスフィルター111及
びA/D変換器112を経てディジタル化される。
ここでこの信号中には第1図における被制御機器2の具
備する音声発生器22からの音声情報が混在しているか
ら、このままでは認識処理に適さない。
そこで被制御機器2内の音声信号発生器21の出力を端
子201に印加する。補正用音声信号入力端子201か
ら入力された音声信号はローパスフィルター211にお
いて高周波成分を濾波され、次いでA/D変換器212
によりディジタル信号化された後、PARCOR型パラメータ
分析器213により適当な周期でパラメータ化される。
PARCOR分析器213により抽出されたパラメータを可変
遅延回路214を用いて適当な遅延を加えた後PARCOR型
逆フィルター113に印加し、これに上記A/D変換器
112によりディジタル化された認識用音声信号を通す
ことにより被制御機器2による音声情報を除去し純粋に
使用者だけの音声信号を得る。
こうして得られた被制御機器からの混在のないディジタ
ル音声情報は認識回路114により高い認識率が認識処
理され、その結果としての制御信号が制御信号出力端子
301から出力される。
以上説明した様に本発明によれば、音声認識装置におい
て制御する対象の機器が音声発生機能を有し、それが音
声発生中であってもその影響を全く受けない音声認識処
理を行うことができるものである。
又本発明の説明例ではPARCOR方式を用いたが、本発明は
それのみに限定されるものではなく音声を表わす特徴パ
ラメータを使用する分析方式であれば全く実現可能であ
る。
[効果] 以上説明した様に本発明によれば、第1の音声信号を入
力し、前記第1の音声信号が混入された第2の音声信号
を入力し、パラメータ分析器により前記第1の音声信号
の特徴パラメータを抽出し、前記抽出した特徴パラメー
タを係数と定めた逆フィルタを用いて、前記入力した第
2の音声信号から前記第1の音声信号を除去することを
特徴とする音声情報処理方法を提供することにより、取
り除きたい音声を除去した所望の音声を、活用度の高い
音声信号の状態で得ることができるという効果が得られ
る。
以上説明した様に本発明によれば、第1の音声信号の特
徴パラメータを抽出するパラメータ分析器にPARCOR型を
用いることにより、より二信号間の位相のずれに影響さ
れない音声信号の除去処理を実現するという効果が得ら
れる。
【図面の簡単な説明】
第1図は本発明に係る音声認識装置と被制御機器との結
線図であり、第2図は音声認識装置のブロック図であ
る。 1……音声認識装置、2……被制御機器 21……音声信号発生回路、22……音声発生器 23……制御回路 101……認識用音声信号入力端子 201……補正用音声信号入力端子 303……制御信号入力端子 111,201……ローパスフィルター 112,212……A/D変換器 213……PARCOR分析器 214……可変遅延回路 113……PARCOR逆フィルター 114……認識回路

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】第1の音声信号を入力し、 前記第1の音声信号が混入された第2の音声信号を入力
    し、 パラメータ分析により前記第1の音声信号の特徴パラメ
    ータを抽出し、 前記抽出した特徴パラメータを係数と定めた逆フィルム
    を用いて、前記入力した第2の音声信号から前記第1の
    音声信号を除去することを特徴とする音声情報処理方
    法。
  2. 【請求項2】前記パラメータ分析器はPARCOR型とするこ
    とを特徴とする特許請求の範囲第1項に記載の音声情報
    処理方法。
JP56134766A 1981-08-27 1981-08-27 音声情報処理方法 Expired - Lifetime JPH069000B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP56134766A JPH069000B2 (ja) 1981-08-27 1981-08-27 音声情報処理方法
US07/048,503 US4825384A (en) 1981-08-27 1987-05-11 Speech recognizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56134766A JPH069000B2 (ja) 1981-08-27 1981-08-27 音声情報処理方法

Publications (2)

Publication Number Publication Date
JPS5835600A JPS5835600A (ja) 1983-03-02
JPH069000B2 true JPH069000B2 (ja) 1994-02-02

Family

ID=15136057

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56134766A Expired - Lifetime JPH069000B2 (ja) 1981-08-27 1981-08-27 音声情報処理方法

Country Status (2)

Country Link
US (1) US4825384A (ja)
JP (1) JPH069000B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5265191A (en) * 1991-09-17 1993-11-23 At&T Bell Laboratories Technique for voice-based security systems
US6067521A (en) * 1995-10-16 2000-05-23 Sony Corporation Interrupt correction of speech recognition for a navigation device
US5765130A (en) * 1996-05-21 1998-06-09 Applied Language Technologies, Inc. Method and apparatus for facilitating speech barge-in in connection with voice recognition systems
AU753204B2 (en) * 1998-05-25 2002-10-10 White Consolidated Industries, Inc. Network for voice controlled appliances
US6246986B1 (en) * 1998-12-31 2001-06-12 At&T Corp. User barge-in enablement in large vocabulary speech recognition systems
US7035091B2 (en) * 2002-02-28 2006-04-25 Accenture Global Services Gmbh Wearable computer system and modes of operating the system
EP2107553B1 (en) * 2008-03-31 2011-05-18 Harman Becker Automotive Systems GmbH Method for determining barge-in
EP2148325B1 (en) * 2008-07-22 2014-10-01 Nuance Communications, Inc. Method for determining the presence of a wanted signal component
WO2013187932A1 (en) 2012-06-10 2013-12-19 Nuance Communications, Inc. Noise dependent signal processing for in-car communication systems with multiple acoustic zones
US9805738B2 (en) 2012-09-04 2017-10-31 Nuance Communications, Inc. Formant dependent speech signal enhancement
WO2014070139A2 (en) 2012-10-30 2014-05-08 Nuance Communications, Inc. Speech enhancement

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3662108A (en) * 1970-06-08 1972-05-09 Bell Telephone Labor Inc Apparatus for reducing multipath distortion of signals utilizing cepstrum technique
US3784747A (en) * 1971-12-03 1974-01-08 Bell Telephone Labor Inc Speech suppression by predictive filtering
US3786188A (en) * 1972-12-07 1974-01-15 Bell Telephone Labor Inc Synthesis of pure speech from a reverberant signal
FR2412210A1 (fr) * 1977-12-14 1979-07-13 Cit Alcatel Poste telephonique a haut-parleur
JPS5511250A (en) * 1978-07-11 1980-01-26 Sanyo Electric Co Voice discriminating circuit in remote controller
JPS5579399U (ja) * 1978-11-27 1980-05-31
JPS55155400A (en) * 1979-05-24 1980-12-03 Nissan Motor Voice detector
US4417098A (en) * 1979-08-16 1983-11-22 Sound Attenuators Limited Method of reducing the adaption time in the cancellation of repetitive vibration
JPS5683844U (ja) * 1979-11-30 1981-07-06
JPS6057261B2 (ja) * 1980-03-18 1985-12-13 日本電気株式会社 多回線音声入出力装置
US4348550A (en) * 1980-06-09 1982-09-07 Bell Telephone Laboratories, Incorporated Spoken word controlled automatic dialer
JPS57138696A (en) * 1981-02-20 1982-08-27 Canon Kk Voice input/output apparatus
DE3820728A1 (de) * 1988-06-18 1989-12-21 Philips Patentverwaltung Verfahren zum pruefen eines festwertspeichers und anordnung zur durchfuehrung des verfahrens

Also Published As

Publication number Publication date
US4825384A (en) 1989-04-25
JPS5835600A (ja) 1983-03-02

Similar Documents

Publication Publication Date Title
KR910006807A (ko) 처리 제어 장치
JPH069000B2 (ja) 音声情報処理方法
JPS54147708A (en) Pre-processing method in audio recognizer
JPH1039886A (ja) 特殊効果処理装置
US8750530B2 (en) Method and arrangement for processing audio data, and a corresponding corresponding computer-readable storage medium
JPH0237600B2 (ja)
EP1786102A1 (en) Digital filter
JPH0561464A (ja) 楽音信号発生装置
JPH06289898A (ja) 音声信号処理装置
US4686509A (en) Digital to analog conversion method and system with the introduction and later removal of dither
JP2757740B2 (ja) ディストーション回路
JPH10149187A (ja) 音声情報抽出装置
Nishi et al. Optimum harmonics tracking filter for auditory scene analysis
JPH057774Y2 (ja)
JPH02294120A (ja) デジタル信号のdcオフセット除去回路
JPS6229798B2 (ja)
JP2689765B2 (ja) ノイズ付与装置
JPS6367913A (ja) 時系列数値デ−タ変換方法
JPH03198100A (ja) 音声分析合成装置
JP2517709B2 (ja) ディジタル信号処理装置
JP3015477B2 (ja) 音声認識方法
WO2003001508A8 (es) Método para identificación de secuencias de audio
JPS6331224A (ja) A/d変換サンプル値の精度改善方式
JPH01213699A (ja) 音声信号処理装置
JPH0727519Y2 (ja) 音声認識装置