JPS5862699A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS5862699A
JPS5862699A JP56161399A JP16139981A JPS5862699A JP S5862699 A JPS5862699 A JP S5862699A JP 56161399 A JP56161399 A JP 56161399A JP 16139981 A JP16139981 A JP 16139981A JP S5862699 A JPS5862699 A JP S5862699A
Authority
JP
Japan
Prior art keywords
voice
speech
temporary storage
storage means
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56161399A
Other languages
English (en)
Other versions
JPH0226240B2 (ja
Inventor
西岡 芳樹
充宏 斗谷
岩橋 弘幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP56161399A priority Critical patent/JPS5862699A/ja
Priority to DE8282305373T priority patent/DE3272915D1/de
Priority to EP82305373A priority patent/EP0077194B1/en
Priority to US06/433,522 priority patent/US4633499A/en
Publication of JPS5862699A publication Critical patent/JPS5862699A/ja
Publication of JPH0226240B2 publication Critical patent/JPH0226240B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は音声認識装置の改良に関し、更に詳細には特定
話者の音声を予め分析して特徴抽出し、その特徴パター
ンを登録記憶するようにした特定話者方式の音声認識装
置の改良に関するものである。
音声認識技術は従来より種々研究されており、特に最近
話者を限定すると共に、予め話者の発声した音声データ
より特徴パターンを抽出して登録記憶し、限られた単詔
等の発声音を認識するようにした簡易型の音声認識装置
が開発され、実用化さ、れて来ている。
このような音声認識装置の一例を第1図に示す。
第、1図において、マイクロフォン1から音声を入力す
ると、音声信号が増幅器2によって増幅された後、周波
数スペクトル分析器3により例えば16個の周波数帯域
毎に分解され、次に後段のスキャナ4により例えば10
0Hzの周期でサンプリングされ、その結果がAD変換
器5により例えば8ビツト長のデジタル値に変換される
。このAD変換器5の出力は音声区間(語界域)検出器
6に入力される。この音声区間検出器6は音声の識別開
始タイミングと識別終了タイミングを与えるものである
。B識判定部7は例えば240ビツトの基準特徴パター
ンを基準パターンメモリ8から取り出して入力と比較す
るものである。またコード圧縮器9は音声区間輸出慕6
に上うてば切られた時間領域のビットパターンを例えば
240ビツトに圧縮するものである。登録用に音声が発
声されると、発声ごとの変動を評価器10が補正して平
均的な基準特徴パターンを作成し、基準パターンメモリ
8に入れる。即ち基準パターンメモリ8に記憶される基
準特徴パターンは認識しなければいけない声を有する人
が予め認識すべき単語等を発声し、これを点線の経路で
パターン化し、これを実線の経路で検査する動作を数回
繰返すことによって形成される。認識判定部7はコード
圧縮器9の出カバターンと基準特徴パターンとを比較し
て入力された語がどのパターンに属するかを判定して、
その判定結果、即ち例えば選択された基準パターンコー
ド番号を出力レジスタ11にセットして認識を終了する
このような従来の音声認識装置においては、音声登録は
単に登録すべき音声を分析して特徴を抽出し、その抽出
した特徴パターンを基準パターンメモリに記憶するだけ
である。従って発声者は正しく発声でき、また騒音も混
入せず、装置が正しく音声区間を検出したか否かは発声
者が直感的に判断する以外に術がなかった。即ち登録す
べき音声波形が第2図(a)〜(d)の如き波形の場合
、正しい特徴パターンが得られない問題があった。
第2図においてU印は装置が検出した音声区間を示し・
(a)の場合には正しく音声区間が検出されているが音
声波形にノイズaが混入した例を示し、(b)の場合は
声のとぎれ(語句内の休止区間b)が長すぎたため、音
声区間の検出が短くなった例を示し、(c)の場合、前
端部の発声が弱く、音声区間が前端部切れになった例を
示し、(d)の場合は後端部のかすれのため音声区間の
検出が後端部切れになった例を示している。
このような例の発声の場合には特徴パターンが正しく登
録されなくなるが、発声者はこの状態を直感的に判断す
る以外に方法がなかった。
本発明は、上記の点に鑑みて成されたものであり、発声
者が自分の意図した音声が正しく認識装置に登録するこ
とが出来たか否かを確認することが出来る装置を得るこ
とを目的とし、この目的を達成するため、本発明の音声
認識装置は特徴、<ターンの登録時に音声区間の検出信
号にもとすき、音声データを一時記憶手段に記憶させる
と共に、発声終了後にこの一時記憶手段に記憶された音
声データを再生手段により再生させるように構成されて
いる。
以下、図面を参照して本発明の詳細な説明する。
第3図は本発明を実施した音声認識装置の構成例を示す
ブロック図であり、第1図と向一部分は同一符号で示し
ている。
第3図において1はマイクロフォン、2は増幅器、3は
周波数スペクトル分析器、4はスキャナ、5はAD変換
器、6は音声区間検出器、7は認識判定部、8は基準パ
ターンメモリ、9はコード圧縮器、10は評価器、11
は出力レジスタである。
また12は一時記憶手段(アナログメモ9)であり、該
一時記憶手段12の入力端は直接あるいは遅延手段13
を介して増幅器2の出力端に接続されており、また一時
記憶手段12の出力端は増幅器14を介して再生手段(
スピーカ)15に接続されている。更に一時記憶手段1
2には&声区間検出器6の検出信号がラインL1を介し
て書込み信号として与えられ、また音声区間検出器6よ
りラインL2を介して読み出し信号が音声区間の終丁傍
知後の所定時間経過後に与えられる。また操作スイッチ
の操作信号Sが読み出し信号として一時記憶手段に与え
られる構成になっている。
なお遅延手段13は音声区間検出器6によって音声区間
の開始が検知されたタイミングに対応して、その音声区
間の開始に対応した音声データを記憶するために設けら
れており、分析器3、スキャナ4及びAD変換器5等に
おける信号処理に時間遅れがない場合には特に必要とし
ない0上記の如き構成によれば一時記憶手段12には音
声区間信号によって区切られた時間領域の音声データが
記憶され、音声区間の終了を検知した後、その記憶内容
が再生手段15により音声出力される。従って発声者は
装置が音声区間と判断した区間の音声データを耳で確認
することが可能となり、例えば第2図(a)の例におい
ては登録しようとじたB声入力にノイズが混入していた
事を再生音を聞くことにより確認することが出来、再度
登録操作を行うことになる。
また第2図(d)の例によれば発声者がl−ATAM 
I Jと発声したにもかかわらす後端部切れのため%−
一時記憶手段12は[A T AJが記憶されると共に
この[ATAJに対する特徴パターンが登録されること
になるが、この不都合を発声者は一時記憶手段12に記
憶された内容が再生手段15により再生される音声によ
り知ることが出来る。
第4図は本発明の実施例をより原理的に示したブロック
図であり、1はマイク、2は増幅器、12は一時記憶手
段(ディジタルメモリ)、13は遅延手段、14は増幅
器、15はスピーカ、21は特徴抽出部、22は認識・
判定・制御部、23は登録パターンメモリ、24はAD
変換部、25はDA変換部であり、一定の手順惇従って
発声される音声を認識・判定・制御部22は定められた
方式で音声区間を判断すると共に特徴抽出部21におい
て特徴パターンを抽出し、フード化(パラメータ化)し
てメモリ23に記憶する。この時AD変換部24により
AD変換した音声信号の音声区間と判断した区間のデー
タを一時記憶手段12に記憶し、発声終了後DA変換部
25を介して音声信号に戻してスピーカ15により発声
者に音声報知する。この動作により発声者は自分の意図
した音声が正して装置に登録できたか否かを確認するこ
とが出来る。
また第5図は一時記憶手段12としてアナログメモリを
用いた例を示しており、その動作は第4図に示したもの
と略同−である。
以上の如く、本発明によれば認識すべき音声の特徴パタ
ーンを予め発声された音声データにもとずいて特徴抽出
して登録するようにした音声認識装置において、特徴パ
ターンの登録時に音声区間の検出信号にもとずき、音声
データを一時記憶手段に記憶させると共に1.、、”j
弁声終了後にこの一時記憶手段に記憶された音声デ1−
夕を再生手段により再生されるため、発声者は“外部騒
音”、声のとぎれ(語区間の休止区間)”、′前端(出
だし)か弱くなる”、゛後端部のがすれ”等により音声
区間の判定が正しく行なわれながった事を知ることが出
来るため、音声の登録をより確実にかつ迅速に行なうこ
とが出来る。
【図面の簡単な説明】
第1図は従来装置の構成を示すブロック図、第2図は発
声音に対する音声区間の検知状態を示す信号波形図、第
3図は本発明の一実施例装置の構成を示すブロック図、
第4図及び第5図はそれぞれ本発明の他の実施例を示す
原理的構成図である。 6・・・音声区間検出器、7・・・認識判定部、8・基
準パターンメモリ、12・・・一時記憶手段、15・・
・再生手段(スピーカ)、21・・・特徴抽出部、22
・・・認識 判定・制御部、23・・・登録パターンメ
モリ。 代理人 弁理士 福 士 愛 彦

Claims (1)

    【特許請求の範囲】
  1. 1、認識すべき音声の特徴パターンを予め発声された音
    声データにもとずいて特徴抽出して登録するようにした
    音声認識装置において、上記特徴パターンの登録時に音
    声区間の検出信号にもとすき、上記音声データを一時記
    憶手段に記憶せしめると共に、発声終了後、上記一時記
    憶手段に記憶された音声データを再生手段により再生せ
    しめるように成したことを特徴とする音声認識装置。
JP56161399A 1981-10-09 1981-10-09 音声認識装置 Granted JPS5862699A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP56161399A JPS5862699A (ja) 1981-10-09 1981-10-09 音声認識装置
DE8282305373T DE3272915D1 (en) 1981-10-09 1982-10-08 Speech recognition system
EP82305373A EP0077194B1 (en) 1981-10-09 1982-10-08 Speech recognition system
US06/433,522 US4633499A (en) 1981-10-09 1982-10-08 Speech recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56161399A JPS5862699A (ja) 1981-10-09 1981-10-09 音声認識装置

Publications (2)

Publication Number Publication Date
JPS5862699A true JPS5862699A (ja) 1983-04-14
JPH0226240B2 JPH0226240B2 (ja) 1990-06-08

Family

ID=15734349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56161399A Granted JPS5862699A (ja) 1981-10-09 1981-10-09 音声認識装置

Country Status (4)

Country Link
US (1) US4633499A (ja)
EP (1) EP0077194B1 (ja)
JP (1) JPS5862699A (ja)
DE (1) DE3272915D1 (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59146100A (ja) * 1983-02-08 1984-08-21 電子計算機基本技術研究組合 音声登録方式
JPS6057899A (ja) * 1983-09-09 1985-04-03 電子計算機基本技術研究組合 日本語音声入力装置
JPS6060698A (ja) * 1983-09-13 1985-04-08 富士通株式会社 音声標準特徴パターン作成処理装置
JPS60154300A (ja) * 1984-01-24 1985-08-13 電子計算機基本技術研究組合 音節標準パタ−ンの切り出し方式
JPS60185999A (ja) * 1984-03-05 1985-09-21 シャープ株式会社 日本語音声入力装置
JPS613241A (ja) * 1984-06-15 1986-01-09 Nippon Telegr & Teleph Corp <Ntt> 音声確認方式
JPS61277996A (ja) * 1985-06-04 1986-12-08 カシオ計算機株式会社 電子楽器
JPS6273297A (ja) * 1985-09-27 1987-04-03 富士通株式会社 音声録音装置
JPS62164419A (ja) * 1986-01-14 1987-07-21 松下電器産業株式会社 調理器具の蓋体
JPS6326699A (ja) * 1986-04-25 1988-02-04 テキサス インスツルメンツ インコ−ポレイテツド 連続語認識記録方法
JPS63292196A (ja) * 1987-05-26 1988-11-29 日本電気株式会社 特定話者用音声認識装置
JPH02272495A (ja) * 1989-04-13 1990-11-07 Toshiba Corp 音声認識装置
JPH07249294A (ja) * 1994-03-11 1995-09-26 Toshiba Corp 半導体集積回路装置

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0792673B2 (ja) * 1984-10-02 1995-10-09 株式会社東芝 認識用辞書学習方法
US4797927A (en) * 1985-10-30 1989-01-10 Grumman Aerospace Corporation Voice recognition process utilizing content addressable memory
DE3636678A1 (de) * 1986-10-28 1988-05-11 Siemens Ag Roentgendiagnostikeinrichtung
US4989253A (en) * 1988-04-15 1991-01-29 The Montefiore Hospital Association Of Western Pennsylvania Voice activated microscope
US4979211A (en) * 1988-11-16 1990-12-18 At&T Bell Laboratories Classifier for high speed voiceband digital data modem signals
AT391035B (de) * 1988-12-07 1990-08-10 Philips Nv System zur spracherkennung
US5222147A (en) * 1989-04-13 1993-06-22 Kabushiki Kaisha Toshiba Speech recognition LSI system including recording/reproduction device
JPH07109560B2 (ja) * 1990-11-30 1995-11-22 富士通テン株式会社 音声認識装置
US6463361B1 (en) * 1994-09-22 2002-10-08 Computer Motion, Inc. Speech interface for an automated endoscopic system
US6911916B1 (en) 1996-06-24 2005-06-28 The Cleveland Clinic Foundation Method and apparatus for accessing medical data over a network
GB2303955B (en) * 1996-09-24 1997-05-14 Allvoice Computing Plc Data processing method and apparatus
US6961700B2 (en) 1996-09-24 2005-11-01 Allvoice Computing Plc Method and apparatus for processing the output of a speech recognition engine
US5857099A (en) * 1996-09-27 1999-01-05 Allvoice Computing Plc Speech-to-text dictation system with audio message capability
US7194752B1 (en) * 1999-10-19 2007-03-20 Iceberg Industries, Llc Method and apparatus for automatically recognizing input audio and/or video streams
WO2001056015A1 (en) * 2000-01-27 2001-08-02 Koninklijke Philips Electronics N.V. Speech detection device having two switch-off criterions
US7047196B2 (en) 2000-06-08 2006-05-16 Agiletv Corporation System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery
US8095370B2 (en) 2001-02-16 2012-01-10 Agiletv Corporation Dual compression voice recordation non-repudiation system
WO2008064668A2 (de) * 2006-11-30 2008-06-05 Teles Ag Informationstechnologien Verfahren der zustellung einer in mindestens einer elektronischen darstellung vorliegenden primär-information

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5651798A (en) * 1979-10-04 1981-05-09 Sanyo Electric Co Sound register system in acoustic device
JPS5683800A (en) * 1979-12-11 1981-07-08 Sanyo Electric Co Voice handler

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB974850A (en) * 1963-06-12 1964-11-11 Standard Telephones Cables Ltd Speech recognition system
US3470321A (en) * 1965-11-22 1969-09-30 William C Dersch Jr Signal translating apparatus
JPS5028132B1 (ja) * 1969-06-20 1975-09-12
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave
US4214125A (en) * 1977-01-21 1980-07-22 Forrest S. Mozer Method and apparatus for speech synthesizing
DE3008830A1 (de) * 1980-03-07 1981-10-01 Siemens AG, 1000 Berlin und 8000 München Verfahren zum betrieb eines spracherkennungsgeraetes
JPS5782899A (en) * 1980-11-12 1982-05-24 Canon Kk Voice recognition apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5651798A (en) * 1979-10-04 1981-05-09 Sanyo Electric Co Sound register system in acoustic device
JPS5683800A (en) * 1979-12-11 1981-07-08 Sanyo Electric Co Voice handler

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59146100A (ja) * 1983-02-08 1984-08-21 電子計算機基本技術研究組合 音声登録方式
JPS6057899A (ja) * 1983-09-09 1985-04-03 電子計算機基本技術研究組合 日本語音声入力装置
JPH0229230B2 (ja) * 1983-09-09 1990-06-28 Denshi Keisanki Kippon Gijutsu
JPS6060698A (ja) * 1983-09-13 1985-04-08 富士通株式会社 音声標準特徴パターン作成処理装置
JPS60154300A (ja) * 1984-01-24 1985-08-13 電子計算機基本技術研究組合 音節標準パタ−ンの切り出し方式
JPS60185999A (ja) * 1984-03-05 1985-09-21 シャープ株式会社 日本語音声入力装置
JPH0229231B2 (ja) * 1984-03-05 1990-06-28 Denshi Keisanki Kippon Gijutsu
JPH0130167B2 (ja) * 1984-06-15 1989-06-16 Nippon Telegraph & Telephone
JPS613241A (ja) * 1984-06-15 1986-01-09 Nippon Telegr & Teleph Corp <Ntt> 音声確認方式
JPH0137751B2 (ja) * 1985-06-04 1989-08-09 Casio Computer Co Ltd
JPS61277996A (ja) * 1985-06-04 1986-12-08 カシオ計算機株式会社 電子楽器
JPS6273297A (ja) * 1985-09-27 1987-04-03 富士通株式会社 音声録音装置
JPH0679240B2 (ja) * 1985-09-27 1994-10-05 富士通株式会社 音声録音装置
JPS62164419A (ja) * 1986-01-14 1987-07-21 松下電器産業株式会社 調理器具の蓋体
JPH0361441B2 (ja) * 1986-01-14 1991-09-19 Matsushita Electric Ind Co Ltd
JPS6326699A (ja) * 1986-04-25 1988-02-04 テキサス インスツルメンツ インコ−ポレイテツド 連続語認識記録方法
JPS63292196A (ja) * 1987-05-26 1988-11-29 日本電気株式会社 特定話者用音声認識装置
JPH02272495A (ja) * 1989-04-13 1990-11-07 Toshiba Corp 音声認識装置
JPH07249294A (ja) * 1994-03-11 1995-09-26 Toshiba Corp 半導体集積回路装置

Also Published As

Publication number Publication date
EP0077194B1 (en) 1986-08-27
US4633499A (en) 1986-12-30
JPH0226240B2 (ja) 1990-06-08
EP0077194A1 (en) 1983-04-20
DE3272915D1 (en) 1986-10-02

Similar Documents

Publication Publication Date Title
JPS5862699A (ja) 音声認識装置
JPH02163819A (ja) テキスト処理装置
JPH11231897A (ja) 音声認識装置及び方法
JPS6194095A (ja) 音声認識装置
JPS6331120Y2 (ja)
KR940005044B1 (ko) 음성 인식장치 및 그의 음성 등록방법
JPS5912479A (ja) 発音練習装置
JPS63278100A (ja) 音声認識装置
JPH0562343A (ja) 雑音除去装置
JP3201327B2 (ja) 録音再生装置
JP3125928B2 (ja) 音声認識装置
JPS6287998A (ja) 音声認識装置
JPS61260299A (ja) 音声認識装置
JP2596018B2 (ja) 登録型音声認識装置
JPS63306498A (ja) 音声区間検出方式
JPS63173097A (ja) 登録型音声認識装置
JPH02287398A (ja) 音声認識方式及び音声認識装置
JP2555029B2 (ja) 音声認識装置
JP2891259B2 (ja) 音声区間検出装置
JPS58113992A (ja) 音声信号圧縮方式
JPS6267598A (ja) 音声区間検出方式
JPS63226692A (ja) パターン比較方式
JPH07210186A (ja) 音声登録装置
JPS59146100A (ja) 音声登録方式
JPH0652479B2 (ja) 音声分析方式