JPH02193199A - 音声認識システム - Google Patents

音声認識システム

Info

Publication number
JPH02193199A
JPH02193199A JP1316602A JP31660289A JPH02193199A JP H02193199 A JPH02193199 A JP H02193199A JP 1316602 A JP1316602 A JP 1316602A JP 31660289 A JP31660289 A JP 31660289A JP H02193199 A JPH02193199 A JP H02193199A
Authority
JP
Japan
Prior art keywords
speech recognition
speech
recognition device
recording
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1316602A
Other languages
English (en)
Inventor
Rudolf Honis
ルドルフ ホニス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Gloeilampenfabrieken NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Gloeilampenfabrieken NV filed Critical Philips Gloeilampenfabrieken NV
Publication of JPH02193199A publication Critical patent/JPH02193199A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は、音声認識装置が、該装置を所定の話者の特有
な発音に適合させる学習装置を具え、所定の単語を学習
処置の期間中にキーボードを介して前記音声認識装置に
供給すると共に、これらの所定の単語に関連し、該当す
る話者から到来する音声信号もマイクロホンを介して前
記音声認識装置に供給し、前記学習処置の進行状況の詳
細を表示スクリーンに表示させ、その後その表示内容に
前記話者を反応させ、前記音声認識装置の学習処置が終
了した後に、テキストに相当する音声信号を入力させて
、該音声信号から前記音声認識装置が該音声信号に含ま
れる個々の単語を認識し得る音声認識システムに関する
ものである。
〔背景技術〕
斯種の音声認識システムは既に市販されている。
斯種のシステムにて所定の話者に順応させる学習処置の
最中には、適切な単語が正しく学習されて、認識された
旨の確認を表示スクリーンが表示するまでの長時間の間
詰者は所定の単語を発音しなければならない。話者はマ
イクロホンに向かって話し、その電気信号を音声認識装
置に供給するのが普通である。学習処置の終了後には原
文(テキスト)に相当する音声信号をシステムに供給し
、これらの音声信号を個々の単語としてシステムにより
認識し、且つ表示させることができる。テキストに相当
するこのような音声信号を再びマイクロホンを介して音
声認識装置に供給すれば、斯種のシステムは通常満足に
機能する。しかし、テキストに相当する斯様な音声信号
を別の方法で送給する場合、つまりマイクロホンと音声
認識装置との間に別の伝送路がある場合には、音声認識
装置にて個々の単語を正確に決めるのが困難なことが屡
ある。これは音声信号が別の伝送路で変形されてしまい
、学習処置仲に用いた音声信号に完全に対応するものと
はならなくなるからである。このようなことは例えば、
テキストに相当する音声信号を例えばIBM Tech
nical Disclosure Bulletin
Vol、22. no、 7.1979年12月、第2
891及び第2892頁に記載されているような書取器
装置を介して供給する音声認識システムを用いる場合に
起こっている。テキストに相当する音声信号を書取器装
置を介して送給する方法は、テキストを書き取る人が音
声認識装置のある場所に限定されなくて済むと云う点で
有利である。
本発明の目的は冒頭にて述べた種類の音声認識システム
における前述したような困難性をなくすと共に、学習処
置を簡単で、しかも確実なものとし、且つテキストに含
まれる単語の音声認識をできるだけ最低の誤り率で行う
ことのできる音声認識システムを提供することにある。
本発明は基本的には、学習処置における音声信号の送給
及びテキストの音声信号の送給〇双方に同じ信号伝送路
を用いるようにし、学習させる発声した所定の単語に話
者を直ちに反応させるように学習処置に対する信号伝送
路を構成すれば学習処置を確実なものとし得ると云う認
識に基づいて成したものである。
〔発明の開示〕
これがため、本発明は冒頭にて述べた種類の音声認識シ
ステムにおいて、テキストに相当する音声信号を、記憶
媒体を走査し得る再生装置を介して音声認識装置に供給
し、該再生装置を記録兼再生装置の形態の記録装置とし
ても構成し、且つ音声認識装置の学習処置の期間中に供
給し得る音声信号を先ず前記記録兼再生装置によって記
憶媒体に記憶させ、その後に再び該記憶媒体を走査して
、この走査により得られた信号を音声認識装置に供給す
るようにしたことを特徴とする。
このようにすれば、後に発音するテキストの音声信号の
送給中に用いるのと同じ信号伝送路を用いて相互学習処
置を行うことができる。なお、磁気テープの形態の記録
媒体に音声信号を記録し、その後直ちに記1意媒体から
音声信号を再生して、それが完全なものであるかどうか
音声記録をモニタすることは例えば西独国特許出願公告
明細書DE−AS 1059,204号に記載されてい
るように本来既知ではあるが、これは音声認識システム
とは全く関係のないものである。さらに、学習処置のた
めに、学習させる所定の単語を記録した磁気テープの音
声信号を音声認識システムに供給することも西独国特許
公開公報DE−〇33518337号に開示されている
ように既知である。しかし、このような場合でも学習処
置の最中に適切な単語が実際に正しく学習されて、認識
されたか否かを該当する話者に直ちに反応させることが
できず、記録済の音声信号が学習処置に適さないことが
後になって判った場合には、必要な音声信号を再び全て
記録しなければならないので学習処置が非常に厄介であ
る。これに対し、本発明によるシステムでは相互学習処
置を行うことができ、該当する話者は単語の正しい判定
又は誤った判定に直ちに反応することができる。
〔実施例〕
以下実施例につき図面を参照して説明するに、第1図に
示す本発明による音声認識システムのブロック回路図に
おける音声δ2識装置1は、その入力端子2にてテキス
ト(原文)に相当する音声信号を電気信号の形態で受信
し、ついでこれらの電気信号を音声δ2識装置により分
析し、且つ処理してから、これらの信号中に含まれる個
々の単語を決定して、これらを表示スクリーン3上にテ
キストとして表示させたり、又はプリンタ4によって印
刷したりすることができる。テキストに含まれる単語を
できるだけ最低の誤り率で明確に認識し、従って不正確
に決定される単語数をできるだけ少なくするために、音
声認識装置1には学習装置5を設け、これにより音声認
識装置を成る所定の話者固有の学習処置でその話者の特
徴的な発音に適合させる。このような学習処置の最中に
は音声認識装置1にキーボード6から所定の単語を連続
的に供給すると共に、システムを適合させる必要のある
前記話者にこれらの単語をマイクロホンに向かって個々
に話させ、このマイクロホンからの音声信号を電気信号
として音声認識装置1の入力端子2に供給する。このよ
うな場合には話者に個々の単語を数回発音させて、音声
認識装置が学習装置を用いて当該する単語を正確に学び
とれるようにすることが屡要求される。進行状況、即ち
学習処置についてのデータは表示スクリーン3を通して
話者に、例えば「話し方がおとなし過ぎる」、「繰り返
し」又は最終的な「単語認識」と云うように示される。
従って、話者は学習処置の最中は表示スクリーンに表示
されるデータに反応しなければならない。学習処置が終
了したら、テキストに相当する音声信号を音声認識装置
に供給し、この音声信号から音声認識装置はその信号に
含まれる個々の単語を決定することができる。
本例ではテキストに相当する音声信号を再生装置により
走査される記憶媒体を介して音声認識装置に既知の方法
で供給する。記憶媒体そのものは、記憶形式及び記憶方
法についても随意選定することができる。記憶媒体は、
例えば磁気テープ又は磁気ディスクとすることができる
。記憶媒体への信号の蓄積はアナログ及びディジクル形
式のいずれでも行うことができる。従って、マイクロホ
ンによって供給される音声信号に影響を及ぼす特殊な信
号伝送路が、話者が話すマイクロホンと、音声認識装置
1の入力端子2との間に存在する。
従って、音声認識装置の学習処置の期間中には話者が学
習させる単語を話すマイクロホンと音声認識装置1の入
力端子2との間に口頭テキストの送給時に設けられるの
と基本的に同一の信号伝送路が存在することになる。こ
れがため、学習処置の最中に音声S思議装置に供給され
る音声信号は、この学習処置の後におけるテキストに相
当する音声信号と全く同じように影響されることになる
ので、音声認識装置はそのテキストから個々の単語を決
めることができる。このように、音声信号が全く同じよ
うな影響を受けるので、テキストに含まれる単語が低い
誤り率で認識され、従って音声認識装置により不正確に
判定される単語数はとりわけ少なくなる。
このようにするために、テキストに相当する音声信号を
記憶媒体から音声認識装置に送給する再生装置は、記録
兼再生装置7の形態の記録装置としても構成されるもの
として、学習処置の期間中に音声認識装置1に送給し得
る音声信号を先ず記=9 憶媒体に記録し、その後直ちに記憶媒体を再び走査して
から音声認識装置に送給する。本例では、記憶媒体を磁
気テープカセット8により構成する。
マイクロホン9から到来する音声信号は記録兼再生装置
7の入力端子10に供給する。入力端子10からの音声
信号は増幅器11及び信号処理回路12に達し、これに
て音声信号をそれらの周波数及び雑音に関して適切に調
製することができる。この信号処理回路12からの音声
信号はスイッチング装置13を介して記録ヘッド14に
到達する。記録ヘッド14は磁気テープカセット8内に
ある磁気テープ15と共働する。音声信号を記録する前
に磁気テープに存在する信号をいずれも消去するために
スイッチング装置13を介して発振器18に接続するこ
とのできる消去へラド17をテープの走行方向(矢印1
6にて示す)に見て記録ヘッド14の前方に慣例の方法
で設ける。再びテープ走行方向に見て再生ヘッド19を
記録ヘッド4の後方に配置し、この再生ヘッド19を用
いて磁気テープに記録された音声信号をその記録後に直
ちに磁気テープから走査することができる。再生ヘット
19からの走査音声信号を再び増幅器20及び随意信号
処理回路21に供給してから記録兼再生装置7の出力端
子22に供給する。音声信号はこの出力端子22から音
声認識装置1の入力端子2に供給することができる。磁
気ヘッドからの走査信号を随意再生することができるス
ピカ24を例えばスイッチ23を介して信号処理回路2
1の出力端子に接続することができる。双方向矢印25
によって示す制御ラインによって記録兼再生装置7と音
声認識装置1との間の相互制御指令を随意交替させるこ
とができる。
音声認識装置の学習処置の最中にはマイクロホン9から
到来する音声信号を記録へラド14によって磁気テープ
15に記録させ、その直ぐ後に再生ヘッド19によって
再び磁気テープを走査して、その走査信号を音声認識装
置■の入力端子2に供給して、この音声8忍識装置にて
前述した学習処置を進行させて、その結果を表示スクリ
ーン3上に表示させる。従って、学習させる単語の当事
者である話者は学習処置に追従して、その結果に直接反
応を示すことができる。このような相互的な進行学習処
置によって、この学習処置を迅速に且つ確実に終了させ
ることができる。
このような学習処置の後にはテキストに相当する音声信
号を記録兼再生装置を介して音声認識装置に供給するこ
とができる。この場合に2通りの方法、即ち音声認識装
置1をリアルタイムで作動させ、テキストに相当する音
声信号を記憶媒体に記録させ、その後直ちに記憶媒体か
ら再生するのと同時に音声認識装置を作動させるか、テ
キストに相当する音声信号を記憶媒体に記録するのを独
立して行い、その記憶媒体よりもかなり後の瞬時に記憶
媒体に記録済の音声信号をこの記憶媒体から再び再生す
るようにして音声認識装置を作動させるかの2通りの方
法がある。従って前者の場合にはテキストに相当する音
声信号が音声認識装置によってほぼ直ちに評価されるの
に対し、後者の場合には斯様な評価は音声信号の記録時
点よりも遅い任意の瞬時に行うことができる。音声信号
を記憶させるた必にここで用いられる記録兼再生装置7
は市販の書取器で構成することができ、これは再生ヘッ
ドを別個に装備しているが、この場合にも記憶媒体に記
録した信号をその記録後に直ちに走査することもできる
。例えば携帯式の書取器のような別個の記録装置の記憶
媒体にテキストに相当する音声信号を記録し、その記録
が終了したら、その別個の記録装置から記憶媒体を取り
出して、それを音声認識装置1に接続した記録兼再生装
置7に設置することもできる。
このような場合には、記録兼再生装置7の再生モードが
必要とされるだけであるから、スイッチング装置13よ
り記録系統の作用を禁止させることができる。
上述した種類の音声認識システムを用いれば、音声認識
装置の学習処置を相互的な方法で簡単、且つ確実な方法
で行うことができること明らかである。さらに、学習処
置における音声信号の送給及びテキストに相当する音声
信号の送給の双方に対して、マイクロホンから音声δ2
識装置まで同じ特性を有する信号伝送路を用いるので、
高品質の音声認識が得られる。本発明は上述した例にの
み限定されるものではなく、幾多の変更を加え得ること
勿論である。
【図面の簡単な説明】
第1図は本発明による音声認識システムの一例を示すブ
ロック回路図である。 ■・・・音声認識装置 2・・・音声信号入力端子 3・・・表示スクリーン 4・プリンタ 5・・・学習処置 6・キーボード 7・・・記録兼再生装置 8・磁気テープカセット 9・・・マイクロホン 11・・・増幅器 12・信号処理回路 13・・スイッチング装置 14・言己録ヘッド 15・磁気テープ 17・・・消去ヘッド 18・・・発振器 20・・・増幅回路 21・・・信号処理回路 24・・・スピーカ

Claims (1)

    【特許請求の範囲】
  1. 1、音声認識装置が、該装置を所定の話者の特有な発音
    に適合させる学習装置を具え、所定の単語を学習処置の
    期間中にキーボードを介して前記音声認識装置に供給す
    ると共に、これらの所定の単語に関連し、該当する話者
    から到来する音声信号もマイクロホンを介して前記音声
    認識装置に供給し、前記学習処置の進行状況の詳細を表
    示スクリーンに表示させ、その後その表示内容に前記話
    者を反応させ、前記音声認識装置の学習処置が終了した
    後に、テキストに相当する音声信号を入力させて、該音
    声信号から前記音声認識装置が該音声信号に含まれる個
    々の単語を認識し得る音声認識システムにおいて、テキ
    ストに相当する音声信号を、記憶媒体を走査し得る再生
    装置を介して音声認識装置に供給し、該再生装置を記録
    兼再生装置の形態の記録装置としても構成し、且つ音声
    認識装置の学習処置の期間中に供給し得る音声信号を先
    ず前記記録兼再生装置によって記憶媒体に記憶させ、そ
    の後に再び該記憶媒体を走査して、この走査により得ら
    れた信号を音声認識装置に供給するようにしたことを特
    徴とする音声認識システム。
JP1316602A 1988-12-07 1989-12-07 音声認識システム Pending JPH02193199A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AT0300288A AT391035B (de) 1988-12-07 1988-12-07 System zur spracherkennung
AT3002/88 1988-12-07

Publications (1)

Publication Number Publication Date
JPH02193199A true JPH02193199A (ja) 1990-07-30

Family

ID=3543787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1316602A Pending JPH02193199A (ja) 1988-12-07 1989-12-07 音声認識システム

Country Status (6)

Country Link
US (1) US5251283A (ja)
EP (1) EP0372639B1 (ja)
JP (1) JPH02193199A (ja)
AT (1) AT391035B (ja)
CA (1) CA2004515A1 (ja)
DE (1) DE58908319D1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000035795A (ja) * 1998-06-15 2000-02-02 Dragon Syst Inc 音声認識におけるノンインタラクティブ方式のエンロ―ルメント

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0505621A3 (en) * 1991-03-28 1993-06-02 International Business Machines Corporation Improved message recognition employing integrated speech and handwriting information
GB9602691D0 (en) * 1996-02-09 1996-04-10 Canon Kk Word model generation
WO1998013822A1 (en) * 1996-09-27 1998-04-02 Philips Electronics N.V. Method of and system for recognizing a spoken text
FR2770323A1 (fr) * 1997-10-24 1999-04-30 Bernard Houot Dispositif permettant de recueillir des informations aupres du public
US6490558B1 (en) * 1999-07-28 2002-12-03 Custom Speech Usa, Inc. System and method for improving the accuracy of a speech recognition program through repetitive training
US6510414B1 (en) 1999-10-05 2003-01-21 Cisco Technology, Inc. Speech recognition assisted data entry system and method
NZ503882A (en) * 2000-04-10 2002-11-26 Univ Otago Artificial intelligence system comprising a neural network with an adaptive component arranged to aggregate rule nodes
US9640175B2 (en) 2011-10-07 2017-05-02 Microsoft Technology Licensing, Llc Pronunciation learning from user correction
CN106384589A (zh) * 2016-03-07 2017-02-08 陈勇 个性语音录入器

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1435779A (en) * 1972-09-21 1976-05-12 Threshold Tech Word recognition
JPS5223202A (en) * 1975-08-15 1977-02-22 Fuji Xerox Co Ltd Utterance timing display device for voice recognition
CA1169969A (en) * 1980-08-20 1984-06-26 Gregor N. Neff Dictation system and method
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置
US4696038A (en) * 1983-04-13 1987-09-22 Texas Instruments Incorporated Voice messaging system with unified pitch and voice tracking
US4618984A (en) * 1983-06-08 1986-10-21 International Business Machines Corporation Adaptive automatic discrete utterance recognition
US4720802A (en) * 1983-07-26 1988-01-19 Lear Siegler Noise compensation arrangement
DE3518337A1 (de) * 1985-06-01 1986-12-04 Herbert Dipl.-Ing. Kubin (FH), 7300 Esslingen Sprachgesteuertes elektronisches schreib- und drucksystem mit wechselmodulen fuer fremdsprachen
US4776016A (en) * 1985-11-21 1988-10-04 Position Orientation Systems, Inc. Voice control system
US4975896A (en) * 1986-08-08 1990-12-04 Agosto Iii Nicholas A D Communications network and method
US4866778A (en) * 1986-08-11 1989-09-12 Dragon Systems, Inc. Interactive speech recognition apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000035795A (ja) * 1998-06-15 2000-02-02 Dragon Syst Inc 音声認識におけるノンインタラクティブ方式のエンロ―ルメント
JP4510953B2 (ja) * 1998-06-15 2010-07-28 ドラゴン・システムズ・インコーポレーテッド 音声認識におけるノンインタラクティブ方式のエンロールメント

Also Published As

Publication number Publication date
AT391035B (de) 1990-08-10
ATA300288A (de) 1990-01-15
EP0372639B1 (de) 1994-09-07
EP0372639A3 (de) 1991-03-13
DE58908319D1 (de) 1994-10-13
US5251283A (en) 1993-10-05
EP0372639A2 (de) 1990-06-13
CA2004515A1 (en) 1990-06-07

Similar Documents

Publication Publication Date Title
US7490039B1 (en) Text to speech system and method having interactive spelling capabilities
KR100312060B1 (ko) 음독이 미숙한 자용 및 표시기가 없는 장치용 음성 인식등록 방법 및 장치
CN1312657C (zh) 用于标注所识别文本的部分的转录设备和方法
US6477493B1 (en) Off site voice enrollment on a transcription device for speech recognition
US6771887B1 (en) Recording/reproducing apparatus and recording/reproducing method
US20020133342A1 (en) Speech to text method and system
US3879751A (en) Court reporting dictating system and method
JPH02193199A (ja) 音声認識システム
JP2003307997A (ja) 語学教育システム、音声データ処理装置、音声データ処理方法、音声データ処理プログラム、及び記憶媒体
US3765106A (en) Teaching system
US3703041A (en) Magnetic teaching machine with selectively operable repetitive and non-repetitive learning modes
JP2000206987A (ja) 音声認識装置
JP7288530B1 (ja) システムおよびプログラム
JP2001331092A (ja) 語学学習システム
KR0135774B1 (ko) 문장 인지를 위한 테이프 기록 및 재생방법과 재생장치
JPS60244989A (ja) 発音訓練機
KR20010029111A (ko) 외국어 청취 보조 장치
KR100988272B1 (ko) 주간 또는 월간으로 발행하는 언어학습지용 언어학습기 및그 장치를 이용한 언어학습방법
JPS613241A (ja) 音声確認方式
JPH0728384A (ja) 語学練習機
KR20010027052A (ko) 어학 학습용 장치 및 그 제어 방법
KR940007508B1 (ko) 어학실습기능을 갖는 오디오 시스템
JP2609874B2 (ja) 音声認識システム
JPH0486886A (ja) 音学習装置
JP2777366B2 (ja) 音声認識システム