JPS62232691A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS62232691A JPS62232691A JP61076905A JP7690586A JPS62232691A JP S62232691 A JPS62232691 A JP S62232691A JP 61076905 A JP61076905 A JP 61076905A JP 7690586 A JP7690586 A JP 7690586A JP S62232691 A JPS62232691 A JP S62232691A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- recognition device
- standard pattern
- speech
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 16
- 238000010586 diagram Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
夜夏分裏
本発明は、音声認識に関する6
丈来技!
単語の音声を認識する方法として数多くの方式が開発さ
れているが、その殆んどがあらかじめ音声を登録してお
き、後に入力される音声がその登録されたどのパターン
と類似しているかを調べて入力音声を認識するものであ
る。
れているが、その殆んどがあらかじめ音声を登録してお
き、後に入力される音声がその登録されたどのパターン
と類似しているかを調べて入力音声を認識するものであ
る。
第7図は、上記従来の音声認識装置の一例を説明するた
めの電気的ブロック線図で、図中、1はマイク、2は特
微分析部、3は標準パターン部、4は照合部、5は結果
出力部で1周知のように、入力音声を特微分析部2にお
いて特徴ベクトルの時系列に変換し、照合部4において
標準パターンとのマツチングを行い、各登録音声ごとに
類似度を算出するものであるが、この場合、標準パター
ンをいかに正確に登録するかが認識率向上のためのポイ
ントである。ところが音声を周辺ノイズから正確に抽出
するということが難しく、特に、単語音声の末尾が抽出
できないことがよくある。
めの電気的ブロック線図で、図中、1はマイク、2は特
微分析部、3は標準パターン部、4は照合部、5は結果
出力部で1周知のように、入力音声を特微分析部2にお
いて特徴ベクトルの時系列に変換し、照合部4において
標準パターンとのマツチングを行い、各登録音声ごとに
類似度を算出するものであるが、この場合、標準パター
ンをいかに正確に登録するかが認識率向上のためのポイ
ントである。ところが音声を周辺ノイズから正確に抽出
するということが難しく、特に、単語音声の末尾が抽出
できないことがよくある。
例えば、「1」をrichiJと発声するところをri
chJと発声し、最後の母音が無声化することがあり、
このような無声化したパターンを標準パターンとして登
録してしまうと、正確にrichiJと発声された音声
が認識できないという欠点がある上、一度誤認識される
と、人間はできるだけ正確にしようとするため、ますま
す認識できなくなってしまう、又、これを防ぐためにr
ichJとrichiJの両方の標準パターンを登録す
る方法もあるが、標準パターン用メモリが増大するばか
りでなく意識的に最終母音を無声化して発声するのもや
りにくいという欠点がある。
chJと発声し、最後の母音が無声化することがあり、
このような無声化したパターンを標準パターンとして登
録してしまうと、正確にrichiJと発声された音声
が認識できないという欠点がある上、一度誤認識される
と、人間はできるだけ正確にしようとするため、ますま
す認識できなくなってしまう、又、これを防ぐためにr
ichJとrichiJの両方の標準パターンを登録す
る方法もあるが、標準パターン用メモリが増大するばか
りでなく意識的に最終母音を無声化して発声するのもや
りにくいという欠点がある。
目 的
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声認識用に質の高い標準パターンを提供するこ
とを目的としてなされたものである。
特に、音声認識用に質の高い標準パターンを提供するこ
とを目的としてなされたものである。
諺−一一収
本発明は、上記目的を達成するために、音声入力部と分
析部と標準パターン作成部とを有し、標準パターンを登
録する際、登録する音韻名を入力する音声認識装置にお
いて、音韻名の末尾近辺に特定の文字又は文字列が存在
する時、あるいは、末尾近辺の文字が破裂子音のとき、
通常の標準パターン作成手順と異なる手順によって標準
パターンを作成することを特徴としたものである。以下
、本発明の実施例に基いて説明する。
析部と標準パターン作成部とを有し、標準パターンを登
録する際、登録する音韻名を入力する音声認識装置にお
いて、音韻名の末尾近辺に特定の文字又は文字列が存在
する時、あるいは、末尾近辺の文字が破裂子音のとき、
通常の標準パターン作成手順と異なる手順によって標準
パターンを作成することを特徴としたものである。以下
、本発明の実施例に基いて説明する。
第1図は1本発明による音声認識装置の一実施例を説明
するための電気的ブロック線図で、図中。
するための電気的ブロック線図で、図中。
11はマイク、12は音声区間検出部、13はバンドパ
スフィルタ群、14はキーボード、15゜16は判定部
、17は標準パターン部、18は照合部、19は結果出
力部で、標準パターン登録に際して、まず、登録すべき
単語名をキーボード14から入力する。その単語名の末
尾が/ n /かどうかを判定部15でチェックし、/
n /でない時は、第7図の場合と同じ処理によって
標準パターンを登録し、/ n /であれば音声パター
ンの末尾が/ n /であるかどうかを調べる。これは
バンドパスフィルタ群13を通過した音声の低域部が高
域部に比べて十分大なることとして調べられる。このよ
うにして単語音声の末尾が/ n /でなければ/ n
/を切り出し損ねたと判断して再発声を要求し、/
n /であれば正常に切り出したとして標準パターンに
登録する。このようなパターン中のスペクトル分布だけ
でなくパワーによっても同様の効果を得ることができる
。
スフィルタ群、14はキーボード、15゜16は判定部
、17は標準パターン部、18は照合部、19は結果出
力部で、標準パターン登録に際して、まず、登録すべき
単語名をキーボード14から入力する。その単語名の末
尾が/ n /かどうかを判定部15でチェックし、/
n /でない時は、第7図の場合と同じ処理によって
標準パターンを登録し、/ n /であれば音声パター
ンの末尾が/ n /であるかどうかを調べる。これは
バンドパスフィルタ群13を通過した音声の低域部が高
域部に比べて十分大なることとして調べられる。このよ
うにして単語音声の末尾が/ n /でなければ/ n
/を切り出し損ねたと判断して再発声を要求し、/
n /であれば正常に切り出したとして標準パターンに
登録する。このようなパターン中のスペクトル分布だけ
でなくパワーによっても同様の効果を得ることができる
。
第2図は、その場合の一実施例を説明するための電気的
ブロック線図で、図中、21は特徴抽出部、22.23
は判定部で、その他第1図に示した実施例と同様の作用
をする部分には第1図の場合と同一の参照番号が付しで
ある。而して、この実施例においても、第1図に示した
実施と同様、キーボード14から登録すべき単語名を打
ち込み、末尾の子音が破裂音かどうか、つまり/ρ/。
ブロック線図で、図中、21は特徴抽出部、22.23
は判定部で、その他第1図に示した実施例と同様の作用
をする部分には第1図の場合と同一の参照番号が付しで
ある。而して、この実施例においても、第1図に示した
実施と同様、キーボード14から登録すべき単語名を打
ち込み、末尾の子音が破裂音かどうか、つまり/ρ/。
/l/、/に/かどうかを調べる。日本語の場合、キー
ボード14で単語名を入力すると末尾は必ず母音である
からここで言う末尾の子音とはこの母音の前の子音であ
り、外国語の場合は最後の子音を指す。例えば、pin
kなどがこれに相当する。 ′破裂音でない場合は通
常通りであるが破裂音であるならば入力された音声パタ
ーンの末尾付近に音声パワーに大きなディップがあるが
どうがを調べる。これは破裂音はその前に無音区間が発
生することを利用したもので、入力された単語名には末
尾に破裂音があるのに音声パターンの末尾にパワーディ
ップがない場合、これは音声区間の切り出し部で末尾子
音以後を検出できず切り落してしまったためとして再入
力を要求する。又、1回の発声で標準パターンを作成す
る方式の他に数回発声してその平均のパターンを標準パ
ターンとするものがあり、この場合、切り出しミスから
末尾がないものとあるものを平均してしまうと標準パタ
ーンが不良になってしまう。
ボード14で単語名を入力すると末尾は必ず母音である
からここで言う末尾の子音とはこの母音の前の子音であ
り、外国語の場合は最後の子音を指す。例えば、pin
kなどがこれに相当する。 ′破裂音でない場合は通
常通りであるが破裂音であるならば入力された音声パタ
ーンの末尾付近に音声パワーに大きなディップがあるが
どうがを調べる。これは破裂音はその前に無音区間が発
生することを利用したもので、入力された単語名には末
尾に破裂音があるのに音声パターンの末尾にパワーディ
ップがない場合、これは音声区間の切り出し部で末尾子
音以後を検出できず切り落してしまったためとして再入
力を要求する。又、1回の発声で標準パターンを作成す
る方式の他に数回発声してその平均のパターンを標準パ
ターンとするものがあり、この場合、切り出しミスから
末尾がないものとあるものを平均してしまうと標準パタ
ーンが不良になってしまう。
第3図は、上述のごとき点を考慮してなされた実施例を
示す電気的ブロック線図で1図中、31は平均部であり
、その他第2図に示した実施例と同様の作用をする部分
には、第2図の場合と同一の参照番号が付しである。而
して、この実施例において、標準パターン作成のための
パターンチェックは、第2図の実施例と同じ方法で行な
い、末尾まで正常に切り出されたパターンだけを用いて
平均パターンを作成するようにする。このため。
示す電気的ブロック線図で1図中、31は平均部であり
、その他第2図に示した実施例と同様の作用をする部分
には、第2図の場合と同一の参照番号が付しである。而
して、この実施例において、標準パターン作成のための
パターンチェックは、第2図の実施例と同じ方法で行な
い、末尾まで正常に切り出されたパターンだけを用いて
平均パターンを作成するようにする。このため。
パターンにより平均回数が異なるものが出てくるが、末
尾が切り落されたパターンを平均に加えることに比べ飛
躍的に標準パターンの質が向上する。
尾が切り落されたパターンを平均に加えることに比べ飛
躍的に標準パターンの質が向上する。
このような場合、平均回数が異なってくるため。
入力されたパターンを全て標準パターン作成に利用する
ものとして第4図のようなものが考えられる。
ものとして第4図のようなものが考えられる。
第4図に示した実施例は、キーボード14からの入力単
語名は音声末尾に破裂音があるにもかかわらず、入力パ
ターン末尾には無音がない場合。
語名は音声末尾に破裂音があるにもかかわらず、入力パ
ターン末尾には無音がない場合。
先にこの単語パターンとして登録された末尾の無音まで
の部分と現入力パターンの平均をとって、標準パターン
として登録するようにする。これにより入力されたパタ
ーンを全て利用して良質の標準パターンを作成すること
ができる。
の部分と現入力パターンの平均をとって、標準パターン
として登録するようにする。これにより入力されたパタ
ーンを全て利用して良質の標準パターンを作成すること
ができる。
以上に述べた方法は1日本語の単語音声に限るものでは
なく外国語に対しても有効である。特に。
なく外国語に対しても有効である。特に。
外国語では母音を伴わない子音単独の発声があるため、
このような方式は効果が大きい。尚、以上の説明で述べ
た音声区間検出法、特徴抽出法、照合法に関しては、特
に、限定するものではなく。
このような方式は効果が大きい。尚、以上の説明で述べ
た音声区間検出法、特徴抽出法、照合法に関しては、特
に、限定するものではなく。
例えば、共立出版「音声認識」 (新美著)などに述べ
られたものを用いれば良い。
られたものを用いれば良い。
羞−一来
以上の説明から明らかなように、本発明によると、質の
高い標準パターンを有する音声認識装置を提供すること
ができる。
高い標準パターンを有する音声認識装置を提供すること
ができる。
第1図乃至第4図は、それぞれ本発明の詳細な説明する
ための電気的ブロック線図、第5図は、標準パターン作
成部の詳細図、第6図は、パターン部分平均の概念を説
明するための図、第7図は、従来の音声認識装置の一例
を説明するための図である。 11・・・マイク、12・・・音声区間検出部、13・
・・バンドパスフィルタ群、14・・・キーボード、1
5゜16・・・判定部、17・・・標準パターン部、1
8・・・照合部、19・・・結果出力部、21・・・特
徴抽出部。 22.23・・・判定部、31・・・平均部。 特許出願人 株式会社 リコー 第 1 図 第2図 第 3 図 第4図 第 5 図 第6図 第7図 !
ための電気的ブロック線図、第5図は、標準パターン作
成部の詳細図、第6図は、パターン部分平均の概念を説
明するための図、第7図は、従来の音声認識装置の一例
を説明するための図である。 11・・・マイク、12・・・音声区間検出部、13・
・・バンドパスフィルタ群、14・・・キーボード、1
5゜16・・・判定部、17・・・標準パターン部、1
8・・・照合部、19・・・結果出力部、21・・・特
徴抽出部。 22.23・・・判定部、31・・・平均部。 特許出願人 株式会社 リコー 第 1 図 第2図 第 3 図 第4図 第 5 図 第6図 第7図 !
Claims (4)
- (1)、音声入力部と分析部と標準パターン作成部とを
有し、標準パターンを登録する際、登録する音韻名を入
力する音声認識装置において、音韻名の末尾近辺に特定
の文字又は文字列が存在する時、通常の標準パターン作
成手順と異なる手順によつて標準パターンを作成するこ
とを特徴とする音声認識装置。 - (2)、音声入力部と分析部と標準パターン作成部とを
有し、標準パターンを登録する際、登録する音韻名を入
力する音声認識装置において、音韻名の末尾近辺の文字
が破裂子音のとき、通常と異なる手順によつて標準パタ
ーンを作成することを特徴とする音声認識装置。 - (3)、末尾近辺の文字が破裂子音のとき、入力された
音声の末尾近辺に無音を表わすパターンが存在するか否
かを調べ、存在しない場合、その音声パターンを標準パ
ターン用の対象から除くようにしたことを特徴とする特
許請求の範囲第(2)項に記載の音声認識装置。 - (4)、複数回の発声によつて一つの音声の標準パター
ンを作成する場合、末尾近辺の文字が破裂子音のとき、
入力された音声の末尾近辺に無音を表わすパターンが存
在するか否かを調べ、存在しない場合、先に入力された
同じ音声パターンの末尾近辺の無音から暴頭の部分と該
入力パターンを対応づけて登録することを特徴とする特
許請求の範囲第(2)項に記載の音声認識装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61076905A JPS62232691A (ja) | 1986-04-03 | 1986-04-03 | 音声認識装置 |
US07/033,943 US4769844A (en) | 1986-04-03 | 1987-04-03 | Voice recognition system having a check scheme for registration of reference data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61076905A JPS62232691A (ja) | 1986-04-03 | 1986-04-03 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62232691A true JPS62232691A (ja) | 1987-10-13 |
Family
ID=13618679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61076905A Pending JPS62232691A (ja) | 1986-04-03 | 1986-04-03 | 音声認識装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US4769844A (ja) |
JP (1) | JPS62232691A (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5347612A (en) * | 1986-07-30 | 1994-09-13 | Ricoh Company, Ltd. | Voice recognition system and method involving registered voice patterns formed from superposition of a plurality of other voice patterns |
US5315689A (en) * | 1988-05-27 | 1994-05-24 | Kabushiki Kaisha Toshiba | Speech recognition system having word-based and phoneme-based recognition means |
US5216720A (en) * | 1989-05-09 | 1993-06-01 | Texas Instruments Incorporated | Voice verification circuit for validating the identity of telephone calling card customers |
US5201028A (en) * | 1990-09-21 | 1993-04-06 | Theis Peter F | System for distinguishing or counting spoken itemized expressions |
US5293452A (en) * | 1991-07-01 | 1994-03-08 | Texas Instruments Incorporated | Voice log-in using spoken name input |
JPH075898A (ja) * | 1992-04-28 | 1995-01-10 | Technol Res Assoc Of Medical & Welfare Apparatus | 音声信号処理装置と破裂性抽出装置 |
US5425128A (en) * | 1992-05-29 | 1995-06-13 | Sunquest Information Systems, Inc. | Automatic management system for speech recognition processes |
WO1994002936A1 (en) * | 1992-07-17 | 1994-02-03 | Voice Powered Technology International, Inc. | Voice recognition apparatus and method |
JPH07225593A (ja) * | 1994-02-10 | 1995-08-22 | Fuji Xerox Co Ltd | 音処理装置 |
US5835894A (en) * | 1995-01-19 | 1998-11-10 | Ann Adcock Corporation | Speaker and command verification method |
US5701389A (en) * | 1995-01-31 | 1997-12-23 | Lucent Technologies, Inc. | Window switching based on interblock and intrablock frequency band energy |
US5706398A (en) * | 1995-05-03 | 1998-01-06 | Assefa; Eskinder | Method and apparatus for compressing and decompressing voice signals, that includes a predetermined set of syllabic sounds capable of representing all possible syllabic sounds |
TW347503B (en) * | 1995-11-15 | 1998-12-11 | Hitachi Ltd | Character recognition translation system and voice recognition translation system |
US5781887A (en) * | 1996-10-09 | 1998-07-14 | Lucent Technologies Inc. | Speech recognition method with error reset commands |
JP3891755B2 (ja) * | 2000-03-27 | 2007-03-14 | 沖電気工業株式会社 | パケット受信装置 |
US7143037B1 (en) | 2002-06-12 | 2006-11-28 | Cisco Technology, Inc. | Spelling words using an arbitrary phonetic alphabet |
JP4447857B2 (ja) * | 2003-06-20 | 2010-04-07 | 株式会社エヌ・ティ・ティ・ドコモ | 音声検出装置 |
US7336282B2 (en) * | 2003-09-11 | 2008-02-26 | Ricoh Company, Ltd. | System, recording medium and program for inputting operation condition of instrument |
KR100554442B1 (ko) * | 2003-10-06 | 2006-02-22 | 주식회사 팬택앤큐리텔 | 음성인식 기능을 가진 이동 통신 단말기, 및 이를 위한음소 모델링 방법 및 음성 인식 방법 |
US7890330B2 (en) * | 2005-12-30 | 2011-02-15 | Alpine Electronics Inc. | Voice recording tool for creating database used in text to speech synthesis system |
US20070203706A1 (en) * | 2005-12-30 | 2007-08-30 | Inci Ozkaragoz | Voice analysis tool for creating database used in text to speech synthesis system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5224010A (en) * | 1975-08-09 | 1977-02-23 | Fuji Xerox Co Ltd | Individual person recognition system using speech frequency spectrum c entroid locus |
JPS5272504A (en) * | 1975-12-15 | 1977-06-17 | Fuji Xerox Co Ltd | Device for recognizing word audio |
JPS59192A (ja) * | 1982-06-25 | 1984-01-05 | 株式会社東芝 | 個人照合装置 |
-
1986
- 1986-04-03 JP JP61076905A patent/JPS62232691A/ja active Pending
-
1987
- 1987-04-03 US US07/033,943 patent/US4769844A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US4769844A (en) | 1988-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS62232691A (ja) | 音声認識装置 | |
US4994983A (en) | Automatic speech recognition system using seed templates | |
JPS5944639B2 (ja) | 音声による異同認識方式における標準パタ−ン更新方法 | |
Boite et al. | A new approach towards keyword spotting. | |
JP2996019B2 (ja) | 音声認識装置 | |
CN111429921B (zh) | 声纹识别方法、系统、移动终端及存储介质 | |
JPH0283593A (ja) | ノイズ適応形音声認識装置 | |
JP2001188556A (ja) | 音声認識方法及び装置 | |
JP3110025B2 (ja) | 発声変形検出装置 | |
JPS62217297A (ja) | 単語音声認識装置 | |
JPS62245295A (ja) | 特定話者音声認識装置 | |
JPS63157199A (ja) | 話者照合装置 | |
JP3357752B2 (ja) | パターンマッチング装置 | |
JPH0534679B2 (ja) | ||
JPS6312000A (ja) | 音声認識装置 | |
JPS63149698A (ja) | 音声認識装置 | |
JPS62255999A (ja) | 単語音声認識装置 | |
JPS6180298A (ja) | 音声認識装置 | |
JPS607492A (ja) | 単音節音声認識方式 | |
Akintola et al. | Speech Processing Algorithm for Automatic Speaker Recognition-Based Telephone Voice Dialing in Yorùbá | |
JPH1130994A (ja) | 音声認識方法および装置ならびに音声認識プログラムを記録した記録媒体 | |
JP2001013983A (ja) | 音声合成を用いた音声認識装置および音声認識方法 | |
JPH0316038B2 (ja) | ||
JPH02183299A (ja) | 音声認識装置 | |
Parris et al. | Ensigma Ltd. Turing House, Station Road, Chepstow, Gwent, UK |