JPH0573039B2 - - Google Patents
Info
- Publication number
- JPH0573039B2 JPH0573039B2 JP59277166A JP27716684A JPH0573039B2 JP H0573039 B2 JPH0573039 B2 JP H0573039B2 JP 59277166 A JP59277166 A JP 59277166A JP 27716684 A JP27716684 A JP 27716684A JP H0573039 B2 JPH0573039 B2 JP H0573039B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- phrase
- symbol string
- memory
- syllable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/12—Improving ICE efficiencies
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/30—Use of alternative fuels, e.g. biofuels
Description
【発明の詳細な説明】
産業上の利用分野
本発明は音声認識装置に関するものである。
従来の技術
近年、単語又は文節音声等を認識する音声認識
装置において母音、子音等を大分類識別してお
き、それら音韻列候補より単語又は文節出力を得
る方法が試みられている(例:三船他 信学技報
EA83−33、昭和58年)。この場合、単語辞書等の
有意味記号列辞書から最終的に単語出力等を得る
に際し従来は第4図の如き構成であつた。
装置において母音、子音等を大分類識別してお
き、それら音韻列候補より単語又は文節出力を得
る方法が試みられている(例:三船他 信学技報
EA83−33、昭和58年)。この場合、単語辞書等の
有意味記号列辞書から最終的に単語出力等を得る
に際し従来は第4図の如き構成であつた。
第4図において、1はマイクロホン、2は音響
パラメータ抽出器、3は母音大分類識別器、4は
子音大分類識別器、5は識別器、6は音韻音節記
号列候補メモリー、7は音韻音節パラメータ辞
書、8は音韻音節パラメータメモリー、9は識別
尤度順位別音韻音節列メモリー、10は単語文節
記号列辞書、11は識別尤度順位別単語文節出力
表示器である。
パラメータ抽出器、3は母音大分類識別器、4は
子音大分類識別器、5は識別器、6は音韻音節記
号列候補メモリー、7は音韻音節パラメータ辞
書、8は音韻音節パラメータメモリー、9は識別
尤度順位別音韻音節列メモリー、10は単語文節
記号列辞書、11は識別尤度順位別単語文節出力
表示器である。
次に上記構成システムの動作について説明す
る。
る。
人間が単語又は文節音声をマイクロホン1に向
かつて発声すると、音響パラメータ抽出器2にお
いてLPCケプストラム等の音響パラメータが抽
出される。これらは母音大分類識別器3、子音大
分類識別器4によつてセグメンテーシヨン及び大
分類識別が行われる。
かつて発声すると、音響パラメータ抽出器2にお
いてLPCケプストラム等の音響パラメータが抽
出される。これらは母音大分類識別器3、子音大
分類識別器4によつてセグメンテーシヨン及び大
分類識別が行われる。
この出力の例を第2図で示す。ここでは入力音
声として“MA TSU SHI TA”という言葉が
発声されている。するとセグメンテーシヨン及び
大分類識別により第1番目の子音C1としてN,
M,Bが、第1番目の母音V1としてA,Oが、
第2番目の子音C2としてS,H,TSが候補とし
て上がつている。以降の母音子音についても同様
とする。これらが音韻音節記号列候補メモリー6
に入ると第5図の如くCVあるいはVCVの単位の
記号列候補が得られ記憶される。ここでは日本語
の場合を例にとつているので通常よく扱われてい
るようにCVやVCVを単位にとつているが、単独
のCやVあるいはCVC等を単位にとつても主旨
は同様である。ここで音韻音節とは音韻や音節の
如く単語音声を構成する基本単位を総称したもの
である。メモリー6の出力は音韻音節パラメータ
辞書7の中で検索され、各々の音韻音節に対応し
たパラメータが呼び出されて音韻音節パラメータ
メモリー8に記憶される。識別器5においては入
力音声のパラメータとメモリー8にある音韻音節
のパラメータとを用いて識別される。この出力は
識別尤度順位別音韻音節列メモリー9に記憶され
る。ここにおいて入力単語音声との識別尤度の大
きいものの順番に配置される。この結果は単語文
節記号列辞書10の中で検索され、該当するもの
が識別尤度順位別単語文節出力表示器11に表示
される。なおここで単語文節とは単語あるいは文
節という意味である。
声として“MA TSU SHI TA”という言葉が
発声されている。するとセグメンテーシヨン及び
大分類識別により第1番目の子音C1としてN,
M,Bが、第1番目の母音V1としてA,Oが、
第2番目の子音C2としてS,H,TSが候補とし
て上がつている。以降の母音子音についても同様
とする。これらが音韻音節記号列候補メモリー6
に入ると第5図の如くCVあるいはVCVの単位の
記号列候補が得られ記憶される。ここでは日本語
の場合を例にとつているので通常よく扱われてい
るようにCVやVCVを単位にとつているが、単独
のCやVあるいはCVC等を単位にとつても主旨
は同様である。ここで音韻音節とは音韻や音節の
如く単語音声を構成する基本単位を総称したもの
である。メモリー6の出力は音韻音節パラメータ
辞書7の中で検索され、各々の音韻音節に対応し
たパラメータが呼び出されて音韻音節パラメータ
メモリー8に記憶される。識別器5においては入
力音声のパラメータとメモリー8にある音韻音節
のパラメータとを用いて識別される。この出力は
識別尤度順位別音韻音節列メモリー9に記憶され
る。ここにおいて入力単語音声との識別尤度の大
きいものの順番に配置される。この結果は単語文
節記号列辞書10の中で検索され、該当するもの
が識別尤度順位別単語文節出力表示器11に表示
される。なおここで単語文節とは単語あるいは文
節という意味である。
発明が解決しようとする問題点
しかしながら上記の構成では、単語文節記号列
辞書に存在しない言葉の音韻音節パラメータにつ
いても識別を行わねばならないために処理効率が
悪いという問題点を有していた。特にパラメータ
におけるパターンマツチングは多量の演算を行う
ため、計算時間が長くかかることが知られてい
る。
辞書に存在しない言葉の音韻音節パラメータにつ
いても識別を行わねばならないために処理効率が
悪いという問題点を有していた。特にパラメータ
におけるパターンマツチングは多量の演算を行う
ため、計算時間が長くかかることが知られてい
る。
本発明は上記問題点に鑑み、単語文節記号列辞
書にある言葉を構成する音韻音節についてのみ識
別を行わせ、識別の計算量を減らすシステムを提
供するものである。
書にある言葉を構成する音韻音節についてのみ識
別を行わせ、識別の計算量を減らすシステムを提
供するものである。
問題点を解決するための手段
上記問題点を解決するために本発明の音声認識
装置は、母音大分類識別器と子音大分類識別器の
出力をまず母子音記号列候補メモリーに供給し、
その出力を単語文節記号列辞書を単語文節別音韻
音節記号列候補メモリーに、さらにその出力を単
語文節別パラメータ列メモリーと音韻音節パラメ
ータ辞書にそれぞれ供給するとともに、音韻音節
パラメータ辞書の出力を単語文節別パラメータ列
メモリーに供給するよう構成したものである。
装置は、母音大分類識別器と子音大分類識別器の
出力をまず母子音記号列候補メモリーに供給し、
その出力を単語文節記号列辞書を単語文節別音韻
音節記号列候補メモリーに、さらにその出力を単
語文節別パラメータ列メモリーと音韻音節パラメ
ータ辞書にそれぞれ供給するとともに、音韻音節
パラメータ辞書の出力を単語文節別パラメータ列
メモリーに供給するよう構成したものである。
作 用
このような構成によれば、母子音記号列候補メ
モリーの出力を用いて単語文節記号列辞書を検索
するために、存在しない言葉の音韻音節パラメー
タについては識別をすることがなく、問題点であ
つた処理効率の悪さが決定されることとなる。
モリーの出力を用いて単語文節記号列辞書を検索
するために、存在しない言葉の音韻音節パラメー
タについては識別をすることがなく、問題点であ
つた処理効率の悪さが決定されることとなる。
実施例
以下本発明の一実施例の音声認識装置について
図面を参照しながら説明する。第1図に本発明の
構成例を示す。図において、21はマイクロホ
ン、22は音響パラメータ抽出器、23は母音大
分類識別器、24は子音大分類識別器、25は識
別器、26は母子音記号列候補メモリー、27は
単語文節記号列辞書、28は単語文節別音韻音節
記号列候補メモリー、29は音韻音節パラメータ
辞書、30は単語文節別パラメータ列メモリー、
31は識別尤度順位別単語文節出力表示器であ
る。
図面を参照しながら説明する。第1図に本発明の
構成例を示す。図において、21はマイクロホ
ン、22は音響パラメータ抽出器、23は母音大
分類識別器、24は子音大分類識別器、25は識
別器、26は母子音記号列候補メモリー、27は
単語文節記号列辞書、28は単語文節別音韻音節
記号列候補メモリー、29は音韻音節パラメータ
辞書、30は単語文節別パラメータ列メモリー、
31は識別尤度順位別単語文節出力表示器であ
る。
次にこの装置の動作について説明する。
人間が単語又は音節音声をマイクロホン21に
向かつて発声すると、音響パラメータ抽出器22
においてLPCケプストラム等の音響パラメータ
が抽出される。これらは母音大分類識別器23、
子音大分類識別器24によつてセグメンテーシヨ
ン及び大分類識別が行われる。この出力の例を第
2図で示す。これらが母子音記号列候補メモリー
26に入り記憶される。母子音記号列候補メモリ
ー26の出力は単語文節記号列辞書27の中で検
索され、合致するものが音韻音節記号列に分解さ
れた後、単語文節別音韻音節記号列候補メモリー
28に記憶される。音韻音節パラメータ辞書29
ではメモリー28にある音韻音節記号列候補に対
応したパラメータが呼び出され、単語文節別パラ
メータ列メモリー30に記憶される。
向かつて発声すると、音響パラメータ抽出器22
においてLPCケプストラム等の音響パラメータ
が抽出される。これらは母音大分類識別器23、
子音大分類識別器24によつてセグメンテーシヨ
ン及び大分類識別が行われる。この出力の例を第
2図で示す。これらが母子音記号列候補メモリー
26に入り記憶される。母子音記号列候補メモリ
ー26の出力は単語文節記号列辞書27の中で検
索され、合致するものが音韻音節記号列に分解さ
れた後、単語文節別音韻音節記号列候補メモリー
28に記憶される。音韻音節パラメータ辞書29
ではメモリー28にある音韻音節記号列候補に対
応したパラメータが呼び出され、単語文節別パラ
メータ列メモリー30に記憶される。
単語文節別パラメータ列メモリー30は第3図
の如く構成されている。母子音大分類識別結果及
び単語文節記号列辞書により得られた単語あるい
は文節が「松下」「那須北」「名付けた」のような
人名、地名、文節だけであると仮定する。この
時、必要な音韻文節パラメータはMA,NA,
ATSU,ASU,AZU,USHI,UKI,UKE,
ITA,ETAの10種類だけで済む。これは第5図
の音韻音節候補と比較すれば大巾な候補削減にな
つている。
の如く構成されている。母子音大分類識別結果及
び単語文節記号列辞書により得られた単語あるい
は文節が「松下」「那須北」「名付けた」のような
人名、地名、文節だけであると仮定する。この
時、必要な音韻文節パラメータはMA,NA,
ATSU,ASU,AZU,USHI,UKI,UKE,
ITA,ETAの10種類だけで済む。これは第5図
の音韻音節候補と比較すれば大巾な候補削減にな
つている。
識別器25においては入力音声のパラメータと
単語メモリー30のパラメータが単語文節候補別
に識別される。そしてその結果が識別尤度順位別
単語文節出力表示器31に、識別尤度の大きな単
語あるいは文節の順位に表示される。
単語メモリー30のパラメータが単語文節候補別
に識別される。そしてその結果が識別尤度順位別
単語文節出力表示器31に、識別尤度の大きな単
語あるいは文節の順位に表示される。
以上の様に本実施例によれば単語文節記号列辞
書を母子音記号列候補メモリーの出力端に接続
し、候補単語文節の絞り込みを行うことにより識
別処理量を少なくし、効率を良くすることができ
る。
書を母子音記号列候補メモリーの出力端に接続
し、候補単語文節の絞り込みを行うことにより識
別処理量を少なくし、効率を良くすることができ
る。
なお本実施例において単語文節とは単語あるい
は文節という意であり、又音韻文節とは音韻ある
いは音節等の様に単語あるいは文節の基本単位と
なる音を意味する。
は文節という意であり、又音韻文節とは音韻ある
いは音節等の様に単語あるいは文節の基本単位と
なる音を意味する。
発明の効果
以上の様に本発明は母子音記号列候補メモリー
の出力を用いて単語文節記号列辞書を検索し、単
語文節候補を絞り込むことにより存在しない、あ
るいは候補にもれた言葉の音韻音節パラメータに
ついての識別計算を行うことがないので処理効率
が良い。特に候補絞り込みにより得る単語文節の
数が1箇の場合、識別計算を行わなくて良いとい
う利点がある。
の出力を用いて単語文節記号列辞書を検索し、単
語文節候補を絞り込むことにより存在しない、あ
るいは候補にもれた言葉の音韻音節パラメータに
ついての識別計算を行うことがないので処理効率
が良い。特に候補絞り込みにより得る単語文節の
数が1箇の場合、識別計算を行わなくて良いとい
う利点がある。
第1図は本発明の一実施例における音声認識装
置の構成を示す図、第2図は同装置における母子
音記号列候補メモリーの内容説明図、第3図は第
1図における単語文節別パラメータ列メモリー3
0の内容説明図、第4図は従来の音声認識装置の
一例の構成を示す図、第5図は同装置の音韻音節
記号列候補メモリーの内容説明図である。 21……マイクロホン、22……音響パラメー
タ抽出器、23……母音大分類識別器、24……
子音大分類識別器、25……識別器、26……母
子音記号列候補メモリー、27……単語文節記号
列辞書、28……単語文節別音韻音節記号列候補
メモリー、29……音韻音節パラメータ辞書、3
0……単語文節別パラメータ列メモリー、31…
…識別尤度順位別単語文節出力表示器。
置の構成を示す図、第2図は同装置における母子
音記号列候補メモリーの内容説明図、第3図は第
1図における単語文節別パラメータ列メモリー3
0の内容説明図、第4図は従来の音声認識装置の
一例の構成を示す図、第5図は同装置の音韻音節
記号列候補メモリーの内容説明図である。 21……マイクロホン、22……音響パラメー
タ抽出器、23……母音大分類識別器、24……
子音大分類識別器、25……識別器、26……母
子音記号列候補メモリー、27……単語文節記号
列辞書、28……単語文節別音韻音節記号列候補
メモリー、29……音韻音節パラメータ辞書、3
0……単語文節別パラメータ列メモリー、31…
…識別尤度順位別単語文節出力表示器。
Claims (1)
- 1 マイクロホンを音響パラメータ抽出器に接続
し、前記音響パラメータ抽出器の出力端を子音大
分類識別器及び母音大分類識別器及び識別器の入
力端に接続し、前記子音大分類識別器の出力端及
び前記母音大分類識別器の出力端を母子音記号列
候補メモリーの入力端に接続し、この母子音記号
列候補メモリーの出力端を単語文節記号列辞書の
入力端に接続し、前記単語文節記号列辞書の出力
端を音韻音節記号列候補メモリーの入力端に接続
し、前記音節記号列候補メモリーの出力端を音韻
音節パラメータ辞書及び単語文節別パラメータ列
メモリーの入力端に接続し、前記音韻音節パラメ
ータ辞書の出力端を前記単語文節別パラメータ列
メモリーの入力端に接続し、前記単語文節別パラ
メータ列メモリーの出力端を前記識別器の入力端
に接続し、前記識別器の出力端を識別尤度順位別
単語文節出力表示器に接続した音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59277166A JPS61149997A (ja) | 1984-12-25 | 1984-12-25 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59277166A JPS61149997A (ja) | 1984-12-25 | 1984-12-25 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61149997A JPS61149997A (ja) | 1986-07-08 |
JPH0573039B2 true JPH0573039B2 (ja) | 1993-10-13 |
Family
ID=17579719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59277166A Granted JPS61149997A (ja) | 1984-12-25 | 1984-12-25 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61149997A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2738760A1 (en) | 2012-12-03 | 2014-06-04 | Yamaha Corporation | Recording and reproduction of waveform based on sound board vibrations |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2721341B2 (ja) * | 1986-09-30 | 1998-03-04 | キヤノン株式会社 | 音声認識方法 |
-
1984
- 1984-12-25 JP JP59277166A patent/JPS61149997A/ja active Granted
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2738760A1 (en) | 2012-12-03 | 2014-06-04 | Yamaha Corporation | Recording and reproduction of waveform based on sound board vibrations |
Also Published As
Publication number | Publication date |
---|---|
JPS61149997A (ja) | 1986-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6243680B1 (en) | Method and apparatus for obtaining a transcription of phrases through text and spoken utterances | |
Zissman et al. | Automatic language identification | |
US5787230A (en) | System and method of intelligent Mandarin speech input for Chinese computers | |
Fujimura | Syllable as a unit of speech recognition | |
Cutler et al. | The predominance of strong initial syllables in the English vocabulary | |
Huttenlocher et al. | A model of lexical access from partial phonetic information | |
EP0562138A1 (en) | Method and apparatus for the automatic generation of Markov models of new words to be added to a speech recognition vocabulary | |
JPH0250198A (ja) | 音声認識システム | |
Abdo et al. | Semi-automatic segmentation system for syllables extraction from continuous Arabic audio signal | |
Lin et al. | Automatic segmentation and labeling for Mandarin Chinese speech corpora for concatenation-based TTS | |
JPS6138479B2 (ja) | ||
Fu et al. | A survey on Chinese speech recognition | |
Manjunath et al. | Automatic phonetic transcription for read, extempore and conversation speech for an Indian language: Bengali | |
Davis et al. | Evaluation of acoustic parameters for monosyllabic word identification | |
JPH0573039B2 (ja) | ||
JP3378547B2 (ja) | 音声認識方法及び装置 | |
Pranjol et al. | Bengali speech recognition: An overview | |
Kaur et al. | On developing an automatic speech recognition system for commonly used english words in indian english | |
Al-Daradkah et al. | Automatic grapheme-to-phoneme conversion of Arabic text | |
Sakai et al. | A classification method of spoken words in continuous speech for many speakers | |
Waibel | Suprasegmentals in very large vocabulary isolated word recognition | |
Billi et al. | A PC-based very large vocabulary isolated word speech recognition system | |
Chiang et al. | CCLMDS'96: Towards a speaker-independent large-vocabulary Mandarin dictation system | |
JP2005534968A (ja) | 漢字語の読みの決定 | |
Ng et al. | Automatic recognition of continuous Cantonese speech with very large vocabulary. |