JPS61149997A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS61149997A
JPS61149997A JP59277166A JP27716684A JPS61149997A JP S61149997 A JPS61149997 A JP S61149997A JP 59277166 A JP59277166 A JP 59277166A JP 27716684 A JP27716684 A JP 27716684A JP S61149997 A JPS61149997 A JP S61149997A
Authority
JP
Japan
Prior art keywords
word
phrase
parameter
memory
symbol string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59277166A
Other languages
English (en)
Other versions
JPH0573039B2 (ja
Inventor
上川 豊
喜一 長谷川
紀代 原
入路 友明
英一 坪香
樺澤 哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59277166A priority Critical patent/JPS61149997A/ja
Publication of JPS61149997A publication Critical patent/JPS61149997A/ja
Publication of JPH0573039B2 publication Critical patent/JPH0573039B2/ja
Granted legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/12Improving ICE efficiencies
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/30Use of alternative fuels, e.g. biofuels

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識装置に関するものである。
従来の技術 近年、単語又は文節音声等を認識する音声認識装置にお
いて母音、子音等を大分類識別しておき、それら音韻列
候補より単語又は文節出力を得る方法が試みられている
(例二三船他 信学技報EA83−33.昭和68年)
。この場合、単語辞書等の有意味記号列辞書から最終的
に単語出力等を得るに際し従来は第4図の如き構成であ
った。
第4図において、1はマイクロホン、2は音響パラメー
タ抽出器、3は母音大分類識別器、4は子音大分類識別
器、5は識別器、6は音韻音節記号列候補メモリー、7
は音韻音節パラメータ辞書、8は音韻音節パラメータメ
モリー、9は識別尤度順位別音韻音節列メモリー、10
は単語文節記号列辞書、11は識別尤度順位別単語文節
出力表示器である。
次に上記構成システムの動作について説明する。
人間が単語又は文節音声をマイクロホン1に向かって発
声すると、音響パラメータ抽出器2においてLPCケプ
ストラム等の音響パラメータが抽出される。これらは母
音大分類識別器3、子音大分類識別器4によってセグメ
ンテーシヨン及び大分類識別が行われる。
この出力の例を第2図で示す。ここでは入力音声として
”MATSUSHITA”という言葉が発声されている
。するとセグメンテーション及び大分類識別により第1
番目の子音C1としてN、M。
Bが、第1番目の母音v1としてA、Oが、第2番目の
子音C2としてS、H,TSが候補として上がっている
。以降の母音子音についても同様とする。これらが音韻
音節記号列候補メモリー6に入ると第5図の如(CVあ
るいはVCVの単位の記号列候補が得られ記憶される。
ここでは日本語の場合を例にとっているので通常よく扱
われているようにCVやvCv を単位にとっているが
、単独のCやVあるいはCVC等を単位にとっても主旨
は同様である。ここで音韻音節とは音韻や音節の如く単
語音声を構成する基本単位を総称したものである。メモ
リーeの出力は音韻音節パラメータ辞書7の中で検索さ
れ、各々の音韻音節に対応したパラメータが呼び出され
て音韻音節パラメータメモリー8に記憶される。識別器
5においては入力音声のパラメータとメモリー8にある
音韻音節のパラメータとを用いて識別される。この出力
は識別尤度順位別音韻音節列メモリー9に記憶される。
ここにおいて入力単語音声との識別尤度の大きいものの
順番に配置される。この結果は単語文節記号列辞書1o
の中で検索され、該当するものが識別尤度順位別単語文
節出力表示器11に表示される。なおここで単語文節と
は単語あるいは文節という意味である。
発明が解決しようとする問題点 しかしながら上記の構成では、単語文節記号列辞書に存
在しない言葉の音韻音節パラメータについても識別を行
わねばならないために処理効率が悪いという問題点を有
していた。特にパラメータにおけるパターンマツチング
は多量の演算を行うため、計算時間が長くかかることが
知られている。
本発明は上記問題点に鑑み、単語文節記号列辞書にある
言葉を構成する音韻音節についてのみ識別を行わせ、識
別の計算量を減らすシステムを提供するものである。
問題点を解決するための手段 上記問題点を解決するために本発明の音声認識装置は、
母音大分類識別器と子音大分類識別器の出力をまず母子
前記号列候補メモリーに供給し、その出力を単語文節記
号列辞書を単語文節別音韻音節記号列候補メモリーに、
さらにその出力を単語文節別パラメータ列メモリーと音
韻音節パラメータ辞書にそれぞれ供給するとともに、音
韻音節パラメータ辞書の出力を単語文節別パラメータ列
メモリーに供給するよう構成したものである。
作  用 このような構成によれば、母子前記号列候補メモリーの
出力を用いて単語文節記号列辞書を検索するために、存
在しない言葉の音韻音節パラメータについては識別をす
ることがなく、問題点であった処理効率の悪さが解決さ
れることとなる。
実施例 以下本発明の一実施例の音声認識装置について図面を参
照しながら説明する。第1図に本発明の構成例を示す。
図において、21はマイクロホン、22は音響パラメー
タ抽出器、23は母音大分類識別器、24は子音大分類
識別器、26は識別器、26は母子前記号列候補メモリ
ー、27は単語文節記号列辞書、28は単語文節側音韻
音節記号列候補メモIJ−129は音韻音節パラメータ
辞書、3oは単語文節別パラメータ列メモリー、31は
識別尤度順位別単語文節出力表示器である。
次にこの装置の動作について説明する。
人間が単語又は文節音声をマイクロホン21に向かって
発声すると、音響パラメータ抽出器22においてLPC
ケプストラム等の音響)くラメータが抽出される。これ
らは母音大分類識別器23、子音大分類識別器24によ
ってセグメンテーション及び大分類識別が行われる。こ
の出力の例を第2図で示す。これらが母子前記号列候補
メモIJ−26に入り記憶される。母子前記号列候補メ
モリー26の出力は単語文節記号列辞書27の中で検索
され、合致するものが音韻音節記号列に分解された後、
単語文節別音韻音節記号列候補メモリー28に記憶され
る。音韻音節パラメータ辞書29ではメモIJ−28に
ある音韻音節記号列候補に対応したパラメータが呼び出
され、単語文節別パラメータ列メモリー30に記憶され
る。
単語文節別パラメータ列メモリー30は第3図の如く構
成されている。母子音大分類識別結果及び単語文節記号
列辞書により得られた単語あるいは文節が「松下」 「
那須北」 「名付けた」のような人名、地名9文節だけ
であると仮定する。この時、必要な音韻音節パラメータ
はMA、NA、ATSU。
ASU、 AZU、 USHI、 UKI、 UKE、
 ITA、 ETAの10種類だけで済む。これは第5
図の音韻音節候補と比較すれば大巾な候補削減になって
いる。
識別器25においては入力音声のパラメータと単語メモ
リー30のパラメータが単語文節候補側に識別される。
そしてその結果が識別尤度順位別単語文節出力表示器3
1に、識別尤度の大きな単語ある因は文節の順位に表示
される。
以上の様に本実施例によれば単語文節記号列辞書を母子
前記号列候補メモリーの出力端に接続し、候補単語文節
の絞り込みを行うことにより識別処理量を少なくし、効
率を良くすることができる。
なお本実施例において単語文節とは単語あるいは文節と
いう意であり、又音韻音節とは音韻あるいは音節等の様
に単語あるいは文節の基本単位となる音を意味する。
発明の効果 以上の様に本発明は母子前記号列候補メモリーの出力を
用いて単語文節記号列辞書を検索し、単語文節候補を絞
り込にとにより存在しない、あるいは候、補にもれた言
葉の音韻音節パラメータについての識別計算を行うこと
がないので処理効率が良い。特に候補絞り込みにより得
る単語文節の数が1箇の場合、識別計算を行わなくて良
いという利点がある。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置の構成
を示す図、第2図は同装置における母子内容説明図、第
4図は従来の音声認識装置の一例の構成を示す図、第6
図は同装置の音韻音節記号列候補メモリーの内容説明図
である。 21・・・・・・マイクロホン、22・・・・・・音響
パラメータ抽出器、23・・・・・・母音大分類識別器
、24・・・・・・子音大分類識別器、25・・・・・
・識別器、26・川・・母子前記号列候補メモリー、2
7・・・・・・単語文節記号列辞書、28・・・・・・
単語文節別音韻音節記号列候補メモリー、29・・・・
・・音韻音節パラメータ辞書、30・・・・・・単語文
節別パラメータ列メモIJ−131・・出・識別尤度順
位別単語文節出力表示器。

Claims (1)

    【特許請求の範囲】
  1. マイクロホンを音響パラメータ抽出器に接続し、前記音
    響パラメータ抽出器の出力端を子音大分類識別器及び母
    音大分類識別器及び識別器の入力端に接続し、前記子音
    大分類識別器の出力端及び前記母音大分類識別器の出力
    端を母子音記号列候補メモリーの入力端に接続し、この
    母子音記号列候補メモリーの出力端を単語文節記号列辞
    書の入力端に接続し、前記単語文節記号列辞書の出力端
    を音韻音節記号列候補メモリーの入力端に接続し、前記
    音節記号列候補メモリーの出力端を音韻音節パラメータ
    辞書及び単語文節別パラメータ列メモリーの入力端に接
    続し、前記音韻音節パラメータ辞書の出力端を前記単語
    文節別パラメータ列メモリーの入力端に接続し、前記単
    語文節別パラメータ列メモリーの出力端を前記識別器の
    入力端に接続し、前記識別器の出力端を識別尤度順位別
    単語文節出力表示器に接続した音声認識装置。
JP59277166A 1984-12-25 1984-12-25 音声認識装置 Granted JPS61149997A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59277166A JPS61149997A (ja) 1984-12-25 1984-12-25 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59277166A JPS61149997A (ja) 1984-12-25 1984-12-25 音声認識装置

Publications (2)

Publication Number Publication Date
JPS61149997A true JPS61149997A (ja) 1986-07-08
JPH0573039B2 JPH0573039B2 (ja) 1993-10-13

Family

ID=17579719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59277166A Granted JPS61149997A (ja) 1984-12-25 1984-12-25 音声認識装置

Country Status (1)

Country Link
JP (1) JPS61149997A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6385697A (ja) * 1986-09-30 1988-04-16 キヤノン株式会社 音声認識方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5842799B2 (ja) 2012-12-03 2016-01-13 ヤマハ株式会社 ピアノ

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6385697A (ja) * 1986-09-30 1988-04-16 キヤノン株式会社 音声認識方法

Also Published As

Publication number Publication date
JPH0573039B2 (ja) 1993-10-13

Similar Documents

Publication Publication Date Title
Fujimura Syllable as a unit of speech recognition
US6243680B1 (en) Method and apparatus for obtaining a transcription of phrases through text and spoken utterances
Zue The use of speech knowledge in automatic speech recognition
Huttenlocher et al. A model of lexical access from partial phonetic information
Bhatt et al. Hindi Speech Vowel Recognition Using Hidden Markov Model.
Abujar et al. A comprehensive text analysis for Bengali TTS using unicode
Nga et al. A Survey of Vietnamese Automatic Speech Recognition
JPS61149997A (ja) 音声認識装置
Davis et al. Evaluation of acoustic parameters for monosyllabic word identification
Hunt Speaker adaptation for word‐based speech recognition systems
Pranjol et al. Bengali speech recognition: An overview
Balula et al. Automatic speech recognition (ASR) systems for learning Arabic language and Al-quran recitation: a Review
Downey et al. A decision tree approach to task-independent speech recognition
JP2813209B2 (ja) 大語彙音声認識装置
Khamdamov et al. Syllable-Based Reading Model for Uzbek Language Speech Synthesizers
JP2001188556A (ja) 音声認識方法及び装置
Al-Daradkah et al. Automatic grapheme-to-phoneme conversion of Arabic text
Khusainov et al. Speech analysis and synthesis systems for the tatar language
Billi et al. A PC-based very large vocabulary isolated word speech recognition system
Kangas et al. Transient map method in stop consonant discrimination.
Chiang et al. CCLMDS'96: Towards a speaker-independent large-vocabulary Mandarin dictation system
Choudhury et al. Development of Bengali Automatic Speech Recognizer and Analysis of Error Pattern
Mishra et al. Speech Recognition Using Machine Learning Techniques
Nagabhushan et al. Dictionary supported generation of English text from Pitman shorthand scripted phonetic text
Cole et al. A pretty good formant tracker