JPS59121400A - 音声処理装置 - Google Patents

音声処理装置

Info

Publication number
JPS59121400A
JPS59121400A JP57230644A JP23064482A JPS59121400A JP S59121400 A JPS59121400 A JP S59121400A JP 57230644 A JP57230644 A JP 57230644A JP 23064482 A JP23064482 A JP 23064482A JP S59121400 A JPS59121400 A JP S59121400A
Authority
JP
Japan
Prior art keywords
word
monosyllable
monosyllables
dictionary
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57230644A
Other languages
English (en)
Inventor
上柳 裕
荻田 隆彦
浜田 隆史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57230644A priority Critical patent/JPS59121400A/ja
Publication of JPS59121400A publication Critical patent/JPS59121400A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 a3発明の技術分野 本発明Gよ、入力された音声を辞書と比較しながら認識
処理する装置に関するものである。
b、技術の背景 従来、コンピュータとの会話は1文字を伝達手段として
1人間の手と目を通して行われてきた。
これに対し、最近の音声信号処理理論の発展とL31化
技術の向上はコンピュータによる音声処理を可能とし、
急速に音声技術を応用した機器の実用化が進んでいる。
そこで1人間にとって最も自然な情報伝達手段である音
声をマン・マシンインターフェイスに取り入れることが
コンピュータを身近にするものとして期待されている。
ところで、このような音声処理技術には、音声認識、及
び、音声合成がある。この音声認識については1話者1
允音の方法、認識の対象などで分類できる。
話者による分類では3話者ごとに標準音声パターンを複
数の辞書に登録し1話者に対応する辞書を選択して、入
力された音声と辞書とを比較しながら音声認識を行う特
定話者音声認識と、一つ標準音声バクーンを辞書に登録
し、入力された音声とその辞書とを比較しながら音声認
識を行う不特定話者音声認識とがある。発音の方法は、
単語単位の単語認識と、カナ文字を一つ一つ区切って発
音する単音節認識とがある。現在では、単語認識は、特
定話者音声認識で500語程程度不特定話者音声認識で
20語程度が実用化されている。
一方、単音節認識では、ア〜ンの45種と、濁音23種
の計68種を認識するのが主であり、半濁音10種、拗
音33種、さらには、「シェ」。
「ディ」等の外来語特有の単音節認識を行っている。単
音節は、辞書の標準音声パターンとそれぞれ1対1の小
単位で対応するために、音声認識には都合がよい。
C9従来技術と問題点 第1図は、従来の音声認識装置を示すものであり、1は
特徴抽出部、2は認識部53は単音節音声標準パターン
部、4は日本語処理部、5は辞書をそれぞれ示す。
抽出部lに入力された単語の音声は、その特徴パラメー
タが抽出される。抽出された特徴パラメータは、認識部
2でパターン部3にある単音節の特徴パラメータと比較
される。その際認識部2では、−単語に含まれる各単音
節ごとにパターン部3と比較する。例えば、“スイフ(
水火)”という単語を抽出部1に入力すると、認識部2
では。
“ス”イ”フ”を別々にパターン部3にある単音節の特
徴バクーンと比較する。そして、認識2は、パターン部
3にある単音節の特徴パラメータのうち、入力された単
音節の特徴パラメータと一番近いものを選択し、認識す
る。認識されたそれらの単音節は、処理部4に入力され
る。処理部4では、入力されたそれらの単音節をつなげ
て。
一つの単語にする。先の例によれば、′ス°“イ”フ”
と入力された単音節を、一つの単語“スイフ”にする。
そして、その単語が、辞書に存在するか、ずなはち、そ
のような日本語が存在するか否かを確認して、その単語
の存在が確認されれば、処理部4ば1その単語1例えば
5 “スイフ”又は“水火”を出力する。
ところで、単音節ごとに認識された単語を、辞書と比較
して、その単語が辞書に存在しない場合には、各単音節
を、他の単音節に置き替えながら再度、辞書と比較して
、正しい認識を行う方式が考えられる。例えば、先の例
においては、誤って“ツイブ°と認識されたものについ
て、“ツ”を順次他の単音節(50音、濁音、半濁音)
と置き替えながら、辞書と比較する。そして、単音節を
置き替えた単語のうちで、辞書に存在するものがあれば
、処理部より出力する。しかしながら、このような方法
で総ての単音節の組合せについてとっていたのでは、置
き替えのために、認識処理に非常に時間を要する。
d1発明の目的 そこで本発明では、単音節の誤認識が発生し。
単語が認識不可能になると、誤認識される可能性の大き
い単音節より順に、その誤認識される可能性の大きい単
音節と置き替えることにより、正しい認識を短い時間で
行おうとするものである。
e9発明の構成 そのため本発明では1話者が発音した単語の特徴パラメ
ータを、単音節標準バクーンに示された単音節の特徴パ
ラメータと比較しながら、前記単語が含む各単音節を認
識し、認識されたそれらの単音節を一つにつなげた単語
の単位で、複数の単語の登録された辞書と比較し、前記
一つにつなげた単語が前記辞書にあれば5その単語を出
力し、さもなければ5前記一つにつなげた単語が含む単
音節の一部、又は、全部を他の単音節に置き替えながら
、前記辞書と比較し音声の認識処理を行う装置で、置き
替えられる単音節の順序を、単語が含む単音節のうちで
、特徴パラメータにR4Q)性がある単音節が他にある
ような単音節を、類似性の大きい順に、その類似性の大
きな単音節と置き替えることを特徴とする音声認識処理
装置を提供するものである。
f9発明の実施例 第2図は2本発明の一実施例である音声認識処理装置を
示し、11は特徴抽出部、12は認識部。
13は単音節音声標準パターン部、14は日本語処理部
、15は辞書部、16は単音節置き替え候補表、17は
単音節置き替え部をそれぞれ示す。
抽出部11に入力された単語の音声は、その特徴パラメ
ータが抽出される。抽出された特徴パラメータは、認識
部12でパターン部13にある単音節の特徴パラメータ
と比較される。その際認識部12では、−単語に含まれ
る各単音節ごとにパターン部13と比較する。
例えば“スイン(水火)”という単語を抽出部11に入
力すると、認識部12ではパス”“イ”“フ”を別々に
パターン部13にある単音節の特徴パターンと比較する
。そして、認識部12は1パタ一ン部13にある単音節
の特徴パラメータのうち、入力された単音節の特徴パラ
メータと一番近いものを選択し、認識する。認識された
それらの単音節は、処理部14に入力される。処理部1
4では、入力されたそれらの単音節をつなげて。
一つの単語にする。
先の例によれば、“ス°゛イ”パフ″と人力された単音
節を、一つの単語“スイン″“にする。そして、その単
語が、辞書に存在するか、ずなはちそのような日本語が
存在するか否かを確認し、その単語の存在が確認されれ
ば2処理部14は、その単語1例えば、“スイン゛又は
1水夫”を出力する。
ここで2例えば“ス”が誤ってツ”と認識部14で認識
されたものとする。処理部14ば“ライフ”を辞書部1
5と比較する。ところが、゛ツイフパは、辞書15にば
存在しない。そこで、処理部14ば置き替え部17に゛
′ツイフ”を送る。
置き替え部17ば、候補表16を参考に単音節を置き替
える。表−1は、候補表16に用いられる一例である。
コンフユージヨン・マトリックスを示す。
表−1は、ある回数、入力側に示した子音を有する単音
節の音声を音声認識処理装置に入力した場合、出力とし
て、どういった子音を有する単音節が、どういった割合
で出てくるかを示したちのである。例えば、子音に“S
”を有する単音節を200回入力すると、173回は正
確に入力した単音節を認識できるが、25回は子音に“
tを有する単音節、1回は子音に“2”を有する単音節
1回は子音に“p”を有する単音節と誤認識する可能性
があることを示す。
表−1(候補表16)を見ると、入力された子音“L”
を有する単音節が、他の子音を有する単音節と誤認識さ
れる可能性と、子音“h”を有する単音節が、他の子音
を有する単音節と誤認識される可能性の中では、子音°
t”を有する単音節が、子音“S11を有する単音節と
誤認識される可能性が一番犬きい。そこで、置き替え部
17は“ツ”を子音“S”を有し、しかも、“ツ”と同
じ子音を有する“ス”と置き替え、処理部14に出力す
る。処理部14は、“ツ”を“ス”に置き替えた“スイ
ン”を出力する。辞書部15には、″スイフ′”が登録
されているので、処理部14は。
゛スイン”又は“水火”を出力する。
なお、母音は誤認識の確率が非常に少ないのが一般的で
あり、置き替え対象とする必要はない。
表−2は9単音節置き替え候補表16として用いられる
。単音節とその単音節に対する誤り履歴表である。この
表−2は1例えば“h u ”について40回音声入力
処理装置に入力すると、“”ku”と誤認識される可能
性が5回、“U”と誤認識される可能性が1回、gu”
と誤認識される可能性が1回、“pu”と誤認識される
可能性が1回あることを示す。このような表を単音節置
き替え候補表として用いるには、先の例において“ツイ
ブ゛が辞書部15に存在しないと、処理部17ば2候補
表16 (表−2)を参考に、誤認識されそうな単音節
をさがす。候補表16を見ると、“tu”と“su”と
誤認識される可能性が40回中15回、“hu”と“k
u”と誤認識される可能性が40回中1回、“hu”と
“U”と誤認識される可能性が40回中1回、“hu”
と“gu”と誤認識される可能性が40回中15回、“
hU”とpu”と誤認識される可能性が40回中1回と
なっている。これより、“tuI+が”su”と誤認識
されている可能性が一番大きい。そこで、置き替え部1
7は“tu”と“hu”を置き替え、処理部14に”ス
イン”を出力する。処理部14は“スイン”を出力する
。処理部14は“スイン”を辞書部15と比較する。辞
書部15には“スイン”が存在するため処理部14は“
スイン”又は“水火”を出力する。
表−1 表−12表−2に示したようなコンフユージヨン・マト
リ7クス、及び、単音節とその単音節に対する誤り履歴
表は誤認識が発生するごとに更新できるようにすればよ
い。
g1発明の効果 本発明によれば、単音節の誤認識のために発生する単語
の認識不可能を防止することができ、かつ、迅速に単語
を認識できる。
【図面の簡単な説明】
第1図は、従来の音声認識装置を示すものであり、1は
特徴抽出部、2は認識部、3は単音節音声標準バクーン
部、4は日本語処理部、5は辞書をそれぞれ示す。 第2図は9本発明の一実施例である音声認識処理装置を
示し、11は特徴抽出部、12は認識部。 13は単音節音声標準パターン部、14は日本語処理部
、15は辞書部、16は単音節置き替え候補表、17ば
単音節置き替え部をそれぞれ示す。

Claims (1)

  1. 【特許請求の範囲】 話者が発音した単語の特徴パラメータを、単音節標準パ
    ターンに示された単音節の特徴パラメータと比較しなが
    ら、前記単語が含む各単音節を認識し、認識されたそれ
    らの単音節を一つにつなげた単語の単位で、複数の単語
    の登録された辞書と比較し、前記一つにつなげた単語が
    前記辞書にあれば2その単語を出力し、さもなければ、
    前記一つにつなげた単語が含む単音節の一部、又は、全
    部を他の単音節に置き替えながら、前記辞書と比較し音
    声の認識処理を行う装置で、置き替えられる単音節の順
    序を、単語が含む単音節のうちで。 特徴パラメータに類似性がある単音節が他にあるような
    単音節を、類(易性の大きい順に、その類似性の大きな
    単音節と置き替えることを特徴とする音声認識処理装置
JP57230644A 1982-12-28 1982-12-28 音声処理装置 Pending JPS59121400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57230644A JPS59121400A (ja) 1982-12-28 1982-12-28 音声処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57230644A JPS59121400A (ja) 1982-12-28 1982-12-28 音声処理装置

Publications (1)

Publication Number Publication Date
JPS59121400A true JPS59121400A (ja) 1984-07-13

Family

ID=16911013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57230644A Pending JPS59121400A (ja) 1982-12-28 1982-12-28 音声処理装置

Country Status (1)

Country Link
JP (1) JPS59121400A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59214899A (ja) * 1983-05-23 1984-12-04 株式会社日立製作所 連続音声認識応答方法
JPS61177573A (ja) * 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPS61177574A (ja) * 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPS61177575A (ja) * 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59214899A (ja) * 1983-05-23 1984-12-04 株式会社日立製作所 連続音声認識応答方法
JPH0552518B2 (ja) * 1983-05-23 1993-08-05 Hitachi Ltd
JPS61177573A (ja) * 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPS61177574A (ja) * 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPS61177575A (ja) * 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置

Similar Documents

Publication Publication Date Title
US20110106792A1 (en) System and method for word matching and indexing
RU2466468C1 (ru) Система и способ распознавания речи
US7406408B1 (en) Method of recognizing phones in speech of any language
Lileikytė et al. Conversational telephone speech recognition for Lithuanian
Savchenko et al. Towards the creation of reliable voice control system based on a fuzzy approach
JPS62232691A (ja) 音声認識装置
Adams et al. Phonemic transcription of low-resource tonal languages
Keating Word-level phonetic variation in large speech corpora
Hassan et al. Gender independent Bangla automatic speech recognition
JPS59121400A (ja) 音声処理装置
JPS6316766B2 (ja)
Nga et al. A Survey of Vietnamese Automatic Speech Recognition
Tzudir et al. Prosodic Information in Dialect Identification of a Tonal Language: The case of Ao.
Mortensen et al. Tusom2021: A phonetically transcribed speech dataset from an endangered language for universal phone recognition experiments
Garvin et al. The conversion of phonetic into orthographic English: A machine-translation approach to the problem
KR20210020294A (ko) 단어 또는 문장 단위 음성 인식 방법 및 장치
Warusawithana et al. Enhanced time delay neural network architectures for sinhala speech recognition
KR100931786B1 (ko) 한국어 철자 발화에 따른 음성인식 방법
JPS58123596A (ja) 補助情報を併用する音声認識方式
Wang et al. Pitch-Aware RNN-T for Mandarin Chinese Mispronunciation Detection and Diagnosis
JPS6335998B2 (ja)
KR20200011176A (ko) 모음 발음을 중심으로 하는 발음 분류가 도입된 한국어 음성인식 시스템
JPS6027433B2 (ja) 日本語情報入力装置
Bae et al. A Comparative Analysis on allophone of Korean for English natives
JPS5837698A (ja) 音声入力和文タイプライタにおける変換方法