JPS6146995A - 音声認識システム - Google Patents

音声認識システム

Info

Publication number
JPS6146995A
JPS6146995A JP59168171A JP16817184A JPS6146995A JP S6146995 A JPS6146995 A JP S6146995A JP 59168171 A JP59168171 A JP 59168171A JP 16817184 A JP16817184 A JP 16817184A JP S6146995 A JPS6146995 A JP S6146995A
Authority
JP
Japan
Prior art keywords
distance
speech recognition
words
word
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59168171A
Other languages
English (en)
Inventor
石垣 由里子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59168171A priority Critical patent/JPS6146995A/ja
Publication of JPS6146995A publication Critical patent/JPS6146995A/ja
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声認識システムに、係り、特に一定数の単語
の音声認識を行うシステムにおいて、認識対象とすべき
単語を単語候補の中から選択する場合等の処理を援助す
るための方式に関する。
音声認識システムには、例えば不特定話者、特定単語の
認識システムといわれるものがある。
この種のシステムでは、認識できる単語は例えば数字を
示す10個の単語等に限定するが、話者は限定しないで
認識を可能にしなければならないので、特に認識率を高
めるために、認識可能とすべき単語を選択することが行
われる。
こ\で単語の選択とは、例えば「1」を表す同義語とし
て「いち」と「ひとつ」が使用できる場合に、他め単語
との誤認識が生じ難い方の単語を選ぶことを言っている
〔従来の技術と発明が解決しようとする問題点〕単語の
音声認識は、単語の音声データの辞書等を持ち、入力音
声データを辞書等と照合して、一定の論理によって入力
音声データと類似性が高いと判定した辞書データを入力
された単語として判定する方法による。
このような辞書等を作成するデータは、通常多数の人か
ら収集した音声に基づいて作成されるので、相当のコス
トが費やされるが、その結果認識対象とした単語群に誤
認識を生じ易い単語があると判明した場合には、再び多
くの費用をかけて辞書等を作り直す必要がある。
従来は、認識対象として選択した単語が、正しく選択さ
れたかを評価するには、辞書等を作成した上で、それを
用いて認識実験を行って評価する方法しか無かったので
、上記のように辞書等の変更に多くの費用を要し、更に
変更の結果は認識実験を繰り返さなければ評価できない
ので、その場合新たに選択した単語が、他の単語との関
係で新たな誤認識の原因となることも起こり得る等の問
題があった。
〔問題点を解決するための手段〕          
  (前記の問題点は、音声認識の対象とすべき単語の
選択において、単語を構成する文字について、文字間の
音声認識上の類似度を示す距離を各文字間について決定
する手段、2個の上記単語を構成する文字の対応する位
置の各文字間の上記距離に基づいて該単語間の音声認識
上の類似度を示す距離を算定する手段を有する本発明の
音声認識システムによって解決される。
更に、上記手段を有し、複数の単語からなる複数の単語
群の各単語群における単語間の上記距離に基づいて、該
単語群間の音声認識の相対的な良ざを比較するように構
成されてなる本出願の第2の発明の音声認識システムに
より、単語群の選択に関する問題が解決される。
〔作用〕
即ち、文字間の音声認識上の類似度、即ち文字間の誤認
識の度合を示す数値である距離として、例えば文字の発
音の音素を2文字間の対応する音素位置間で比較し、同
一の音素を有する位置が無い文字間の距離を最大値、す
べての位置に同一の音素を有する文字間の距離を最小値
とする方法等によって文字間距離を求めておく。
この文字間距甜を使って、2単語の各構成文字の対応文
字間の文字間距離を決定し、それらを例えば合計したも
のを単語間の誤認識の度合を示す距離とする。
この方法により、単語間の誤認識の相対的な程度を、認
識実験を行うことなく、上記距離値の比較によって事前
に予測することが可能になる。
更に、1群の単語について、すべての2を語の組合せに
ついての単語間距離を、例えば合計した値(又はそめ合
計を2単語の組合せ数で除した平均値等)をその単語群
の音声認識の相対的な良さ、又は誤認識発生度の相対値
、を示す指標とすれば、複数の単語群についての該距離
を比較することにより、相対的に誤認識の少ない単語群
を、認識実験を行うことなく選択することができる。
〔実施例〕
第2図は本発明を実施する計算機システムの構成例であ
る。
処理装置1は、キーボード等の入力装置2から入力する
、単語間距離を算定すべき2単語の読みを記憶装置3に
格納し、同じく記憶装置3にあるプログラムを実行して
、該データに関して以下に説明する処理を行う。
記憶装置3に生成された処理結果は、処理装置1がディ
スプレイあるいはプリンタ等の出力装置4へ出力する。
第1図は単語間距離算定処理の流れ図である。
ステップ10で処理文字位iiI、単語間距離りを0に
初期設定する。
ステップ11ば入力された読みの文字をすべて処理した
か検査し、全文字処理を終わった場合は、ステップ12
で結果の単語開路1yiitDを出力する。
終わらないときは、ステップ13に進み、2単語の第■
文字により、記憶装置3上の文字間距離テーブルを引い
て、該当する2文字間の距離を求める。
文字間距離テーブルは、例えば第3図のような内容を持
つものとする。このテーブルは、2文字の音素を比較し
て、2文字の音素がすべて異なるとき、その文字間距離
を3とし、完全に同一のときを0とし、それ以外の場合
を2として文字間距離を求めた表である。
2単語の読みの文字数が異なるときは、ステップ13に
おいて、先頭の文字から比較していって、一方の単語の
文字のみになった場合には、例えば文字間距離を強制的
に3とするものとする。
ステップ14で単語間距離りの値にステップ13で得た
文字間距離値を積算し、ステップ15で処理文字位置I
を進めてステップ11へ戻る。
第4図(alは「ゆき」 (雪)と「あめ」 (雨)、
第4図(b)は「みず」 (水)と「しずく」(雫)の
単語間距離を上記処理によって求める原理を示したもの
である。
第5図は複数の単語群から最も誤認識が少ないと予測さ
れる群を選択するための処理の内容を一例によって示す
ものである。
この例は、1〜3の数字を表す単語群を選択する例であ
って、 1に対して「いち」、「ひとつ」 2に対して「に」、「にこ」 3に対して「さん」、「さんご」 というように、それぞれ2個の候補単語からなる3組が
あるとする。従って、全部で8群の異なる単語群が考え
られるので、その中で最も誤認識が少ないと予測される
群を選択することが、この処理の目的である。
この場合、まず各単語と異なる組のすべての単語との、
2車語の組合せについて、前記の方法により単語間距離
を求めると、第5図(a)に示す12個の単語間距離が
定まる。
この単語間距離を用いて、第5図(b)に示す8単語群
の各々について、単語間距離の合計として、各群の音声
認識の良さの指標を求めると、図に示す値となる。従っ
て、この例では最大の指標値26を得た「ひとつ」−「
に」−「ざんこ」の単語群が、最も誤認識の生じ難い単
語群として選択される。
この場合において、特に大きな単語間距離を有する単語
対があると、それを含む単語群に特に単語間距離の小さ
い(即ち誤認識を生じ易い)単語対があっても、その形
容が隠される可能性があるので、単語間距離の算定結果
によって、ある値(例えば3)より小さい単語間距離を
持つ単語対は、単語群の構成から予め除くことが望まし
い。
〔発明の効果〕
以上の説明から明らかなように本発明によれば、音声認
識システムにおいて誤認識を生じ易い単語を事前に予測
できるので、認識対象とする単語の選択及び認識用辞書
等の作成の経済性を大幅に改善するという著しい工業的
効果がある。
【図面の簡単な説明】
第1図は本発明一実施例の処理の流れ図、第2図は本発
明を実施する計算機の一例構成図、第3図は文字間距離
テーブルの一例を示す図、第4図は単語間距離算定の説
明図、 第5図は単語群選択処理の説明図である。 図において、 1は処理装置、    2は入力装置、3は記憶装置、
     4は出力装置、茶 1 司 芥 2 目 3 t 3− Q 茅 ひ) 目 (b) 2士()十3=5

Claims (5)

    【特許請求の範囲】
  1. (1)音声認識の対象とすべき単語の選択において、単
    語を構成する文字について、文字間の音声認識上の類似
    度を示す距離を各文字間について決定する手段、2個の
    上記単語を構成する文字の対応する位置の各文字間の上
    記距離に基づいて該単語間の音声認識上の類似度を示す
    距離を算定する手段を有することを特徴とする音声認識
    システム。
  2. (2)上記文字間の距離を決定する手段は、該文字の対
    応位置における音素を比較し、同一の音素を有する位置
    が無い文字間の距離を最大値、すべての位置に同一の音
    素を有する文字間の距離を最小値とするように構成され
    てなることを特徴とする特許請求の範囲第(1)項記載
    の音声認識システム。
  3. (3)上記単語間の距離を算定する手段は、上記対応す
    る位置の各文字間の距離を加算した合計値を該単語間の
    距離値とするように構成されてなることを特徴とする特
    許請求の範囲第(1)項又は第(2)項記載の音声認識
    システム。
  4. (4)音声認識の対象とすべき単語の選択において、単
    語を構成する文字について、文字間の音声認識上の類似
    度を示す距離を各文字間について決定する手段、2個の
    上記単語を構成する文字の対応する位置の各文字間の上
    記距離に基づいて該単語間の音声認識上の類似度を示す
    距離を算定する手段を有し、複数の単語からなる複数の
    単語群の各単語群における単語間の上記距離に基づいて
    、該単語群間の音声認識の相対的な良さを比較するよう
    に構成されてなることを特徴とする音声認識システム。
  5. (5)上記各単語群の音声認識の相対的な良さは、該各
    単語群を構成する単語のすべての単語間の上記単語間距
    離を加算した合計値によって比較するように構成されて
    なることを特徴とする特許請求の範囲第(4)項記載の
    音声認識システム。
JP59168171A 1984-08-11 1984-08-11 音声認識システム Expired - Lifetime JPS6146995A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59168171A JPS6146995A (ja) 1984-08-11 1984-08-11 音声認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59168171A JPS6146995A (ja) 1984-08-11 1984-08-11 音声認識システム

Publications (1)

Publication Number Publication Date
JPS6146995A true JPS6146995A (ja) 1986-03-07

Family

ID=15863115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59168171A Expired - Lifetime JPS6146995A (ja) 1984-08-11 1984-08-11 音声認識システム

Country Status (1)

Country Link
JP (1) JPS6146995A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6225795A (ja) * 1985-07-25 1987-02-03 シャープ株式会社 音声認識装置
US5042044A (en) * 1989-04-28 1991-08-20 Sharp Kabushiki Kaisha Semiconductor laser device, a semiconductor wafer

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5614381A (en) * 1979-07-13 1981-02-12 Nec Corp Pattern recognizing system
JPS5872996A (ja) * 1981-10-28 1983-05-02 電子計算機基本技術研究組合 単語音声認識方法
JPS5872995A (ja) * 1981-10-28 1983-05-02 電子計算機基本技術研究組合 単語音声認識方法
JPS58129497A (ja) * 1982-01-28 1983-08-02 電子計算機基本技術研究組合 単語音声認識方法
JPS595292A (ja) * 1982-07-01 1984-01-12 電子計算機基本技術研究組合 単語音声認識方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5614381A (en) * 1979-07-13 1981-02-12 Nec Corp Pattern recognizing system
JPS5872996A (ja) * 1981-10-28 1983-05-02 電子計算機基本技術研究組合 単語音声認識方法
JPS5872995A (ja) * 1981-10-28 1983-05-02 電子計算機基本技術研究組合 単語音声認識方法
JPS58129497A (ja) * 1982-01-28 1983-08-02 電子計算機基本技術研究組合 単語音声認識方法
JPS595292A (ja) * 1982-07-01 1984-01-12 電子計算機基本技術研究組合 単語音声認識方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6225795A (ja) * 1985-07-25 1987-02-03 シャープ株式会社 音声認識装置
US5042044A (en) * 1989-04-28 1991-08-20 Sharp Kabushiki Kaisha Semiconductor laser device, a semiconductor wafer

Similar Documents

Publication Publication Date Title
Campbell et al. Language recognition with support vector machines
US6738741B2 (en) Segmentation technique increasing the active vocabulary of speech recognizers
US4741036A (en) Determination of phone weights for markov models in a speech recognition system
JP5240457B2 (ja) 拡張認識辞書学習装置と音声認識システム
JP4680714B2 (ja) 音声認識装置および音声認識方法
Lee et al. The 2015 NIST language recognition evaluation: the shared view of I2R, Fantastic4 and SingaMS
Bahl et al. A fast match for continuous speech recognition using allophonic models
CN114360514A (zh) 语音识别方法、装置、设备、介质及产品
JP3444108B2 (ja) 音声認識装置
JPS6146995A (ja) 音声認識システム
JP2002082690A (ja) 言語モデル生成方法、音声認識方法及びそのプログラム記録媒体
Shastri et al. Adversarial Synthesis based Data Augmentation for Speech Classification
JP2979912B2 (ja) 音声認識装置
JP3621922B2 (ja) 文認識装置、文認識方法、プログラム、および媒体
JPS5915993A (ja) 音声認識装置
JPH04291399A (ja) 音声認識方法
Mohammad et al. Automated Detection and Consistency Analysis of Tajweed Recitation Rules in the Holy Quran
Mashao et al. Utterance dependent parametric warping for a talker-independent HMM-based recognizer
Rasekh et al. An efficient hybrid solution for pronouncing Farsi text
JPS62206597A (ja) 音声認識用単語予備選択方式
JPS646514B2 (ja)
JPH0574838B2 (ja)
JPS6232499A (ja) 音声認識における単語予備選択方式
Wu et al. Text-Independent Speaker Identification Based on Small Training Data and Fast Search Algorithms
JPH02110599A (ja) 音声認識方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term