JPS62218997A - 単語音声認識装置 - Google Patents

単語音声認識装置

Info

Publication number
JPS62218997A
JPS62218997A JP61060968A JP6096886A JPS62218997A JP S62218997 A JPS62218997 A JP S62218997A JP 61060968 A JP61060968 A JP 61060968A JP 6096886 A JP6096886 A JP 6096886A JP S62218997 A JPS62218997 A JP S62218997A
Authority
JP
Japan
Prior art keywords
word
syllable
recognition
sequence
syllables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61060968A
Other languages
English (en)
Inventor
佐藤 泰雄
教幸 藤本
一成 畑中
花田 章夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61060968A priority Critical patent/JPS62218997A/ja
Publication of JPS62218997A publication Critical patent/JPS62218997A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 音節を認識単位とする単語音声認識装置において、入力
音声を音節対応の標準パターンの系列と照合して音節候
補列を抽出し、上位装置からのカテゴリ種別情報に従っ
て認識対象単語群の各単語に対応する音節系列を格納し
ている又は上位装置より直接受信された前記音節系列を
格納している使用単語辞書部の音節系列と前記音節候補
列とを、音節系列名の一致しているものについて照合し
て単語認識を行う。これにより、少ない容量の使用単語
辞書部により事実上無限語党又は人語量の単語音声の認
識が可能となると共に、処理量を低減させ認識率を向上
させることが出来る。
〔産業上の利用分野〕
本発明は、音節を認識単位とする単語音声の認識装置、
特に、大語党の単語群を認識する場合に好適な単語音声
認識装置に関する。
〔従来の技術〕
単語音声を認識する方式の代表的なものとして、従来、
第3図(A)に示す様に単語を認識単位とする方式(以
下、単語単位の単語音声認識方式という)と、同図(B
)に示す様に単語よりも小さい音節(又は音素)を認識
単位とする方式(以下、音節(音素)単位の単語音声認
識方式という)が−ある。
各単語は音節(シラブル)から成り立ち、音節は音素か
ら成り立っている。音素は音声の最小基本単位で、母音
と子音がある。各音節は通常1個の母音と1個の子音が
結合して形成され、日本語では約100種の音節がある
第3図(A)に示す単語単位の単語音声認識方式では、
音声分析部210が入力単語音声を分析し、入力単語音
声の特徴を表すパラメタの抽出や区間検出を行って入力
単語音声パターンを作成し、単語認識部220に入力す
る。
一方、単語標準パターン部230には、認識対象となる
単語群の各単語を分析して作成された標準パターンが予
め登録されている。
単語認識部220は、入力単語音声パターンを単語標準
パターン部230の各単語の標準パターンと照合して単
語認識を行う。この単語L!2識は、例えば公知の動的
計画法(D P : Dynamic Program
ming )を用いて行われ、距離の最も小さい標準パ
ターンの単語を認識結果として出力する。
第3図(B)に示す音節(音素)単位の単語音声認識方
式では、音声分析部240が入力単語音声の特徴を表す
パラメタ抽出や各音節の区間検出を行って入力音節(音
素)パターンの系列を作成し、音節(音素)認識部(2
50)に入力する。
音節(音素)標準パターン部260には、音節(音素)
対応の標準パターンが予め登録されている。
音節(音素)認識部250は、入力音節(音素)パター
ンの系列を、音節(音素)標準パターン部260から読
み出された音節対応の標準パターンの系列と照合してそ
の距離を求め、得られた各音節系列をその距離情報と共
に単語認識部270に入力する。
単語辞書部280には、各単語をその音節(音素)の系
列で表現したものが格納されている。
単語認識部270は、音節(音素)認識部250より入
力された各音節(音素)系列の距離情報に基づいて単語
辞書部280の各単語の音節(音素)系列の距離を求め
、その値が最も小さい単語を認識結果として出力する。
以上の代表的な単語音声認識方式において、単語単位の
単語音声認識方式(第3図(A))は、認識率は良いが
、反面、処理量及び標準パターンの記憶容量が単語数の
増加と共に急速に増大する。
この為、1000語以上といった大語党の単語音声の認
識には不利である。
これに対し、音節(音素)単位の単語音声認識方式(第
3図(B))は、認識率の点では劣るが、単語認識に必
要な距離計算が入力音節パターンと音節(音素)の標準
パターンとの間で行われることから、単語数が増加して
も処理量や標準パターンの記憶容量の増加が単語単位の
単語音声認識方式よりもはるかに少ないという長所を持
っている。
この様なことから、一般に単語数が少ない語霊の場合に
は単語単位の単語音声認識方式が有利であり、単語数の
多い大語鴬の場合には音節(音素)単位の単語音声認識
方式が有利であるとされている。
〔発明が解決しようとする問題点〕
音節単位の単語音声認識方式は、前述の様に、認識する
単語数が増加しても処理や記憶容量の増加が単語単位の
単語音声認識方式よりもはるかに少ないという特徴を有
している。
然しなから、人語量の単語音声の認識の場合は、単語辞
書部の記憶量や処理量の絶対量が未だ多いのが現状であ
る。この為、人語量の単語群を対象とする音節単位の単
語音声認識装置においては、認識率を向上させると共に
、単語辞書部の記憶容量や処理量を更に減少させること
が問題点となっている。
本発明は、少ない記憶容量を用いて人語量の単語音声の
認識を可能にすると共に、処理量及び認識率を向上させ
る様に改善した音節単位の単語音声認識装置を提供する
ことを目的とする。
〔問題点を解決するための手段〕
従来の音節単位の単語音声認識方式における前述の問題
点を解決する為に本発明が講じた手段を、第1図を参照
して説明する。
第1図は、本発明の基本構成をプロ・νり図で示したも
のである。
第1図において、110は音節候補列抽出手段で、入力
された単語音声を予め登録されている音節対応の標準パ
ターンの系列と照合し、音節系列の異なる長さ毎に、音
節系列名とその距離情報を有する音節候補列を抽出する
。音節候補列の距離情報としては、例えば、その音節候
補列の各音節毎の距離又はその音節候補列の累積距離が
用いられる。
120は単語認識手段で、上位装置より受信されたカテ
ゴリ種別情報に基づいて認識対象となる単語群の各単語
に対応する音節系列が格納される又は上位装置より直接
受信された前記音節系列が格納される使用単語辞書部1
21を備え、この使用単語辞書部121に格納されてい
る各単語に対応する音節系列と前記音節候補列とを、音
節系列名の一致しているものについて照合して単語認識
を行う。
13ゝOは上位装置で、単語認識手段120に対し、認
識対象となる単語群即ち入力単語音声の属する単語群の
カテゴリ種別情報を送信し、又は認識対象となる単語群
の各単語に対応する音節系列を送信する。
〔作 用〕
単語音声が例えばマイクロホン等から入力されると、音
節候補列抽出手段110は、この入力単語音声を予め登
録されている音節対応の標準パターンの系列と照合し、
この音節系列の異なる長さ毎に、音節系列名とその距離
情報からなる音節候補列を抽出して、単語認識手段12
0に入力する。
一方、使用単語辞書部121には、上位装置130より
受信されたカテゴリ種別情報に基づいて、認識対象とな
る単語群の各単語に対応する音節系列が予め格納されて
おり、又は、上位装置130より直接受信された前記音
節系列が予め格納されている。この単語群の内容は、認
識対象に対応して随時変更される。
単語認識手段120は、使用単語辞書部121に格納さ
れている各単語に対応する音節系列と音節候補列抽出手
段110より入力された音節候補列とを、音節系列名の
一致しているものについて照合して単語認識を行う。
この様にすることにより、上位装置から認識対象となる
単語群のカテゴリ種別情報を受けることによって、又は
、上位装置より認識対象となる単語群の各単語に対応す
る音節系列を直接受信することによって、使用単語辞書
部に格納する単語群を認識対象の単語群に随時変更する
ことが可能となるので、小容量の使用単語辞書を用いて
事実上無限鉛量又は人語量の音節単位の単語音声の認識
を行うことが出来る。
又、音節候補列は抽出手段と単語認識手段を分離したの
で、単語音声の入力時点と上位装置からの認識対象単語
群に関する情報を受信する時点に余裕を持たすことが可
能となり、無限倍量又は人語量の単語音声の認識を容易
にしている。
更に、入力単語音声の属するカテゴリの単語群のみを認
識の対象とするので、処理量を低減させると共に認識率
を向上させることが出来る。
〔実施例〕
本発明の実施例を、第2図を参照して説明する。
第2図は、本発明の一実施例の構成をプロソク図で示し
たものである。
(A)実施例の構成 第2図において、音節候補列抽出手段110、単語認識
手段120、使用単語辞書部121及び上位装置130
については、第1図で説明した通りである。
上位装置130はエキスパートシステムとも呼ばれ、単
語認識手段120によって認識された単語が入力される
140はマイクロホンで、話者(図示せず)の発生した
単語音声又は音節音声が入力される。
音節列候補110において、111はパラメタ抽出部で
、マイクロホン140から入力された単語音声又は音節
音声の特徴を表すパラメタが抽出される。112は区間
検出部で、パラメタ抽出部111によって抽出されたパ
ラメタに基づいて区間検出を行って音節対応の入力単語
音声パターンを作成する。113は単音節辞書部で、特
定の単語音声又は音節音声から作成された音節対応の標
準パターンが、予め登録されている。114は音節照合
部で、区間検出部112から入力された音節対応の入力
単語音声パターンと単音節辞書部113に登録されてい
る音節対応の各標準パターンの系列と照合し、この音節
系列の異なる長さ毎に、音節系列名とその距離情報から
なる音節候補列を抽出する。115は切替え回路で、区
間検出部112の出力を単音節辞書部113又は音節照
合部114に供給する。
単語認識手段120において、122は文字列照合部で
、使用単語辞書部121に格納されている各単語に対応
する音節系列と音節候補列抽出手段110より入力され
た音節候補列とを、音節系列名の一致しているものにつ
いて照合して単語認識を行う。
(B)実施例の動作 話者の発声した単語音声に対する認識処理が開始される
前に、単音節辞書部113には音節対応の標準パターン
が登録され、使用単語辞書部121には入力単語音声の
属するカテゴリの単語群の各単語に対応する音節系列が
格納される。
単音節辞書部113に音節対応の標準パターンを登録す
る場合は、切替え回路115を単音節辞書部113側に
接続し、マイクロホン140より特定の単語音声又は単
音節音声を音節候補列抽出手段110に入力する。
音節候補列抽出手段110のパラメタ抽出部及び区間検
出部112は、入力された単語音声又は単音節音声より
音節対応の標準パターンを作成して、単音節辞書部11
3に登録する。これらパラメタ抽出部111及び区間検
出部112の構成及び動作は何れも公知であるので、そ
れらの詳細な説明は省略する。
単音節の数は約100種類で単語数には依存しないので
、人語党の単語音声認識の場合にも単音節辞書部113
の容量は増加しない。
使用単語辞書部121には、上位装置より受信されたカ
テゴリ種別情報に基づいて、入力単語音声の属するカテ
ゴリの単語群即ち認識対象となる単語群の各単語に対応
する音節系列が、図示しない単語辞書部より読み出され
て格納される。又は、上位装置130より前記音節系列
が直接受信されて格納される。
次に、入力単語音声の認識を行う場合は、切替え回路1
15は音節照合部114側に接続される。
マイクロホン140より単語音声が入力されると、前述
の標準パターンの登録の場合と同様に、パラメタ抽出部
111及び区間検出部112は、音節対応の入力単語音
声パターンを作成して音節照合部114に入力する。
音節照合部114は、区間検出部112より入力された
音節対応の入力単語音声パターンと単音節辞書部113
に登録されている音節対応の各標準パターンの系列と照
合し、この音節系列の異なる長さ毎に、音節系列とその
距離情報からなる音節候補列を抽出して、単語認識手段
120に入力する。この音節候補列の抽出は、例えばD
P(口ynamic Programming )マツ
チング処理により行うことが出来る。音節候補列の距離
情報には、その音節候補列の各音節毎の距離又はその音
節候補列の累積距離が用いられる。
単語認識手段120において、文字列照合部122は、
使用単語辞書部121に格納されている各単語に対応す
る音節系列と音節候補列抽出手段110より入力された
音節候補列とを、音節系列名の一致しているものについ
て照合し、距離の最も小さい単語を認識結果として出力
する。
次に、文字列照合部122の動作を、単語音声として地
名“加賀(カガ)”を入力した場合を例にとり、表1を
参照して説明する。入力単語音声の属するカテゴリ即ち
認識対象となる単語群は“地名”である。従って、使用
単語辞書121には、“地名”の名単語に対応する音節
系列が格納される。
表1において、(A)欄の“音節候補列”は、音節候補
列抽出手段110により抽出された各音節候補列の音節
系列名とその距離を示したものである。抽出されたl音
節長の音節候補列は、音節系列名が“ガ”、“力”及び
“ア”で、その距離はそれぞれ“57”、“71”及び
“83”である。2音節長の音節候補列は、音節系列名
が“アガ、“カガ”及び“アア”で、その距離はそれぞ
れ“32”、143″及び“74″である。3音節長の
音節候補列は、音節系列名が“カガア”。
“カガワ”及び“カアア”で、その距離はそれぞれ“4
1”、”56”及び68″である。
(B)Iの“使用単語辞書部の音節系列”は、認識対象
となる地名の各単語に対応する音節系列の音節系列名を
示したものである。1音節長のも。
のとして“ツ(津)″が、2音節長のものとして“カガ
(加賀)”が、3音節長のものとして“カガワ(香川)
”が、それぞれ例示されている。
(c)欄の“照合例”には、文字列照合部122によっ
て照合された単語の音節系列名とその距離がそれぞれ示
されている。
1音節長の音節系列においては、使用単語辞書部121
の音節系列名と一致する音節系列名を持った音節候補列
が存在しないので、その場合は無限大の距離“■”又は
該当なしの記号が与えられる。
2音節長の音節系列の場合は、“カガの音節系列名が一
致しているので、“カガ(加賀)”及びその距離“43
”が抽出される。
3音節長の音節系列の場合は、“カガワ°の音節系列名
が一致しているので、“カガワ(香川)”及びその距離
“56″が抽出される。
各音節系列の距離は、対応する各音節候補列の距離情報
から求められるが、音節候補列の距離が正規化されてい
る(フレーム当りの値になっている)場合は、音節毎の
距離の加算値を音節数で削って、正規化する様にする。
以上の様にして抽出された音節系列“カガ(距離43)
”及び“カガワ(距離56)  ”のうち、その距離の
最も小さい“カガ即ち“加賀”が認識結果として抽出さ
れ、上位装置130に送信される。1音節長の“ツ(津
)”は、その距離が無限大であるので、認識の対象とさ
れない。
以上の様に、入力単語音声の属するカテゴリの単語群に
ついて認識処理を行うので、処理量を低減させることが
出来る。又、音節候補列として抽出され、距離が“カガ
(距離43)”よりも小さい“アガ(距離32)′や“
カガア(距離41)′は、その音節系列名が入力単語音
声の属するカテゴリの単語群中に存在しないことから、
照合の対象外とされる。従って、これらが誤って認識さ
れることが阻止され、認識率を向上させることが出来る
〔発明の効果〕
以上説明した様に、本発明によれば、次の諸効果が得ら
れる。
(イ)上位装置より認識対象となる単語群のカテゴリ種
別情報を受けることにより使用単語辞書に格納する単語
群を随時変更することが可能であるので、少ない容量の
使用単語辞書を用いて、事実上無限大又は人語量の単語
音声の認識を行うことが出来る。
又、音節候補列抽出手段と単語認識手段を分離したので
、単語音声の入力時点と上位装置からの認識対象単語群
に関する情報を受信する時点に余裕を持たすことが可能
となり、無限倍量又は人語量の単語音声の認識を容易に
している。
(ロ)入力単語音声の属するカテゴリの単語群のみを認
識の対象とするので、処理量を低減させると共に認識率
を向上させることが出来る。
【図面の簡単な説明】
第1図・・・本発明の基本構成の説明図、第2図・・・
本発明の一実施例の構成の説明図、第3図・・・従来の
単語音声認識方式の説明図。 第1図及び第2図において、 110・・・音節候補列抽出手段、120・・・単語認
識手段、121・・・使用単語辞書部、130・・・上
位装置、140・・・マイクロホン。 (A) CB) 胱采のキ修誇認肯4式゛ 第3図 手続補正占(自発) 昭和61年12月23日 特許庁長官  黒 1) 明 雄 殿 】、  事件の表示 1餠061年特許願第060968号 2、  発明の名称 華語音声認識装置 3、  補正をする者 事件との関係   特許出願人 住所 神奈川県用崎市中原区上小田中1015番地名称
 (522)富士通株ヱ(会社 4、代理人 IAI片氏の通り 補正の内容(特願昭61−060968号)1. 明細
書第16頁の表1を、下記の通り補正する。 記 表      1

Claims (1)

  1. 【特許請求の範囲】 音節を認識単位とする単語音声の認識装置において、 (a)入力された単語音声を予め登録されている音節対
    応の標準パターンの系列と照合し、音節系列の異なる長
    さ毎に、音節系列名とその距離情報を有する音節候補列
    を抽出する音節候補列抽出手段(110)と、 (b)上位装置(130)より受信されたカテゴリ種別
    情報に基づいて認識対象となる単語群の各単語に対応す
    る音節系列が格納される又は上位装置(130)より直
    接受信された前記音節系列が格納される使用単語辞書部
    (121)を備え、この使用単語辞書部(121)に格
    納されている各単語に対応する音節系列と前記音節候補
    列とを、音節系列名の一致しているものについて照合し
    て単語認識を行う単語認識手段(120)と、 (c)単語認識手段(120)に対し、認識対象となる
    単語群のカテゴリ種別情報を送信し、又は、認識対象と
    なる単語群の各単語に対応する音節系列を送信する上位
    装置(130)、 を備えたことを特徴とする単語音声認識装置。
JP61060968A 1986-03-20 1986-03-20 単語音声認識装置 Pending JPS62218997A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61060968A JPS62218997A (ja) 1986-03-20 1986-03-20 単語音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61060968A JPS62218997A (ja) 1986-03-20 1986-03-20 単語音声認識装置

Publications (1)

Publication Number Publication Date
JPS62218997A true JPS62218997A (ja) 1987-09-26

Family

ID=13157720

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61060968A Pending JPS62218997A (ja) 1986-03-20 1986-03-20 単語音声認識装置

Country Status (1)

Country Link
JP (1) JPS62218997A (ja)

Similar Documents

Publication Publication Date Title
JPS62218997A (ja) 単語音声認識装置
JP3039453B2 (ja) 音声認識装置
JPS6180298A (ja) 音声認識装置
JPS63161499A (ja) 音声認識装置
JP2737122B2 (ja) 音声辞書作成装置
JP2615643B2 (ja) 単語音声認識装置
JPS60164800A (ja) 音声認識装置
JPS62217297A (ja) 単語音声認識装置
JPS62219000A (ja) 単語音声認識装置
JPS607492A (ja) 単音節音声認識方式
JPS60182499A (ja) 音声認識装置
JP3033132B2 (ja) 言語処理装置
JPS6033599A (ja) 音声認識装置
JP2578771B2 (ja) 音声認識装置
JPS60118896A (ja) 音声認識装置
JPS58123596A (ja) 補助情報を併用する音声認識方式
JPH0415960B2 (ja)
JPH0573039B2 (ja)
JPS6240497A (ja) 音声パタ−ン分類方式
JPH067359B2 (ja) 音声認識装置
JPS62249198A (ja) 単語音声認識装置
JPH05241592A (ja) 連続単語認識装置
JPS60150098A (ja) 音声認識装置
JPS6355599A (ja) 音声認識装置
JPS62103698A (ja) 音素変形ル−ルの話者適応方式