JPS615300A - 学習機能付音声入力装置 - Google Patents

学習機能付音声入力装置

Info

Publication number
JPS615300A
JPS615300A JP59127735A JP12773584A JPS615300A JP S615300 A JPS615300 A JP S615300A JP 59127735 A JP59127735 A JP 59127735A JP 12773584 A JP12773584 A JP 12773584A JP S615300 A JPS615300 A JP S615300A
Authority
JP
Japan
Prior art keywords
field
word
clause
words
independent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59127735A
Other languages
English (en)
Inventor
外川 文雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP59127735A priority Critical patent/JPS615300A/ja
Publication of JPS615300A publication Critical patent/JPS615300A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 く技術分野〉 本発明は文節(単語)単位に発声された音声を音節単位
に認識し、該認識された音節候補列を作成し、辞書照合
を含む文法処理を行なって文節(単語)候補及びその認
識評価値を出力する音声入力装置に関し、特にこれまで
に入力し確定された一連の自立語の分゛野別属性の傾向
を参照(学習)して、′これから確定すべき文節(単語
)候補に係る自立語の分野を推定し、これにもとづいて
認識評価値を補正し認識結果の出力順序を変更するよう
にした学習機能付音声入力装置に関するものである。
〈従来技術〉 従来の日本語音声入力装置において、例えば入力音声を
音節単位に認識し、この認識された音節候補の組合せに
より複数の文節候補列を作成し、辞書照合を−含む文法
処理を行なって文節単位の認識結果を出力している。そ
してこの時文節の長さと各音節毎の候補数を組合せた数
の文節候補列が作成され、また辞書照合の結果も複数の
認識結果が出力される。
この場合、音声認識結果の確からしさの順序で複数の認
識結果を順次出力している。
しかし、従来のこのような方法において、単音節の認識
結果がほとんど誤まりの無い場合、あるいは対象とする
語粟が少ない場合には特に問題は生じないか、現在の音
声認識の技術レベルでは充分に区切った音節でも識別し
にくい音節があり、また連続的に発声した音声では調音
結合等の影響により識別率が更に低下する。
また辞書に収納された語索が多くなれば思ってもみない
語が最初に認識結果として出力されることがある。
そこで、従来はたとえば、認識結果の複数の候補を音声
認識結果の確からしさを示す確度情報と、音声認識結果
の確からしさ以外の自立語の長さ、頻度を含む条件にも
とすく文法評°価値情報とから得られる総合評価値情報
によって評価して認識結果の出力順序を決定するように
した日本語音声入力装置が提案されてbる。
しかしながら、この種装置によれば認識結果の正解率は
向上するが、処理内容が煩雑すぎて装置構成が非常に複
雑になるという問題があった。
〈目的〉 本発明はかかる従来の問題点に鑑みて成されたもので、
その目的とするところは、これまでに入力確定された一
連の文節(単語)の分野別属性を統計的に検知しながら
、これから確定すべき文節(単語)の分野を予測すると
いう所謂学習機能により、処理内容を簡略化でき且文節
(単語)の認識率を向上させることのできる学習機能付
音声入力装置を提供せんとするものである。
〈実施例〉 以下図にもとづいて本発明の詳細な説明する。
まず本発明の詳細な説明する。言葉には意味や概念を表
わす最小の基本単位である語幹でこ\では自立語という
)が含まれる。日本語として存在する数万から数10万
の自立語は、幾つかの語いカテゴリを構成しており、例
えば事務系、技術系、医学系、法律系などの分野を語い
カテゴリとして設定すれば、「政治」という自立語は事
務系や法律系の文章ではよく使われるが技術系の文章に
は殆ど使われない。また「酸化」という自立語は技術系
や医学系ではよく使われるが事務系ではあまり使われな
い。
このように一連の文章中に現われる自立語の属する語い
カテゴリ(分野)には文章の分野に応じである偏りを示
す。
本発明はこの点に着目して、予め複数種の分野に対して
各自立語に分野別属性を設定し、この偏りを逆に利用し
て文章などの音声入力時に以前に入力された自立語の分
野別属性を学習し現在入力している分野を推定するもの
で、この推定分野と認識結果の各文節(単語)候補を構
成する自立語の分野別属性を用いて分野別属性の尤度を
算出し、その尤度で音響処理及び文法処理から求められ
た認識評価値(なお、認識評価値の算出方法はたとえば
特願昭58−585]8号で説明している。)を補正し
たものを新しい評価値として得、この評価値をもとにし
て候補の並び換えを行なうものである。
以下、文節を区切りて発声された音声(文節音声)を認
識する場合を例に上げて具体的に説明する。
第1図は本発釘に係る学習機能付音声入力装置の概略構
成図である。図において、lはマイクロホンを介して入
力された文節単位の音声を音節単位に区分して単音節毎
の特徴抽出を行なう音響処理部であり、従来公知のもの
である。2は各装置を制御するコントローラ(CPU)
、8は音響処理にて得られた入力音声の特徴パターンを
記憶する音節パターンバッファ、4は各単音節毎の標準
パターンを記憶する標準音節パターンメモリ、5は音節
候補ラティスバッファであり、特徴パターンと標準パタ
ーンとのマツチング計算処理が行なわれ、このマツチン
グ計算処理の結果、最も近似したものが第1候補として
、また順次近似したものが次候補として選出され、その
結果が近似度(確からしさ)を示す距離差情報と共に音
節ラティスとして前記ラティスバッフ15に記憶される
ようになっている。6は候補列作成部にて識別確度の高
順に展開された候補列(かな列)を記憶する候補列バッ
フ1.7は文法分析によって得られた認識評価値をもつ
文節候補を記憶する文節候補バッファである。
8は自立語の分野別属性を記憶する分野別属性フラッグ
テーブルである。このテーブルは第1表に示すように、
文節を解釈できる辞書を構成する    ′自立語約3
,4万語に対して分野別属性フラッグをもたせ自立語番
号の昇順に並び換えたものでありM(分野数)×N(自
立語数)bits  で構成されて因る。第1表では8
種の分野(たとえば、物理、化学、生物、地学、倫理、
政経、歴史、地理)をF1〜F8の8個のフラッグに対
応させ、さらにフラッグの11”、0#によって自立語
の分野別属性を記憶するようにしている。なお、フラッ
グFmか1#であれば分野mK属し、−〇#であれば分
野mに属さないことを示している。
9は分野別カウンタであり、92表に示すように、各分
野に対応するB1〜B8の8個のカウンタから成る。1
0は文法分析に必要な文法情報、見出し語辞書及び接辞
語辞書等を含む辞書メモリである。
第1表 II/112表 次に上記の如く構成された装置の動作を第2図に示す処
理フローに従って説明する。なお、点、線で囲んだ部分
が本発明に係る処理フローである。
文節単位に発声された入力音声は音響処理により音節パ
ターンが抽出されて識別され音節候補ラティスが出力さ
れる(a−f)。この音節ラティスは候補列作成部にて
a!!別確度の高い願に展開され候補列(かな列)が作
成されて8,4万語の辞書照合及び文法分析部で文法分
析か行なわれ文法的に可能な解釈が総て行なわれる。も
し、解釈が不可能ならば除外し次の候補列を作成する。
そして、g臓評価値Hfをもつ文節候補を分析結果とし
て得る(g−j)。同時に、各文節候補を構成する自立
語の分野別属性Fm (m=L M)と現在の分野別カ
ウンタBm (m−1,M)O値を用いて尤度演算部に
て分野別属性の尤度Liを次式のような内積で求める(
 k=m )。
但し、Liは第i候補文節の亦野別−性の尤度である。
次に評価値算出部により、次式に従って認識評価値Hi
を対応の尤度Liで割算して新しい評価値H1°を求め
、文命候補を出力する。
Hi’ =Hi / (1+Lixk)       
式(2)但し、k;重み付は係数で、k > 0゜そし
て、並換部にて求めた評価値Hi″にもとづく文節候補
の並び換えを行なう(n−p)。
このようにして、°新しい評価値H1′  によって並
び換えられた文節候補のうち、候補順位−位のものが話
者(オペレータ)によって確定されると、その確定され
た文節に含まれる自立語の分野別属性Fmを次式で示す
通り、分野別カウンタBmに累計加算し、これまでに確
定した自立語の分野別属性の傾向を記憶し、次の自立語
における分野別属性の尤度Liの算出時に参照できるよ
うに考慮されている。、(q、r、m)。
Bm=Bm+Fm  (form=1.、M)    
 式(3)次に具体例を挙げて今少し詳細に説明する。
今、たとえば、「化学反応は熱や触媒によって加速され
る。例えば、鉄が」と入力した文章に続いて/酸化する
/と発声して入力した場合、文節候補の認識評価値Hに
よる候補順位は第3表に示す通りであり、「参賀する」
が第1位であった。
文節候補 (噛鍵判1場画6r)(ルC陶唆「f仔■m1; H)
、(fie)(m己)(硼fllJFaQ心1L) 1)     1000   さんがする参賀する (
0,38)2)     1800   さんかする 
参加する (0,46)酸化する (0,87) 8)   1500  さん力;〈ぶ山岳部(0,47
)第8表 ところで、入力音声の/酸化する/を認識するまでに、
化学、反応、触媒、加速、鉄の各自立語5が確定されて
おり、確定される度毎に分野別カウンタB1〜B8”は
各自立語の分野別属性(フラッグFl−F8の状態)を
累計している。
したがって、/酸化する/という入力音声の認識時にあ
っては分野別カウンタB1〜B8の各カウンタ値は第2
表に示す通り、化学系の分野別カウンタB2で高い値(
5)を示しており、現在化学系の分野の入力が行なわれ
ているという予測をしていることがわかる。
よって、式(1)にもとづいて入力音声/酸化する/は
係る各文節候補について分野別属性の尤度りを算出する
と、第3表のように「酸化する」の値りがα87と大き
な値になる。次に、式(2)に各文節候補の認識評価値
Hと対応の尤度りを代入して新しい認識評価値H′を求
めて並び換えると、第4表に示す通り1.「酸化する」
が第1候補となり誤りが訂正される。
分野別属性の尤度による評価後 (認識評価値;H′) (1)    695     酸化するr2)   
 752     参賀する(31   890   
  参加する(4)    1020    山岳部第
4表 このように、本発明は既に確定した一連の文節(単語)
の分野別属性の傾向を参照して、次に確定すべき文節(
単語)の分野を予測し、再評価するようにしたものであ
り、簡単な処理手順でもって認識率を向上させることか
できる。
なお、上記実施例では分野別カウンタBmにて自立語の
確定の度毎にその分野別属性を累計カウントしているが
、この分野別カウンタBmの各分野別毎のカウンタ値を
任意に設定し且その設定値を固定できるようにしてもよ
い。たとえば、分野にのカウンタのみにある値を設定し
、他の分野のカウンタ値を総て′0#に固定すれば、分
野kに属する音声入力が確率良く行なえ見掛は上分野に
の語いに限定した状態となる。
なお、総てのカウンタ値を0#に設定し固定すれば全文
節候補の尤度Li=0でHi’=Hiとなり本発明に係
る処理が作用しない状態と々る。
また、分野別属性を表わすフラッグFmは10#。
’I”の2値シはなく、文章や会話で使用される使用頻
度などに基づいた統計的なアナログ値であっても良い。
く効果〉 以上詳細に説明したように、本発明装置は予め定められ
た複数の分野に対して各自立語の分野別属性情報を記憶
する手段と、入力した文節(単語)が確定する度毎に当
該文節(単語)を構成する自立語の分野別属性情報を順
次累計カウントする分野別カウンター手段と、前記各文
節(単語)候補蚤゛1構成する自立語の分野別属性情報
と、前記カウンター手段の累計による、今一つの分野別
属性情報を用いて、前記各文節(単語)候補に係る分野
別属性情報の尤度を算出する手段と、算出した尤度を用
いて前記各文節(単語)の認識評価値を補正する手段と
から成るから、処理内容を簡略化でき尚且文節(単語)
の認識率を向上させることが出来る。
【図面の簡単な説明】
第1図は本発明装置の概略構成図、第2図は処理フロー
を示す図である。 1は音響処理部、   2はコントローラ、3は音節パ
ターンバッファ、  8は分野別属性フラッグテーブル
、   9は分野別カウンタ。

Claims (1)

  1. 【特許請求の範囲】 1、文節(単語)単位に発声された音声を音節単位に認
    識し、該認識された音節候補の組合せにより複数の文節
    (単語)に候補列を作成し、辞書照合を含む文法処理を
    行なって文節(単語)候補及びその認識評価値を出力す
    る音声入力装置に於て、 予め定められた複数の分野に対して各自立語の分野別属
    性情報を記憶する手段と、入力した文節(単語)が確定
    する度毎に当該文節(単語)を構成する自立語の分野別
    属性情報を順次累計カウントする分野別カウンター手段
    と、前記各文節(単語)候補を構成する自立語の分野別
    属性情報と前記カウンター手段の累計による今一つの分
    野別属性情報を用いて、前記各文節(単語)候補に係る
    分野別属性情報の尤度を算出する手段と、算出した尤度
    を用いて前記各文節(単語)の認識評価値を補正する手
    段とを備えたことを特徴とする学習機能付音声入力装置
    。 2、前記記憶手段を、各自立語に対して分野別の属性フ
    ラッグをもたせ、かつ自立語番号の昇順に並び換えたフ
    ラッグテーブルにて構成したことを特徴とする特許請求
    の範囲第1項に記載の学習機能付音声入力装置。 3、前記カウンター手段を、必要に応じて各分野別毎の
    カウンター値を任意に設定でき、且その設定値を固定し
    得るように構成したことを特徴とする特許請求の範囲第
    1項に記載の学習機能付音声入力装置。 4、前記補正手段は補正評価値にもとづいて文節(単語
    )候補の並び換えを行なう手段を包含して成ることを特
    徴とする特許請求の範囲第1項に記載の学習機能付音声
    入力装置。
JP59127735A 1984-06-19 1984-06-19 学習機能付音声入力装置 Pending JPS615300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59127735A JPS615300A (ja) 1984-06-19 1984-06-19 学習機能付音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59127735A JPS615300A (ja) 1984-06-19 1984-06-19 学習機能付音声入力装置

Publications (1)

Publication Number Publication Date
JPS615300A true JPS615300A (ja) 1986-01-11

Family

ID=14967385

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59127735A Pending JPS615300A (ja) 1984-06-19 1984-06-19 学習機能付音声入力装置

Country Status (1)

Country Link
JP (1) JPS615300A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0749649A (ja) * 1994-05-24 1995-02-21 Roehm Properties Bv 電子学習装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0749649A (ja) * 1994-05-24 1995-02-21 Roehm Properties Bv 電子学習装置

Similar Documents

Publication Publication Date Title
EP0387602B1 (en) Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system
US7251600B2 (en) Disambiguation language model
JPS61177493A (ja) 音声認識方法
EP3613046B1 (en) System and method for automatic speech analysis
JPH0772839B2 (ja) 自動音声認識用に音類似に基づく文脈依存カテゴリへ音素の発音をグループ化する方法と装置
JPS62231995A (ja) 音声認識方法
EP2891147B1 (en) Method and system for predicting speech recognition performance using accuracy scores
CN109979257B (zh) 一种基于英语朗读自动打分进行分拆运算精准矫正的方法
US8219386B2 (en) Arabic poetry meter identification system and method
JP2004094257A (ja) 音声処理のためのデシジョン・ツリーの質問を生成するための方法および装置
JPH0250198A (ja) 音声認識システム
JPS61219099A (ja) 音声認識装置
JP2002278579A (ja) 音声データ検索装置
JPS615300A (ja) 学習機能付音声入力装置
JPH08248988A (ja) 音声認識方法
JPS6229796B2 (ja)
JPS6325366B2 (ja)
JPH049320B2 (ja)
JPS62134698A (ja) 多数単語の音声入力方式
JP2647234B2 (ja) 音声認識装置
JP2003263187A (ja) 言語モデル学習方法、その装置、そのプログラムおよびそのプログラムの記録媒体ならびに言語モデル学習を用いた音声認識方法、その装置、そのプログラムおよびそのプログラムの記録媒体
JPS6147999A (ja) 音声認識装置
KR0136426B1 (ko) 히든 마르코프 모델링 방식(hmm)의 음성인식 시스템에서의 음성인식 방법
JPH04232997A (ja) 音声認識装置における認識結果表示方式
CN113409630A (zh) 基于关联词汇生成的英文单词背诵辅助方法与系统