JPS6321214B2 - - Google Patents

Info

Publication number
JPS6321214B2
JPS6321214B2 JP59031005A JP3100584A JPS6321214B2 JP S6321214 B2 JPS6321214 B2 JP S6321214B2 JP 59031005 A JP59031005 A JP 59031005A JP 3100584 A JP3100584 A JP 3100584A JP S6321214 B2 JPS6321214 B2 JP S6321214B2
Authority
JP
Japan
Prior art keywords
candidate
recognition results
memory
stored
evaluation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP59031005A
Other languages
English (en)
Other versions
JPS60175141A (ja
Inventor
Tooru Ueda
Mitsuhiro Toya
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DENSHI KEISANKI KIPPON GIJUTSU KENKYU KUMIAI
Original Assignee
DENSHI KEISANKI KIPPON GIJUTSU KENKYU KUMIAI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DENSHI KEISANKI KIPPON GIJUTSU KENKYU KUMIAI filed Critical DENSHI KEISANKI KIPPON GIJUTSU KENKYU KUMIAI
Priority to JP59031005A priority Critical patent/JPS60175141A/ja
Publication of JPS60175141A publication Critical patent/JPS60175141A/ja
Publication of JPS6321214B2 publication Critical patent/JPS6321214B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
<発明の技術分野> 本発明は文節単位に発声された音声を音節単位
に認識し、この認識された音節候補の組合せによ
り複数の文節候補列を作成し、辞書照合を含む文
法処理を行なつて文節単位の認識結果を出力する
日本語音声入力装置の改良に関するものであり、
更に詳細には認識結果の複数の候補を音声認識結
果の確からしさ及び該確からしさ以外の条件にも
とずいて総合評価して認識結果の出力順序を変更
するようにした日本語音声入力装置に関するもの
である。 <発明の技術的背景とその問題点> 従来の日本語音声入力装置において、例えば入
力音声を音節単位に認識し、この認識された音節
候補の組合せにより複数の文節候補列を作成し、
辞書照合を含む文法処理を行なつて文節単位の認
識結果を出力している。そしてこの時文節の長さ
と各音節毎の候補数を組合せた数の文節候補例が
作成され、また辞書照合の結果も複数の認識結果
が出力される。 この場合、音声認識結果の確からしさの順序で
複数の認識結果を順次出力している。 しかし、従来のこのような方法において、単音
節の認識結果がほとんど誤まりの無い場合、ある
いは対象とする語彙が少ない場合には特に問題は
生じないが、現在の音声認識の技術レベルでは充
分に区切つた音節でも識別しにくい音節があり、
また連続的に発声した音声では調音結合等の影響
により識別率が更に低下する。 また辞書に収納された語彙が多くなれば思つて
もみない語が最初に認識結果として出力されるこ
とがある。 本出願人はこのような従来の問題点を解決する
ため、先に特願昭58−58513号(特開昭59−
180629号公報)「音声入力式日本語文書処理装置」
を提案した。 この方法は、認識結果の複数の候補を音響点
(音節認識結果の確からしさを示す確度情報)と、
文法点(音節認識結果の確からしさ以外の自立語
の長さ、頻度を含む条件にもとずく文法評価値情
報)とから得られる総合評価値情報によつて評価
して認識結果の出力順序を決定するようにしたも
のである。 しかし、本出願人が先に提案した音声入力式日
本語文書処理装置において、その出力結果を
CRT等の表示装置によつて人間が確認しなけれ
ばならない場合、先に本出願人が提案した出力方
法では文節の表示全体が書き換わつてしまう場合
が多く、非常に目が疲れやすい問題点があること
が判明した。 <発明の目的> 本発明は上記の点に鑑みて成されたものであ
り、同一自立語の候補を続けて出力することによ
つて表示の書き換わる部分を少なくし、使用者の
疲労度を軽減せしめるようにした日本語音声入力
装置を提供することを目的とし、この目的を達成
するため、本発明の日本語音声入力装置は、認識
結果の複数の候補を音声認識結果の確からしさを
示す確度情報と、音声認識結果の確からしさ以外
の自立語の長さ、頻度を含む条件にもとずく文法
評価値情報とから得られる総合評価値情報により
評価して認識結果の出力順序を入れ換える手段
と、得られた文節候補列のなかで同じ自立語のも
のをまとめるように認識結果の出力順序を決定す
る手段とを備えて次候補を選択する際の表示を見
やすくするように構成されている。 <発明の実施例> 以下、図面を参照して本発明の一実施例を詳細
に説明する。 第1図は本発明の音声入力式日本語文書処理装
置の一実施例の構成を示すブロツク図である。 第1図において、1は音声入力をピツクアツプ
するマイクロホンであり、このマイクロホン1に
より検出された音声は単音節認識部2に入力され
る。この単音節認識部2は従来公知のものであ
り、マイクロホン1を介して入力された文節単位
の音声が音節単位に区分されて単音節毎の特徴描
出が行なわれる。一方メモリ3には各単音節毎の
標準パターンが記憶されており、単音節認識部2
において入力音声の特徴パターンと標準パターン
とのマツチング計算処理が行なわれ、このマツチ
ング計算処理の結果、最も近似したものが第1候
補として、また順次近似したものが次候補として
選出され、その結果が近似度(確からしさ)を示
す距離情報と共にメモリ4に音節ラテイスとして
記憶される。 上記単音節認識部2において認識され、音節ラ
テイスとしてメモリ4に記憶された内容は候補列
作成部5に入力されて近似度(確からしさ)を示
す距離情報を用いて確度の高い順に文節候補(か
な文字列)が作成されて文節候補メモリ6に記憶
される。なお、メモリ6において領域6aは文節
候補の確からしさを示す確度情報を記憶領域、領
域6bは後述する評価内容を記憶する評価レジス
タ領域である。 上記候補列作成部5において作成され、メモリ
6内に記憶された複数の候補列は順次文節分析部
7に入力されて文法的な分析が行なわれると共に
分析に必要な文法情報及び見出し語辞書、接辞語
辞書等を含む辞書メモリ8の内容と照合され、一
致したものが認識結果メモリ9に文節(単語)の
漢字候補情報として記憶される。更に文節分析部
7は後述するようにメモリ9に記憶される文節
(漢字)候補の構成要素を分析して文法評価値を
算出し、仮名漢字変換処理における同音語の最高
評価値を得た漢字候補が認識結果メモリ9に記憶
され、またメモリエリア9aにその候補に対する
文法評価値が記憶される。 また上記メモリ領域6aに記憶されている確度
情報Yとメモリエリア9aに記憶された文法評価
値情報Xにもとずいて算出された各候補の総合評
価値Zがメモリエリア9bに記憶され、この総合
評価値Zが用いて文節候補のソートが行なわれ、
更に得られた文節候補のなかで、同じ自立語のも
のをまとめるようにソートが行なわれて、認識結
果の出力順序が決定されるように構成されてい
る。 なお10は評価点算出のために用いられるバツ
フアであり、メモリ領域A、B、C、ST、SB、
Xを有している。また11は認識結果等を表示す
る表示装置、12はかなキー、フアンクシヨンキ
ー等を有する入力装置、13は上記各装置を制御
するコントローラ(CPU)である。 次に上記の如く構成された装置の動作を第2図
に示す1文節の処理フローに従つて説明する。 文節単位に発声された音声はマイクロホン1に
よつて検出されて単音節認識部2により、音響分
析によつて単音節単位に認識され(n0〜n3)、そ
の認識結果が音節ラテイスメモリ4に入力記憶さ
れる。 例えば入力音声「/ほ//ん//た//い//
か//い/」(「本大会」)に対する単音節認識結
果として第1表に示すような音節ラテイスが形成
される。
【表】 なお、上記第1表において音節ラテイスの
( )内に示した数字は第1位の認識結果を1.0と
した時の2位以下の確度を表わしている。 上記のように音節ラテイスには音節番号と音節
確度(確からしさ)情報が書かれることになる。
ここで音節の確からしさを表わす音節確度は次の
ようにして算出される。 即ち、単音節認識部2で入力音節の特徴パター
ンとメモリ3に記憶されている複数の標準パター
ンとの間でパターンマツチングが行なわれ、パタ
ーンマツチングの結果として、各標準パターンと
のマツチング距離を得る。このマツチング距離の
小さい順に並べて、上位数個を音節候補とする。 第2表に音節候補のマツチング距離を( )内
の数値で示す。第1表に示した音節確度は、第1
位のマツチング距離で各位のマツチング距離を除
して正規化したものである。
【表】 上記単音節認識部2において認識され、音節ラ
テイスとしてメモリ4に記憶された音節単位の各
候補は候補列作成部5に入力される。 候補列作成部5は音節ラテイスメモリ4に記憶
された音節単位の認識結果を用いて、最初に上記
メモリ4に記憶された1位の認識結果ばかりを並
べて候補列を作成して文節候補メモリ6に記憶
し、次に順次2位以下の認識結果を組合せて確度
の総和(候補列の確度)の小さい順に候補列(文
節候補)を作成してメモリ6に記憶する。またこ
の時各文節候補に対する確度情報Yがメモリエリ
ア6aに記憶される(n4)。上記第1表に示した
例では36個の候補列が第3表の如く作成されてメ
モリ6に記憶される。
【表】 次にメモリ6に記憶された候補列は順次文節分
析部7に入力され、文節の分析が行なわれる
(n5)。 即ち文節分析部7では入力される候補列を辞書
メモリ8の内容との照合を含む文法分析を次のよ
うに実行する。 候補列→(接頭語)+自立語+(接尾語)+(活用
語尾)+(付属語列) ただし( )内の要素は無くても良い。 ステツプn5において行なわれる文節の文法分
析処理フローは第3図に詳細に示されており、文
節分析部7はまず入力された候補列と辞書メモリ
8の記憶内容との照合を行なつて仮名漢字変換処
理を実行する(n20,n21)。この時変換できなか
つた場合には入力された候補列が文節として不可
能なかな配列と判定して、メモリエリア6bのそ
の候補列に対応した位置(評価レジスタ)に
「0」を入れて、文節分析結果(評価)「×」の決
定を行う(ステツプn22,23,24)。 一方、仮名漢字変換処理動作(n21)の結果、
変換が可能であつた場合には、評価レジスタエリ
ア6bの対応位置(評価レジスタ)を「1」にセ
ツトして(n25)、照合の結果一致したことを示
す判定情報を記憶すると共にステツプn26以後の
文法評価値算出動作に移行する。 即ち、本発明実施例において各文節候補につい
てn20〜n25の動作を実行することにより上記第
3表の評価欄に示したように「〇」を付加した6
個の候補列が文節として可能であることが分析さ
れる。 また、本発明実施例においては文節として可能
な候補列についてステツプn26以後において文節
の構成要素において重み付けを行なつて出力順序
付けを行なつているがその一例を以下に示す。 文節として可能な候補列に対する文法評価値は
上記した文節の要素の接頭語、自立語、接尾語の
各々に対して次の3点において点数を与え、各要
素ごとに重みをかけて加算した点数の合計として
算出される。 語長 頻度 直前の数百文節での使用の有無 次に各項目に対する文法評価値の算出動作を説
明する。 () 自立語に対する評価値(n26〜n31) 自立語長は、その自立語の活用語尾の長さも含
めた長さとする。例えば「歩いた」では、「歩」
が自立語の語幹であり、「い」が活用語尾であり、
「た」が付属語となる。従つて自立語長は3とな
り、この自立語の長さはAレジスタに記憶される
(n26)。 自立語に対する頻度情報は3ランクに分け、少
ないものから0,1,2の値が与えられて例えば
辞書メモリ8に記憶されており、この辞書メモリ
8より所望の頻度情報が取出されてBレジスタに
記憶される(n27)。 次にステツプn28に移行して直前の数十文節で
使用されているか否かが判定され、使用されてい
れば「1」、使用されていなければ「0」がCレ
ジスタに記憶される(n29,30)。 次にステツプn31に移行して自立語の評価値J
が次式 J=A+B+4C に従つて算出され、その結果がJレジスタに記憶
される。 なお、自立語の場合には、一度用いたものを再
度用いる確率が高いため、使用の有無の情報Cに
重みをかけている。 () 接頭語、接尾語に対する評価値(n32〜
n47) 接頭語はその文字数(拗音は除く)を2倍した
ものを用いる。ただし、文字数が0(接頭語がな
い時)の時には「4」を与える(n33)。また頻
度は2ランクに分けられており、少ないものを
「0」、多いものを「1」としている。更に使用の
有無は無い時には「0」、有の時には「1」を与
えている。 接頭語長はAレジスタに記憶され(n34)、頻
度情報はBレジスタに記憶され(n35)、使用の
有無情報はCレジスタに記憶され(n37,38)、
その後ステツプn39に移行して接頭語の評価値ST
が次式 ST=A+B+2C に従つて計算され、その結果がSTレジスタに記
憶される。 接尾語の場合には接頭語と同様の動作がステツ
プn40〜n47において実行され、その結果やSBレ
ジスタに記憶される。 次にステツプn48に移行して1文節全体の評価
値Xが次式 X=ST+16J+SB に従つて計算され、その結果がXレジスタに記憶
される。 次にステツプn49に移行してXレジスタの値が
評価値レジスタ(メモリエリア9a)の値より大
きいか否かが判定され、Xレジスタの値が評価値
レジスタの値より大きい場合には評価値レジスタ
(メモリエリア9a)にXレジスタの内容を記憶
すると共に、ステツプn21,n22において変換さ
れた漢字候補をその文法評価値と共にメモリ9に
記憶する(n50)。 一方n49においてXレジスタの値が評価値レジ
スタの値より大きくない場合にはステツプn50を
飛び越してステツププn51に移行する。 ステツプn51においては次の同音語の候補があ
るか否かが判定され、同音語の候補があればステ
ツプn26以降に戻つて新たな同音語候補に対する
文法評価値の計算が行なわれる。 また同音語の候補がなければステツプn52に移
行して1候補列に対する文節の分析動作が終了す
る(n5,n6)。 このような動作により1候補列に対する漢字候
補がその文法評価値と共に認識結果メモリ9に記
憶され、また1候補列に対して同音語(複数の漢
字候補)が存在する場合には評価点の最も大きい
漢字候補がメモリ9に記憶されることになる。 第3表に示した例においては 「こんたいがい」→「今対外」 「こんたいかい」→「今大会」 「おんたいがい」→「御対外」 「おんたいかい」→「御大会」 「ほんたいがい」→「本対外」 「ほんたいかい」→「本大会」 の漢字列が得られる。また自立語「対外」と「大
会」、および接頭語「今」、「本」、「御」の頻度を
一様に1とした場合の各文節の評価は、すべて X=4+16×(4+1+0)+4=88 となる。 次にステツプn8(第2図)において各文節認識
結果の総合評価値が Z=X(文法評価値)/Y(確 度) の式に従つて算出され、その結果がメモリエリア
9bに記憶される。 次にステツプn9(第2図)において文節認識
結果をソートすることによりメモリ9の記憶内容
は第4表のの如くなる。 次にステツプn10に移行して本発明の特徴であ
る同一自立語の候補をまとめる操作が行なわれ
る。 これは評価値の大きい候補から順に、その候補
より上位に同一自立語を持つ候補があるかどうか
を判定し、それによつて候補順位を入れ換えるも
のであり、次の処理ステツプにより自立語による
候補の出力順序の並びかえが行なわれる。 上位の候補に、判定している候補と同一自立
語のものがないならばそのまま。 上位の候補に、判定している候補と同一自立
語のものがあるなら判定候補をその上位候補の
後ろにいれる。同一自立語の候補が複数個ある
ならば、その最後の候補の後ろにいれる。 このような操作を施すことにより、メモリ9の
記憶内容は例えば第3表の場合には第4表のよ
うになる。
【表】 表4においては、音響分析の確からしさで並
べかえたもの、は文法分析の確からしさで並べ
かえたもの、はとの組み合わせて並べかえ
たものであり、は本発明の自立語による並べか
えを行なつた場合のメモリ9の記憶内容を示して
いる。 なお、第4表においてアンダーラインは次候補
を選択するときに前の候補から変化する字を示し
ている。このアンダーラインの数から明らかなよ
うにの場合では、正しい「本大会」になるまで
12字が変化するが、の場合、7字ですむ。ま
た、表示をひらかな列で表示した場合、のとき
7字、のとき6字となる。つまり、自立語によ
る並べ換えを行なつた結果、変化する字数が減つ
ていることがわかる。 以上のような処理手順によつて、得られた文節
候補列のなかで、同じ自立語の含まれる候補が続
けて出力されるようになる。 <発明の効果> 以上述べたように、本発明によれば認識結果の
複数の候補を音声認識結果の確からしさを示す確
度情報と、音声認識結果の確からしさ以外の自立
語の長さ、頻度を含む条件にもとずく文法評価値
情報とから得られる総合評価値情報により評価し
て認識結果の出力順序を入れ換えると共に、得ら
れた文節候補列のなかで同じ自立語を有する候補
をまとめるように認識結果の出力順序を決定する
ように成しているため、認識結果を選択する際に
前候補からの変化の字数が少なくなり入力者の目
の疲労が軽減され、かつ音響部、文法部の得点を
加味した順位として認識結果が出力されるため、
オペレータによる候補選択が容易となる。
【図面の簡単な説明】
第1図は本発明の一実施例装置の構成を示すブ
ロツク図、第2図は1文節の処理フローを示す
図、第3図は本発明による1候補列(文節)に対
する文節の分析処理フローを示す図である。 2…単音節認識部、3…標準パターンメモリ、
4…音節ラテイスメモリ、5…候補列作成部、6
…文節候補メモリ、7…文節分析部、8…辞書メ
モリ、9…認識結果メモリ、10…文法評価値算
出用バツフアメモリ、6a…確度情報記憶メモ
リ、9a…文法評価値記憶エリア、9b…総合評
価値記憶エリア。

Claims (1)

  1. 【特許請求の範囲】 1 文節単位に発声された音声を音節単位に認識
    し、該認識された音節候補の組合せにより複数の
    文節候補列を作成し、辞書照合を含む文法処理を
    行なつて文節単位の認識結果を出力する日本語音
    声入力装置において、 認識結果の複数の候補を音声認識結果の確から
    しさを示す確度情報と、音声認識結果の確からし
    さ以外の自立語の長さ、頻度を含む条件にもとず
    く文法評価値情報とから得られる総合評価値情報
    により評価して認識結果の出力順序を入れ換える
    手段と、 上記得られた文節候補列のなかで同じ自立語の
    ものをまとめるように認識結果の出力順序を決定
    する手段と を備え、次候補を選択する際の表示を見やすく
    成したことを特徴とする日本語音声入力装置。
JP59031005A 1984-02-20 1984-02-20 日本語音声入力装置 Granted JPS60175141A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59031005A JPS60175141A (ja) 1984-02-20 1984-02-20 日本語音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59031005A JPS60175141A (ja) 1984-02-20 1984-02-20 日本語音声入力装置

Publications (2)

Publication Number Publication Date
JPS60175141A JPS60175141A (ja) 1985-09-09
JPS6321214B2 true JPS6321214B2 (ja) 1988-05-06

Family

ID=12319446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59031005A Granted JPS60175141A (ja) 1984-02-20 1984-02-20 日本語音声入力装置

Country Status (1)

Country Link
JP (1) JPS60175141A (ja)

Also Published As

Publication number Publication date
JPS60175141A (ja) 1985-09-09

Similar Documents

Publication Publication Date Title
Black et al. Issues in building general letter to sound rules
JP5072415B2 (ja) 音声検索装置
EP1209659B1 (en) Method and apparatus for text input utilizing speech recognition
US20020099543A1 (en) Segmentation technique increasing the active vocabulary of speech recognizers
US9384730B2 (en) Pronunciation accuracy in speech recognition
CN101785050A (zh) 语音识别用对照规则学习系统、语音识别用对照规则学习程序以及语音识别用对照规则学习方法
JP3948260B2 (ja) テキスト入力方法及びその装置
JPS6321214B2 (ja)
JPS59180629A (ja) 日本語音声入力装置
JPS59116837A (ja) 音声入力式日本語文書処理装置
JPS60196869A (ja) 音声入力式日本語文書処理装置
JP5474723B2 (ja) 音声認識装置およびその制御プログラム
Maxwell et al. Training hidden Markov models using populationbased learning
JPS61122781A (ja) 音声ワ−ドプロセツサ
JPH0338699A (ja) 音声認識装置
EP0896320B1 (en) System for sorting prospective speech recognition results, obtained by a language processor, in optimized order
JPH0630052B2 (ja) 音声認識表示装置
JPH04296898A (ja) 音声認識装置
US20060206301A1 (en) Determining the reading of a kanji word
JP3036591B2 (ja) 音声認識装置
JP2001051992A (ja) 日本語統計データ作成装置および方法、並びにディクテーションシステム
JP3369121B2 (ja) 音声認識方法および音声認識装置
JPH04232997A (ja) 音声認識装置における認識結果表示方式
JPH0627985A (ja) 音声認識方法
JPH11344991A (ja) 音声認識装置および記憶媒体