JPS60175141A - 日本語音声入力装置 - Google Patents

日本語音声入力装置

Info

Publication number
JPS60175141A
JPS60175141A JP59031005A JP3100584A JPS60175141A JP S60175141 A JPS60175141 A JP S60175141A JP 59031005 A JP59031005 A JP 59031005A JP 3100584 A JP3100584 A JP 3100584A JP S60175141 A JPS60175141 A JP S60175141A
Authority
JP
Japan
Prior art keywords
candidate
stored
memory
clause
recognition results
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59031005A
Other languages
English (en)
Other versions
JPS6321214B2 (ja
Inventor
Toru Ueda
徹 上田
Mitsuhiro Toya
充宏 斗谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP59031005A priority Critical patent/JPS60175141A/ja
Publication of JPS60175141A publication Critical patent/JPS60175141A/ja
Publication of JPS6321214B2 publication Critical patent/JPS6321214B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈発明の技術分野〉 本発明は文節単位に発声された音声を音節単位に認識し
、この認識された音節候補の組合せにより複数の文節候
補列を作成し、辞書照合を含む文法処理を行なって文節
単位の認識結果を出力する日本語音声入力装置の改良に
関するものであり、更に詳細には認識結果の複数の候補
を音声認識結果の確からしさ及び該確からしさ以外の条
件にもとすいて総合評価して認識結果の出力順序を変更
するようにした日本語音声入力装置に関するものである
〈発明の技術的背景とその問題点〉 従来の日本語音声入力装置におりて、例えば入力音声を
音節単位に認識し、この認識された音節候補の組合せK
より複数の文節候補列を作成し、辞書照合を含む文法処
理を行なって文節単位の認識結果を出力している。そし
てこの時文節の長さと各音節毎の候補数を組合せた数の
文節候補列が作成され、また辞書照合の結果も複数の認
識結果が出力される。
この場合、音声認識結果の確からしさの順序で複数の認
識結果を順次出力している。
しかし、従来のこのような方法において、単音節の認識
結果がほとんど誤まりの無い場合、あるいは対象とする
語粂が少ない場合には特に問題は生じないか、現在の音
声認識の技術レベルヤは充分に区切った音節でも識別し
にく−音節があり、また連続的に発声した音声では調音
結合等の影響により識別率が更に低下する。
また辞書に収納された語朶か多くなれば思ってもみない
語が最初に認識結果として出力されることがある。
本出願人はこのような従来の問題点を解決するため、先
に特願昭58−58513号「音声入力(音節認識結果
の確からしさ以外の自立語の長さ、頻度を含む条件にも
とすく文法評価値情報)とか、ら得られる総合評価値情
報によって評価して認識結果の出力順序を決定するよう
にしたものである。
しかし、本出願人が先に提案した音声入力式日本語文書
処理装置において、その出力結果をCRT等の表示装置
によって人間が確認しなければならない場合、先忙本出
願人が提案した出力方法では文節の表示全体が書き換わ
ってしまう場合が多く、非常に目か疲れやすい問題点が
あることが判明した。
〈発明の目的〉 本発明は上記の点に鑑みて成されたものであり、同一自
立語の候補を続けて出力することによって表示の書き換
わる部分を少なくし、使用者の疲労度を軽減せしめるよ
うにした日本語音声入力装置を提供することを目的とし
、この目的を達成するため、本発明の日本語音声入力装
置は、認識結果の複数の候補を音声認識結果の確からし
さを示す確度情報と、音声認識結果の確からしさ以外の
自立語の長さ、頻度を含む条件にもとすく文法評価値情
報とから得られる総合評価値情報により評価ミ朝認識結
果の出力順序を入れ換える手段と、得られた文節候補列
のなかで同じ自立語のものをまとめるように認識結果の
出力順序を決定する手段とを備えて次候補を選択する際
の表示を見やすくするように構成されている。
〈発明の実施例〉 以下、図面を参照して本発明の一実施例を詳細に説明す
る。
第1図は本発明の音声入力式日本語文書処理装置の一実
施例の構成を示すブロック図である。
第1図において、lは音声入力をピックアップするマイ
クロホンであり、このマイクロホンlにより検出された
音声は単音節認識部2に入力される。この単音節認識部
2は従来公知のものであり、マイクロホンlを介して入
力された文節単位の音声が音節単位に区分されて単音節
毎の特徴描出が行なわれる。一方メモリ3には各単音節
毎の標準パターンが記憶されており、単音節認識部2に
おいて入力音声の特徴パターンと標準パターンとのマツ
チング計算処理が行なわれ、このマツチング計算処理の
結果、#Ik近似したものが第1候補として、また順次
近似したものか次候補として選出され、その結果が近似
度(確からしさ)を示す距離差情報と共にメモリ4に音
節ラティスとして記憶される。
上記単音節認識部2において認識され、音節ラティスと
してメモリ4に記憶された内容は候補列作成部5に入力
されて近似度(確からしさ)を示す距離差情報を用−て
確度の高い順に文節候補(かな文字列)が作成されて文
節候補メモリ6に記憶される。なお、メモリ6において
領域6aは文節候補の確からしさを示す確度情報の記憶
領域、領域6bは後述する評価内容を記憶する評価レジ
スフ領域である。
上記候補列作成部5において作成され、メモリ6内に記
憶された複数の候補列は順次文節分析部7に入力されて
文法的な分析が行なわれると共に分析に必要な文法情報
及び見出し語辞書、接辞語辞書等を含む辞書メモリ8の
内容と照合され、一致したものが認識結果メモリ9に文
節(単M)の漢字候補情報として記憶される。更に文節
分析部7は後述するようにメモリ9に記憶される文節(
漢字)候補の構成要素を分析して文法評価値を算出し、
仮名漢字変換処理における同音語の最高評価値を得た漢
字候補が認識結果メモリ9に記憶され、またメモリエリ
ア9aにその候補に対する文法評価値か記憶される。
また上記メモリ領域6aに記憶されている確度情報Yと
メモリエリア9aに記憶された文法評価値情報Xにもと
すいて算出された各候補の総合評価値Zがメモリエリア
9bに記憶され、この総合評価値Zを用いて文節候補の
ソートが行なわれ、更に得られた文節候補のなかで、同
じ自立語のものをまとめるようにソートが行なわれて、
認識結果の出力順序が決定されるように構成されている
なおIOは評価点算出のために用いられるバッファであ
り、メモリ領域A、B、C,ST、SB。
X、を有している。また11は認識結果等を表示する表
示装置、12はかなキー、ファンクションキー等を有す
る入力装置、13は上記各装置を制御スるコントローラ
(CPU)である。
次に上記の如く構成された装置の動作を第2図に示す1
文節の処理フローに従って説明する。
文節単位に発声された音声はマイクロホン1によって検
出されて単音節認識部2により、音響分析によって単音
節単位に認識され(nO〜n3 )、その認識結果が音
節ラティスメモリ4に入力記憶される。
例えば入力音声「/は//ん//た//い//か//い
/」(「本大会」)に対する単音節認識結果として第1
表に示すような音節ラティスが形成される。
なお、上記@1表において音節ラティスの0内に示した
数字は第1位の認識結果を1.0とした時の2位以下の
確度を表わしている。
上記のように音節ラティスには音節番号と音節確度(確
からしさ)情報が書かれることになる。
ここで音節の確からしさを表わす音節確度は次のように
して算出される。
即ち、単音節認識部2で入力音節の特徴パターンとメモ
リ3に記憶されている複数の標準パターンとの間でパタ
ーンマツチングが行なわれ、パターンマツチングの結果
として、各標準パターンとのマツチング距離を得る。こ
のマツチング距離の小さい順に並べて、上位数個を音節
候補とする。
第2表に音節候補のマツチング距離を0内の数値で示す
。第1表に示した音節確度は、@1位のマツ、チング距
離で各位のマツチング距離を除して正規化したものであ
る。
上記単音節認識部2において認識され、音節ラティスと
してメモリ4に記憶された音節単位の各候補は候補列作
成部5に入力される。
候補列作成部5は音節ラティスメモリ4に記憶された音
節単位の認識結果を用いて、最初に上記メモリ4に記憶
された1位の認識結果ばかりを並べて候補列を作成して
文節候補メモリ6に記憶し、次に順次2位以下の認識結
果を組合せて確度の総和(候補列の確度)の小さい順に
候補列(文節候補)を作成してメモリ6に記憶する。ま
たこの時各文節候補に対する確度情報Yがメモリエリア
6aに記憶される(n4)。上記第1表に示した例では
86個の候補列が第3表の如く作成されてメモリ6に記
憶される。
−1−匹−1表 次にメモリ6/C記憶された候補列は順次文節分析部7
に入力され、文節の分析か行なわれる(n5)。
即ち文節分析部7では入力される候補列を辞書メモリ8
の内容との照合を含む文法分析を次のように実行する。
候補列−(接頭語)十自立語+(接尾M)+(活用語尾
)+(付属語列) ただし0内の要素は無くても良い。
ステップn5において行なわれる文節の文法分析処理フ
ローは第3図に詳細に示されており、文節分析部7はま
ず入力された候補列と辞書メモリ8の記憶内容との照合
を行なって仮名漢字変換処理を実行する( n20.n
21)。この時変換できなかった場合には入力された候
補列が文節として不可能なかな配列と判定して、メモリ
エリア6bのその候補列に対応した位置(評価レジスタ
)に「0」を入れて、文節分析結果(評価〕「×」の決
定を行う(ステップn22.28.24 )。
一方、仮名漢字変換処理動作(n21)の結果、変換が
可能であった場合には、評価レジスタエリア6bの対応
位置(評価レジスタ)を「1」にセットして(n25 
)、照合の結果一致したことを示す判定情報を記憶する
と共にステップn26以後の文法評価値算出動作に移行
する。
即ち、本発明実施例において各文節候補についてn20
〜n25 の動作を実行することにより上記第3表の評
価欄に示したように「○」を付加した6個の候補列力;
文節として可能であることか分析される。
また、本発明実施例においては文節として可能な候補列
についてステップn26以後において文節の構成要素に
おいて重み付けを行なって出力順序付けを行なっている
がその一例を以下に示す。
文節として可能な候補列に対する文法評価値は上記した
文節の要素の接頭語、自立語、接尾語の各々に対して次
の3点において点数を与え、各要素ごとに重みをかけて
加算した点数の合計として算出される。
■ 語長 ■ 頻度 ■ 直前の数百文節での使用の有無 法に各項目に対する文法評価値の算出動作を説明する。
(D 自立語に対する評価値(n26〜n31)自立語
長は、その自立語の活用語尾の長さも含めた長さとする
。例えば「歩すた」では、「歩」が自立語の語幹であり
、「い」か活用語尾であり、「た」が付属語となる。従
って自立語長は3となり、この自立語の長さはAレジス
タに記憶される(n26 )。
自立語に対する頻度情報は3ランクに分け、少ないもの
から0.1.2の値が与えられて例えば辞書メモリ8に
記憶されており、この辞書メモリ8より所望の頻度情報
か取出されてBレジスタに記憶される( n27 )。
次にステップn28に移行して直前の数十文節で使用さ
れているか否がか判定され、使用されていれば、rlJ
、使用されていなければ「0」かCレジスタに記憶され
る( n29,80 )。
次にステップnaI K移行して自立語の評価値Jが次
式 J=A+B+40 に従って算出され、その結果がJレジスタに記憶される
なお、自立語の場合には、一度用いたものを再度用いる
確率が高いため、使用の有無の情報Cに重みをかけてい
る。
■ 接頭語、接尾語に対する評価値(n32〜n47)
接頭語はその文字数(拗音は除く)を2倍したものを用
いる。ただし、文字数か0(接頭語がない時)の時には
「4」を与える(n8B)。
また頻度は2ランクに分けられており、少ないものを1
−0」、多いものをrlJとしている。
更に使用の有無は無い時には「0」、有の時にはrlJ
を与えている。
接頭語長はAレジスタに記憶され(n84 )、頻度情
報はBレジスタに記憶され(n35L使用の有無情報は
Cレジスタに記憶され(n87゜38)、その後ステッ
プn39 に移行して接頭語の評価値STが次式 %式% に従って計算され、その結果がSTレジスクに記憶され
る。
接尾語の場合には接頭語と同様の動作がステップn40
〜n47 において実行され、その結果がSBレジスタ
に記憶される。
次にステップn4g に移行して1文節全体の評価値X
か次式 %式% に従って計算され、その結果かXレジスタに記憶される
次にステップn49 に移行してXレジスタの値が評価
値レジスタ(メモリエリア9a)の値より大きいか否か
が判定され、Xレジスタの値か評価値レジスタの値より
大きい場合には評価値レジスタ(メモリエリア9a)に
Xレジスタの内容を記憶すると共に、ステップn21.
 n22において変換された漢字候補をその文法評価値
と共にメモリ9に記憶する(n50 )。
一方n49 においてXレジスタの値が評価値レジスタ
の値より大多くない場合にはステップn50 を飛び越
してステップn51 に移行する。
ステップn51 においては次の同音語の候補があるか
否かが判定され、同音語の候補かあればステップn26
 以降に戻って新たな同音語候補に対する文法評価値の
計算が行なわれる。
また同音語の候補がなければステップn52に移行して
1候補列に対する文節の分析動作か終了する( n5.
 n6)。
このような動作により1候補列に対する漢字候補がその
文法評価値と共に認識結果メモリ9に記憶され、また1
候補列に対して同音語(複数の漢字候補)が存在する場
合には評価点の最も大きい漢字候補がメモリ9に記憶さ
れることになる。
第3表に示した例(でおいては 「こんたいがい」−「今対外」 「こんたいかい」−「今大会」 「おんたいがい」−「御対外」 「おんたいかい」=「御大会」 「はんたいがい」−「本対外」 「はんたいかい」=「本大会」 の漢字列が得られる。また自立語「対外」と「大会」、
および接頭語「今」、1本」、「御」の頻度を一様Kl
とした場合の各文節の評価は、すべて X=4+16X(4+1+0)+4=88となる。
次にステップn8(第2図)において各文節認識結果の
総合評価値が の式に従って算出され、その結果かメモリエリア9bに
記憶される。
次にステップn9(@2図)において文節認識結果をソ
ートすることによりメモリ9の記憶内容は第4表の■の
如くなる。
次にステップnlOK移行して族明の特徴である同一自
立語の候補をまとめる操作が行なわれる。
これは評価値の大きい候補から順に、その候補より−f
位に同一自立語を持つ候補があるかどうかを判定し、そ
れによって候補順位を入れ換えるものであり、次の処理
ステップにより自立語による候補の出力順序の並びかえ
か行なわれる。
■ 上位の候補に、判定している候補と同一自立語のも
のがないならばそのまま。
■ 上位の候補に、判定している候補と同一自立語のも
のがあるなら判定候補をその上位候補の後ろにいれる。
同一自立語の候補が複数個あるならば、その最後の候補
の後ろにいれる。
このような操作を施すことにより、メモリ9の記憶内容
は例えば@3表の場合には@4表+Vのようになる。
表4においてIは、音響分析の確からしさて並べかえた
もの、■は文法分析の確からしさて並べかえたもの、■
は■とHの組み合わせで並べかえたものであり、■は本
発明の自立語による並べかえを行なった場合のメモリ9
の記憶内容を示している。
なお、第4表においてアンダーラインは次候補を選択す
るときに前の候補から変化する字を示している。このア
ンダーラインの数から明らかなように■の場合では、正
しい「本大会」に々るまで12字が変化するか、■の場
合、7字ですむ。また、表示をひらかな列で表示した場
合、IIのとき7字、■のとき6字となる。つまり、自
立語による並べ換えを行なった結果、変化する字数が減
っていることかわかる。
以上のような処理手順によって、得られた文節候補列の
なかで、同じ自立語の含まれる候補が続けて出力される
ようになる。
〈発明の効果〉 以上述べたように、本発明によれば認識結果の複数の候
補を音声認識結果の確からしさを示す確度情報と、音声
認識結果の確からしさ以外の自立語の長さ、頻度を含む
条件にもとすく文法評価値情報とから得られる総合評価
値情報により評価して認識結果の出力順序を入れ換える
と共に、得られた文節候補列のなかで同じ自立語を有す
る候補をまとめるように認識結果の出力順序を決定する
ように成しているため、認識結果を選択する際に前候補
からの変化の字数が少なくなり入力者の目の疲労か軽減
され、かつ音響部、文法部の得点を加味した順位として
認識結果か出力されるため、オペレータによる候補選択
か容易となる。
【図面の簡単な説明】
第1図は本発明の一実施例装置の構成を示すブロック図
、第2図は1文節の処理フローを示す図、第3図は本発
明による1候補列(文節)に対する文節の分析処理フロ
ーを示す図である。 2・・・単音節認識部、 3・・・標準パターンメモリ
、4・・・音節ラティスメモリ、 5・・・候補列作成
部、6・・・文節候補メモリ、7・・・文節分析部、 
8・・・辞書メモリ、 9・・・認識結果メモリ、IO
・・・文法評価値算出用バッフ7メモリ、6a・・・確
度情報記憶メモリ、 9a・・・文法評価値記憶エリア
、9b・・・総合評価値記憶エリア。 代理人 弁理士 福 士 愛 彦(他2名)第1図 第2図

Claims (1)

  1. 【特許請求の範囲】 1 文節単位如発声された音声を音節単位に認識し、該
    認識された音節候補の組合せにより複数の文節候補列を
    作成し、辞書照合を含む文法処理を行なって文節単位の
    認識結果を出力する日本語音声入力装置において、 認識結果の複数の候補を音声認識結果の確からしさを示
    す確度情報と、音声認識結果の確からしさ以外の自立語
    の長さ、頻度を含む条件にもとすく文法評価値情報とか
    ら得られる総合評価値情報により評価して認識結果の出
    方順序を入れ換える手段と、 上記得られた文節候補列のなかで同じ自立語のものをま
    とめるように認識結果の出力順序を決定する手段と を備え、次候補を選択する際の表示を見やすく成したこ
    とを特徴とする日本語音声入力装置。
JP59031005A 1984-02-20 1984-02-20 日本語音声入力装置 Granted JPS60175141A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59031005A JPS60175141A (ja) 1984-02-20 1984-02-20 日本語音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59031005A JPS60175141A (ja) 1984-02-20 1984-02-20 日本語音声入力装置

Publications (2)

Publication Number Publication Date
JPS60175141A true JPS60175141A (ja) 1985-09-09
JPS6321214B2 JPS6321214B2 (ja) 1988-05-06

Family

ID=12319446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59031005A Granted JPS60175141A (ja) 1984-02-20 1984-02-20 日本語音声入力装置

Country Status (1)

Country Link
JP (1) JPS60175141A (ja)

Also Published As

Publication number Publication date
JPS6321214B2 (ja) 1988-05-06

Similar Documents

Publication Publication Date Title
Black et al. Issues in building general letter to sound rules
US5467407A (en) Method and apparatus for recognizing cursive writing from sequential input information
KR19990078364A (ko) 문서처리장치 및 그의 방법
EP1209659B1 (en) Method and apparatus for text input utilizing speech recognition
JPS60175141A (ja) 日本語音声入力装置
JPS59180629A (ja) 日本語音声入力装置
JPS59116837A (ja) 音声入力式日本語文書処理装置
JPH0338699A (ja) 音声認識装置
JP3803253B2 (ja) 漢字入力のための方法および装置
JPS61208162A (ja) かな漢字変換方式
JPS60196869A (ja) 音声入力式日本語文書処理装置
JP2647234B2 (ja) 音声認識装置
JPS61184683A (ja) 認識結果選択方式
JP2001051992A (ja) 日本語統計データ作成装置および方法、並びにディクテーションシステム
JPH04232997A (ja) 音声認識装置における認識結果表示方式
JPH04296898A (ja) 音声認識装置
JP4797307B2 (ja) 音声認識装置及び音声認識方法
JPH0630052B2 (ja) 音声認識表示装置
JPH0740262B2 (ja) カナ漢字変換装置
JPS61125676A (ja) 音声ワ−ドプロセツサ
JPH03221999A (ja) 音声認識装置
JPS60205594A (ja) 認識結果表示方式
JPH01229366A (ja) 文字処理装置
JPH0574837B2 (ja)
JPH02298997A (ja) 音声認識装置