JPS59180629A - 日本語音声入力装置 - Google Patents

日本語音声入力装置

Info

Publication number
JPS59180629A
JPS59180629A JP58058513A JP5851383A JPS59180629A JP S59180629 A JPS59180629 A JP S59180629A JP 58058513 A JP58058513 A JP 58058513A JP 5851383 A JP5851383 A JP 5851383A JP S59180629 A JPS59180629 A JP S59180629A
Authority
JP
Japan
Prior art keywords
stored
memory
candidate
clause
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58058513A
Other languages
English (en)
Other versions
JPS6325366B2 (ja
Inventor
Fumio Togawa
外川 文雄
Mitsuhiro Toya
充宏 斗谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP58058513A priority Critical patent/JPS59180629A/ja
Publication of JPS59180629A publication Critical patent/JPS59180629A/ja
Publication of JPS6325366B2 publication Critical patent/JPS6325366B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 く技術分野〉 本発明は文節単位に発声された音声を音節単位に認識し
、この認識された音節候補の組合せにより複数の文節候
補列を作成し、辞書照合を含む文法゛処理を行なって文
節単位の認識結果を出力する日本゛語音声入力装置の改
良に関するものであり、更に詳細には認識結果の複数の
候補を音声認識結果の確からしさ及び該確からしさ以外
の条件にもとすいて総合評価して認識結果の出力順序を
変更するようにしだ日本語音声入力装置に関するもので
ある。
〈従来技術〉 従来の日本語音声入力装置において、例えば入力音声を
音節単位に認識し、この認識された音節候補の組合せに
より複数の文節候補列を作成し、辞書照合を含む文法処
理を行なって文節単位の認識結果を出力している。そし
てこの時文節の長さと各音節毎の候補数を組合せた数の
文節候補列が作成され、まだ辞書照合の結果も複数の認
識結果が出力される。
この場合、音声認識結果の確からしさの順序で複数の認
識結果を順次出力している0 しかし、従来のこのような方法において、単音節の認識
結果がほとんど誤まりの無い場合、あるいは対象とする
語粟が少ない場合には特に問題は生じないが、現在の音
声認識の技術レベルでは充分に区切った音節でも識別し
にぐい音節があり、また連続的に発声した音声では調音
結合等の影響により識別率が更1fこ低下する。
また辞書に収納された語粟が多くなれば思ってもみない
語が最初に認識結果として出力されることがある。
本発明者等はこのような音響分析での音節認識率(音節
の正解率)が悪い場合に有効となる認識結果の出力順序
の決定方法を先に特願昭57−23221、3号「音−
人力式日本語文書処理装置」として提案した。
この方法は、音声認識結果の確からしき以外の自立語の
長さ、頻度等の条件を考慮に入れて認識結果の出力順令
脚定するようにしだものである。
しかし、本発明者等が先に提案した方法によれば、音響
分析技術の向上に従って、音節認識率が良くなって来る
と、認識結果の出力順序の決定に際して、逆に悪い方向
に働き、最終の文節認識結果の正解率を平均的に落とし
てしまうという問題点が見出されるに至った。
く目的〉 本発明は上記の点に鑑みて成されたものであり、認識結
果の複数の候補を音声認識結果の確からしさを示す確度
情報と、音声認識結果の確からしさ以外の自立語の長さ
、頻度を含む条件にもとず〈文法評価値情報とから得ら
れる総合評価値情報によって評価して認識結果の出力順
序を決定するようにした日本語音声入力装置を提供する
ことを目的としている。
〈実施例〉 以下、本発明を一実施例を挙げて詳細に説明する。
第1図は本発明の音声入力式日本語文書処理装置の一実
施例の構成を示すブロック図である。
第1図において、■は音声入力をビノクア、ノブするマ
イクロホンであり、このマイクロホン1により検出され
た音声は単音節認識部2に入力される。この単音節認識
部2は従来公知のものであり、マイクロホン1を介して
入力された文節単位の音声が音節単位に区分されて単音
節毎の特徴描出が行なわれる。一方メモリ3には各単音
節毎の標準パターンが記憶されており、単音節認識部2
において入力音声の特徴パターンと標準パターンとのマ
ツチング計算処理が行なわれ、このマツチング計算処理
の結果、最も近似したものが第1候補として、また順次
近似したものが次候補として選出され、その結果が近似
度(確からしさ)を示す距離差情報と共((メモ+)4
に音節ラティスとして記憶される。
上記単音節認識部2において認識され、音節ラティスと
してメモリ4に記憶された内容は候補列作成部5に入力
されて近似度(確からしさ)を示す距離差情報を用いて
確度の高い順に文節候補(かな文字列)が作成されて文
節候補メモ、す6に記憶される。なおメモリ6において
領域6aは文節候補の確からしさを示す確度情報の記憶
領域、領−第6bは後述する評価内容を記憶する評価レ
ジスタ領域である。
上記候補列作成部5において作成され、メモリ6内に記
憶された複数の候補列は順次文節分析部7に入力されて
文法的な分析が行なわれると共に分析に必要な文法情報
及び見出し語辞書、接辞語辞書等を含む辞書メモリ8の
内容と照合され、一致したものが認識結果メモリ9に文
節(単語)の漢字候補情報として記憶される。更に文節
分析部7は後述するようにメモリ9に記憶される文節(
漢字)候補の構成要素を分析して文法評価値を算出し、
仮名漢字変換処理における同音語の最高評価値を得た漢
字候補が認識結果メモリ9に記憶され、ま、たメモリエ
リア9aにその候補に対する文法評価値が記憶される。
また上記メモリ領域6aに記憶されている確度情報Yと
メモリエリア9aに記憶された文法評価値′情報Xにも
とすいて算出された各候・補の総合評価値Zがメモリエ
リア9bに記憶され、この総合評価値Zを用いて文節候
補のソートが行なわれて、認識結果の出力順序が決定さ
れるように構成されている。
なお10は評価点算出のために用いられるバッフ7であ
り、メモリ領域A、B、C,ST、SB、X。
を有している。また11け認識結果等を表示する表示装
置、12はかなキー、ファンクションキー等を有する入
力装置、13け上記各装置を制御するコントローラ(C
PU)である。
次に上記の如く構成された装置の動作を第2図に示す1
文節の処理フローに従って説明する。
文節単位に発声された音声はマイクロホン1によって検
出されて単音節認識部2によシ、音響分析によって単音
節単位に認識され(no−n3)、その認識結果が音節
ラティスメモリ4に入力記憶される。
例えば入力音声「/こ//(/lみ//7v//の/」
(「国民の」)に対する単音節認識結果として第1表に
示すような音節ラティスが形成される。
なお、上記第1表において音節ラティスのに)内に示し
た数字は第1位の認識結果を10とした時の2位以下の
確度を表わしている。
上記のように音節ラティスには音節番号と音節確度(確
からしさ)情報が書かれることになる。
ここで音節の確からしさを表わす音節確度は次のように
して算出される。
即ち、単音節認識部2で入力音節の特徴パターンとメモ
リ3に記憶されている複数の標準パターンとの間でパタ
ーンマツチングが行なわれ、パターンマツチングの結果
として、各標準パターンとのマツチング距離を得る。こ
のマツチング距離の小さい順に並べて、上位数個を音節
候補とする。
第2表に音節候補のマツチング距離をに)内の数値で示
す。第」表に示しだ音節確度は、第1位のマツチング距
離で各位のマツチング距離を除して正規化したものであ
る。
上記単音節認識部2において認識され、音節ラティスと
してメモリ4に記憶され。た音節単位の各候補は候補列
作成部5に入力される。
候補列作成部5は音節ラティスメモ+)4に記憶された
音節単位の認識結果を用いて、最初に上首Cメモリ4に
記憶された1位の認識結果ばかりを並べて候補列を作成
して文節候補メモリ6に記憶し、次に順次2位以下の認
識結果を組合せて確度の総和(候補列の確度)の小さい
順に候補列(文節候補)を作成してメモリ6に記憶する
。またこの時各文節候補に対する確度情報Yがメモリエ
リア6aに記憶される(n4)。上記第4表に示した例
では36個の候補列が第3表の如く作成されてメモリ6
に記憶される。
第3表 次妬メモリ6に記憶された候補列は順次文節分析部7に
入力さ九、文節の分析が行なわれる(n5)。
即ち文節分析部7では入力される候補列を辞書メモリ8
の内容との照合を含む文法分析を次のように実行する。
候補列→(接頭語)十自立語+(接尾語)」−(活用語
尾)」−(付属語列) ただしくニ)内の要素は無くても良い。
ステップn5におじで行なわれる文節の文法分析処理フ
ローは第3図に詳細に示されており、文節分析部7はま
ず入力された候補列と辞書メモリ8の記憶内容との照合
を行なって仮名漢字変換処理を実行する(n20.n2
1)。
この時変換でき々かった場合には入力された候補列が文
節として不可能なかな配列と判定して、メモリエリア6
bのその候補列に対応した位置(評価レジスタ)にrO
Jを入れて、文節分析結果(評価)「×」の決定を行う
(ステップn 22.23.24 )(。
一方、仮名漢字変換処理動作(n21)の結果、変換が
可能であった場合には、評価レジスタエリア6bの対応
位置(評価レジスタ)を「1」にセットして(n25)
、照合の結果一致したことを示す判定情報を記憶すると
共にステップn26以後の文法評価値算出動作に移行す
る。
即ち、本発明実施例において各文節候補についてn20
”rr25の動作を実行することにより上記第3表の評
価欄に示したように「○」を付加した6個の候補列が文
節として可能であることが分析される。
また、本発明実施例においては文節々して可能々候補列
についてステ、プn26以後において文節の構成要素に
おいて重み付けを行なって出力順序付けを行なっている
がその一例を以下に示す。
文節として可能な候補列に対する文法評価値は上記した
文節の要素の接頭語、自立語、接尾語の各々に対して次
の3点において点数を与え、各要素ごとに重みをかけて
加算した点数の合計として算出される。
■ 語長 ■ 頻度 ■ 直前の数百文節での使用の有無 法に各項目に対する文法評価値の算出動作を説明する。
(D  自立語に対する評価値(n26〜n31)自立
語長は、その自立語の活用語尾の長さも含めた長さとす
る。例えば「歩いた」では、「歩Jが自立語の語幹であ
シ、「い」が活用語尾であり、「だ」が付属語となる。
従って自立語長は3となり、この自立語の長さはAレジ
スタに記憶される(n26)。
自立語に対する頻度情報は3ランクに分け、少ないもの
から0.1.2の値が与えられて例えば辞書メモリ8に
記憶されており、この辞書メモリ8よシ所望の頻度情報
が取出されてBレジスタに記憶される( n 27 )
次にステップn28に移行して直前の数十文節で使用さ
れているか否かが判定され、使用されていればil」、
使用されていなければ「0」がCレジスタに記憶される
( n29.30)。
次にステップn31に移行して自立語の評価値Jが次式 %式% に従って算出され、その結果がJレジスタに記憶される
なお、自立語の場合には、一度用いたものを再度用いる
確率が高いため、使用の有無の情報Cに重みをかけてい
る。
(11)接頭語、接尾語に対する評価値(n32〜n4
7)接頭語はその文字数(拗音は除く)を2倍したもの
を用いる。ただし、文字数が0(接頭語がない時)の時
にば「4」を与える(n33)0また頻度は2ランクに
分けられており、少ないものをrOJ、多いものをrl
Jとしている。
更に使用の有無は無い時には「0」、有の時には「1」
を与えて−る。
接頭語長ばAレジスタに記憶され(n34)、頻度情報
//iBレジスタに記憶され(n35)、使用の有無情
報はCレジスタに記憶され(n37.38)、その後ス
テップn39に移行して接頭語の評価値STが次式 %式% に従って計算され、その結果がSTレジスタに記憶され
る。
接尾語の場合には接頭語と同様の動作がステソゲn40
〜n47において実行され、その結果がSBレジスタに
記憶される。
次にステップn48に移行して1文節全体の評価値Xが
次式 %式% に従って計算され、その結果がXレジスタに記憶される
次にステソゲn49に移行してXレジスタの値が評価値
レジスタ(メモリエリア9a)の値よシ大きいか否かが
判定され、Xレジスタの値が評価値レジスタの値より大
きい場合には評価値レジスタ(メモリエリア9a)にX
レジスタの内容を記憶すると共に、ステプ゛−プn21
,1122において変換された漢字候補をその文法評価
値と共にメモリ9に記憶する(n50)。
一方n49においてXレジスタの値が評価値レジスタの
値より大きくない場合にはステップn50を飛び越して
ステップn、51に移行する。
ステップn51においては次の同音語の候補があるか否
かが判定され、同音語の候補があればステップn26以
降に戻って新たな同音語候補に対する文法評価値の計算
が行なわれる。
また同音語の候補が々ければステップn52に移行して
1候補列に対する文節の分析動作が終了する( n 5
 + n 6 )。
このような動作により1候補列に対する漢字候補がその
文法評価値と共に認識結果メモリ9に記憶され、また1
候補列に対して同音語(複数の漢字候補)が存在する場
合には評価点の最も大きい漢字候補がメモリ9に記憶さ
れることになる。
第3表に示しだ例においては 「ごふにんの」→「ご赴任の」 「ごふみんの」→「ご不眠の」 「おふにんの」→「お赴任の」 「こくみんのJ→「国民の」 「おふみんの」→「お不眠の」 の漢字候補が得られる。また接頭語「ご」に関しては頻
度が高いため 5T=2+1+O=3 とし、「赴任」は頻度1.「国民」及び「贈り物」は頻
度2.「不眠」け頻度0とした場合、各文節を評価する
と、 「ご赴任のJ:(接頭)(自立語・・・3文字)(付属
語) X=3+16X(3+1十〇)+4=71「ご不眠の」
:(接頭)(自立語・・・3文字)(付属語) X=3+16X(3十〇十〇)+4=55「お赴任の」
;(接頭〕(自立語、・・3文字)(付属語) X=3+16X(’3+1十0)+4=71「国民の」
:(自立語・・4文字)(付属語)X=4+16(4,
+2十〇)+4=104「お不眠の」:(接頭)(自立
語・3文字)(付属語) X−=3+16x(3+O+0)+4=55「贈り物J
:(自立語・・5文字) X=4+16X(5+2)+4=120となり「贈り物
」が最高の文法評価値となる。
次にステップn8(第2図)において各文節認識結果の
総合評価値が の式に従って算出され、その結果がメモリエリア9bに
記憶される。
このステップにおいて例えば「国民の」の総合評価値が となり、最高の総合評価値となる。
従ってステップn9(第2図)において文節認識結果を
ソートすることによりメモリ9の記憶内容は第4表の■
の如くなる。
このような一連の動作により漢字候補「国民の」が第1
位の認識候補となりステップnloに移行して、その第
1位の認R候補「国民の」が最初に出力されることにな
る。
第4表 なお、第4表においてIの欄は音響分析から得られる確
度(確からしさ)情報によってソートした場合、■の欄
は本発明者等が先に提案した文法分析から得られる文法
評価値によってノートした場合のメモリ9の記憶内容を
示している。
上記の第4表に示した例からも明らかなように入力音声
に対応した正しい文節「国民の」は■では第4位、■で
は第′2位であるのに対し、本発明による■では第1位
に出力されるようになり、本発明が最も良い結果になっ
ていることが判る。
以上のような処理手順により、音声認識の確度に従った
認識結果の出力順、あるいは文法分析による文法評価値
に従った認識結果の出力順に比べて、認識結果の正解率
の高いものが先に出力されるようKなる。
く効果〉 以上述べたよう傾、本発明によれば認識結果の複数の候
補を音声認識結果の確からしさを示す確度情報と、音声
認識結果の確からしさ以外の自立語の長さ、頻度を含む
条件にもとすく文法評価値情報とから得られる総合評価
値情報により評価して認識結果の出力順序を決定するよ
うに成しているため、妥当性の高い文節から順次出力さ
れることになシ、認識結果の正解率が向上すると共に、
候補選択が容易となる。
【図面の簡単な説明】
第1図は本発明の一実施例装置の構成を示すブロック図
、第2図は1文節の処理フローを示す図、第3図は本発
明による1候補列(文節)に対する文節の分析処理フロ
ーを示す図である。 2・・・単W節認識部、3・・・標準パターンメモリ、
4・音節シティスメモリミ5・・・候補列作成部、6・
・文節候補メモリ、7・・・文節分析部、8・・・辞書
メモリ、9・・認識結果メモリ、10・・・文法評価値
算出用バッファメモリ、6a・・・確度情報記憶メモリ
、9a・・文法評価値記憶エリア、9b ・総合評価値
記憶エリア。

Claims (1)

  1. 【特許請求の範囲】 1、文節単位に発声された音声を音節単位に認識し、該
    認識された音節候補の組合せKより複数の文節候補列を
    作成し、辞書照合を含む文法処理を行なって文節単位の
    認識結果を出力する日本語音声入力装置において、 認識結果の複数の候補を音声認識結果の確からしさを示
    す確度情報と、音声認識結果の確からしさ以外の自立語
    の長さ、頻度を含む条件にもとず〈文法評価値情報とか
    ら得られる総合評価値情報により評価して認識結果の出
    力順序を決定する手段を備えたことを特徴とする日本語
    音声入力装置。
JP58058513A 1983-03-30 1983-03-30 日本語音声入力装置 Granted JPS59180629A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58058513A JPS59180629A (ja) 1983-03-30 1983-03-30 日本語音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58058513A JPS59180629A (ja) 1983-03-30 1983-03-30 日本語音声入力装置

Publications (2)

Publication Number Publication Date
JPS59180629A true JPS59180629A (ja) 1984-10-13
JPS6325366B2 JPS6325366B2 (ja) 1988-05-25

Family

ID=13086505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58058513A Granted JPS59180629A (ja) 1983-03-30 1983-03-30 日本語音声入力装置

Country Status (1)

Country Link
JP (1) JPS59180629A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61184683A (ja) * 1985-02-12 1986-08-18 Nec Corp 認識結果選択方式
JPS627095A (ja) * 1985-07-03 1987-01-14 株式会社日立製作所 音声認識装置
JPS62113264A (ja) * 1985-11-12 1987-05-25 Toshiba Corp 音声文書作成装置
JPS6470865A (en) * 1987-09-11 1989-03-16 Brother Ind Ltd Language processor based upon voice input

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61184683A (ja) * 1985-02-12 1986-08-18 Nec Corp 認識結果選択方式
JPS627095A (ja) * 1985-07-03 1987-01-14 株式会社日立製作所 音声認識装置
JPS62113264A (ja) * 1985-11-12 1987-05-25 Toshiba Corp 音声文書作成装置
JPS6470865A (en) * 1987-09-11 1989-03-16 Brother Ind Ltd Language processor based upon voice input

Also Published As

Publication number Publication date
JPS6325366B2 (ja) 1988-05-25

Similar Documents

Publication Publication Date Title
US6738741B2 (en) Segmentation technique increasing the active vocabulary of speech recognizers
KR20010096490A (ko) 이동통신을 위한 철자 음성인식장치 및 방법
CN111145718A (zh) 一种基于自注意力机制的中文普通话字音转换方法
JPS61177493A (ja) 音声認識方法
JPS59180629A (ja) 日本語音声入力装置
Graves et al. Hierarchical subsampling networks
JP2002278579A (ja) 音声データ検索装置
JPH049320B2 (ja)
JPS61122781A (ja) 音声ワ−ドプロセツサ
JPS60196869A (ja) 音声入力式日本語文書処理装置
JPS6321214B2 (ja)
JPH0338699A (ja) 音声認識装置
JP3708747B2 (ja) 音声認識方法
JP2647234B2 (ja) 音声認識装置
JP2979912B2 (ja) 音声認識装置
JPH04296898A (ja) 音声認識装置
JPH04115383A (ja) オンライン手書き文字認識装置の文字認識方式
JPS62134698A (ja) 多数単語の音声入力方式
JPH04232997A (ja) 音声認識装置における認識結果表示方式
JPH04291399A (ja) 音声認識方法
JP3293191B2 (ja) 音声認識装置
JPH0222730A (ja) 音声入力による文書作成装置
JPH11344991A (ja) 音声認識装置および記憶媒体
JPH0574837B2 (ja)
JPS58195955A (ja) 音声入力式日本語文書処理装置