JPS59180629A - 日本語音声入力装置 - Google Patents
日本語音声入力装置Info
- Publication number
- JPS59180629A JPS59180629A JP58058513A JP5851383A JPS59180629A JP S59180629 A JPS59180629 A JP S59180629A JP 58058513 A JP58058513 A JP 58058513A JP 5851383 A JP5851383 A JP 5851383A JP S59180629 A JPS59180629 A JP S59180629A
- Authority
- JP
- Japan
- Prior art keywords
- stored
- memory
- candidate
- clause
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
く技術分野〉
本発明は文節単位に発声された音声を音節単位に認識し
、この認識された音節候補の組合せにより複数の文節候
補列を作成し、辞書照合を含む文法゛処理を行なって文
節単位の認識結果を出力する日本゛語音声入力装置の改
良に関するものであり、更に詳細には認識結果の複数の
候補を音声認識結果の確からしさ及び該確からしさ以外
の条件にもとすいて総合評価して認識結果の出力順序を
変更するようにしだ日本語音声入力装置に関するもので
ある。
、この認識された音節候補の組合せにより複数の文節候
補列を作成し、辞書照合を含む文法゛処理を行なって文
節単位の認識結果を出力する日本゛語音声入力装置の改
良に関するものであり、更に詳細には認識結果の複数の
候補を音声認識結果の確からしさ及び該確からしさ以外
の条件にもとすいて総合評価して認識結果の出力順序を
変更するようにしだ日本語音声入力装置に関するもので
ある。
〈従来技術〉
従来の日本語音声入力装置において、例えば入力音声を
音節単位に認識し、この認識された音節候補の組合せに
より複数の文節候補列を作成し、辞書照合を含む文法処
理を行なって文節単位の認識結果を出力している。そし
てこの時文節の長さと各音節毎の候補数を組合せた数の
文節候補列が作成され、まだ辞書照合の結果も複数の認
識結果が出力される。
音節単位に認識し、この認識された音節候補の組合せに
より複数の文節候補列を作成し、辞書照合を含む文法処
理を行なって文節単位の認識結果を出力している。そし
てこの時文節の長さと各音節毎の候補数を組合せた数の
文節候補列が作成され、まだ辞書照合の結果も複数の認
識結果が出力される。
この場合、音声認識結果の確からしさの順序で複数の認
識結果を順次出力している0 しかし、従来のこのような方法において、単音節の認識
結果がほとんど誤まりの無い場合、あるいは対象とする
語粟が少ない場合には特に問題は生じないが、現在の音
声認識の技術レベルでは充分に区切った音節でも識別し
にぐい音節があり、また連続的に発声した音声では調音
結合等の影響により識別率が更1fこ低下する。
識結果を順次出力している0 しかし、従来のこのような方法において、単音節の認識
結果がほとんど誤まりの無い場合、あるいは対象とする
語粟が少ない場合には特に問題は生じないが、現在の音
声認識の技術レベルでは充分に区切った音節でも識別し
にぐい音節があり、また連続的に発声した音声では調音
結合等の影響により識別率が更1fこ低下する。
また辞書に収納された語粟が多くなれば思ってもみない
語が最初に認識結果として出力されることがある。
語が最初に認識結果として出力されることがある。
本発明者等はこのような音響分析での音節認識率(音節
の正解率)が悪い場合に有効となる認識結果の出力順序
の決定方法を先に特願昭57−23221、3号「音−
人力式日本語文書処理装置」として提案した。
の正解率)が悪い場合に有効となる認識結果の出力順序
の決定方法を先に特願昭57−23221、3号「音−
人力式日本語文書処理装置」として提案した。
この方法は、音声認識結果の確からしき以外の自立語の
長さ、頻度等の条件を考慮に入れて認識結果の出力順令
脚定するようにしだものである。
長さ、頻度等の条件を考慮に入れて認識結果の出力順令
脚定するようにしだものである。
しかし、本発明者等が先に提案した方法によれば、音響
分析技術の向上に従って、音節認識率が良くなって来る
と、認識結果の出力順序の決定に際して、逆に悪い方向
に働き、最終の文節認識結果の正解率を平均的に落とし
てしまうという問題点が見出されるに至った。
分析技術の向上に従って、音節認識率が良くなって来る
と、認識結果の出力順序の決定に際して、逆に悪い方向
に働き、最終の文節認識結果の正解率を平均的に落とし
てしまうという問題点が見出されるに至った。
く目的〉
本発明は上記の点に鑑みて成されたものであり、認識結
果の複数の候補を音声認識結果の確からしさを示す確度
情報と、音声認識結果の確からしさ以外の自立語の長さ
、頻度を含む条件にもとず〈文法評価値情報とから得ら
れる総合評価値情報によって評価して認識結果の出力順
序を決定するようにした日本語音声入力装置を提供する
ことを目的としている。
果の複数の候補を音声認識結果の確からしさを示す確度
情報と、音声認識結果の確からしさ以外の自立語の長さ
、頻度を含む条件にもとず〈文法評価値情報とから得ら
れる総合評価値情報によって評価して認識結果の出力順
序を決定するようにした日本語音声入力装置を提供する
ことを目的としている。
〈実施例〉
以下、本発明を一実施例を挙げて詳細に説明する。
第1図は本発明の音声入力式日本語文書処理装置の一実
施例の構成を示すブロック図である。
施例の構成を示すブロック図である。
第1図において、■は音声入力をビノクア、ノブするマ
イクロホンであり、このマイクロホン1により検出され
た音声は単音節認識部2に入力される。この単音節認識
部2は従来公知のものであり、マイクロホン1を介して
入力された文節単位の音声が音節単位に区分されて単音
節毎の特徴描出が行なわれる。一方メモリ3には各単音
節毎の標準パターンが記憶されており、単音節認識部2
において入力音声の特徴パターンと標準パターンとのマ
ツチング計算処理が行なわれ、このマツチング計算処理
の結果、最も近似したものが第1候補として、また順次
近似したものが次候補として選出され、その結果が近似
度(確からしさ)を示す距離差情報と共((メモ+)4
に音節ラティスとして記憶される。
イクロホンであり、このマイクロホン1により検出され
た音声は単音節認識部2に入力される。この単音節認識
部2は従来公知のものであり、マイクロホン1を介して
入力された文節単位の音声が音節単位に区分されて単音
節毎の特徴描出が行なわれる。一方メモリ3には各単音
節毎の標準パターンが記憶されており、単音節認識部2
において入力音声の特徴パターンと標準パターンとのマ
ツチング計算処理が行なわれ、このマツチング計算処理
の結果、最も近似したものが第1候補として、また順次
近似したものが次候補として選出され、その結果が近似
度(確からしさ)を示す距離差情報と共((メモ+)4
に音節ラティスとして記憶される。
上記単音節認識部2において認識され、音節ラティスと
してメモリ4に記憶された内容は候補列作成部5に入力
されて近似度(確からしさ)を示す距離差情報を用いて
確度の高い順に文節候補(かな文字列)が作成されて文
節候補メモ、す6に記憶される。なおメモリ6において
領域6aは文節候補の確からしさを示す確度情報の記憶
領域、領−第6bは後述する評価内容を記憶する評価レ
ジスタ領域である。
してメモリ4に記憶された内容は候補列作成部5に入力
されて近似度(確からしさ)を示す距離差情報を用いて
確度の高い順に文節候補(かな文字列)が作成されて文
節候補メモ、す6に記憶される。なおメモリ6において
領域6aは文節候補の確からしさを示す確度情報の記憶
領域、領−第6bは後述する評価内容を記憶する評価レ
ジスタ領域である。
上記候補列作成部5において作成され、メモリ6内に記
憶された複数の候補列は順次文節分析部7に入力されて
文法的な分析が行なわれると共に分析に必要な文法情報
及び見出し語辞書、接辞語辞書等を含む辞書メモリ8の
内容と照合され、一致したものが認識結果メモリ9に文
節(単語)の漢字候補情報として記憶される。更に文節
分析部7は後述するようにメモリ9に記憶される文節(
漢字)候補の構成要素を分析して文法評価値を算出し、
仮名漢字変換処理における同音語の最高評価値を得た漢
字候補が認識結果メモリ9に記憶され、ま、たメモリエ
リア9aにその候補に対する文法評価値が記憶される。
憶された複数の候補列は順次文節分析部7に入力されて
文法的な分析が行なわれると共に分析に必要な文法情報
及び見出し語辞書、接辞語辞書等を含む辞書メモリ8の
内容と照合され、一致したものが認識結果メモリ9に文
節(単語)の漢字候補情報として記憶される。更に文節
分析部7は後述するようにメモリ9に記憶される文節(
漢字)候補の構成要素を分析して文法評価値を算出し、
仮名漢字変換処理における同音語の最高評価値を得た漢
字候補が認識結果メモリ9に記憶され、ま、たメモリエ
リア9aにその候補に対する文法評価値が記憶される。
また上記メモリ領域6aに記憶されている確度情報Yと
メモリエリア9aに記憶された文法評価値′情報Xにも
とすいて算出された各候・補の総合評価値Zがメモリエ
リア9bに記憶され、この総合評価値Zを用いて文節候
補のソートが行なわれて、認識結果の出力順序が決定さ
れるように構成されている。
メモリエリア9aに記憶された文法評価値′情報Xにも
とすいて算出された各候・補の総合評価値Zがメモリエ
リア9bに記憶され、この総合評価値Zを用いて文節候
補のソートが行なわれて、認識結果の出力順序が決定さ
れるように構成されている。
なお10は評価点算出のために用いられるバッフ7であ
り、メモリ領域A、B、C,ST、SB、X。
り、メモリ領域A、B、C,ST、SB、X。
を有している。また11け認識結果等を表示する表示装
置、12はかなキー、ファンクションキー等を有する入
力装置、13け上記各装置を制御するコントローラ(C
PU)である。
置、12はかなキー、ファンクションキー等を有する入
力装置、13け上記各装置を制御するコントローラ(C
PU)である。
次に上記の如く構成された装置の動作を第2図に示す1
文節の処理フローに従って説明する。
文節の処理フローに従って説明する。
文節単位に発声された音声はマイクロホン1によって検
出されて単音節認識部2によシ、音響分析によって単音
節単位に認識され(no−n3)、その認識結果が音節
ラティスメモリ4に入力記憶される。
出されて単音節認識部2によシ、音響分析によって単音
節単位に認識され(no−n3)、その認識結果が音節
ラティスメモリ4に入力記憶される。
例えば入力音声「/こ//(/lみ//7v//の/」
(「国民の」)に対する単音節認識結果として第1表に
示すような音節ラティスが形成される。
(「国民の」)に対する単音節認識結果として第1表に
示すような音節ラティスが形成される。
なお、上記第1表において音節ラティスのに)内に示し
た数字は第1位の認識結果を10とした時の2位以下の
確度を表わしている。
た数字は第1位の認識結果を10とした時の2位以下の
確度を表わしている。
上記のように音節ラティスには音節番号と音節確度(確
からしさ)情報が書かれることになる。
からしさ)情報が書かれることになる。
ここで音節の確からしさを表わす音節確度は次のように
して算出される。
して算出される。
即ち、単音節認識部2で入力音節の特徴パターンとメモ
リ3に記憶されている複数の標準パターンとの間でパタ
ーンマツチングが行なわれ、パターンマツチングの結果
として、各標準パターンとのマツチング距離を得る。こ
のマツチング距離の小さい順に並べて、上位数個を音節
候補とする。
リ3に記憶されている複数の標準パターンとの間でパタ
ーンマツチングが行なわれ、パターンマツチングの結果
として、各標準パターンとのマツチング距離を得る。こ
のマツチング距離の小さい順に並べて、上位数個を音節
候補とする。
第2表に音節候補のマツチング距離をに)内の数値で示
す。第」表に示しだ音節確度は、第1位のマツチング距
離で各位のマツチング距離を除して正規化したものであ
る。
す。第」表に示しだ音節確度は、第1位のマツチング距
離で各位のマツチング距離を除して正規化したものであ
る。
上記単音節認識部2において認識され、音節ラティスと
してメモリ4に記憶され。た音節単位の各候補は候補列
作成部5に入力される。
してメモリ4に記憶され。た音節単位の各候補は候補列
作成部5に入力される。
候補列作成部5は音節ラティスメモ+)4に記憶された
音節単位の認識結果を用いて、最初に上首Cメモリ4に
記憶された1位の認識結果ばかりを並べて候補列を作成
して文節候補メモリ6に記憶し、次に順次2位以下の認
識結果を組合せて確度の総和(候補列の確度)の小さい
順に候補列(文節候補)を作成してメモリ6に記憶する
。またこの時各文節候補に対する確度情報Yがメモリエ
リア6aに記憶される(n4)。上記第4表に示した例
では36個の候補列が第3表の如く作成されてメモリ6
に記憶される。
音節単位の認識結果を用いて、最初に上首Cメモリ4に
記憶された1位の認識結果ばかりを並べて候補列を作成
して文節候補メモリ6に記憶し、次に順次2位以下の認
識結果を組合せて確度の総和(候補列の確度)の小さい
順に候補列(文節候補)を作成してメモリ6に記憶する
。またこの時各文節候補に対する確度情報Yがメモリエ
リア6aに記憶される(n4)。上記第4表に示した例
では36個の候補列が第3表の如く作成されてメモリ6
に記憶される。
第3表
次妬メモリ6に記憶された候補列は順次文節分析部7に
入力さ九、文節の分析が行なわれる(n5)。
入力さ九、文節の分析が行なわれる(n5)。
即ち文節分析部7では入力される候補列を辞書メモリ8
の内容との照合を含む文法分析を次のように実行する。
の内容との照合を含む文法分析を次のように実行する。
候補列→(接頭語)十自立語+(接尾語)」−(活用語
尾)」−(付属語列) ただしくニ)内の要素は無くても良い。
尾)」−(付属語列) ただしくニ)内の要素は無くても良い。
ステップn5におじで行なわれる文節の文法分析処理フ
ローは第3図に詳細に示されており、文節分析部7はま
ず入力された候補列と辞書メモリ8の記憶内容との照合
を行なって仮名漢字変換処理を実行する(n20.n2
1)。
ローは第3図に詳細に示されており、文節分析部7はま
ず入力された候補列と辞書メモリ8の記憶内容との照合
を行なって仮名漢字変換処理を実行する(n20.n2
1)。
この時変換でき々かった場合には入力された候補列が文
節として不可能なかな配列と判定して、メモリエリア6
bのその候補列に対応した位置(評価レジスタ)にrO
Jを入れて、文節分析結果(評価)「×」の決定を行う
(ステップn 22.23.24 )(。
節として不可能なかな配列と判定して、メモリエリア6
bのその候補列に対応した位置(評価レジスタ)にrO
Jを入れて、文節分析結果(評価)「×」の決定を行う
(ステップn 22.23.24 )(。
一方、仮名漢字変換処理動作(n21)の結果、変換が
可能であった場合には、評価レジスタエリア6bの対応
位置(評価レジスタ)を「1」にセットして(n25)
、照合の結果一致したことを示す判定情報を記憶すると
共にステップn26以後の文法評価値算出動作に移行す
る。
可能であった場合には、評価レジスタエリア6bの対応
位置(評価レジスタ)を「1」にセットして(n25)
、照合の結果一致したことを示す判定情報を記憶すると
共にステップn26以後の文法評価値算出動作に移行す
る。
即ち、本発明実施例において各文節候補についてn20
”rr25の動作を実行することにより上記第3表の評
価欄に示したように「○」を付加した6個の候補列が文
節として可能であることが分析される。
”rr25の動作を実行することにより上記第3表の評
価欄に示したように「○」を付加した6個の候補列が文
節として可能であることが分析される。
また、本発明実施例においては文節々して可能々候補列
についてステ、プn26以後において文節の構成要素に
おいて重み付けを行なって出力順序付けを行なっている
がその一例を以下に示す。
についてステ、プn26以後において文節の構成要素に
おいて重み付けを行なって出力順序付けを行なっている
がその一例を以下に示す。
文節として可能な候補列に対する文法評価値は上記した
文節の要素の接頭語、自立語、接尾語の各々に対して次
の3点において点数を与え、各要素ごとに重みをかけて
加算した点数の合計として算出される。
文節の要素の接頭語、自立語、接尾語の各々に対して次
の3点において点数を与え、各要素ごとに重みをかけて
加算した点数の合計として算出される。
■ 語長
■ 頻度
■ 直前の数百文節での使用の有無
法に各項目に対する文法評価値の算出動作を説明する。
(D 自立語に対する評価値(n26〜n31)自立
語長は、その自立語の活用語尾の長さも含めた長さとす
る。例えば「歩いた」では、「歩Jが自立語の語幹であ
シ、「い」が活用語尾であり、「だ」が付属語となる。
語長は、その自立語の活用語尾の長さも含めた長さとす
る。例えば「歩いた」では、「歩Jが自立語の語幹であ
シ、「い」が活用語尾であり、「だ」が付属語となる。
従って自立語長は3となり、この自立語の長さはAレジ
スタに記憶される(n26)。
スタに記憶される(n26)。
自立語に対する頻度情報は3ランクに分け、少ないもの
から0.1.2の値が与えられて例えば辞書メモリ8に
記憶されており、この辞書メモリ8よシ所望の頻度情報
が取出されてBレジスタに記憶される( n 27 )
。
から0.1.2の値が与えられて例えば辞書メモリ8に
記憶されており、この辞書メモリ8よシ所望の頻度情報
が取出されてBレジスタに記憶される( n 27 )
。
次にステップn28に移行して直前の数十文節で使用さ
れているか否かが判定され、使用されていればil」、
使用されていなければ「0」がCレジスタに記憶される
( n29.30)。
れているか否かが判定され、使用されていればil」、
使用されていなければ「0」がCレジスタに記憶される
( n29.30)。
次にステップn31に移行して自立語の評価値Jが次式
%式%
に従って算出され、その結果がJレジスタに記憶される
。
。
なお、自立語の場合には、一度用いたものを再度用いる
確率が高いため、使用の有無の情報Cに重みをかけてい
る。
確率が高いため、使用の有無の情報Cに重みをかけてい
る。
(11)接頭語、接尾語に対する評価値(n32〜n4
7)接頭語はその文字数(拗音は除く)を2倍したもの
を用いる。ただし、文字数が0(接頭語がない時)の時
にば「4」を与える(n33)0また頻度は2ランクに
分けられており、少ないものをrOJ、多いものをrl
Jとしている。
7)接頭語はその文字数(拗音は除く)を2倍したもの
を用いる。ただし、文字数が0(接頭語がない時)の時
にば「4」を与える(n33)0また頻度は2ランクに
分けられており、少ないものをrOJ、多いものをrl
Jとしている。
更に使用の有無は無い時には「0」、有の時には「1」
を与えて−る。
を与えて−る。
接頭語長ばAレジスタに記憶され(n34)、頻度情報
//iBレジスタに記憶され(n35)、使用の有無情
報はCレジスタに記憶され(n37.38)、その後ス
テップn39に移行して接頭語の評価値STが次式 %式% に従って計算され、その結果がSTレジスタに記憶され
る。
//iBレジスタに記憶され(n35)、使用の有無情
報はCレジスタに記憶され(n37.38)、その後ス
テップn39に移行して接頭語の評価値STが次式 %式% に従って計算され、その結果がSTレジスタに記憶され
る。
接尾語の場合には接頭語と同様の動作がステソゲn40
〜n47において実行され、その結果がSBレジスタに
記憶される。
〜n47において実行され、その結果がSBレジスタに
記憶される。
次にステップn48に移行して1文節全体の評価値Xが
次式 %式% に従って計算され、その結果がXレジスタに記憶される
。
次式 %式% に従って計算され、その結果がXレジスタに記憶される
。
次にステソゲn49に移行してXレジスタの値が評価値
レジスタ(メモリエリア9a)の値よシ大きいか否かが
判定され、Xレジスタの値が評価値レジスタの値より大
きい場合には評価値レジスタ(メモリエリア9a)にX
レジスタの内容を記憶すると共に、ステプ゛−プn21
,1122において変換された漢字候補をその文法評価
値と共にメモリ9に記憶する(n50)。
レジスタ(メモリエリア9a)の値よシ大きいか否かが
判定され、Xレジスタの値が評価値レジスタの値より大
きい場合には評価値レジスタ(メモリエリア9a)にX
レジスタの内容を記憶すると共に、ステプ゛−プn21
,1122において変換された漢字候補をその文法評価
値と共にメモリ9に記憶する(n50)。
一方n49においてXレジスタの値が評価値レジスタの
値より大きくない場合にはステップn50を飛び越して
ステップn、51に移行する。
値より大きくない場合にはステップn50を飛び越して
ステップn、51に移行する。
ステップn51においては次の同音語の候補があるか否
かが判定され、同音語の候補があればステップn26以
降に戻って新たな同音語候補に対する文法評価値の計算
が行なわれる。
かが判定され、同音語の候補があればステップn26以
降に戻って新たな同音語候補に対する文法評価値の計算
が行なわれる。
また同音語の候補が々ければステップn52に移行して
1候補列に対する文節の分析動作が終了する( n 5
+ n 6 )。
1候補列に対する文節の分析動作が終了する( n 5
+ n 6 )。
このような動作により1候補列に対する漢字候補がその
文法評価値と共に認識結果メモリ9に記憶され、また1
候補列に対して同音語(複数の漢字候補)が存在する場
合には評価点の最も大きい漢字候補がメモリ9に記憶さ
れることになる。
文法評価値と共に認識結果メモリ9に記憶され、また1
候補列に対して同音語(複数の漢字候補)が存在する場
合には評価点の最も大きい漢字候補がメモリ9に記憶さ
れることになる。
第3表に示しだ例においては
「ごふにんの」→「ご赴任の」
「ごふみんの」→「ご不眠の」
「おふにんの」→「お赴任の」
「こくみんのJ→「国民の」
「おふみんの」→「お不眠の」
の漢字候補が得られる。また接頭語「ご」に関しては頻
度が高いため 5T=2+1+O=3 とし、「赴任」は頻度1.「国民」及び「贈り物」は頻
度2.「不眠」け頻度0とした場合、各文節を評価する
と、 「ご赴任のJ:(接頭)(自立語・・・3文字)(付属
語) X=3+16X(3+1十〇)+4=71「ご不眠の」
:(接頭)(自立語・・・3文字)(付属語) X=3+16X(3十〇十〇)+4=55「お赴任の」
;(接頭〕(自立語、・・3文字)(付属語) X=3+16X(’3+1十0)+4=71「国民の」
:(自立語・・4文字)(付属語)X=4+16(4,
+2十〇)+4=104「お不眠の」:(接頭)(自立
語・3文字)(付属語) X−=3+16x(3+O+0)+4=55「贈り物J
:(自立語・・5文字) X=4+16X(5+2)+4=120となり「贈り物
」が最高の文法評価値となる。
度が高いため 5T=2+1+O=3 とし、「赴任」は頻度1.「国民」及び「贈り物」は頻
度2.「不眠」け頻度0とした場合、各文節を評価する
と、 「ご赴任のJ:(接頭)(自立語・・・3文字)(付属
語) X=3+16X(3+1十〇)+4=71「ご不眠の」
:(接頭)(自立語・・・3文字)(付属語) X=3+16X(3十〇十〇)+4=55「お赴任の」
;(接頭〕(自立語、・・3文字)(付属語) X=3+16X(’3+1十0)+4=71「国民の」
:(自立語・・4文字)(付属語)X=4+16(4,
+2十〇)+4=104「お不眠の」:(接頭)(自立
語・3文字)(付属語) X−=3+16x(3+O+0)+4=55「贈り物J
:(自立語・・5文字) X=4+16X(5+2)+4=120となり「贈り物
」が最高の文法評価値となる。
次にステップn8(第2図)において各文節認識結果の
総合評価値が の式に従って算出され、その結果がメモリエリア9bに
記憶される。
総合評価値が の式に従って算出され、その結果がメモリエリア9bに
記憶される。
このステップにおいて例えば「国民の」の総合評価値が
となり、最高の総合評価値となる。
従ってステップn9(第2図)において文節認識結果を
ソートすることによりメモリ9の記憶内容は第4表の■
の如くなる。
ソートすることによりメモリ9の記憶内容は第4表の■
の如くなる。
このような一連の動作により漢字候補「国民の」が第1
位の認識候補となりステップnloに移行して、その第
1位の認R候補「国民の」が最初に出力されることにな
る。
位の認識候補となりステップnloに移行して、その第
1位の認R候補「国民の」が最初に出力されることにな
る。
第4表
なお、第4表においてIの欄は音響分析から得られる確
度(確からしさ)情報によってソートした場合、■の欄
は本発明者等が先に提案した文法分析から得られる文法
評価値によってノートした場合のメモリ9の記憶内容を
示している。
度(確からしさ)情報によってソートした場合、■の欄
は本発明者等が先に提案した文法分析から得られる文法
評価値によってノートした場合のメモリ9の記憶内容を
示している。
上記の第4表に示した例からも明らかなように入力音声
に対応した正しい文節「国民の」は■では第4位、■で
は第′2位であるのに対し、本発明による■では第1位
に出力されるようになり、本発明が最も良い結果になっ
ていることが判る。
に対応した正しい文節「国民の」は■では第4位、■で
は第′2位であるのに対し、本発明による■では第1位
に出力されるようになり、本発明が最も良い結果になっ
ていることが判る。
以上のような処理手順により、音声認識の確度に従った
認識結果の出力順、あるいは文法分析による文法評価値
に従った認識結果の出力順に比べて、認識結果の正解率
の高いものが先に出力されるようKなる。
認識結果の出力順、あるいは文法分析による文法評価値
に従った認識結果の出力順に比べて、認識結果の正解率
の高いものが先に出力されるようKなる。
く効果〉
以上述べたよう傾、本発明によれば認識結果の複数の候
補を音声認識結果の確からしさを示す確度情報と、音声
認識結果の確からしさ以外の自立語の長さ、頻度を含む
条件にもとすく文法評価値情報とから得られる総合評価
値情報により評価して認識結果の出力順序を決定するよ
うに成しているため、妥当性の高い文節から順次出力さ
れることになシ、認識結果の正解率が向上すると共に、
候補選択が容易となる。
補を音声認識結果の確からしさを示す確度情報と、音声
認識結果の確からしさ以外の自立語の長さ、頻度を含む
条件にもとすく文法評価値情報とから得られる総合評価
値情報により評価して認識結果の出力順序を決定するよ
うに成しているため、妥当性の高い文節から順次出力さ
れることになシ、認識結果の正解率が向上すると共に、
候補選択が容易となる。
第1図は本発明の一実施例装置の構成を示すブロック図
、第2図は1文節の処理フローを示す図、第3図は本発
明による1候補列(文節)に対する文節の分析処理フロ
ーを示す図である。 2・・・単W節認識部、3・・・標準パターンメモリ、
4・音節シティスメモリミ5・・・候補列作成部、6・
・文節候補メモリ、7・・・文節分析部、8・・・辞書
メモリ、9・・認識結果メモリ、10・・・文法評価値
算出用バッファメモリ、6a・・・確度情報記憶メモリ
、9a・・文法評価値記憶エリア、9b ・総合評価値
記憶エリア。
、第2図は1文節の処理フローを示す図、第3図は本発
明による1候補列(文節)に対する文節の分析処理フロ
ーを示す図である。 2・・・単W節認識部、3・・・標準パターンメモリ、
4・音節シティスメモリミ5・・・候補列作成部、6・
・文節候補メモリ、7・・・文節分析部、8・・・辞書
メモリ、9・・認識結果メモリ、10・・・文法評価値
算出用バッファメモリ、6a・・・確度情報記憶メモリ
、9a・・文法評価値記憶エリア、9b ・総合評価値
記憶エリア。
Claims (1)
- 【特許請求の範囲】 1、文節単位に発声された音声を音節単位に認識し、該
認識された音節候補の組合せKより複数の文節候補列を
作成し、辞書照合を含む文法処理を行なって文節単位の
認識結果を出力する日本語音声入力装置において、 認識結果の複数の候補を音声認識結果の確からしさを示
す確度情報と、音声認識結果の確からしさ以外の自立語
の長さ、頻度を含む条件にもとず〈文法評価値情報とか
ら得られる総合評価値情報により評価して認識結果の出
力順序を決定する手段を備えたことを特徴とする日本語
音声入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58058513A JPS59180629A (ja) | 1983-03-30 | 1983-03-30 | 日本語音声入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58058513A JPS59180629A (ja) | 1983-03-30 | 1983-03-30 | 日本語音声入力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS59180629A true JPS59180629A (ja) | 1984-10-13 |
JPS6325366B2 JPS6325366B2 (ja) | 1988-05-25 |
Family
ID=13086505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58058513A Granted JPS59180629A (ja) | 1983-03-30 | 1983-03-30 | 日本語音声入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59180629A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61184683A (ja) * | 1985-02-12 | 1986-08-18 | Nec Corp | 認識結果選択方式 |
JPS627095A (ja) * | 1985-07-03 | 1987-01-14 | 株式会社日立製作所 | 音声認識装置 |
JPS62113264A (ja) * | 1985-11-12 | 1987-05-25 | Toshiba Corp | 音声文書作成装置 |
JPS6470865A (en) * | 1987-09-11 | 1989-03-16 | Brother Ind Ltd | Language processor based upon voice input |
-
1983
- 1983-03-30 JP JP58058513A patent/JPS59180629A/ja active Granted
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61184683A (ja) * | 1985-02-12 | 1986-08-18 | Nec Corp | 認識結果選択方式 |
JPS627095A (ja) * | 1985-07-03 | 1987-01-14 | 株式会社日立製作所 | 音声認識装置 |
JPS62113264A (ja) * | 1985-11-12 | 1987-05-25 | Toshiba Corp | 音声文書作成装置 |
JPS6470865A (en) * | 1987-09-11 | 1989-03-16 | Brother Ind Ltd | Language processor based upon voice input |
Also Published As
Publication number | Publication date |
---|---|
JPS6325366B2 (ja) | 1988-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6738741B2 (en) | Segmentation technique increasing the active vocabulary of speech recognizers | |
KR20010096490A (ko) | 이동통신을 위한 철자 음성인식장치 및 방법 | |
CN111145718A (zh) | 一种基于自注意力机制的中文普通话字音转换方法 | |
JPS61177493A (ja) | 音声認識方法 | |
JPS59180629A (ja) | 日本語音声入力装置 | |
Graves et al. | Hierarchical subsampling networks | |
JP2002278579A (ja) | 音声データ検索装置 | |
JPH049320B2 (ja) | ||
JPS61122781A (ja) | 音声ワ−ドプロセツサ | |
JPS60196869A (ja) | 音声入力式日本語文書処理装置 | |
JPS6321214B2 (ja) | ||
JPH0338699A (ja) | 音声認識装置 | |
JP3708747B2 (ja) | 音声認識方法 | |
JP2647234B2 (ja) | 音声認識装置 | |
JP2979912B2 (ja) | 音声認識装置 | |
JPH04296898A (ja) | 音声認識装置 | |
JPH04115383A (ja) | オンライン手書き文字認識装置の文字認識方式 | |
JPS62134698A (ja) | 多数単語の音声入力方式 | |
JPH04232997A (ja) | 音声認識装置における認識結果表示方式 | |
JPH04291399A (ja) | 音声認識方法 | |
JP3293191B2 (ja) | 音声認識装置 | |
JPH0222730A (ja) | 音声入力による文書作成装置 | |
JPH11344991A (ja) | 音声認識装置および記憶媒体 | |
JPH0574837B2 (ja) | ||
JPS58195955A (ja) | 音声入力式日本語文書処理装置 |