JP2686085B2

JP2686085B2 - 音声認識システム

Info

Publication number: JP2686085B2
Application number: JP62320212A
Authority: JP
Inventors: 正幸飯田; 宏樹大西; 計美大倉
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 1987-12-17
Filing date: 1987-12-17
Publication date: 1997-12-08
Anticipated expiration: 2012-12-08
Also published as: JPH01161299A

Description

【発明の詳細な説明】（イ）産業上の利用分野音声認識システムに関するものである。（ロ）従来の技術音声をテープレコーダの如き録音再生装置に録音し、
これを再生して出力される再生音声を音声認識装置へ入
力することにより、音声認識を行ないこれを文章化する
音声認識システムが開発されつつある（特開昭58−1587
36号）。斯様なシステムでは、入力音声を文節単位に認識する
文節認識部と、入力音声を単語単位に認識する単語認識
部との二つの認識部を備えるものがあり、この場合、そ
れぞれの認識部が出力した認識結果を一つにまとめ、確
かさを示す尤度の一番大きなものを１位の認識結果とし
て出力する事となる。従来の斯様なシステムでは、出力された１位の認識結
果が誤っている場合は、次候補キーを押すことにより２
位の認識結果を出力させる。このように次候補キーを押
すことにより、３位と４位と順番に認識結果を出力させ
る。次候補キーの操作によって正解が得られないときは、
再発声を行なうか、キー入力で修正を行なう。（ハ）発明が解決しようとする問題点従来システムでは、正しい認識結果が得られず、再発
声を行なう場合、認識させたい語句全体を再発声し、再
認識していた。この場合、１回目の認識結果は、再認識
時には考慮される事はなかった。例えば、認識単語内の、頭の１音節だけが誤っている
場合でも、単語全体を再発声し、再認識していたので、
１回目の認識結果が全く無駄になってしまう。また、１
回目の認識結果よりも、２回目の認識結果の方が認識率
が高いとはかぎらず、より誤った認識結果を招く場合も
ある。（ニ）問題点を解決するための手段本発明の音声認識システムは、入力音声を認識して認
識結果を求める音声認識部と、該認識結果を表示する表
示部と、該認識結果を記憶する認識結果記憶部と、前記
入力音声の認識結果が誤認識である場合に発話者に再発
声を求めて、前記認識結果を修正する認識結果修正部
と、を備えた音声認識システムに於いて、前記認識結果
修正部は、再発声された入力音声の認識結果が誤認識で
ある場合に、再発声された入力音声の認識結果と再発声
入力前の認識結果とを比較することにより、両認識結果
が同一の部分を検出し、該同一の部分のデータについて
辞書検索を行って認識候補語を選択し、該選択された認
識候補語と再発声された入力音声の認識結果との尤度計
算を行うことを特徴とする。（ホ）作用本発明によれば、１回目の発声と、２回目の発声とを
比較することにより認識結果を求めることにより、１度
の発声よりも正確な認識を行なえる。（ヘ）実施例第１図に本発明を採用して音声入力により文章作成す
るディクテーティングマシンの外観図を示し、第２図に
該マシンの機能ブロック図を示す。第２図に於て、（１）は第１図の本体（100）内に回
路装備された音声認識部であり、その詳細は第３図のブ
ロック図に示す如く、入力音声信号の音圧調整を行う前
処理部（11）［第４図］、該処理部（11）からの音圧調
整済みの音声信号からその音響特徴を示すパラメータを
抽出する特徴抽出部（12）［第５図］、該抽出部（12）
から得られる特徴パラメータに基づき入力音声の単語認
識を行う単語認識部（13）［第６図］と文節認識部（1
4）［第７図］、及びこれらいずれかの認識部（13）、
（14）からの認識結果に基づき認識単語文字列、或いは
認識音節文字の候補を作成する候補作成部（15）からな
る。更に第２図に於て、（２）は第１図に示す如く本体
（100）に機械的並びに電気的に着脱可能なテープレコ
ーダ等の録音再生装置、（３）は例えば第１図図示の如
きヘッドホンタイプのマイクロホン、（４）は録音再生
装置（２）とマイクロホン（３）と音声認識部（１）と
のあいだの接続切り換えを行う入力切り換え部［第８
図］である。（６）は認識結果に基づき生成した文字列
等を表示するための表示装置、（７）は該ディスクテー
ティングマシンの各種制御信号を入力するためのキーボ
ード、（８）は該ディクテーティングマシンで生成され
文字列を記憶する磁気ディスク装置等の記憶装置、
（９）は該記憶装置の文字列を規則合成によりスピーカ
（10）から読み上げるための音声合成部である。尚、
（５）はマイクロプロセッサからなる制御部であり、上
記各部の動作を制御を司っている。上述の構成のディクテーティングマシンに依る文章作
成方法としては二通りあり、それぞれに就いて以下に詳
述する。第一の方法は、マイク（３）より生音声を音声認識部
（１）に入力し、音声認識を行ない、入力音声を文字列
に変換し、表示装置（６）に表示し、同時に記憶装置
（８）に結果を記憶する。第二の方法は、入力したい文章を予め録音再生装置
（２）に録音しておき、この録音再生装置（２）を本装
置に接続し、録音文章を音声認識部（１）に入力するこ
とにより、音声認識を行ない、入力音声を文字列に変換
し、表示装置（６）に表示し、同時に記憶装置（８）に
結果を記憶する。上述の様に、音声を入力する方法は、二通りあるの
で、入力切り換え部（４）において、入力の切り換えを
行なう。また入力切り換え部（４）は、入力の切り換え
の他に、録音再生装置（２）に録音信号（イ）を録音す
るのか、マイク（３）より入力された音声を録音するの
かの切り換えも行なう。以下に音声録音から文章作成までの動作を順次詳述す
る。（ｉ）音声登録処理音声認識を行なうに先だち、音声認識に必要な音声の
標準パターンを作成するため、音声登録を行なう。まず、音節登録モードについて述べる。ここで述べている標準パターンとは、音声認識部
（１）の文節認識部（14）でのパターンマッチィング時
の基準パターンとなるものであり、具体的には第７図の
如き文節認識部（14）の音節標準パターンメモリ（14
d）に格納される。本ディクテーティングマシンに音声登録する方法は、
まず第７図のスイッチ（14s1）を操作しパラメータバッ
ファ（14a）と音節標準パターンメモリ（14d）とを接続
し、次に述べる三方法がある。第一の方法は該マシンの本体（100）にマイク（３）
より直接登録音声を入力し、この登録音声を音声認識部
（１）で分析し、標準パターンを作成し、作成した標準
パターンを音節標準パターンメモリ（14d）および記憶
装置（８）に記憶させる方法である。第二の方法は前もって登録音声を録音しておいた録音
再生装置（２）を本体（100）に接続し、この録音登録
音声を再生することにより登録音声の入力をなし、この
入力した登録音声を音声認識部（１）で分析し、標準パ
ターンを作成し、作成した標準パターンを音節標準パタ
ーンメモリ（14d）および記憶装置（８）に記憶させる
方法である。第三の方法は本マシンの本体（100）にマイク（３）
から直接登録音声を入力するが、このとき同時に録音再
生装置（２）を本体（100）に接続しておきこの入力さ
れた音声を録音再生装置（２）に録音しながら、本体
（100）側ではマイク（３）からの登録音声の分析を行
ない標準パターンを作成し、作成した標準パターンを記
憶装置（８）に記憶させておく。そして、次にこのマイ
ク（３）への音声入力が終了すると、これに引き続き、
録音再生装置（２）に録音された音声を再生し、この録
音された登録音声を音声認識部（１）で分析し、標準パ
ターンを作成し、作成した標準パターンを音節標準パタ
ーンメモリ（14d）に記憶しておくと同時に、記憶装置
（８）にも上述のマイク（３）からの直接の登録音声の
音節標準パターンと共に記憶させる方法である。この第３の方法に於ては、録音再生装置（２）に録音
した音声は録音再生装置（２）の周波数特性を受けてい
るため、録音した音声から作成した標準パターンと、マ
イク（３）から直接入力した音声より作成した標準パタ
ーンとを比べた場合、両標準パターンの間に違いが現れ
る。故に録音音声を認識させるときは、録音音声より作
成した標準パターンを使用する必要があり、マイク
（３）から直接入力した音声を認識させるときは、マイ
ク（３）から直接入力した音声より作成した標準パター
ンを使用する必要があるので、上述の如きの方法をとる
ことによって、マイク（３）から直接登録した標準パタ
ーンと録音音声より作成した標準パターンの両パターン
を一回の音声登録操作によって作成し記憶できる。ま
た、一度録音再生装置（２）に登録音声を録音しておけ
ば標準パターンを作成していないディクテーティングマ
シン上にも登録者の発声入力を必要とせず、この録音音
声を再生入力するだけで、標準パターンが作成できる。
また、録音再生装置（２）に登録音声を録音し、さらに
この登録音声のあとに文章を録音しておけば、後にこの
録音再生装置（２）を本体（100）に接続し、録音され
た音声を再生するだけで音声登録から、文章作成まで、
すべて自動的に行なえる。尚、音声の標準パターンを作成する為の登録者の発声
入力は、本装置が一定の順序で表示装置（６）に表示す
る文字を登録者が読み上げることにより行なわれる。また、本マシン専用の表示機能をもつ録音再生装置
（２）を使用する場合はこの録音再生装置（２）単独で
携帯する時でもその表示画面に表示された見出し語に対
応する音声を発声し録音再生装置（２）に録音する事
で、標準パターンの作成が可能となる。上述の如く、標準パターンを作成するための登録音声
を録音再生装置（２）に録音する場合は、この録音され
た登録音声より標準パターンを作成するときにノイズな
どの影響を受け録音音声とこれに対応するべき見出し語
とがずれる可能性があり、以下、第９図に基づき、説明
のため録音再生装置としてテープレコーダを使用した場
合について述べる。第９図（ａ）はテープレコーダに標
準パターン作成のための登録音声を録音した状態のう
ち、見出し語「あ」〜「か」に対応した登録音声“あ”
〜“か”の間のテープの状態を表わしており、ここでは
“え”と“お”の間に［ノイズ］が録音された場合を示
す。第９図（ａ）の様に登録音声と登録音声との間に
［ノイズ］が録音されたテープにより音声登録を行なっ
た場合、１番目に録音された音が“あ”で２番目に録音
された温が“い”という様に、ただ単にテープに録音さ
れた音の順序により、入力された登録音声がどの音節に
対応しているのかを決定していると、［ノイズ］まで登
録音声とみなして見出し語を対応させるので入力された
実際の登録音声と見出し語とがずれてしまう。ここで、第９図（ｂ）は［ノイズ］を音声と誤認識
し、見出し語「え」のところに［ノイズ］が入力され、
見出し語「お」のところに音節“え”が入力された図で
ある。この様に登録音声より標準パターンを作成するときに
ノイズなどの影響を受け録音音声と見出し語とがずれる
場合があるため、第９図（ｃ）に示すように、登録音声
の種類を示したキャラクターコード音を、登録音声に対
応させて録音再生装置（２）に録音する。この方法によ
り、“う”と“え”の間に［ノイズ］が録音されていて
も、上述のように、入力された音と見出し語とのずれを
防止する。このずれを防止する特定周波数のキャラクターコード
音の録音方法を、録音再生装置（２）のテープレコーダ
がシングルトラックである場合と、マルチトラックであ
る場合とにわけて説明する。まず第10図において、録音方式としてマルチトラック
をもつ録音再生装置を使用する場合について述べる。録音方式としてマルチトラックをもつ録音再生装置を
使用する場合は同図（ａ）に示すように音声を録音して
いないトラックに見出し語に対応するキャラクターコー
ドを録音する。音声認識部（１）では、このキャラクタ
ーコード音により、入力される音声の見出し語を知ると
ともに、音声トラックに録音された音のうち、このキャ
ラクターコード音が録音された区間t1に録音された音の
うち、音圧のしきい値以上の条件をみたすもののみを音
声とみなし、分析を行なう。または、同図（ｂ）に示すように、音声の始めと終わ
りに見出し語に対応するキャラクターコードを録音し、
音声トラックに録音された音のうち、この音声の始めを
示すキャラクターコード音と、音声の終わりを示すキャ
ラクターコード音の間の区間t2に録音された音のうち、
音圧のしきい値以上の条件をみたすもののみを音声とみ
なし、分析を行なう。または、同図（ｃ）に示すように、音声の始めに見出
し語に対応するキャラクターコードを録音する。音声ト
ラックに録音された音のうち、この音声の種類を示すキ
ャラクターコード音から、次の見出し語に対応するキャ
ラクターコード音までの区間t3に録音された音のうち、
音圧しきい値以上の条件をみたすもののみを音声とみな
し、分析を行なう。また第二の方法としてシングルトラックの録音再生装
置（２）の場合は、見出し語に対応するキャラクターコ
ードを音声の分析周波数帯域外の音で表わし、音声の録
音されているトラックに音声と共に録音する。この場合
のキャラクターコード音を録音する方法は、上述のマル
チトラックの場合と同様である。つまり、上述のt1、t
2、t3の区間に録音された音うち、上述と同様の条件を
みたすもののみを音声とみなし、分析を行なう。ただ
し、音声と、キャラクターコード音が重なっている同図
（ａ）に示した実施例の場合以外は、キャラクターコー
ド音に、音声の分析周波数帯域外の音を使用しなくても
よい。次ぎにアルファベット、数字およびカッコや句読点な
ど予め第６図の如き単語認識部（13）の単語辞書（13
d）にキャラクター登録されている単語に対応する単語
標準パターンを、同図の単語標準パターンメモリ（13
c）に登録する。まず、所定の操作により、第６図のパラメータバッフ
ァ（13a）と単語標準パターンメモリ（13c）とがスイッ
チ（13s1）により接続され、単語登録モードにする。つぎに、本装置本体（100）の表示装置（６）にアル
ファベット、数字およびカッコや句読点などが表示さ
れ、操作者はこれに対応する読みを音声入力する。音声認識部（１）では、この音声を分析し、単語標準
パターンメモリ（13c）に単語標準パターンの登録を行
なう。上述までの操作により音声認識は可能となる。しか
し、自立語・付属語辞書（14e）および単語辞書（13d）
にない単語を認識させないときは、自立語・付属語辞書
（14e）に認識させたい単語を登録するか、単語辞書（1
3d）に認識させたい単語を、また単語標準パターンメモ
リ（13c）に単語標準パターンを登録する必要がある。
ただし、自立語・付属語辞書（14e）に単語を登録する
か、単語辞書（13d）および単語標準パターンメモリ（1
3c）に、単語および単語標準パターンを登録するかは、
使用者がその単語を文節発声として認識させたいか、単
語発声として認識させたいかによって決定する。また、自立語・付属語辞書（14e）にはあるが、単語
辞書（13d）になく、それでも単語認識で認識させたい
場合、かかる単語を単語辞書（13d）および単語標準パ
ターンメモリ（13c）に、単語および単語標準パターン
を登録する必要がある。以下に任意単語の登録方法について述べる。単語の登録には、単語を自立語・付属語辞書（14e）
に文字列を登録する登録と、単語を単語標準パターンメ
モリ（13c）に単語標準パターンを登録、および単語辞
書（13d）に文字列を登録する２方法がある。単語を自立語・付属語辞書（14e）に登録する場合
は、登録したい単語を発声し本装置に入力する。このとき本装置はこの音声を音声認識部（１）で認識
し、認識結果を表示装置（６）に表示する。使用者はこ
の結果が正しければキーボード（７）の所定のキーを押
し、発声音声を表示装置（６）に表示されている文字列
として自立語・付属語辞書（14e）に登録する。もし、
表示装置（６）に表示された認識結果が正しくなけれ
ば、本装置の音節修正機能により表示装置（６）に表示
された認識結果を修正するか、登録したい単語を再発声
する。また再発声した結果が誤っているときは、再び本
装置の音節修正機能により修正する。上述の操作を表示
装置（６）に表示される文字列が登録したい単語と一致
するまで繰り返す。単語を単語標準パターンメモリ（13c）および単語辞
書（13d）に登録する場合は、単語を自立語・付属語辞
書（14e）に登録する場合と同様にまず表示装置（６）
に登録したい文字列を正しく表示させる。次に正しく認
識された文字列と単語標準パターンを、単語辞書（13
d）および単語標準パターンメモリ（13c）にそれぞれ登
録する。また、自然な発声で入力された音声を認識すること
は、現在の音声認識技術のレベルを考えた場合、無理が
ある。現在の音声認識技術のレベルでは、連続音節発声
入力が限度であるため、以下に連続音節発声入力の一実
施例について記す。連続音節発声入力の場合も、上記の手順と同一である
が、連続音節発声入力の場合は、単語標準パターンも連
続音節発声のパターンとなっているため、登録したい単
語を自然発声で再発声し、単語標準パターンを自然発声
より作成し、単語標準パターンと文字列を単語標準パタ
ーンメモリ（13c）および単語辞書（13d）にそれぞれ登
録する。以上の操作により、音声認識による文章作成のために
必要なデータを登録できた事となる。（ii）文章作成以下に文章作成の実施例について述べる。まず、認識動作を行なう場合は、単語認識部（13）の
スイッチ（13s1）は、パラメータバッファ（13a）と単
語判定部（13b）を接続する様に、文節認識部（14）の
スイッチ（14s1）は、パラメータバッファ（14a）と音
節認識部（14b）を接続する様に設定する。文章作成には二方法がある。第一の方法は本装置の本体に作成したい文章を音声に
よりマイク（３）から直接入力するオンライン認識方法
である。第二の方法は文章を録音しておいた録音再生装置
（２）を本装置に接続し、録音文章を再生し、認識させ
るオフライン認識である。まず、オンライン認識の実施例について述べる。オンライン認識の場合は、本装置にマイク（３）より
直接文節単位または単語単位に発声した文章を音声入力
するので、所定の操作により、入力切り換え部（４）で
マイク（３）と音声認識部（１）を接続する。また、マイク（３）より入力している音声を録音再生
装置（２）に記録しておきたいときは、録音再生装置
（２）を本体に接続し、入力切り換え部（４）をマイク
（３）の出力と録音再生装置（２）の録音端子とを接続
する。また同時に、入力切り換え部（４）には、後述の様に
無音検出信号が特徴抽出部（12）より入力された場合、
文節、または単語区切りを示すビープ音を録音するよう
機能する。音声認識時は、単語認識部（13）と文節認識部（14）
が起動している。マイク（３）より入力された音声は、前処理部（11）
で入力音声を音声分析に適した特性になるよう処理を施
され（例えば入力音声の音圧が小さい時は、増幅器によ
り音圧を増幅したりする処理を行なう）、特徴抽出部
（12）に送られる。特徴抽出部（12）では、第５図に示す如く、前処理部
（11）より入力されてきた音声を分析部（12a）で分析
し特徴抽出を行ない、パラメータバッファ（12c）に記
憶する。同時に、特徴抽出部（12）の分析単位判定部（12b）
では、分析部（12a）の分析結果より、音節または文節
単位に発声されたあとの無音区間、および文節または単
語単位に発声されたあとに録音されたビープ音（詳細は
後述のオフライン認識の実施例に示す。）の検出を行な
っており、無音区間を検出した場合、無音区間検出信号
（ロ）を発生する。かかる無音区間検出信号（ロ）を受け取ったパラメー
タバッファ（12c）は、記憶している特徴パラメータを
単語認識部（13）と文節認識部（14）に送り、記憶内容
を消去する。単語認識部（13）に入力された特徴パラメータは、第
６図に示されたパラメータバッファ（13a）に記憶され
る。単語判定部（13b）では、パラメータバッファ（13
a）に記憶された特徴パラメータと単語標準パターンメ
モリ（13c）とを比較し、パラメータバッファ（13a）に
記憶された特徴パラメータと、尤度の大きい単語標準パ
ターンをもつ単語を、単語辞書（13d）より複数語選
び、選ばれた単語の文字列とその尤度値を候補作成部
（15）に送る。一方、文節認識部（14）に入力された特徴パラメータ
は、パラメータバッファ（14a）に記憶される。音節認
識部（14b）では、パラメータバッファ（14a）に記憶さ
れた特徴パラメータと音節標準パターンメモリ（14d）
とを比較し、パラメータバッファ（14a）に記憶された
特徴パラメータを音節列に変換し、かかる音節列を文節
判定部（14c）へ送る。文節判定部（14c）では入力され
た音節列と自立語・付属語辞書（14e）に登録されてい
る単語を比較し、自立語と付属語を組み合わせて尤度の
大きい文節を複数組作成し、作成した文節の文字列とそ
の尤度値を候補作成部（15）に送る。候補作成部（15）は入力された文字列から尤度の大き
いものを複数個選び、尤度値と単語認識部（13）から送
られてきたデータか文節認識部（14）から送られてきた
データかを示すコードを付加し記憶する。同時に、尤度
の最も大きいものの文字列を、表示装置に表示させる信
号を制御部（５）に送る。制御部（５）は、この信号を
受け尤度の最も大きいものの文字列の後に区切り記号マ
ーク「^▽」をつけ、例えば第14図（ａ）の入力文章に対
して第14図（ｃ）に示すような形式で表示装置に表示さ
せる。同時に候補作成部（15）は制御部（５）に、候補
作成部（15）に記憶された内容を記憶装置（８）に記憶
させる信号を送る。制御部（５）はこの信号を受け、候
補作成部（15）に記憶された文字列の後に区切り記号を
表わすコードを付加した形で記憶装置（８）に記憶させ
る。この外部記憶装置に記憶された文字列は、ワープロ
の一次原稿とする。一般的にはフロッピーディスクを用
いるが、このとき記憶装置（８）のファイルのフオーマ
ットはワープロのファイルフォーマットに合わせておく
必要がある。また、この無音区間検出信号をうけとった第８図に示
す入力切り換え部（４）の信号発生部（42）は、文章の
文節または単語の区切りを表わすビープ音を発生し、か
かるビープ音をスイッチ（41）に入力する。スイッチ
（41）は、マイク（３）から入力される音声と、信号発
生部（42）より入力されるビープ音を、録音再生装置
（２）に録音するよう、回路を接続し、録音再生装置
（２）に録音されている文章の文節または単語の区切り
と見なされた無音区間にビープ音を録音する。次ぎに、オフライン認識の実施例について述べる。オフライン認識の場合は、本装置に録音再生装置
（２）の録音音声を再生入力することにより文章作成を
行なうものであるため、まず録音再生装置（２）に文章
を録音する。また、録音再生装置（２）より音声入力を行なうた
め、入力切り換え部（４）により、録音再生装置（２）
と音声認識部（１）を接続する。文章録音時は、文節単位または単語単位に発声し、文
節および単語間に無音区間を作る。また、第１図に示す
如き本装置専用の録音再生装置（２）を使用する場合
は、文節および単語の区切りを明確にするため、区切り
を示すビープ音を、録音再生装置（２）または本ディス
クテーティングマシン本体に設定されている区切りキー
（71）を押し録音する。また、単語登録をした単語は、単語単位に発声をおこ
なうが、録音再生装置（２）がキャラクター音発生機能
を持ち、かつ入力したい単語に相当するキャラクターを
もっていれば、音声の替わりにそのキャラクター音を録
音してもよい。また、文章単位の頭だしや文章と文章の間に録音され
たノイズを音声と誤り認識してしまうことを避けるため
に文章の始まりと終わりを示す信号を音声と共に録音し
ておく。ただし、この信号の録音方法は、録音再生装置（２）
がマルチトラック方式か否かにより音声登録のところで
述べたように変わる。第11図は、マルチトラック方式お
よび、第12図はシングルトラック方式の図である。第11
図（ａ）、第12図（ａ）は、DTMF信号等の音が、録音さ
れている区間を音声領域として、検出する方法である。第11図（ｂ）、第12図（ｂ）は、DTMF信号等の音を、
文章の始まる前に録音し、文章が終了したときに、再度
録音し、かかる両信号に挾まれた区間を音声領域とし
て、検出する方法である。また、第12図のシングルトラック方式の場合は、音声
区間とDTMF信号等の音が、重なることを考え、音声帯域
外のDTMF信号等を用いる。また文章を認識するときは、信号の録音されている前
後t4およびt5の区間をサンプリングし、音声か否かを判
定するため必ずしも文章の始まりと信号の始まり、およ
び文章の終わりと信号の終わりが一致している場合はな
い。このため、文章を発声するタイミングとキーを押す
タイミングが少々ずれても認識可能である。次に、録音再生装置（２）を本装置の本体と接続し録
音音声を再生し認識処理を行なうが、この録音音声を認
識させる前に認識速度のモードを、録音音声を再生速度
を速くして、認識時間短縮を行なう早聞き認識のモード
か、通常の再生速度で認識させるモードか、時間的に余
裕があり、高認識率を必要とするときは、二度再生認識
モードのいずれかのモードに設定しておく。まず早聞き認識モードの実施例を記す。早聞き認識モードでは、録音音声の再生速度を速くし
ているため、入力音声の特性が、通常の再生速度で再生
された登録音声より作成した、標準パターンとは特性が
違っており、単に再生速度を速くした音声を入力して
も、正確に音声認識を行なえない。そこで、再生速度を速くした音声を正確に認識するた
め、サンプリング周波数を変更する。以下に、かかる方
法の、実施例を記す。第５図の特徴抽出部（12）のサンプリング周波数制御
部（12d）は、特徴抽出部（12）の入力音声のサンプリ
ング周波数を音声の標準パターンを作成したときのサン
プリング周波数の（再生速度／録音速度）倍に設定し、
音声をサンプリングし分析する。特徴抽出部（12）以降
の処理はオンライン認識時の実施例と同様。ただし、録
音再生装置（２）の録音文章に、文節および単語の区切
りを明確にするための区切りを示すビープ音を録音済み
の文章を入力し、特徴抽出部（12）がかるビープ音を検
出したとき、特徴抽出部（12）は無音区間検出信号
（ロ）の代わりに、ビープ音検出信号（ロ′）を発生す
る。受信信号が、無音区間検出信号（ロ）でなく、ビー
プ音検出信号（ロ′）の場合、入力切り換え部（４）の
信号発生部（42）は、文章の文節または単語の区切りを
表わすビープ音の発生は行なわない。また、音声認識部（１）が、単語を示すキャラクター
音を認識した場合は、かかるキャラクター音に対応した
単語を認識結果として出力する。次に二度再生認識モードの実施例を記す。本モードは、まず録音音声を再生し本装置に入力す
る。このとき音声認識部（１）の前処理部（11）で録音
音声の音圧変動を全て読みとり、このデータを第４図に
示す音圧変動メモリ（11b）に記憶する。次ぎに、再び
録音音声を再生し本装置に入力する。このとき前処理部
（11）では、音圧変動メモリ（11b）に記憶されたデー
タを使用し、特徴抽出部（12）への入力音圧を第18図に
示す如く、音声認識に最も適したレベルにあわせるよ
う、AGC回路（11a）の増幅率を調整する。即ち、利得Ｇ
を固定利得Ａに制御電圧V_G（可変調整される）を乗じた
ものとする。また、二度再生認識モードの別の実施例として、多数
回再生認識モードも考えられる。これは、録音文章を多
数回再生入力し、入力のつど、音声認識部（１）におけ
る認識方法を変更することによって認識された結果を比
較し、最も確からしさの尤度の大きいものを、選択する
方法である。また、録音再生装置（２）に登録用音声を録音してお
らず、かつ録音再生装置（２）によっては再生速度を速
くした場合の周波数特性と通常の再生速度の場合の周波
数特性が違うものを使用するとき、または音声の標準パ
ターン作成に使用した録音再生装置（２）と違う周波数
特性をもつ録音再生装置（２）に録音した文章を認識さ
せるとき、または音声の標準パターン作成に使用した録
音再生装置（２）と規格上は同じ周波数特性を有するが
使用部品等の誤差の影響をうけ実際の周波数特性が音声
の標準パターン作成に使用した録音再生装置（２）と違
っている録音再生装置（２）に録音した文章を認識させ
るときは、以下に述べる周波数特性の影響を補正する機
能を使用する。まず、録音再生装置（２）の周波数特性を測定する場
合の基準となる基準正弦波信号を基準信号発生部（42）
で発生させ、録音再生装置（２）に録音する。しかる後
に録音されたかかる基準正弦波信号を本装置に再生入力
する。入力された基準正弦波信号を音声認識部（１）は
分析し、録音された基準正弦波信号と、基準信号発生部
（42）で発生させた基準正弦波信号との周波数特性の差
を求め、録音された基準正弦波信号と、基準信号発生部
（42）で発生させた基準正弦波信号との周波数特性の差
を小さくするように、補正をかける。補正をかける手段
は、音声認識部（１）の特徴抽出部（12）の特徴抽出方
法により、多数考えられる。例えば第13図に示したよう
に、直列接続されたバンドパスフィル（BPF）と増巾器
（AMP）との並列接続体からなるアナログフィルターバ
ンク方式とするものであれば、増幅器（AMP）の増幅率
を調整することにより、基準信号発生部（42）で発生さ
せた基準正弦波信号との周波数特性の差を小さくするよ
うにフィルタからの出力を調整する。また、特徴抽出部
（12）の特徴抽出方法として、ディジタルフィルターを
もちいていれば、ディジタルフィルターの特性を決めて
いるパラメータを変更すればよい。その他、音声認識部
（１）の特徴抽出部（12）の特徴抽出方法に対応して、
あらゆる方法が考えられる。前記までの操作により、音声入力した文章はかな列に
変換された事となる。このかな列変換された文章が入力
した文章と違っている場合の修正方法を第14図を使用し
それぞれの誤りかたに場合分けして以下に述べる。以下
の手順により修正を行なう。第14図（ａ）は入力文章、同図（ｂ）は入力音声、同
図（ｃ）は認識結果、同図（ｄ）〜（ｈ）は修正過程、
同図（ｉ）は修正結果を表わしている。まず、単語として発声したものが文節として誤認識さ
れた場合の修正法について述べる。同図（ｃ）に示した
ように単語“C"として発声したものが、文節“しー”と
して認識された場合、先ずカーソル（Ｘ）を誤った単語
の部分へ移動する［同図（ｄ）ｉ］。次ぎに単語次候補
キー（72）を押し単語の次候補を表示させる［同図
（ｄ）ii］。この結果が正しければ次の修正部分へ進
む。もしこの結果が誤っていれば、再び単語次候補キー
（72）を押し単語の次候補を表示させる。この操作を正
解が表示されるまで繰り返す。次ぎに、文節として発声したものが単語として誤認識
された場合の修正法について述べる。文節“い”として
発声したものが、単語“E"として認識された場合、先ず
カーソル（Ｘ）を誤った文節の部分へ移動する。次ぎに
文節次候補キー（73）を押し文節の次候補を表示させ
る。この結果が正しければ次の修正部分へ進む。もしこの結果が誤っていれば、文節次候補キー（73）
を押し文節の次候補を表示させる。この操作を正解が表
示されるまで繰り返す。単語前候補キー（74）を押すことにより単語、文節前
候補キー（75）を押すことにより文節、それぞれの一つ
前の候補を表示させることも出来る。上述の２通りの修正法で正解が得られないときは音節
単位の修正や、単語または文節または音節を再発声入力
する。また、再発声入力時に再び、文節を単語認識したり、
単語を文節認識したりすることを避けるため、候補作成
部（15）を、単語認識部（13）より送られてきた認識結
果のみを認識結果としてみなし、文節認識部（14）より
送られてきた認識結果は、無視するよう外部より制御で
きる。また、候補作成部（15）を、文節認識部（14）より送
られてきた認識結果のみを認識結果としてみなし、単語
認識部（13）より送られてきた認識結果は、無視するよ
う外部より制御できる。上述の次候補キーとは、以下に述べる機能を有するキ
ーの事であり、第15図を使用し説明する。本装置の音声認識部（１）では、単語認識と文節認識
が並走しており、単語および文節の両認識結果を求めて
いることは先に述べたが、この両認識結果より、文節認
識処理の結果を尤度の大きいものから順番に認識結果を
表示装置（６）に表示させるためのキーが文節次候補キ
ー（73）であり、単語認識処理の結果を尤度の大きいも
のから順番に認識結果を表示装置に表示させるためのキ
ーが単語次候補キー（72）であり、現在表示装置に表示
されている認識結果より、一つ尤度の大きい認識結果を
表示装置（６）に表示するキーが、単語前候補キーおよ
び文節前候補キーである。第15図は候補作成部（15）の候補バッファ（15a）で
ある。この図は、一位の認識結果が、「たんご」であ
り、これは単語認識部（13）から送られてきた認識結果
であることを（単語）で表わしている。同様に二位の認
識結果が、「たんごを」であり、これは文節認識部（1
4）から送られてきた認識結果であることを（文節）で
表わし、三位の認識結果が、「たんごに」であり、これ
は文節認識部（14）から送られてきた認識結果であるこ
とを（文節）で表わし、四位の認識結果が、「たんこ
う」であり、これは単語認識部（13）から送らてきた認
識結果であることを（単語）で表わしている。いま、表示装置（６）には、「たんご」が表示されて
いるとする。かかる状態で文節次候補キー（73）を押す
と表示装置（６）には「たんごを」が表示される。ま
た、単語次候補キー（72）を押すと表示装置（６）には
「たんこう」が表示される。また、表示装置（６）には、「たんこう」が表示され
ている場合に、単語前候補キー（74）を押すと表示装置
（６）には「たんご」が表示され、文節前候補キー（7
3）を押すと表示装置（６）には「たんごに」が表示さ
れる。次ぎに一文節全体の一括修正方法について述べる。第14図（ｅ）の例は単語「Ｔ」を「Ａ」と誤認識した
例である。先ずカーソルを修正したい単語へ移動する
［同図（ｅ）ｉ］。次ぎに単語次候補キー（72）を押し単語の次候補を表
示させる［同図（ｅ）ii］。この結果が正しければ次の
修正部分へ進む。もしこの結果が誤っていれば、単語次
候補キー（72）を押し単語の次候補を表示させる。この
操作を正解が表示されるまで繰り返す。正解が表示され
無ければ、再発声を行ない、再入力をおこなう。前単語
候補キー（74）を押すことにより一つ前に表示した単語
の候補を表示させることも出来る。次ぎに一単語全体の一括修正方法について述べる。第14図（ｆ）の例は文節「がめんの」を「がいねん
の」と誤認識した例である。先ずカーソルを修正したい
文節へ移動する［同図（ｆ）ｉ］。次ぎに文節次候補キー（73）を押し文節の次候補を表
示させる［同図（ｆ）ii］。この結果が正しければ次の
修正部分へ進む。もしこの結果が誤っていれば、文節次
候補キー（73）を押し文節の次候補を表示させる。この
操作を正解が表示されるまで繰り返す。正解が表示され
無ければ、再発声を行ない、再入力をおこなう。前文節
候補キー（75）を押すことにより一つ前に表示した文節
の候補を表示させることも出来る。次ぎに音節単位の修正方法について述べる。第14図（ｈ）の例は文節「おんせいで」を「おんけい
で」と誤認識した例である。この例は音節「け」を
「せ」に修正する場合であるが、先ずカーソル（Ｘ）を
修正したい音節「け」へ移動し［同図（ｈ）ｉ］、音節
次候補キー（76）を押す。音節次候補キー（76）を押す
ことにより修正したい部分の音節と最も距離が近い音節
が表示される［同図（ｈ）ii］。正解が表示されれば、
次の修正部分へ移動する。もしこの結果が誤っていれ
ば、再度音節次候補キーを押し音節の次候補を表示させ
る。この操作を正解が表示されるまで繰り返す。正解が
表示され無ければ、再発声により再入力を行なう。再入
力の結果が間違っている時は上記の手順により再び修正
する。この操作を正解があ表示されるまで繰り返す。また前音節候補キー（77）を押すことにより音節の一
つ前の候補を表示させることも出来る。音節を削除したい時は、カーソルを修正したい音節へ
移動し削除キー（78）を押し削除する。音節を挿入したい時は、カーソルを修正したい音節へ
移動し挿入キー（79）に押し挿入する。次に第16図を使用し、数音節修正方法について記す。この例は、同図（ａ）の入力文章“かいじょう”を同
図（ｂ）「かんじょう」と誤認識した例である。この場
合、まずカーソル（Ｘ）を修正したい音節にもっていき
［同図（ｃ）］、“かい”と再発声入力する。かかる再
発声入力音声は音声認識部（１）で認識され、認識結果
は表示装置（６）に表示される。認識結果が正しけれ
ば、次の修正部へすすむ。もし、同図（ｄ）に示すよう
に、「かい」を「かえ」と誤認識した場合、単語の場合
は、単語次候補キー（72）を押す。文節の場合は、文節
次候補キー（73）を押す。第16図は単語の場合の例であ
るので、以下単語の修正方法について記す。同図（ｄ）
の状態で、単語次候補キー（72）を押した場合、まず、
制御部（５）は、単語辞書（13d）より、修正前の同図
（ｂ）の認識結果「かんじょう」と再発声後の同図
（ｄ）の認識結果「かえじょう」とを比較し、同一部分
「じょう」をみつける。次に、制御部（５）は、単語辞
書（13d）より、かかる同一の部分「じょう」をもつ単
語を選ぶ。同図（ｆ）は単語辞書（13d）の記憶内容を
示しており、同図（ｇ）は記憶内容より選んだ「じょ
う」をもつ単語を示している。次に制御部（５）は、同
図（ｇ）に記した単語と、再発声後の認識結果「かえじ
ょう」との尤度を計算し、最も尤度値の大きい単語を表
示する［同図（ｅ）］。次に文節または単語の認識境界誤りを修正する場合に
ついて述べる。第14図（ｇ）の例は文節「ぶんしょうを」を「ん」と
「し」の間に［^▽］印で示す無音区間があると誤認識
し、単語「ぶん」と文節「しょうを」というように二つ
に分けて誤認識した例である。この場合認識境界誤りを
修正しなければならない、認識境界区切り記号を削除し
たい場合は、削除したい認識境界区切り記号にカーソル
（Ｘ）を移動し［同図（ｇ）ｉ］、削除キー（78）を押
す［同図（ｇ）ii］。認識境界区切り記号を挿入したい
場合は挿入したい位置にある音節にカーソル（Ｘ）を移
動し挿入キー（79）を押す。ただし、後に述べるように録音再生装置（２）の区切
りビープ音と、記憶装置（８）に記憶された認識結果に
付加された区切り記号は、録音再生装置（２）と記憶装
置（８）の同期をとるための目印となるので、対応はと
っておかなければならない。ゆえに、この時記憶装置
（８）に区切り記号が挿入削除されたことを記憶装置
（８）に記憶しておく。例えば、第14図（ｂ）に示した文章の一部が、第14図
（ｇ）iiに示すように、記憶装置（８）に記憶されてい
るものとする。（ｇ）ｉの文章を、（ｇ）iiに示すよう
に修正した場合、記憶装置（８）に記憶されていた区切
り記号「^▽」は、第14図（ｊ）に示しように、記
号「^▼」に改められる。記号「^▼」は、区切り記
号「^▽」が削除されたことを示す記号であり、認識単位
を示す記号には用いられず、録音再生装置（２）等との
制御のみに用いられる記号である。このような構成にすれば、区切り記号「^▽」を削除し
た後も、録音再生装置（２）に録音されたビープ音と、
記憶装置（８）に記憶された記号「^▽」「^▼」を用いる
ことにより、同期をとりながら両装置を制御できる。以上は、区切り記号「^▽」を削除した場合の例である
が、挿入された場合も同様の考え方ができる。つまり、
制御信号としては用いられず、区切りのみを表わす特定
の記号を、区切り記号「^▽」の替わりに挿入すればよ
い。以上の修正手順により、第14図（ｉ）に示すように、
文章を修正する。認識境界誤り修正を行なった後認識境界誤り修正を行
なった認識単位について、修正手順に従って修正を加え
る。再発声による修正の場合、標準パターンを登録した
人なら誰の音声でも認識できるので文章の録音者でなく
とも修正操作を行なえる。以上、かな列文章の修正方法を述べたが、修正を補助
する機能としては以下に述べる機能を有する。表示装置（６）に表示された文字列上のカーソル移動
と表示画面のスクロール機能により、記憶装置（８）よ
り順次記憶文章を表示画面上に表示できるが、この時画
面上に表示されている部分に対応する音声が録音再生装
置（２）から再生される。また、上述の機能とは逆の機能も有し、録音再生装置
（２）から再生されている部分に対応した文字列が表示
装置（６）に表示される。また、上述のどちらの方法の場合も録音文章に録音さ
れている区切り記号音と、表示側に記録されている区切
り記号を、同期を取るタイミング信号として使用し、録
音再生装置（２）の再生と表示とがお互いに同期をとり
ながら動作するよう制御している。また、キーボード
（７）、または録音再生装置（２）より再生を止める信
号が入力されたとき、再生を止めるとともに、表示のス
クロールまたはカーソルの移動を止める。以上の録音再生装置（２）の再生と表示との同期機能
により、再生音を聞きながら文字列の確認を行なうこと
ができ、修正個所の発見を容易にする。ここで述べている同期のとり方として、再生されてい
る部分に対応する記憶装置（８）の文字列を表示装置
（６）に表示する方法と、再生されている部分に対応す
る部分より区切り記号一つ遅れた部分のかな列を表示装
置（６）に表示する方法とがある。この場合、修正のための表示を停止したときには既に
録音音声の修正部分は再生されているため再度修正部分
を再生するためには、再生された文章より修正したい部
分の頭だしを行なう必要がある。そこで、この方法を採
用する場合は、表示を停止したとき、自動的に録音再生
装置（２）を一つ前の区切り記号までバックトラックす
る機能をもたせる。また、録音再生装置（２）に、テープレコーダを使用
した場合、再生部分をモータの回転により制御するこ
と、テープのたるみなどにより、修正部分に対応した部
分の頭出しが正確に行なえない場合がある。このような場合は、入力されてくる音声を、一定時間
長だけPCM録音やADPCM録音で記憶しておき、入力された
音声を聞き返したい場合は、PCM録音やADPCM録音音声を
聞き返す機能を付加する。第17図は上記の、機能の一実施例であり、PCM録音の
データを記憶しておくPCMデータメモリの図である。図
中の数字01〜05はアドレスを示している。入力音声は、
第14図に記した“わたしわ｜てん｜し−｜あ−る｜て−
｜がめんの｜ぶんしょうを｜てん｜おんせいで｜しゅう
せいした｜まる”という、文章である。上記の、音声が入力されたとき、PCMデータメモリ（D
M）には、01番地に最初の無音区間までの音声“わたし
わ”が記憶される。02番地に２番目の無音区間までの音
声“てん”が記憶される。05番地に５番目の無音区間ま
での音声“て−”が記憶される。このとき、PCMアドレ
スポインタ（AP）は、PCMデータメモリに記憶されてい
るデータのうち、１番先に記憶されたデータのアドレス
を記憶しておく。本例では、01が記憶される。この段階でPCMデータメモリは一杯になる。次に、音声が入力されたときには、PCMデータメモリ
（DM）に記憶されているデータのうち、１番先に記憶さ
れたデータのアドレスに、入力された音声を記憶する。
本例では“わたしわ”が記憶されていたアドレス01に
“がめんの”を記憶する。このとき、PCMアドレスポイ
ンタ（AP）は、PCMデータメモリ（DM）に記憶されてい
るデータのうち、１番先に記憶されたデータのアドレス
を記憶しておく。本例では、02が記憶される。この状態で、PCMデータメモリ（DM）の内容を再生す
る場合、PCMアドレスポインタ（AP）の指している、ア
ドレスから、再生する。本例では、02,03,04,05,01の順
番に再生していく。かかる方法により、何度でも、正確に素早く、音声を
聞き換すことが可能となる。また、画面上の認識単位の区切り記号上へカーソル
（Ｘ）を移動し録音音声の頭出しキー（70）を押すこと
により、カーソルが示している認識単位に対応した録音
再生装置（２）側の区切り記号音部分を録音文章より捜
し出し、これに続く文章を再生する機能を有する。以下
に、かかる機能を実施例を示す。認識した文章の確認のため、認識結果を記憶装置
（８）より読み出し、表示装置（６）に冒頭より表示さ
せる。この時、第19図、制御部（５）の区切り記号カウ
ンター（5a）は、記憶装置（８）より読み出された区切
り記号の数を計数していく。読み出した認識結果が誤っ
ている場合は、誤っている部分にカーソルをあて、頭出
しキーを押す。制御部（５）は、録音再生装置（２）に
録音されている文章を、早送り再生モードで再生させ
る。特徴抽出部（12）のビープ音カウンター（12e）
は、録音再生装置（２）より入力される文章中の区切り
をしめすビープ音を計数する。比較回路（5b）は、ビープ音カウンター（12e）の値
が、先に述べた区切り記号カウンター（5a）の値より、
１つ小さくなったとき、信号（ハ）を録音再生装置
（２）に送り、再生を止める。また、認識結果、および修正を終了した文章の確認の
ためには、記憶装置（８）の記憶データを表示装置
（６）に文字列で表示させ、表示画面上に表示された文
字列を目で追い、読まなければならないため、非常に目
が疲れる。かかる点に鑑み、本装置は認識結果を記憶させた記憶
装置（８）上の文字列を、音声合成機能により読み上げ
る機能をもたらせることにより、認識結果、および修正
を終了した文章の確認を音声合成音を聞くことにより行
なえるようにできる。この場合も音声合成部（９）と記憶装置（８）と録音
再生装置（２）と表示装置（６）との同期を取るタイミ
ング信号として、区切り記号を使用する。つまり、音声合成部（９）が記憶装置（８）より読み
上げている部分に相当する文字列が表示装置（６）に表
示され、同時に録音再生装置（２）より録音部分を頭出
ししている。この方法により、音声合成音の読み合わせ
機能により誤りを発見し修正のために音声合成の読み合
わせ機能を停止させたとき、表示装置（６）の表示も録
音再生装置（２）の録音部分も誤り部分を示しており、
即座に修正を行なうことができる。ここで述べている同期のとり方として、音声合成機能
により読み上げられている部分に対応する記憶装置のか
な列を表示装置（６）に表示すると同時に、録音再生装
置（２）に録音されている文章より該当する音節部分を
再生する方法と、音声合成機能により読み上げられてい
る部分に対応する部分より、区切り記号一つ遅れた録音
再生装置（２）に録音されている文章部分再生する方法
とがある。後者の場合、修正のため音声合成を停止した
とき、録音再生装置（２）は修正したい部分より手前で
停止しているため、この状態で再生すれば直ぐに修正部
分の音声を再生できる。前者の場合は修正のため音声合
成を停止したときには既に録音音声の修正部分は再生さ
れているため再度修正部分を再生するためにはバックト
ラックする必要がある。そこで、前者の方法を採用する
場合は表示を停止したとき、自動的に録音再生装置
（２）が一つ前の区切り記号までバックトラックする機
能をもたせるのが好ましい。以上、認識結果を記憶装置（８）に記憶しておく実施
例を記してきたが、別の実施例として、録音再生装置
（２）に認識結果を記憶させてもよい。記憶装置（８）に記憶された、認識結果を、原文の録
音された録音再生装置（２）に記録しておけば、原文と
認識結果が、同一記録媒体に記憶できるため、原文と認
識結果の管理が容易になる。また、録音文章を、再生入力しながら、認識した結果
を録音再生装置（２）に録音いていくことにより、外部
記憶装置が不要となる。いずれの場合も、マルチトラック方式の録音再生装置
（２）を用いることにより、録音音声を再生しながら、
音声の録音されていないトラックに認識結果を記憶させ
ることができる。（ト）発明の効果本発明の音声認識システムによれば、誤認識された語
を再発声入力し、１回目の認識結果と２回目の認識結果
を比較し、両認識結果の同一部分をもとに辞書検索を行
ない、認識候補をもとめ、音声認識するため、正確で迅
速な認識結果修正が行なえる。

【図面の簡単な説明】第１図は本発明の音声認識システムを採用したディクテ
ーティングマシンの外観図、第２図はディクテーティン
グマシンの構成図、第３図は音声認識部（１）の構成
図、第４図は前処理部（11）の構成図、第５図は特徴抽
出部（12）の構成図、第６図は単独認識部（13）の構成
図、第７図は文節認識部（14）の構成図、第８図は入力
切り換え部（４）の構成図、第９図は見出し語と録音方
式とキャラクター音の関係図、第10図はキャラクター音
の録音方法と音声区間の関係図、第11図は録音再生装置
がマルチトラック方式の場合の録音方法を示す図、第12
図は録音再生装置がシングルトラック方式の場合の録音
方法を示す図、第13図は周波数補正回路例を示す図、第
14図は誤認識時の修正図、第15図は候補作成部（15）内
の候補バッファ（15a）を示す図、第16図は誤認識時の
数音節修正例を示す図、第17図はPCM録音方法説明図、
第18図はAGC動作の説明図、第19図は、区切り記号のカ
ウンターの説明図である。（１）……音声認識部、（２）……録音再生装置、
（３）……マイク、（６）……表示装置、（７）……キ
ーボード、（８）……記憶装置、（11）……前処理部、
（12）……特徴抽出部、（13）……単語認識部、（14）
……文節認識部。

Claims

(57)【特許請求の範囲】１．入力音声を認識して認識結果を求める音声認識部
と、該認識結果を表示する表示部と、該認識結果を記憶
する認識結果記憶部と、前記入力音声の認識結果が誤認
である場合に発話者に再発声を求め、前記認識結果を修
正する認識結果修正部と、を備えた音声認識システムに
於いて、前記認識結果修正部は、再発声された入力音声の認識結
果が誤認識である場合に、再発声された入力音声の認識
結果と再発声入力前の認識結果とを比較することによ
り、両認識結果が同一の部分を検出し、該同一の部分の
データについて辞書検索を行って認識候補語を選択し、
該選択された認識候補語と再発声された入力音声の認識
結果との尤度計算を行うことを特徴とする音声認識シス
テム。