JPH01161299A

JPH01161299A - 音声認識システム

Info

Publication number: JPH01161299A
Application number: JP62320212A
Authority: JP
Inventors: Masayuki Iida; 正幸飯田; Hiroki Onishi; 宏樹大西; Kazuyoshi Okura; 計美大倉
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 1987-12-17
Filing date: 1987-12-17
Publication date: 1989-06-23
Anticipated expiration: 2012-12-08
Also published as: JP2686085B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（イ）産業上の利用分野音声認識ンスアムに関するものである。

（１１）従来の技術音声をチープレコーグの如き録音再生装置に録音し、こ
れを再生して出力される再生音声を音声認識装置へ入力
することにより、音声認識を行ない、ニー　：Ｉｔを文
章化づ−る音声認識ジスｆ’ｉ−１、が開発非れつ”′
−）ある（特開昭５８−１５８７３６号）。

１０ｉ様４システムでは、入力音声を文節単位に認１像
°づる文節認識部と、入力８声を単語単位に認識する中
４語認識部との二つの認識部を備えるものがあり、この
場合、それぞれの認識部が出力した認識結果を一一一つ
にまとめ、確かさを示す尤度の一番犬、きなイ）のを１
位の認識結果として出力する事となる。

従来の断様なシステムて・は、出力された１位のＳど識
結果が誤＞’ｔいる場合は、次候補キーを押１コトニよ
り２位の認識結果を出力さ七イ、。このよ）にε（候補
キーを押すことにより、３位４１ケと順番に認識結果を
出力させる。

次候補キーの操作によ−）て正解が得られないときは、
再発声を行なうか、キー入力で修正を行なう。

（／・）発明が解決しようとする問題点従来ンステｌ、
では、正しい認識結果が得られず、再発声を行なう場合
、認識させたい語句全体を再発声し、再認識していた。

この場合、１回目の認識結果は、再認識萌には考方され
る事（ｊなかった。

例えは、認識中薄内の、頭の１音節だけが誤っ−でいる
場合でも、Ｃれ語全体を再発声し、再認識していたので
、１回目の認識結果が全く無駄になってしまう。また、
１回目の認識結果よりも、２回目の認識結果の方が認識
率が高いとはかぎらず、より誤った認識結果を招く場合
もある。

（ニ）問題点を解決するための手段本発明の音声８識シスデムは再発声入力の認識結果と再
発声入力前の認、識結果とを比較し、両認識結果が同一
の部分をもとに辞書検索を行なう。

次に、選択きれた語句と、入力語との尤度計算を行なう
ことにより、認識結果を求める。

（ホ）作用木登明番こよれば、１回目の発声と、２回目の発声とを
比較することにより認識結果を求めることに、ｒす、１
度の発声よりも正確な認識を行なえる。

（・＼〉　実施例第１図に本発明を採用してＩＴ声入力により文章作成す
るデイクチ−ティングマシンの外観図を示し、第２図に
該マシンの機能ブロック図を示す。

第２図に於て、（１）は第１図の本体（１００）内に回
路装備された音声認識部であり、その詳細は第３図のブ
ロック図に示す如く、入力音声信号の音圧調整を行う前
処理部（Ｕ）［第４図］、該処理部（１１）からの音圧
調整済みの音声信号からその音響特徴を示すバラメーク
を抽出する特徴抽出部（１２）［第５図］、該抽出部（
１２）から得られる特徴パラメータに基つき入力音声の
単語認識を行う単語認識ｆｆ１ｉ＜１３）［第６図］と
文節認識部（１４）［第７図］、及びこれらいずれかの
認識部（１３）、り１４）からの認識結果に基づき認識
単語文字列、或いは認識音節文字の候補を作成する候補
作酸部（１５）からなる。

更に第２図に於て、（２）は第１図に示す如く本体＜ｔ
ｏｅ）に機械的並びに電気的に着脱可能なチープレコー
グ等の録音再生装置、（３）は例えば第１図図示の如き
ヘッドホンタイプのマイクロホン、（４）は録音再生装
置（２）とマイクロボン（３）と音声認識部（１）との
あいたの接続切り換えを行う入力切り換え部［第８図］
である。（６）は認識結果に基−）き生成した文字列等
を表示するための表示装置、（７）は該ディクテーアイ
ングマシンの各種制御信号を入力するためのキーボード
、（８）は該デイクチ−ティングマシンで生成された文
字列を記憶する磁気う１イスク装置等の記憶装置、（９
）は該記憶装置の文字列を規則合成によりスピーカ（１
０）から読み上げるための音声合成部である。

尚、（５）はマイクロプロセッサからなる制御部であり
、Ｌ記各部の動作の制御を司っている。

上述の構成のデイクチ−ティングマシンに依る文章作成
方法としては〕二通りあり、それぞれに就いて以下に詳
述する。

第一の方法は、マイク（３）より生音声を音声認識部（
１〉に入力し、音声認識を行ない、入力音声を文字列に
変換し、表示装置（６）に表示し、同時に記憶装置（８
）に結果を記憶する。

第二の方法は、入力したい文章を予め録音再生装置（２
）に録音しておき、この録音再生装置（２ンを本装置に
接続し、録音文章を音声認識部〈１）に入力することに
より、音声認識を行ない、入力音声を文字列に変換し、
表示装置（６）に表示し、同時に記憶装置（８）に結果
を記憶する。

上述の様に、音声を入力する方法は、二通りあるので、
入力切り換え部く４）において、入力の切り換えを行な
う。また入力切り換え？ｌＦｌ！（４〉は、入力の切り
換えの他に、録音再生装置（２）に０．冴信号（インを
録音するのか、マイク（３〉より入力きれた音声を録音
するのかの切り換えも行なう。

以下に音声録音から文章作成までの動作を順次Ｓ羊述す
る。

（１）　音声登録処理８−声認識を行なうに先たち、音声認識に必要な音声の
標準パターンを作成するため、音声登録を行なう。

まず、音節登録モードについて述べる。

ここで述べている標準パターンとは、音声認識部（１）
の文節認識部（１４）でのパターンマッチイング時の基
準パターンとなるものであり、具体的に（Ｊ第７図の如
き文節認識部（１４）の音節標準パターンメモリ（１４
ｄ）に格納される。

本ディクデーーノイ〉グマンンに音声登録する方法は、
まず第７図のスイッチ（Ｌ４ｓｌ）を操作しパラメータ
ハフノア（１４ｄ）と音節認識部（１４ｂ）とを接続し
、次に述べる三方法がある。

第一の方法は該マシンの本体（１００）にマイク（３）
より直接登録音声を入力し、この登録音声を音声認識部
（１）で分析し、標準パターンを作成し、作成した標準
パターンをａ節標準バク−／メ七’、１（ｔ４ｄ＞およ
び記憶装置（８）に記憶させる方法である。

第二の方法は前もって登録音声を録音しておいた録音再
生装置（２）を本体（１００）に接続し、この録音登録
音声を再生することにより登録音声の入力をなし、この
入力した登録音声を音声認識部（１）で分析ｌ１、標準
パター〉・を作成し、作成した標準バク−〉をｆｆ−節
標準パターンメモリ（１４ｄ）および記憶装置（８）に
記憶きせる方法である。

第三の方法は本マシンの本体（１００）にマイク（３）
から直接登録音声を入力するが、このとき同時に録音再
生装置（２）を本体（１００）に接続しておきこの入力
きれた音声を録音再生装置（２）に録音しながら、本体
（１００）側ではマイク（３）からの登録音声の分析を
行ない標準パターンを作成し、作成した標準パターンを
記憶装置（８〉に記憶きせておく。そして、次にこのマ
イク（３）への音声入力が終了すると、これに引き続き
、録音再生装置（２）に録音きれた音声を再生し、この
録音された登Ｈ皆声を音声認識部（１）で分析し、標準
パターンを作成し、作成した標準バター〉を音節標準パ
ターンメモリ（１４ｄ）に記憶しておくと同時に、記憶
装置（８）にも上述のマイク（３）からの直接の登録音
声の音節標準パターンと共に記憶させる方法である。

この第３の方法に於ては、録音再生装置（２〉に録音し
、た音声は録音再生装置（２）の周波数特性を受けてい
るため、録音した音声から作成した標準パターンと、マ
イク（３）から直接入力した音声より作成し、た標準パ
ターンとを比べた場合、両標準パターンの間に違いが現
れる。故に録音音声を認識さゼるときは、録音音声より
作成した標準パターンを使用する必要があり、マイク（
３）から直接入力した音声を認識させるときは、マイク
（３）から直接入力した音声より作成した標準パターン
を使用する必要があるので、上述の如きの方法をとるこ
とによっ゛（、マイク（３）から直接登録した標準パタ
ーンと録音音声より作成した標準パターンの両パターン
を一回の音声登録操作によって作成し記憶できる。また
、−度録音再生装置（２）に登録音声を録音しておけば
標準パターンを作成していないデイクチ−ティングマシ
ン上にも登録者の発声入力を必要とせず、この録音音声
を再生入力するだけで、標準パターンが作成できる。ま
た、録音再生装置（２）に登録音声を録音し、さらにこ
の登録音声のあとに文章を録音しておけば、後にこの録
音再ノを装置（２）を本体（１００）に接続し、録音さ
れた音声を再生するだけで音声登録から、文章作成まで
、すべて自動的に行なえる。

尚、音声の標準パターンを作成する為の登録者の発声入
力は、本装置が一定の順序で表示装置（６）に表示する
文字を登録者が読み上げることにより行なわれる。

また、本マシン専用の表示機爺をもつ録音再生装ｗ（２
）を使用する場合はこの録音再生装置（２）単独で携帯
する時でもその表示画面に表示された見出し語に対応す
る音声を発声し録音再生装置（２）に録音する事で、標
準パターンの作成が可能となる。

上述の如く、標準パターンを作成するための登録音声を
録音再生装置く２）に録音する場合は、この録音された
登録音声より標準パターンを作成するときにノイズなど
の影響を受は録音音声とこれに対応するべき見出し語と
がずれる可能性があり、以下、第９図に基つき、説明の
ため録音再生装置としてテープレコーダを使用した場合
について述・＼る。第９図（ａ）はテープレコーダに標
準パターン作成のための登録音声を録音した状態のうち
、見出し語１あ」〜１か、に対応した登録音声′“オ°
′〜“か“′の間のテープの状態を表わしており、ここ
では°え“′と“おパの間に［ノイスコが録音された場
合を示す。第９図（ａ）の様に登録音声と登録音声との
間に［ノイズ］が録音されたテープにより音声登録を行
なった場合、１番目に録音された音が“あ′で２番目に
録音された音が“い′という様に、ただ単にテープに録
音された音の順序により、入力された登録音声がとの音
節に対応しているのかを決定していると、［）ｆス〕ま
で登録音声とみなして見出し語を対応させるので入力さ
れた実際の登録音声と見出し語とがずれてしまう。

ここで、第９図（ｂ）は［ノイズ］を音声と誤認識し、
見出し語１え」のところに［ノイズ］が入力きれ、見出
し語１お、のところに音節“え゛が入力された図である
。

この様に登録音声より標準／ζターンを作成するときに
ノイズなどの影響を受は録音音声と見出し語とがずれる
場合があるため、第９図（ｃ）に示すように、登録音声
の種類を示したキャラクタ−コード音を、登録音声に対
応許せて録音再生装置（２）に録音する。この方法によ
り、°う″　と°え′”の間に［ノイズ］が録音されて
いても、上述のように、入力諮れた音と見出し語とのず
れを防止する。

このずれを防止する特定周波数のキルラフターコード音
の録ｇ方法を、録音再生装置（２）のブーブｌ−コーダ
がシングルトラックである場合と、マルチ・トラックで
ある場合とにわ（′Ｊ−Ｃ説明する。

まず第１０図において、録音ブｉ式としてマルチトラ／
りをもつ録音再生装置を使用する場合について述へる。

録音方式としてマルチトラックをもつ録音再生装置を使
用丈る場合は同図（ａ）に示すように音声を録音してい
ないトラックに見出し語に対応するキャ７クターコード
を録音する。音〜認識部（１ンでは、二のキャラクタ−
コード音より、入力される音声の見出し語を知るととも
に、音声トラックに録音された音のうち、このキャラク
タ−コード音が録音された区間ｔ１に録音された音のう
ち、身圧し訴い値以ｊ―の条件をみたすもののみを音声
とみなし、分析を行なう。

または、同図（ｂ）に示すように、音声の始めと終わり
に見出し語に対応するキャラクタ−コードを録音し、音
声トラックに録音された音のうち、この音声の始めを示
すキャラクタ−コード音と、音声の終わりを示すキ・■
ラフターフード音の間の区間ｔ２に録音きれた音のうち
、音圧しきい値以上の条件をみたすもののみを音声とみ
なし、分析を行なう。

または、同図（Ｃ）に示すように、音声の始めに見出し
語に対応するギヘ・ラフターコードを録音する。音声ト
ラックに録音された音のうち、この音声の種類を示すキ
ャラクタ−コード音から、次の見出し語に対応するキル
ラフターコード音までの区間ｔ３に録音された音のうち
、音圧しきい値以」−の条件をみたＶもののみを音声と
みなし、分析を行なう。

また第二の方法とし２てシングルトラックの録音再生装
置（２〉の場合は、見出し語に対応するキ〜ラフターコ
ードを音声の分析周波数帯域外の音で表わし、音声の録
音さｎている１シツクに音声と共に録音する。この場合
のキー＼・ラフターコード音を録音する方法は、上述の
マルチトラックの場合と同様である。つまり、上述のｔ
ｌ、ｔ２、ｔ３の区間に録音諮れた音うち、上述と同様
の条件をみたすもののみを音声とみなし、分析を行なう
。

ただし、音声と、キャラクタ−コード音が重なっている
同図（ａ）に示した実施例の場合以外は、キトラクター
コード音に、音声の分析周波数帯域外の音を使用しなく
てもよい。

次ぎにアルファベット、数字およびカッコや句読点など
予め第６図の如き単語認識部（１３）の単語辞書（１３
ｄ）にキャラクタ−登録諮れている単語に対応する単語
標準パターンを、同図の単語標準パターンメモリ（１３
ｃ）に登録する。

まず、所定の操作により、第６図のパラメータバッファ
（１３ａ）と単語標準パターンメモリ（Ｌ３ｃ）とがス
イッチ（１３ｓｌ）により接続され、単語登録モードに
する。

つぎに、本装置オ体＜１００＞の表示装置（６）にアル
ファ・＼ット、数字およびカッコや句読点などが表示キ
れ、操作者はこれに対応する読みを音声入力する。

音声認識部く１〉では、この音声を分析し、単語標準パ
ターンメモリ（１３ｃ）に却語標準パターンの登録を行
なう。

上述までの操作により音声認識は可能となる。

しかし、自立語・付属語辞書（１４ｅ）および単語辞書
（１３ｄ）にない単語を認識させたいときは、自立語・
イ」属開辞書（１４ｅ）に認識させたい単語を登録する
か、単語辞書（１３ｄ）に認識させたい単語を、また単
語標準パターンメモリ（１３ｃ）に単語標準パターンを
登録する必要がある。ただし、自立語・付属語辞書（１
４ｅ）に単語を登録するが、単語辞書（１３ｄ）および
単語標準パターンメモリ（１３ｃ）に、単語および単語
標準パターンを登録するかは、使用者がその単語を文節
発声として認識させたいか、単語発意として認識させた
いかによって決定する。

また、自立語・付属語辞書（１４ｅ）にはあるが、単語
辞書（１３ｄ）になく、それでも単語認識で認識さゼた
い場合、かかる単語を単語辞書（１３ｄ）および単語標
準パターンメモリ＜１３ｃ）に、単語および単語標準パ
ターンを登録する必要がある。

以下に任意単語の登録方法について述べる。

単語の登録には、単語を自立語・付属語辞書（１４ｅ）
に文字列を登録する登録と、単語を単語標準パターンメ
モリ（１３ｃ）に１ａ語標準パターンを登録、および単
語辞書（１３ｄ）に文字列を登録する２方法がある。

単語を自立語・付属語辞書（１４ｅ）に登録する場合は
、登録したい単語を発声し本装置に入力する。

このとき本装置はこの音声を音声認識部（１）で認識し
、認識結果を表示装置（６）に表示する。使用者はこの
結果が正しければキーボード（７）の所定のキーを押し
、発声音声を表示装置（６）に表示されている文字列と
して自立語・付属語辞書（１４ｅ）に登録する。もし、
表示装置（６）に表示された認識結果が正しくなければ
、本装置の音節修正機能により表示装置（６〉に表示さ
れた認識結果を修正するか、登録したい部語を再発声す
る。また再発声した結果が誤っているときは、再び本装
置の音節修正機能により修正する。−上述の操作を表示
装置（６）に表示きれる文字列が登録したい単語と一致
するまで繰り返ず。

単語をｆｉｔ語標準標準パターンメモリ３ｃ）および単
語辞書（１３ｄ）に登録する場合は、単語を自立語・イ
リ属語辞書（１４ｅ）に登録する場合と同様にます”表
示装置（６）に登録したい文字列を正しく表示させる。

次に正しく認識された文字列と単語標準パターンを、単
語辞書（１３ｄ）および単語標準パターンメモリ（１３
ｃ）にそれぞれ登録する。

また、自然な発声で入力された音声を認識することは、
現在の音声認識技術のレベルを考えた場合、無理がある
。現在の音声認識技術のレベルでは、連続音節発声入力
が限度であるため、以下に連続音節発声入力の一実施例
に一ついて記す。

連続音節発声入力の場合も、上記の手順と同一であるが
、連続音節発声入力の場合は、単語標準パターンも連続
音節発声のパターンとなっているため、登録したい単語
を自然発声で再発声し、単語標準パターンを自然発声よ
り作成し、単語標準パターンと文字列を単語標準パター
ンメモリ（１３Ｃ）および単語辞書（１３ｄ）にそれぞ
れ登録Ｖる。

以上の操作により、音声認識による文章作成のために必
要なデータを登録できた事となる。

（ｉ）　　文章作成以下に文章作成の実施例について述べる。

まず、認識動作を行なう場合は、単語認識部（１３）の
スイッチ（１３ｓｌ）は、パラメータバッファ（１３ａ
）と単語判定部（１３ｂ）を接続する様に、文節認識部
（１４）のスイッチ（１４ｓｌ）は、パラメータバッフ
γ（１４ａ）と音節認識部（１４ｂ）を接続゛りる様に
設定する。

文章作成には三方法がある。

第一の方法は本装置の重体に作成したい文章を音声によ
りマイク（３）から直接入力するオンライン認識方法で
ある。

第二の方法は文章を録音しておいた録音再生装置（２）
を本装置に接続し、録音文章を再生し、認識させるオフ
ライン認識である。

まず、オンライン認識の実施例について述へる。

オンライン認識の場合は、本装置にマイク（３）より直
接文節単位または＃語単位に発声した文章を音声入力す
るので、所定の操作により、入力切り換え部（４）でマ
イク（３）と音声認識部（１）を接続する。

また、マイク（３）より入力している音声を録音再生装
置（２）に記録しておさたいときは、録音再生装置（２
）、を本体に接続し、入力切り換え部（４）をマイク（
３）の出力と録音再生装置く２）の録音端子とを接続す
る。

また同時に、入力切り換え部（４）は、後述の様に無音
検出信号が特徴抽出部り１２）より入力された場合、文
節、または単語区切りを示すビーブ音を録音するよう機
能する。

音声認識時は、単語認識部（１３）と文節認識部（１４
）が起動している。

マイク（３）より入力された音声は、前処理部（１１）
で入力音声を音声分析に適した特性になるよう処理を施
され（例えば入力音声の音圧が小きい時は、増幅器によ
り音圧を増幅したりする処理を行なう）、特徴抽出部（
１２）に送られる。

特徴抽出部（１２）では、第５図に示す如く、前処理部
（１１）より入力され−〔きた音声を分析部（１２ａ）
で分析し特徴抽出を行ない、パラメータバッファ＜　１
２ｃ　）に記憶する。

同時に、特徴抽出部（１２）の分析車位判定部（１２ｂ
）では、分析部（１２ａ）の分析結果より、音節または
文節単位に発Ｐされたあとの無音区間、および文節また
は単語単位に発声されたあとに録音されたビープ音（詳
細は後述のオフライン認識の実施例に示す。）の検出を
行なっており、無音区間を検出した場合、無音区間検出
信号（ロ）を発生する。

かかる無音区間検出信号（ロ）を受は取ったパラメータ
バッファ（１２ｃ）は、記憶している特徴パラメータを
単語認識部（■３）と文節認識部（１４）に送リ、記憶
内容を消去する。

単語認識部’（１３）に入力された特徴バラメークは、
第６図に示されたパラメータバッファ（１３ａ）に記憶
きれる。＠語判定部（１’ｌｂ）では、パラメータハラ
ノア＜１３ａ）に記憶された特徴パラメータと単語標準
パターンメモリ（１３，ｃ　）とを比較し、パラメータ
バッファ（１３ａ）に記憶された特徴パラメータと、光
度の大きい単語標準パターンをもつ単語を、単語辞書＜
１３ｄ）より複数語選び、選ばれた輩語の文字列とその
尤度値を候補作成部（１５）に送る。

一方、文節認識部（１４）に入力された特徴パラメータ
は、パラメータバッファ（１４ａ）に記憶される。音節
認識部（１４ｂ）では、パラメータバッファ（１４ａ）
に記憶された特徴パラメータと音節標準パターンメモリ
（１４ｄ）とを比較し、パラメータバッフγ（１４ａ）
に記憶されノー特徴パラメータを音節列に変換し、かか
る音節列を文節判定部（１４ｃ）へ送る。文節判定部（
１４ｃ）では入力された音節列と自立語・付属語辞書（
１４ｃ）に登録されている単語を比較し、自立語と付属
語を組み合わせて尤度の大きい文節を複数組作成し、作
成した文節の文字列とその尤度値を候補作成部（１５）
に送る。

候補作成部（１５）は入力された文字列から尤度の大き
いものを複数個選び、尤度値と単語認識部（１３）から
送られてきたデータか文節認識部（１４）から送られて
きたデータかを示すフードを付加し記憶する。同時に、
尤度の最も大きいものの文字列を、表示装置に表示させ
る信号を制御ｍ（５）に送る。制御部（５）は、この信
号を受は尤度の最も大きいものの文字列の後に区切り記
号７マーク「７」を一つＩ−４、例えば第１４図（ａ）
の入力文章に対して第１４１囚（ｃ）に示Ｖような形式
で表示装置に表示させる。同時に候補作成部（１５）は
制御部（５）に、候補選択部＜１５ンに記憶された内容
を記憶装置（８）に記憶きせる信号を送る。制御部（５
）はこの信号を受（）、候補作成部（１５）に記憶され
た文字列の後に区切り記号を表わすフードを付加した形
で記憶装置（８）に記憶させる。この外部記憶装置に記
憶された文字列は、ワープロの一次原稿とする。一般的
にはフロッピーディスクを用いる力釈このとき記憶装Ｆ
（８）のファイルのフォーマットはワープロのファイル
フォーマットに合わせておく必要がある。

また、この無音区間検出信号をうけとった第８図に示す
入力切り換え部（４）の信号発生部（４２）は、文章の
文節または単語の区切りを表わすビーブ音を発生し、か
かるビーブ音をスイッチ（４１〉に入力する。スイッチ
（４１）は、マイク（３〉から入力きれる音声と、信号
発生部（４２）より入力きれるビーブ音を、録音再生装
置（２〉に録音するよう、回路を接続し、録音再生装置
（２）に録音されている文章の文節または単語の区切り
と見なきれた無音区間にビーブ音を録音する。

次ぎに、オフライン認識の実施例について述べる。

オフライン認識の場合は、本装置に録音再生装置（２）
の録音音声を再生入力Ｖることにより文章作成を行なう
もの、であるため、ます録音再生装置（２）に文章を録
音する。

また、録音再生装置（２）より音声入力を行なうため、
入力切り換え部（４）により、録音再生装置（２）と音
声認識部（１）を接続する。

文章録音時は、文節栄位または単語単位に発声し、文節
および単語間に無音区間を作る。また、第１図に示す如
き本装置専用の録音再生装置（２〉を使用する場合は、
文節および単語の区切りを明確にするため、区切りを示
ｒビープ音を、録音再生装置（２）または本デイクチ−
ティングマシン本体に設定されている区切りキー（７１
）を押し録音する。

また、屯語登録をした単語は、単語単位に発声をおこな
うが、録音再生装置（２）がキヘ・ラフターａ発生機能
を持ち、かつ入力したい単語に相当するギヘ・ラフター
をもっていれは、音声の替わりにそのキャラクタ−音を
録音してもよい。

また、文章単位の頭たしゃ文章と文章の間に録音された
ノイズを音声と誤り認識してしまうことを避（′３るた
めに文章の始まりと終わりを示す信号を音声と共に録音
しておく。　　　　　　　・ただし、この信号の録音方
法は、録音再生装置（２）がマルチトラック方式か否か
により音声登録のところで述べたように変わる。第１１
図は、マルチトラック方式および、第１２図はシングル
トラック方式の図である。第１１図（ａ）、第１２図（
ａ、）は、Ｉ）ＴＭＦ”信号等の音が、録音されている
区間を音声領域として、検出する方法である。

第１１図、（ｂ）、第１２図（ａ）は、ＤＴＭＦ信号等
の音を、文章の始まる前に録音し、文章が終了したとき
に、再度録音し、かかる両信号に挾まれた区間を音声領
域として、検出する方法である。

また、第１２図のシングルトラック方式の場合は、音声
区間とＤＴＭＦ信号等の音が、重なることを考え、音声
帯域外のＤＴＭＦ信号等を用いる。

また文章を認識するときは、信号の録音されている前後
ｔ４およびｔ５の区間をサンプリングし、音声か否かを
判定するため必ずしも文章の始まりと信号の始まり、お
よび文章の終わりと信号の終わりが一致している必要は
ない。このため、文章を発声するタイミングとキーを押
すタイミングが少々ずれても認識可能である。

次に、録音再生装置（２）を本装置の本体と接続し録音
音声を再生し認識処理を行なうが、この録音音声を認識
させる前に認識速度のモードを、録音音声の再生速度を
速くして、認識時間短縮を行なう早聞さ認識のモードか
、通常の再生速度で認識させるモードか、時間的に余裕
があり、高認識率を必要とするときは、二度再生認識モ
ードのいずれかのモードに設定しておく。

まず早聞き認識モードの実施例を記す。

早聞き認識モードでは、録音音声の再生速度を速くして
いるため、入力音声の特性が、通常の再生速度で再生さ
れた登録音声より作成した、標準パターンとは特性が違
っており、単に再生速度を速くした音声を入力しても、
正確に音声認識を行なえない。

そこで、再生速度を速くした音声を正確に認識するため
、サンプリング周波数を変更する。以下に、かかる方法
の、実施例を記す。

第５図の特徴抽出部（１２）のサンプリング周波数制御
部（１２ｄ＞は、特徴抽出部（１２）の入力音声のツノ
ブリング周波数を音声の標準パターンを作成したときの
サンプリング周波数のく再生速度／録音速度）倍に設定
し、音声をサンプリングし分析する。特徴抽出部（１２
）以降の処理はオンライン認識時の実施例と同様。ただ
し、録音再生装置（２）の録音文章に、文節および単語
の区切りを明確にするための区切りを示すビープ音を録
音済みの文章を入力し、特徴抽出部（１２）がかかるビ
ーブ音を検出したとき、特徴抽出部（１２）は無音区間
検出信号（ロ）の代わりに、ビープ音検出信号（口′）
を発生する。受信信号が、無音区間検出信号（ロ）でな
く、ビープ音検出信号（口′）の場合、入力切り換え部
（４）の信号発生部（４２）は、文章の文節または単語
の区切りを表わすビーブ音の発生は行なわない。

また、音声認識部（１）が、単語を示すキャラクタ−音
を認識した場合は、かかるキャラクタ−音に対応した単
語を認識結果として出力する。

次に二度再生認識モードの実施例を記す。

本モードは、まず録音音声を再生し本装置に入力する。

このとき音声認識部（１〉の前処理部（１１）で録音音
声の音圧変動を全て読みとり、このデータを第４図に示
す音圧変動メモリ（ｌｌｂ＞に記憶する。次ぎに、再び
録音音声を再生し本装置に入力する。このとき前処理部
（１１）では、音圧変動記憶メモリ（ｌｌｂ＞に記憶さ
れたデータを使用し、特徴抽出部（１２）への入力音圧
を第１８図に示す如く、音声認識に最も適したレベルに
あわせるよう、ＡＧＣ回路＜１ｌａ）の増幅率を調整す
る。即ち、利得Ｇを固定利得Ａに制御電圧■。（可変調
整される）を乗じたものとする。

また、二度再生認識モードの別の実施例として、多数回
再生認識モードも考えられる。これは、録音文章を多数
回再生入力し、入力のつど、音声認識部（１）における
認識方法を変更することによって認識された結果を比較
し、最も確からしきの尤度の大きいものを、選択する方
法である。

また、録音再生装置（２）に登録用音声を録音しておら
ず、かつ録音再生装置く２）によっては再生速度を速く
した場合の周波数特性と通常の再生速度の場合の周波数
特性が違うものを使用するとき、または音声の標準パタ
ーン作成に使用した録音再生装置（２）と違う周波数特
性をもつ録音再生装置（２）に録音した文章を認識させ
るとき、またはＷ　％の標準パターン作成に使用した録
音再生装置（２〉と規格上は同じ周波数特性を有するが
使用部品等の誤差の影響をうけ実際の周波数特性が音声
）標準パターン作成に使用した録音再生装置（２）と違
っている録音再生装置（２）に録音した文章を認識させ
るときは、以下に述べる周波数特性の影響を補正する機
能を使用する。

まず、録音再生装置（２）の周波数特性を測定する場合
の基準となる基準正弦波信号を基準信号発生部（４２）
で発生させ、録音再生装置（２）に録音する。しかる後
に録音されたかかる基準正弦波信号を本装置に再生入力
する。入力された基準正弦波イハ号を音声認識部（１）
は分析し、録音された基準正弦波信号と、基準信号発生
部（４２）で発生させた基準正弦波信号との周波数特性
の差を求め、録音された基準正弦波信号と、基準信号発
生部（４２）で発生させた基準正弦波信号との周波数特
性の差を小きくするように、補正をかける。補正をかけ
る手段は、音声認識部（１）の特徴抽出部（１２）の特
徴抽出方法により、多数考えられる。例えば第１３図に
示したように、直列接続されたバンドパスフィルタ（Ｂ
ＰＦ）と増巾器（ＡＭＰ）との並列接続体からなるアナ
ログフィルターバンク方式とするものであれは、増幅器
（ＡＭＰ＞の増幅率を調整することにより、基準信号発
生部（４２）で発生させた基準正弦波信号との周波数特
性の差を小さくするようにフィルタからの出力を調整す
る。また、特徴抽出部（１２）の特徴抽出方法として、
ディジタルフィルターをもちいていれば、ディジタルフ
ィルターの特性を決めているパラメータを変更すればよ
い。その他、音声認識部（１〉の特徴抽出部（１２）の
特徴抽出方法に対応して、あらゆる方法が考えられる。

前記までの操作により、音声入力した文章はかな列に変
換された事となる。このかな列変換された文章が入力し
た文章と違っている場合の修正方法を第１４図を使用し
それぞれの誤りかたに場合分けして以下に述べる。以下
の手順により修正を行なう。

第１４図（ａ）は入力文章、同図（ｂ）は入力音声、同
図（Ｃ）は認識結果、同図＜ｄ）〜（ｈ）は修正過程、
同図（ｉ）は修正結果を表わしている。

まず、単語として発声したものが文節として誤認識され
た場合の修正法について述べる。同図（Ｃ）に示したよ
うに単語“Ｃ′として発声したものが、文節“’　Ｌ　
−”として認識された場合、先ずカーソル（Ｘ）を誤っ
た単語の部分へ移動する［同図（ｄ）１コ。次ぎに単語
次候補キー（７２）を押し単語の次候補を表示させる［
同図（ｄ）ｉｉ］。　この結果が正し＋−７れば次の修
正部分へ進む。もしこの結果が誤っていれば、再び単語
次候補キー（７２）を押し単語の次候補を表示させる。

この操作を正解が表示されるまで繰り返す。

次ぎに、文節として発声したものが単語とじて誤認、識
きれた場合の修正法について述へる。文節“い′とし〔
発声したものが、単語“Ｅ”′とし、て認識された場合
、先ずカーソル（Ｘ）を誤った文節の部分−移動一りる
。次ぎに文節次候補キー（７３）を押し文節の次候補を
表示させる。この結果が正しくつれば次の修正部分へ進
む。

もしこの結果が誤っていれば、文節次候補キー（７３）
を押し文節の次候補を表示許せる。この操作を正解が表
示されるまで繰り返す。

申開前候補キー（７４）を押すことにより単語、文節前
候補キー（７５）を押すことにより文節、それぞれの−
・つ前の候補を表示許せることも出来る。

上述の２通りの修正法で正解が得られないときは音節単
位の修正や、単語または文節または音節を再発声入力す
る。

また、再発声入力時に再び、文節を単語認識したり、単
語を文節認識したりすることを避けるため、候補作成部
（１５）を、単語認識部（１３）より送られてきた認識
結果のみを認識結果としてみなし、文節認識部（１４）
より送られてきた認識結果は、無視するよう外部より制
御できる。

また、候補作成部（１５）を、文節認識部（１４）より
送られ工きた認識結果のみを認識結果としてみなし、単
語認識部（１３）より送られてきた認識結果は、無視す
るよう外部より制御できる。

上述の次候補キーとは、以下に述べる機能を有［るキー
の事であり、第１５図を使用し説明する。

本装置の音声認識部＜１）では、単語認識と文節認識が
並走しており、単語および文節の両認識結果ヲ求めてい
ることは先に述べたが、この両認識結果より、文節認識
処理の結果を尤度の太きいものから順番に認識結果を表
示装置（６）に表示させるためのキーが文節次候補キー
（７３）であり、単語認識処理の結果を尤度の大きいも
のから順番に認識結果を表示装置に表示きせるためのキ
゛−が単語次候補キー（７２）であり、現在表示装置に
表示されている認識結果より、一つ光度の大きい認識結
果を表示装置（６）に表示するキーが、単語前候補キー
および文節前候補キーである。

第１５図は候補作成部り１５）の候補バッファ（１５ａ
）である。この図は、−位の認識結果が、′たんご、で
あり、これは単語認識部（１３〉から送られてきた認識
結果であることをく単語）で表わしている。同様に王位
の認識結果が、「たんごを」であり、これは文節認識部
（１４）から送られてきた認識結果であることを（文節
）で表わし、王位の認識結果が、′たんごに、であり、
これは文節認識部（１４）から送られてきた認識結果で
あることを（文節）で表わし、四位の認識結果が、′た
んこう。

であり、これは単語認識部（１３）から送られてきた認
識結果であることを（単語〉で表わしている。

いま、表示装置（６）には、′たんご」が表示きれてい
るとする。かかる状態で文節次候補キー（７３）を押１
と表示装置（６）には「たんこ゛を」が表示きれる。ま
た、単語次候補キー（７２）を押すと表示装置（６）に
は「たんこう」が表示される。

また、表示装置（６）には、′たんこう」が表示されて
いる場合に、単語前候補キー（７４〉を押すと表示装置
（６）には「たんごヨが表示され、文節前候補キーク７
３）を押すと表示装置く６）には「だんごに」が表示き
れる。

次ぎに一文節全体の一括修正方法について述べる。

第１４図＜ｅ）の例は単語「Ｔ」を’ＡＪと誤認識した
例である。先ずカーソルを修正したい単語へ移動する［
同図〈ｅ）１コ。

次に単語次候補キー（７２）を押し単語の次候補を表示
させる［同図（ｅ）ｉ］。この結果が正しければ次の修
正部分へ進む。もしこの結果が誤っていれば、単語次候
補４−（７２）を押し単語の次候補を表示させる。この
操作を正解が表示されるまで繰り返す。正解が表示され
無ければ、再発声をｔｉない、再入力をおこなう。前単
語候補キー（７４〉を押すことにより一つ前に表示した
型開の候補を表示させることも出来る。

次ぎに一単語全体の一括修正方法について述へる。

第１４図＜ｒ＞の例は文節ｒがめんの、を１がいねんの
」と誤認識した例である。先ずカーソルを修正したい文
節へ移動する［同図（ｒ）ｉ］。

次ぎに文節次候補キーク７３〉を押し文節の次候補を表
示させる［同図（ｆ）ｉｉ］。この結果が正しければ次
の修正部分ｔ〜進む。もしこの結果が誤っていれは、文
節次候補キー（７３）を押し文節の次候補庖表示さ口る
。この操作を正解が表示されるまで繰り返す。正解か表
示され蕪けれは、再発声を行ない、再入力をおこなう。

前文節候補キー（７５）を押すことにより一つ前に表示
した文節の候補を表示させることも出来る。

次ぎに音節単位の修正方法について述べる。

第１４図（ｈ）の例は文節「おんせいて、を「おんけい
で」と誤認識した例である。この例は音節「（す、を１
せ、に修正する場合であるが、先ずカーソル（Ｘ）を修
正したい音節「け、へ移動し［同図（ｈ）１コ、音節次
候補キー（７６〉を押す。音節次候補キー（７６）を押
すことにより修正したい部分の音節と最も距離が近いさ
節が表示される［同図（ｈ）ｉｉ］。正解が表示されれ
ば、次の修正部分へ移動す２・。もしこの結果が誤っ１
いれば、再度音節次候補キーを押し音節の次候補を表示
させる。

この操作を正解が表示されるまで繰り返す。正解が表示
され無けれは、再発声により再入力を行なう。再入力の
結果が間違っている時は上記の手順により再び修正する
。この操作を正解が表示＃れるまで繰り返す。

また前音節候補キー（７７）を押すことにより音節の−
・つ前の候補を表示させることも出来る。

音節を削除したい時は、カーソルを修正したい音節へ移
動し削除キー（７８）を押し削除する。

音節を挿入したい時は、カーソルを修正したい音節へ移
動し挿入キー（７９）を押し挿入する。

次に第１６図を使用し、数音節修正法について記す。

この例は、同図（ａ＞の入力文章°°かいしよう゛を同
図（ｂ）’がんじよう」と誤認識した例である。この場
合、まずカーソル（Ｘ）を修正したい音節にもっていき
［同図（Ｃ）］、°・かい“と再発声入力する。かかる
再発声入力音声は音声認識部（１）で認識され、８識結
果は表示装置（６）に表示きれる。認識結果が１１．け
れば、次の修正部・＼すすむ。もし、同図（ｄ）に示す
ように、′かい」を１かえ、と誤認識した場合、単語の
場合は、単語次候補キー（７２）を押す。文節の場合は
、文節次候補キー〈７３）を押す。第１６図はＳ語の場
合の例であるので、以下単語の修正方法について記す。

同図（ｄ）の状態で、単語次候補キー（７２）を押した
場合、まず、制御部（５）は、単語辞書（１３ｄ）より
、修正前の同図（ｂ）の認識結果「かんしょう」と再発
声後の同図（ｄ）の認識結果１かえじよう」とを比較し
、同一部分１じよう」をみつ１プる。次に、制御部（５
）は、単語辞書（１３ｄ）より、かかる同一部分１じよ
う」をもつ単語を選ぶ。同図（ｆ）は単語辞書（１３ｄ
）の記憶内容を示しており、同図（ｇ）は記憶内容より
選んだ１しよう」をもつ単語を示している。次に制御部
（５）は、同図（ｇ）に記した単語と、再発声後の認識
結果「かえしようＪとの尤度を計算し、最も尤度値の大
きい単語を表示する［同図（ｅ）コ。

次に文節または単語の認識境界誤りを修正する場合につ
いて述べる。

第１４図（ｇ＞の例は文節「ぷんしようを」を１ん」と
１し」の間に［ｖ］印で示す無音区間があると誤認識し
、単語「ふん、と文節「しようを。

というように二つに分けて誤認識した例である。

この場合認識境界誤りを修正しなければならないが、認
識境界区切り記号を削除したい場合は、削除したい認識
境界区切り記号にカーソル＜Ｘ＞を移動し［同図（ｇ）
ｉ］、削除キー（７８）を押す［同図（ｇ＞ｉｉ］、認
識境界区切り記号を挿入したい場合は挿入したい位置に
ある音節にカーソル（Ｘ）を移動し挿入キー（７９）を
押す。

ただし、後に述べるように録音再生装置（２）の区切り
ビーブ音と、記憶装置（８〉に記憶された認識結果に付
加きれた区切り記号は、録音再生装置（２）と記憶装置
（８）の同期をとるための目印となるので、対応はとっ
ておかなければならない。ゆえに、この時記憶装置（８
）に区切り記号が挿入削除きれたことを記憶装置（８）
に記憶しておく。

例えば、第１４図（ｇ）１に示した文章が、第１４図（
ｇ）Ｈに示すように、記憶装置（８）に記憶されている
ものとする。（ｇ）１の文章を、（ｇ＞ｉｉに示すよう
に修正した場合、記憶装ｅ（８）に記憶されていた区切
り記号「９」は、記号「１」に改められる。記号「マ」
は、区切り記号「７」が削除されたことを示す記号であ
り、認識単位を示す記号には用いられず、録音再生装置
（２）等との制御のみに用いられる記号である。

このような構成に寸れば、区切り記号「マ」を削除した
後も、録音再生装置（２）に録音されたビーブ音と、記
憶装置（８）に記憶きれた記号「マ」「９．を用いるこ
とにより、同期をとりながら同装置を制御でさる。

以上は、区切り記号「、を削除した場合の例であるが、
挿入された場合も同様の考え方ができる。つまり、制御
信号としては用いられず、区切りのみを表わす特定の記
号を、区切り記号「ワ。

の替わりに挿入すればよい。

以上の修正手順により、第１４図Ｎ＞に示すように、文
章を修正する。

認識境界誤り修正を行なった後認識境界誤り修正を行な
った認識単位について、修正手順に従−）て修正を加え
る。再発声による修正の場合、標準パターンを登録した
人なら誰の音声でも認識できるので文章の録音者でなく
とも修ｆ操作を行なえる。

以１−５かな列文章の修正方法を述べたが、修正を補助
する機能として以下に述べる機能を有する。

表示装置（６）に表示された文字列上のカーソル移動と
表示画面のスクロール機能により、記憶装置（８〉より
順次記憶文章を表示画面−Ｆに表示できるか、この時画
面上に表示されでいる部分に対応する音声が録音再生装
置（２）から再生きれる。

また、上述の機能とは逆の機能も有し、録音再生装置（
２）から再生されている部分に対応した文字列が表示装
置（６）に表示される。

また、上述のどうらの方法の場合も録音文章に録音され
ている区切り記号音と、表示側に記録きれている区切り
記号を、同期を取るタイミング信号として使用し、録音
再生装置（２）の再生と表示とがお互いに同期をとりな
がら動作するよう制御している。また、キーボード〈７
）、または録音再生装置く２）より再生を止める信男が
入力されたとき、再生を止めるとともに、表示のスクロ
ールまたはカーソルの移動を止める。

以上の録音再生装置（２〉の再生と表示との同期機能に
より、再生音を聞きながら文字列の確認を行なうことが
でき、修正個所の発見を容易にする。

ここで述べている同期のとり方として、再生されている
部分に対応する記憶装置（８）の文字列を表示装置（６
）に表かする方法と、再生されている部分に対応する部
分より区切り記憶−つ遅れた部分のかな列を表示装置（
６）に表示する方法とがある。

との場合、修正のため表示を停止したときには既に録音
音声の修正部分は再生きれているため再度修正部分を再
生するためには、再生きれた文章より修正したい部分の
頭たしを行なう必要がある。そこで、この方法を採用す
る場合は、表示を停止したとき、自動的に録音再生装置
（２）を−一一一つ前の区切り記号士でハソクトシツク
する機能をもたせる。

また、録音再生装置（２）に、テープレコーダを使用し
た場合、再生部分をテークの回転により制御することと
、テープのたるみなどにより、修正部分に対応し、辷８
１ｉ分の頭出しが正確に行なえない場合がおる。

このような場合は、入力されてくる音声を、−定時間長
たｉ−ＪＰＣＭ録音やＡＤＰＣＭ録音−〇記憶しておき
、入力された音声を聞き返したい場合は、ＰＣＭ録音や
Ａ　Ｄ　Ｐ　ＣＭ録音音声を聞き返す機能を付加する。

第１７図は上記の、機能の一実施例であり、ＰＣＭ録音
のテークを記憶しておくＰＣＭデータメモリの図である
。図中の数字０１〜０５はアトｔ７スを示している。入
力音声は、第１４図りこ記した“わたしわ１てんｌ−１
あ−る１て−１かめんの１ふんしようをＩてん１おんせ
いでＩしゆうせいしたＩまる″という、文章である。

上記の、音声が入力されたとき、ＰＣＭデータ・モリ（
ＤＭ）には、０１番地に最初の無音区間よて゛の音声“
わたしわ°が記憶される。０２番地に２番目の無音区間
までの音声“−〔んパが記憶される。０５番地に５番目
の無音区間までの音声“°て−゛が記憶される。このと
き、ＰＣＭアドレスポインタ（ＡＰ）は、ＰＣＭテ−タ
メモリに記憶されているテークのうち、１番先に記憶さ
れたデータのアトし・ノ、を記憶しておく。本例では、
０１が記憶される。

この段階でＰ　ＣＭテークメモリは一杯になる。

次に、音声が入力されたときは、ＰＣＭデータ７［す＜
ＤＭ）に呂己憶され℃し・るテークのうち、１番先に記
憶されたテークのアドレスに、入力きれた音声を記憶４
−る。本例では°わたしわ′か記憶されていたアドレス
０１に゛がめんの゛を記憶する。このとさ、ＰＣＭアド
レスポインタ（ＡＰ）は、ＰＣＭテークメモリ（ＤＭ）
に記憶されているデータのうち、１番先に記憶されたデ
ータのアドレスを記憶しておく。本例では、０２が記憶
される。

この状態で、ＰＣＭデータメモリ（ＤＭ）の内容を再生
する場合、ＰＣＭアドレスポインタ（ＡＰ）の指してい
る、ア１ξレスから、再生する。本例では、０２，０３
．０４，０５，０１の順番に再生しでいく。

かかる方法により、何度でも、正確に素早く、音声を聞
き返すことが可能となる。

また、画面上の認識中位の区切り記υ″上へカーソル（
Ｘ）を移動し録音音声の頭出しキー（７０）を押すこと
により、カーソルが示している認識中位に対応した録び
再生装置（２）側の区切り記に音部分を録音文章Ｊ：り
捜し出し、これに続く文章を再生？−る機能を壱４−る
。以下に、かかる機能の実施例を示す。

認識した文章の確認のため、認識結果を記憶装置（８）
より読み出し、表示装置く６）に冒頭より表示さ七る。

乙の時、第１９図、制御部（５）の区切り記号カラ〉タ
ー（５ａ〉は、記憶装置（８）より読み出された区切り
記号の数を計数していく。読み出した認識結果が誤って
いる場合は、誤っている部分にカーソルをあて、頭出し
キーを押す。制御部（５〉は、録音再生装置（２）に録
音されている文章を、早送り再生モードで再生させる。

特徴抽出部（１２）０）　ｅ−ブ音カウンター（１２ｅ
）は、録音再生装置（２）より入力される文章中の区切
りをしめすビープ音を計数する。

比較回路り５ｂ）は、ビーブ音カウンター（１２ｅ）の
値が、先に述−た区切り記号カウンター（５８）の値よ
り、１つ小さくなったとき、信号（ハ）を録音再生装置
（２）に送り、再生を止める。

また　認識結果、および修正を終了した文章の確認のた
めには、記憶装置（８）の記憶データを表示装置く６）
に文字列で表示させ、表示画面」二に表示された文字列
を目で追い、読まなりれはならないため、非常に目が疲
れる。

かかる点に鑑み、本装置は認識結果を記憶させた記憶装
置（８）１の文字列を、音声合成機能により読み上げる
機能をもたせることにより、認識結果、および修正を終
了した文章の確認を音声合成音を聞く、−とにより行な
えるようにできる。

この場合千１音声合成部（９）と記憶装置（８）と録音
再生装置（２）と表示装置（６）との同期を取るタイミ
ング信号として、区切り記けを使用する。

つまり、音声合成部（９）が記憶装置（８）より読み−
１；げている部分に相当する文字列が表示装置（６）に
表示され、同時に録音再生装置（２）より録音部分を頭
出ししている。この方法により、音声合成音の読み合わ
せ機能により誤りを発見し修正のために音声合成の読み
合わせ機能を停止させたとき、表示装置（６）の表示も
録音再生装置（２）の録音部分も誤り部分を示しており
、即座に修正を行なうことができる。

ここで述へている同期のとり方として、音声合成機能に
より読み上げられている部分に対応する記憶装置のかな
列を表示装置（６）に表示すると同時に、録音再生装置
（２）に録音されている文章より該当する音節部分を再
生する方法と、音声合成機能により読み−Ｆげられてい
る部分に対応する部分より、区切り記号−つ遅れた録音
再生装置（２）に録音されている文章部分再生する方法
とがある。後者の場合、修正のため音声合成を停止した
とき、録音再生装置（２）は修正したい部分より手前で
停止しでいるため、−の状態で再生すれば直・、に修正
部分の音声を再生できる。前者の場合は修正のため音声
合成を停止したときには既に録音音声の修正部分は再生
されでいるため再度修正部分を再生するためにはハック
トラックする必要がある。そこで、前者の方法を採用す
る場合は表示を停止したとき、自動的に録音再生装置（
２）が一つ前の区切り記号までハックトラックする機能
をもたせるのが好ましい。

以ト、認識結果を記憶装置（８〉に記憶してお〈実施例
を記してきたが、以下に、別の実施例とし王、録音再生
装置（２）に認識結果を記憶きせる方法を記す。

記憶装置（８）に記憶された、認識結果を、原文の録音
された録音再生装置（２）に記録する。この様にすれは
、原文と認識結果が、同一記録媒体に記録できるため、
原文と認識結果の管理が容易になる。

また、録音文章を、再生入力しながら、認識した結果を
録音再生装置（２）に録音し−Ｃいくことにより、外部
記憶装置が不要となる。

いずれの場合も　マルチトラック方式の録音再生装置（
２）４用いることにより、録音ｇ声を再生しながら、音
声の録音されていないトラックに認識結果を記憶きせる
ことができる。

（ト）　発明の効果本発明の音声認識システムによれば、誤認識された話を
再発声入力し、１回目の認識結果と２回目の認識結果を
比較し、両認識結果の同一部分をもとに辞書検索を行な
い、認識候補をもとめ、音声認識するため、正確で迅速
な認識結果修正が行なえる。

【図面の簡単な説明】

第１図は本発明の音声認識システムを採用したデイクチ
−ティングマシンの外観図、第２図はデイクチ−ティ、
／グマシンの構成図、第３図は音声認識部く１〉の構成
図、第４図は前処理部（１１〉の構成図、第５図は特徴
抽出部（１２）の構成図、第６図はｊｌｊ語認識部（１
３）の構成図、第７図は文節８識部（１４）の構成図、
第８図は入力切り換え部（４）の構成図、第９図は見出
し語と録音方式とキャラクタ−計の関係図、第１０図は
キャラクタ−計の録音１法と音声区間の関係図、第１１
図は録音再生装置がマルチトラック方式の場合の録音方
法を示す図、第１２図は録音再生装置がシングルトラッ
ク方式の場合の録音方法を示す図、第１３図は周波数補
正回路例を示す図、第１４図は誤認識時の修正図、第１
５図は候補作成部（１５）内の候補バッファ（１５ａ）
を示す図、第１６図は誤認識時の数ａ節修正例を示シー
図、第１７図はＰＣＭ録音方法説明図、第１８図はＡＧ
Ｃ動作の説明図、第１９図は、区切り記号のカウンター
の説明図である。（１）・・・音声認識部、（２）・・・録音再生装置、
（３）・・・マイク、（６）・・・表示装置、（７〉・
・・キーボード、（８〉・・・記憶装置、（１１）・・
・前処理部、（１２）・・・特徴抽出部、（１３）・・
・単語認識部、（１４）・・・文節認識部。区 ′寸法区０つ区ビ） −ｔｌｌ使 ■ 派〒−一釦ｐ＼Ｉ　　　　　　　　　　　　　　　　　　　　　　　
　　　　　　（１／第１６図（ａ）　　“かいじよう′” （Ｃ）　「品んじよう　マ。（ｅ）　「かいしよ１イＶ」第１９図５　制御部手続補正書（自発）

Claims

【特許請求の範囲】

入力音声を認識する機能と、認識結果を表示する機能と
、認識結果を記憶する機能と、認識結果を修正する機能
とをもつ音声認識システムにおいて、認識結果修正時に
、再発声入力の認識結果と再発声入力前の認識結果とを
比較することにより、両認識結果が同一の部分を検出し
、該同一部分のデータだけで辞書検索を行なって認識候
補語を選択し、この選択された語句と再発声入力語との
尤度計算を行なうことを特徴とする音声認識システム。