JP3108121B2 - 音声認識装置の辞書制御方式 - Google Patents

音声認識装置の辞書制御方式

Info

Publication number
JP3108121B2
JP3108121B2 JP03091488A JP9148891A JP3108121B2 JP 3108121 B2 JP3108121 B2 JP 3108121B2 JP 03091488 A JP03091488 A JP 03091488A JP 9148891 A JP9148891 A JP 9148891A JP 3108121 B2 JP3108121 B2 JP 3108121B2
Authority
JP
Japan
Prior art keywords
dictionary
speech
pattern
voice
external storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03091488A
Other languages
English (en)
Other versions
JPH04301695A (ja
Inventor
晴剛 安田
邦容 金内
修司 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP03091488A priority Critical patent/JP3108121B2/ja
Publication of JPH04301695A publication Critical patent/JPH04301695A/ja
Application granted granted Critical
Publication of JP3108121B2 publication Critical patent/JP3108121B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【技術分野】本発明は、音声認識装置の辞書の制御方式
に関する。
【0002】
【従来技術】最初に、従来技術の欠点を説明するため
に、図4に示すような、パーソナルコンピュータ1で制
御される音声認識装置2について説明する。パーソナル
コンピュータ上で用いられる音声認識装置の場合、例え
ば、図4に示すように、通信回路3を介して認識結果や
音声辞書データ等をパーソナルコンピュータ1と相互に
通信する。例えば、特定話者方式の場合、音声辞書の登
録はパーソナルコンピュータ1の指示により行われる。
生成された辞書は当面、音声認識装置2内のメモリ2
4,25に記憶されパーソナルコンピュータ1の指示に
より通信回線3を介してパーソナルコンピュータ1に送
られ、その外部記憶装置4にファイルとして記憶され保
存される。この時、音声辞書は認識に必要な音声パター
ン辞書とその読みに対するストリング辞書として外部記
憶装置4に記憶される。又、同一ファイルに2つの要素
を含める場合もある。
【0003】このような使用法において、単一アプリケ
ーションのみで音声認識装置を利用する場合は問題ない
が、パーソナルコンピュータ1の音声キーエミュレータ
のような複数のアプリケーションに適用させようとする
場合などに、あるアプリケーションのために作成されて
いる辞書ファイルはそのアプリケーション専用のもの
で、他のアプリケーションに利用する場合はそれ用に再
度辞書を登録しなければならなかった。
【0004】図5は、一般的な音声認識の認識の手順を
示す図で、周知のように、マイクロフォン21から入力
された音声の特徴量が特徴抽出部22で抽出され、その
特徴量が認識部23にて認識される。得られた認識結果
に対応するストリングをストリング辞書データ25より
選んで結果出力部26に送り、ストリング列として音声
認識装置2から通信回線3を介してパーソナルコンピュ
ータ1に出力する。図6は、この場合の音声辞書データ
24とストリング辞書データ25の関係を示す図で、音
声認識装置2のメモリ内には登録された音声辞書のデー
タファイルとその読みに対するストリングが存在し単語
番号に対してあらかじめ定められている。これらの音声
辞書データ24とストリング辞書データ25は一般にメ
モリが揮発性であるためパーソナルコンピュータ1の指
示に基いて通信回線3を通してパーソナルコンピュータ
1へ転送され、例えば、図4に示したように、ハードデ
ィスクのような外部記憶装置4に記憶される。このよう
な音声認識装置2を用いたパーソナルコンピュータ1に
おいて、使用するアプリケーションが定っている場合
は、使用前にこの2つのファイルを外部記憶装置4から
パーソナルコンピュータ1に読み込み更に音声認識装置
2に転送すれば良いが、例えば、複数のアプリケーショ
ンに用いる場合は、それぞれの音声辞書データファイル
とストリング辞書データファイルが必要になる。特に、
音声キーエミュレータ等は初めから複数のアプリケーシ
ョンに対応できるように構成されている。
【0005】この時、複数のアプリケーションに対し
て、例えば、図7に示すような、3種のアプリケーショ
ンに対する必要単語がある場合に、使用する単語の内容
は異なるがある単語については同じものが存在する場合
が多い。特に「終了」とか「はい」「いいえ」などはア
プリケーションに共通して用いられることが多く、従来
においては、アプリケーションごとに全ての単語につい
て音声を登録せねばならず、そのため登録時は大変な労
力を要していた。
【0006】
【目的】本発明は、上述のような実情に鑑みてなされた
もので、アプリケーション間の辞書の利用により、使用
時の登録の手間を極力少なくするためになされたもの
で、特に、外部記憶装置内の同一ストリングの音声パタ
ーンを利用し、登録時の使用者の負担を軽減しようとす
るものである。
【0007】
【構成】本発明は、上記目的を達成するために、(1)
力された音声の特徴量を抽出する特徴抽出部と、音声パ
ターン辞書と未知入力の類似性を計算する認識部と、音
声パターンを格納する音声パターン辞書と各々の音声パ
ターンが有する音声ストリングを格納するストリング辞
とからなる音声辞書と、を有する音声認識装置と、こ
れら音声パターン辞書とストリング辞書とからなる音声
辞書を1個もしくは複数個その使用者名と共に記憶させ
るための外部記憶装置と、前記音声認識装置と外部記憶
装置との間で辞書の転送を制御する辞書転送装置とを有
し、単語の音声の登録時に、登録したい単語のストリン
グに対して、既に用意され、外部記憶装置と格納されて
いる音声辞書の中から同一のストリングを検索し、同一
ストリングが存在する場合、その単語に対する音声パタ
ーンを前記外部記憶装置から前記認識装置に転送して使
用すること、或いは、前記(1)において、(2)前記
外部記憶装置を検索し、該外部記憶装置に複数の同一ス
トリングの音声パターンが存在する場合、これら音声パ
ターンの中から利用する音声パターンの同一使用者名の
同一ストリングの音声パターンを優先して転送して使用
すること、或いは、(3)前記外部記憶装置を検索し、
該外部記憶装置に複数の同一ストリングの音声パターン
が存在する場合において、これら音声パターンの中に使
用者の音声パターンがない場合は、使用者の発声に従っ
て最も類似性の高い音声パターンを選択して転送して使
用すること、更には、前記(3)において、発声した入
力パターンを利用して、利用しようとする音声パターン
を更新して使用すること、或いは、音声辞書の外部記憶
装置への記憶時に、他の辞書から利用した音声パターン
はその使用辞書を代表する記号と、単語番号のみを記憶
させることを特徴としたものである。以下、本発明の実
施例に基いて説明する。
【0008】図1は、本発明の一実施例を説明するため
のブロック図で、以下、前記辞書データはパーソナルコ
ンピュータ等の外部記憶装置(ディスク等)4に記憶さ
れている場合を例にして説明する。マイクロフォン21
等から入力された音声データの特徴量を特徴抽出部22
において抽出し、特徴パターンを生成し、認識部23に
おいて、予め貯えられている音声辞書データ24とパタ
ーン照合を行って認識結果を求める。ここで得られた認
識結果に対応する単語ストリングをストリングデータ辞
書25より認識結果として、通信回線3を介してポスト
コンピュータとしてのパーソナルコンピュータ1に転送
する。パーソナルコンピュータ1の外部記憶装置4には
各アプリケーションで使用する音声辞書ファイルが記憶
されており、これらは同一使用者の音声辞書ファイルの
場合と他の利用者の音声辞書ファイルの場合がある。音
声認識装置を利用する場合、特に、特定話者認識方式の
場合、ユーザは、まず、音声を登録するために、その
「読み」に相当する音声ストリングをキー入力し、その
後、そのストリングを発声して音声の登録作業を行う。
従って、前述した様に、登録作業は労力を要する事にな
る。しかしながら、一般に、使用単語は共通した単語を
含むことが多く、使用アプリケーションが異なる場合で
も「終了」、「はい」、「いいえ」…とか、又、同一ア
プリケーションで、使用者が異なる場合、例えば、事務
処理用(交通費精算…etc)アプリケーション等の場合
は同一単語で同一ストリングを有している。
【0009】従って、本発明では、音声登録をする前に
同一外部記憶装置の各音声辞書の内容を検索し同一スト
リングを有する単語の音声パターンを利用する。今、外
部記憶装置4のファイル構成が、図2に示す様に構成さ
れているとする。Name‘A’は‘A’という人の専用
ファイルである。辞書ファイルは図ではストリングとパ
ターンを別にして表示してあるが、対にして考えてもよ
い。而して、本発明では登録する単語と同一ストリング
を有する音声パターンを転送して使用する。図3は、本
発明の動作説明をするためのフローチャートで、まず、
同一使用者の音声パターンを優先して使用する。つま
り、登録しようとするストリング群の各単語について外
部記憶装置のファイル群を検索し同一使用者のファイル
から同一ストリングの音声パターンがあればそれを音声
認識装置の辞書メモリに転送する。又、同一使用者のそ
れがない場合には他の使用者の同一ストリングの音声パ
ターンを利用する。又、この場合同一ストリングの音声
パターンが複数個あった場合、どれを用いると最適かは
不明である。従って、その場合、ユーザにそれを知ら
せ、発声を促し、発声させ、その発声により、最も類似
性の大きい音声パターンを利用する。又、この発声の入
力パターンを保存しておき、選ばれた音声パターンに対
し更新処理を行い、これを利用すれば、より高品質な音
声パターンとして使用できる。
【0010】次に、この様にして構成された音声パター
ン辞書を再度外部記憶装置に記憶する場合には、図8に
示すように、単に他ファイルから転送してきただけのも
のは該当する音声パターン辞書は記憶せず、利用した元
のファイルのファイル名と単語ストリングだけを記憶さ
せ、再び音声認識装置にロードする場合は、その記述に
従って行う。このように構成することにより外部記憶装
置にその記憶する音声パターン辞書の重複を避ける事が
できる。もちろん、前記又は他の方法により音声パター
ンを更新した場合はこの限りではない。
【0011】
【効果】以上の説明から明らかなように、発明により、 (1)音声パターンの登録作業を軽減することができ
る。 (2)他の使用者の辞書を利用することが可能である。 (3)外部記憶装置の不要情報を削減することができる
等の効果が得られる。
【図面の簡単な説明】
【図1】 本発明の一実施例を説明するためのブロック
図である。
【図2】 外部記憶装置のファイル構成例を示す図であ
る。
【図3】 図1に示した実施例の動作説明をするための
フローチャートである。
【図4】 パーソナルコンピュータで制御される音声認
識装置の一例を説明するための図である。
【図5】 一般的な音声認識装置の認識手順を説明する
ための図である。
【図6】 音声辞書データとストリングの関係を示す図
である。
【図7】 複数のアプリケーションに対する必要単語の
例を示す図である。
【図8】 音声辞書の生成結果の一例を示す図である。
【符号の説明】
1…マイクロコンピュータ、2…音声認識装置、3…通
信回線、4…外部記憶装置。
フロントページの続き (56)参考文献 特開 昭63−24297(JP,A) 特開 昭63−32596(JP,A) 特開 昭59−147400(JP,A) 特開 昭61−75395(JP,A) 特開 昭63−24297(JP,A) 特開 平2−50197(JP,A) 特開 平2−211500(JP,A) 特許2989211(JP,B2) 特許3001585(JP,B2) 特公 平2−56680(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 - 17/00

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された音声の特徴量を抽出する特徴
    抽出部と、音声パターン辞書と未知入力の類似性を計算
    する認識部と、音声パターンを格納する音声パターン辞
    書と各々の音声パターンが有する音声ストリングを格納
    するストリング辞書とからなる音声辞書と、を有する音
    声認識装置と、これら音声パターン辞書とストリング辞
    書とからなる音声辞書を1個もしくは複数個その使用者
    名と共に記憶させるための外部記憶装置と、前記音声認
    識装置と外部記憶装置との間で辞書の転送を制御する辞
    書転送装置とを有し、単語の音声の登録時に、登録した
    い単語のストリングに対して、既に用意され、外部記憶
    装置と格納されている音声辞書の中から同一のストリン
    グを検索し、同一ストリングが存在する場合、その単語
    に対する音声パターンを前記外部記憶装置から前記認識
    装置に転送して使用することを特徴とする音声認識装置
    の辞書制御方式。
  2. 【請求項2】 請求項1において、前記外部記憶装置を
    検索し、該外部記憶装置に複数の同一ストリングの音声
    パターンが存在する場合、これら音声パターンの中から
    利用する音声パターンの同一使用者名の同一ストリング
    の音声パターンを優先して転送して使用することを特徴
    とする音声認識装置の辞書制御方式。
  3. 【請求項3】 請求項1において、前記外部記憶装置を
    検索し、該外部記憶装置に複数の同一ストリングの音声
    パターンが存在する場合において、これら音声パターン
    の中に使用者の音声パターンがない場合は、使用者の発
    声に従って最も類似性の高い音声パターンを選択して
    送して使用することを特徴とする音声認識装置の辞書制
    御方式
JP03091488A 1991-03-28 1991-03-28 音声認識装置の辞書制御方式 Expired - Fee Related JP3108121B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03091488A JP3108121B2 (ja) 1991-03-28 1991-03-28 音声認識装置の辞書制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03091488A JP3108121B2 (ja) 1991-03-28 1991-03-28 音声認識装置の辞書制御方式

Publications (2)

Publication Number Publication Date
JPH04301695A JPH04301695A (ja) 1992-10-26
JP3108121B2 true JP3108121B2 (ja) 2000-11-13

Family

ID=14027801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03091488A Expired - Fee Related JP3108121B2 (ja) 1991-03-28 1991-03-28 音声認識装置の辞書制御方式

Country Status (1)

Country Link
JP (1) JP3108121B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0551613U (ja) * 1991-11-29 1993-07-09 タカムラ建設株式会社 プレキャストコンクリート板

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4540185B2 (ja) * 2000-05-29 2010-09-08 オリンパス株式会社 音声処理装置及び音声処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0551613U (ja) * 1991-11-29 1993-07-09 タカムラ建設株式会社 プレキャストコンクリート板

Also Published As

Publication number Publication date
JPH04301695A (ja) 1992-10-26

Similar Documents

Publication Publication Date Title
US4653097A (en) Individual verification apparatus
JP2989211B2 (ja) 音声認識装置における辞書制御方式
JPH01501977A (ja) 言語翻訳システム
JP3108121B2 (ja) 音声認識装置の辞書制御方式
JP2002215184A (ja) 音声認識装置、及びプログラム
JP3105930B2 (ja) 音声認識装置
JP3709578B2 (ja) 音声規則合成装置および音声規則合成方法
CN114676244B (zh) 信息处理方法、信息处理装置以及计算机可读存储介质
JP3501489B2 (ja) 音声処理装置及び方法
JP4206253B2 (ja) 自動音声応答装置及び自動音声応答方法
JP2817406B2 (ja) 連続音声認識方式
JPS595335A (ja) 日本語入力装置
JP2000322085A (ja) 音声認識装置及び音声認識方法
JP2001343995A (ja) 音声入力処理装置、音声入力処理方法及び音声入力処理プログラムを記録した記録媒体
JP2839515B2 (ja) 文字読取システム
JP2001067375A (ja) 名称検索装置、キーボード及び名称検索プログラムを記録した記録媒体
JP3033132B2 (ja) 言語処理装置
JPH04282700A (ja) 音声認識システムにおける辞書登録制御方法
JP3305343B2 (ja) 辞書編集装置
JPH04282699A (ja) 音声認識システム
JP2580566B2 (ja) 音声合成装置
JPH0256680B2 (ja)
JPS6382500A (ja) 規則合成音出力装置
JPS63153597A (ja) 検索照合型認識システム
JPH0535441A (ja) 文書自動作成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080908

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080908

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090908

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees