JPH02211500A - 音声認識システム - Google Patents

音声認識システム

Info

Publication number
JPH02211500A
JPH02211500A JP1033208A JP3320889A JPH02211500A JP H02211500 A JPH02211500 A JP H02211500A JP 1033208 A JP1033208 A JP 1033208A JP 3320889 A JP3320889 A JP 3320889A JP H02211500 A JPH02211500 A JP H02211500A
Authority
JP
Japan
Prior art keywords
standard pattern
standard
recognition
storage means
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1033208A
Other languages
English (en)
Other versions
JP3001585B2 (ja
Inventor
Harutake Yasuda
安田 晴剛
Junichiro Fujimoto
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1033208A priority Critical patent/JP3001585B2/ja
Publication of JPH02211500A publication Critical patent/JPH02211500A/ja
Application granted granted Critical
Publication of JP3001585B2 publication Critical patent/JP3001585B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声認識用の単語の標準パターンの登録機能
を備えた音声認識システムに関する。
〔従来の技術〕
音声認識システムとして、第2図に示したような構成の
ものが知られている。
第2図に示した音声認識システム50では、音声認識用
の標準パターンの全ては一般に認識メモリ54に標準パ
ターン群として格納されている。
音声の認識時には、特定話者がある単語の音声を発生す
ると、この音声はマイクなどの音声入力部51から特徴
抽出部52に入力し、特徴抽出部52において特徴量が
抽出され特徴パターンとして認識部53に送られる。認
識部53では抽出された特徴パターンを認識メモリ54
に格納されている標準パターン群と比較照合し、標準パ
ターン群のうちで比較結果の一致した標準パターンに対
応する単語名を認識結果として出力させることができる
また、特定話者が新しい単語について登録しようとする
ときには、新しい単語についてこれを音声で音声入力部
51に入力する。入力された音声は特徴抽出部52で特
徴量が抽出され特徴ノ<ターンとして登録部55に送ら
れ、登録部55ではこの特徴パターンを新しい単語の標
準パターンとしてその単語名とともに認識メモリ54の
標準ノ(ターン群に格納し、これによって新しい単語に
ついての標準パターンの登録を行なうことができる。
なお認識メモリ54上の標準パターン群は、場合に応じ
て外部記憶装置56などに格納されるようになっている
ところで従来では、認識メモリ54上の標準)(ターン
群は、クラスタなどに分割されて格納され、これによっ
て認識処理時に認識対象となる標準)(ターンをある程
度絞り、認識を容易にさせるようにしていた。
〔発明が解決しようとする課題〕
従来では認識を容易にさせるため認識メモリ54上の標
準パターン群をクラスタなどに分割したが、このなめに
クラスタ等の管理が必要となり、またそのチエツクも必
要となるなどの問題があった。さらに、クラスタなどに
分割したとしても、認識処理時に認識メモリ54上の全
ての標準パターン群から認識対象となる標準パターンの
クラスタの限定を容易に行なうことができないという問
題があった。またユーザは新しい単語については必ず登
録作業を必要とし、登録に際して、新しい単語の属すべ
きクラスタや他の情報等を何らかの仕方で入力しなけれ
ばならないという問題があった。
本発明は、ユーザの登録作業の負担を軽減し、また認識
処理をより効率良くかつ精度良く行なわせることの可能
な音声認識システムを提供することを目的としている。
〔課題を解決するための手段〕
上記目的を達成するために、本発明は、音声認識用の標
準パターン群が格納される第一の記憶手段と、認識対象
の標準パターン群が登録される第二の記憶手段と、前記
第二の記憶手段に認識対象の標準パターン群を登録する
登録手段とを備え、前記登録手段は、前記第一の記憶手
段を検索し前記第一の記憶手段に所定の標準パターンが
存在するときに該標準パターンを前記第二の記憶手段に
転送し登録するようになっていることを特徴としたもの
である。
また、前記登録手段は、前記第一の記憶手段を検索して
不特定話者用の標準パターンを前記第二の記憶手段に転
送し登録した場合に、認識処理時に得られる特徴パター
ンによって前記第二の記憶手段に登録されている不特定
話者用の標準パターンを置き換え、前記第二の記憶手段
を更新するようになっている。
〔作用〕
上記のような構成の音声認識システムでは、登録手段は
、音声認識用の標準パターン群が格納されている第一の
記憶手段を検索して所定の標準パターンが存在するとき
に、この標準パターンを第二の記憶手段に転送するとい
うような仕方で認識対象の標準パターン群を第二の記憶
手段に形成する。所定の標準パターンが第一の記憶手段
に存在する場合には、第二の記憶手段への認識対象の標
準パターン群の登録は、上記のように自動的になされる
ので、ユーザの登録作業の負担は軽減する。
゛また認識処理は第二の記憶手段に登録された認識対象
の標準パターン群に基づいて行なわれる。すなわち入力
音声の特徴パターンと第二の記憶手段に登録された認識
対象の標準パターン群とを直接照合させることによって
認識処理がなされるので、認識処理を効率良く行なうこ
とができる0本発明ではさらにこの認識処理時に、照合
の結果、入力音声の特徴パターンと類似する標準パター
ンが見出され、この標準パターンが第一の記憶手段の不
特定話者用の標準パターンを転送したものであるときに
は、この標準パターンを特定話者用の標準パターンとみ
なしうる特徴パターンに置き換え、第二の記憶手段を更
新し、これにより認識率を高めることができる。
〔実施例〕
以下、本発明の一実施例を図面に基づいて説明する。
第1図は本発明に係る音声認識システムの一実施例の構
成図である。
この音声認識システム1は、話者の音声が入力するマイ
クなどの音声入力部2と、入力した音声から特徴量を抽
出し特徴パターンとして求める特徴抽出部3と、単語の
標準パターンが単語名と対応させて格納される外部記憶
装置4と、外部記憶装置4に単語名等を入力させるキー
ボード/デイスプレィなどの入力装置5と、認識対象の
標準パターン群が記憶される認識メモリ6と、認識対象
のa準パターン群を認識メモリ6に登録する登録部7と
、認識メモリ6に登録された認識対象の標準パターン群
に基づいて入力音声の認識処理を行なう認識部8とを備
えている。
外部記憶装置4上には、ユーザが登録した全ての単語の
標準パターンが特定話者標準パターン群P、として単語
名とともに格納されるとともに、ユーザが高い頻度で使
うと考えられる汎用的言語(例えば、“はい”、“いい
え”、数字、出力。
・・・・・・等)の標準パターンが不特定話者標準パタ
ーン群すなわち汎用標準パターン群P、として単語名と
ともに格納されている。なお、1つの単語の標準パター
ンが特定話者標準パターン群PAと汎用標準パターン群
PBとの両方に格納されていても良い。
また登録部7は、認識対象となる標準パターン群を認識
メモリ6に登録するに際して、登録すべき単語の標準パ
ターンが外部記憶装置4の特定話者標準パターン群PA
、または汎用標準パターン群Paの中に存在するときに
は、この標準パターンを外部記憶装置4から認識メモリ
6に転送し、外部記憶装置4中に存在しない場合には、
ユーザにその旨を知らせて認識メモリ6への登録作業を
行なわせるようになっている。
このような構成の音声認識システムの動作を次に説明す
る。
外部記憶装置4中には、特定話者標準パターン群P と
汎用標準パターン群P8とか予め格納されているとする
、認識処理を行なわ゛せるに先立つて、単語の標準パタ
ーンを認識メモリ6の認識対象の標準パターン群として
登録する登録処理が行なわれる。この登録処理は、ユー
ザが入力装置5から登録すべき単語の単語名等を入力す
ることによってなされ、登録部6は、入力装置5から例
えば単語名が入力されると、これと同一の単語名をもつ
標準パターンが外部記憶装置4にすでに格納されている
か否かを検索する。すなわち、先づ外部記憶装置4中の
特定話者標準パターン群PAを検索して、特定話者標準
パターン群PA中に同じ単語名をもつ標準パターンが存
在するか否かを調べろ、同じ単語名をもつ標準パターン
が存在する場合には、この標準ノ5ターンを認識メモリ
6に転送し、認識対象の標準パターン群に組込む。これ
に対して特定話者標準パターン群PA中に目的の単語の
標準パターンが存在しないときには、汎用標準パターン
群P8を検索する。汎用標準パターン群PB中に目的の
単語の標準パターンが存在するときには、この標準パタ
ーンを認識メモリ6に転送し、認識対象の標準パターン
群に組込む。
このように、登録しようとする単語の標準パターンが外
部記憶装置4にすでに存在するときには、この標準パタ
ーンは外部記憶装置4から認識メモリ6へ転送され、認
識対象の標準パターン群が自動的に形成される。
外部記憶装置4を検索し、登録しようとする単語の標準
パターンが外部記憶装置4上4中の特定話者標準パター
ン群PA、汎用標準パターン群PBのいずれにも存在し
ない場合には、ユーザにその旨を知らせ、これによりユ
ーザはその単語の音声を発生し、音声入力部2から特徴
抽出部3に入力させ、特徴抽出部3で抽出された特徴パ
ターンをその単語の単語名とともに認識メモリ6中に認
識対象の標準パターン群として登録する。
このようにして、新しい単語の標準パターンの登録に際
してユーザの登録作業は、外部記憶装置4中にない単語
の標準パターンのみに限られるので、登録に要するユー
ザの負担を著しく軽減することが可能となる。また認識
メモリ6には認識対象となる標準パターン群だけが登録
されるので、認識処理時に従来のようにどのクラスタの
標準パターン群を認識対象として用いるかの判断が不要
となり、認識処理を効率良く行なうことができる。
さらに、本実線側では、外部記憶装置4中の特定話者標
準パターン群PAを汎用標準パターン群P8よりも優先
して検索するようにしており、認識メモリ6中にはある
単語について汎用標準パターン群の標準パターンに比べ
て高い認識率を与える特定話者標準パターン群からの標
準パターンが優先して登録されるので、認識処理時に高
い認識率を得ることができる。
なお、ある単語について認識メモリ6に汎用標準パター
ンが転送されて登録された場合に、認識処理時にその単
語の特定話者の音声が音声入力部2から入力され、特徴
抽出部3において特徴パターンが抽出され、認識部8で
この特徴パターンと汎用標準パターンとが類似している
と判断されたときに、認識メモリ6に登録されているそ
の単語の汎用標準パターンを特定話者の特徴パターンで
置き換えて更新し特定化するようにすれば、より高い認
識率を与える認識対象の標準パターン群を認識メモリ6
中に形成することができる。
上述の実施例では、入力装置5から単語名を入力させる
ことによって外部記憶装置4を単語名で検索するように
したが、例えば単語名の先頭文字によって検索を行なう
ことも可能である。具体的には、入力装置5から例えば
「m」のキーが入力されると、単語名の先頭文字が「m
」の標準パターンを外部記憶袋f4から検索し、これら
の全てを認識メモリ6に転送し、認識を行なわせること
もできる。また例えばI’mak」までのストリングが
キー人力されたときにも、同様にrmakJの先頭3文
字をもつ単語の標準パターンの全てを認識メモリ6に転
送し認識を行なわせることができる。
以上のようにして本実施例によれば、ユーザの判断によ
って認識メモリ6中に任意の所望の標準パターン群を形
成することが可能になり、登録作業の負担を軽減できて
、極めて融通性があり認識率を高めうる音声認識システ
ムを得ることができる。
〔発明の効果〕
以上に説明したように、本発明によれば、第一の記憶手
段に所定の標準パターンが存在するときに該標準パター
ンを第二の記憶手段に転送し登録するようにしているの
で、ユーザの登録作業の負担を軽減することができる。
また第二の記憶手段には認識対象となる標準パターン群
だけが登録さされるので、どのクラスタの標準パターン
群を認識対象として用いるかの判断が不要となり、認識
処理を効率良く行なわせることができる。
さらに第二の記憶手段に不特定話者用の標準パターンが
登録された場合に、認識処理時にこれを特定話者の特徴
パターンに゛置き換えるようにすれば、認識率を高める
ことができる。
【図面の簡単な説明】
第1図は本発明に係る音声認識システムの一実施例の構
成図、第2図は従来の音声認識システムの構成図である
。 1・・・音声認識システム、2・・・音声入力部、3・
・・特徴抽出部、4・・・外部記憶装置、5・・・入力
装置、6・・・認識メモリ、7・・・登録部、8・・・
認識部、P、・・・特定話者標準パターン群、PB・・
・汎用標準パターン群 特許出願人  株式会社 リ コ − 第 図 第 図

Claims (1)

  1. 【特許請求の範囲】 1)音声認識用の標準パターン群が格納される第一の記
    憶手段と、認識対象の標準パターン群が登録される第二
    の記憶手段と、前記第二の記憶手段に認識対象の標準パ
    ターン群を登録する登録手段とを備え、前記登録手段は
    、前記第一の記憶手段を検索し前記第一の記憶手段に所
    定の標準パターンが存在するときに該標準パターンを前
    記第二の記憶手段に転送し登録するようになつているこ
    とを特徴とする音声認識システム。 2)前記登録手段は、前記第一の記憶手段を検索して不
    特定話者用の標準パターンを前記第二の記憶手段に転送
    し登録した場合に、認識処理時に得られる特徴パターン
    によって前記第二の記憶手段に登録されている不特定話
    者用の標準パターンを置き換え、前記第二の記憶手段を
    更新するようになっていることを特徴とする請求項1記
    載の音声認識システム。
JP1033208A 1989-02-13 1989-02-13 音声認識システム Expired - Lifetime JP3001585B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1033208A JP3001585B2 (ja) 1989-02-13 1989-02-13 音声認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1033208A JP3001585B2 (ja) 1989-02-13 1989-02-13 音声認識システム

Publications (2)

Publication Number Publication Date
JPH02211500A true JPH02211500A (ja) 1990-08-22
JP3001585B2 JP3001585B2 (ja) 2000-01-24

Family

ID=12380042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1033208A Expired - Lifetime JP3001585B2 (ja) 1989-02-13 1989-02-13 音声認識システム

Country Status (1)

Country Link
JP (1) JP3001585B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001337691A (ja) * 2000-05-29 2001-12-07 Olympus Optical Co Ltd 音声記録装置、音声処理装置、音声処理プログラムを記録した記録媒体及び音声データ処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001337691A (ja) * 2000-05-29 2001-12-07 Olympus Optical Co Ltd 音声記録装置、音声処理装置、音声処理プログラムを記録した記録媒体及び音声データ処理方法

Also Published As

Publication number Publication date
JP3001585B2 (ja) 2000-01-24

Similar Documents

Publication Publication Date Title
JP2002099561A (ja) データ変換方法およびデータ変換システム並びに記憶媒体
JPH02211500A (ja) 音声認識システム
JP2004226698A (ja) 音声認識装置
JPS5821287B2 (ja) カナ漢字変換装置
JP2812218B2 (ja) データ検索装置およびデータ検索方法
JP2006065651A (ja) 商標称呼検索プログラム、商標称呼検索装置及び商標称呼検索方法
JP3108121B2 (ja) 音声認識装置の辞書制御方式
JP2001243230A (ja) 類似性判別方法
JPH05347666A (ja) 電子会議システム
JPH10232871A (ja) 検索装置
JPH06223113A (ja) 電子ファイリング装置
JPS5864548A (ja) 音声日本語処理システム
JPH04290158A (ja) 文書作成装置
JPH05233713A (ja) 学習形あいまい検索方法
JPH03177972A (ja) データベースシステム
JPS637398B2 (ja)
JPH04148232A (ja) 用語管理方式
JPH03282500A (ja) 応答用音声データの管理方法及び装置
JPH0235499A (ja) 音声認識方式
JPH0689217A (ja) ファイル情報登録方式
JPH0341560A (ja) 情報検索方式
JPH06161995A (ja) 氏名データ整形方法および装置
JP2001175320A (ja) プラント監視装置
JPH04165566A (ja) カナ文字のソート装置
JPS62151922A (ja) 情報登録検索装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 10