JP3001585B2 - 音声認識システム - Google Patents

音声認識システム

Info

Publication number
JP3001585B2
JP3001585B2 JP1033208A JP3320889A JP3001585B2 JP 3001585 B2 JP3001585 B2 JP 3001585B2 JP 1033208 A JP1033208 A JP 1033208A JP 3320889 A JP3320889 A JP 3320889A JP 3001585 B2 JP3001585 B2 JP 3001585B2
Authority
JP
Japan
Prior art keywords
standard pattern
word
pattern group
storage means
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1033208A
Other languages
English (en)
Other versions
JPH02211500A (ja
Inventor
晴剛 安田
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1033208A priority Critical patent/JP3001585B2/ja
Publication of JPH02211500A publication Critical patent/JPH02211500A/ja
Application granted granted Critical
Publication of JP3001585B2 publication Critical patent/JP3001585B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声認識用の単語の標準パターンの登録機
能を備えた音声認識システムに関する。
〔従来の技術〕
音声認識システムとして、第2図に示したような構成
のものが知られている。
第2図に示した音声認識システム50では、音声認識用
の標準パターンの全ては一般に認識メモリ54に標準パタ
ーン群として格納されている。
音声の認識時には、特定話者がある単語の音声を発声
すると、この音声はマイクなどの音声入力部51から特徴
抽出部52に入力し、特徴抽出部52において特徴量が抽出
され特徴パターンとして認識部53に送られる。認識部53
では抽出された特徴パターンを認識メモリ54に格納され
ている標準パターン群と比較照合し、標準パターン群の
うちで比較結果の一致した標準パターンに対応する単語
名を認識結果として出力させることができる。
また、特定話者が新しい単語について登録しようとす
るときには、新しい単語についてこれを音声で音声入力
部51に入力する。入力された音声は特徴抽出部52で特徴
量が抽出され特徴パターンとして登録部55に送られ、登
録部55ではこの特徴パターンを新しい単語の標準パター
ンとしてその単語名とともに認識メモリ54の標準パター
ン群に格納し、これによって新しい単語についての標準
パターンの登録を行なうことができる。なお認識メモリ
54上の標準パターン群は、場合に応じて外部記憶装置56
などに格納されるようになっている。
ところで従来では、認識メモリ54上の標準パターン群
は、クラスタなどに分割されて格納され、これによって
認識処理時に認識対象となる標準パターンをある程度絞
り、認識を容易にさせるようにしていた。
〔発明が解決しようとする課題〕
従来では認識を容易にさせるため認識メモリ54上の標
準パターン群をクラスタなどに分割したが、このために
クラスタ等の管理が必要となり、またそのチェックも必
要となるなどの問題があった。さらに、クラスタなどに
分割したとしても、認識処理時に認識メモリ54上の全て
の標準パターン群から認識対象となる標準パターンのク
ラスタの限定を容易に行なうことができないという問題
があった。またユーザは新しい単語については必ず登録
作業を必要とし、登録に際して、新しい単語の属すべき
クラスタや他の情報等を何らかの仕方で入力しなければ
ならないという問題があった。
本発明は、ユーザの登録作業の負担を軽減し、また認
識処理をより効率良くかつ精度良く行なわせることの可
能な音声認識システムを提供することを目的としてい
る。
〔課題を解決するための手段〕
上記目的を達成するために、本発明は、音声認識用の
標準パターン群が格納される第一の記憶手段と、認識対
象の標準パターン群が登録される第二の記憶手段と、前
記第二の記憶手段に認識対象の標準パターン群を登録す
る登録手段とを備え、前記登録手段は、前記第一の記憶
手段を検索し前記第一の記憶手段に所定の標準パターン
が存在するときに該標準パターンを前記第二の記憶手段
に転送し登録するようになっていることを特徴としたも
のである。
また、前記登録手段は、前記第一の記憶手段を検索し
て不特定話者用の標準パターンを前記第二の記憶手段に
転送し登録した場合に、認識処理時に得られる特徴パタ
ーンによって前記第二の記憶手段に登録されている不特
定話者用の標準パターンを置き換え、前記第二の記憶手
段を更新するようになっている。
〔作用〕
上記のような構成の音声認識システムでは、登録手段
は、音声認識用の標準パターン群が格納されている第一
の記憶手段を検索して所定の標準パターンが存在すると
きに、この標準パターンを第二の記憶手段に転送すると
いうような仕方で認識対象の標準パターン群を第二の記
憶手段に形成する。所定の標準パターンが第一の記憶手
段に存在する場合には、第二の記憶手段への認識対象の
標準パターン群の登録は、上記のように自動的になされ
るので、ユーザの登録作業の負担は軽減する。また認識
処理は第二の記憶手段に登録された認識対象の標準パタ
ーン群に基づいて行なわれる。すなわち入力音声の特徴
パターンと第二の記憶手段に登録された認識対象の標準
パターン群とを直接照合させることによって認識処理が
なされるので、認識処理を効率良く行なうことができ
る。本発明ではさらにこの認識処理時に、照合の結果、
入力音声の特徴パターンと類似する標準パターンが見出
され、この標準パターンが第一の記憶手段の不特定話者
用の標準パターンを転送したものであるときには、この
標準パターンを特定話者用の標準パターンとみなしうる
特徴パターンに置き換え、第二の記憶手段を更新し、こ
れにより認識率を高めることができる。
〔実施例〕
以下、本発明の一実施例を図面に基づいて説明する。
第1図は本発明に係る音声認識システムの一実施例の
構成図である。
この音声認識システム1は、話者の音声が入力するマ
イクなどの音声入力部2と、入力した音声から特徴量を
抽出し特徴パターンとして求める特徴抽出部3と、単語
の標準パターンが単語名と対応させて格納される外部記
憶装置4と、外部記憶装置4に単語名等を入力させるキ
ーボード/ディスプレイなどの入力装置5と、認識対象
の標準パターン群が記憶される認識メモリ6と、認識対
象の標準パターン群を認識メモリ6に登録する登録部7
と、認識メモリ6に登録された認識対象の標準パターン
群に基づいて入力音声の認識処理を行なう認識部8とを
備えている。
外部記憶装置4上には、ユーザが登録した全ての単語
の標準パターンが特定話者標準パターン群PAとして単語
名とともに格納されるとともに、ユーザが高い頻度で使
うと考えられる汎用的言語(例えば、“はい",“いい
え",数字,出力,……等)の標準パターンが不特定話者
標準パターン群すなわち汎用標準パターン群PBとして単
語名とともに格納されている。なお、1つの単語の標準
パターンが特定話者標準パターン群PAと汎用標準パター
ン群PBとの両方に格納されていても良い。
また登録部7は、認識対象となる標準パターン群を認
識メモリ6に登録するに際して、登録すべき単語の標準
パターンが外部記憶装置4の特定話者標準パターン群
PA,または汎用標準パターン群PBの中に存在するときに
は、この標準パターンを外部記憶装置4から認識メモリ
6に転送し、外部記憶装置4中に存在しない場合には、
ユーザにその旨を知らせて認識メモリ6への登録作業を
行なわせるようになっている。
このような構成の音声認識システムの動作を次に説明
する。
外部記憶装置4中には、特定話者標準パターン群PA
汎用標準パターン群PBとが予め格納されているとする。
認識処理を行なわせるに先立って、単語の標準パターン
を認識メモリ6の認識対象の標準パターン群として登録
する登録処理が行なわれる。この登録処理は、ユーザが
入力装置5から登録すべき単語の単語名等を入力するこ
とによってなされ、登録部6は、入力装置5から例えば
単語名が入力されると、これと同一の単語名をもつ標準
パターンが外部記憶装置4にすでに格納されているか否
かを検索する。すなわち、先づ外部記憶装置4中の特定
話者標準パターン群PAを検索して、特定話者標準パター
ン群PA中に同じ単語名をもつ標準パターンが存在するか
否かを調べる。同じ単語名をもつ標準パターンが存在す
る場合には、この標準パターンを認識メモリ6に転送
し、認識対象の標準パターン群に組込む。これに対して
特定話者標準パターン群PA中に目的の単語の標準パター
ンが存在しないときには、汎用標準パターン群PBを検索
する。汎用標準パターン群PB中に目的の単語の標準パタ
ーンが存在するときには、この標準パターンを認識メモ
リ6に転送し、認識対象の標準パターン群に組込む。
このように、登録しようとする単語の標準パターンが
外部記憶装置4にすでに存在するときには、この標準パ
ターンは外部記憶装置4から認識メモリ6へ転送され、
認識対象の標準パターン群が自動的に形成される。
外部記憶装置4を検索し、登録しようとする単語の標
準パターンが外部記憶装置4中の特定話者標準パターン
群PA,汎用標準パターン群PBのいずれにも存在しない場
合には、ユーザにその旨を知らせ、これによりユーザは
その単語の音声を発声し、音声入力部2から特徴抽出部
3に入力させ、特徴抽出部3で抽出された特徴パターン
をその単語の単語名とともに認識メモリ6中に認識対象
の標準パターン群として登録する。
このようにして、新しい単語の標準パターンの登録に
際してユーザの登録作業は、外部記憶装置4中にない単
語の標準パターンのみに限られるので、登録に要するユ
ーザの負担を著しく軽減することが可能となる。また認
識メモリ6には認識対象となる標準パターン群だけが登
録されるので、認識処理時に従来のようにどのクラスタ
の標準パターン群を認識対象として用いるかの判断が不
要となり、認識処理を効率良く行なうことができる。
さらに、本実施例では、外部記憶装置4中の特定話者
標準パターン群PAを汎用標準パターン群PBよりも優先し
て検索するようにしており、認識メモリ6中にはある単
語について汎用標準パターン群の標準パターンに比べて
高い認識率を与える特定話者標準パターン群からの標準
パターンが優先して登録されるので、認識処理時に高い
認識率を得ることができる。
なお、ある単語について認識メモリ6に汎用標準パタ
ーンが転送されて登録された場合に、認識処理時にその
単語の特定話者の音声が音声入力部2から入力され、特
徴抽出部3において特徴パターンが抽出され、認識部8
でこの特徴パターンと汎用標準パターンとが類似してい
ると判断されたときに、認識メモリ6に登録されている
その単語の汎用標準パターンを特定話者の特徴パターン
で置き換えて更新し特定化するようにすれば、より高い
認識率を与える認識対象の標準パターン群を認識メモリ
6中に形成することができる。
上述の実施例では、入力装置5から単語名を入力させ
ることによって外部記憶装置4を単語名で検索するよう
にしたが、例えば単語名の先頭文字によって検索を行な
うことも可能である。具体的には、入力装置5から例え
ば「m」のキーが入力されると、単語名の先頭文字が
「m」の標準パターンを外部記憶装置4から検索し、こ
れらの全てを認識メモリ6に転送し、認識を行なわせる
こともできる。また例えば「mak」までのストリングが
キー入力されたときにも、同様に「mak」の先頭3文字
をもつ単語の標準パターンの全てを認識メモリ6に転送
し認識を行なわせることができる。
以上のようにして本実施例によれば、ユーザの判断に
よって認識メモリ6中に任意の所望の標準パターン群を
形成することが可能になり、登録作業の負担を軽減でき
て、極めて融通性があり認識率を高めうる音声認識シス
テムを得ることができる。
〔発明の効果〕
以上に説明したように、本発明によれば、第一の記憶
手段に所定の標準パターンが存在するときに該標準パタ
ーンを第二の記憶手段に転送し登録するようにしている
ので、ユーザの登録作業の負担を軽減することができ
る。また第二の記憶手段には認識対象となる標準パター
ン群だけが登録されるので、どのクラスタの標準パター
ン群を認識対象として用いるかの判断が不要となり、認
識処理を効率良く行なわせることができる。
さらに第二の記憶手段に不特定話者用の標準パターン
が登録された場合に、認識処理時にこれを特定話者の特
徴パターンに置き換えるようにすれば、認識率を高める
ことができる。
【図面の簡単な説明】
第1図は本発明に係る音声認識システムの一実施例の構
成図、第2図は従来の音声認識システムの構成図であ
る。 1……音声認識システム、2……音声入力部、 3……特徴抽出部、4……外部記憶装置、 5……入力装置、6……認識メモリ、7……登録部、 8……認識部、PA……特定話者標準パターン群、 PB……汎用標準パターン群
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭58−178200(JP,A) 特開 昭57−139798(JP,A) 特開 昭60−12599(JP,A) 特開 昭59−3494(JP,A) 特開 昭58−19100(JP,A) 特開 昭56−140399(JP,A) 特公 昭62−27399(JP,B2) 特公 平2−56680(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G10L 3/00 521 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】文字を入力する入力手段と、音声認識用の
    標準パターン群が格納される第1の記憶手段と、認識対
    象のパターン群が登録される第2の記憶手段と、前記第
    2の記憶手段に認識対象のパターン群を登録する登録手
    段とを備え、前記第1の記憶手段に格納される音声認識
    用の標準パターン群の各標準パターンは、それぞれ、所
    定の単語を表わす文字列に対応付けられて格納されてお
    り、前記登録手段は、前記入力手段から第2の記憶手段
    へ転送すべき少なくとも1つの文字が入力されると、そ
    の入力された少なくとも1つの文字について前記第1の
    記憶手段の単語を標わす文字列とを比較し、入力された
    少なくとも1つの文字と部分一致する単語が存在すると
    きにはその単語に対応する標準パターンを前記第2の記
    憶手段に転送し登録するようになっていることを特徴と
    する音声認識システム。
  2. 【請求項2】請求項1記載の音声認識システムにおい
    て、前記第1の記憶手段に格納されている不特定話者用
    の標準パターンを用いて前記登録手段で作成した前記第
    2の記憶手段を特定話者用の辞書として用いるようにな
    っていることを特徴とする音声認識システム。
  3. 【請求項3】請求項1記載の音声認識システムにおい
    て、前記第1の記憶手段には、音声認識用の標準パター
    ン群として、特定話者標準パターン群と汎用標準パター
    ン群とが予め格納されており、前記登録手段は、前記入
    力手段から少なくとも1つの文字が入力されたとき、先
    ず、第1の記憶手段中の特定話者標準パターン群と比較
    し、該当する単語が存在する場合には、その単語に対応
    する標準パターンを第2の記憶手段に転送して登録し、
    また、該当する単語が存在しない場合には、第1の記憶
    手段中の汎用標準パターン群と比較し、該当する単語が
    存在する場合には、その単語に対応する標準パターンを
    第2の記憶手段に転送して登録するようになっているこ
    とを特徴とする音声認識システム。
JP1033208A 1989-02-13 1989-02-13 音声認識システム Expired - Lifetime JP3001585B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1033208A JP3001585B2 (ja) 1989-02-13 1989-02-13 音声認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1033208A JP3001585B2 (ja) 1989-02-13 1989-02-13 音声認識システム

Publications (2)

Publication Number Publication Date
JPH02211500A JPH02211500A (ja) 1990-08-22
JP3001585B2 true JP3001585B2 (ja) 2000-01-24

Family

ID=12380042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1033208A Expired - Lifetime JP3001585B2 (ja) 1989-02-13 1989-02-13 音声認識システム

Country Status (1)

Country Link
JP (1) JP3001585B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4540185B2 (ja) * 2000-05-29 2010-09-08 オリンパス株式会社 音声処理装置及び音声処理プログラム

Also Published As

Publication number Publication date
JPH02211500A (ja) 1990-08-22

Similar Documents

Publication Publication Date Title
JP3132738B2 (ja) テキスト検索方法
WO2018149209A1 (zh) 语音识别方法、电子设备以及计算机存储介质
JPH11338883A (ja) 特徴文字列抽出方法および装置とこれを用いた類似文書検索方法および装置並びに特徴文字列抽出プログラムを格納した記憶媒体および類似文書検索プログラムを格納した記憶媒体
JPH10240759A (ja) 検索装置
US20080091660A1 (en) System and method for searching information using synonyms
JP2002189747A (ja) 文書情報の検索方法
JP5112978B2 (ja) 音声認識装置、音声認識システムおよびプログラム
CN111932076B (zh) 一种规则配置和发布方法、装置及计算设备
JP3001585B2 (ja) 音声認識システム
JP3230606B2 (ja) 固有名詞特定方法
JP2000259645A (ja) 音声処理装置及び音声データ検索装置
JP2004348552A (ja) 音声文書検索装置および方法およびプログラム
JP2002342361A (ja) 情報検索装置
CN112988993B (zh) 一种问答方法和计算设备
WO2021051600A1 (zh) 基于信息熵识别新词的方法、装置、设备及存储介质
JPH07219957A (ja) 情報分類装置、情報検索装置及び情報収集装置
JP2018010482A (ja) 文書概念ベース生成装置、文書概念検索装置、方法、及びプログラム
JPH09185632A (ja) 情報検索・編集方法及び装置
JP3105930B2 (ja) 音声認識装置
JP2002132789A (ja) 文書検索方法
JP3389285B2 (ja) 固有名詞特定方法
JP3108121B2 (ja) 音声認識装置の辞書制御方式
JPH11110395A (ja) 類似文書検索装置および類似文書検索方法
JP2001067364A (ja) 複合メディア検索方法および複合メディア検索用プログラム記録媒体
JP2849111B2 (ja) 学習機能付き自然文意味解析処理装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 10