JPS6361300A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS6361300A
JPS6361300A JP61205463A JP20546386A JPS6361300A JP S6361300 A JPS6361300 A JP S6361300A JP 61205463 A JP61205463 A JP 61205463A JP 20546386 A JP20546386 A JP 20546386A JP S6361300 A JPS6361300 A JP S6361300A
Authority
JP
Japan
Prior art keywords
recognition
standard pattern
voice
registered
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61205463A
Other languages
English (en)
Other versions
JP2559031B2 (ja
Inventor
敏 奥山
知善 竹林
俊宏 浅見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61205463A priority Critical patent/JP2559031B2/ja
Publication of JPS6361300A publication Critical patent/JPS6361300A/ja
Application granted granted Critical
Publication of JP2559031B2 publication Critical patent/JP2559031B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 特定話者、離散単語の音声認識方式において、音声の特
徴のみから認識を行う場合必ずしも高い認識率を得るこ
とができないが、各単語に使用頻度に基づく優先度を付
して登録し、認識時、音声の特徴に使用頻度を加味して
認識を行うことによって、より認識率を向上させる。
〔産業上の利用分野〕
本発明は音声を認識する方式に係り、特に特定話者の離
散単語による音声認識の認識率を向上させることができ
る音声認識方式に関するものである。
音声認識技術の実用化が多くの分野で進められているが
、特に装置の小型化と認識率の向上とが強く要求されて
いる。各方式のなかで最も認識率が高く小型化にも適し
たものとして実用化が進んでいるのが、特定話者、離散
単語による音声認識方式である。
この方式はその音声を認識すべき特定の話者にいくつか
の離散単語の音声を発声させ、この音声を分析して特徴
を抽出して登録しておき、認識時、同じ話者が発声した
離散単語の音声の特徴と予め登録しである音声の特徴と
を比較して、最も近いと判定されたものを認識結果とす
るもので゛ある。
この方式では一般にかなり高い認識率が得られるが、そ
れでも100%の認識率を得ることは困難であって、特
に認識装置が実際に使用される環境条件によって、ある
いは同じ話者でも音声の変化等に基づいて認識率が低下
する。本方式のアルゴリズムで、音声の特徴だけから認
識率を上げることには限界があり、そのため何等かの別
の手段を加味することによって、より高い、100%に
近い認識率を得ることができる音声認識方式が要望され
ている。
〔従来の技術〕
第4図は従来の離散単語、特定話者の音声認識方式を示
したものである。同図において、1は音声入力を示して
いる。2は特徴抽出部であって、入力音声を多数の帯域
に分割して周波数分析を行う等の周知の手法で音声の特
徴を抽出して、それぞれの帯域ごとのパラメータをパタ
ーン化する。
音声登録時には抽出された音声の特徴パターンは、径路
aを経て標準パターン格納部3に送られる。
標準パターンデータ格納部3はメモリからなり、入力さ
れた音声の特徴パターンに例えば番号等のデータを付し
て、標準パターンとして格納する。
音声認識時においては、音声人力1は特徴抽出部2にお
いて同様にして特徴を抽出され、抽出された特徴パター
ンは径路すを経て照合部4に加えられる。照合部4にお
いては、入力された音声の特徴パターンと標準パターン
データ格納部4から読み出された標準パターンとについ
て、周知のDP (Dynamic Programi
ng )マツチング等の手法でパラメータごとにその距
離を計算し、入カバターンとの距離が最も近い標準パタ
ーンについて、これを示す番号等を認識結果出力5とし
て出力する。
〔発明が解決しようとする問題点〕
このように従来の特定話者、 1iil散単語による音
声認識方式では、音声の特徴の情報のみによって認識を
行っていた。そのため音声認識装置が使用される環境に
よっては、音声情報が歪んで正しく特徴抽出が行われな
いことがあり、そのため音声認識率が低下することを避
けられなかった。例えばオフィス等において使用する場
合には、周囲の騒音等の影響で認識率は大きく低下する
。また使用環境以外に認識方式自体の原因によって生じ
る誤差もあり、これらのため、認識率の向上には限界が
あるという問題が生じていた。
〔問題点を解決するための手段〕
このような従来技術の問題点を解決するため、第1図の
原理的構成図に示すように、特定話者の離散単語の特徴
パターンを特徴抽出手段(2)で抽出し、抽出された特
徴パターンを標準パターン登録手段(3)に登録し、話
者の音声から抽出された特徴パターンを標準パターン登
録手段(3)の特徴パターンと照合手段(4)で照合し
て最も距離の近い単語を示す情報を認識結果として出力
する音声認識方式において、標準パターン登録手段(3
)における標準パターンを使用頻度に応じた優先度を付
して登録するとともに、使用頻度判定手段(6)と、認
識判定手段(7)とを具える。
使用頻度判定手段(6)は、照合手段(4)において距
離が近いと判定された単語が2つ以上あったとき標準パ
ターン登録手段(3)における優先度の最も高い単語を
判定する。
認識判定手段(7)は、照合手段(4)において距離が
近いと判定された単語が1つだけのときはこれを示す情
報を認識結果として出力し、2つ以上あったときは使用
頻度判定手段(6)において優先度が高いと判定された
単語を示す情報を認識結果として出力する。
〔作 用〕
音声認識の結果登録されている標準パターンとの距離が
近いと判定された単語が1つだけのときはこれを示す情
報を認識結果として出力するが、このような単語が2つ
以上あったときは、使用頻度が最も高い単語を判定して
これを示す情報を認識結果とするので、単語の音声情報
にその単語の使用頻度を加味して音声認識を行うことに
なり、認識率がより向上する。
〔実施例〕
第2図は本発明の一実施例を示し、第4図におけると同
じ部分は同じ番号で示されており、それらの動作もまた
同様である。6は使用頻度判定部、7は認識判定部であ
って、特徴抽出部2.標準パターンデータ格納部3.照
合部4.使使用度判定部6.認識判定部7は音声認識部
10を構成している。音声認識部10は音声認識によっ
てダイヤルを行う電話機における、音声認識装置を例示
している。11は処理装置(CPU)、12はセレクタ
、】3はスイッチ、】4は伝送路である。
音声登録時または音声認識時においては、CPU1lは
セレクタ12をa側に設定する。これによって音声登録
モードまたは音声認識モードとなる。
音声登録時においては、発声された音声は音声入力端子
1から特徴抽出部2に加えられ、第4図について説明し
たのと同様にして特徴を抽出され、抽出された特徴パタ
ーンは後述するような優先順位の指定に基づいて、Cの
径路から標準パターンデータ格納部3において標準パタ
ーンとして登録される。
音声認識時には、特徴抽出部2において抽出された音声
の特徴パターンをdの径路を経て照合部4に加え、標準
パターンデータ格納部3に登録されている各特徴パター
ンをeの経路で読み出してこれとの距離を求め、最も距
離の小さいパターンに対応する番号等をhの径路で認識
判定部7に送る。認識判定部7では、照合部4における
照合結果得られた候補となるデータが1個だけのときは
、これを認識結果としてkの径路でCPUIIに送り、
CPUIIはこのデータを解読して、例えばこの番号等
に対応する電話番号でダイヤリングを行って相手方と接
続されたとき、セレクタI2をb側に切り替えてmの径
路でセレクタ12とスイッチ13を接続して音声人力1
と伝送路14とを接続し、音声を直接伝送路14に送っ
て通話できるようにする。
また照合H4での照合結果、いずれも距離が小さくて候
補となるべきデータが2個以上あったときは、認識判定
部7はiの径路で使用頻度判定部6にその情報を与え、
使用頻度判定部6はf、  gの径路で標準パターンデ
ータ格納部3に照会して、標準パターンデータ格納部3
における優先順位が最も高いデータ(すなわち使用頻度
が最も高いデータ)を判定して、判定結果をjの径路で
認識判定部7に返す。認識判定部7はこの番号等を認識
結果としてCPUIIへ渡し、これによって以後ダイヤ
リング等の処理が同様にして行われる。
第3図は標準パターンデータ格納部7における使用頻度
に基づくデータ管理を説明するものであって、(1)は
登録時を示している。(alはデータ数が最大格納数に
満たないときを示し、データ1〜4が登録されていると
き、新に登録されるデータaがあったときは、最も優先
順位の高い位置に登録される。
山)は最大格納数(例えば32個)のデータ1〜データ
32が既に格納されているときを示し、新に登録したデ
ータaは最も優先順位の高い位置に登録され、最下位の
データ1は削除される。
(2)は認識時を示し、データ1〜データ32が登録さ
れているとき、例えばデータ9が認識に使用されたとき
は、優先順位を1つ繰り上げた位置に登録し直されるこ
とが示されている。
なおこの場合、認識されたものを直ちに優先度を上げる
ようにすると、誤認識が生じたとき優先度が乱れて誤動
作することになるので、認識結果が利用者によって正し
いと判断されるのを待って、すなわちダイヤルが行われ
て正しく接続が行われたとき、CPUIIから径路lを
経て使用頻度判定部6を制御して、データの優先度を上
げるようにしている。
第2図に示されるような電話機においては、音声認識ダ
イヤルが主として使用頻度の高い相手に対して使用され
ることが多いが、本発明によれば音声情報の他に使用頻
度の情報を用いて認識結果を判定するため、より認識率
の高い音声認識を実現できることになる。
また第3図に説明されたような方法で標準データの管理
を行っているので、利用者にとって必要性の少ない、あ
まり使用されないデータを自動的に削除できるという効
果もある。
〔発明の効果〕
以上説明したように本発明によれば、音声情報の他に使
用頻度の情報を補助的に用いて音声認識結果の判別を行
っているので、従来のような音声情報のみを用いて認識
を行う方法と比べて、より高い音声認識率を得ることが
できる。
【図面の簡単な説明】
第1図は本発明の原理的構成を示す図、第2図は本発明
の一実施例の構成を示す図、第3図は使用頻度に基づく
データ管理を説明する図、 第4図は従来の特定話者、離散単語の音声認識方式を示
す図である。 1・−音声入力 4−照合部 6−使用頻度判定部 7−・・認識判定部 1〇−音声認識部 11−・−処理装置 12・−セレクタ 13−・スイッチ 14−・−伝送路

Claims (1)

  1. 【特許請求の範囲】 特定話者の離散単語の特徴パターンを抽出する特徴抽出
    手段(2)と、該抽出された特徴パターンを登録する標
    準パターン登録手段(3)と、該話者の音声から抽出さ
    れた特徴パターンを標準パターン登録手段(3)の特徴
    パターンと照合して最も距離の近い単語を示す情報を認
    識結果として出力する照合手段(4)とを具えてなる音
    声認識方式において、 前記標準パターン登録手段(3)における標準パターン
    を使用頻度に応じた優先度を付して登録するとともに、 前記照合手段(4)において距離が近いと判定された単
    語が2つ以上あつたとき前記標準パターン登録手段(3
    )における優先度の最も高い単語を判定する使用頻度判
    定手段(6)と、 前記照合手段(4)において距離が近いと判定された単
    語が1つだけのときはこれを示す情報を認識結果として
    出力し、2つ以上あつたときは前記使用頻度判定手段(
    6)において優先度が高いと判定された単語を示す情報
    を認識結果として出力する認識判定手段(7)とを具え
    てなることを特徴とする音声認識方式。
JP61205463A 1986-09-01 1986-09-01 音声認識方式 Expired - Lifetime JP2559031B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61205463A JP2559031B2 (ja) 1986-09-01 1986-09-01 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61205463A JP2559031B2 (ja) 1986-09-01 1986-09-01 音声認識方式

Publications (2)

Publication Number Publication Date
JPS6361300A true JPS6361300A (ja) 1988-03-17
JP2559031B2 JP2559031B2 (ja) 1996-11-27

Family

ID=16507288

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61205463A Expired - Lifetime JP2559031B2 (ja) 1986-09-01 1986-09-01 音声認識方式

Country Status (1)

Country Link
JP (1) JP2559031B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001265377A (ja) * 2000-03-15 2001-09-28 Junji Kuwabara 音声処理装置
JP2001312296A (ja) * 2000-05-02 2001-11-09 Internatl Business Mach Corp <Ibm> 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体
JP2002057811A (ja) * 2000-08-09 2002-02-22 Jiyakosu:Kk 声紋電話システム
JP2004295102A (ja) * 2003-03-13 2004-10-21 Matsushita Electric Ind Co Ltd 音声認識辞書作成装置及び情報検索装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3042585B2 (ja) 1995-01-30 2000-05-15 富士通テン株式会社 音声認識装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57209575A (en) * 1981-06-19 1982-12-22 Fujitsu Ltd Character recognizing device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57209575A (en) * 1981-06-19 1982-12-22 Fujitsu Ltd Character recognizing device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001265377A (ja) * 2000-03-15 2001-09-28 Junji Kuwabara 音声処理装置
JP2001312296A (ja) * 2000-05-02 2001-11-09 Internatl Business Mach Corp <Ibm> 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体
JP2002057811A (ja) * 2000-08-09 2002-02-22 Jiyakosu:Kk 声紋電話システム
JP2004295102A (ja) * 2003-03-13 2004-10-21 Matsushita Electric Ind Co Ltd 音声認識辞書作成装置及び情報検索装置
JP4601306B2 (ja) * 2003-03-13 2010-12-22 パナソニック株式会社 情報検索装置、情報検索方法、およびプログラム

Also Published As

Publication number Publication date
JP2559031B2 (ja) 1996-11-27

Similar Documents

Publication Publication Date Title
WO2021213490A1 (zh) 一种身份验证方法、装置和电子设备
CN113744742A (zh) 对话场景下的角色识别方法、装置和系统
JPS6361300A (ja) 音声認識方式
CN113724698B (zh) 语音识别模型的训练方法、装置、设备及存储介质
JPH03248199A (ja) 音声認識方式
JPS5823097A (ja) 音声認識装置
JP2899485B2 (ja) コードレス電話機
KR100811554B1 (ko) 음성 다이얼링 기능을 갖는 통신 단말기 및 음성 다이얼링방법
CA2176103C (en) Speech recognizer
JPS593491A (ja) 音声認識装置
JPS5876892A (ja) 音声認識装置
JPS6052440B2 (ja) 音声認識装置
JPH09244684A (ja) 本人認証装置
JPS60169900A (ja) 単語登録方式
JPH01293397A (ja) 音声応答方式
JPS62229197A (ja) 数字音声認識装置
JPS593498A (ja) 音声認識装置
JPS58159598A (ja) 単音節音声認識方式
JPS58159599A (ja) 単音節音声認識方式
JPS6078489A (ja) 辞書更新方式
JPS63121098A (ja) 電話用音声認識装置
JPS58121100A (ja) 単語音声認識方式
JPS5898794A (ja) パタンマツチング装置
JPS5977500A (ja) 単語音声認識方式
JPH03123156A (ja) 音声ダイヤル装置