JPS6120996A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS6120996A
JPS6120996A JP59141794A JP14179484A JPS6120996A JP S6120996 A JPS6120996 A JP S6120996A JP 59141794 A JP59141794 A JP 59141794A JP 14179484 A JP14179484 A JP 14179484A JP S6120996 A JPS6120996 A JP S6120996A
Authority
JP
Japan
Prior art keywords
voice
pattern
ram
speech
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59141794A
Other languages
English (en)
Other versions
JPH0642154B2 (ja
Inventor
宏樹 大西
鶴藤 真一
正幸 飯田
正典 宮武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Sanyo Denki Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Sanyo Denki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd, Sanyo Denki Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP59141794A priority Critical patent/JPH0642154B2/ja
Publication of JPS6120996A publication Critical patent/JPS6120996A/ja
Publication of JPH0642154B2 publication Critical patent/JPH0642154B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上の利用分野 本発明は音声認識装置、特に不特定話者を対象とした装
置に関する。
(ロ)従 来の技 術 一般に音声は、話者毎に発声器官の形状や発声71、ア
クセント等が異なる為、同じ語を発声したとしても話者
毎に異なった特徴をもっている事が知られている。この
為、不特定多数の話者の音声を認識する場合は、話者毎
の音声の特徴に於ける差違を吸収する認識手法が必要と
されている1−1斯様な認識手法として従来の音声認識
装置に最も多く採用されてhるものとして、同一語につ
いて、話者の相違に対応する複数の標準的な音声パター
ンをROM(リードオンリーメモリ)に格納しておき、
同一の入力音声パターンに対して上記ROM内の複数の
音声パターンを参照してパターン認識を行なうマルチテ
ンプレート法がある。
然るに、マルチテンプレート法に於いて用意される複数
の標準的な音声パターンは、多数話者の音声に基づいて
、話者の相違に依る代表的な音声パターンを複数個選択
したものであるが、全ての話者の音声パターンに完全に
対応できるとは限らず、特異な音質を有する話者の入力
音声に対しては認識率が低下し、誤認識が多発する惧れ
があった。
クス第66頁乃至第69頁には不特定話者単語の認識部
と特定話者単音節の゛認識部を備えた[音声入力の日本
語ワード・プロセッサ」についての記載がある。
しかしながら、斯様なに声認識処理に於いても、特異な
音質を有する話者に対しては、単音節音声の登録処理に
依って特定話者単音節の認識部での認識率は低下する事
はないが、不特定話者単語の認識部での認識率はやはり
低下してしまう欠点があった。
(ハ)発明が解決しようとする問題点 本発明は上述の点に鑑みてなされたものであり、不特定
話者を対象とした音声認識装置に於いて、特異な音質の
話者の音声をも認識率の低下を招く事なく認識せしめよ
うとするものである。
に)問題点を解決するための手段 本発明の音声認識装置は標準的な音声パターンが格納さ
れたROM(リードオンリーメモリ)と特定の話者の音
声パターンを格納可能なRAM(ランダムアクセスメモ
リ)とからなる参照ノきターンメモリ手段を備えたもの
である。
(ホ)作  用 本発明の音声認識装置に於いては、音声の登録時には、
入力された話者の音声を分析して得た音声パターンを参
照パターンメモリ手段のRAMに格納し、音声の認識時
には、入力された話者の音声を分析して得た音声パター
ンを参照パターンメモリ手段の予め標準的な音声パター
ンが格納されたROMと上記RAMとの両方の音声パタ
ーンに基づいてパターン認識が行なわる。
(へ)実 施 例 第1図に本発明の音声認識装置の一実施例を示す。同図
に於いて、(1)は音声を入力するマイク。
ロフォン、(2)は該マイクロフォン(1)から得られ
る音声信号を分析して音声パターンを作成する分析回路
であり、例えばフィルターバンク方式に依る 。
音声のスペクトル値の時系列パターンからなる音声パタ
ーンが出力される。(3)は該分析回路(2)からの音
声パターンが一時的に貯えられるRAM構成の入カバタ
ーンメモリである。
(4)はROMII>とRAM(42とからなる参照パ
ターンメモリ手段であり、ROM(4flには標準的な
音声パターンが格納されており、RAM(43には特定
の話者の音声パターンが格納され得るのである。即ち、
ROM(41)については第2図に示す如く、例え)−
[字音声の音声パターン「ゼロ1、「イチ」、「二」、
・・・・・・「キュー」が夫々#0領域、#1領域、#
2領域、・・・#9領域に対応せしめるのであるが、発
音、アクセント等話者個有の音質の相違が存在する例え
ば3種類の代表的な同一数字音声の音声パターンを予め
選択して各#領域を更に5分割したA、B、C領域に格
納している。一方RAM(421も又上記ROM(41
)の各#領域と対応して#0領域、#1領域、#2領域
、・・・、#9領域が設けられており、この各#領域に
はやはり、「ゼロ」、「イチ」、「二」、・・・「キュ
ー」なる音声パターンが必要に応じて書き込まれるので
ある。
(SW)はモード設定スイッチであり、このスイッチ(
8w)をt側に接続する事に依って登録モードが選択さ
れ、このモード時にマイクロフォン(1)に入力された
話者の数字音声が分析(2)されて得られた入カバター
ンメモ1月3)の音声パターンを参照パターンメモリ手
段(4)のRAM(421の各#領域に第2図に示す如
く順次格納せしめる。
(5)は上記モード設定スイッチ(SW )をr側に接
続する事に依って認識モードを選択した時に、動作する
パターン認識回路であり、マイクロフォン(1)に入力
された話者の数字音声例えば「サンjが分析(2)され
七得られた入カバターンメモリ(3)の音声パターンを
上記参照パターンメモリ手段(4)のROM(41)の
各#領域での各A、B、C領域の音声パターン及びRA
 M (4Bの各#領域の音声パターン全てについて比
較参照してパターン認識が行なわれる。この時入力音声
パターン[サンJがROM(4υの#5・A領域、#5
・B領域、#3・C領域、あるいはRAM(42の#3
領域のいずれかの音声パターンに最も類似であると判定
された時、上記パターン認識回路は入力音声が「サン」
である事を示す#3なるコード信号を出力する事となる
っ上述の如き構成の本発明音声認識装置に於いては、認
識しようとする話者の音声パターンが参照バタニンメモ
リ手段(4)のROM(41)に予め格納されている不
特定話者を対象とした標準的な音声の代表的な3種類の
音声パターンのいずれにも属さない特異なものの場合に
、これを補なうべく登録モードにてRAM(42)にこ
の話者め必要な音声パターンを格納する事となる。従っ
て、この話者の音声認識については主にRAM(43の
音声パターンが判定対象に供せられ、高い認識率が得ら
れるのである。父、一般的な音質の話者の音声認識につ
いては、主にROM(411に予め用意された音声パタ
ーンが判定対象に供せられるのである。
斯様な音声認識装置は基本的には不特定話者を対象とし
ているので、従来実用化されている特定話者専用の装置
と異なり、認識させようとする話者1人1人全てについ
て登録処理を行なう必要がなく、特に特異な音質の音声
の持ち主のみについてだけ登録処理を行なえば良く、一
般的な音声の持ち主について(171この登録処理は必
要ないのである。
以上の説明に於いては、RA M f43に特定の話者
の1人分の音声パターンを格納する場合を例示したが、
オペレータとして不特定話者を対象としながら、例えば
3人の特定話者が主たるオペレータとなる音声入力機器
例えば音声入力ワードプロセッサの入力部を構成する音
声g識装置に於いては、R,AM(43に3人分の音声
パターンを格納できる構成とすればよい。父、この主た
るオペレータが変更された時には、新たなオペレータに
ついてのみ登録処理を行ないRAM(42の音声パター
ンを書き換える事もできる。
(ト)発明の効果 本発明音声認識装置は以上の説明から明らかな如く、入
力音声パターンを、不特定話者用の音声パターンが格納
されたROMと特定話者用の音声パターンが格納された
RAMとからなる参照パターンメモリ手段の全ての音声
パターンを比較参照の対象としてパターン認識するもの
であるので、必要に応じてRAMに特異な音質の話者の
音声パターンを格納する事に依って、この特異な音質の
特定話者の音声に対しても一般的な音質の不特定゛話者
と同様に高い認識率で音声認識を行う事ができる。
【図面の簡単な説明】
ち′<1図は本発明の音声認識装置の一実施例を示すブ
ロック図、第2図は本発明装置IC係るメモリ図である

Claims (1)

  1. 【特許請求の範囲】 1)標準的な音声パターンが格納されたROMと特定の
    話者の音声パターンを格納可能なRAMとからなる参照
    パターンメモリ手段を備え、音声の登録時には、入力さ
    れた話者の音声を分析して得た音声パターンを上記参照
    パターンメモリ手段のRAMに格納し、 音声の認識時には、入力された話者の音声を分析して得
    た音声パターンを上記参照パターンメモリ手段のROM
    とRAMの両方の音声パターンに基づいてパターン認識
    する事を特徴とした音声認識装置。
JP59141794A 1984-07-09 1984-07-09 音声認識装置 Expired - Lifetime JPH0642154B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59141794A JPH0642154B2 (ja) 1984-07-09 1984-07-09 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59141794A JPH0642154B2 (ja) 1984-07-09 1984-07-09 音声認識装置

Publications (2)

Publication Number Publication Date
JPS6120996A true JPS6120996A (ja) 1986-01-29
JPH0642154B2 JPH0642154B2 (ja) 1994-06-01

Family

ID=15300293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59141794A Expired - Lifetime JPH0642154B2 (ja) 1984-07-09 1984-07-09 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0642154B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10146809A (ja) * 1996-11-15 1998-06-02 Juken Sangyo Co Ltd 多孔質の草本類材料を使用した板材

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58106329A (ja) * 1981-12-17 1983-06-24 Matsushita Electric Ind Co Ltd 加熱装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58106329A (ja) * 1981-12-17 1983-06-24 Matsushita Electric Ind Co Ltd 加熱装置

Also Published As

Publication number Publication date
JPH0642154B2 (ja) 1994-06-01

Similar Documents

Publication Publication Date Title
JPS6120996A (ja) 音声認識装置
JPS597998A (ja) 連続音声認識装置
JPH02232696A (ja) 音声認識装置
JPS63149699A (ja) 音声入出力装置
JPS62124599A (ja) 音声認識装置
JPS6126678B2 (ja)
JPS61180297A (ja) 話者照合装置
JPS61278896A (ja) 話者照合装置
JPS63157199A (ja) 話者照合装置
JPS63292199A (ja) 音声認識装置
JPS6167897A (ja) 音声認識装置
JPH0323920B2 (ja)
SU1501139A2 (ru) Способ идентификации говор щего
JPH04301695A (ja) 音声認識装置の辞書制御方式
JPS6410080B2 (ja)
JPS61223799A (ja) 音声合成装置
JPH0316038B2 (ja)
JPS6134599A (ja) パタ−ン認識方式
JPS63281196A (ja) 音声認識装置
JPH01158499A (ja) 定常雑音除去方式
JPS61102684A (ja) 聴覚障害者用発声訓練装置
JPS5868797A (ja) 音声認識装置
JPS59180598A (ja) 音声入力方式
Sroka Effects of various types of speaker normalization on an automatic vowel recognition scheme
JPS58166398A (ja) 音声認識装置における音声辞書登録方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term