JPS6120996A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS6120996A JPS6120996A JP59141794A JP14179484A JPS6120996A JP S6120996 A JPS6120996 A JP S6120996A JP 59141794 A JP59141794 A JP 59141794A JP 14179484 A JP14179484 A JP 14179484A JP S6120996 A JPS6120996 A JP S6120996A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- pattern
- ram
- speech
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(イ)産業上の利用分野
本発明は音声認識装置、特に不特定話者を対象とした装
置に関する。
置に関する。
(ロ)従 来の技 術
一般に音声は、話者毎に発声器官の形状や発声71、ア
クセント等が異なる為、同じ語を発声したとしても話者
毎に異なった特徴をもっている事が知られている。この
為、不特定多数の話者の音声を認識する場合は、話者毎
の音声の特徴に於ける差違を吸収する認識手法が必要と
されている1−1斯様な認識手法として従来の音声認識
装置に最も多く採用されてhるものとして、同一語につ
いて、話者の相違に対応する複数の標準的な音声パター
ンをROM(リードオンリーメモリ)に格納しておき、
同一の入力音声パターンに対して上記ROM内の複数の
音声パターンを参照してパターン認識を行なうマルチテ
ンプレート法がある。
クセント等が異なる為、同じ語を発声したとしても話者
毎に異なった特徴をもっている事が知られている。この
為、不特定多数の話者の音声を認識する場合は、話者毎
の音声の特徴に於ける差違を吸収する認識手法が必要と
されている1−1斯様な認識手法として従来の音声認識
装置に最も多く採用されてhるものとして、同一語につ
いて、話者の相違に対応する複数の標準的な音声パター
ンをROM(リードオンリーメモリ)に格納しておき、
同一の入力音声パターンに対して上記ROM内の複数の
音声パターンを参照してパターン認識を行なうマルチテ
ンプレート法がある。
然るに、マルチテンプレート法に於いて用意される複数
の標準的な音声パターンは、多数話者の音声に基づいて
、話者の相違に依る代表的な音声パターンを複数個選択
したものであるが、全ての話者の音声パターンに完全に
対応できるとは限らず、特異な音質を有する話者の入力
音声に対しては認識率が低下し、誤認識が多発する惧れ
があった。
の標準的な音声パターンは、多数話者の音声に基づいて
、話者の相違に依る代表的な音声パターンを複数個選択
したものであるが、全ての話者の音声パターンに完全に
対応できるとは限らず、特異な音質を有する話者の入力
音声に対しては認識率が低下し、誤認識が多発する惧れ
があった。
クス第66頁乃至第69頁には不特定話者単語の認識部
と特定話者単音節の゛認識部を備えた[音声入力の日本
語ワード・プロセッサ」についての記載がある。
と特定話者単音節の゛認識部を備えた[音声入力の日本
語ワード・プロセッサ」についての記載がある。
しかしながら、斯様なに声認識処理に於いても、特異な
音質を有する話者に対しては、単音節音声の登録処理に
依って特定話者単音節の認識部での認識率は低下する事
はないが、不特定話者単語の認識部での認識率はやはり
低下してしまう欠点があった。
音質を有する話者に対しては、単音節音声の登録処理に
依って特定話者単音節の認識部での認識率は低下する事
はないが、不特定話者単語の認識部での認識率はやはり
低下してしまう欠点があった。
(ハ)発明が解決しようとする問題点
本発明は上述の点に鑑みてなされたものであり、不特定
話者を対象とした音声認識装置に於いて、特異な音質の
話者の音声をも認識率の低下を招く事なく認識せしめよ
うとするものである。
話者を対象とした音声認識装置に於いて、特異な音質の
話者の音声をも認識率の低下を招く事なく認識せしめよ
うとするものである。
に)問題点を解決するための手段
本発明の音声認識装置は標準的な音声パターンが格納さ
れたROM(リードオンリーメモリ)と特定の話者の音
声パターンを格納可能なRAM(ランダムアクセスメモ
リ)とからなる参照ノきターンメモリ手段を備えたもの
である。
れたROM(リードオンリーメモリ)と特定の話者の音
声パターンを格納可能なRAM(ランダムアクセスメモ
リ)とからなる参照ノきターンメモリ手段を備えたもの
である。
(ホ)作 用
本発明の音声認識装置に於いては、音声の登録時には、
入力された話者の音声を分析して得た音声パターンを参
照パターンメモリ手段のRAMに格納し、音声の認識時
には、入力された話者の音声を分析して得た音声パター
ンを参照パターンメモリ手段の予め標準的な音声パター
ンが格納されたROMと上記RAMとの両方の音声パタ
ーンに基づいてパターン認識が行なわる。
入力された話者の音声を分析して得た音声パターンを参
照パターンメモリ手段のRAMに格納し、音声の認識時
には、入力された話者の音声を分析して得た音声パター
ンを参照パターンメモリ手段の予め標準的な音声パター
ンが格納されたROMと上記RAMとの両方の音声パタ
ーンに基づいてパターン認識が行なわる。
(へ)実 施 例
第1図に本発明の音声認識装置の一実施例を示す。同図
に於いて、(1)は音声を入力するマイク。
に於いて、(1)は音声を入力するマイク。
ロフォン、(2)は該マイクロフォン(1)から得られ
る音声信号を分析して音声パターンを作成する分析回路
であり、例えばフィルターバンク方式に依る 。
る音声信号を分析して音声パターンを作成する分析回路
であり、例えばフィルターバンク方式に依る 。
音声のスペクトル値の時系列パターンからなる音声パタ
ーンが出力される。(3)は該分析回路(2)からの音
声パターンが一時的に貯えられるRAM構成の入カバタ
ーンメモリである。
ーンが出力される。(3)は該分析回路(2)からの音
声パターンが一時的に貯えられるRAM構成の入カバタ
ーンメモリである。
(4)はROMII>とRAM(42とからなる参照パ
ターンメモリ手段であり、ROM(4flには標準的な
音声パターンが格納されており、RAM(43には特定
の話者の音声パターンが格納され得るのである。即ち、
ROM(41)については第2図に示す如く、例え)−
[字音声の音声パターン「ゼロ1、「イチ」、「二」、
・・・・・・「キュー」が夫々#0領域、#1領域、#
2領域、・・・#9領域に対応せしめるのであるが、発
音、アクセント等話者個有の音質の相違が存在する例え
ば3種類の代表的な同一数字音声の音声パターンを予め
選択して各#領域を更に5分割したA、B、C領域に格
納している。一方RAM(421も又上記ROM(41
)の各#領域と対応して#0領域、#1領域、#2領域
、・・・、#9領域が設けられており、この各#領域に
はやはり、「ゼロ」、「イチ」、「二」、・・・「キュ
ー」なる音声パターンが必要に応じて書き込まれるので
ある。
ターンメモリ手段であり、ROM(4flには標準的な
音声パターンが格納されており、RAM(43には特定
の話者の音声パターンが格納され得るのである。即ち、
ROM(41)については第2図に示す如く、例え)−
[字音声の音声パターン「ゼロ1、「イチ」、「二」、
・・・・・・「キュー」が夫々#0領域、#1領域、#
2領域、・・・#9領域に対応せしめるのであるが、発
音、アクセント等話者個有の音質の相違が存在する例え
ば3種類の代表的な同一数字音声の音声パターンを予め
選択して各#領域を更に5分割したA、B、C領域に格
納している。一方RAM(421も又上記ROM(41
)の各#領域と対応して#0領域、#1領域、#2領域
、・・・、#9領域が設けられており、この各#領域に
はやはり、「ゼロ」、「イチ」、「二」、・・・「キュ
ー」なる音声パターンが必要に応じて書き込まれるので
ある。
(SW)はモード設定スイッチであり、このスイッチ(
8w)をt側に接続する事に依って登録モードが選択さ
れ、このモード時にマイクロフォン(1)に入力された
話者の数字音声が分析(2)されて得られた入カバター
ンメモ1月3)の音声パターンを参照パターンメモリ手
段(4)のRAM(421の各#領域に第2図に示す如
く順次格納せしめる。
8w)をt側に接続する事に依って登録モードが選択さ
れ、このモード時にマイクロフォン(1)に入力された
話者の数字音声が分析(2)されて得られた入カバター
ンメモ1月3)の音声パターンを参照パターンメモリ手
段(4)のRAM(421の各#領域に第2図に示す如
く順次格納せしめる。
(5)は上記モード設定スイッチ(SW )をr側に接
続する事に依って認識モードを選択した時に、動作する
パターン認識回路であり、マイクロフォン(1)に入力
された話者の数字音声例えば「サンjが分析(2)され
七得られた入カバターンメモリ(3)の音声パターンを
上記参照パターンメモリ手段(4)のROM(41)の
各#領域での各A、B、C領域の音声パターン及びRA
M (4Bの各#領域の音声パターン全てについて比
較参照してパターン認識が行なわれる。この時入力音声
パターン[サンJがROM(4υの#5・A領域、#5
・B領域、#3・C領域、あるいはRAM(42の#3
領域のいずれかの音声パターンに最も類似であると判定
された時、上記パターン認識回路は入力音声が「サン」
である事を示す#3なるコード信号を出力する事となる
っ上述の如き構成の本発明音声認識装置に於いては、認
識しようとする話者の音声パターンが参照バタニンメモ
リ手段(4)のROM(41)に予め格納されている不
特定話者を対象とした標準的な音声の代表的な3種類の
音声パターンのいずれにも属さない特異なものの場合に
、これを補なうべく登録モードにてRAM(42)にこ
の話者め必要な音声パターンを格納する事となる。従っ
て、この話者の音声認識については主にRAM(43の
音声パターンが判定対象に供せられ、高い認識率が得ら
れるのである。父、一般的な音質の話者の音声認識につ
いては、主にROM(411に予め用意された音声パタ
ーンが判定対象に供せられるのである。
続する事に依って認識モードを選択した時に、動作する
パターン認識回路であり、マイクロフォン(1)に入力
された話者の数字音声例えば「サンjが分析(2)され
七得られた入カバターンメモリ(3)の音声パターンを
上記参照パターンメモリ手段(4)のROM(41)の
各#領域での各A、B、C領域の音声パターン及びRA
M (4Bの各#領域の音声パターン全てについて比
較参照してパターン認識が行なわれる。この時入力音声
パターン[サンJがROM(4υの#5・A領域、#5
・B領域、#3・C領域、あるいはRAM(42の#3
領域のいずれかの音声パターンに最も類似であると判定
された時、上記パターン認識回路は入力音声が「サン」
である事を示す#3なるコード信号を出力する事となる
っ上述の如き構成の本発明音声認識装置に於いては、認
識しようとする話者の音声パターンが参照バタニンメモ
リ手段(4)のROM(41)に予め格納されている不
特定話者を対象とした標準的な音声の代表的な3種類の
音声パターンのいずれにも属さない特異なものの場合に
、これを補なうべく登録モードにてRAM(42)にこ
の話者め必要な音声パターンを格納する事となる。従っ
て、この話者の音声認識については主にRAM(43の
音声パターンが判定対象に供せられ、高い認識率が得ら
れるのである。父、一般的な音質の話者の音声認識につ
いては、主にROM(411に予め用意された音声パタ
ーンが判定対象に供せられるのである。
斯様な音声認識装置は基本的には不特定話者を対象とし
ているので、従来実用化されている特定話者専用の装置
と異なり、認識させようとする話者1人1人全てについ
て登録処理を行なう必要がなく、特に特異な音質の音声
の持ち主のみについてだけ登録処理を行なえば良く、一
般的な音声の持ち主について(171この登録処理は必
要ないのである。
ているので、従来実用化されている特定話者専用の装置
と異なり、認識させようとする話者1人1人全てについ
て登録処理を行なう必要がなく、特に特異な音質の音声
の持ち主のみについてだけ登録処理を行なえば良く、一
般的な音声の持ち主について(171この登録処理は必
要ないのである。
以上の説明に於いては、RA M f43に特定の話者
の1人分の音声パターンを格納する場合を例示したが、
オペレータとして不特定話者を対象としながら、例えば
3人の特定話者が主たるオペレータとなる音声入力機器
例えば音声入力ワードプロセッサの入力部を構成する音
声g識装置に於いては、R,AM(43に3人分の音声
パターンを格納できる構成とすればよい。父、この主た
るオペレータが変更された時には、新たなオペレータに
ついてのみ登録処理を行ないRAM(42の音声パター
ンを書き換える事もできる。
の1人分の音声パターンを格納する場合を例示したが、
オペレータとして不特定話者を対象としながら、例えば
3人の特定話者が主たるオペレータとなる音声入力機器
例えば音声入力ワードプロセッサの入力部を構成する音
声g識装置に於いては、R,AM(43に3人分の音声
パターンを格納できる構成とすればよい。父、この主た
るオペレータが変更された時には、新たなオペレータに
ついてのみ登録処理を行ないRAM(42の音声パター
ンを書き換える事もできる。
(ト)発明の効果
本発明音声認識装置は以上の説明から明らかな如く、入
力音声パターンを、不特定話者用の音声パターンが格納
されたROMと特定話者用の音声パターンが格納された
RAMとからなる参照パターンメモリ手段の全ての音声
パターンを比較参照の対象としてパターン認識するもの
であるので、必要に応じてRAMに特異な音質の話者の
音声パターンを格納する事に依って、この特異な音質の
特定話者の音声に対しても一般的な音質の不特定゛話者
と同様に高い認識率で音声認識を行う事ができる。
力音声パターンを、不特定話者用の音声パターンが格納
されたROMと特定話者用の音声パターンが格納された
RAMとからなる参照パターンメモリ手段の全ての音声
パターンを比較参照の対象としてパターン認識するもの
であるので、必要に応じてRAMに特異な音質の話者の
音声パターンを格納する事に依って、この特異な音質の
特定話者の音声に対しても一般的な音質の不特定゛話者
と同様に高い認識率で音声認識を行う事ができる。
ち′<1図は本発明の音声認識装置の一実施例を示すブ
ロック図、第2図は本発明装置IC係るメモリ図である
。
ロック図、第2図は本発明装置IC係るメモリ図である
。
Claims (1)
- 【特許請求の範囲】 1)標準的な音声パターンが格納されたROMと特定の
話者の音声パターンを格納可能なRAMとからなる参照
パターンメモリ手段を備え、音声の登録時には、入力さ
れた話者の音声を分析して得た音声パターンを上記参照
パターンメモリ手段のRAMに格納し、 音声の認識時には、入力された話者の音声を分析して得
た音声パターンを上記参照パターンメモリ手段のROM
とRAMの両方の音声パターンに基づいてパターン認識
する事を特徴とした音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59141794A JPH0642154B2 (ja) | 1984-07-09 | 1984-07-09 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59141794A JPH0642154B2 (ja) | 1984-07-09 | 1984-07-09 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6120996A true JPS6120996A (ja) | 1986-01-29 |
JPH0642154B2 JPH0642154B2 (ja) | 1994-06-01 |
Family
ID=15300293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59141794A Expired - Lifetime JPH0642154B2 (ja) | 1984-07-09 | 1984-07-09 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0642154B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10146809A (ja) * | 1996-11-15 | 1998-06-02 | Juken Sangyo Co Ltd | 多孔質の草本類材料を使用した板材 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58106329A (ja) * | 1981-12-17 | 1983-06-24 | Matsushita Electric Ind Co Ltd | 加熱装置 |
-
1984
- 1984-07-09 JP JP59141794A patent/JPH0642154B2/ja not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58106329A (ja) * | 1981-12-17 | 1983-06-24 | Matsushita Electric Ind Co Ltd | 加熱装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH0642154B2 (ja) | 1994-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS6120996A (ja) | 音声認識装置 | |
JPS597998A (ja) | 連続音声認識装置 | |
JPH02232696A (ja) | 音声認識装置 | |
JPS63149699A (ja) | 音声入出力装置 | |
JPS62124599A (ja) | 音声認識装置 | |
JPS6126678B2 (ja) | ||
JPS61180297A (ja) | 話者照合装置 | |
JPS61278896A (ja) | 話者照合装置 | |
JPS63157199A (ja) | 話者照合装置 | |
JPS63292199A (ja) | 音声認識装置 | |
JPS6167897A (ja) | 音声認識装置 | |
JPH0323920B2 (ja) | ||
SU1501139A2 (ru) | Способ идентификации говор щего | |
JPH04301695A (ja) | 音声認識装置の辞書制御方式 | |
JPS6410080B2 (ja) | ||
JPS61223799A (ja) | 音声合成装置 | |
JPH0316038B2 (ja) | ||
JPS6134599A (ja) | パタ−ン認識方式 | |
JPS63281196A (ja) | 音声認識装置 | |
JPH01158499A (ja) | 定常雑音除去方式 | |
JPS61102684A (ja) | 聴覚障害者用発声訓練装置 | |
JPS5868797A (ja) | 音声認識装置 | |
JPS59180598A (ja) | 音声入力方式 | |
Sroka | Effects of various types of speaker normalization on an automatic vowel recognition scheme | |
JPS58166398A (ja) | 音声認識装置における音声辞書登録方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |