JPS61147298A - 音声認識制御方式 - Google Patents
音声認識制御方式Info
- Publication number
- JPS61147298A JPS61147298A JP59269203A JP26920384A JPS61147298A JP S61147298 A JPS61147298 A JP S61147298A JP 59269203 A JP59269203 A JP 59269203A JP 26920384 A JP26920384 A JP 26920384A JP S61147298 A JPS61147298 A JP S61147298A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- section
- speaker
- recognition
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声認識制御方式に関するものである。
従来の不特定話者認識方式の音声認識制御装置では特定
話者の発する特定言語に対する認識率が悪く、此の改善
が強く要望されていた。
話者の発する特定言語に対する認識率が悪く、此の改善
が強く要望されていた。
音声認識は専用LSIの開発が進め、実用化が活発にな
って来たが、認、識率は95%前後が多く、実用化の上
で一つの壁になっている。
って来たが、認、識率は95%前後が多く、実用化の上
で一つの壁になっている。
認識語の数が数十語に限られた場合は不特定話者認識が
可能であるが、数百語と多くなると誤認識が増えるので
特定話者でないと実用出来ない。
可能であるが、数百語と多くなると誤認識が増えるので
特定話者でないと実用出来ない。
前者の例は音声ダイヤルに、後者の例には音声タイプラ
イタ等に利用されている。
イタ等に利用されている。
第2図は従来の音声認識装置の基本構成の一例を示す図
である。
である。
図中、1は音声入力部、2は特徴抽出部、3は照合部、
4は出力部、5はパターン発生部、6は制御部である。
4は出力部、5はパターン発生部、6は制御部である。
尚以下全図を通じ同一記号は同一対象物を表す。
音声入力部1はマイク等でとらえた音声のレヘルの調整
を主に行う。
を主に行う。
’tV 徴抽出部2はバンドパスフィルタ、ADコンバ
ータ等から構成され、音声入力部1から送られた音声を
バンドパスフィルタにより複数個の周波数成分に分解し
、一定周期毎に各周波数成分のレベルをサンプリングし
、△Dコンハークによりディジタル音声データに変換す
る。
ータ等から構成され、音声入力部1から送られた音声を
バンドパスフィルタにより複数個の周波数成分に分解し
、一定周期毎に各周波数成分のレベルをサンプリングし
、△Dコンハークによりディジタル音声データに変換す
る。
照合部3は特徴抽出部2から送られたディジクル音声デ
ータとパターン発生部5に於いて発生した標【11°パ
ターンを比較照合し、判定基準に合格したものを出力部
4へ送り、出力部4は此れを例えばCRTの画面」二に
表示したり、或いは他装置へ情報転送する等の動作を行
う。制御部6ば以」二説明した各種制御動作を行って音
声認識装置としての機能を果たしている。
ータとパターン発生部5に於いて発生した標【11°パ
ターンを比較照合し、判定基準に合格したものを出力部
4へ送り、出力部4は此れを例えばCRTの画面」二に
表示したり、或いは他装置へ情報転送する等の動作を行
う。制御部6ば以」二説明した各種制御動作を行って音
声認識装置としての機能を果たしている。
特定話者認識とは前記パターン発生部5に特定の話者の
音声パターンを予め登録しておく方式で、不特定話者認
識 ーンを格納しておく方式であり、装置使用に当たり話者
の音声登録4;l:行ねない。
音声パターンを予め登録しておく方式で、不特定話者認
識 ーンを格納しておく方式であり、装置使用に当たり話者
の音声登録4;l:行ねない。
特定話者認識の場合は登録した話者に対する認識率は高
<(98%以上)なるが、登録してない他の話者に対す
る認識率は低下し、又予め登録すると云う煩わしさがあ
り、不特定話者認識の場合は前述した様に其の認識率は
95%前後となるのが普通である。
<(98%以上)なるが、登録してない他の話者に対す
る認識率は低下し、又予め登録すると云う煩わしさがあ
り、不特定話者認識の場合は前述した様に其の認識率は
95%前後となるのが普通である。
本発明の目的は上記従来方式の欠点を除去し、大多数の
語には標準パターンを使用し、装置の機能上或いは話者
の癖により認識率の低い詔には話者の音声パターンを登
録しておく特定話者認識を採用し、全体として認識率向
上を計った音声認識制御方式を提供することである。
語には標準パターンを使用し、装置の機能上或いは話者
の癖により認識率の低い詔には話者の音声パターンを登
録しておく特定話者認識を採用し、全体として認識率向
上を計った音声認識制御方式を提供することである。
問題点を解決するだめの手段は、認識すべき音声を入力
する音声入力部、該音声波形の特徴を抽出する特徴抽出
部、該特徴の比較対象となるパターンを発生するパター
ン発生部、該パターン発生部の出力と該特徴を比較照合
する照合部、前記照合結果を外部に出力する出力部、及
び前記各部を制御する制御部から構成される音声認識装
置に於いて、前記パターン発生部を標準パターンを格納
するROMと、該標準パターンの一部を別のパターンと
直材可能となるように配置したRAMにより構成し、該
特定言語の話者音声パターンを前記RAMに格納し、照
合動作時該特定言語の時にのみ前記RAMにアクセスす
ることにより達成される。
する音声入力部、該音声波形の特徴を抽出する特徴抽出
部、該特徴の比較対象となるパターンを発生するパター
ン発生部、該パターン発生部の出力と該特徴を比較照合
する照合部、前記照合結果を外部に出力する出力部、及
び前記各部を制御する制御部から構成される音声認識装
置に於いて、前記パターン発生部を標準パターンを格納
するROMと、該標準パターンの一部を別のパターンと
直材可能となるように配置したRAMにより構成し、該
特定言語の話者音声パターンを前記RAMに格納し、照
合動作時該特定言語の時にのみ前記RAMにアクセスす
ることにより達成される。
本発明に依ると予め登録されている特定話者が発する特
定言語に対しては直材可能となるように配置したRAM
上に予め登録されているパターンを使用して照合するの
で認識率が大幅に向上すると云う効果が生まれる。
定言語に対しては直材可能となるように配置したRAM
上に予め登録されているパターンを使用して照合するの
で認識率が大幅に向上すると云う効果が生まれる。
第1図は本発明に依るパターン発生部の一実施例を示す
図である。
図である。
図11コ、7はROM、8はRAMである。
本発明に依るパターン発生部はROM7とRAM8から
構成され、ROM7には標準パターンを格納する。
構成され、ROM7には標準パターンを格納する。
第1図に於いては一例として数字の音声パターンを示す
。即ち、ROM 7 、J−の第1ブロツクには「イチ
」、第2ブロツクには「二」、第3ブロツクには「ザン
」、第4ブロツクには「ヨン」、第5ブロツクには「ゴ
」、第6ブロソクには「ロク」、第7ブロソクには「シ
チ」、第8ブロツクには「ハチ」 ・・・と格納する。
。即ち、ROM 7 、J−の第1ブロツクには「イチ
」、第2ブロツクには「二」、第3ブロツクには「ザン
」、第4ブロツクには「ヨン」、第5ブロツクには「ゴ
」、第6ブロソクには「ロク」、第7ブロソクには「シ
チ」、第8ブロツクには「ハチ」 ・・・と格納する。
尚各ブロックは複数バイトのデータで構成される。
今数字の7を「ヒチ」と発音する話者aがいたとすると
第7ブロソクのROM7のデータとは一致しないので認
識不可能となる。
第7ブロソクのROM7のデータとは一致しないので認
識不可能となる。
此の場合、ROM7の第7ブロソクと置換可能な位置に
RAM8を配置し、此処に「ヒチ」と云う話者aのパタ
ーンと話者aの登録を行う。
RAM8を配置し、此処に「ヒチ」と云う話者aのパタ
ーンと話者aの登録を行う。
此の様に登録した話者が本装置を使用する場合には予め
登録話者aであることを入力することにより、ROM7
の第7ブロソクの照合データには置換可能なRAM8の
位置のデータを採用する様に制御部6が制御することに
よって認識率を向上させることが可能となる。
登録話者aであることを入力することにより、ROM7
の第7ブロソクの照合データには置換可能なRAM8の
位置のデータを採用する様に制御部6が制御することに
よって認識率を向上させることが可能となる。
以」−詳細に説明した様に本発明によれば、大多数の語
には標準バクーンを使用し、装置の機能上或いは話者の
癖により認識率の低い語には話者の音声パターンを登録
しておく特定話者認識を採用し、全体として認識率向上
を計った音声認識制御方式を実現出来ると云う大きい効
果がある。
には標準バクーンを使用し、装置の機能上或いは話者の
癖により認識率の低い語には話者の音声パターンを登録
しておく特定話者認識を採用し、全体として認識率向上
を計った音声認識制御方式を実現出来ると云う大きい効
果がある。
第1図は本発明に依るパターン発生部の一実施例を示す
図である。 第2図は従来の音声認識装置の基本構成の一例を示す図
である。 図中、1は音声入力部、2は特徴抽出部、3は照合部、
4は出力部、5はパターン発生部、6は制御部、7はR
OM、8ばRAMである。 榮 1 図 3△ * 2 図
図である。 第2図は従来の音声認識装置の基本構成の一例を示す図
である。 図中、1は音声入力部、2は特徴抽出部、3は照合部、
4は出力部、5はパターン発生部、6は制御部、7はR
OM、8ばRAMである。 榮 1 図 3△ * 2 図
Claims (1)
- 認識すべき音声を入力する音声入力部、該音声波形の特
徴を抽出する特徴抽出部、該特徴の比較対象となるパタ
ーンを発生するパターン発生部、該パターン発生部の出
力と該特徴を比較照合する照合部、前記照合結果を外部
に出力する出力部、及び前記各部を制御する制御部から
構成される音声認識装置に於いて、前記パターン発生部
を標準パターンを格納するROMと、該標準パターンの
一部を別のパターンと置替可能となるように配置したR
AMにより構成し、該特定言語の話者音声パターンを前
記RAMに格納し、照合動作時該特定言語の時にのみ前
記RAMにアクセスすることを特徴とする音声認識制御
方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59269203A JPS61147298A (ja) | 1984-12-20 | 1984-12-20 | 音声認識制御方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59269203A JPS61147298A (ja) | 1984-12-20 | 1984-12-20 | 音声認識制御方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61147298A true JPS61147298A (ja) | 1986-07-04 |
Family
ID=17469107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59269203A Pending JPS61147298A (ja) | 1984-12-20 | 1984-12-20 | 音声認識制御方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61147298A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6230132B1 (en) * | 1997-03-10 | 2001-05-08 | Daimlerchrysler Ag | Process and apparatus for real-time verbal input of a target address of a target address system |
-
1984
- 1984-12-20 JP JP59269203A patent/JPS61147298A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6230132B1 (en) * | 1997-03-10 | 2001-05-08 | Daimlerchrysler Ag | Process and apparatus for real-time verbal input of a target address of a target address system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5752230A (en) | Method and apparatus for identifying names with a speech recognition program | |
JPS61147298A (ja) | 音声認識制御方式 | |
JPH0421252A (ja) | 音声応答装置 | |
JPS6135494A (ja) | 音声認識処理装置 | |
JPS638798A (ja) | 音声認識装置 | |
JPS61239358A (ja) | 音声入力による文書作成方式 | |
JPS5977499A (ja) | 音声認識装置 | |
JPH02305047A (ja) | 電話機 | |
JPS61105597A (ja) | 連続音声認識装置 | |
JPS63121097A (ja) | 電話用音声認識装置 | |
KR20230126575A (ko) | 클라우드 기반 보이스 아카이빙 기술 및 디지털 변환 장치 | |
JPS58105298A (ja) | 音声認識装置の標準パタ−ン登録方法 | |
JP2989426B2 (ja) | 音声ダイアラ装置 | |
JPS63121098A (ja) | 電話用音声認識装置 | |
JPH04301695A (ja) | 音声認識装置の辞書制御方式 | |
JPS61183699A (ja) | 音声認識装置 | |
JPS63306748A (ja) | 音声ダイヤル装置 | |
JPS58136099A (ja) | 音声認識システム | |
JPS6194096A (ja) | 音声認識装置 | |
JPS58108595A (ja) | 音声認識方法 | |
JPS58108596A (ja) | 音声登録方式 | |
JPH01156799A (ja) | 音声ダイヤリング装置 | |
JPS6287994A (ja) | 音声認識辞書更新方式 | |
JPS58111097A (ja) | 音声入力認識装置 | |
JPH0222699A (ja) | 音声認識装置 |