JPS60217397A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS60217397A JPS60217397A JP59074723A JP7472384A JPS60217397A JP S60217397 A JPS60217397 A JP S60217397A JP 59074723 A JP59074723 A JP 59074723A JP 7472384 A JP7472384 A JP 7472384A JP S60217397 A JPS60217397 A JP S60217397A
- Authority
- JP
- Japan
- Prior art keywords
- section
- patterns
- dictionary
- pattern
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
1亙±」
本発明は、音声認識装置に関する。
先聚韮遣
一般的な不特定話者方式の音声認識装置においては、辞
書パターンとして1つの単語に複数のパターンを割り当
てることが多い。而して、1つの辞書のパターンをいく
つかの代表的なパターンで表わしておいて未知入力があ
った場合に全てのパターンと照合し、最類似のパターン
を認識結果として出力する。しかし、この方式によると
仮りに各単語パターンにつきN (IIの代表的なパタ
ーンが存在し、M単語発声したとするとNXMのパター
ンと照合しなければならず、計算量が増えるという欠点
がある。
書パターンとして1つの単語に複数のパターンを割り当
てることが多い。而して、1つの辞書のパターンをいく
つかの代表的なパターンで表わしておいて未知入力があ
った場合に全てのパターンと照合し、最類似のパターン
を認識結果として出力する。しかし、この方式によると
仮りに各単語パターンにつきN (IIの代表的なパタ
ーンが存在し、M単語発声したとするとNXMのパター
ンと照合しなければならず、計算量が増えるという欠点
がある。
止−一力
本発明は、上述のごとき実情に鑑みてなされたもので、
少ない計算量で不特定話者音声の認識をし、認識結果を
迅速に出力することのできる音声認識装置を提供するこ
とを目的としてなされたものである。
少ない計算量で不特定話者音声の認識をし、認識結果を
迅速に出力することのできる音声認識装置を提供するこ
とを目的としてなされたものである。
−−1
本発明の構成について、以下、一実施例に基づいて説明
する。
する。
本発明は、上記目的を達成するために、登録単語音声パ
ターンを複数保持しておき、まず、使用者がテスト音声
を入力し、その分析結果によって前記複数パターン中の
必要な物を重ね合わせて辞書パターンを作り、その後、
該辞書パターンを音声の認識に用いるようにしたもので
ある。
ターンを複数保持しておき、まず、使用者がテスト音声
を入力し、その分析結果によって前記複数パターン中の
必要な物を重ね合わせて辞書パターンを作り、その後、
該辞書パターンを音声の認識に用いるようにしたもので
ある。
図は、本発明の一実施例を説明するための構成図で、図
中、1はマイク、2は音声区間切り出し部、3は特徴抽
出部、4は分析部、5は辞書パターン作成部、6はパタ
ーン格納部、7は辞書部、8は照合部、9は結果表示部
で、まず、マイクからテスト単語の音声が入力され音声
区間のみが検出されて特徴抽出部へ転送される。ここで
は例えばバンドパスフィルタ群の出力を10ms毎にサ
ンプリングするなどの方法によって特徴抽出が行われそ
のデータが分析部へ転送され分析される。ここでの分析
は例えばテス゛ト単語のフィルタ分析された時のピーク
出力チャンネルによって分類するなどの方法によって何
種類かに分類する。
中、1はマイク、2は音声区間切り出し部、3は特徴抽
出部、4は分析部、5は辞書パターン作成部、6はパタ
ーン格納部、7は辞書部、8は照合部、9は結果表示部
で、まず、マイクからテスト単語の音声が入力され音声
区間のみが検出されて特徴抽出部へ転送される。ここで
は例えばバンドパスフィルタ群の出力を10ms毎にサ
ンプリングするなどの方法によって特徴抽出が行われそ
のデータが分析部へ転送され分析される。ここでの分析
は例えばテス゛ト単語のフィルタ分析された時のピーク
出力チャンネルによって分類するなどの方法によって何
種類かに分類する。
一方、パターン格納部には一つの単語について多数のパ
ターンが登録単語分格納されており、分析部によって話
者のタイプを分類し、その結果によってパターン格納部
中の決められたパターンが重ね合わされて登録単語分の
辞書パターンが作成されて辞書部へ入れられる。こうし
て登録第1単語はパターン格納部の第1単語のいくつか
のパターン例えばAとCとDの組合せで辞書を作るとい
った風に全単語についての辞書パターンを形成すること
になる。その後、この話者が未知音声を認識する際には
この辞書パターンで照合して認識結果を出力する。照合
のしかたは入カバターンと辞書パターンの重ね合わせに
より重なり具合から類似度を決定する方法(音響学会秋
季講論集3−1−8(1983))が適している。上述
のように、本発明においては、多数のパターンが格納さ
れているが、辞書登録されたパターンは登録単語数と等
しく、照合すべきパターンを減らすことができる。
ターンが登録単語分格納されており、分析部によって話
者のタイプを分類し、その結果によってパターン格納部
中の決められたパターンが重ね合わされて登録単語分の
辞書パターンが作成されて辞書部へ入れられる。こうし
て登録第1単語はパターン格納部の第1単語のいくつか
のパターン例えばAとCとDの組合せで辞書を作るとい
った風に全単語についての辞書パターンを形成すること
になる。その後、この話者が未知音声を認識する際には
この辞書パターンで照合して認識結果を出力する。照合
のしかたは入カバターンと辞書パターンの重ね合わせに
より重なり具合から類似度を決定する方法(音響学会秋
季講論集3−1−8(1983))が適している。上述
のように、本発明においては、多数のパターンが格納さ
れているが、辞書登録されたパターンは登録単語数と等
しく、照合すべきパターンを減らすことができる。
効−一−−果
以上の説明から明らかなように、本発明によると、計算
量の少ない不特定話者用の音声認識装置を提供すること
ができる。
量の少ない不特定話者用の音声認識装置を提供すること
ができる。
図は、本発明による音声認識装置の一実施例を説明する
ための構成図である。 l・・・マイク、2・・・音声区間切り出し部、3・・
・特徴抽出部、4・・・分析部、5・・・辞書パターン
作成部、6・・・パターン格納部、7・・・辞書部、8
・・・照合部、9・・・結果表示部
ための構成図である。 l・・・マイク、2・・・音声区間切り出し部、3・・
・特徴抽出部、4・・・分析部、5・・・辞書パターン
作成部、6・・・パターン格納部、7・・・辞書部、8
・・・照合部、9・・・結果表示部
Claims (1)
- 複数の音声パターンを保持した音声認識装置において、
テスト音声が入力された時、該テスト音声を分析し、そ
の分析結果をもとに前記複数の音声パターンを重ね合わ
せて辞書パターンを形成し、その後、一般単語を認識す
るようにしたことを特徴とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59074723A JPS60217397A (ja) | 1984-04-13 | 1984-04-13 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59074723A JPS60217397A (ja) | 1984-04-13 | 1984-04-13 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60217397A true JPS60217397A (ja) | 1985-10-30 |
Family
ID=13555425
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59074723A Pending JPS60217397A (ja) | 1984-04-13 | 1984-04-13 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60217397A (ja) |
-
1984
- 1984-04-13 JP JP59074723A patent/JPS60217397A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111128223B (zh) | 一种基于文本信息的辅助说话人分离方法及相关装置 | |
Lippmann | Speech perception by humans and machines | |
CN113744742A (zh) | 对话场景下的角色识别方法、装置和系统 | |
JPS60217397A (ja) | 音声認識装置 | |
JPS61180297A (ja) | 話者照合装置 | |
JPS6332596A (ja) | 音声認識装置 | |
CN113409763B (zh) | 语音纠正方法、装置及电子设备 | |
JPS61278896A (ja) | 話者照合装置 | |
JPS6287998A (ja) | 音声認識装置 | |
JPH0316038B2 (ja) | ||
Sharma et al. | Eminent method of voice identification by applying pitch, intensity and pulse | |
JP3033132B2 (ja) | 言語処理装置 | |
JPS63306499A (ja) | 不特定話者音声認識装置 | |
JPS63155195A (ja) | 音声認識装置 | |
JPS63247799A (ja) | 音声認識装置 | |
JPS62159200A (ja) | 特定話者用単語音声認識装置 | |
JPS59211098A (ja) | 音声認識装置 | |
JPS6287993A (ja) | 音声認識装置 | |
JPS59189398A (ja) | 連続音声認識方式 | |
JPS63798B2 (ja) | ||
JPS61248099A (ja) | 不特定話者音声認識装置 | |
JPS6194094A (ja) | 音声認識装置 | |
JPS58121100A (ja) | 単語音声認識方式 | |
JPS6287994A (ja) | 音声認識辞書更新方式 | |
JPS6167897A (ja) | 音声認識装置 |