JPH05232983A - 音声処理装置 - Google Patents
音声処理装置Info
- Publication number
- JPH05232983A JPH05232983A JP4038137A JP3813792A JPH05232983A JP H05232983 A JPH05232983 A JP H05232983A JP 4038137 A JP4038137 A JP 4038137A JP 3813792 A JP3813792 A JP 3813792A JP H05232983 A JPH05232983 A JP H05232983A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- frequency
- storage unit
- unit
- standard pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【目的】 老若男女を問わない不特定話者向けの音声認
識における認識の計算量を少なくして処理時間を短縮
し、認識率の低下を防げるようにする。 【構成】 記憶部1005に平均周波数ごとにそれぞれ
独立した周波数高低別標準パターン群1101〜110
4を設け、音声認識を行う前にあらかじめ決められた語
彙を入力し、その音声データの平均周波数を周波数検出
部1001で測定して判定し、平均周波数高低別標準パ
ターン群1101〜1104の中で一番合った一標準パ
ターン群に特徴マッチング部1006が周波数高低別標
準パターン接続回路1011〜1013を介して接続さ
れた後に音声認識を行う。 【効果】 記憶部にあるすべての標準パターンを対象と
した類似度の算出を行う必要をなくすことができる。
識における認識の計算量を少なくして処理時間を短縮
し、認識率の低下を防げるようにする。 【構成】 記憶部1005に平均周波数ごとにそれぞれ
独立した周波数高低別標準パターン群1101〜110
4を設け、音声認識を行う前にあらかじめ決められた語
彙を入力し、その音声データの平均周波数を周波数検出
部1001で測定して判定し、平均周波数高低別標準パ
ターン群1101〜1104の中で一番合った一標準パ
ターン群に特徴マッチング部1006が周波数高低別標
準パターン接続回路1011〜1013を介して接続さ
れた後に音声認識を行う。 【効果】 記憶部にあるすべての標準パターンを対象と
した類似度の算出を行う必要をなくすことができる。
Description
【0001】
【産業上の利用分野】本発明は、電話交換機の顧客サー
ビスその他に利用する。老若男女を問わない不特定話者
向けの音声認識に利用する。本発明は、音声認識の処理
時間を短縮し、認識率の低下を抑えることができる音声
処理装置に関する。
ビスその他に利用する。老若男女を問わない不特定話者
向けの音声認識に利用する。本発明は、音声認識の処理
時間を短縮し、認識率の低下を抑えることができる音声
処理装置に関する。
【0002】
【従来の技術】通常、老若男女を問わない不特定話者向
けの音声認識は、同一語彙でも周波数の違いからそれぞ
れ別々に標準パターンを作成する必要があり、標準パタ
ーンの記憶容量が非常に多く認識の計算量が膨大になっ
ていた。
けの音声認識は、同一語彙でも周波数の違いからそれぞ
れ別々に標準パターンを作成する必要があり、標準パタ
ーンの記憶容量が非常に多く認識の計算量が膨大になっ
ていた。
【0003】
【発明が解決しようとする課題】上述した従来の老若男
女を問わない不特定話者向けの音声認識では、標準パタ
ーンの記憶容量が非常に多いため認識の計算量が膨大に
なることから、その処理時間が長くなり認識率を下げて
しまう問題があった。
女を問わない不特定話者向けの音声認識では、標準パタ
ーンの記憶容量が非常に多いため認識の計算量が膨大に
なることから、その処理時間が長くなり認識率を下げて
しまう問題があった。
【0004】本発明はこのような問題を解決するもの
で、認識の計算量を少なくして処理時間を短縮し、認識
率の低下を抑えることができる装置を提供することを目
的とする。
で、認識の計算量を少なくして処理時間を短縮し、認識
率の低下を抑えることができる装置を提供することを目
的とする。
【0005】
【課題を解決するための手段】本発明は、利用者にスピ
ーカを介してガイダンスを与える音声出力装置部と、利
用者からの音声を入力する音声入力部と、音声の周波数
スペクトルを測定して判定し平均周波数を検出する周波
数検出部と、音声パターンを記憶する記憶部とを備えた
音声処理装置において、前記記憶部に、周波数の高低別
に標準パターンを区別した周波数高低別標準パターン群
をあらかじめ格納する領域を設け、前記周波数検出部
に、利用者から入力された音声データの平均周波数を測
定して判定区分する手段を含み、入力された音声データ
の音声パターンを前記記憶部から抽出する特徴抽出部
と、この特徴抽出部が抽出した音声パターンと前記記憶
部に記憶された標準パターンとの類似度を算出して比較
分析し音声認識結果を出力する特徴マッチング部とを備
えたことを特徴とする。
ーカを介してガイダンスを与える音声出力装置部と、利
用者からの音声を入力する音声入力部と、音声の周波数
スペクトルを測定して判定し平均周波数を検出する周波
数検出部と、音声パターンを記憶する記憶部とを備えた
音声処理装置において、前記記憶部に、周波数の高低別
に標準パターンを区別した周波数高低別標準パターン群
をあらかじめ格納する領域を設け、前記周波数検出部
に、利用者から入力された音声データの平均周波数を測
定して判定区分する手段を含み、入力された音声データ
の音声パターンを前記記憶部から抽出する特徴抽出部
と、この特徴抽出部が抽出した音声パターンと前記記憶
部に記憶された標準パターンとの類似度を算出して比較
分析し音声認識結果を出力する特徴マッチング部とを備
えたことを特徴とする。
【0006】前記記憶部には、前記マッチング部と前記
周波数高低別標準パターン群との接続を行う周波数高低
別標準パターン接続回路を含むことができる。
周波数高低別標準パターン群との接続を行う周波数高低
別標準パターン接続回路を含むことができる。
【0007】
【作用】記憶部内に同一語彙の標準パターン群を周波数
の高低別に複数準備しておき、音声認識を行う前に音声
出力装置部から利用者に対し音声ガイダンスに従ってあ
らかじめ定められた語彙の音声データを入力させる。入
力された音声データの平均周波数を周波数検出部が測定
して判定し、その判定結果に基づき記憶部内に準備した
マッチングし易い標準パターン群を選出して特徴マッチ
ング部と接続する。接続完了後に音声出力装置部から利
用者に対し音声データ入力のガイダンスを行い、同時に
特徴抽出部を作動させて利用者が入力した音声データを
もとに音声パターンを抽出させる。この抽出された音声
パターンと記憶部に準備された標準パターンとを特徴マ
ッチング部が比較分析し入力音声を認識する。
の高低別に複数準備しておき、音声認識を行う前に音声
出力装置部から利用者に対し音声ガイダンスに従ってあ
らかじめ定められた語彙の音声データを入力させる。入
力された音声データの平均周波数を周波数検出部が測定
して判定し、その判定結果に基づき記憶部内に準備した
マッチングし易い標準パターン群を選出して特徴マッチ
ング部と接続する。接続完了後に音声出力装置部から利
用者に対し音声データ入力のガイダンスを行い、同時に
特徴抽出部を作動させて利用者が入力した音声データを
もとに音声パターンを抽出させる。この抽出された音声
パターンと記憶部に準備された標準パターンとを特徴マ
ッチング部が比較分析し入力音声を認識する。
【0008】これにより、認識のための計算量を全標準
パターンの一部に限定することが可能となり、処理時間
を大幅に短縮することができ、さらに、平均周波数の合
致した標準パターンだけとの類似性の算出が行われるた
め誤認識の確率を減少させることができる。
パターンの一部に限定することが可能となり、処理時間
を大幅に短縮することができ、さらに、平均周波数の合
致した標準パターンだけとの類似性の算出が行われるた
め誤認識の確率を減少させることができる。
【0009】
【実施例】次に、本発明実施例を図面に基づいて説明す
る。図1は本発明実施例の構成を示すブロック図であ
る。
る。図1は本発明実施例の構成を示すブロック図であ
る。
【0010】本発明実施例は、利用者にスピーカ100
3を介してガイダンスを与える音声出力装置部1002
と、利用者からの音声を入力する音声入力部1000
と、音声の周波数スペクトルを測定して判定し平均周波
数を検出する周波数検出部1001と、音声パターンを
記憶する記憶部1005とを備え、さらに、本発明の特
徴として、記憶部1005に、周波数の高低別に標準パ
ターンを区別した周波数高低別標準パターン群1101
〜1104を格納する領域を設け、周波数検出部100
1に、利用者から入力された音声データの平均周波数を
測定して判定区分する手段を含み、入力された音声デー
タの音声パターンを前記記憶部から抽出する特徴抽出部
1004と、この特徴抽出部1004が抽出した音声パ
ターンと記憶部1005に記憶された標準パターンとの
類似度を算出して比較分析し音声認識結果を音声認識結
果出力端子1007から出力する特徴マッチング部10
06そを備え、記憶部1005に周波数高低別標準パタ
ーン群1101〜1104と特徴マッチング部1006
との接続を行う周波数高低別標準パターン接続回路10
11〜1013を含む。
3を介してガイダンスを与える音声出力装置部1002
と、利用者からの音声を入力する音声入力部1000
と、音声の周波数スペクトルを測定して判定し平均周波
数を検出する周波数検出部1001と、音声パターンを
記憶する記憶部1005とを備え、さらに、本発明の特
徴として、記憶部1005に、周波数の高低別に標準パ
ターンを区別した周波数高低別標準パターン群1101
〜1104を格納する領域を設け、周波数検出部100
1に、利用者から入力された音声データの平均周波数を
測定して判定区分する手段を含み、入力された音声デー
タの音声パターンを前記記憶部から抽出する特徴抽出部
1004と、この特徴抽出部1004が抽出した音声パ
ターンと記憶部1005に記憶された標準パターンとの
類似度を算出して比較分析し音声認識結果を音声認識結
果出力端子1007から出力する特徴マッチング部10
06そを備え、記憶部1005に周波数高低別標準パタ
ーン群1101〜1104と特徴マッチング部1006
との接続を行う周波数高低別標準パターン接続回路10
11〜1013を含む。
【0011】次に、このように構成された本発明実施例
の動作について説明する。図2は本発明実施例の動作の
流れを示す流れ図である。
の動作について説明する。図2は本発明実施例の動作の
流れを示す流れ図である。
【0012】装置が作動し(ステップ2001)、音声
出力装置部1002から例えば「123とお話下さい」
という情報を発しスピーカ1003からそのガイダンス
が流され(ステップ2002)、これを受けた利用者が
そのガイダンスに従い音声入力部1000より「12
3」と入力すると(ステップ2003)、入力された音
声データは周波数検出部1001で平均周波数が測定さ
れ判定が行われる(ステップ2004)。判定が不可能
な場合には再入力のガイダンスが音声出力装置部100
2を介して発せられ(ステップ2014)、判定が可能
な場合にはその平均周波数に合致する周波数高低別標準
パターン群1101〜1104のつずれかに接続させる
ために平均周波数の情報が特徴マッチング部1006を
介して記憶部1005に送られる。
出力装置部1002から例えば「123とお話下さい」
という情報を発しスピーカ1003からそのガイダンス
が流され(ステップ2002)、これを受けた利用者が
そのガイダンスに従い音声入力部1000より「12
3」と入力すると(ステップ2003)、入力された音
声データは周波数検出部1001で平均周波数が測定さ
れ判定が行われる(ステップ2004)。判定が不可能
な場合には再入力のガイダンスが音声出力装置部100
2を介して発せられ(ステップ2014)、判定が可能
な場合にはその平均周波数に合致する周波数高低別標準
パターン群1101〜1104のつずれかに接続させる
ために平均周波数の情報が特徴マッチング部1006を
介して記憶部1005に送られる。
【0013】このとき周波数高低別標準パターン接続回
路1011〜1013が作動して周波数高低別標準パタ
ーン群1101〜1104の中で最も平均周波数の合っ
ている一群と特徴マッチング部1006とが接続され
(ステップ2005)、記憶部1005から接続完了の
情報が音声出力装置部1002および特徴抽出部100
4に送られる。これを受けた音声出力装置部1002で
は音声データの入力のガイダンスをスピーカ1003を
介して発し、同時に特徴抽出部1004の機能が作動す
る。
路1011〜1013が作動して周波数高低別標準パタ
ーン群1101〜1104の中で最も平均周波数の合っ
ている一群と特徴マッチング部1006とが接続され
(ステップ2005)、記憶部1005から接続完了の
情報が音声出力装置部1002および特徴抽出部100
4に送られる。これを受けた音声出力装置部1002で
は音声データの入力のガイダンスをスピーカ1003を
介して発し、同時に特徴抽出部1004の機能が作動す
る。
【0014】音声データの入力のガイダンスを受けた利
用者が何らかの音声データを音声入力部1000から入
力すると(ステップ2006)、入力された音声データ
は特徴抽出部1004で特徴抽出、すなわち音声パター
ンの作成が行われ(ステップ2007)、作成された音
声パターンはすでに記憶部1005の中の周波数高低別
標準パターン群1101〜1104の中の一群と接続さ
れている特徴マッチング部1006に送られ、周波数高
低別標準パターン群1101〜1104の中の一群の標
準パターンとの類似度の算出が行われる(ステップ20
08)。その結果は音声認識結果出力端子1007から
出力される(ステップ2009)。したがって、特徴マ
ッチング部1006と接続されている周波数高低別標準
パターン群1101〜1104の中の一群以外の群の標
準パターンとの類似度の算出は行われず、認識の計算量
が抑えられる。
用者が何らかの音声データを音声入力部1000から入
力すると(ステップ2006)、入力された音声データ
は特徴抽出部1004で特徴抽出、すなわち音声パター
ンの作成が行われ(ステップ2007)、作成された音
声パターンはすでに記憶部1005の中の周波数高低別
標準パターン群1101〜1104の中の一群と接続さ
れている特徴マッチング部1006に送られ、周波数高
低別標準パターン群1101〜1104の中の一群の標
準パターンとの類似度の算出が行われる(ステップ20
08)。その結果は音声認識結果出力端子1007から
出力される(ステップ2009)。したがって、特徴マ
ッチング部1006と接続されている周波数高低別標準
パターン群1101〜1104の中の一群以外の群の標
準パターンとの類似度の算出は行われず、認識の計算量
が抑えられる。
【0015】なお、本発明は電話回線を介しての入力、
および直接マイクなどによる入力が行われる複合入力方
式にも応用することができる。
および直接マイクなどによる入力が行われる複合入力方
式にも応用することができる。
【0016】
【発明の効果】以上説明したように本発明によれば、標
準パターン群を周波数の高低別に複数用意し、認識機能
作動前に利用者の平均周波数を測定して判定し、標準パ
ターンの中から平均周波数の合致した標準パターンと接
続して類似度の算出を行うことにより、認識のための計
算量を全標準パターンの一部に限定することが可能とな
り、処理時間を大幅に短縮することができ、また、平均
周波数の合致した標準パターンだけとの類似性の算出が
行われるため、誤認識の確率を減少させることができる
効果がある。
準パターン群を周波数の高低別に複数用意し、認識機能
作動前に利用者の平均周波数を測定して判定し、標準パ
ターンの中から平均周波数の合致した標準パターンと接
続して類似度の算出を行うことにより、認識のための計
算量を全標準パターンの一部に限定することが可能とな
り、処理時間を大幅に短縮することができ、また、平均
周波数の合致した標準パターンだけとの類似性の算出が
行われるため、誤認識の確率を減少させることができる
効果がある。
【図1】本発明実施例の構成を示すブロック図。
【図2】本発明実施例の動作の流れを示すフローチャー
ト。
ト。
1000 音声入力部 1001 周波数検出部 1002 音声出力装置部 1003 スピーカ 1004 特徴抽出部 1005 記憶部 1006 特徴マッチング部 1007 音声認識結果出力端子 1011〜1013 周波数高低別標準パターン接続
回路 1101〜1104 周波数高低別標準パターン群
回路 1101〜1104 周波数高低別標準パターン群
Claims (2)
- 【請求項1】 利用者にスピーカを介してガイダンスを
与える音声出力装置部と、 利用者からの音声を入力する音声入力部と、 音声の周波数スペクトルを測定して判定し平均周波数を
検出する周波数検出部と、 音声パターンを記憶する記憶部とを備えた音声処理装置
において、 前記記憶部に、周波数の高低別に標準パターンを区別し
た周波数高低別標準パターン群をあらかじめ格納する領
域を設け、 前記周波数検出部に、利用者から入力された音声データ
の平均周波数を測定して判定区分する手段を含み、 入力された音声データの音声パターンを前記記憶部から
抽出する特徴抽出部と、 この特徴抽出部が抽出した音声パターンと前記記憶部に
記憶された標準パターンとの類似度を算出して比較分析
し音声認識結果を出力する特徴マッチング部とを備えた
ことを特徴とする音声処理装置。 - 【請求項2】 前記記憶部には、前記マッチング部と前
記周波数高低別標準パターン群との接続を行う周波数高
低別標準パターン接続回路を含む請求項1記載の音声処
理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4038137A JPH05232983A (ja) | 1992-02-25 | 1992-02-25 | 音声処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4038137A JPH05232983A (ja) | 1992-02-25 | 1992-02-25 | 音声処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05232983A true JPH05232983A (ja) | 1993-09-10 |
Family
ID=12517041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4038137A Pending JPH05232983A (ja) | 1992-02-25 | 1992-02-25 | 音声処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05232983A (ja) |
-
1992
- 1992-02-25 JP JP4038137A patent/JPH05232983A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9530401B2 (en) | Apparatus and method for reporting speech recognition failures | |
JP3284832B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
US10733986B2 (en) | Apparatus, method for voice recognition, and non-transitory computer-readable storage medium | |
WO2019134247A1 (zh) | 基于声纹识别模型的声纹注册方法、终端装置及存储介质 | |
JP4246703B2 (ja) | 自動音声認識の方法 | |
JPS62231997A (ja) | 音声認識システム及びその方法 | |
JPH1083194A (ja) | 話し手照合システムのための2段階群選択方法 | |
US8428241B2 (en) | Semi-supervised training of destination map for call handling applications | |
US20030200087A1 (en) | Speaker recognition using dynamic time warp template spotting | |
CN109688271A (zh) | 联系人信息输入的方法、装置及终端设备 | |
US7177806B2 (en) | Sound signal recognition system and sound signal recognition method, and dialog control system and dialog control method using sound signal recognition system | |
JP2000163098A (ja) | 音声認識装置 | |
JPH05232983A (ja) | 音声処理装置 | |
JP2975772B2 (ja) | 音声認識装置 | |
KR100574883B1 (ko) | 비음성 제거에 의한 음성 추출 방법 | |
JP2020024310A (ja) | 音声処理システム及び音声処理方法 | |
JP6571587B2 (ja) | 音声入力装置、その方法、及びプログラム | |
JPS63186298A (ja) | 単語音声認識装置 | |
KR100280873B1 (ko) | 음성인식 시스템 | |
JP3322491B2 (ja) | 音声認識装置 | |
WO2002069324A1 (en) | Detection of inconsistent training data in a voice recognition system | |
JPH09274497A (ja) | 音声認識装置 | |
JPH11249688A (ja) | 音声認識装置およびその方法 | |
JPH10171488A (ja) | 音声認識方法及び装置及び記憶媒体 | |
JPS58130394A (ja) | 音声認識装置 |