JPH05232983A

JPH05232983A - 音声処理装置

Info

Publication number: JPH05232983A
Application number: JP4038137A
Authority: JP
Inventors: Sadayuki Sugawara; 貞之菅原
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1992-02-25
Filing date: 1992-02-25
Publication date: 1993-09-10

Abstract

(57)【要約】【目的】老若男女を問わない不特定話者向けの音声認
識における認識の計算量を少なくして処理時間を短縮
し、認識率の低下を防げるようにする。【構成】記憶部１００５に平均周波数ごとにそれぞれ
独立した周波数高低別標準パターン群１１０１〜１１０
４を設け、音声認識を行う前にあらかじめ決められた語
彙を入力し、その音声データの平均周波数を周波数検出
部１００１で測定して判定し、平均周波数高低別標準パ
ターン群１１０１〜１１０４の中で一番合った一標準パ
ターン群に特徴マッチング部１００６が周波数高低別標
準パターン接続回路１０１１〜１０１３を介して接続さ
れた後に音声認識を行う。【効果】記憶部にあるすべての標準パターンを対象と
した類似度の算出を行う必要をなくすことができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、電話交換機の顧客サー
ビスその他に利用する。老若男女を問わない不特定話者
向けの音声認識に利用する。本発明は、音声認識の処理
時間を短縮し、認識率の低下を抑えることができる音声
処理装置に関する。

【０００２】

【従来の技術】通常、老若男女を問わない不特定話者向
けの音声認識は、同一語彙でも周波数の違いからそれぞ
れ別々に標準パターンを作成する必要があり、標準パタ
ーンの記憶容量が非常に多く認識の計算量が膨大になっ
ていた。

【０００３】

【発明が解決しようとする課題】上述した従来の老若男
女を問わない不特定話者向けの音声認識では、標準パタ
ーンの記憶容量が非常に多いため認識の計算量が膨大に
なることから、その処理時間が長くなり認識率を下げて
しまう問題があった。

【０００４】本発明はこのような問題を解決するもの
で、認識の計算量を少なくして処理時間を短縮し、認識
率の低下を抑えることができる装置を提供することを目
的とする。

【０００５】

【課題を解決するための手段】本発明は、利用者にスピ
ーカを介してガイダンスを与える音声出力装置部と、利
用者からの音声を入力する音声入力部と、音声の周波数
スペクトルを測定して判定し平均周波数を検出する周波
数検出部と、音声パターンを記憶する記憶部とを備えた
音声処理装置において、前記記憶部に、周波数の高低別
に標準パターンを区別した周波数高低別標準パターン群
をあらかじめ格納する領域を設け、前記周波数検出部
に、利用者から入力された音声データの平均周波数を測
定して判定区分する手段を含み、入力された音声データ
の音声パターンを前記記憶部から抽出する特徴抽出部
と、この特徴抽出部が抽出した音声パターンと前記記憶
部に記憶された標準パターンとの類似度を算出して比較
分析し音声認識結果を出力する特徴マッチング部とを備
えたことを特徴とする。

【０００６】前記記憶部には、前記マッチング部と前記
周波数高低別標準パターン群との接続を行う周波数高低
別標準パターン接続回路を含むことができる。

【０００７】

【作用】記憶部内に同一語彙の標準パターン群を周波数
の高低別に複数準備しておき、音声認識を行う前に音声
出力装置部から利用者に対し音声ガイダンスに従ってあ
らかじめ定められた語彙の音声データを入力させる。入
力された音声データの平均周波数を周波数検出部が測定
して判定し、その判定結果に基づき記憶部内に準備した
マッチングし易い標準パターン群を選出して特徴マッチ
ング部と接続する。接続完了後に音声出力装置部から利
用者に対し音声データ入力のガイダンスを行い、同時に
特徴抽出部を作動させて利用者が入力した音声データを
もとに音声パターンを抽出させる。この抽出された音声
パターンと記憶部に準備された標準パターンとを特徴マ
ッチング部が比較分析し入力音声を認識する。

【０００８】これにより、認識のための計算量を全標準
パターンの一部に限定することが可能となり、処理時間
を大幅に短縮することができ、さらに、平均周波数の合
致した標準パターンだけとの類似性の算出が行われるた
め誤認識の確率を減少させることができる。

【０００９】

【実施例】次に、本発明実施例を図面に基づいて説明す
る。図１は本発明実施例の構成を示すブロック図であ
る。

【００１０】本発明実施例は、利用者にスピーカ１００
３を介してガイダンスを与える音声出力装置部１００２
と、利用者からの音声を入力する音声入力部１０００
と、音声の周波数スペクトルを測定して判定し平均周波
数を検出する周波数検出部１００１と、音声パターンを
記憶する記憶部１００５とを備え、さらに、本発明の特
徴として、記憶部１００５に、周波数の高低別に標準パ
ターンを区別した周波数高低別標準パターン群１１０１
〜１１０４を格納する領域を設け、周波数検出部１００
１に、利用者から入力された音声データの平均周波数を
測定して判定区分する手段を含み、入力された音声デー
タの音声パターンを前記記憶部から抽出する特徴抽出部
１００４と、この特徴抽出部１００４が抽出した音声パ
ターンと記憶部１００５に記憶された標準パターンとの
類似度を算出して比較分析し音声認識結果を音声認識結
果出力端子１００７から出力する特徴マッチング部１０
０６そを備え、記憶部１００５に周波数高低別標準パタ
ーン群１１０１〜１１０４と特徴マッチング部１００６
との接続を行う周波数高低別標準パターン接続回路１０
１１〜１０１３を含む。

【００１１】次に、このように構成された本発明実施例
の動作について説明する。図２は本発明実施例の動作の
流れを示す流れ図である。

【００１２】装置が作動し（ステップ２００１）、音声
出力装置部１００２から例えば「１２３とお話下さい」
という情報を発しスピーカ１００３からそのガイダンス
が流され（ステップ２００２）、これを受けた利用者が
そのガイダンスに従い音声入力部１０００より「１２
３」と入力すると（ステップ２００３）、入力された音
声データは周波数検出部１００１で平均周波数が測定さ
れ判定が行われる（ステップ２００４）。判定が不可能
な場合には再入力のガイダンスが音声出力装置部１００
２を介して発せられ（ステップ２０１４）、判定が可能
な場合にはその平均周波数に合致する周波数高低別標準
パターン群１１０１〜１１０４のつずれかに接続させる
ために平均周波数の情報が特徴マッチング部１００６を
介して記憶部１００５に送られる。

【００１３】このとき周波数高低別標準パターン接続回
路１０１１〜１０１３が作動して周波数高低別標準パタ
ーン群１１０１〜１１０４の中で最も平均周波数の合っ
ている一群と特徴マッチング部１００６とが接続され
（ステップ２００５）、記憶部１００５から接続完了の
情報が音声出力装置部１００２および特徴抽出部１００
４に送られる。これを受けた音声出力装置部１００２で
は音声データの入力のガイダンスをスピーカ１００３を
介して発し、同時に特徴抽出部１００４の機能が作動す
る。

【００１４】音声データの入力のガイダンスを受けた利
用者が何らかの音声データを音声入力部１０００から入
力すると（ステップ２００６）、入力された音声データ
は特徴抽出部１００４で特徴抽出、すなわち音声パター
ンの作成が行われ（ステップ２００７）、作成された音
声パターンはすでに記憶部１００５の中の周波数高低別
標準パターン群１１０１〜１１０４の中の一群と接続さ
れている特徴マッチング部１００６に送られ、周波数高
低別標準パターン群１１０１〜１１０４の中の一群の標
準パターンとの類似度の算出が行われる（ステップ２０
０８）。その結果は音声認識結果出力端子１００７から
出力される（ステップ２００９）。したがって、特徴マ
ッチング部１００６と接続されている周波数高低別標準
パターン群１１０１〜１１０４の中の一群以外の群の標
準パターンとの類似度の算出は行われず、認識の計算量
が抑えられる。

【００１５】なお、本発明は電話回線を介しての入力、
および直接マイクなどによる入力が行われる複合入力方
式にも応用することができる。

【００１６】

【発明の効果】以上説明したように本発明によれば、標
準パターン群を周波数の高低別に複数用意し、認識機能
作動前に利用者の平均周波数を測定して判定し、標準パ
ターンの中から平均周波数の合致した標準パターンと接
続して類似度の算出を行うことにより、認識のための計
算量を全標準パターンの一部に限定することが可能とな
り、処理時間を大幅に短縮することができ、また、平均
周波数の合致した標準パターンだけとの類似性の算出が
行われるため、誤認識の確率を減少させることができる
効果がある。

【図面の簡単な説明】

【図１】本発明実施例の構成を示すブロック図。

【図２】本発明実施例の動作の流れを示すフローチャー
ト。

【符号の説明】

１０００音声入力部１００１周波数検出部１００２音声出力装置部１００３スピーカ１００４特徴抽出部１００５記憶部１００６特徴マッチング部１００７音声認識結果出力端子１０１１〜１０１３周波数高低別標準パターン接続
回路１１０１〜１１０４周波数高低別標準パターン群

Claims

【特許請求の範囲】

【請求項１】利用者にスピーカを介してガイダンスを
与える音声出力装置部と、利用者からの音声を入力する音声入力部と、音声の周波数スペクトルを測定して判定し平均周波数を
検出する周波数検出部と、音声パターンを記憶する記憶部とを備えた音声処理装置
において、前記記憶部に、周波数の高低別に標準パターンを区別し
た周波数高低別標準パターン群をあらかじめ格納する領
域を設け、前記周波数検出部に、利用者から入力された音声データ
の平均周波数を測定して判定区分する手段を含み、入力された音声データの音声パターンを前記記憶部から
抽出する特徴抽出部と、この特徴抽出部が抽出した音声パターンと前記記憶部に
記憶された標準パターンとの類似度を算出して比較分析
し音声認識結果を出力する特徴マッチング部とを備えた
ことを特徴とする音声処理装置。
【請求項２】前記記憶部には、前記マッチング部と前
記周波数高低別標準パターン群との接続を行う周波数高
低別標準パターン接続回路を含む請求項１記載の音声処
理装置。