JPS6350899A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS6350899A
JPS6350899A JP19627286A JP19627286A JPS6350899A JP S6350899 A JPS6350899 A JP S6350899A JP 19627286 A JP19627286 A JP 19627286A JP 19627286 A JP19627286 A JP 19627286A JP S6350899 A JPS6350899 A JP S6350899A
Authority
JP
Japan
Prior art keywords
frame
spectral
change amount
channel
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP19627286A
Other languages
English (en)
Other versions
JPH0465399B2 (ja
Inventor
陽一 山田
高橋 圭子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP19627286A priority Critical patent/JPS6350899A/ja
Priority to US07/084,107 priority patent/US4882755A/en
Publication of JPS6350899A publication Critical patent/JPS6350899A/ja
Publication of JPH0465399B2 publication Critical patent/JPH0465399B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は音声認識装置、特にマツチング技術を用いた
音声認識装置に関するものである。
(従来の技術) 音声認識を行う一般的な技術として以下に述べるスペク
トルマツチング技術がある。先ず、この発明の説明に先
立ち、第5図及び第6図を用いて従来提案されているス
ペクトルマツチング技術を用いた音声認識装置につき簡
単な説明を行う。
A/D変換された入力音声信号DIは周波数分析部10
へ入力される0周波数分析部10はこの入力信号D1に
対し入力中心周波数の異なる(中心周波数の番号付けを
以後チャネルと称す)バンドパスフィルタによる周波数
分析及び対数変換を行った周波数スペクトルD2を所定
の時間間隔(以後フレームと称する。)毎に算出しく第
6図(A) ) 。
スペクトル正規化部11及び音声区間検出部12へ出力
する。
音声区間検出部12は周波数スペクトルD2の値の大き
さなどから始端時刻と終端時刻とを決定し始端時刻信号
D3及び終端時刻信号D4をスペクトル正規化部11へ
出力する。
スペクトル正規化部11は周波数スペクトルD2からス
ペクトルの最小自乗直線を減じ正規化スペクトル(第6
図(A)及び(B))とする処理を始端時刻から終端時
刻まで行い正規化スペクトルパタンD5としてスペクト
ル類似度計算部13へ出力する。
北記処理を所定の時間間隔(フレーム)毎に音声始端時
刻から音声終端時刻まで繰り返し行う。
次にスペクトル類似度計算部13は正規化スペクトルパ
タンD5と、予めスペクトル標準パタン記憶部14に格
納して用意されている全ての標準パタンとの類似度を算
出し、各認識対象カテゴリに対するスペクトル類似度D
6を判定部15へ出力する。
判定部15は全ての標準パタンの中で最大の類似度を与
える標準パタンか属するカテゴリ名を認識結果として出
力する。
以上述べた音声認識装置におけるスペクトルマツチング
技術によれば、スペクトル正規化を行うことにより話者
の相違により発生する声帯音源特性の相違を吸収するこ
とが出来、不特定話者が発声する音声の認識に対して有
効である。
(発明が解決しようとする問題点) このスペクトルマツチング技術は入力音声パタン全体の
スペクトル形状を抽出し、スペクトル標準パタンとの類
似度計算を行うものである。
従ってパタン全体のスペクトル形状が類似したカテゴリ
、例えば「イイエ」と「レイ」を考えると、母音「イ」
と母音「工」のホルマント周波数の出現位置は同一音声
内においては明らかな相違があるが、発声時刻及び発声
話者が変動する場合を考えると両母音のホルマント周波
数の出現位置の分布はオーバーラツプする部分があるた
め、正規化スペクトル情報(例えばホルマント周波数)
が出現するチャネル上の絶対位置の標準的な値であると
ころのスペクトル標準パタンと類似度計算を行った場合
に両者を正確に識別判定することが困難となる場合があ
る。即ち、同−音声内におけるスペクトルの変化量(相
対的な性質を有し、例えば「イ」から「工」への遷移部
、「工」から「イ」への遷移部の情報)を表わす特微量
が欠落していることにより認識性詣の低下を招くという
問題点があった。
この発明は上述した問題点を除去するために成されたも
のであり、従ってこの発明の目的は入力音声の正規化ス
ペクトルの変化方向を定量化した特徴を追加し、この特
徴を標準パタンとの類似度演算に使用する構成とするこ
左により、認識性能の優れた音声認識装置を提供するこ
とにある。
(問題点を解決するための手段) この目的の達成を図るため、この発明による音声認識装
置によれば、 a)音声区間内の各フレーム毎に該フレームの周辺にお
ける時間の進行に従った正規化スペクトルのチャネル方
向に対する遷移方向を定量化した値をスペクトル変化量
パタンとして各チャネル毎に算出するスペクトル変化量
パタン計算部と、b)スペクトル変化量標準パタンを予
め格納したスペクトル変化量標準パタン記憶部と、 C)このスペクトル変化量パタンと、スペクトル変化量
標準パタンとの類似度計算を行い各認識対象カテゴリに
対するスペクトル変化量類似度を算出するスペクトル変
化量類似度計算部とを設ける。
d)そして、さらに、このスペクトル類似度とスペクト
ル変化量類似度の両者を参照することにより各認識対象
カテゴリ毎に総合類似度を計算し、この総合類似度が全
ての認識対象カテゴリの中で最大となるカテゴリ名を認
識結果として出力するように構成した判定部を具えてい
る。
この発明の実施に当っては、好ましくはこのスペクトル
変化量パタン抽出部にはフレーム間距離算出手段と、極
大フレーム判定手段と、スペクトル変化量パタン抽出手
段とを設けるのが良い。
このフレーム間距#算出手段は、音声区間内の音声始端
フレームから音声終端フレームまでの各フレーム毎に、
該フレームと該フレームの直前フレームとのフレーム間
距離を算出する機使を有するのが好適である。
さらに極大フレーム判定手段は、算出した音声区間内の
各フレームにおけるフレーム間距離が極大となるフレー
ムを変化量極大フレームと判定する機能を有するのが好
適である。
さらに、スペクトル変化量パタン抽出手段は、変化量極
大フレームについて該フレームにおける各チャネルに対
して、 ■該フレームよりフレーム番号負方向かつ該チャネルよ
りチャネル番号負方向である領域■該フレームよりフレ
ーム番号正方向かつ該チャネルよりチャネル番号正方向
である領域■該フレームよりフレーム番号負方向かつ該
チャネルよりチャネル番号正方向である領域■該フレー
ムよりフレーム番号正方向かつ該チャネルよりチャネル
番号負方向である領域の4領域の正規化スペクトルに着
目し、■及び■項で説明された領域における正規化スペ
クトル値と、[3]及び[4]項で説明された領域にお
ける正規化スペクトル値の相対関係を表わす値、例えば
両正規化スペクトル値の差値、を該フレーム及び該チャ
ネルにおけるスペクトル変化量とする処理を施し、この
処理を音声区間内における全ての変化量極大フレームに
ついて行いスペクトル変化量パタンを作成する機能を有
するのが好適である6(作用) このように、この発明の音声認識装置によれば、従来の
識別判定に用いられているスペクトル類似度の他に、同
一音声区間内におけるスペクトルの変化量を表わす特微
量であって、しかも、スペクトルの遷移方向を考慮した
スペクトル変化量類似度を加えた総合類似度で識別判定
を行うので、正確かつ安定な認識が可染となる。
(実施例) 以下、図面を参照してこの発明の音声認識装置の一実施
例につき説明する。
第1図はこの発明の一実施例を示す機能ブロー。
り図、第2図(A)はこの発明の−1要部を構成するス
ペクトル変化量抽出部の一例を示す機能ブロック図、第
2図CB)は第2図(A)のスペクトル変化量抽出部の
動作手順を説明するための浣れ図である。第1図及び第
2図(A)及び(B)を用いてこの発明の音声認識装置
及びその動作説明を行うが、第1図において第5図に示
した構成成分に対応する構成成分については同一符号を
付して示し、その詳細な説明は、特に相違する場合を除
き、省略する。
この発明の実施例の音声認識装置によれば、第5図に示
した従来提案されている構成成分の他に、発声音の特徴
であるスペクトル変化量を抽出するスペクトル変化量計
算部16と、スペクトル変化量標準パタンを予め読み出
し自在に記憶させであるスペクトル変化量標準パタン記
憶部17と、スペクトル変化量パタン及びスペクトル変
化量標準パタンの類似度を計算するスペクトル変化量類
似度計算部18とを設けると共に、判定部を総合類似度
で認識判定出来る判定部19として構成している。
このスペクトル変化量計算系16には、音声区間検出部
12から始端時刻信号D3及び終端時刻信号D4を供給
すると共に、スペクトル正規化部11から正規化スペク
トルパタンD5を′供給する。このスペクトル変化量計
算部16は第2図(B)の説明の項で後述する手法によ
りスペクトル変化量パタンD8を算出し、スペクトル変
化量類似度計算部1日へ出力する。
このスペクトル変化量類似度計算部18はスペク)ル[
化!パタンD8と、予めスペクトル変化量標準パタン記
憶部17に記憶されている全てのスペクトル変化量標準
パタンD9との類似度を計算し、各認識対象カテゴリに
対するスペクトル変化量類似度010を判定部18へ出
力する。
この判定部19は認識対象カテゴリ毎にスペクトル類似
度D6と、スペクトル変化量類似度010との両者を参
照して最大の総合類似度を求めて認識結果011を出力
するが、この実施例では両者D8及びDloの総和を算
出し、この類似度総和値が全ての認識対象カテゴリの中
で最大となるカテゴリ名を認識結果Dllとして出力す
る。
次に、第2図(A)及び(B)の機能ブロック図及び動
作の流れ図によりスペクトル変化量計算部16の動作説
明を詳細に行う。
スペクトル変化量計算部16は第2図(A)に示すよう
にこの実施例ではフレーム間距#、算出手段20、極大
フレーム判定手段21及びスペクトル変化ffi パタ
ン抽出手段22を具えている。そして、これら手段20
〜22による処理手j順につき第2図(B)を参照して
以下説明する。尚、以下の説明において、処理ステップ
をSで表わす。
(I)フレーム間距離算出手段 音声区間内のあるフレーム(フレーム番号をjとする)
におけるフレーム間距離をDST(j)、周波数分析チ
ャネル数をCHNNO1正規化スペクトル出力をS(i
、j)(但しiはチャネル番号)とする、先ず、隣接す
るフレーム間での正規化スペクトル出力の差値ΔS(i
 、 Dを求め、次にその絶対値1ΔS(i。
j)1を求め、続いて下記(1)式に従ってDST (
Dを求める(Sl)。
すなわち上記(1)式に示されるように該フレームにお
ける正規化スペクトル出力と該フレームの直前フレーム
における正規化スペクトル出力間の各チャネル成分の差
分絶対値の総和としてフレーム間圧fiDsT(j)を
音声区間における始端フレームSFRから終端フレーム
EFRまでの全てのフレームに対して算出する(Sl、
S2)。
(II )極大フレーム判定手段 フレーム番号j=SFRと初期化を行った後(S3)、
音声区間内において各フレーム毎に算出したフレーム間
距離DST(J)が極大かどうか比較して判定しくS4
)、極大となるフレームを変化量極大フレームとして検
出する。
(m)スペクトル変化量パタン抽出手段(イ)変化量極
大フレームである場合(S5〜(a)高域から低域方向
へのスペクトル量算出(S5) 各チャネル毎に当該極大フレーム周辺における高域から
低域方向へのスペクトル量HTOL(i、j)(但しi
:チャネル番号)を以下の(2)式により算出する。
(2)式の第1項はフレーム番号負方向及びチャネル番
号正方向の領域の、又、第2項はフレーム番号正方向及
びチャネル番号負方向の領域の正規化スペクトル値であ
る。
(b)低域から高域方向へのスペクトル量算出(S6) 各チャネル毎に該フレーム周辺における低域から高域方
向へのスペクトル1LTOH(i 、D(但しi:チャ
ネル番号)を以下の(3)式により算出する。
(3)式において第1項はフレーム番号負方向及びチャ
ネル番号負方向の領域の、又、第2項はフレーム番号正
方向及びチャネル番号正方向の領域の正規化スペクトル
値である。
但し、これら(2)式及び(3)式において、fはチャ
ネル番号の変数、tはフレーム番号の変数であり、又、
TL、FLは経験によって定まる所定の定数で、この実
施例ではTI、=3、FL=2程度とすることが好まし
い、尚、この(2)式及び(3)式を算出する計算手順
は任意に定めることが出来る。
ト記(2)式で示される値は該フレーム及び該チャネル
周辺における時間の進行に従って高域チャネルから低域
チャネル方向へ遷移する正規化スペクトル値であり、(
3)式で示される値は該フレーム及び該チャネル周辺に
おける時間の進行に従って低域チャネルから高域チャネ
ル方向へ遷移する正規化スペクトル値である。
(c)スペクトル変化量算出(S7) これら(2)式及び(3)式で与えられる正規化スペク
トル値の相対関係を表わす値として、この実施例におい
ては、次の(4)式で定義される、該フレーム(フレー
ム番号j)における各チャネル毎のスペクトル変化量パ
タンDS (t 。
D  (但しi:チャネル番号)でかえられる。
ELS(i 、j)=HTOL(i 、j)−LTOH
(i、j)   ・ ・ 拳 ・ ・  (4)このス
ペクトル変化量パタンDS (i 、 j)を抽出する
算出ステップを処理ステップ(S7)で行う。
(4)式の値DS (i 、 j)が正値である場合は
時間の進行に従って高域チャネルから低域チャネル方向
へ遷移する正規化スペクトル値が犬、(4)式の値が負
値である場合は時間の進行に従って低域チャネルから高
域チャネル方向へ遷移する正規化スペクトル値が大であ
る。
(ロ)変化量極大フレームでない場合(S8)この場合
の処理もスペクトル変化量パタン抽出手段22で行う。
この場合には、該フレームにおける各チャネル毎のスペ
クトル変化量パタンDS (i 、 j)の値は全ての
チャネルについてOとする(S8)。
上述した各処理(34〜38)の終了後、フレーム番号
jに1を加算する(S9)、次に、j≦EFR(EFR
:軒端フレーム番号)を満足するか否かの判定を行い(
SIO)、この条件を満足する時ステップS4からの処
理を訝り返し行い、満足しない時は処理を終了する。
具体例の説明 第3図(A)は発声音「イイエ」及び第3図CB)は発
声音「レイ」の正規化スペクトルを横軸にフレーム番号
及び縦軸にチャネル番号を取って表わした図である。
濃淡の濃い部分が正規化出力値が大であることを表して
いる。
これら図から理解出来るように、第3図(A)にBで示
した領域及び第3図(B)のCで示した領域においてス
ペクトル変化量パタンDS (i 、 j)は負値とな
り、第3図(A)のAで示した領域及び第3IA(B)
のDで示した領域においてスペクトル変化量パタンDS
 (i 、 j)は正値となる。従ってスペクトル変化
量計算部16から出力されるスペクトル変化量パタンD
8と、スペクトル変化量標準パタンD9との間の類似度
であるところのスペクトル変化量類似度010は両者の
間で明白な相違がある。
第4図は判定部ISにおける発声音の音声パタンと、こ
の発声音に類似する音声の標準パタンとの総合類似度を
説明する図であり、第4図(A)は第3図(A)の音声
パタンを有する発声音「イイエ」のカテゴリ名「イイエ
」及びカテゴリ名「レイ」に対する総合類似度を表わし
、第4図(B)は第3図(B)の音声パタンを有する発
声音「レイ」のカテゴリ名「イイエ」及びカテゴリ名「
レイ」に対する総合類似度を表わしている0、尚、図中
2はスペクトル変化量゛類似度010を表わし、2はス
ペクトル類似度D8をそれぞれ表わしている。
これら図から理解出来るように発声音「イイエ」及び「
レイ」のそれぞれの特徴量であるスペクトル変化量類似
度が対比されるべき「レイ」及び「イイエ」の標準パタ
ンのスペクトル変化量類似度よりも大きいため、「イイ
エ」及び「レイ」の発声音の音声パタンと標準パタンと
でスペクトル類似度に差が無くても、スペクトル類似度
との併用により正確な認識処理を行なうことが出来る。
この発明は上述した実施例にのみ限定されるものではな
く、多くの変形又は変更を行い得ること明らかである0
例えば、スペクトル変化量計算部16の各機能手段は何
ら実施例で説明したものに限定されるものではない、又
、これら機能手段で行われる動作手順も上述した実施例
に限定されるものではない。
さらに、スペクトル変化量類似度計算部18及びスペク
トル変化量標準パタン記憶部17については詳細な説明
を省略したが、これらはスペクトル類似度計算部13及
びスペクトル標準パタン記憶部14と同様にして構成出
来る。
又、第1図に示した音声認識装置の動作はメモリ、制御
部、その他の通常の電子回路等を用いて構成したマイク
ロコンピュータ−等によってソフト的に処理することが
出来る。
(発明の効果) 上述した説明から明らかなように、この発明の音声認識
装置では、正・規化スペクトル類似度とスペクトル変化
量類似度を用いて認識判定を行う構成としたので、入力
音声内におけるスペクトルの遷移方向を加味した正確か
つ安定な認識が回走となり認識性能の優れた音声認識装
置の実現が可能となる。
【図面の簡単な説明】
第1図はこの発明の音声認識装置の一実施例を示す機能
ブロック図、 第2図(A)は第1図の音声認識装置のスペクトル変化
量計算部の一実施例を示す機能ブロック図、 第2図(B)はこの発明のスペクトル変化量パタン抽出
の処理手順を示す動作の流れ図、第3図(A)及び(B
)はこの発明の説明に供する発声音「イイエ」及び「レ
イ」の正規化スペクトルをそれぞれ示す図、 第4図はこの発明におけるスペクトル変化量類似度の認
識への貢献を説明するための、標準パタンに対する総合
類似度の説明図、 第5図は従来の音声認識装置を示す機衡ブロッり図、 第6図はスペクトルマツチング技術の説明図である。 10・・・周波数分析部、 11・・・スペクトル正規
化部12・・・音声区間検出部 13・・・スペクトル類似度計算部 14・・・スペクトル標準パタン記憶部16・・・スペ
クトル変化量計算部 17・・・スペクトル変化量標準パタン記憶部18・・
・スペクトル変化量類似度計算部19・・・判定部 20・・・フレーム間距離算出手段 21・・・極大フレーム判定手段 22・・・スペクトル変化量パタン抽出手段。 特許出願人   沖電気工業株式会社 金?者の正規化スペクトル 第3図 )紫茅ハOクツ1:ズ寸す■1石′呂iず!l D)J
iの8光日月図第4図 スペクトルマヅテシク゛′才支マネ°↑の畜見明図第6
図 手続補正書 昭和61年8月28日

Claims (2)

    【特許請求の範囲】
  1. (1)入力音声に対し複数のチャネルによる周波数分析
    、対数変換を行い周波数スペクトルを抽出する周波数分
    析部と、 前記周波数スペクトルに基づいて音声区間を検出する音
    声区間検出部と、 前記周波数スペクトル及び音声区間に基づいて前記周波
    数スペクトルの最小近似直線により正規化した正規化ス
    ペクトルパタンを算出するスペクトル正規化部と、 スペクトル標準パタンを予め格納したスペクトル標準パ
    タン記憶部と、 前記正規化スペクトルパタン及びスペクトル標準パタン
    の類似度計算を行い各認識対象カテゴリに対するスペク
    トル類似度を算出するスペクトル類似度計算部と、 全ての認識対象カテゴリの中で最大の類似度を与えるカ
    テゴリ名を認識結果として出力する判定部と を具える音声認識装置において、 a)音声区間内の各フレーム毎に該フレームの周辺にお
    ける時間の進行に従った正規化スペクトルのチャネル方
    向に対する遷移方向を定量化した値をスペクトル変化量
    パタンとして各チャネル毎に算出するスペクトル変化量
    パタン計算部と、 b)スペクトル変化量標準パタンを予め格納したスペク
    トル変化量標準パタン記憶部と、 c)前記スペクトル変化量パタンと、スペクトル変化量
    標準パタンとの類似度計算を行い各認識対象カテゴリに
    対するスペクトル変化量類似度を算出するスペクトル変
    化量類似度計算部と を具え、 d)前記判定部における最大の類似度を、前記スペクト
    ル類似度とスペクトル変化量類似度の両者を参照するこ
    とにより各認識対象カテゴリ毎に算出された総合類似度
    のうちの最大の総合類似度とした ことを特徴とする音声認識装置。
  2. (2)前記スペクトル変化量パタン計算部は、a)音声
    区間内の各フレーム毎に、該フレームと該フレームの直
    前フレームとのフレーム間距離を算出するフレーム間距
    離算出手段と、 b)前記算出した音声区間内の各フレームにおけるフレ
    ーム間距離が極大となるフレームを変化量極大フレーム
    と判定する極大フレーム判定手段と、c)前記変化量極
    大フレームと判定されたフレームについて該フレームに
    おける各チャネルに対して、下記の[1]〜[4]項の
    各領域すなわち[1]該フレームよりフレーム番号負方
    向かつ該チャネルよりチャネル番号負方向である領域 [2]該フレームよりフレーム番号正方向かつ該チャネ
    ルよりチャネル番号正方向である領域 [3]該フレームよりフレーム番号負方向かつ該チャネ
    ルよりチャネル番号正方向である領域 [4]該フレームよりフレーム番号正方向かつ該チャネ
    ルよりチャネル番号負方向である領域 の正規化スペクトル値を算出し、[1]及び[2]項の
    領域における正規化スペクトル値と、[3]及び[4]
    項の領域における正規化スペクトル値の相対関係を表わ
    す値を該フレーム及び該チャネルにおけるスペクトル変
    化量パタンとする処理を施し、前記変化量極大フレーム
    と判定されなかったフレームのスペクトル変化量パタン
    の値は全てのチャネルについて0とするスペクトル変化
    量パタン抽出手段と を具えることを特徴とする特許請求の範囲第1項に記載
    の音声認識装置。
JP19627286A 1986-08-21 1986-08-21 音声認識装置 Granted JPS6350899A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP19627286A JPS6350899A (ja) 1986-08-21 1986-08-21 音声認識装置
US07/084,107 US4882755A (en) 1986-08-21 1987-08-11 Speech recognition system which avoids ambiguity when matching frequency spectra by employing an additional verbal feature

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19627286A JPS6350899A (ja) 1986-08-21 1986-08-21 音声認識装置

Publications (2)

Publication Number Publication Date
JPS6350899A true JPS6350899A (ja) 1988-03-03
JPH0465399B2 JPH0465399B2 (ja) 1992-10-19

Family

ID=16355043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19627286A Granted JPS6350899A (ja) 1986-08-21 1986-08-21 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6350899A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005234304A (ja) * 2004-02-20 2005-09-02 Kawai Musical Instr Mfg Co Ltd 演奏音判定装置および演奏音判定プログラム
JP2008291377A (ja) * 2007-05-23 2008-12-04 Voith Patent Gmbh 古紙裁断用ロータ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005234304A (ja) * 2004-02-20 2005-09-02 Kawai Musical Instr Mfg Co Ltd 演奏音判定装置および演奏音判定プログラム
JP2008291377A (ja) * 2007-05-23 2008-12-04 Voith Patent Gmbh 古紙裁断用ロータ

Also Published As

Publication number Publication date
JPH0465399B2 (ja) 1992-10-19

Similar Documents

Publication Publication Date Title
CN112053695A (zh) 声纹识别方法、装置、电子设备及存储介质
CN110767239A (zh) 一种基于深度学习的声纹识别方法、装置及设备
Von Zeddelmann et al. Perceptual audio features for unsupervised key-phrase detection
JPS6128998B2 (ja)
US4856067A (en) Speech recognition system wherein the consonantal characteristics of input utterances are extracted
JPS6350896A (ja) 音声認識装置
CN106887226A (zh) 一种基于人工智能识别的语音识别算法
JPS6350899A (ja) 音声認識装置
JPH0558560B2 (ja)
JP2003271190A (ja) 雑音除去方法、雑音除去装置及び、それを用いた音声認識装置
CN112992131A (zh) 一种在复杂场景下提取目标人声的乒乓球指令的方法
JPH0466520B2 (ja)
JP2744622B2 (ja) 破裂子音識別方式
JP2613108B2 (ja) 音声認識方法
JPS6346496A (ja) 音声認識装置
JPS6136797A (ja) 音声セグメンテ−シヨン法
CN114697687A (zh) 一种数据处理方法和装置
JPS59211100A (ja) 登録型音声認識方法
JPS625298A (ja) 音声認識装置
JPS6152698A (ja) 音声認識装置
JPH01260495A (ja) 音声認識法
JPS6350898A (ja) 音声認識装置
JPS625299A (ja) 音声認識装置
JPS61275799A (ja) 音声認識装置
JPS6336680B2 (ja)