JPH11119795A - 特徴量の濃縮合成方法、及び特徴量の濃縮合成装置 - Google Patents

特徴量の濃縮合成方法、及び特徴量の濃縮合成装置

Info

Publication number
JPH11119795A
JPH11119795A JP9283451A JP28345197A JPH11119795A JP H11119795 A JPH11119795 A JP H11119795A JP 9283451 A JP9283451 A JP 9283451A JP 28345197 A JP28345197 A JP 28345197A JP H11119795 A JPH11119795 A JP H11119795A
Authority
JP
Japan
Prior art keywords
feature
feature vector
vector
pattern
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9283451A
Other languages
English (en)
Inventor
Shuji Nishikawa
修史 西川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9283451A priority Critical patent/JPH11119795A/ja
Publication of JPH11119795A publication Critical patent/JPH11119795A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 複数の測定方法により得られた特徴量を効率
よく合成することにより、パターン認識の精度を高めた
技術を提供することにある。 【解決手段】 2種類の測定方法により要素数mの特徴
ベクトルX、及び要素数nの特徴ベクトルYを得る。特
徴ベクトルX及び特徴ベクトルYに対して特徴選択を行
う。この特徴選択により、要素数i(i<m)の特徴ベ
クトルT及び要素数j(j<n)の特徴ベクトルUが生
成される。続いて、特徴ベクトルTと特徴ベクトルUと
を一列に並べて要素数k(k= i+j)の特徴ベクトルV
を生成する。特徴ベクトルVに対して特徴選択を行い要
素数l(l<k)の特徴ベクトルWを生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はパターン認識に関す
る技術であり、特に情報密度の高い特徴量が得られる特
徴量の濃縮合成技術に関する。
【0002】
【従来の技術】パターンマッチングの技術は色々な技術
が開発されている。例えば、パターンマッチングの技術
として、特許出願公開番号特開平8−110797号公
報に記載された技術がある。以下、図5を参照して説明
する。このパターンマッチング装置は、音声入力手段1
00と、音声入力手段100よりの入力音声を特徴ベク
トルの時系列である入力パターンに変換する特徴部抽出
手段110と、標準パターンの特徴ベクトルを予め登録
した標準パターン記憶手段130と、特徴部抽出手段1
10によって取り出された入力パターンの特徴ベクトル
と標準パターン記憶手段130から取り出された標準パ
ターンの特徴ベクトルとの局所距離と類似度中立点とか
ら局所類似度を求め、局所類似度の累積値を入力パター
ンと標準パターンとの類似度として求める類似度計算手
段120と、類似度中立点を入力信号に応じて決定する
類似度中立点計算手段150と、求められた累積類似度
から認識対象となつている標準パターンがしきい値以上
かどうかを判定する結果出力判定手段140と、しきい
値以上のときはその標準パターンを認識結果として出力
する認識結果出力手段160とから成る。
【0003】このパターンマッチング装置によれば、類
似度中立点計算手段150により類似度中立点を入力信
号に応じて、例えば入力された信号のパワーや入力ベク
トルの大きさに応じて決定する。すなわち、標準パター
ンの特徴量に応じて類似度中立点決定するのではなく、
入力パターンの特徴量に応じて類似度中立点決定してい
る。
【0004】これにより、特定話者が単語登録して用い
る学習データが少ない音声認識方式においても、部分マ
ッチングを起こしにくい。
【0005】
【発明が解決しようとする課題】ところで、上述の従来
技術では特徴ベクトルを一つの測定方法により生成して
いる。しかしながら、測定方法には様々なものが検討さ
れているがそれぞれ一長一短があり完全な方法はない。
【0006】従って、一つの測定方法により得られた特
徴ベクトルを用いてパターン認識する技術では、パター
ン認識の精度にも限度があった。そこで、本発明の目的
は、上記問題点を解決し、複数の測定方法により得られ
た特徴量を効率よく合成することにより、パターン認識
の精度を高めた技術を提供することにある。
【0007】
【課題を解決する為の手段】上記本発明の目的を解決す
る第1の発明は、パターン認識に用いられる特徴量の濃
縮合成方法であって、(a)複数の測定方法に基づい
て、入力データから複数の第1の特徴ベクトルを生成す
る工程と、(b)前記第1の特徴ベクトルの各々に対し
て任意の特徴選択を行い、複数の第2の特徴ベクトルを
生成する工程と、(c)前記複数の第2の特徴ベクトル
を併合して第3の特徴ベクトルを生成する工程と、
(d)前記第3の特徴ベクトルに対して任意の特徴選択
を行い、第4の特徴ベクトルを生成する工程とを有する
ことを特徴とする。
【0008】第1の発明によれば、類似性の判別に大き
な影響を与える部分だけを取り出せて情報量の圧縮をし
ながら、別々の特徴量の合成が出来る。尚、用いられる
測定方法は、周波数測定、時系列測定等、種類は問わな
い。同様に特徴選択の方法も、主成分分析法や正準判別
分析法、あるいはニューラルネットワーク等、種類は問
わない。
【0009】又、第2の発明は、第1の発明における第
1の特徴ベクトルを生成する工程は、互いに異なる測定
方法により入力データから第1の特徴ベクトルを生成す
ることを特徴とする。又、第3の発明は、第1の発明に
おける第2の特徴ベクトルを生成する工程は、互いに異
なる特徴選択の方法により特徴選択を行うことを特徴と
する。
【0010】又、第4の発明は、第1の発明に加えて、
第4の特徴ベクトルと正解パターンとの類似性を解析
し、類似性が最も高い正解パターンを認識結果として出
力する工程を更に有することを特徴とする。又、第5の
発明は、第1の発明における(a)〜(d)の工程を複
数設け、複数の第4の特徴ベクトルを生成する工程と、
前記複数の第4の特徴ベクトルを併合して第5の特徴ベ
クトルを生成する工程と、前記第5の特徴ベクトルに対
して任意の特徴選択を行い、第6の特徴ベクトルを生成
する工程と、前記第6の特徴ベクトルと正解パターンと
の類似性を解析し、類似性が最も高いパターンを認識結
果として出力する工程とを有することを特徴とする。
【0011】上記本発明の目的を解決する第6の発明
は、パターン認識に用いられる特徴量の濃縮合成装置で
あって、所定の測定方法により、入力データから第1の
特徴ベクトルを生成し、前記第1の特徴ベクトルに対し
て特徴選択を行って第2の特徴ベクトルを生成する複数
の測定手段と、前記複数の第2の特徴ベクトルを併合し
て第3の特徴ベクトルを生成し、前記第3の特徴ベクト
ルに対して特徴選択を行い、第4の特徴ベクトルを生成
する特徴量併合手段とを有することを特徴とする。
【0012】尚、用いられる測定方法は、周波数測定、
時系列測定等、種類は問わない。同様に特徴選択の方法
も、主成分分析法や正準判別分析法、あるいはニューラ
ルネットワーク等、種類は問わない。又、第7の発明
は、第6の発明の測定手段が、互いに異なる測定方法に
基づいて入力データから第1の特徴ベクトルを生成する
手段であることを特徴とする。
【0013】又、第8の発明は、第6の発明の測定手段
が、互いに異なる特徴選択の方法に基づいて特徴選択を
行う手段であることを特徴とする。又、第9の発明は、
第6の発明に加えて、第4の特徴ベクトルと正解パター
ンとの類似性を解析し、類似性が最も高い正解パターン
を認識結果として出力する認識判定手段を更に有し、前
記特徴量併合手段は前記認識判定手段において判定に遜
色ない範囲で情報を圧縮する為に特徴選択を行うことを
特徴とする。
【0014】又、第10の発明は、前記複数の測定手段
及び特徴量併合手段から成る濃縮合成装置を複数設け、
濃縮合成装置から出力される複数の第4の特徴ベクトル
を併合して第5の特徴ベクトルを生成し、前記第5の特
徴ベクトルに対して特徴選択を行って第6の特徴ベクト
ルを生成する第2の特徴量併合手段と、前記第6の特徴
ベクトルと正解パターンとの類似性を解析し、類似性が
最も高い正解パターンを認識結果として出力する第2の
認識判定手段を有し、前記第2の特徴量併合手段は、特
徴ベクトルの要素数を前記第2の認識判定手段において
判定に遜色ない範囲で情報を圧縮する為に特徴選択を行
うことを特徴とする。
【0015】上記本発明の目的を解決する第11の発明
は、パターン認識に用いられる特徴ベクトルの特徴量の
濃縮合成装置であって、複数の測定手段と、特徴量併合
手段と、認識判定手段とを有し、前記測定手段の各々
は、他の測定手段とは異なる測定方法に基づいて、入力
データから第1の特徴ベクトルを生成する手段と、特徴
量を記憶する記憶手段と、前記第1の特徴ベクトルに対
して、前記特徴量記憶手段に記憶されている特徴量に基
づいて他の測定手段とは異なる特徴選択を行って前記第
1の特徴ベクトルの要素数よりも要素数が少ない第2の
特徴ベクトルを生成する特徴選択手段とを有し、前記特
徴量併合手段は、前記複数の第2の特徴ベクトルを併合
し、第3の特徴ベクトルを生成する特徴量併合手段と、
特徴量を記憶する記憶手段と、前記第3の特徴ベクトル
に対して、前記特徴量記憶手段に記憶されている特徴量
に基づいて所定の特徴選択を行って前記第3の特徴ベク
トルの要素数よりも要素数が少なく、かつ、前記認識判
定手段における要素数と同じ第4の特徴ベクトルを生成
する手段とを有し、前記認識判定手段は、正解パターン
を記憶する記憶手段と、前記第4の特徴ベクトルと前記
正解パターンとの類似性を解析し、類似性が最も高い正
解パターンを認識結果として出力する手段とを有するこ
とを特徴とする。
【0016】本発明によれば、お互いの特徴(量)のよ
い部分だけを取り出して合成するので、情報密度の高い
特徴量が得られる。
【0017】
【発明の実施の形態】本発明の実施の形態を説明する。
図1は本特徴量の濃縮方法を説明する為の図である。本
特徴量の濃縮方法の特徴は、複数の特徴抽出方法を用い
て、特徴量を得るとともに特徴選択をする操作を並列し
て行ってから、合成するところにある。入力するデー
タ、特徴選択の方法は、何を用いても構わない。
【0018】まず、方向や位置、時間変化、状態など、
入力するものの特性を測定した測定データを並べて、特
徴量を特徴ベクトルとして定義する。実際には、ここで
得られた特徴ベクトルと正解となるベクトルとの類似性
によって分類が行われる。本実施の形態では、2種類の
測定方法により特徴ベクトルX、及び特徴ベクトルYを
得る。尚、特徴ベクトルXの要素数はm、特徴ベクトル
Yの要素数はnである。
【0019】次に、特徴ベクトルX及び特徴ベクトルY
において、類似性の比較に大きな影響を与える要素だけ
を選び出すための特徴選択を行う。特徴選択の方法に
は、主成分分析法や正準判別分析法あるいは、ニューラ
ルネットワークなどがあげられる。この特徴選択によ
り、特徴ベクトルX及び特徴ベクトルYは、要素数の少
ない特徴ベクトルT及び特徴ベクトルUが生成される。
尚、特徴ベクトルTの要素数はi(i<m)、特徴ベク
トルUの要素数はj(j<n)である。特徴選択によっ
てデータ量を減らせるため、併合する際に扱うデータ量
を減らすことができる。
【0020】続いて、特徴ベクトルTと特徴ベクトルU
とを一列に並べて新たな特徴ベクトルを作り(特徴ベク
トルの併合と呼ぶ)、これを特徴ベクトルVとする。こ
の特徴ベクトルの併合は、 特徴ベクトルT=(t1,t2,……,ti) 特徴ベクトルU=(u1,u2,……,uj) の場合、 特徴ベクトルV=(t1,t2,……,ti,u1,u
2,……,uj) と言うように各特徴ベクトルの要素を並べることにより
行われる。従って、特徴ベクトルVの要素数はk(k=
i+j)である。
【0021】最後に、特徴ベクトルVに対して同じよう
に特徴選択を適用し得られた特徴ベクトルを特徴ベクト
ルWとする。尚、特徴ベクトルWの要素数はl(l<
k)である。そして、特徴ベクトルWの特徴量は、濃縮
された特徴量である。尚、本実施の形態では、特徴選択
の際に特徴ベクトルの要素数を減らしているが、かなら
ずしも要素数を減らさなくとも良い。
【0022】又、本実施の形態では、特徴ベクトルが二
つ、即ち二つの特徴ベクトルの併合について説明した
が、3つ以上の特徴ベクトルを併合しても良い。又、既
に併合された2以上の特徴ベクトルを再び併合して新た
な特徴ベクトルを生成しても良い。次に、第1の特徴量
の濃縮合成装置について説明する。図2は第1の濃縮合
成装置のブロック図である。尚、本実施形態では、本発
明を音声認識に適用した例を示すが、入力されるデータ
としては音声以外の文字、画像等のパターン認識される
データならば何でも良い。
【0023】1はマイクなどの入力装置である。2は第
1の測定器である。測定器2は、周波数測定に基づいて
入力データから特徴ベクトルを生成する測定手段21
と、予め特徴選択に用いられる演算のための情報(数値
データ)が記憶された特徴量記憶部22と、特徴量記憶
部22を用いて主成分分析法により特徴選択を行う特徴
選択手段23とを有する。
【0024】3は第2の測定器である。測定器3は、時
系列測定に基づいて入力データから特徴ベクトルを生成
する測定手段31と、予め特徴選択に用いられる演算の
ための情報が記憶された特徴量記憶部32と、特徴量記
憶部32を用いて正準判別分析法により特徴選択を行う
特徴選択手段33とを有する。尚、測定器2,3は、各
々の測定方法の処理が並列に行えるように分わかれてい
る。
【0025】4は特徴ベクトル(特徴量)の併合・特徴
選択を行う特徴量併合処理器である。特徴量併合処理器
4は、特徴選択手段23及び特徴選択手段33から出力
された特徴ベクトルを併合する特徴量併合手段41と、
予め特徴選択に用いられる演算のための情報が記憶され
た特徴量記憶部42と、特徴量記憶部42を用いて主成
分分析法により特徴選択を行う特徴選択手段43とを有
する。尚、特徴選択手段43は、併合されて生成された
特徴ベクトルを後述する認識判定器5に必要な特徴ベク
トルに変換する。
【0026】5は入力データと正解の比較・分類を行う
認識判定器である。認識判定器5は、正解パターンが予
め記憶された特徴量記憶部51と、特徴選択手段43か
ら出力された特徴ベクトル(特徴量)と特徴量記憶部5
1に記憶されている正解パターンとを比較して類似性判
定を行う判定手段52とを有する。尚、判定手段52に
おける類似性判定の識別関数には、ユークリッド距離が
使用される。
【0027】6はディスプレイなどの出力装置である。
上記の如く構成された濃縮合成装置の動作を説明する。
入力装置1から与えられた入力音声は、複数に分かれた
測定器2,3に同時に供給される。測定器2,3では、
各々の測定方法で入力音声をいくつかの項目からなる数
値データにし、それを特徴ベクトル(特徴量)として構
成する。その特徴ベクトルに対し、主成分分析、又は正
準判別分析法を行って特徴選択を行い、新たな特徴ベク
トルを構成して出力する。
【0028】特徴量併合処理器4では、測定器2,3か
らの出力が揃ったところで、ベクトルの併合を行う。そ
して、併合されて生成された特徴ベクトルに対して主成
分分析を行い、更に認識判定器5に必要な特徴ベクトル
に合わせて新たな特徴ベクトルを構成し出力する。認識
判定器5では、特徴量併合処理器4からの特徴ベクトル
と、特徴量記憶部51にある正解パターンとのベクトル
の類似性を、識別関数を用いて計算し、正解となる分類
(カテゴリー)の中で最も類似性が高いと判定されたカ
テゴリーを認識結果として出力装置6に表示する。
【0029】第1の濃縮合成装置によれば、入力データ
から別々に得られた特徴量を、そのデータの内容に関わ
らず機械的に合成できる。又、特徴選択により、類似性
の判別に大きな影響を与える部分だけを取り出せるた
め、情報量の圧縮をしながら別々の特徴量の合成が行え
る。尚、本実施の形態では、説明を簡単にする為に測定
器を2つしか設けなかったが、図3に示される第2の濃
縮合成装置の様に3つ以上の測定器を設けて、3つ以上
の特徴ベクトルを併合することも可能である。この場
合、入力装置からの入力に対して測定器における処理は
並列して行うことができるため、3つ以上の測定方法か
ら得られる特徴量を同時に合成可能である。
【0030】次に、第3の濃縮合成装置を説明する。第
3の濃縮合成装置は、第1の濃縮合成装置における測定
器2,3と特徴量併合処理器4とを一つのモジュールと
して(これを中間合成装置とする)、中間合成装置60
と中間合成装置61と中間合成装置62とを並列に並べ
てたものである。
【0031】そして、各中間合成装置から出力された特
徴ベクトルを特徴量併合処理器4に入力する。そして、
特徴量併合処理器4及び認識判定器5において第1の濃
縮合成装置と同様な処理を行う。第3の濃縮合成装置に
よれば、より特徴量が濃縮された特徴ベクトルを得るこ
とが出来、パターン認識の精度も高まる。
【0032】
【効果】本発明によれば、入力データから別々に得られ
た特徴ベクトル(特徴量)を、そのデータの内容に関わ
らず機械的に合成することが出来る。又、かならず特徴
選択を行うので、情報量を圧縮しながら類似性の判別に
大きな影響を与える部分だけを取り出せ、この情報を合
成することにより、大きな影響を与える部分のみを濃縮
して合成することが出来る。
【図面の簡単な説明】
【図1】図1は本特徴量の濃縮方法を説明する為の図で
ある。
【図2】図2は第1の濃縮合成装置のブロック図であ
る。
【図3】図3は第2の濃縮合成装置のブロック図であ
る。
【図4】図4は第3の濃縮合成装置のブロック図であ
る。
【図5】図5は従来技術を説明する為の図である。
【符号の説明】
1 入力装置 2,3 測定器 4 特徴量併合処理器 5 認識判定器 6 出力装置 21,31 測定手段 22,32,42,51 特徴量記憶部 23,33,43 特徴選択手段 41 特徴量併合手段 52 判定手段 60,61,62 中間合成装置

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 パターン認識に用いられる特徴量の濃縮
    合成方法であって、 (a)複数の測定方法に基づいて、入力データから複数
    の第1の特徴ベクトルを生成する工程と、 (b)前記第1の特徴ベクトルの各々に対して任意の特
    徴選択を行い、複数の第2の特徴ベクトルを生成する工
    程と、 (c)前記複数の第2の特徴ベクトルを併合して第3の
    特徴ベクトルを生成する工程と、 (d)前記第3の特徴ベクトルに対して任意の特徴選択
    を行い、第4の特徴ベクトルを生成する工程とを有する
    ことを特徴とする特徴量の濃縮合成方法。
  2. 【請求項2】 (a)第1の特徴ベクトルを生成する工
    程は、互いに異なる測定方法により入力データから第1
    の特徴ベクトルを生成する工程であることを特徴とする
    請求項1に記載の特徴量の濃縮合成方法。
  3. 【請求項3】 (b)第2の特徴ベクトルを生成する工
    程は、互いに異なる特徴選択の方法により特徴選択を行
    うことを特徴とする請求項1又は請求項2に記載の特徴
    量の濃縮合成方法。
  4. 【請求項4】 第4の特徴ベクトルと正解パターンとの
    類似性を解析し、類似性が最も高い正解パターンを認識
    結果として出力する工程を更に有することを特徴とする
    請求項1から請求項3のいずれかに記載の特徴量の濃縮
    合成方法。
  5. 【請求項5】 請求項1に記載の(a)〜(d)の工程
    を複数設け、複数の第4の特徴ベクトルを生成する工程
    と、 前記複数の第4の特徴ベクトルを併合して第5の特徴ベ
    クトルを生成する工程と、 前記第5の特徴ベクトルに対して任意の特徴選択を行
    い、第6の特徴ベクトルを生成する工程と、 前記第6の特徴ベクトルと正解パターンとの類似性を解
    析し、類似性が最も高いパターンを認識結果として出力
    する工程とを更に有することを特徴とする請求項1から
    請求項4のいずれかに記載の特徴量の濃縮合成方法。
  6. 【請求項6】 パターン認識に用いられる特徴量の濃縮
    合成装置であって、所定の測定方法により、入力データ
    から第1の特徴ベクトルを生成し、前記第1の特徴ベク
    トルに対して特徴選択を行って第2の特徴ベクトルを生
    成する複数の測定手段と、 前記複数の第2の特徴ベクトルを併合して第3の特徴ベ
    クトルを生成し、前記第3の特徴ベクトルに対して特徴
    選択を行い、第4の特徴ベクトルを生成する特徴量併合
    手段とを有することを特徴とする特徴量の濃縮合成装
    置。
  7. 【請求項7】 複数の測定手段は、互いに異なる測定方
    法に基づいて入力データから第1の特徴ベクトルを生成
    する手段であることを特徴とする請求項1に記載の特徴
    量の濃縮合成装置。
  8. 【請求項8】 複数の測定手段は、互いに異なる特徴選
    択の方法に基づいて特徴選択を行う手段であることを特
    徴とする請求項1又は請求項2に記載の特徴量の濃縮合
    成装置。
  9. 【請求項9】 第4の特徴ベクトルと正解パターンとの
    類似性を解析し、類似性が最も高い正解パターンを認識
    結果として出力する認識判定手段を更に有し、 前記特徴量併合手段は、特徴ベクトルの要素数を前記認
    識判定手段において判定に遜色ない範囲で情報を圧縮す
    る為に特徴選択を行うことを特徴とする請求項6から請
    求項8のいずれかに記載の特徴量の濃縮合成装置。
  10. 【請求項10】 複数の測定手段及び特徴量併合手段か
    ら成る濃縮合成装置を複数設け、 濃縮合成装置から出力される複数の第4の特徴ベクトル
    を併合して第5の特徴ベクトルを生成し、前記第5の特
    徴ベクトルに対して特徴選択を行って第6の特徴ベクト
    ルを生成する第2の特徴量併合手段と、 前記第6の特徴ベクトルと正解パターンとの類似性を解
    析し、類似性が最も高い正解パターンを認識結果として
    出力する第2の認識判定手段を有し、 前記第2の特徴量併合手段は、特徴ベクトルの要素数を
    前記第2の認識判定手段において判定に遜色ない範囲で
    情報を圧縮する為に特徴選択を行うことを特徴とする請
    求項6から請求項9のいずれかに記載の特徴量の濃縮合
    成装置。
  11. 【請求項11】 パターン認識に用いられる特徴量の濃
    縮合成装置であって、 複数の測定手段と、特徴量併合手段と、認識判定手段と
    を有し、 前記測定手段の各々は、他の測定手段とは異なる測定方
    法に基づいて、入力データから第1の特徴ベクトルを生
    成する手段と、特徴量を記憶する記憶手段と、前記第1
    の特徴ベクトルに対して、前記特徴量記憶手段に記憶さ
    れている特徴量に基づいて他の測定手段とは異なる特徴
    選択を行って前記第1の特徴ベクトルの要素数よりも要
    素数が少ない第2の特徴ベクトルを生成する特徴選択手
    段とを有し、 前記特徴量併合手段は、前記複数の第2の特徴ベクトル
    を併合し、第3の特徴ベクトルを生成する特徴量併合手
    段と、特徴量を記憶する記憶手段と、前記第3の特徴ベ
    クトルに対して、前記特徴量記憶手段に記憶されている
    特徴量に基づいて所定の特徴選択を行って前記第3の特
    徴ベクトルの要素数よりも要素数が少なく、かつ、前記
    認識判定手段における要素数と同じ第4の特徴ベクトル
    を生成する手段とを有し、 前記認識判定手段は、正解パターンを記憶する記憶手段
    と、前記第4の特徴ベクトルと前記正解パターンとの類
    似性を解析し、類似性が最も高い正解パターンを認識結
    果として出力する手段とを有することを特徴とする特徴
    量の濃縮合成装置。
JP9283451A 1997-10-16 1997-10-16 特徴量の濃縮合成方法、及び特徴量の濃縮合成装置 Pending JPH11119795A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9283451A JPH11119795A (ja) 1997-10-16 1997-10-16 特徴量の濃縮合成方法、及び特徴量の濃縮合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9283451A JPH11119795A (ja) 1997-10-16 1997-10-16 特徴量の濃縮合成方法、及び特徴量の濃縮合成装置

Publications (1)

Publication Number Publication Date
JPH11119795A true JPH11119795A (ja) 1999-04-30

Family

ID=17665723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9283451A Pending JPH11119795A (ja) 1997-10-16 1997-10-16 特徴量の濃縮合成方法、及び特徴量の濃縮合成装置

Country Status (1)

Country Link
JP (1) JPH11119795A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008250693A (ja) * 2007-03-30 2008-10-16 Matsushita Electric Ind Co Ltd 映像検索装置
JP2023513430A (ja) * 2020-01-21 2023-03-31 グーグル エルエルシー デリバレーションモデルベースの2パスのエンド・ツー・エンド音声認識

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008250693A (ja) * 2007-03-30 2008-10-16 Matsushita Electric Ind Co Ltd 映像検索装置
JP2023513430A (ja) * 2020-01-21 2023-03-31 グーグル エルエルシー デリバレーションモデルベースの2パスのエンド・ツー・エンド音声認識

Similar Documents

Publication Publication Date Title
Joder et al. Temporal integration for audio classification with application to musical instrument classification
US4624010A (en) Speech recognition apparatus
Deshpande et al. Classification of music signals in the visual domain
EP0686965B1 (en) Speech recognition apparatus with speaker adaptation using acoustic category mean value calculus
CN108711422A (zh) 语音识别方法、装置、计算机可读存储介质和计算机设备
Gao et al. The labeled multiple canonical correlation analysis for information fusion
US20050192805A1 (en) Voice analysis device, voice analysis method and voice analysis program
JP2002328695A (ja) テキストからパーソナライズ化音声を生成する方法
Parekh et al. Weakly supervised representation learning for audio-visual scene analysis
US20220156552A1 (en) Data conversion learning device, data conversion device, method, and program
US6131089A (en) Pattern classifier with training system and methods of operation therefor
CN111128178A (zh) 一种基于面部表情分析的语音识别方法
JPH0981730A (ja) パターン認識方法及び装置及びコンピュータ制御装置
US5864807A (en) Method and apparatus for training a speaker recognition system
CN111488486B (zh) 一种基于多音源分离的电子音乐分类方法及系统
CN111785284A (zh) 基于音素辅助的文本无关声纹识别方法、装置以及设备
JPH11119795A (ja) 特徴量の濃縮合成方法、及び特徴量の濃縮合成装置
Lee A system for automatic chord transcription from audio using genre-specific hidden Markov models
CN113870896A (zh) 基于时频图和卷积神经网络的运动声音判假方法、装置
Blaszke et al. Real and Virtual Instruments in Machine Learning–Training and Comparison of Classification Results
JP2757356B2 (ja) 単語音声認識方法および装置
CN111539490B (zh) 一种业务模型训练方法和装置
Nguyen et al. Improving mix-and-separate training in audio-visual sound source separation with an object prior
US7818172B2 (en) Voice recognition method and system based on the contexual modeling of voice units
Pentari et al. Graph-based representations of speech signals: A novel approach for emotion recognition