JP6620882B2 - ドメイン適応を用いたパターン認識装置、方法およびプログラム - Google Patents
ドメイン適応を用いたパターン認識装置、方法およびプログラム Download PDFInfo
- Publication number
- JP6620882B2 JP6620882B2 JP2018507663A JP2018507663A JP6620882B2 JP 6620882 B2 JP6620882 B2 JP 6620882B2 JP 2018507663 A JP2018507663 A JP 2018507663A JP 2018507663 A JP2018507663 A JP 2018507663A JP 6620882 B2 JP6620882 B2 JP 6620882B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- domain
- plda
- parameter
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006978 adaptation Effects 0.000 title claims description 43
- 238000000034 method Methods 0.000 title claims description 31
- 238000003909 pattern recognition Methods 0.000 title claims description 29
- 238000006243 chemical reaction Methods 0.000 claims description 109
- 238000012360 testing method Methods 0.000 claims description 44
- 230000009466 transformation Effects 0.000 claims description 34
- 238000004458 analytical method Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 14
- 238000012567 pattern recognition method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 description 27
- 230000006870 function Effects 0.000 description 25
- 238000011156 evaluation Methods 0.000 description 16
- 238000011161 development Methods 0.000 description 15
- 238000007476 Maximum Likelihood Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 239000000284 extract Substances 0.000 description 9
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000013459 approach Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 102100021337 Gap junction alpha-1 protein Human genes 0.000 description 1
- 101000894966 Homo sapiens Gap junction alpha-1 protein Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000000216 zygoma Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2134—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
- G06F18/21347—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis using domain transformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Description
と、クラス間のばらつき
とが得られた後、線形結合部105は、PLDAパラメータの2つのセットを、
となるように結合し、適応されたPLDAパラメータ106を生成する。ここで、
は、INDデータがどの程度、寄与するかを定めるための重み係数である。評価フェーズでは、PLDA分類部107は、登録データとテストデータからそれぞれ抽出された特徴の、与えられたペアに対するスコアを計算する。この方法では、PLDAパラメータ
は、
に偏るので、OODがINDに近い場合にのみ作用する。しかし、常にそうなるとは限らない。OODがINDから離れている場合に、結合されたPLDAパラメータが正しいパラメータに近いとは限らない。さらに、重み係数
を推定するために、追加の学習データが必要となる。そのため、ドメインのミスマッチを補償できない。図9は、OODデータとINDデータによって学習されたPLDAパラメータの2つのセットに基づく線形結合を用いたパラメータ適応という関連技術1のブロック図である。
それらは、しばしば、OODがINDに近いという非現実的な仮定を置く。そのため、データが近いドメイン内にない多くの実際のアプリケーションでは、PLDAパラメータの適応は、適応されたPLDAパラメータ
が、OODの
に偏るので、特定の用途がない。さらに、追加の重み係数を学習するために、追加のデータおよび学習が必要になる。そして、OODデータとINDデータの間のアフィン変換のような明確な関係がない。しばしば、最尤(ML)や最小距離等のような、システムパラメータを最適化するための2以上の基準が存在する。従って、包括的な最適化に到達することができない。
また、本発明によるドメイン適応を用いたパターン認識装置は、第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する推定部を備え、第1ドメインデータおよび第2ドメインデータの一方の特徴を、変換パラメータを用いて、他方のドメインに変換する特徴変換部と、テストデータが登録データと同じクラスに属するかどうかを、PLDAパラメータを用いて分類する分類部とを、さらに備えることを特徴とする。
また、本発明によるドメイン適応を用いたパターン認識装置は、第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する推定部を備え、PLDAパラメータが、第1ドメインデータの特徴から推定され、PLDAパラメータおよび変換パラメータが目的関数を最大化/最小化するように、PLDAパラメータを用いて、変換パラメータが、第2ドメインデータから推定されることを特徴とする。
また、本発明によるドメイン適応を用いたパターン認識方法は、第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定し、第1ドメインデータおよび第2ドメインデータの一方の特徴を、変換パラメータを用いて、他方のドメインに変換し、テストデータが登録データと同じクラスに属するかどうかを、PLDAパラメータを用いて分類することを特徴とする。
また、本発明によるドメイン適応を用いたパターン認識方法は、第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定し、PLDAパラメータと変換パラメータとを推定するときに、PLDAパラメータを、第1ドメインデータの特徴から推定し、PLDAパラメータおよび変換パラメータが目的関数を最大化/最小化するように、PLDAパラメータを用いて、変換パラメータを、第2ドメインデータから推定することを特徴とする。
また、本発明によるドメイン適応を用いたパターン認識プログラムは、コンピュータに、第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する推定処理を実行させ、さらに、第1ドメインデータおよび第2ドメインデータの一方の特徴を、変換パラメータを用いて、他方のドメインに変換する処理、および、テストデータが登録データと同じクラスに属するかどうかを、PLDAパラメータを用いて分類する処理を実行させることを特徴とする。
また、本発明によるドメイン適応を用いたパターン認識プログラムは、コンピュータに、第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する推定処理を実行させ、推定処理で、PLDAパラメータを、第1ドメインデータの特徴から推定させ、PLDAパラメータおよび変換パラメータが目的関数を最大化/最小化するように、PLDAパラメータを用いて、変換パラメータを、第2ドメインデータから推定させることを特徴とする。
図4は、本発明の第1の実施形態のブロック図である。本発明の第1の実施形態は、シングルステップのドメイン適応を示す。第1の実施形態は、PLDAパラメータと変換パラメータを同じステップで推定する。図4によれば、ドメイン適応を用いたパターン認識装置は、特徴抽出部303と、パラメータ推定部304と、PLDAパラメータ305の記憶装置と、変換パラメータ306の記憶装置と、特徴変換部307と、PLDA分類部308とを備える。
がドメインに依存していて、元ドメインの(OODからの)共分散
と、目標ドメインの(INDからの)共分散
とが異なるという仮定に基づいている。さらに、目標ドメインの特徴
は、元ドメイン
に変換され得るということを仮定し、ここで、この変換は、アフィン変換
を適用することによって行われ、また、元ドメインにおいて、
と
が同じ共分散と平均
を共有することとなるように、変換が行われると仮定する。ここで
は、IND(目標ドメイン)を表し、
は、OOD(元ドメイン)を表し、
は、元ドメイン内の変換されたINDであり、
と称する。そのため、目標ドメイン内のPLDAパラメータは、
である。
を同時に最適化(304)するために、本発明は、INDデータとOODデータ内の全ての観測の尤度を最大化してよい(図4)。与えられた
OOD学習パターンと、
IND学習パターンは、
と
のそれぞれのクラスに分離され、対数尤度は、
となる。ここで、
は、同じクラスに属する
または
のパターンのセットの結合確率分布である。
と、変換パラメータ
を更新するための補助関数は、
である。以下の表現で、全ての
と、
は、元ドメイン
内のパラメータと、
を表す。
E−ステップ
隠れ変数
の事後確率が、ベイズの定理
を使って計算される。ここで、
である。
M−ステップ
各パラメータに関連する
の微分係数をゼロに設定することによって、以下の式によって解が得られる。
は、PLDAパラメータ305として記憶され、
は、変換パラメータ306として記憶される。
図5は、本発明の第2の実施形態のブロック図である。本発明の第2の実施形態は、2ステップのドメイン適応学習を示す。本発明の第2の実施形態は、PLDAパラメータ推定と変換パラメータ推定の2つの学習ループを示す(図2を参照)。図5によれば、ドメイン適応を用いたパターン認識装置は、特徴抽出部403と、推定部411と、PLDAパラメータ405の記憶装置と、変換パラメータ407の記憶装置と、特徴変換部408と、PLDA分類部409とを備える。推定部411は、PLDAパラメータ推定部404と、変換パラメータ推定部406とを備える。
S. Ioffe, “Probabilistic linear discriminant analysis”, In European Conference on Computer Vision, 2006
がドメインに依存し、目標ドメインの特徴
は、元ドメイン
に変換され得ることという同じ仮定を、第1の実施形態と共有する。ここで、この変換は、アフィン変換
を適用することによって行われると仮定する。図5と図2を用いて述べたように、本実施形態は、OODデータを用いてPLDAパラメータを最適化し(404)、INDデータを用いて変換パラメータ
を最適化する(406)。そして、特徴変換部408は、全ての評価データを元ドメイン内に変換し、PLDA分類部409は、変換された特徴に適用される。変換パラメータ
の推定(406)において、元ドメインの共分散
と、平均
が与えられる(405)。ML基準では、各パラメータに関連する
の微分係数をゼロに設定することによって、以下の式からパラメータが推定される。
ここで、
は、クラスの数であり、
は、目標ドメイン内の観測の数である。
データセットをOODデータセットに加えることによって、共分散を更新し続けることができる。これらのステップを繰り返すことによって、マージされたドメインのための変換パラメータとPLDAを最適化することができる。
図6は、本発明の第3の実施形態のブロック図である。第3の実施形態は、ディベロップメントデータに変換を適用するもう一つの形態である。図6によれば、ドメイン適応を用いたパターン認識装置は、特徴抽出部503と、パラメータ推定部504と、PLDAパラメータ505の記憶装置と、変換パラメータ506の記憶装置と、特徴変換部507と、PLDA分類部508とを備える。
図7は、本発明の第4の実施形態のブロック図である。第4の実施形態は、シングルステップの教師なしドメイン適応学習を示す。図7によれば、ドメイン適応を用いたパターン認識装置は、特徴抽出部603と、クラスタリング部604と、パラメータ推定部605と、PLDAパラメータ606の記憶装置と、変換パラメータ607の記憶装置と、特徴変換部608と、PLDA分類部609とを備える。
S.J.D. Prince, J.H. Elder, “Probabilistic linear discriminant analysis for inferences about identity”, In IEEE International Conference on Computer Vision, 2007
P. Kenny, “Bayesian speaker verification with heavy-tailed priors”, in Proc. Odyssey- The Speaker and Language Recognition Workshop, 2010
第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する推定部を備える
ことを特徴とする、ドメイン適応を用いたパターン認識装置。
一方のドメインで観測された登録データおよびテストデータの特徴を、変換パラメータを用いて、他方のドメインに変換する特徴変換部と、
テストデータが登録データと同じクラスに属するかどうかを、PLDAパラメータを用いて分類する分類部とを、さらに備える
付記1に記載のパターン認識装置。
第1ドメインデータおよび第2ドメインデータの一方の特徴を、変換パラメータを用いて、他方のドメインに変換する特徴変換部と、
テストデータが登録データと同じクラスに属するかどうかを、PLDAパラメータを用いて分類する分類部とを、さらに備える
付記1に記載のパターン認識装置。
PLDAパラメータが、第1ドメインデータの特徴から推定され、PLDAパラメータおよび変換パラメータが目的関数を最大化/最小化するように、PLDAパラメータを用いて、変換パラメータが、第2ドメインデータから推定される
付記1に記載のパターン認識装置。
複数のテストデータの特徴が、複数のテストデータのそれぞれが登録データと同じクラスに属するかどうかで分類され、登録データに最も類似するテストデータが選択される
付記2または付記3に記載のパターン認識装置。
同じクラスからのデータのペアのそれぞれが同じクラスタに割り当てられ、異なるクラスからのデータのペアのそれぞれが異なるクラスタに割り当てられるように、第1ドメインデータおよび第2ドメインデータの一方を、クラスタリングするクラスタリング部をさらに備え、PLDAパラメータおよび変換パラメータは、クラスタの情報を用いて推定される
付記1に記載のパターン認識装置。
目的関数は、PLDAと変換パラメータの尤度、事後確率、ベイズ確率のうちの少なくとも1つである
付記1に記載のパターン認識装置。
PLDAパラメータと変換パラメータは、目的関数から導出される補助関数に従って、反復的に更新される
付記7に記載のパターン認識装置。
特徴変換は、第1ドメインデータと第2ドメインデータの間のアフィン変換として表される
付記1または付記4に記載のパターン認識装置。
第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する
ことを特徴とする、ドメイン適応を用いたパターン認識方法。
コンピュータに、
第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する推定処理
を実行させるための、ドメイン適応を用いたパターン認識プログラム。
304,504,605 パラメータ推定部
307,408,507,608 特徴変換部
308,409,508,609 PLDA分類部
404 PLDAパラメータ推定部
406 変換パラメータ推定部
Claims (10)
- 第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する推定部を備え、
一方のドメインで観測された登録データおよびテストデータの特徴を、変換パラメータを用いて、他方のドメインに変換する特徴変換部と、
テストデータが登録データと同じクラスに属するかどうかを、PLDAパラメータを用いて分類する分類部とを、さらに備える
ことを特徴とする、ドメイン適応を用いたパターン認識装置。 - 第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する推定部を備え、
第1ドメインデータおよび第2ドメインデータの一方の特徴を、変換パラメータを用いて、他方のドメインに変換する特徴変換部と、
テストデータが登録データと同じクラスに属するかどうかを、PLDAパラメータを用いて分類する分類部とを、さらに備える
ことを特徴とする、ドメイン適応を用いたパターン認識装置。 - 第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する推定部を備え、
PLDAパラメータが、第1ドメインデータの特徴から推定され、PLDAパラメータおよび変換パラメータが目的関数を最大化/最小化するように、PLDAパラメータを用いて、変換パラメータが、第2ドメインデータから推定される
ことを特徴とする、ドメイン適応を用いたパターン認識装置。 - 複数のテストデータの特徴が、複数のテストデータのそれぞれが登録データと同じクラスに属するかどうかで分類され、登録データに最も類似するテストデータが選択される
請求項1または請求項2に記載のパターン認識装置。 - 第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定し、
一方のドメインで観測された登録データおよびテストデータの特徴を、変換パラメータを用いて、他方のドメインに変換し、
テストデータが登録データと同じクラスに属するかどうかを、PLDAパラメータを用いて分類する
ことを特徴とする、ドメイン適応を用いたパターン認識方法。 - 第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定し、
第1ドメインデータおよび第2ドメインデータの一方の特徴を、変換パラメータを用いて、他方のドメインに変換し、
テストデータが登録データと同じクラスに属するかどうかを、PLDAパラメータを用いて分類する
ことを特徴とする、ドメイン適応を用いたパターン認識方法。 - 第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定し、
PLDAパラメータと変換パラメータとを推定するときに、PLDAパラメータを、第1ドメインデータの特徴から推定し、PLDAパラメータおよび変換パラメータが目的関数を最大化/最小化するように、PLDAパラメータを用いて、変換パラメータを、第2ドメインデータから推定する
ことを特徴とする、ドメイン適応を用いたパターン認識方法。 - コンピュータに、
第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する推定処理を実行させ、
さらに、
一方のドメインで観測された登録データおよびテストデータの特徴を、変換パラメータを用いて、他方のドメインに変換する処理、および、
テストデータが登録データと同じクラスに属するかどうかを、PLDAパラメータを用いて分類する処理
を実行させるための、ドメイン適応を用いたパターン認識プログラム。 - コンピュータに、
第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する推定処理を実行させ、
さらに、
第1ドメインデータおよび第2ドメインデータの一方の特徴を、変換パラメータを用いて、他方のドメインに変換する処理、および、
テストデータが登録データと同じクラスに属するかどうかを、PLDAパラメータを用いて分類する処理
を実行させるための、ドメイン適応を用いたパターン認識プログラム。 - コンピュータに、
第1ドメインデータと第2ドメインデータの特徴から、その特徴に関する目的関数を最大化/最小化するように、PLDA(Probabilistic Linear Discriminant Analysis)パラメータと変換パラメータとを推定する推定処理を実行させ、
推定処理で、PLDAパラメータを、第1ドメインデータの特徴から推定させ、PLDAパラメータおよび変換パラメータが目的関数を最大化/最小化するように、PLDAパラメータを用いて、変換パラメータを、第2ドメインデータから推定させる
ための、ドメイン適応を用いたパターン認識プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/004716 WO2017046828A1 (en) | 2015-09-16 | 2015-09-16 | Pattern recognition apparatus, method, and program using domain adaptation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018529157A JP2018529157A (ja) | 2018-10-04 |
JP6620882B2 true JP6620882B2 (ja) | 2019-12-18 |
Family
ID=54330828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018507663A Active JP6620882B2 (ja) | 2015-09-16 | 2015-09-16 | ドメイン適応を用いたパターン認識装置、方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10614343B2 (ja) |
JP (1) | JP6620882B2 (ja) |
WO (1) | WO2017046828A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6867276B2 (ja) * | 2017-12-04 | 2021-04-28 | 日本電信電話株式会社 | モデル学習装置、モデル学習方法、および、予測システム |
WO2020084727A1 (en) * | 2018-10-25 | 2020-04-30 | Nec Corporation | Unsupervised model adaptation apparatus, method, and program |
KR102366777B1 (ko) * | 2019-04-01 | 2022-02-24 | 한국전자통신연구원 | 도메인 적응 기반 객체 인식 장치 및 그 방법 |
JP7207532B2 (ja) * | 2019-05-17 | 2023-01-18 | 日本電信電話株式会社 | 学習装置、学習方法及び予測システム |
JP7353940B2 (ja) * | 2019-11-26 | 2023-10-02 | 株式会社日立製作所 | 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム |
CN113129900A (zh) * | 2021-04-29 | 2021-07-16 | 科大讯飞股份有限公司 | 一种声纹提取模型构建方法、声纹识别方法及其相关设备 |
WO2023192179A1 (en) * | 2022-03-27 | 2023-10-05 | Ohio State Innovation Foundation | Venc design and velocity estimation for phase contrast mri |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9865266B2 (en) * | 2013-02-25 | 2018-01-09 | Nuance Communications, Inc. | Method and apparatus for automated speaker parameters adaptation in a deployed speaker verification system |
US9792899B2 (en) * | 2014-07-15 | 2017-10-17 | International Business Machines Corporation | Dataset shift compensation in machine learning |
-
2015
- 2015-09-16 US US15/759,302 patent/US10614343B2/en active Active
- 2015-09-16 WO PCT/JP2015/004716 patent/WO2017046828A1/en active Application Filing
- 2015-09-16 JP JP2018507663A patent/JP6620882B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018529157A (ja) | 2018-10-04 |
WO2017046828A1 (en) | 2017-03-23 |
US20180253628A1 (en) | 2018-09-06 |
US10614343B2 (en) | 2020-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6620882B2 (ja) | ドメイン適応を用いたパターン認識装置、方法およびプログラム | |
CN110797021B (zh) | 混合语音识别网络训练方法、混合语音识别方法、装置及存储介质 | |
Wen et al. | Face reconstruction from voice using generative adversarial networks | |
Tsagkatakis et al. | Online distance metric learning for object tracking | |
US8873798B2 (en) | Methods for tracking objects using random projections, distance learning and a hybrid template library and apparatuses thereof | |
WO2020003533A1 (en) | Pattern recognition apparatus, pattern recognition method, and computer-readable recording medium | |
Zhou et al. | A compact representation of visual speech data using latent variables | |
CN113326731B (zh) | 一种基于动量网络指导的跨域行人重识别方法 | |
US9697614B2 (en) | Method for segmenting and tracking content in videos using low-dimensional subspaces and sparse vectors | |
Kumar et al. | Indian classical dance classification with adaboost multiclass classifier on multifeature fusion | |
CN114241569B (zh) | 人脸识别攻击样本的生成方法、模型训练方法及相关设备 | |
JP6821615B2 (ja) | マスク推定装置、モデル学習装置、音源分離装置、マスク推定方法、モデル学習方法、音源分離方法及びプログラム | |
JP6597914B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
CN108564061B (zh) | 一种基于二维主元分析的图像识别方法和系统 | |
JP2018194828A (ja) | マルチビューベクトルの処理方法及び装置 | |
CN116868206A (zh) | 跨域自适应学习 | |
JP4348202B2 (ja) | 顔画像認識装置及び顔画像認識プログラム | |
Xu et al. | Graphical modeling for multi-source domain adaptation | |
Kumar et al. | Normalizing flow based feature synthesis for outlier-aware object detection | |
Zhu et al. | Multiview latent space learning with progressively fine-tuned deep features for unsupervised domain adaptation | |
Liu et al. | Lip event detection using oriented histograms of regional optical flow and low rank affinity pursuit | |
CN109165587B (zh) | 智能图像信息抽取方法 | |
CN109165586B (zh) | 用于ai芯片的智能图像处理方法 | |
JP2007249394A (ja) | 顔画像認識装置及び顔画像認識プログラム | |
Haddad et al. | A statistical framework for few-shot action recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190516 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191023 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6620882 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |