JP6636374B2 - 登録発話分割装置、話者らしさ評価装置、話者識別装置、登録発話分割方法、話者らしさ評価方法、プログラム - Google Patents
登録発話分割装置、話者らしさ評価装置、話者識別装置、登録発話分割方法、話者らしさ評価方法、プログラム Download PDFInfo
- Publication number
- JP6636374B2 JP6636374B2 JP2016076605A JP2016076605A JP6636374B2 JP 6636374 B2 JP6636374 B2 JP 6636374B2 JP 2016076605 A JP2016076605 A JP 2016076605A JP 2016076605 A JP2016076605 A JP 2016076605A JP 6636374 B2 JP6636374 B2 JP 6636374B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- registered
- speaker
- divided
- registered utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
話者特徴ベクトルには、発話長が長くなるほど話者情報が強く表れるという性質以外に、話者情報だけでなく発話に含まれる言葉の情報にも依存するという性質もあることが知られている。この性質から、同程度の発話長でも発話に含まれる言葉が異なるほど話者特徴ベクトルの類似度が低下する傾向にある。例えば「おとな」と「おとこ」という発話の話者特徴ベクトルの類似度は高く、「おとな」と「こども」という発話の話者特徴ベクトルの類似度は低くなりやすいという傾向がある。
以下、図1〜図4を参照して実施形態1の話者識別装置100について説明する。図1は、話者識別装置100の構成を示すブロック図である。図2は、話者識別装置100の動作を示すフローチャートである。図3は、話者識別装置100による話者類似度計算の様子を示す図である。図4は、話者識別装置100による話者類似度の例を示す図である。図1に示すように、話者識別装置100は、発話分割部110と、音響分析部820−1と、話者特徴ベクトル算出部830−1と、話者登録部840と、登録発話記録部803と、音響分析部820−2と、話者特徴ベクトル算出部830−2と、ベクトル類似度計算部850と、話者類似度計算部160と、話者識別部870を含む。話者識別装置100は、UBMモデル記録部801と、話者特徴量抽出モデル記録部802とに接続している。
1.登録発話の音声を短時間ごと(認識発話と同程度の長さが好ましい)に分割し、分割後の各音声(分割済登録発話という)に対して話者特徴ベクトルを算出する(S110、S820−1、S830−1)。
2.話者特徴ベクトルと登録発話の話者名を組にして登録発話データベースに登録する(S840)。
1.認識発話の音声に対して話者特徴ベクトルを算出する(S820−2、S830−2)。
2.認識発話の話者特徴ベクトルと各分割済登録発話の話者特徴ベクトルとのベクトル類似度を計算する(S850)。
3.2.で求めた類似度を話者ごとに平均化し、話者類似度を計算する(S160)。
4.話者類似度の最大値に対応する話者名を認識発話の話者、つまり識別結果として返す(S870)。
入力:登録発話
出力:分割済登録発話
登録発話集合の各登録発話を短時間ごとに分割し、分割済登録発話を生成する(S110)。分割済登録発話は、登録発話の一部を切り出す形で生成される。分割時、区間の重複は許すものとする。つまり、図3にあるように分割済登録発話の音声には重なりがある。分割時の窓幅は、話者識別の利用時に想定される認識発話と同程度となるようにし、例えば1.5秒とする。シフト幅は例えば0.5秒とする。
入力:分割済登録発話、認識発話
出力:音響特徴量ベクトル系列
各発話から音響特徴量ベクトル系列を算出する(S820−1、S820−2)。算出した音響特徴量ベクトル系列をそれぞれ分割済登録発話音響特徴量ベクトル系列、認識発話音響特徴量ベクトル系列という。
(参考非特許文献2:鹿野清宏、伊藤克亘、河原達也、武田一哉、山本幹雄、“IT Text 音声認識システム”、pp.13-14、オーム社、2001)
入力:音響特徴量ベクトル系列、UBMモデル、話者特徴量抽出モデル
出力:話者特徴ベクトル
各音響特徴量ベクトルからUBMモデル、話者特徴量抽出モデルを用いて話者特徴ベクトルを算出する(S830−1、S830−2)。算出した話者特徴ベクトルをそれぞれ分割済登録発話話者特徴ベクトル、認識発話話者特徴ベクトルという。話者特徴ベクトルとして、話者識別装置800と同じく、i−vectorを用いる。
入力:分割済登録発話話者特徴ベクトル、話者名
出力先:登録発話データベース
分割済登録発話話者特徴ベクトルとそれに対応する話者名(分割元となった登録発話の話者名)を組とし、登録発話記録部803の登録発話データベースへ追加する(S840)。話者名は、先述の通り、人手で与えるものとする。つまり、登録発話データベースには登録発話集合の各登録発話に対して1つ以上の分割済登録発話話者特徴ベクトルが登録されることとなる。
入力:認識発話話者特徴ベクトル、分割済登録発話話者特徴ベクトル、話者名
出力:類似度、話者名
認識発話話者特徴ベクトルと登録発話データベースに含まれるすべての分割済登録発話話者特徴ベクトルとの類似度を計算する(S850)。類似度は非特許文献1のコサイン類似度とする。計算した類似度は、分割済登録発話話者特徴ベクトルに対応する話者名と組にして出力される。
(参考非特許文献3:A. O. Hatch, S. Kajarekar, A. Stolcke, “Within-Class Covariance Normalization for SVM-based Speaker Recognition”, Proc. Interspeech 2006, pp.1471-1474, 2006.)
入力:類似度、話者名
出力:話者類似度、話者名
類似度を話者ごとに平均化し、話者類似度を求める(S160)。計算した話者類似度は、分割済登録発話話者特徴ベクトルに対応する話者名と組にして出力される。話者ごとの平均をとるために、例えば、分割元を同じくする分割済登録発話話者特徴ベクトルとの類似度の範囲で平均をとるなどすればよい。また、同一話者による複数の登録発話が話者識別装置100に入力され、当該登録発話から算出される分割済登録発話話者特徴ベクトルが登録データベースに登録されている場合は、同一の話者名と組になっているこれらの分割済登録発話話者特徴ベクトルのすべてあるいは一部を用いて話者類似度を求めるようにしてもよい。
入力:話者類似度、話者名
出力:話者名
話者類似度のうち、最大となる類似度に対応する話者名(つまり、分割元となった登録発話の話者名)を選択、識別結果として返す(S870)。
入力:分割済登録発話、UBMモデル、話者特徴量抽出モデル
出力:分割済登録発話話者特徴ベクトル
分割済登録発話から、UBMモデルと話者特徴量抽出モデルを用いて分割済登録発話話者特徴ベクトルを算出する(S820−1、S830−1)。
入力:認識発話、UBMモデル、話者特徴量抽出モデル
出力:認識発話話者特徴ベクトル
認識発話から、UBMモデルと話者特徴量抽出モデルを用いて認識発話話者特徴ベクトルを算出する(S820−2、S830−2)。
実施形態2では、実施形態1の話者識別装置での処理に加えて、閾値を用いた登録外話者判定処理(閾値処理)を行う。認識発話の話者が登録発話データベースにいる場合(閾値処理の結果、所定の要件を満たすと判断される場合)は実施形態1の話者識別装置での処理結果である話者名を識別結果として出力し、認識発話の話者が登録発話データベースにない場合(閾値処理の結果、所定の要件を満たされないと判断される場合)は登録外話者と判定する。ここで、登録外話者とは、登録発話データベースに話者名が登録されていない話者をいう。
入力:話者類似度、話者名
出力:話者類似度の最大値に対応する話者名、話者類似度の最大値
最大となる話者類似度に対応する話者名を選択、選択した話者名に対応する話者類似度(つまり、話者類似度の最大値)を出力する(S875)。話者識別部870では話者類似度の最大値に対応する話者名のみを出力したが、話者識別部875では話者類似度の最大値もあわせて出力する。
入力:話者類似度の最大値に対応する話者名、話者類似度の最大値、閾値
出力:識別結果
認識発話の話者が登録外話者かを判定し、認識発話の話者が登録発話データベースにいる場合は話者名を、認識発話の話者が登録発話データベースにない場合は登録外話者である旨を識別結果として出力する(S210)。登録外話者の判定は、話者類似度の最大値の閾値処理により実現する。閾値は事前に設定されているものとする。
実施形態1では、図3に示すように、登録発話が認識発話に対して長い場合、登録発話を分割し、認識発話と同程度の発話長の分割済登録発話を生成することで発話長の差の影響を低減する。また、“ベクトル類似度が言葉の影響を受けるものの、同一話者であれば平均的には高く、別話者であれば平均的には低くなる”という性質を利用し、登録発話の分割済登録発話と認識発話とのベクトル類似度の話者ごとの平均を話者類似度とみなすことで、言葉の類似性の影響を低減する(図4参照)。登録発話の分割とベクトル類似度の平均化により、話者認識精度の向上が期待できる。
実施形態3の発明では、実施形態1のように登録発話を窓掛けして分割発話を生成する方法とは異なり、登録発話を分割済登録発話よりも短い微小区間であるセグメントに分割し、セグメントを無作為に組み合わせて分割済登録発話を生成する点にある。窓掛けによる分割に比べ、様々な言葉を含む発話をより多く生成することが可能となる。
1.登録発話をセグメント単位に分割する(S310)。
2.登録発話のセグメントを所定の長さになるまで無作為に組み合わせ、分割済登録発話を生成する(S320)。この際、1つの登録発話から十分な数の分割済登録発話を生成する。
3.分割済登録発話に対して話者特徴ベクトルを算出する(S820−1、S830−1)。
4.話者特徴ベクトルと登録発話の話者名を組にして登録発話データベースに登録する(S840)。
1.認識発話から話者特徴ベクトルを算出する(S820−2、S830−2)。
2.認識発話の話者特徴ベクトルと分割済登録発話の話者特徴ベクトルのベクトル類似度をそれぞれ計算する(S850)。
3.2.で求めたベクトル類似度を話者ごとに平均化し、話者類似度を算出する(S160)。
4.話者類似度の最大値に対応する話者名を識別結果として返す(S870)。
入力:登録発話
出力:登録発話セグメント
登録発話を分割し、登録発話セグメントを生成する(S310)。
入力:登録発話セグメント
出力:分割済登録発話
登録発話セグメントを組み合わせ、分割済登録発話を生成する(S320)。
以下では、登録発話から分割済登録発話を生成する登録発話分割装置の変形例について説明する。実施形態3における登録発話分割装置は、セグメント分割部310と分割済発話生成部320で構成される。また、実施形態1における登録発話分割装置は、発話分割部110のみで構成される。
実施形態3の発明の効果を確かめるために、実施形態1の発明との比較実験を行った。以下、その概要(実験手順、実験条件、各実施形態の手法の補足情報)と結果について説明する。
1.音声コーパスをWCCN学習セットと評価セットに分割する。
2.評価セットから複数の発話を選択し、当該複数の発話を結合した後、先頭から切り出すことにより、一定長の登録発話を作成する。
3.評価セットのうち登録発話の作成に利用しなかった発話を用いて、先頭から切り出し、一定長の認識発話を作成する。
4.認識発話ごとに話者識別を行い、正解精度を算出する。
5.2〜4の処理を7回繰り返し、平均の正解精度を最終的な正解精度として算出する。
1.話者数は、男女各10名の計20名とする。
2.登録発話の内容は全話者で同一とする。
3.登録発話長は5秒、10秒、20秒であり、それぞれ1発話ずつとする。
4.認識発話長は0.5秒、1.0秒、1.5秒、2.0秒、2.5秒、3.0秒であり、計6発話用意する。
5.セグメント長は0.1秒、分割数は500個とする。なお、分割数とは生成した分割済登録発話の数のことである。
6.生成したUBM及びTV(全変動空間)は、512混合、200次元とする。
7.UBM及びTVの学習に用いた学習データは283名の34435発話を含む学習セットである。
1.分割済登録発話の長さは1.5秒とする。
2.実施形態1の分割で用いるシフト幅は0.5秒とする。
3.話者特徴ベクトル正規化行列Wの学習に用いる学習データには、WCCN学習セットの発話を分割したものと分割しないものを用いる。分割したものの長さ及びシフト幅はそれぞれ1.5秒、0.5秒とする。
4.ベクトル類似度の距離尺度としては、コサイン類似度を用いる。
1.実施形態にかかわらず、認識発話長が長くなるほど、正解精度が100%に近づいていく。
2.実施形態にかかわらず、登録発話長が長くなるほど、正解精度が100%に近づいていく。
3.登録発話長・認識発話長にかかわらず、実施形態3は実施形態1に比べて同等またはそれ以上の正解精度であり、特に登録発話長が短いほど精度向上が大きい。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
110 発話分割部
160 話者類似度計算部
200 話者識別装置
210 登録外話者判定部
300 話者識別装置
310 セグメント分割部
320 分割済登録発話生成部
400 登録発話分割装置
405 登録発話分割装置
430 登録発話長判定部
801 UBMモデル記録部
802 話者特徴量抽出モデル記録部
803 登録発話記録部
820 音響分析部
830 話者特徴ベクトル算出部
840 話者登録部
850 ベクトル類似度計算部
870 話者識別部
875 話者識別部
1001 分割済登録発話話者特徴ベクトル算出部
1002 認識発話話者特徴ベクトル算出部
Claims (8)
- 話者認識の対象となる話者の発話音声を認識発話、前記話者を認識するために用いる発話音声を登録発話とし、
前記登録発話から、当該登録発話の長さより短く、認識発話と同程度の長さになるように分割済登録発話を生成する登録発話分割装置であって、
前記登録発話から、前記分割済登録発話の長さより短い登録発話セグメントを生成するセグメント分割部と、
前記登録発話セグメントを前記分割済登録発話の長さと等しくなるよう組み合わせることにより前記分割済登録発話を生成する分割済登録発話生成部と
を含む登録発話分割装置。 - 話者認識の対象となる話者の発話音声を認識発話、前記話者を認識するために用いる発話音声を登録発話とし、
前記登録発話から、当該登録発話の長さより短く、認識発話と同程度の長さになるように分割済登録発話を生成する登録発話分割装置であって、
前記登録発話から、当該登録発話の一部を切り出すことにより前記分割済登録発話を生成する発話分割部と、
前記登録発話の長さが短いことを示す所定の範囲にあるか否かを判定する登録発話長判定部と、
前記登録発話の長さが短いことを示す所定の範囲にある場合に、前記登録発話から、前記分割済登録発話の長さより短い登録発話セグメントを生成するセグメント分割部と、
前記登録発話セグメントを前記分割済登録発話の長さと等しくなるよう組み合わせることにより前記分割済登録発話を生成する分割済登録発話生成部と
を含む登録発話分割装置。 - 話者認識の対象となる話者の発話音声を認識発話、前記話者を認識するために用いる発話音声を登録発話とし、
前記登録発話から、当該登録発話の一部を切り出すことにより、当該登録発話の長さより短く、認識発話と同程度の長さになるように分割済登録発話を生成する発話分割部と、
前記登録発話から、前記分割済登録発話の長さより短い登録発話セグメントを生成するセグメント分割部と、
前記登録発話セグメントを前記分割済登録発話の長さと等しくなるよう組み合わせることにより前記分割済登録発話を生成する分割済登録発話生成部と、
前記分割済登録発話から、分割済登録発話話者特徴ベクトルを生成する分割済登録発話話者特徴ベクトル算出部と、
前記認識発話から、認識発話話者特徴ベクトルを生成する認識発話話者特徴ベクトル算出部と、
前記分割済登録発話話者特徴ベクトルと前記認識発話話者特徴ベクトルの類似度を計算するベクトル類似度計算部と
を含む話者らしさ評価装置。 - 請求項3に記載の話者らしさ評価装置であって、
前記発話分割部及び前記分割済登録発話生成部が生成する分割済登録発話の数は、2以上であり、
前記ベクトル類似度計算部は、前記2以上の分割済登録発話の各々に対して前記類似度を計算するものであり、
さらに、
前記類似度の平均値である話者類似度を計算する話者類似度計算部と
を含む話者らしさ評価装置。 - 話者認識の対象となる話者の発話音声を認識発話、前記話者を認識するために用いる発話音声を登録発話、前記登録発話を要素とする集合を登録発話集合とし、
前記登録発話集合の登録発話から、当該登録発話の一部を切り出すことにより、当該登録発話の長さより短く、認識発話と同程度の長さになるように分割済登録発話を生成する発話分割部と、
前記登録発話集合の登録発話から、前記分割済登録発話の長さより短い登録発話セグメントを生成するセグメント分割部と、
前記登録発話セグメントを前記分割済登録発話の長さと等しくなるよう組み合わせることにより前記分割済登録発話を生成する分割済登録発話生成部と、
前記分割済登録発話から、分割済登録発話話者特徴ベクトルを生成する分割済登録発話話者特徴ベクトル算出部と、
前記認識発話から、認識発話話者特徴ベクトルを生成する認識発話話者特徴ベクトル算出部と、
前記分割済登録発話話者特徴ベクトルと前記認識発話話者特徴ベクトルの類似度を計算するベクトル類似度計算部と
前記類似度の最大値に対応する登録発話の話者名を前記認識発話を識別した結果とする話者識別部と
を含む話者識別装置。 - 話者認識の対象となる話者の発話音声を認識発話、前記話者を認識するために用いる発話音声を登録発話とし、
セグメント分割部と、分割済登録発話生成部とを含む登録発話分割装置が、前記登録発話から、当該登録発話の長さより短く、認識発話と同程度の長さになるように分割済登録発話を生成する登録発話分割方法であって、
前記セグメント分割部が、前記登録発話から、前記分割済登録発話の長さより短い登録発話セグメントを生成するセグメント分割ステップと、
前記分割済登録発話生成部が、前記登録発話セグメントを前記分割済登録発話の長さと等しくなるよう組み合わせることにより前記分割済登録発話を生成する分割済登録発話生成ステップと
を含む登録発話分割方法。 - 話者認識の対象となる話者の発話音声を認識発話、前記話者を認識するために用いる発話音声を登録発話とし、
発話分割部と、セグメント分割部と、分割済登録発話生成部と、分割済登録発話話者特徴ベクトル算出部と、認識発話話者特徴ベクトル算出部と、ベクトル類似度計算部とを含む話者らしさ評価装置が、前記登録発話と前記認識発話の類似度を計算する話者らしさ評価方法であって、
前記発話分割部が、前記登録発話から、当該登録発話の一部を切り出すことにより、当該登録発話の長さより短く、認識発話と同程度の長さになるように分割済登録発話を生成する発話分割ステップと、
前記セグメント分割部が、前記登録発話から、前記分割済登録発話の長さより短い登録発話セグメントを生成するセグメント分割ステップと、
前記分割済登録発話生成部が、前記登録発話セグメントを前記分割済登録発話の長さと等しくなるよう組み合わせることにより前記分割済登録発話を生成する分割済登録発話生成ステップと、
前記分割済登録発話話者特徴ベクトル算出部が、前記分割済登録発話から、分割済登録発話話者特徴ベクトルを生成する分割済登録発話話者特徴ベクトル算出ステップと、
前記認識発話話者特徴ベクトル算出部が、前記認識発話から、認識発話話者特徴ベクトルを生成する認識発話話者特徴ベクトル算出ステップと、
前記ベクトル類似度計算部が、前記類似度として、前記分割済登録発話話者特徴ベクトルと前記認識発話話者特徴ベクトルの類似度を計算するベクトル類似度計算ステップと
を含む話者らしさ評価方法。 - 請求項1または2に記載の登録発話分割装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016076605A JP6636374B2 (ja) | 2016-04-06 | 2016-04-06 | 登録発話分割装置、話者らしさ評価装置、話者識別装置、登録発話分割方法、話者らしさ評価方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016076605A JP6636374B2 (ja) | 2016-04-06 | 2016-04-06 | 登録発話分割装置、話者らしさ評価装置、話者識別装置、登録発話分割方法、話者らしさ評価方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017187642A JP2017187642A (ja) | 2017-10-12 |
JP6636374B2 true JP6636374B2 (ja) | 2020-01-29 |
Family
ID=60045577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016076605A Active JP6636374B2 (ja) | 2016-04-06 | 2016-04-06 | 登録発話分割装置、話者らしさ評価装置、話者識別装置、登録発話分割方法、話者らしさ評価方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6636374B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102207291B1 (ko) * | 2019-03-29 | 2021-01-25 | 주식회사 공훈 | 교차 검증을 이용한 음성 인증 방법 및 장치 |
JP2023174185A (ja) * | 2022-05-27 | 2023-12-07 | パナソニックIpマネジメント株式会社 | 認証システムおよび認証方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2816163B2 (ja) * | 1988-01-20 | 1998-10-27 | 株式会社リコー | 話者照合方式 |
-
2016
- 2016-04-06 JP JP2016076605A patent/JP6636374B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017187642A (ja) | 2017-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6622505B2 (ja) | 音響モデル学習装置、音声合成装置、音響モデル学習方法、音声合成方法、プログラム | |
JP2017097188A (ja) | 話者らしさ評価装置、話者識別装置、話者照合装置、話者らしさ評価方法、プログラム | |
US20160379624A1 (en) | Recognition result output device, recognition result output method, and computer program product | |
JP6680933B2 (ja) | 音響モデル学習装置、音声合成装置、音響モデル学習方法、音声合成方法、プログラム | |
JP6553015B2 (ja) | 話者属性推定システム、学習装置、推定装置、話者属性推定方法、およびプログラム | |
KR20100130263A (ko) | 음성 인식용 발음사전 확장 장치 및 방법 | |
JP7160095B2 (ja) | 属性識別装置、属性識別方法、およびプログラム | |
JP6845489B2 (ja) | 音声処理装置、音声処理方法、および音声処理プログラム | |
JP6676009B2 (ja) | 話者判定装置、話者判定情報生成方法、プログラム | |
JP7409381B2 (ja) | 発話区間検出装置、発話区間検出方法、プログラム | |
JP6996570B2 (ja) | 緊急度推定装置、緊急度推定方法、プログラム | |
JP6631883B2 (ja) | クロスリンガル音声合成用モデル学習装置、クロスリンガル音声合成用モデル学習方法、プログラム | |
JP6276513B2 (ja) | 音声認識装置および音声認識プログラム | |
JP6636374B2 (ja) | 登録発話分割装置、話者らしさ評価装置、話者識別装置、登録発話分割方法、話者らしさ評価方法、プログラム | |
US11798578B2 (en) | Paralinguistic information estimation apparatus, paralinguistic information estimation method, and program | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム | |
JP6546070B2 (ja) | 音響モデル学習装置、音声認識装置、音響モデル学習方法、音声認識方法、およびプログラム | |
Nguyen et al. | Resident identification in smart home by voice biometrics | |
JP5427140B2 (ja) | 音声認識方法、音声認識装置及び音声認識プログラム | |
JP2009075249A (ja) | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム | |
JP7107377B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP2018132678A (ja) | ターンテイキングタイミング識別装置、ターンテイキングタイミング識別方法、プログラム、記録媒体 | |
US20220335927A1 (en) | Learning apparatus, estimation apparatus, methods and programs for the same | |
Xing et al. | Speaker verification normalization sequence kernel based on Gaussian mixture model super-vector and Bhattacharyya distance | |
JP5369079B2 (ja) | 音響モデル作成方法とその装置とプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190521 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190701 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6636374 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |