JPWO2022034630A5 - 音声処理装置、音声処理方法、プログラム、および音声認証システム - Google Patents

音声処理装置、音声処理方法、プログラム、および音声認証システム Download PDF

Info

Publication number
JPWO2022034630A5
JPWO2022034630A5 JP2022542518A JP2022542518A JPWO2022034630A5 JP WO2022034630 A5 JPWO2022034630 A5 JP WO2022034630A5 JP 2022542518 A JP2022542518 A JP 2022542518A JP 2022542518 A JP2022542518 A JP 2022542518A JP WO2022034630 A5 JPWO2022034630 A5 JP WO2022034630A5
Authority
JP
Japan
Prior art keywords
feature
phonemes
phoneme
speaker
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022542518A
Other languages
English (en)
Other versions
JPWO2022034630A1 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/JP2020/030542 external-priority patent/WO2022034630A1/ja
Publication of JPWO2022034630A1 publication Critical patent/JPWO2022034630A1/ja
Publication of JPWO2022034630A5 publication Critical patent/JPWO2022034630A5/ja
Pending legal-status Critical Current

Links

Claims (10)

  1. 音声データから、発話に係る特徴を示す音響特徴を抽出する音響特徴抽出手段と、
    前記音響特徴に基づいて、前記音声データに含まれる音素を識別する音素識別手段と、
    前記音響特徴、および、前記音声データに含まれる音素の識別結果を示す音素識別情報に基づいて、音素ごとの発話の特徴を示す第1の話者識別用特徴を生成する第1話者識別用特徴生成手段と、
    2つ以上の音素のそれぞれについての前記第1の話者識別用特徴を合成することにより、発話全体の特徴を示す第2の話者識別用特徴を生成する第2話者識別用特徴生成手段と
    を備えた音声処理装置。
  2. 前記音声データに含まれる音素のうちの2つ以上の音素を、所与の条件にしたがい選択する音素選択手段をさらに備え、
    前記第1話者識別用特徴生成手段は、前記音響特徴、前記音声データに含まれる2つ以上の音素の識別結果を示す音素識別情報、および、前記所与の条件にしたがい選択された2つ以上の音素を示す選択情報に基づいて、発話の特徴を示す話者識別用特徴を生成する
    ことを特徴とする請求項1に記載の音声処理装置。
  3. 前記音素選択手段は、前記音声データに含まれる音素のうち、登録された音声データに含まれる2つ以上の音素と同一の2つ以上の音素を選択する
    ことを特徴とする請求項2に記載の音声処理装置。
  4. 前記音素選択手段は、前記音声データに含まれる音素のうち、所定のテキストに含まれる2つ以上の文字と対応する2つ以上の音素を選択する
    ことを特徴とする請求項2に記載の音声処理装置。
  5. 前記第1話者識別用特徴生成手段は、
    前記音響特徴と、単一の音素から抽出された音素識別情報との組ごとに、前記第1の話者識別用特徴を生成し、
    前記第2話者識別用特徴生成手段は、
    複数の前記組について生成した前記第1の話者識別用特徴同士を加算することによって、前記発話全体の特徴を示す第2の話者識別用特徴を生成する
    ことを特徴とする請求項1から4のいずれか1項に記載の音声処理装置。
  6. 音声データから、発話に係る特徴を示す音響特徴を抽出する音響特徴抽出手段と、
    前記音響特徴に基づいて、前記音声データに含まれる音素を識別する音素識別手段と、
    前記音声データに含まれる音素のうち、所与の選択条件にしたがう音素を選択する音素選択手段と、
    前記音響特徴、前記音声データに含まれる音素の識別結果を示す音素識別情報、および、前記所与の条件にしたがい選択された音素を示す選択情報に基づいて、発話の特徴を示す話者識別用特徴を生成する話者識別用特徴生成手段と
    を備えた音声処理装置。
  7. 予め準備された所定のテキストのデータを取得するテキスト取得手段をさらに備え、
    前記音素選択手段は、前記音声データに含まれる音素のうち、前記所定のテキストに含まれる1つ以上の文字と対応する音素を選択する
    ことを特徴とする請求項6に記載の音声処理装置。
  8. 音声データから、発話に係る特徴を示す音響特徴を抽出し、
    前記音響特徴に基づいて、音声データに含まれる音素を識別し、
    前記音響特徴、および、前記音声データに含まれる音素の識別結果を示す音素識別情報に基づいて、音素ごとの発話の特徴を示す第1の話者識別用特徴を生成し、
    2つ以上の音素のそれぞれについての前記第1の話者識別用特徴を合成することにより、発話全体の特徴を示す第2の話者識別用特徴を生成する
    ことを含む音声処理方法。
  9. 音声データから、発話に係る特徴を示す音響特徴を抽出することと、
    前記音響特徴に基づいて、前記音声データに含まれる音素を識別することと、
    前記音響特徴、および、前記音声データに含まれる音素の識別結果を示す音素識別情報に基づいて、音素ごとの発話の特徴を示す第1の話者識別用特徴を生成することと、
    2つ以上の音素のそれぞれについての前記第1の話者識別用特徴を合成することにより、発話全体の特徴を示す第2の話者識別用特徴を生成することと
    をコンピュータに実行させるためのプログラム。
  10. 請求項1から5のいずれか1項に記載の音声処理装置と、
    前記音声処理装置が生成した前記第1の話者識別用特徴または前記第2の話者識別用特徴に基づいて、話者が登録済みの人物本人かどうかを確認する照合装置と
    を備えた音声認証システム。
JP2022542518A 2020-08-11 音声処理装置、音声処理方法、プログラム、および音声認証システム Pending JPWO2022034630A5 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/030542 WO2022034630A1 (ja) 2020-08-11 2020-08-11 音声処理装置、音声処理方法、記録媒体、および音声認証システム

Publications (2)

Publication Number Publication Date
JPWO2022034630A1 JPWO2022034630A1 (ja) 2022-02-17
JPWO2022034630A5 true JPWO2022034630A5 (ja) 2023-04-04

Family

ID=

Similar Documents

Publication Publication Date Title
US10339290B2 (en) Spoken pass-phrase suitability determination
JP4672003B2 (ja) 音声認証システム
JP6671356B2 (ja) 声紋情報管理方法および声紋情報管理装置、ならびに本人認証方法および本人認証システム
CN103475490B (zh) 一种身份验证方法及装置
EP3061086B1 (en) Text-to-speech performance evaluation
JP2017009980A (ja) 声紋認証方法および装置
WO2018129869A1 (zh) 声纹验证方法和装置
US9767787B2 (en) Artificial utterances for speaker verification
JP6179337B2 (ja) 音声認証装置、音声認証方法及び音声認証プログラム
Cuccovillo et al. Open challenges in synthetic speech detection
CN110379433A (zh) 身份验证的方法、装置、计算机设备及存储介质
CN110797032A (zh) 一种声纹数据库建立方法及声纹识别方法
Asda et al. Development of Quran reciter identification system using MFCC and neural network
JP2014066779A5 (ja)
JPWO2022034630A5 (ja) 音声処理装置、音声処理方法、プログラム、および音声認証システム
JP6480124B2 (ja) 生体検知装置、生体検知方法及びプログラム
JP4245948B2 (ja) 音声認証装置、音声認証方法及び音声認証プログラム
CN113658599A (zh) 基于语音识别的会议记录生成方法、装置、设备及介质
CN111326173B (zh) 语音信息处理方法、装置、电子设备以及可读存储介质
JP6003352B2 (ja) データ生成装置、及びデータ生成方法
CN109087651B (zh) 一种基于视频与语谱图的声纹鉴定方法、系统及设备
CN112634861A (zh) 数据处理方法、装置、电子设备和可读存储介质
JPWO2021024869A5 (ja) 音声処理装置、音声処理方法、およびプログラム
WO2014155652A1 (ja) 話者検索システム、プログラム
JP5436951B2 (ja) 本人認証装置および本人認証方法