JPWO2023013060A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2023013060A5
JPWO2023013060A5 JP2023539570A JP2023539570A JPWO2023013060A5 JP WO2023013060 A5 JPWO2023013060 A5 JP WO2023013060A5 JP 2023539570 A JP2023539570 A JP 2023539570A JP 2023539570 A JP2023539570 A JP 2023539570A JP WO2023013060 A5 JPWO2023013060 A5 JP WO2023013060A5
Authority
JP
Japan
Prior art keywords
information
feature
keyword
feature amount
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023539570A
Other languages
English (en)
Other versions
JPWO2023013060A1 (ja
Publication date
Application filed filed Critical
Priority claimed from PCT/JP2021/029412 external-priority patent/WO2023013060A1/ja
Publication of JPWO2023013060A1 publication Critical patent/JPWO2023013060A1/ja
Publication of JPWO2023013060A5 publication Critical patent/JPWO2023013060A5/ja
Pending legal-status Critical Current

Links

Description

会話データ取得部110は、複数人の音声情報を含む会話データを取得する。会話データ取得部110は、例えばマイク等から直接会話データを取得してもよいし、他の装置等で生成された会話データを取得してもよい。会話データの一例としては、会議の音声を録音した会議データ等が挙げられる。また、会話データ取得部110は、取得した会話データに対して各種処理を実行可能に構成されてよい。例えば、会話データ取得部110は、会話データにおいて話者が発話している区間を検出する処理、会話データを音声認識してテキスト化する処理、及び発話している話者を分類する処理等を実行可能に構成されてよい。
(情報生成動作)
次に、図3を参照しながら、第1実施形態に係る情報処理システム10による照合用情報を生成する際の動作(以下、適宜「情報生成動作」と称する)の流れについて説明する。図3は、第1実施形態に係る情報処理システムによる情報生成動作の流れを示すフローチャートである。
図3に示すように、第1実施形態に係る情報処理システム10による情報生成動作では、まず会話データ取得部110が、複数人の音声情報を含む会話データを取得する(ステップS101)。そして、会話データ取得部110は、会話データにおいて話者が発話している区間を検出する処理(以下、適宜「区間検出処理」と称する)を実行する(ステップS102)。区間検出処理は、例えば無音区間を検出してトリミングする処理であってよい。
(情報生成動作)
次に、図5を参照しながら、第2実施形態に係る情報処理システム10による情報生成動作の流れについて説明する。図5は、第2実施形態に係る情報処理システムによる情報生成動作の流れを示すフローチャートである。なお、図5では、図3で説明した処理と同様の処理に同一の符号を付している。
図5に示すように、第2実施形態に係る情報処理システム10による情報生成動作では、まず会話データ取得部110が、複数人の音声情報を含む会話データを取得する(ステップS101)。そして、会話データ取得部110は、区間検出処理を実行する(ステップS102)。

Claims (7)

  1. 複数人の音声情報を含む会話データを取得する取得手段と、
    前記音声情報からキーワードを抽出するキーワード抽出手段と、
    前記音声情報から前記キーワードを発話した際の音声に関する特徴量である第1特徴量を抽出する特徴量抽出手段と、
    前記キーワードと前記第1特徴量とを関連付けた照合用情報を生成する生成手段と、
    を備える情報処理システム。
  2. 前記複数人のうち少なくとも1人の音声に関する特徴量である第2特徴量を取得する特徴量取得手段と、
    前記第1特徴量と前記第2特徴量とを比較することで、前記第1特徴量から前記キーワードを発話した話者を特定できるか否かを判定する判定手段と、
    を更に備える請求項1に記載の情報処理システム。
  3. 前記会話データに対する所定処理を要求するユーザに対して、前記照合用情報が生成された前記キーワードの発話を促す情報を提示する提示手段と、
    前記ユーザの発話内容から、前記ユーザの音声に関する特徴量である第3特徴量を抽出する認証用特徴量抽出手段と、
    発話を促した前記キーワードに関連付いた前記第1特徴量と、前記第3特徴量との比較結果に基づいて、前記ユーザによる前記所定処理の実行を許可するか否かを判定する許可判定手段と、
    を更に備える請求項1又は2に記載の情報処理システム。
  4. 前記照合用情報は複数の前記キーワードについて生成されており、
    前記提示手段は、一部の前記キーワードの発話を促す情報を提示して、前記ユーザによる前記所定処理の実行を許可しないと判定された場合に、他の前記キーワードの発話を促す情報を提示する、
    請求項3に記載の情報処理システム。
  5. 複数人の音声情報を含む会話データを取得する取得手段と、
    前記音声情報からキーワードを抽出するキーワード抽出手段と、
    前記音声情報から前記キーワードを発話した際の音声に関する特徴量である第1特徴量を抽出する特徴量抽出手段と、
    前記キーワードと前記第1特徴量とを関連付けた照合用情報を生成する生成手段と、
    を備える情報処理装置。
  6. 少なくとも1つのコンピュータが実行する情報処理方法であって、
    複数人の音声情報を含む会話データを取得し、
    前記音声情報からキーワードを抽出し、
    前記音声情報から前記キーワードを発話した際の音声に関する特徴量である第1特徴量を抽出し、
    前記キーワードと前記第1特徴量とを関連付けた照合用情報を生成する、
    情報処理方法。
  7. 少なくとも1つのコンピュータに、
    複数人の音声情報を含む会話データを取得し、
    前記音声情報からキーワードを抽出し、
    前記音声情報から前記キーワードを発話した際の音声に関する特徴量である第1特徴量を抽出し、
    前記キーワードと前記第1特徴量とを関連付けた照合用情報を生成する、
    情報処理方法を実行させるコンピュータプログラ
JP2023539570A 2021-08-06 2021-08-06 Pending JPWO2023013060A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/029412 WO2023013060A1 (ja) 2021-08-06 2021-08-06 情報処理システム、情報処理装置、情報処理方法、及び記録媒体

Publications (2)

Publication Number Publication Date
JPWO2023013060A1 JPWO2023013060A1 (ja) 2023-02-09
JPWO2023013060A5 true JPWO2023013060A5 (ja) 2024-04-08

Family

ID=85155474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023539570A Pending JPWO2023013060A1 (ja) 2021-08-06 2021-08-06

Country Status (2)

Country Link
JP (1) JPWO2023013060A1 (ja)
WO (1) WO2023013060A1 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4318475B2 (ja) * 2003-03-27 2009-08-26 セコム株式会社 話者認証装置及び話者認証プログラム
US8543834B1 (en) * 2012-09-10 2013-09-24 Google Inc. Voice authentication and command
JP2016206428A (ja) * 2015-04-23 2016-12-08 京セラ株式会社 電子機器および声紋認証方法
KR102113879B1 (ko) * 2018-12-19 2020-05-26 주식회사 공훈 참조 데이터베이스를 활용한 화자 음성 인식 방법 및 그 장치

Similar Documents

Publication Publication Date Title
CN108630193B (zh) 语音识别方法及装置
US8010367B2 (en) Spoken free-form passwords for light-weight speaker verification using standard speech recognition engines
US11693988B2 (en) Use of ASR confidence to improve reliability of automatic audio redaction
JP2018169494A (ja) 発話意図推定装置および発話意図推定方法
JP2007133414A (ja) 音声の識別能力推定方法及び装置、ならびに話者認証の登録及び評価方法及び装置
US20140316783A1 (en) Vocal keyword training from text
JP5030868B2 (ja) 会議音声録音システム
EP4139816B1 (en) Voice shortcut detection with speaker verification
JP7255032B2 (ja) 音声認識
US10872615B1 (en) ASR-enhanced speech compression/archiving
US11416593B2 (en) Electronic device, control method for electronic device, and control program for electronic device
JP2021033260A (ja) 学習方法、話者識別方法、及び、プログラム
JP2010237364A (ja) 合成音声判別装置、方法及びプログラム
JP5342629B2 (ja) 男女声識別方法、男女声識別装置及びプログラム
JPWO2023013060A5 (ja)
US11398239B1 (en) ASR-enhanced speech compression
JP2019132997A (ja) 音声処理装置、方法およびプログラム
WO2020195924A1 (ja) 信号処理装置および方法、並びにプログラム
JP4245948B2 (ja) 音声認証装置、音声認証方法及び音声認証プログラム
JP7177348B2 (ja) 音声認識装置、音声認識方法およびプログラム
CN111798844A (zh) 根据声纹识别的人工智能扬声器定制型个人化服务系统
JP2019101285A (ja) 音声処理装置、音声処理方法及びプログラム
WO2023047893A1 (ja) 認証装置および認証方法
US11521623B2 (en) System and method for single-speaker identification in a multi-speaker environment on a low-frequency audio recording
WO2023013060A1 (ja) 情報処理システム、情報処理装置、情報処理方法、及び記録媒体