JPWO2023013060A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2023013060A5 JPWO2023013060A5 JP2023539570A JP2023539570A JPWO2023013060A5 JP WO2023013060 A5 JPWO2023013060 A5 JP WO2023013060A5 JP 2023539570 A JP2023539570 A JP 2023539570A JP 2023539570 A JP2023539570 A JP 2023539570A JP WO2023013060 A5 JPWO2023013060 A5 JP WO2023013060A5
- Authority
- JP
- Japan
- Prior art keywords
- information
- feature
- keyword
- feature amount
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 claims description 14
- 238000000034 method Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims 5
- 238000003672 processing method Methods 0.000 claims 3
- 238000004590 computer program Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 description 3
- 238000009966 trimming Methods 0.000 description 1
Description
会話データ取得部110は、複数人の音声情報を含む会話データを取得する。会話データ取得部110は、例えばマイク等から直接会話データを取得してもよいし、他の装置等で生成された会話データを取得してもよい。会話データの一例としては、会議の音声を録音した会議データ等が挙げられる。また、会話データ取得部110は、取得した会話データに対して各種処理を実行可能に構成されてよい。例えば、会話データ取得部110は、会話データにおいて話者が発話している区間を検出する処理、会話データを音声認識してテキスト化する処理、及び発話している話者を分類する処理等を実行可能に構成されてよい。
(情報生成動作)
次に、図3を参照しながら、第1実施形態に係る情報処理システム10による照合用情報を生成する際の動作(以下、適宜「情報生成動作」と称する)の流れについて説明する。図3は、第1実施形態に係る情報処理システムによる情報生成動作の流れを示すフローチャートである。
次に、図3を参照しながら、第1実施形態に係る情報処理システム10による照合用情報を生成する際の動作(以下、適宜「情報生成動作」と称する)の流れについて説明する。図3は、第1実施形態に係る情報処理システムによる情報生成動作の流れを示すフローチャートである。
図3に示すように、第1実施形態に係る情報処理システム10による情報生成動作では、まず会話データ取得部110が、複数人の音声情報を含む会話データを取得する(ステップS101)。そして、会話データ取得部110は、会話データにおいて話者が発話している区間を検出する処理(以下、適宜「区間検出処理」と称する)を実行する(ステップS102)。区間検出処理は、例えば無音区間を検出してトリミングする処理であってよい。
(情報生成動作)
次に、図5を参照しながら、第2実施形態に係る情報処理システム10による情報生成動作の流れについて説明する。図5は、第2実施形態に係る情報処理システムによる情報生成動作の流れを示すフローチャートである。なお、図5では、図3で説明した処理と同様の処理に同一の符号を付している。
次に、図5を参照しながら、第2実施形態に係る情報処理システム10による情報生成動作の流れについて説明する。図5は、第2実施形態に係る情報処理システムによる情報生成動作の流れを示すフローチャートである。なお、図5では、図3で説明した処理と同様の処理に同一の符号を付している。
図5に示すように、第2実施形態に係る情報処理システム10による情報生成動作では、まず会話データ取得部110が、複数人の音声情報を含む会話データを取得する(ステップS101)。そして、会話データ取得部110は、区間検出処理を実行する(ステップS102)。
Claims (7)
- 複数人の音声情報を含む会話データを取得する取得手段と、
前記音声情報からキーワードを抽出するキーワード抽出手段と、
前記音声情報から前記キーワードを発話した際の音声に関する特徴量である第1特徴量を抽出する特徴量抽出手段と、
前記キーワードと前記第1特徴量とを関連付けた照合用情報を生成する生成手段と、
を備える情報処理システム。 - 前記複数人のうち少なくとも1人の音声に関する特徴量である第2特徴量を取得する特徴量取得手段と、
前記第1特徴量と前記第2特徴量とを比較することで、前記第1特徴量から前記キーワードを発話した話者を特定できるか否かを判定する判定手段と、
を更に備える請求項1に記載の情報処理システム。 - 前記会話データに対する所定処理を要求するユーザに対して、前記照合用情報が生成された前記キーワードの発話を促す情報を提示する提示手段と、
前記ユーザの発話内容から、前記ユーザの音声に関する特徴量である第3特徴量を抽出する認証用特徴量抽出手段と、
発話を促した前記キーワードに関連付いた前記第1特徴量と、前記第3特徴量との比較結果に基づいて、前記ユーザによる前記所定処理の実行を許可するか否かを判定する許可判定手段と、
を更に備える請求項1又は2に記載の情報処理システム。 - 前記照合用情報は複数の前記キーワードについて生成されており、
前記提示手段は、一部の前記キーワードの発話を促す情報を提示して、前記ユーザによる前記所定処理の実行を許可しないと判定された場合に、他の前記キーワードの発話を促す情報を提示する、
請求項3に記載の情報処理システム。 - 複数人の音声情報を含む会話データを取得する取得手段と、
前記音声情報からキーワードを抽出するキーワード抽出手段と、
前記音声情報から前記キーワードを発話した際の音声に関する特徴量である第1特徴量を抽出する特徴量抽出手段と、
前記キーワードと前記第1特徴量とを関連付けた照合用情報を生成する生成手段と、
を備える情報処理装置。 - 少なくとも1つのコンピュータが実行する情報処理方法であって、
複数人の音声情報を含む会話データを取得し、
前記音声情報からキーワードを抽出し、
前記音声情報から前記キーワードを発話した際の音声に関する特徴量である第1特徴量を抽出し、
前記キーワードと前記第1特徴量とを関連付けた照合用情報を生成する、
情報処理方法。 - 少なくとも1つのコンピュータに、
複数人の音声情報を含む会話データを取得し、
前記音声情報からキーワードを抽出し、
前記音声情報から前記キーワードを発話した際の音声に関する特徴量である第1特徴量を抽出し、
前記キーワードと前記第1特徴量とを関連付けた照合用情報を生成する、
情報処理方法を実行させるコンピュータプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/029412 WO2023013060A1 (ja) | 2021-08-06 | 2021-08-06 | 情報処理システム、情報処理装置、情報処理方法、及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2023013060A1 JPWO2023013060A1 (ja) | 2023-02-09 |
JPWO2023013060A5 true JPWO2023013060A5 (ja) | 2024-04-08 |
Family
ID=85155474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023539570A Pending JPWO2023013060A1 (ja) | 2021-08-06 | 2021-08-06 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2023013060A1 (ja) |
WO (1) | WO2023013060A1 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4318475B2 (ja) * | 2003-03-27 | 2009-08-26 | セコム株式会社 | 話者認証装置及び話者認証プログラム |
US8543834B1 (en) * | 2012-09-10 | 2013-09-24 | Google Inc. | Voice authentication and command |
JP2016206428A (ja) * | 2015-04-23 | 2016-12-08 | 京セラ株式会社 | 電子機器および声紋認証方法 |
KR102113879B1 (ko) * | 2018-12-19 | 2020-05-26 | 주식회사 공훈 | 참조 데이터베이스를 활용한 화자 음성 인식 방법 및 그 장치 |
-
2021
- 2021-08-06 JP JP2023539570A patent/JPWO2023013060A1/ja active Pending
- 2021-08-06 WO PCT/JP2021/029412 patent/WO2023013060A1/ja active Application Filing
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108630193B (zh) | 语音识别方法及装置 | |
US8010367B2 (en) | Spoken free-form passwords for light-weight speaker verification using standard speech recognition engines | |
US11693988B2 (en) | Use of ASR confidence to improve reliability of automatic audio redaction | |
JP2018169494A (ja) | 発話意図推定装置および発話意図推定方法 | |
JP2007133414A (ja) | 音声の識別能力推定方法及び装置、ならびに話者認証の登録及び評価方法及び装置 | |
US20140316783A1 (en) | Vocal keyword training from text | |
JP5030868B2 (ja) | 会議音声録音システム | |
EP4139816B1 (en) | Voice shortcut detection with speaker verification | |
JP7255032B2 (ja) | 音声認識 | |
US10872615B1 (en) | ASR-enhanced speech compression/archiving | |
US11416593B2 (en) | Electronic device, control method for electronic device, and control program for electronic device | |
JP2021033260A (ja) | 学習方法、話者識別方法、及び、プログラム | |
JP2010237364A (ja) | 合成音声判別装置、方法及びプログラム | |
JP5342629B2 (ja) | 男女声識別方法、男女声識別装置及びプログラム | |
JPWO2023013060A5 (ja) | ||
US11398239B1 (en) | ASR-enhanced speech compression | |
JP2019132997A (ja) | 音声処理装置、方法およびプログラム | |
WO2020195924A1 (ja) | 信号処理装置および方法、並びにプログラム | |
JP4245948B2 (ja) | 音声認証装置、音声認証方法及び音声認証プログラム | |
JP7177348B2 (ja) | 音声認識装置、音声認識方法およびプログラム | |
CN111798844A (zh) | 根据声纹识别的人工智能扬声器定制型个人化服务系统 | |
JP2019101285A (ja) | 音声処理装置、音声処理方法及びプログラム | |
WO2023047893A1 (ja) | 認証装置および認証方法 | |
US11521623B2 (en) | System and method for single-speaker identification in a multi-speaker environment on a low-frequency audio recording | |
WO2023013060A1 (ja) | 情報処理システム、情報処理装置、情報処理方法、及び記録媒体 |