JP2020504329A - 共振器を利用した話者認識方法及びその装置 - Google Patents
共振器を利用した話者認識方法及びその装置 Download PDFInfo
- Publication number
- JP2020504329A JP2020504329A JP2019534648A JP2019534648A JP2020504329A JP 2020504329 A JP2020504329 A JP 2020504329A JP 2019534648 A JP2019534648 A JP 2019534648A JP 2019534648 A JP2019534648 A JP 2019534648A JP 2020504329 A JP2020504329 A JP 2020504329A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- band
- size difference
- vowel
- resonator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000010586 diagram Methods 0.000 abstract description 18
- 238000001228 spectrum Methods 0.000 description 10
- 239000000463 material Substances 0.000 description 7
- 239000002033 PVDF binder Substances 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005452 bending Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 2
- XLOFNXVVMRAGLZ-UHFFFAOYSA-N 1,1-difluoroethene;1,1,2-trifluoroethene Chemical group FC(F)=C.FC=C(F)F XLOFNXVVMRAGLZ-UHFFFAOYSA-N 0.000 description 1
- 102100033133 D-dopachrome decarboxylase Human genes 0.000 description 1
- 101000927579 Homo sapiens D-dopachrome decarboxylase Proteins 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- ZOKXTWBITQBERF-UHFFFAOYSA-N Molybdenum Chemical compound [Mo] ZOKXTWBITQBERF-UHFFFAOYSA-N 0.000 description 1
- 229910007694 ZnSnO3 Inorganic materials 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- -1 for example Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 239000011733 molybdenum Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 229920000131 polyvinylidene Polymers 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000001845 vibrational spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01H—MEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
- G01H13/00—Measuring resonant frequency
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/20—Pattern transformations or operations aimed at increasing system robustness, e.g. against channel noise or different working conditions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Telephone Function (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
12 センサ部、
12a 下部電極、
12b 圧電物質層、
12c 上部電極、
14、30 支持部、
16 質量部、
40 貫通ホール、
R 共振器、
100、100d 共振器センサ、
200 話者認識装置、
210 プロセッサ、
220 メモリ、
230 ディスプレイ。
Claims (32)
- 互いに異なる共振帯域を有する複数個の共振器のうち少なくとも一部の共振器から、話者の音声に対応する電気的信号を受信する段階と、
前記電気的信号を利用し、前記共振帯域のサイズ差を算出する段階と、
前記共振帯域のサイズ差を利用し、前記話者を認識する段階と、
を含む話者認識方法。 - 前記共振帯域のサイズ差は、
周波数を基準に、隣接する共振周波数を有する2つの共振器から出力された電気的信号のサイズ差であることを特徴とする請求項1に記載の話者認識方法。 - 前記話者を認識する段階は、
前記共振帯域のサイズ差を符号化し、帯域傾度のビットマップを生成する段階と、
前記帯域傾度のビットマップを利用し、前記話者を認識する段階と、
を含むことを特徴とする請求項1に記載の話者認識方法。 - 前記符号化は、
前記共振帯域のサイズ差を、3以上の奇数個の値のうちいずれか一つに変換することを特徴とする請求項3に記載の話者認識方法。 - 前記3以上の奇数個の値は、
1つの値を基準に、残りの値のうち対応する値は、絶対値が同じでありながら、符号が反対であることを特徴とする請求項4に記載の話者認識方法。 - 前記3以上の奇数個の値は、
a、0、−a(ここで、aは、定数である)を含むことを特徴とする請求項4に記載の話者認識方法。 - 話者音声が登録過程音声である場合、前記話者を認識する段階は、
前記帯域傾度のビットマップを利用し、話者モデルを生成する段階と、
前記話者モデルを認証テンプレートとして登録する段階と、
を含むことを特徴とする請求項3に記載の話者認識方法。 - 前記話者音声が登録過程音声ではない場合、前記話者を認識する段階は、
前記帯域傾度のビットマップを利用し、話者特徴値を生成する段階と、
前記話者特徴値を、前記登録された認証テンプレートと比較し、前記話者が登録された話者であるか否かということを決定する段階と、
を含むことを特徴とする請求項7に記載の話者認識方法。 - 前記話者を認識する段階は、
前記共振帯域のサイズ差を利用し、前記話者の音声のうち母音を決定する段階を含むことを特徴とする請求項1に記載の話者認識方法。 - 前記母音を決定する段階は、
前記共振帯域のサイズ差を利用し、フォルマントの相対的位置を推定する段階と、
前記フォルマントの相対的位置から前記母音を決定する段階と、
を含むことを特徴とする請求項9に記載の話者認識方法。 - 前記フォルマントの個数は、3個であることを特徴とする請求項10に記載の話者認識方法。
- 前記共振帯域のサイズ差は、
共振器センサのうち4個の共振器から受信された電気的信号の大きさによって決定されることを特徴とする請求項10に記載の話者認識方法。 - 前記話者を認識する段階は、
前記決定された母音に加重値を割り当てる段階と、
前記母音を決定するために利用された共振帯域のサイズ差と異なる、共振帯域のサイズ差を利用し、帯域傾度のビットマップを生成する段階と、
前記帯域傾度のビットマップを利用し、話者特徴値を生成する段階と、
前記加重値を利用し、前記話者特徴値と認証テンプレートとを比較することにより、前記話者が登録された話者であるか否かということを認識する段階と、
を含むことを特徴とする請求項9に記載の話者認識方法。 - 前記加重値を割り当てる段階は、
前記決定された母音の加重値を、他の母音の加重値より高く割り当てることを特徴とする請求項13に記載の話者認識方法。 - 前記加重値は、
前記決定された母音には、1が割り当てられ、前記他の母音には、0が割り当てられたことを特徴とする請求項14に記載の話者認識方法。 - 前記帯域傾度のビットマップを生成するために利用された共振帯域のサイズ差の個数は、前記母音を決定するために利用された共振帯域のサイズ差の個数より多いことを特徴とする請求項14に記載の話者認識方法。
- 互いに異なる共振帯域を有する複数個の共振器を含み、前記複数個の共振器のうち少なくとも一部の共振器から、話者の音声に対応する電気的信号を出力する共振器センサと、
前記電気的信号を利用し、共振帯域のサイズ差を算出し、前記共振帯域のサイズ差を利用し、前記話者を認識するプロセッサと、を利用した話者認識装置。 - 前記共振帯域のサイズ差は、
周波数を基準に、隣接する共振周波数を有する2つの共振器から出力された電気的信号のサイズ差であることを特徴とする請求項17に記載の話者認識装置。 - 前記プロセッサは、
前記共振帯域のサイズ差を符号化し、帯域傾度のビットマップを生成し、前記帯域傾度のビットマップを利用し、前記話者を認識することを特徴とする請求項17に記載の話者認識装置。 - 前記プロセッサは、
前記共振帯域のサイズ差を、3以上の奇数個の値のうちいずれか一つに変換することにより、前記共振帯域のサイズ差を符号化することを特徴とする請求項19に記載の話者認識装置。 - 前記プロセッサは、
前記帯域傾度のビットマップを利用し、決定された話者特徴値を、登録された認証テンプレートと比較し、前記話者が登録された話者であるか否かということを決定することを特徴とする請求項19に記載の話者認識装置。 - 前記プロセッサは、
前記共振帯域のサイズ差を利用し、前記話者の音声のうち母音を決定することを特徴とする請求項17に記載の話者認識装置。 - 前記プロセッサは、
前記共振帯域のサイズ差を利用し、フォルマントの相対的位置を推定し、前記フォルマントの相対的位置から前記母音を決定することを特徴とする請求項22に記載の話者認識装置。 - 前記共振帯域のサイズ差は、
前記共振器センサのうち4個の共振器から受信された電気的信号の大きさによって決定されることを特徴とする請求項23に記載の話者認識装置。 - 前記プロセッサは、
前記決定された母音に加重値を割り当て、
前記母音を決定するために利用された共振帯域のサイズ差と異なる、共振帯域のサイズ差を利用し、話者特徴値を生成し、
前記加重値を利用し、前記話者特徴値と認証テンプレートとを比較することにより、話者を認識することを特徴とする請求項23に記載の話者認識装置。 - 帯域傾度のビットマップを生成するために利用された共振帯域のサイズ差の個数は、前記母音を決定するために利用された共振帯域のサイズ差の個数より多いことを特徴とする請求項25に記載の話者認識装置。
- 話者の音声に対応する周波数帯域の信号を受信する段階と、
前記信号のサイズ差を算出する段階と、
前記サイズ差を利用し、前記話者の音声のうち母音を決定する段階と、
前記決定された母音を利用し、前記話者が登録された話者であるか否かということを判断する段階と、
を含む話者認識方法。 - 前記母音を決定する段階は、
前記サイズ差を利用し、フォルマントの相対的位置を推定する段階と、
前記フォルマントの相対的位置から前記母音を決定する段階と、
を含むことを特徴とする請求項27に記載の話者認識方法。 - 前記周波数帯域の信号は、
互いに異なる共振帯域を有する複数個の共振器から受信することを特徴とする請求項28に記載の話者認識方法。 - 前記話者が登録された話者であるか否かということを判断する段階は、
前記決定された母音に加重値を割り当てる段階と、
前記話者の音声に対応する前記話者の特徴値を生成する段階と、
前記加重値を利用し、前記話者の特徴値と認証テンプレートとを比較することにより、前記話者が登録された話者であるか否かということ判断する段階と、
を含むことを特徴とする請求項27に記載の話者認識方法。 - 前記加重値を割り当てる段階は、
前記決定された母音の加重値を、他の母音の加重値より高く割り当てることを特徴とする請求項30に記載の話者認識方法。 - 前記加重値は、
前記決定された母音には、1が割り当てられ、前記他の母音には、0が割り当てられることを特徴とする請求項31に記載の話者認識方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2016-0182792 | 2016-12-29 | ||
KR20160182792 | 2016-12-29 | ||
PCT/KR2017/015020 WO2018124590A1 (ko) | 2016-12-29 | 2017-12-19 | 공진기를 이용한 화자 인식 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020504329A true JP2020504329A (ja) | 2020-02-06 |
JP7048619B2 JP7048619B2 (ja) | 2022-04-05 |
Family
ID=62709541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019534648A Active JP7048619B2 (ja) | 2016-12-29 | 2017-12-19 | 共振器を利用した話者認識方法及びその装置 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11341973B2 (ja) |
EP (1) | EP3598086B1 (ja) |
JP (1) | JP7048619B2 (ja) |
KR (1) | KR102520858B1 (ja) |
CN (1) | CN110121633B (ja) |
WO (1) | WO2018124590A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102335774B1 (ko) | 2017-09-01 | 2021-12-06 | 삼성전자주식회사 | 다중 공진기 어레이를 포함하는 소리 방향 탐지 센서 |
KR102477099B1 (ko) * | 2018-08-21 | 2022-12-13 | 삼성전자주식회사 | 소리 방향 탐지 센서 및 이를 포함하는 전자 장치 |
KR20200024602A (ko) * | 2018-08-28 | 2020-03-09 | 삼성전자주식회사 | 사용자 단말의 학습 방법 및 장치 |
KR102626924B1 (ko) | 2019-06-20 | 2024-01-19 | 삼성전자주식회사 | 지향성 음향 센서와, 이를 이용한 지향 특성의 조절 방법 및 특정 방향의 음향 신호 감쇄 방법 |
US12067135B2 (en) * | 2020-12-14 | 2024-08-20 | Netflix, Inc. | Secure video capture platform |
KR20220121631A (ko) * | 2021-02-25 | 2022-09-01 | 삼성전자주식회사 | 음성 인증 방법 및 이를 이용한 장치 |
US12087307B2 (en) | 2021-11-30 | 2024-09-10 | Samsung Electronics Co., Ltd. | Method and apparatus for performing speaker diarization on mixed-bandwidth speech signals |
KR20230086877A (ko) | 2021-12-08 | 2023-06-16 | 삼성전자주식회사 | 지향성 음향 센서 |
KR20230094246A (ko) | 2021-12-20 | 2023-06-28 | 삼성전자주식회사 | 음향 센서를 이용한 방향 추정 장치 및 방법 |
KR20230095689A (ko) | 2021-12-22 | 2023-06-29 | 삼성전자주식회사 | 마이크로폰 패키지 및 이를 포함하는 전자 장치 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02500864A (ja) * | 1987-07-09 | 1990-03-22 | ブリテツシュ・テレコミユニケイシヨン・パブリツク・リミテツド・カンパニー | パターン認識 |
JPH1097274A (ja) * | 1996-09-24 | 1998-04-14 | Kokusai Denshin Denwa Co Ltd <Kdd> | 話者認識方法及び装置 |
JP2002196784A (ja) * | 2000-12-27 | 2002-07-12 | Sumitomo Metal Ind Ltd | 時系列信号の識別方法及び装置 |
US6791433B1 (en) * | 1999-07-14 | 2004-09-14 | International Business Machines Corporation | Signal processing by means of resonators |
JP2004538526A (ja) * | 2001-08-09 | 2004-12-24 | サムスン エレクトロニクス カンパニー リミテッド | 音声登録方法及びそのシステム,音声登録方法及びそのシステムに基づく音声認識方法及びそのシステム |
JP2005202309A (ja) * | 2004-01-19 | 2005-07-28 | Sony Corp | 認証方法、認証装置及びmemsフィルタバンク |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4343969A (en) * | 1978-10-02 | 1982-08-10 | Trans-Data Associates | Apparatus and method for articulatory speech recognition |
US4379949A (en) * | 1981-08-10 | 1983-04-12 | Motorola, Inc. | Method of and means for variable-rate coding of LPC parameters |
US5054085A (en) * | 1983-05-18 | 1991-10-01 | Speech Systems, Inc. | Preprocessing system for speech recognition |
US5856722A (en) | 1996-01-02 | 1999-01-05 | Cornell Research Foundation, Inc. | Microelectromechanics-based frequency signature sensor |
US5729694A (en) * | 1996-02-06 | 1998-03-17 | The Regents Of The University Of California | Speech coding, reconstruction and recognition using acoustics and electromagnetic waves |
SE515447C2 (sv) * | 1996-07-25 | 2001-08-06 | Telia Ab | Metod och anordning för talverifiering |
JP3248452B2 (ja) | 1997-05-26 | 2002-01-21 | 住友金属工業株式会社 | 音響センサ |
US6502066B2 (en) * | 1998-11-24 | 2002-12-31 | Microsoft Corporation | System for generating formant tracks by modifying formants synthesized from speech units |
US6751354B2 (en) * | 1999-03-11 | 2004-06-15 | Fuji Xerox Co., Ltd | Methods and apparatuses for video segmentation, classification, and retrieval using image class statistical models |
JP2001117579A (ja) * | 1999-10-21 | 2001-04-27 | Casio Comput Co Ltd | 音声照合装置、音声照合方法、及び音声照合処理プログラムを記憶した記憶媒体 |
EP1246164A1 (en) * | 2001-03-30 | 2002-10-02 | Sony France S.A. | Sound characterisation and/or identification based on prosodic listening |
US20060004567A1 (en) | 2002-11-27 | 2006-01-05 | Visual Pronunciation Software Limited | Method, system and software for teaching pronunciation |
US20050171774A1 (en) * | 2004-01-30 | 2005-08-04 | Applebaum Ted H. | Features and techniques for speaker authentication |
DE102004013952A1 (de) | 2004-03-22 | 2005-10-20 | Infineon Technologies Ag | Schaltkreis-Anordnung und Signalverarbeitungs-Vorrichtung |
US7454337B1 (en) * | 2004-05-13 | 2008-11-18 | The United States Of America As Represented By The Director, National Security Agency, The | Method of modeling single data class from multi-class data |
US7991167B2 (en) * | 2005-04-29 | 2011-08-02 | Lifesize Communications, Inc. | Forming beams with nulls directed at noise sources |
CN101051464A (zh) * | 2006-04-06 | 2007-10-10 | 株式会社东芝 | 说话人认证的注册和验证方法及装置 |
US10154819B2 (en) * | 2006-04-20 | 2018-12-18 | Jack S. Emery | Systems and methods for impedance analysis of conductive medium |
US7863714B2 (en) | 2006-06-05 | 2011-01-04 | Akustica, Inc. | Monolithic MEMS and integrated circuit device having a barrier and method of fabricating the same |
US7953600B2 (en) * | 2007-04-24 | 2011-05-31 | Novaspeech Llc | System and method for hybrid speech synthesis |
US8103027B2 (en) | 2007-06-06 | 2012-01-24 | Analog Devices, Inc. | Microphone with reduced parasitic capacitance |
JP5203730B2 (ja) | 2008-01-28 | 2013-06-05 | 株式会社東芝 | 磁気共鳴診断装置 |
US20090326939A1 (en) * | 2008-06-25 | 2009-12-31 | Embarq Holdings Company, Llc | System and method for transcribing and displaying speech during a telephone call |
CN102187685B (zh) | 2008-10-14 | 2015-03-11 | 美商楼氏电子有限公司 | 具有多个换能器元件的传声器 |
CN101436405A (zh) * | 2008-12-25 | 2009-05-20 | 北京中星微电子有限公司 | 说话人识别方法和系统 |
KR101022519B1 (ko) * | 2009-04-17 | 2011-03-16 | 고려대학교 산학협력단 | 모음 특징을 이용한 음성구간 검출 시스템 및 방법과 이에 사용되는 음향 스펙트럼 유사도 측정 방법 |
WO2011026247A1 (en) * | 2009-09-04 | 2011-03-10 | Svox Ag | Speech enhancement techniques on the power spectrum |
US8831942B1 (en) * | 2010-03-19 | 2014-09-09 | Narus, Inc. | System and method for pitch based gender identification with suspicious speaker detection |
US8756062B2 (en) * | 2010-12-10 | 2014-06-17 | General Motors Llc | Male acoustic model adaptation based on language-independent female speech data |
CN102655003B (zh) * | 2012-03-21 | 2013-12-04 | 北京航空航天大学 | 基于声道调制信号mfcc的汉语语音情感点识别方法 |
WO2014039028A1 (en) * | 2012-09-04 | 2014-03-13 | Nuance Communications, Inc. | Formant dependent speech signal enhancement |
US20140100839A1 (en) * | 2012-09-13 | 2014-04-10 | David Joseph Arendash | Method for controlling properties of simulated environments |
US9305559B2 (en) * | 2012-10-15 | 2016-04-05 | Digimarc Corporation | Audio watermark encoding with reversing polarity and pairwise embedding |
KR20140050951A (ko) * | 2012-10-22 | 2014-04-30 | 한국전자통신연구원 | 음성 인식 시스템 |
CN102968990B (zh) * | 2012-11-15 | 2015-04-15 | 朱东来 | 说话人识别方法和系统 |
US10203762B2 (en) | 2014-03-11 | 2019-02-12 | Magic Leap, Inc. | Methods and systems for creating virtual and augmented reality |
US9621713B1 (en) * | 2014-04-01 | 2017-04-11 | Securus Technologies, Inc. | Identical conversation detection method and apparatus |
US10008216B2 (en) * | 2014-04-15 | 2018-06-26 | Speech Morphing Systems, Inc. | Method and apparatus for exemplary morphing computer system background |
KR102207928B1 (ko) * | 2014-08-13 | 2021-01-26 | 삼성전자주식회사 | 음향 센싱 소자 및 주파수 정보 획득 방법 |
KR101718214B1 (ko) * | 2015-06-09 | 2017-03-20 | 한국과학기술원 | 사물인터넷용 초저전력 유연압전 음성인식 센서 |
US9558734B2 (en) * | 2015-06-29 | 2017-01-31 | Vocalid, Inc. | Aging a text-to-speech voice |
KR102710725B1 (ko) | 2016-08-03 | 2024-09-27 | 삼성전자주식회사 | 음향 스펙트럼 분석기 및 이에 구비된 공진기들의 배열방법 |
-
2017
- 2017-12-19 US US16/474,465 patent/US11341973B2/en active Active
- 2017-12-19 EP EP17888519.0A patent/EP3598086B1/en active Active
- 2017-12-19 WO PCT/KR2017/015020 patent/WO2018124590A1/ko unknown
- 2017-12-19 KR KR1020197013600A patent/KR102520858B1/ko active IP Right Grant
- 2017-12-19 JP JP2019534648A patent/JP7048619B2/ja active Active
- 2017-12-19 CN CN201780080753.XA patent/CN110121633B/zh active Active
-
2022
- 2022-05-10 US US17/741,087 patent/US11887606B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02500864A (ja) * | 1987-07-09 | 1990-03-22 | ブリテツシュ・テレコミユニケイシヨン・パブリツク・リミテツド・カンパニー | パターン認識 |
JPH1097274A (ja) * | 1996-09-24 | 1998-04-14 | Kokusai Denshin Denwa Co Ltd <Kdd> | 話者認識方法及び装置 |
US6791433B1 (en) * | 1999-07-14 | 2004-09-14 | International Business Machines Corporation | Signal processing by means of resonators |
JP2002196784A (ja) * | 2000-12-27 | 2002-07-12 | Sumitomo Metal Ind Ltd | 時系列信号の識別方法及び装置 |
JP2004538526A (ja) * | 2001-08-09 | 2004-12-24 | サムスン エレクトロニクス カンパニー リミテッド | 音声登録方法及びそのシステム,音声登録方法及びそのシステムに基づく音声認識方法及びそのシステム |
JP2005202309A (ja) * | 2004-01-19 | 2005-07-28 | Sony Corp | 認証方法、認証装置及びmemsフィルタバンク |
Also Published As
Publication number | Publication date |
---|---|
EP3598086A4 (en) | 2020-08-26 |
KR102520858B1 (ko) | 2023-04-13 |
EP3598086B1 (en) | 2024-04-17 |
US20220270615A1 (en) | 2022-08-25 |
US11887606B2 (en) | 2024-01-30 |
WO2018124590A1 (ko) | 2018-07-05 |
US11341973B2 (en) | 2022-05-24 |
US20190348050A1 (en) | 2019-11-14 |
CN110121633A (zh) | 2019-08-13 |
EP3598086A1 (en) | 2020-01-22 |
JP7048619B2 (ja) | 2022-04-05 |
CN110121633B (zh) | 2023-04-04 |
KR20190092379A (ko) | 2019-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7048619B2 (ja) | 共振器を利用した話者認識方法及びその装置 | |
KR101688354B1 (ko) | 신호 소스 분리 | |
EP2022042B1 (en) | Intersession variability compensation for automatic extraction of information from voice | |
US20160071526A1 (en) | Acoustic source tracking and selection | |
CN110706714B (zh) | 说话者模型制作系统 | |
US10878812B1 (en) | Determining devices to respond to user requests | |
Jung et al. | Deep learning-based noise robust flexible piezoelectric acoustic sensors for speech processing | |
Tjandra et al. | Combination of two-dimensional cochleogram and spectrogram features for deep learning-based ASR | |
Das et al. | A voice identification system using hidden markov model | |
Jolad et al. | An art of speech recognition: a review | |
Saritha et al. | A comprehensive review on speaker recognition | |
DiPassio et al. | Direction of arrival estimation of an acoustic wave using a single structural vibration sensor | |
CN111261184A (zh) | 声源分离装置和声源分离方法 | |
KR101593672B1 (ko) | 음향 분리 방법 및 장치 | |
Larcher et al. | Constrained temporal structure for text-dependent speaker verification | |
Jayamaha et al. | Voizlock-human voice authentication system using hidden markov model | |
Lee et al. | Fast frequency discrimination and phoneme recognition using a biomimetic membrane coupled to a neural network | |
JP2000200098A (ja) | 学習装置および学習方法、並びに認識装置および認識方法 | |
Thakur et al. | Design of Hindi key word recognition system for home automation system using MFCC and DTW | |
DiPassio et al. | Estimating the Direction of Arrival of a Spoken Wake Word Using a Single Sensor on an Elastic Panel | |
JP5315976B2 (ja) | 音声認識装置、音声認識方法、および、プログラム | |
Jung et al. | Normalized minimum-redundancy and maximum-relevancy based feature selection for speaker verification systems | |
Ichikawa et al. | Harmonic feature fusion for robust neural network-based acoustic modeling | |
US10930279B2 (en) | Voice frequency analysis system, voice frequency analysis method, and voice recognition system and voice recognition method using the same | |
Park et al. | Zero-crossing-based feature extraction for voice command systems using neck-microphones |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220324 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7048619 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |