JP2018194844A - 音声制御装置、音声制御装置の動作方法、コンピュータプログラム及び記録媒体 - Google Patents
音声制御装置、音声制御装置の動作方法、コンピュータプログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2018194844A JP2018194844A JP2018094704A JP2018094704A JP2018194844A JP 2018194844 A JP2018194844 A JP 2018194844A JP 2018094704 A JP2018094704 A JP 2018094704A JP 2018094704 A JP2018094704 A JP 2018094704A JP 2018194844 A JP2018194844 A JP 2018194844A
- Authority
- JP
- Japan
- Prior art keywords
- feature vector
- keyword
- audio data
- audio
- speaker feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000004590 computer program Methods 0.000 title claims description 10
- 239000013598 vector Substances 0.000 claims abstract description 256
- 238000001514 detection method Methods 0.000 claims abstract description 69
- 230000005236 sound signal Effects 0.000 claims abstract description 51
- 238000000605 extraction Methods 0.000 claims description 44
- 238000012545 processing Methods 0.000 claims description 39
- 239000000284 extract Substances 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 11
- 238000012935 Averaging Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 description 69
- 230000015654 memory Effects 0.000 description 50
- 241000219793 Trifolium Species 0.000 description 23
- 238000004891 communication Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 10
- 241000736305 Marsilea quadrifolia Species 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000009434 installation Methods 0.000 description 2
- 230000007257 malfunction Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3228—Monitoring task completion, e.g. by use of idle timers, stop commands or wait commands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
Abstract
Description
110 メモリ
120 プロセッサ
121 オーディオ処理部
122 キーワード検出部
123 話者特徴ベクトル抽出部
124 ウェークアップ判断部
125 音声認識部
126 機能部
Claims (19)
- 周辺音に対応するオーディオ信号を受信し、オーディオストリームデータを生成するオーディオ処理部と、
前記オーディオストリームデータから、所定のキーワードに対応する候補キーワードを検出し、前記オーディオストリームデータにおいて、前記候補キーワードが検出された第1オーディオデータに該当する第1区間の始点及び終点を決定するキーワード検出部と、
前記第1オーディオデータに係わる第1話者特徴ベクトルを抽出し、前記オーディオストリームデータにおいて、前記第1区間の始点を終点にする第2区間に該当する第2オーディオデータに係わる第2話者特徴ベクトルを抽出する話者特徴ベクトル抽出部と、
前記第1話者特徴ベクトルと前記第2話者特徴ベクトルとの類似度を基に、前記第1オーディオデータに、前記キーワードが含まれていたか否かを判断するウェークアップ判断部と、を含む音声制御装置。 - 前記ウェークアップ判断部は、前記第1話者特徴ベクトルと前記第2話者特徴ベクトルとの類似度が、既設定基準値以下である場合、前記第1オーディオデータに、前記キーワードが含まれていると判断することを特徴とする請求項1に記載の音声制御装置。
- 前記所定のキーワードを含む複数のキーワードを保存するキーワード保存所をさらに含み、
前記キーワードそれぞれは、ウェークアップキーワードまたは単独命令キーワードであることを特徴とする請求項1に記載の音声制御装置。 - 前記キーワード検出部により、前記オーディオストリームデータから、前記単独命令キーワードに対応する前記候補キーワードが検出された場合、
前記話者特徴ベクトル抽出部は、前記オーディオストリームデータにおいて、前記第1区間の終点を始点にする第3区間に該当する第3オーディオデータを受信し、前記第3オーディオデータの第3話者特徴ベクトルを抽出し、
前記ウェークアップ判断部は、前記第1話者特徴ベクトルと前記第2話者特徴ベクトルとの類似度、及び前記第1話者特徴ベクトルと前記第3話者特徴ベクトルとの類似度を基に、前記第1オーディオデータに、前記単独命令キーワードが含まれていたか否かを判断することを特徴とする請求項3に記載の音声制御装置。 - 前記ウェークアップ判断部は、前記第1話者特徴ベクトルと前記第2話者特徴ベクトルとの類似度が、所定の基準値以下であり、前記第1話者特徴ベクトルと前記第3話者特徴ベクトルとの類似度が、所定の基準値以下である場合、前記第1オーディオデータに、前記単独命令キーワードが含まれていると判断することを特徴とする請求項4に記載の音声制御装置。
- 前記キーワード検出部により、前記オーディオストリームデータから、前記ウェークアップキーワードに対応する前記候補キーワードが検出された場合、
前記第1オーディオデータに前記ウェークアップキーワードが含まれている旨の前記ウェークアップ判断部による判断に応答して、ウェークアップされ、前記オーディオストリームデータにおいて、前記第1区間の終点を始点にする第3区間に該当する第3オーディオデータを受信し、前記第3オーディオデータを音声認識するか、あるいは前記第3オーディオデータが音声認識されるように外部に伝送する音声認識部をさらに含むことを特徴とする請求項3に記載の音声制御装置。 - 前記第2区間は、前記ウェークアップキーワードによって可変的に決定されることを特徴とする請求項6に記載の音声制御装置。
- 前記話者特徴ベクトル抽出部は、
前記第1オーディオデータの各フレームごとに第1フレーム特徴ベクトルを抽出し、抽出された前記第1フレーム特徴ベクトルを正規化及び平均化し、前記第1オーディオデータを代表する前記第1話者特徴ベクトルを抽出し、
前記第2オーディオデータの各フレームごとに第2フレーム特徴ベクトルを抽出し、抽出された前記第2フレーム特徴ベクトルを正規化及び平均化し、前記第2オーディオデータを代表する前記第2話者特徴ベクトルを抽出することを特徴とする請求項1に記載の音声制御装置。 - 前記キーワード検出部は、前記オーディオストリームデータの各フレームごとに、人音声である第1確率と、背景音である第2確率とを計算し、前記第1確率が前記第2確率より、所定の基準値を超えて高いフレームを音声フレームと決定し、
前記話者特徴ベクトル抽出部は、
前記第1オーディオデータ内のフレームにおいて、音声フレームと決定されたフレームそれぞれについて、第1フレーム特徴ベクトルを抽出し、抽出された前記第1フレーム特徴ベクトルを正規化及び平均化し、前記第1オーディオデータを代表する前記第1話者特徴ベクトルを抽出し、
前記第2オーディオデータ内のフレームにおいて、音声フレームと決定されたフレームそれぞれについて、第2フレーム特徴ベクトルを抽出し、抽出された前記第2フレーム特徴ベクトルを正規化及び平均化し、前記第2オーディオデータを代表する前記第2話者特徴ベクトルを抽出することを特徴とする請求項1に記載の音声制御装置。 - 前記話者特徴ベクトル抽出部は、前記キーワード検出部による前記候補キーワードの検出に応答してウェークアップされることを特徴とする請求項1に記載の音声制御装置。
- 周辺音に対応するオーディオ信号を受信し、オーディオストリームデータを生成する段階と、
前記オーディオストリームデータから、所定のキーワードに対応する候補キーワードを検出し、前記オーディオストリームデータにおいて、前記候補キーワードが検出された第1オーディオデータに該当する第1区間の始点及び終点を決定する段階と、
前記第1オーディオデータに係わる第1話者特徴ベクトルを抽出する段階と、
前記オーディオストリームデータにおいて、前記第1区間の始点を終点にする第2区間に該当する第2オーディオデータに係わる第2話者特徴ベクトルを抽出する段階と、
前記第1話者特徴ベクトルと前記第2話者特徴ベクトルとの類似度を基に、前記第1オーディオデータに、前記キーワードが含まれていたか否かを判断し、ウェークアップさせるか否かを決定する段階と、を含む音声制御装置の動作方法。 - 前記ウェークアップさせるか否かを決定する段階は、
前記第1話者特徴ベクトルと前記第2話者特徴ベクトルとの類似度を所定の基準値と比較する段階と、
前記類似度が、前記所定の基準値以下である場合、前記第1オーディオデータに、前記キーワードが含まれていると判断してウェークアップさせる段階と、
前記類似度が、前記所定の基準値を超える場合、前記第1オーディオデータに、前記キーワードが含まれていないと判断してウェークアップさせない段階と、を含むことを特徴とする請求項11に記載の音声制御装置の動作方法。 - 前記検出された候補キーワードが、単独命令キーワードに対応する前記候補キーワードである場合、
前記オーディオストリームデータにおいて、前記第1区間の終点を始点にする第3区間に該当する第3オーディオデータを受信する段階と、
前記第3オーディオデータの第3話者特徴ベクトルを抽出する段階と、
前記第1話者特徴ベクトルと前記第2話者特徴ベクトルとの類似度が、所定の基準値以下であり、前記第1話者特徴ベクトルと前記第3話者特徴ベクトルとの類似度が、所定の基準値以下である場合、前記第1オーディオデータに、前記単独命令キーワードが含まれていると判断する段階と、をさらに含むことを特徴とする請求項11に記載の音声制御装置の動作方法。 - 前記第1オーディオデータに、前記単独命令キーワードが含まれているという判断に応答し、前記単独命令キーワードに対応する機能を遂行する段階をさらに含むことを特徴とする請求項13に記載の音声制御装置の動作方法。
- 前記検出されたキーワードがウェークアップキーワードに対応する前記候補キーワードである場合、
前記第1オーディオデータに、前記ウェークアップキーワードが含まれているという判断に応答して、前記オーディオストリームデータにおいて、前記第1区間の終点を始点にする第3区間に該当する第3オーディオデータを受信する段階と、
前記第3オーディオデータを音声認識するか、あるいは前記第3オーディオデータが音声認識されるように外部に伝送する段階と、をさらに含むことを特徴とする請求項11に記載の音声制御装置の動作方法。 - 前記第1話者特徴ベクトルと前記第2話者特徴ベクトルとを抽出する段階は、
前記第1オーディオデータの各フレームごとに第1フレーム特徴ベクトルを抽出する段階と、
抽出された前記第1フレーム特徴ベクトルを正規化及び平均化し、前記第1オーディオデータを代表する前記第1話者特徴ベクトルを抽出する段階と、
前記第2オーディオデータの各フレームごとに第2フレーム特徴ベクトルを抽出する段階と、
抽出された前記第2フレーム特徴ベクトルを正規化及び平均化し、前記第2オーディオデータを代表する前記第2話者特徴ベクトルを抽出する段階と、を含むことを特徴とする請求項11に記載の音声制御装置の動作方法。 - 前記オーディオストリームデータの各フレームごとに、人音声である第1確率と、背景音である第2確率とを計算し、前記第1確率が前記第2確率より、所定の基準値を超えて高いフレームを音声フレームと決定する段階をさらに含み、
前記第1話者特徴ベクトルと前記第2話者特徴ベクトルとを抽出する段階は、
前記第1オーディオデータ内のフレームにおいて、音声フレームと決定されたフレームそれぞれについて、第1フレーム特徴ベクトルを抽出する段階と、
抽出された前記第1フレーム特徴ベクトルを正規化及び平均化し、前記第1オーディオデータを代表する前記第1話者特徴ベクトルを抽出する段階と、
前記第2オーディオデータ内のフレームにおいて、音声フレームと決定されたフレームそれぞれについて、第2フレーム特徴ベクトルを抽出する段階と、
抽出された前記第2フレーム特徴ベクトルを正規化及び平均化し、前記第2オーディオデータを代表する前記第2話者特徴ベクトルを抽出する段階と、を含むことを特徴とする請求項11に記載の音声制御装置の動作方法。 - 音声制御装置のプロセッサに、請求項11ないし17のうちいずれか1項に記載の動作方法を実行させる命令語を含むコンピュータプログラム。
- 請求項18に記載のコンピュータプログラムを記録した記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2017-0062391 | 2017-05-19 | ||
KR1020170062391A KR101986354B1 (ko) | 2017-05-19 | 2017-05-19 | 키워드 오인식을 방지하는 음성 제어 장치 및 이의 동작 방법 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019071410A Division JP2019133182A (ja) | 2017-05-19 | 2019-04-03 | 音声制御装置、音声制御方法、コンピュータプログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018194844A true JP2018194844A (ja) | 2018-12-06 |
JP6510117B2 JP6510117B2 (ja) | 2019-05-08 |
Family
ID=64561798
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018094704A Active JP6510117B2 (ja) | 2017-05-19 | 2018-05-16 | 音声制御装置、音声制御装置の動作方法、コンピュータプログラム及び記録媒体 |
JP2019071410A Pending JP2019133182A (ja) | 2017-05-19 | 2019-04-03 | 音声制御装置、音声制御方法、コンピュータプログラム及び記録媒体 |
JP2022000145A Granted JP2022033258A (ja) | 2017-05-19 | 2022-01-04 | 音声制御装置、動作方法及びコンピュータプログラム |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019071410A Pending JP2019133182A (ja) | 2017-05-19 | 2019-04-03 | 音声制御装置、音声制御方法、コンピュータプログラム及び記録媒体 |
JP2022000145A Granted JP2022033258A (ja) | 2017-05-19 | 2022-01-04 | 音声制御装置、動作方法及びコンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
JP (3) | JP6510117B2 (ja) |
KR (1) | KR101986354B1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109785836A (zh) * | 2019-01-28 | 2019-05-21 | 三星电子(中国)研发中心 | 交互方法和装置 |
KR20190065200A (ko) * | 2019-05-21 | 2019-06-11 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
JP2019095526A (ja) * | 2017-11-20 | 2019-06-20 | 富士通株式会社 | 音声処理プログラム、音声処理装置、及び音声処理方法 |
CN109992239A (zh) * | 2019-04-15 | 2019-07-09 | 北京百度网讯科技有限公司 | 语音出行方法、装置、终端及存储介质 |
JP2019133182A (ja) * | 2017-05-19 | 2019-08-08 | ネイバー コーポレーションNAVER Corporation | 音声制御装置、音声制御方法、コンピュータプログラム及び記録媒体 |
CN113450828A (zh) * | 2021-06-25 | 2021-09-28 | 平安科技(深圳)有限公司 | 音乐流派的识别方法、装置、设备及存储介质 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109637531B (zh) * | 2018-12-06 | 2020-09-15 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
WO2020122271A1 (ko) * | 2018-12-11 | 2020-06-18 | 엘지전자 주식회사 | 디스플레이 장치 |
KR20220071591A (ko) * | 2020-11-24 | 2022-05-31 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
KR20220136750A (ko) | 2021-04-01 | 2022-10-11 | 삼성전자주식회사 | 사용자 발화를 처리하는 전자 장치, 및 그 전자 장치의 제어 방법 |
CN115731926A (zh) * | 2021-08-30 | 2023-03-03 | 佛山市顺德区美的电子科技有限公司 | 智能设备的控制方法、装置、智能设备和可读存储介质 |
CN114038457B (zh) * | 2021-11-04 | 2022-09-13 | 贝壳找房(北京)科技有限公司 | 用于语音唤醒的方法、电子设备、存储介质和程序 |
JP2023128711A (ja) | 2022-03-04 | 2023-09-14 | キヤノン株式会社 | 医療システム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0643895A (ja) * | 1992-07-22 | 1994-02-18 | Nec Corp | 音声認識装置 |
JPH11231896A (ja) * | 1998-02-19 | 1999-08-27 | Fujitsu Ten Ltd | 音声起動システム |
JP2002156992A (ja) * | 2000-11-21 | 2002-05-31 | Sony Corp | モデル適応装置およびモデル適応方法、記録媒体、並びに音声認識装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006039382A (ja) * | 2004-07-29 | 2006-02-09 | Nissan Motor Co Ltd | 音声認識装置 |
JP5549506B2 (ja) * | 2010-09-28 | 2014-07-16 | 富士通株式会社 | 音声認識装置及び音声認識方法 |
KR20140139982A (ko) * | 2013-05-28 | 2014-12-08 | 삼성전자주식회사 | 전자 장치의 음성인식을 수행하는 방법 및 이를 사용하는 전자 장치 |
KR101986354B1 (ko) * | 2017-05-19 | 2019-09-30 | 네이버 주식회사 | 키워드 오인식을 방지하는 음성 제어 장치 및 이의 동작 방법 |
-
2017
- 2017-05-19 KR KR1020170062391A patent/KR101986354B1/ko active IP Right Grant
-
2018
- 2018-05-16 JP JP2018094704A patent/JP6510117B2/ja active Active
-
2019
- 2019-04-03 JP JP2019071410A patent/JP2019133182A/ja active Pending
-
2022
- 2022-01-04 JP JP2022000145A patent/JP2022033258A/ja active Granted
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0643895A (ja) * | 1992-07-22 | 1994-02-18 | Nec Corp | 音声認識装置 |
JPH11231896A (ja) * | 1998-02-19 | 1999-08-27 | Fujitsu Ten Ltd | 音声起動システム |
JP2002156992A (ja) * | 2000-11-21 | 2002-05-31 | Sony Corp | モデル適応装置およびモデル適応方法、記録媒体、並びに音声認識装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019133182A (ja) * | 2017-05-19 | 2019-08-08 | ネイバー コーポレーションNAVER Corporation | 音声制御装置、音声制御方法、コンピュータプログラム及び記録媒体 |
JP2022033258A (ja) * | 2017-05-19 | 2022-02-28 | ネイバー コーポレーション | 音声制御装置、動作方法及びコンピュータプログラム |
JP2019095526A (ja) * | 2017-11-20 | 2019-06-20 | 富士通株式会社 | 音声処理プログラム、音声処理装置、及び音声処理方法 |
JP7035476B2 (ja) | 2017-11-20 | 2022-03-15 | 富士通株式会社 | 音声処理プログラム、音声処理装置、及び音声処理方法 |
CN109785836A (zh) * | 2019-01-28 | 2019-05-21 | 三星电子(中国)研发中心 | 交互方法和装置 |
CN109992239A (zh) * | 2019-04-15 | 2019-07-09 | 北京百度网讯科技有限公司 | 语音出行方法、装置、终端及存储介质 |
KR20190065200A (ko) * | 2019-05-21 | 2019-06-11 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
KR102225001B1 (ko) | 2019-05-21 | 2021-03-08 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US11183190B2 (en) | 2019-05-21 | 2021-11-23 | Lg Electronics Inc. | Method and apparatus for recognizing a voice |
CN113450828A (zh) * | 2021-06-25 | 2021-09-28 | 平安科技(深圳)有限公司 | 音乐流派的识别方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
KR20180127065A (ko) | 2018-11-28 |
JP6510117B2 (ja) | 2019-05-08 |
JP2022033258A (ja) | 2022-02-28 |
JP2019133182A (ja) | 2019-08-08 |
KR101986354B1 (ko) | 2019-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6510117B2 (ja) | 音声制御装置、音声制御装置の動作方法、コンピュータプログラム及び記録媒体 | |
US11875820B1 (en) | Context driven device arbitration | |
US11600291B1 (en) | Device selection from audio data | |
US12125483B1 (en) | Determining device groups | |
US12094461B2 (en) | Processing spoken commands to control distributed audio outputs | |
US12033632B2 (en) | Context-based device arbitration | |
US11710478B2 (en) | Pre-wakeword speech processing | |
US11887590B2 (en) | Voice enablement and disablement of speech processing functionality | |
US10504511B2 (en) | Customizable wake-up voice commands | |
CN110140168B (zh) | 上下文热词 | |
KR102596430B1 (ko) | 화자 인식에 기초한 음성 인식 방법 및 장치 | |
US9672812B1 (en) | Qualifying trigger expressions in speech-based systems | |
US9837068B2 (en) | Sound sample verification for generating sound detection model | |
JP6812843B2 (ja) | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 | |
KR20160145634A (ko) | 사용자 정의된 키워드를 검출하기 위한 키워드 모델 생성 | |
KR20140089863A (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 | |
KR102061206B1 (ko) | 키워드 오인식을 방지하는 음성 제어 장치 및 이의 동작 방법 | |
US11348579B1 (en) | Volume initiated communications | |
US11693622B1 (en) | Context configurable keywords | |
US11605380B1 (en) | Coordinating content-item output across multiple electronic devices | |
US11328713B1 (en) | On-device contextual understanding | |
KR20210098250A (ko) | 전자 장치 및 이의 제어 방법 | |
WO2019187543A1 (ja) | 情報処理装置および情報処理方法 | |
US20200321022A1 (en) | Method and apparatus for detecting an end of an utterance | |
KR20240048802A (ko) | 치안현장 지원을 위한 단말내장형 음성인식 장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6510117 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |