JP6553111B2 - 音声認識装置、音声認識方法及び音声認識プログラム - Google Patents
音声認識装置、音声認識方法及び音声認識プログラム Download PDFInfo
- Publication number
- JP6553111B2 JP6553111B2 JP2017054907A JP2017054907A JP6553111B2 JP 6553111 B2 JP6553111 B2 JP 6553111B2 JP 2017054907 A JP2017054907 A JP 2017054907A JP 2017054907 A JP2017054907 A JP 2017054907A JP 6553111 B2 JP6553111 B2 JP 6553111B2
- Authority
- JP
- Japan
- Prior art keywords
- threshold
- voice signal
- voice
- signal
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 48
- 230000005236 sound signal Effects 0.000 claims description 44
- 238000012545 processing Methods 0.000 claims description 41
- 239000000284 extract Substances 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60Q—ARRANGEMENT OF SIGNALLING OR LIGHTING DEVICES, THE MOUNTING OR SUPPORTING THEREOF OR CIRCUITS THEREFOR, FOR VEHICLES IN GENERAL
- B60Q9/00—Arrangement or adaptation of signal devices not provided for in one of main groups B60Q1/00 - B60Q7/00, e.g. haptic signalling
- B60Q9/002—Arrangement or adaptation of signal devices not provided for in one of main groups B60Q1/00 - B60Q7/00, e.g. haptic signalling for parking purposes, e.g. for warning the driver that his vehicle has contacted or is about to contact an obstacle
- B60Q9/007—Arrangement or adaptation of signal devices not provided for in one of main groups B60Q1/00 - B60Q7/00, e.g. haptic signalling for parking purposes, e.g. for warning the driver that his vehicle has contacted or is about to contact an obstacle providing information about the distance to an obstacle, e.g. varying sound
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
- G10L2025/786—Adaptive threshold
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephonic Communication Services (AREA)
Description
本実施形態はユーザとのインタラクティブな調整指示に基づいて、ユーザ所望の範囲での音声取得が可能になるような音声認識装置、音声認識方法及び音声認識プログラムを提供することを目的とする。
(第1の実施形態)
図1は、第1の実施形態に係る音声認識装置100の構成を示すブロック図である。この音声認識装置は、マイクロホン101によって集音される音声信号を変換器102でデジタル信号に変換した上で、信号処理器103に入力する。この信号処理器103は、指示入力装置104からの指示に従って、音声信号を諸条件に基づく閾値と比較し、閾値に満たない信号成分をカットした上で音声信号の音声認識を行い、テキストデータに変換して、表示装置105に表示させる。
図2は、上記信号処理器103における音声認識処理の流れを示すフローチャートである。本実施形態に係る音声認識処理では、調整処理過程と認識処理過程とを備える。
次に、第2の実施形態に係る音声認識装置について説明する。なお、本実施形態に係る音声認識装置は、第1の実施形態に係る音声認識装置と基本的に同構成であるので、ここではその構成の説明を省略する。
次に、第3の実施形態に係る音声認識装置について説明する。なお、本実施形態に係る音声認識装置は、第1の実施形態に係る音声認識装置と基本的に同構成であるので、ここではその構成の説明を省略する。
図5は、本実施形態に係る音声認識処理の流れを示すフローチャートである。なお、図5において、図2に示す第1の実施形態の処理と同じ処理については同一符号を付して示し、ここでは異なる部分について説明する。
具体的には、まず、第1の閾値t1を読み出し(ステップS30)、第1の閾値t1と入力音声信号とを比較し(ステップS31)、入力音声信号の音量レベルが第1の閾値t1を超えた場合には、音声認識処理を行う(ステップS33)。この音声認識処理が一回目か否かを判断し(ステップS34)、1回目の場合は音声再入力を指示し(ステップS35)、音声信号が再入力された場合(ステップS36)には、ステップS30に戻り、第1の閾値t1との比較を行う。ステップS34の音声認識処理が二回目で認識結果が一回目と同じ内容の場合には、「声が小さくて入らなかったのでもう一度言い直した」と判断して第2の閾値t2を下げて再登録し(ステップS37)、ステップS32の比較処理に移行する。ステップS32で音量レベルが第1の閾値t1を超えない場合には、ステップS19の入力音声信号破棄に移行し、一連の処理を終了する。
(第4の実施形態)
次に、第4の実施形態に係る音声認識装置について説明する。なお、本実施形態に係る音声認識装置は、第1の実施形態に係る音声認識装置と基本的に同構成であるので、ここではその構成の説明を省略する。
本実施形態は、閾値の調整・登録処理(ステップS14)において、入力音声信号の音量を計測し(ステップS141)、表示装置105に、図7に示すような音量レベルを示すレベルメータと閾値を表示し(ステップS142)、ユーザが指示入力装置104を通じて指定する値に閾値を調整する(ステップS143)。
(第5の実施形態)
次に、第5の実施形態に係る音声認識装置について説明する。なお、本実施形態に係る音声認識装置は、第1の実施形態に係る音声認識装置と基本的に同構成であるので、ここではその構成の説明を省略する。
本実施形態は、閾値の調整・登録処理(ステップS14)において、入力音声信号の特徴量を抽出し(ステップS144)、その特徴量からマイクロホン101と話者との距離を推定し(ステップS145)、所定距離範囲内の話者の音声信号を取り込む値に閾値を調整する(ステップS146)。これにより、(1)マイクロホン101から近い話者の声だけ認識することが可能となる。さらに、話者の声の大きさを推定して閾値を調整する(ステップS147)。これにより、(2)話者の声の大きさを推定して認識するかどうかを判断するため、近くの話者のひそひそ話しは認識しないようにすることができる。
次に、第1乃至第5の実施形態に係る音声認識装置のハードウェア構成について図8を用いて説明する。図10は、第1から第5の実施形態に係る音声認識装置のハードウェア構成例を示すブロック図である。
第1乃至第5の実施形態に係る音声認識装置で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供されるように構成してもよい。
200…音響処理装置、201…記憶部、202…推定部、203…除去部、
301…CPU、302…ROM、303…RAM、304…入出力I/F、305…通信I/F、306…バス。
Claims (8)
- 音声を集音して音声信号を取得する取得部と、
前記音声信号に対する閾値を設定する閾値設定部と、
認識指示入力に従って前記閾値と前記音声信号とを比較して、前記音声信号が前記閾値に満たない場合は前記音声信号を破棄し、前記音声信号が閾値以上となった場合は、認識対象の話者の音声信号として認識処理を実行する認識部と
を具備し、
前記閾値設定部は、第1の閾値t1と第2の閾値t2(t1<t2)とを用意し、
前記認識部は、第2の閾値t2を前記音声信号と比較し、前記音声信号が前記第2の閾値t2より高い場合には、音声認識処理に移行し、
前記閾値設定部は、前記音声信号が前記第2の閾値t2を超えない場合には、前記第2の閾値t2の再設定を行い、
前記認識部は、前記第1の閾値t1を前記音声信号と比較し、前記音声信号が前記第1の閾値t1を超えた場合には音声認識処理を行い、音声信号の再取得を促し、再取得の音声信号を再度前記第1の閾値t1と比較し、再取得の音声信号が前記第1の閾値t1を超えた場合には音声認識処理を行い、
前記閾値設定部は、二回目の音声認識結果が一回目の音声認識結果と同じ場合には、前記第2の閾値t2を下げて再設定し、前記音声信号、再取得の音声信号が前記第1の閾値t1を超えない場合には、その音声信号を破棄する音声認識装置。 - 前記閾値設定部は、前記音声信号の音量を計測し、その音量レベルと前記閾値をユーザに提示して、ユーザが指定する値に閾値を設定する請求項1記載の音声認識装置。
- 音声を集音して音声信号を取得する取得部と、
前記音声信号に対する閾値を設定する閾値設定部と、
認識指示入力に従って前記閾値と前記音声信号とを比較して、前記音声信号が前記閾値に満たない場合は前記音声信号を破棄し、前記音声信号が閾値以上となった場合は、認識対象の話者の音声信号として認識処理を実行する認識部と
を具備し、
前記閾値設定部は、前記音声信号の特徴量を抽出し、その特徴量から前記取得部と前記話者との距離を推定し、所定距離範囲内の話者の音声信号を取り込む値に閾値を設定する音声認識装置。 - 前記取得部と前記話者との距離は、直接音と残響音との比率に基づいて推定する請求項3記載の音声認識装置。
- 音声を集音して音声信号を取得し、
前記音声信号に対する閾値を設定し、
認識指示に従って前記閾値と前記音声信号とを比較して、前記音声信号が前記閾値に満たない場合は前記音声信号を破棄し、前記音声信号が閾値以上となった場合は、認識対象の話者の音声信号として認識処理を実行し、
前記閾値の設定は、
第1の閾値t1と第2の閾値t2(t1<t2)とを用意し、
第2の閾値t2を前記音声信号と比較し、前記音声信号が前記第2の閾値t2より高い場合には、音声認識処理に移行し、
前記音声信号が前記第2の閾値t2を超えない場合には、前記第2の閾値t2の再設定を行い、
前記第1の閾値t1を前記音声信号と比較し、前記音声信号が前記第1の閾値t1を超えた場合には音声認識処理を行い、音声信号の再取得を促し、再取得の音声信号を再度前記第1の閾値t1と比較し、再取得の音声信号が前記第1の閾値t1を超えた場合には音声認識処理を行い、
二回目の音声認識結果が一回目の音声認識結果と同じ場合には、前記第2の閾値t2を下げて再設定し、前記音声信号、再取得の音声信号が前記第1の閾値t1を超えない場合には、その音声信号を破棄する音声認識方法。 - 音声を集音して音声信号を取得し、
前記音声信号に対する閾値を設定し、
認識指示に従って前記閾値と前記音声信号とを比較して、前記音声信号が前記閾値に満たない場合は前記音声信号を破棄し、前記音声信号が閾値以上となった場合は、認識対象の話者の音声信号として認識処理を実行し、
前記閾値の設定は、前記音声信号の特徴量を抽出し、その特徴量から前記音声信号の取得位置と前記話者との距離を推定し、所定距離範囲内の話者の音声信号を取り込む値に閾値を設定する音声認識方法。 - 音声認識処理をコンピュータに実行させるための音声認識プログラムであって、
音声を集音して音声信号を取得する取得ステップと、
前記音声信号に対する閾値を設定する閾値設定ステップと、
認識指示入力に従って前記閾値と前記音声信号とを比較して、前記音声信号が前記閾値に満たない場合は前記音声信号を破棄し、前記音声信号が閾値以上となった場合は、認識対象の話者の音声信号として認識処理を実行する認識ステップと
を具備し、
前記閾値設定ステップは、
第1の閾値t1と第2の閾値t2(t1<t2)とを用意し、
第2の閾値t2を前記音声信号と比較し、前記音声信号が前記第2の閾値t2より高い場合には、音声認識処理に移行し、
前記音声信号が前記第2の閾値t2を超えない場合には、前記第2の閾値t2の再設定を行い、
前記第1の閾値t1を前記音声信号と比較し、前記音声信号が前記第1の閾値t1を超えた場合には音声認識処理を行い、音声信号の再取得を促し、再取得の音声信号を再度前記第1の閾値t1と比較し、再取得の音声信号が前記第1の閾値t1を超えた場合には音声認識処理を行い、
二回目の音声認識結果が一回目の音声認識結果と同じ場合には、前記第2の閾値t2を下げて再設定し、前記音声信号、再取得の音声信号が前記第1の閾値t1を超えない場合には、その音声信号を破棄する
音声認識プログラム。 - 音声認識処理をコンピュータに実行させるための音声認識プログラムであって、
音声を集音して音声信号を取得する取得ステップと、
前記音声信号に対する閾値を設定する閾値設定ステップと、
認識指示入力に従って前記閾値と前記音声信号とを比較して、前記音声信号が前記閾値に満たない場合は前記音声信号を破棄し、前記音声信号が閾値以上となった場合は、認識対象の話者の音声信号として認識処理を実行する認識ステップと
を具備し、
前記閾値設定ステップは、前記音声信号の特徴量を抽出し、その特徴量から前記音声信号の取得位置と前記話者との距離を推定し、所定距離範囲内の話者の音声信号を取り込む値に閾値を設定する音声認識プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017054907A JP6553111B2 (ja) | 2017-03-21 | 2017-03-21 | 音声認識装置、音声認識方法及び音声認識プログラム |
CN201710767713.4A CN108630202B (zh) | 2017-03-21 | 2017-08-31 | 语音识别装置、语音识别方法以及记录介质 |
US15/705,134 US10579327B2 (en) | 2017-03-21 | 2017-09-14 | Speech recognition device, speech recognition method and storage medium using recognition results to adjust volume level threshold |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017054907A JP6553111B2 (ja) | 2017-03-21 | 2017-03-21 | 音声認識装置、音声認識方法及び音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018156044A JP2018156044A (ja) | 2018-10-04 |
JP6553111B2 true JP6553111B2 (ja) | 2019-07-31 |
Family
ID=63581073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017054907A Active JP6553111B2 (ja) | 2017-03-21 | 2017-03-21 | 音声認識装置、音声認識方法及び音声認識プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10579327B2 (ja) |
JP (1) | JP6553111B2 (ja) |
CN (1) | CN108630202B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11462217B2 (en) | 2019-06-11 | 2022-10-04 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6642808B2 (ja) * | 2017-03-29 | 2020-02-12 | 京セラドキュメントソリューションズ株式会社 | 音声入力システム、音声入力装置および音声入力プログラム |
JP7173049B2 (ja) * | 2018-01-10 | 2022-11-16 | ソニーグループ株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
JP2020085953A (ja) * | 2018-11-16 | 2020-06-04 | トヨタ自動車株式会社 | 音声認識支援装置及び音声認識支援プログラム |
WO2020111880A1 (en) | 2018-11-30 | 2020-06-04 | Samsung Electronics Co., Ltd. | User authentication method and apparatus |
JP7131362B2 (ja) * | 2018-12-20 | 2022-09-06 | トヨタ自動車株式会社 | 制御装置、音声対話装置及びプログラム |
KR20200084727A (ko) | 2019-01-03 | 2020-07-13 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US11308949B2 (en) * | 2019-03-12 | 2022-04-19 | International Business Machines Corporation | Voice assistant response system based on a tone, keyword, language or etiquette behavioral rule |
JP7266432B2 (ja) * | 2019-03-14 | 2023-04-28 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
CN110083645A (zh) | 2019-05-06 | 2019-08-02 | 浙江核新同花顺网络信息股份有限公司 | 一种报告生成的系统和方法 |
CN110265010A (zh) * | 2019-06-05 | 2019-09-20 | 四川驹马科技有限公司 | 基于百度语音的货车多人语音识别方法及系统 |
CN110265018B (zh) * | 2019-07-01 | 2022-03-04 | 成都启英泰伦科技有限公司 | 一种连续发出的重复命令词识别方法 |
JP7248564B2 (ja) * | 2019-12-05 | 2023-03-29 | Tvs Regza株式会社 | 情報処理装置及びプログラム |
TWI719791B (zh) * | 2019-12-31 | 2021-02-21 | 緯創資通股份有限公司 | 觸控靈敏度的調整方法及使用此方法的行動裝置 |
CN111416909B (zh) * | 2020-03-31 | 2022-07-08 | 惠州Tcl移动通信有限公司 | 音量自适应调节方法、系统、存储介质及移动终端 |
CN112463107A (zh) * | 2020-11-25 | 2021-03-09 | Oppo广东移动通信有限公司 | 音频播放参数确定方法、装置、电子设备和可读存储介质 |
CN112599126B (zh) * | 2020-12-03 | 2022-05-27 | 海信视像科技股份有限公司 | 一种智能设备的唤醒方法、智能设备及计算设备 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0977172A4 (en) | 1997-03-19 | 2000-12-27 | Hitachi Ltd | METHOD AND DEVICE FOR DETERMINING THE START AND END POINT OF A SOUND SECTION IN VIDEO |
JP2000310993A (ja) * | 1999-04-28 | 2000-11-07 | Pioneer Electronic Corp | 音声検出装置 |
JP3891023B2 (ja) * | 2002-04-01 | 2007-03-07 | 日本電気株式会社 | 通訳システム及びプログラム |
JP2009075263A (ja) * | 2007-09-19 | 2009-04-09 | Kddi Corp | 音声認識装置およびコンピュータプログラム |
JP2009109536A (ja) * | 2007-10-26 | 2009-05-21 | Panasonic Electric Works Co Ltd | 音声認識システム及び音声認識装置 |
EP2293289B1 (en) * | 2008-06-06 | 2012-05-30 | Raytron, Inc. | Speech recognition system and method |
EP3258468B1 (en) | 2008-11-10 | 2019-08-21 | Google LLC | Multisensory speech detection |
JP5402089B2 (ja) * | 2009-03-02 | 2014-01-29 | 富士通株式会社 | 音響信号変換装置、方法、及びプログラム |
JP2011002534A (ja) * | 2009-06-17 | 2011-01-06 | Brother Industries Ltd | 音声認識装置 |
JP5621783B2 (ja) * | 2009-12-10 | 2014-11-12 | 日本電気株式会社 | 音声認識システム、音声認識方法および音声認識プログラム |
JP5695447B2 (ja) * | 2011-03-01 | 2015-04-08 | 株式会社東芝 | テレビジョン装置及び遠隔操作装置 |
JP5673330B2 (ja) | 2011-04-25 | 2015-02-18 | 株式会社デンソー | 音声入力装置 |
TWI557722B (zh) * | 2012-11-15 | 2016-11-11 | 緯創資通股份有限公司 | 語音干擾的濾除方法、系統,與電腦可讀記錄媒體 |
TWI601032B (zh) * | 2013-08-02 | 2017-10-01 | 晨星半導體股份有限公司 | 應用於聲控裝置的控制器與相關方法 |
WO2015030642A1 (en) * | 2013-08-29 | 2015-03-05 | Telefonaktiebolaget L M Ericsson (Publ) | Volume reduction for an electronic device |
EP2878515B1 (en) * | 2013-11-29 | 2017-03-08 | Harman Becker Automotive Systems GmbH | Generating an audio signal with a configurable distance cue |
JP6276132B2 (ja) | 2014-07-30 | 2018-02-07 | 株式会社東芝 | 発話区間検出装置、音声処理システム、発話区間検出方法およびプログラム |
CN105812517A (zh) * | 2014-12-31 | 2016-07-27 | 陕西天涯信息技术有限公司 | 一种具有语音识别功能的受话装置 |
WO2016136044A1 (ja) * | 2015-02-23 | 2016-09-01 | ソニー株式会社 | 情報処理システムおよび情報処理方法 |
-
2017
- 2017-03-21 JP JP2017054907A patent/JP6553111B2/ja active Active
- 2017-08-31 CN CN201710767713.4A patent/CN108630202B/zh active Active
- 2017-09-14 US US15/705,134 patent/US10579327B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11462217B2 (en) | 2019-06-11 | 2022-10-04 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
Also Published As
Publication number | Publication date |
---|---|
US10579327B2 (en) | 2020-03-03 |
US20180275951A1 (en) | 2018-09-27 |
JP2018156044A (ja) | 2018-10-04 |
CN108630202B (zh) | 2021-12-03 |
CN108630202A (zh) | 2018-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6553111B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP4816711B2 (ja) | 通話音声処理装置および通話音声処理方法 | |
JPH09212196A (ja) | 雑音抑圧装置 | |
JP4964204B2 (ja) | 複数信号区間推定装置、複数信号区間推定方法、そのプログラムおよび記録媒体 | |
JP2010112996A (ja) | 音声処理装置、音声処理方法およびプログラム | |
JP6276132B2 (ja) | 発話区間検出装置、音声処理システム、発話区間検出方法およびプログラム | |
KR20190130533A (ko) | 음성 검출기를 구비한 보청기 및 그 방법 | |
JP2014126856A (ja) | 雑音除去装置及びその制御方法 | |
JP6374936B2 (ja) | 音声認識方法、音声認識装置及びプログラム | |
KR20190129805A (ko) | 잡음 환경 분류 및 제거 기능을 갖는 보청기 및 그 방법 | |
CN107452398B (zh) | 回声获取方法、电子设备及计算机可读存储介质 | |
CN111199751B (zh) | 一种麦克风的屏蔽方法、装置和电子设备 | |
JP5803125B2 (ja) | 音声による抑圧状態検出装置およびプログラム | |
JP6878776B2 (ja) | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム | |
WO2019207912A1 (ja) | 情報処理装置及び情報処理方法 | |
KR20220104693A (ko) | 라이브 스피치 검출 | |
JP2006234888A (ja) | 残響除去装置、残響除去方法、残響除去プログラムおよび記録媒体 | |
JP4510539B2 (ja) | 特定話者音声出力装置及び特定話者判定プログラム | |
CN110661923A (zh) | 一种在会议中记录发言信息的方法和装置 | |
JP6106618B2 (ja) | 音声区間検出装置、音声認識装置、その方法、及びプログラム | |
JP6544439B2 (ja) | 困惑状態判定装置、困惑状態判定方法、及びプログラム | |
CN113380244A (zh) | 一种设备播放音量的智能调节方法和系统 | |
JP2005157086A (ja) | 音声認識装置 | |
WO2021059497A1 (ja) | 音信号処理装置、音信号処理方法および記憶媒体 | |
KR100574883B1 (ko) | 비음성 제거에 의한 음성 추출 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190703 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6553111 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |