JP6759898B2 - 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム - Google Patents
発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム Download PDFInfo
- Publication number
- JP6759898B2 JP6759898B2 JP2016175765A JP2016175765A JP6759898B2 JP 6759898 B2 JP6759898 B2 JP 6759898B2 JP 2016175765 A JP2016175765 A JP 2016175765A JP 2016175765 A JP2016175765 A JP 2016175765A JP 6759898 B2 JP6759898 B2 JP 6759898B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance section
- threshold value
- section
- frame
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 155
- 238000004590 computer program Methods 0.000 title claims description 10
- 230000005236 sound signal Effects 0.000 claims description 50
- 238000004364 calculation method Methods 0.000 claims description 49
- 238000012545 processing Methods 0.000 description 59
- 238000000034 method Methods 0.000 description 33
- 230000008569 process Effects 0.000 description 29
- 238000004891 communication Methods 0.000 description 21
- 238000012986 modification Methods 0.000 description 20
- 230000004048 modification Effects 0.000 description 20
- 238000012544 monitoring process Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 230000007774 longterm Effects 0.000 description 9
- 238000005070 sampling Methods 0.000 description 9
- 230000007704 transition Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 6
- 239000004065 semiconductor Substances 0.000 description 6
- 230000007423 decrease Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 229910019760 S109-No Inorganic materials 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000004704 glottis Anatomy 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
- G10L2025/786—Adaptive threshold
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
- G10L2025/906—Pitch tracking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
Description
この発話区間検出装置は、音声信号中で話者が発話している区間(以下、単に発話区間と呼ぶ)では、人の声の特性上、ある程度の周期性が認められることから、音の周期性の強さを表すピッチゲインに基づいて発話区間を検出する。これにより、この発話区間検出装置は、話者の声以外でも大きな値を取り得るパワーまたは信号対雑音比を利用するよりも、発話区間をより正確に検出できる。
処理部13が有するこれらの各部は、例えば、処理部13が有するプロセッサ上で動作するコンピュータプログラムにより実現される機能モジュールである。あるいは、処理部13が有するこれらの各部は、その各部の機能を実現する一つまたは複数の集積回路であってもよい。また処理部13は、音声信号を所定長を持つフレームを処理単位として発話区間検出処理を実行する。フレーム長は、例えば、10msec〜20msecに設定される。そのため、処理部13は、音声信号をフレームごとに分割し、各フレームをパワー算出部21及びピッチゲイン算出部25へ入力する。
なお、後述する有音判定部24により、現フレームが何らかの信号成分を含む有音フレームであると判定された場合には、雑音推定部22は、現フレームの推定雑音成分Noise(k)を、Noise(k-1)で置換してもよい。これにより、雑音推定部22は、雑音成分のみを含み、信号成分を含まないと推定されるフレームに基づいて雑音成分を推定できるので、雑音成分の推定精度を向上できる。
図10は、上記の何れかの実施形態またはその変形例による発話区間検出装置が実装されたサーバクライアントシステムの概略構成図である。
サーバクライアントシステム100は、端末110とサーバ120とを有し、端末110とサーバ120とは、通信ネットワーク130を介して互いに通信可能となっている。なお、サーバクライアントシステム100が有する端末110は複数存在してもよい。同様に、サーバクライアントシステム100が有するサーバ120は複数存在してもよい。
(付記1)
話者の声が表された音声信号を分割した所定長を持つフレームごとに、前記音声信号の周期性の強さを表すピッチゲインを算出するピッチゲイン算出部と、
前記話者が発話していない非発話区間が継続している場合において前記ピッチゲインが第1の閾値以上となると前記話者が発話している発話区間が開始されたと判定し、かつ、前記発話区間が継続している場合において前記ピッチゲインが前記第1の閾値よりも小さい第2の閾値未満となると前記発話区間が終了すると判定する発話区間検出部と、
を有する発話区間検出装置。
(付記2)
前記フレームごとに、前記音声信号の信号対雑音成分比を算出する信号対雑音成分比算出部と、
前記フレームごとの前記信号対雑音成分比に基づいて前記音声信号に信号成分が含まれる有音区間を検出する有音区間検出部とをさらに有し、
前記発話区間検出部は、前記有音区間内において直前のフレームが前記発話区間でなく、かつ、現フレームの前記ピッチゲインが前記第1の閾値以上となる場合に前記現フレームから前記発話区間が開始されたと判定する、付記1に記載の発話区間検出装置。
(付記3)
前記発話区間検出部は、前記発話区間が開始されたと判定されたフレームにおける前記ピッチゲインが大きいほど、前記第2の閾値を高くする、付記1または2に記載の発話区間検出装置。
(付記4)
前記フレームごとに、前記音声信号の信号対雑音成分比を算出する信号対雑音成分比算出部をさらに有し、
前記発話区間検出部は、前記信号対雑音成分比が大きいフレームほど、当該フレームにおける前記第1の閾値及び前記第2の閾値を高くする、付記1に記載の発話区間検出装置。
(付記5)
前記フレームごとに、前記音声信号の信号対雑音成分比を算出する信号対雑音成分比算出部と、
前記フレームごとの前記信号対雑音成分比に基づいて前記音声信号に信号成分が含まれる有音区間を検出する有音区間検出部とをさらに有し、
前記発話区間検出部は、前記有音区間が開始されたと判定したフレームにおける前記信号対雑音成分比が大きいほど、前記第1の閾値及び前記第2の閾値を高くする、付記1に記載の発話区間検出装置。
(付記6)
前記発話区間検出部は、前記発話区間が継続している場合において前記ピッチゲインが前記第2の閾値未満となる期間が一定期間継続すると前記発話区間が終了したと判定する、付記1〜5の何れかに記載の発話区間検出装置。
(付記7)
話者の声が表された音声信号を分割した所定長を持つフレームごとに、前記音声信号の周期性の強さを表すピッチゲインを算出し、
前記話者が発話していない非発話区間が継続している場合において前記ピッチゲインが第1の閾値以上となると前記話者が発話している発話区間が開始されたと判定し、かつ、前記発話区間が継続している場合において前記ピッチゲインが前記第1の閾値よりも小さい第2の閾値未満となると前記発話区間が終了すると判定する、
ことを含む発話区間検出方法。
(付記8)
話者の声が表された音声信号を分割した所定長を持つフレームごとに、前記音声信号の周期性の強さを表すピッチゲインを算出し、
前記話者が発話していない非発話区間が継続している場合において前記ピッチゲインが第1の閾値以上となると前記話者が発話している発話区間が開始されたと判定し、かつ、前記発話区間が継続している場合において前記ピッチゲインが前記第1の閾値よりも小さい第2の閾値未満となると前記発話区間が終了すると判定する、
ことをコンピュータに実行させるための発話区間検出用コンピュータプログラム。
(付記9)
話者の声が表された音声信号を取得するマイクロホンと、
前記音声信号を分割した所定長を持つフレームごとに、前記音声信号の周期性の強さを表すピッチゲインを算出し、
前記話者が発話していない非発話区間が継続している場合において前記ピッチゲインが第1の閾値以上となると前記話者が発話している発話区間が開始されたと判定し、かつ、前記発話区間が継続している場合において前記ピッチゲインが前記第1の閾値よりも小さい第2の閾値未満となると前記発話区間が終了すると判定するように構成されたプロセッサと、
を有する発話区間検出装置。
11 マイクロホン
12 アナログ/デジタルコンバータ
13 処理部
14 記憶部
21 パワー算出部
22 雑音推定部
23 信号対雑音比算出部
24 有音判定部
25 ピッチゲイン算出部
26 発話区間検出部
100 サーバクライアントシステム
110 端末
111 音声入力部
112 記憶部
113 通信部
114 制御部
120 サーバ
121 通信部
122 記憶部
123 処理部
130 通信ネットワーク
Claims (6)
- 話者の声が表された音声信号を分割した所定長を持つフレームごとに、前記音声信号の周期性の強さを表すピッチゲインを算出するピッチゲイン算出部と、
前記フレームごとに、前記音声信号の信号対雑音成分比を算出する信号対雑音成分比算出部と、
前記フレームごとの前記信号対雑音成分比に基づいて前記音声信号に信号成分が含まれる有音区間を検出する有音区間検出部と、
前記有音区間内において直前のフレームが発話区間でなく、かつ、現フレームの前記ピッチゲインが第1の閾値以上となる場合に前記現フレームから前記発話区間が開始されたと判定し、かつ、前記発話区間が継続している場合において前記ピッチゲインが前記第1の閾値よりも小さい第2の閾値未満となると前記発話区間が終了すると判定する発話区間検出部と、
を有する発話区間検出装置。 - 前記発話区間検出部は、前記発話区間が開始されたと判定されたフレームにおける前記ピッチゲインが大きいほど、前記第2の閾値を高くする、請求項1に記載の発話区間検出装置。
- 前記発話区間検出部は、前記信号対雑音成分比が大きいフレームほど、当該フレームにおける前記第1の閾値及び前記第2の閾値を高くする、請求項1に記載の発話区間検出装置。
- 前記発話区間検出部は、前記発話区間が継続している場合において前記ピッチゲインが前記第2の閾値未満となる期間が一定期間継続すると前記発話区間が終了したと判定する、請求項1〜3の何れか一項に記載の発話区間検出装置。
- 話者の声が表された音声信号を分割した所定長を持つフレームごとに、前記音声信号の周期性の強さを表すピッチゲインを算出し、
前記フレームごとに、前記音声信号の信号対雑音成分比を算出し、
前記フレームごとの前記信号対雑音成分比に基づいて前記音声信号に信号成分が含まれる有音区間を検出し、
前記有音区間内において直前のフレームが発話区間でなく、かつ、現フレームの前記ピッチゲインが第1の閾値以上となる場合に前記現フレームから前記発話区間が開始されたと判定し、かつ、前記発話区間が継続している場合において前記ピッチゲインが前記第1の閾値よりも小さい第2の閾値未満となると前記発話区間が終了すると判定する、
ことを含む発話区間検出方法。 - 話者の声が表された音声信号を分割した所定長を持つフレームごとに、前記音声信号の周期性の強さを表すピッチゲインを算出し、
前記話者が発話していない非発話区間が継続している場合において前記ピッチゲインが第1の閾値以上となると前記話者が発話している発話区間が開始されたと判定し、かつ、前記発話区間が継続している場合において前記ピッチゲインが前記第1の閾値よりも小さい第2の閾値未満となると前記発話区間が終了すると判定し、
前記発話区間が開始されたと判定されたフレームにおける前記ピッチゲインが大きいほど、前記第2の閾値を高くする、
ことをコンピュータに実行させるための発話区間検出用コンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016175765A JP6759898B2 (ja) | 2016-09-08 | 2016-09-08 | 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム |
US15/643,576 US10755731B2 (en) | 2016-09-08 | 2017-07-07 | Apparatus, method, and non-transitory computer-readable storage medium for storing program for utterance section detection |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016175765A JP6759898B2 (ja) | 2016-09-08 | 2016-09-08 | 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018040982A JP2018040982A (ja) | 2018-03-15 |
JP6759898B2 true JP6759898B2 (ja) | 2020-09-23 |
Family
ID=61281398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016175765A Active JP6759898B2 (ja) | 2016-09-08 | 2016-09-08 | 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10755731B2 (ja) |
JP (1) | JP6759898B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10609479B2 (en) | 2017-09-14 | 2020-03-31 | Fujitsu Limited | Device and method for determining a sound source direction |
EP3503592B1 (en) * | 2017-12-19 | 2020-09-16 | Nokia Technologies Oy | Methods, apparatuses and computer programs relating to spatial audio |
JP7243105B2 (ja) | 2018-09-27 | 2023-03-22 | 富士通株式会社 | 音源方向判定装置、音源方向判定方法、及び音源方向判定プログラム |
JP2020118838A (ja) * | 2019-01-23 | 2020-08-06 | 日本電信電話株式会社 | 判定装置、その方法、およびプログラム |
DE102019201879B3 (de) * | 2019-02-13 | 2020-06-04 | Sivantos Pte. Ltd. | Verfahren zum Betrieb eines Hörsystems und Hörsystem |
US11138981B2 (en) * | 2019-08-21 | 2021-10-05 | i2x GmbH | System and methods for monitoring vocal parameters |
KR20210031265A (ko) * | 2019-09-11 | 2021-03-19 | 삼성전자주식회사 | 전자 장치 및 그 동작방법 |
KR102516391B1 (ko) * | 2022-09-02 | 2023-04-03 | 주식회사 액션파워 | 음성 구간 길이를 고려하여 오디오에서 음성 구간을 검출하는 방법 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5018200A (en) * | 1988-09-21 | 1991-05-21 | Nec Corporation | Communication system capable of improving a speech quality by classifying speech signals |
JP3211398B2 (ja) | 1992-09-04 | 2001-09-25 | 松下電器産業株式会社 | テレビ会議用発言音声検出装置 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
JP2739811B2 (ja) | 1993-11-29 | 1998-04-15 | 日本電気株式会社 | 雑音抑圧方式 |
JPH11133997A (ja) | 1997-11-04 | 1999-05-21 | Matsushita Electric Ind Co Ltd | 有音無音判定装置 |
US6188981B1 (en) * | 1998-09-18 | 2001-02-13 | Conexant Systems, Inc. | Method and apparatus for detecting voice activity in a speech signal |
US7013269B1 (en) * | 2001-02-13 | 2006-03-14 | Hughes Electronics Corporation | Voicing measure for a speech CODEC system |
US7171357B2 (en) * | 2001-03-21 | 2007-01-30 | Avaya Technology Corp. | Voice-activity detection using energy ratios and periodicity |
US8311819B2 (en) * | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
US8532984B2 (en) * | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
JP2008058667A (ja) * | 2006-08-31 | 2008-03-13 | Sony Corp | 信号処理装置および方法、記録媒体、並びにプログラム |
WO2011049515A1 (en) * | 2009-10-19 | 2011-04-28 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and voice activity detector for a speech encoder |
WO2011148230A1 (en) * | 2010-05-25 | 2011-12-01 | Nokia Corporation | A bandwidth extender |
US8762150B2 (en) * | 2010-09-16 | 2014-06-24 | Nuance Communications, Inc. | Using codec parameters for endpoint detection in speech recognition |
US8751220B2 (en) * | 2011-11-07 | 2014-06-10 | Broadcom Corporation | Multiple microphone based low complexity pitch detector |
JP2015004703A (ja) | 2013-06-19 | 2015-01-08 | アルパイン株式会社 | 電子装置、音声信号の転送方法、音声信号の転送プログラム及び音声処理システム |
CN106328169B (zh) * | 2015-06-26 | 2018-12-11 | 中兴通讯股份有限公司 | 一种激活音修正帧数的获取方法、激活音检测方法和装置 |
US11631421B2 (en) * | 2015-10-18 | 2023-04-18 | Solos Technology Limited | Apparatuses and methods for enhanced speech recognition in variable environments |
WO2017196382A1 (en) * | 2016-05-11 | 2017-11-16 | Nuance Communications, Inc. | Enhanced de-esser for in-car communication systems |
-
2016
- 2016-09-08 JP JP2016175765A patent/JP6759898B2/ja active Active
-
2017
- 2017-07-07 US US15/643,576 patent/US10755731B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10755731B2 (en) | 2020-08-25 |
JP2018040982A (ja) | 2018-03-15 |
US20180068677A1 (en) | 2018-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6759898B2 (ja) | 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム | |
US9536525B2 (en) | Speaker indexing device and speaker indexing method | |
JP4322785B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
US20190180758A1 (en) | Voice processing apparatus, voice processing method, and non-transitory computer-readable storage medium for storing program | |
EP2083417B1 (en) | Sound processing device and program | |
US9031841B2 (en) | Speech recognition apparatus, speech recognition method, and speech recognition program | |
KR101836430B1 (ko) | 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버 | |
WO2007046267A1 (ja) | 音声判別システム、音声判別方法及び音声判別用プログラム | |
JP6699748B2 (ja) | 対話装置、対話方法及び対話用コンピュータプログラム | |
JP6176055B2 (ja) | 音声検索装置及び音声検索方法 | |
JP2015068897A (ja) | 発話の評価方法及び装置、発話を評価するためのコンピュータプログラム | |
JP6996185B2 (ja) | 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム | |
JPH11175082A (ja) | 音声対話装置及び音声対話用音声合成方法 | |
JP5803125B2 (ja) | 音声による抑圧状態検出装置およびプログラム | |
JP2005070367A (ja) | 信号分析装置、信号処理装置、音声認識装置、信号分析プログラム、信号処理プログラムおよび音声認識プログラム、記録媒体、並びに電子機器 | |
JP2011154341A (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
KR102051966B1 (ko) | 음성 인식 향상 장치 및 방법 | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム | |
Kasap et al. | A unified approach to speech enhancement and voice activity detection | |
KR20230118165A (ko) | 핫워드 속성에 기초한 자동화된 스피치 인식 파라미터적응시키기 | |
KR20100111544A (ko) | 음성인식을 이용한 발음 교정 시스템 및 그 방법 | |
JP2019032400A (ja) | 発話判定プログラム、発話判定方法、及び発話判定装置 | |
Prasangini et al. | Sinhala speech to sinhala unicode text conversion for disaster relief facilitation in sri lanka | |
JP4632831B2 (ja) | 音声認識方法および音声認識装置 | |
JP2015087557A (ja) | 発話様式検出装置および発話様式検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190611 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200225 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200817 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6759898 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |