JP6176055B2 - 音声検索装置及び音声検索方法 - Google Patents
音声検索装置及び音声検索方法 Download PDFInfo
- Publication number
- JP6176055B2 JP6176055B2 JP2013218422A JP2013218422A JP6176055B2 JP 6176055 B2 JP6176055 B2 JP 6176055B2 JP 2013218422 A JP2013218422 A JP 2013218422A JP 2013218422 A JP2013218422 A JP 2013218422A JP 6176055 B2 JP6176055 B2 JP 6176055B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- section
- score
- threshold
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 62
- 238000001514 detection method Methods 0.000 claims description 83
- 238000012545 processing Methods 0.000 claims description 67
- 230000008569 process Effects 0.000 claims description 50
- 230000007423 decrease Effects 0.000 claims description 14
- 241001417093 Moridae Species 0.000 claims 2
- 230000006870 function Effects 0.000 description 18
- 238000004891 communication Methods 0.000 description 10
- 238000007476 Maximum Likelihood Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 208000003028 Stuttering Diseases 0.000 description 4
- 238000005311 autocorrelation function Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012888 cubic function Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000012887 quadratic function Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
この音声検索装置は、音声データから、相対的に検出精度が低いものの、相対的に処理量が少ない簡易音声検索処理(第1の音声検索処理)により、検索対象となる検索語が含まれている可能性がある候補区間を検出する。そしてこの音声検索装置は、その候補区間に対して、相対的に処理量が多いものの、相対的に検出精度が高い精密音声検索処理(第2の音声検索処理)を適用することにより、その候補区間に検索語が含まれているか否か判定する。ここで、この音声検索装置は、検索語自身の特徴に基づいて、検索精度が高いか、出現する確率が低い検索語ほど、簡易音声検索処理による候補区間の検出基準を厳しく、すなわち、候補区間が検出され難くなるように設定する。逆に、この音声検索装置は、検索精度が低いか、出現する確率が高い検索語ほど、候補区間の検出基準を緩く、すなわち、候補区間が検出され易くなるように設定する。これにより、この音声検索装置は、音声データに含まれる検索語の検出精度の低下を抑制しつつ、検索語の検出に要する処理量を軽減する。
しかし、音声検索装置は、電話機に組み込まれるものに限られず、音声データを扱う様々な装置、例えば、ICレコーダまたはコンピュータに実装されてもよい。
処理部7が有するこれらの各部は、例えば、処理部7が有するプロセッサ上で動作するコンピュータプログラムにより実現される機能モジュールである。あるいは、処理部7が有するこれらの各部は、それぞれ、別個の回路として、電話機1に実装されてもよく、あるいはこれらの各部の機能を実現する一つの集積回路として、処理部7とは別個に電話機1に実装されてもよい。
発話区間検出部11は、発話区間が検出される度に、その発話区間の開始時刻と終了時刻とを簡易照合部13に通知する。
閾値設定部12は、順位閾値nkを簡易照合部13に通知する。
(1)「と」を「こ」に置換 (とうきょく)→(こうきょく)
(2)「く」を削除 (こうきょく)→(こうきょ)
したがって、編集距離は2となる。
なお、簡易照合部13は、音節単位で編集距離を算出する代わりに、音素単位で編集距離を算出してもよい。
音響モデルは、例えば、単語の発音を音素または音節といった単位音ごとに区分し、その単位音の順序に従って、その単位音に対応する単位音響モデルを連結することにより生成される。この単位音響モデル及び音響モデルは、例えば、それぞれ、隠れマルコフモデル(Hidden Markov Model, HMM)により表される。
発話区間検出部11は、検索対象となる音声データから、何れかの話者が発話している発話区間を検出する(ステップS101)。一方、閾値設定部12は、ユーザインターフェース部6を介して指定された検索語の特徴に基づいて、検索精度が高い検索語ほど順位閾値nkが小さくなるように、順位閾値nkを設定する(ステップS102)。
第2の実施形態による音声検索装置は、第1の実施形態による音声検索装置と比較して、処理部7の閾値設定部12の処理だけが異なる。そこで以下では、閾値設定部12及びその関連部分について説明する。
一方、閾値設定部12は、検索語の出現確率が高いほど、順位閾値を大きくすることで、候補区間の数を多くして、検索語を含む区間が候補区間から外れる可能性を低減させる。
第3の実施形態による音声検索装置は、第1の実施形態による音声検索装置と比較して、処理部7の閾値設定部12及び簡易照合部13の処理が異なる。そこで以下では、閾値設定部12、簡易照合部13及びその関連部分について説明する。
閾値設定部12は、スコア閾値xpを簡易照合部13へ通知する。
発話区間検出部11は、検索対象となる音声データから、何れかの話者が発話している発話区間を検出する(ステップS201)。一方、閾値設定部12は、ユーザインターフェース部6を介して指定された検索語の発音難易度に基づいて、発音難易度が低い検索語ほどスコア閾値xpが高くなるように、スコア閾値xpを設定する(ステップS202)。
第4の実施形態による音声検索装置は、第1の実施形態による音声検索装置と比較して、処理部7の閾値設定部12及び簡易照合部13の処理が異なる。そこで以下では、閾値設定部12、簡易照合部13及びその関連部分について説明する。
閾値設定部12は、順位閾値Nk,w及びスコア閾値xpを簡易照合部13へ通知する。
例えば、簡易照合部13は、第1の実施形態における簡易照合部と同様に、音声データ中の発話区間内の検索語と同じ長さの区間ごとに照合スコアSを算出する。そして簡易照合部13は、例えば、照合スコアSがスコア閾値xp以上となり、かつ、照合スコアが高い方から順にNk,w個以内となる区間を候補区間として検出する。
あるいは、簡易照合部13は、照合スコアSがスコア閾値xp以上となるか、または、照合スコアSが高い方から順にNk,w個以内となる区間を候補区間として検出してもよい。
あるいはまた、簡易照合部13は、照合スコアSがスコア閾値(αxp)以上となる区間を候補区間として検出する。また、簡易照合部13は、照合スコアSが高い方から順に(βNk,w)個以内となる区間を候補区間として検出する。さらに、簡易照合部13は、照合スコアSがスコア閾値xp以上となり、かつ、照合スコアが高い方から順にNk,w個以内となる区間を候補区間としてもよい。なお、α、βは定数であり、例えば、それぞれ、1.1〜1.2、0.8〜0.9に設定される。
発話区間検出部11は、検索対象となる音声データから、何れかの話者が発話している発話区間を検出する(ステップS301)。一方、閾値設定部12は、ユーザインターフェース部6を介して指定された検索語のモーラ数が多いほど、あるいは、検索語の出現確率が低いほど、順位閾値nkが小さくなるように、順位閾値nkを設定する(ステップS302)。さらに、閾値設定部12は、発音難易度が低い検索語ほどスコア閾値xpが高くなるように、スコア閾値xpを設定する(ステップS303)。
(付記1)
検索語の特徴に基づいて、該検索語の検出精度が高いほど、該検索語の発音難易度が低いほど、あるいは該検索語の出現確率が低いほど厳しくなるように、該検索語の検出基準を設定する検出基準設定部と、
音声データに対して前記検出基準に従って第1の音声検索処理を行うことにより、前記音声データから前記検索語が含まれる可能性がある区間を候補区間として検出する第1の照合部と、
前記候補区間のそれぞれに対して前記第1の音声検索処理と異なる第2の音声検索処理を行うことにより、前記候補区間のそれぞれについて前記検索語が含まれるか否か判定する第2の照合部と、
を有する音声検索装置。
(付記2)
前記第1の音声検索処理の処理量は、前記第2の音声検索処理の処理量よりも少ない、付記1に記載の音声検索装置。
(付記3)
前記第1の照合部は、前記音声データに含まれる複数の区間のそれぞれごとに、前記第1の音声検索処理に従って前記検索語が含まれる可能性を表す照合スコアを算出し、前記照合スコアが前記検出基準を満たす区間を前記候補区間として検出する、付記1または2に記載の音声検索装置。
(付記4)
前記検出基準設定部は、前記検索語に含まれるモーラ数を前記検索語の特徴として算出し、該モーラ数が多いほど、前記検出基準を厳しく設定する、付記3に記載の音声検索装置。
(付記5)
前記検出基準設定部は、前記検索語の出現確率を前記検索語の特徴として算出し、該出現確率が低いほど、前記検出基準を厳しく設定する、付記3に記載の音声検索装置。
(付記6)
前記検出基準は、前記照合スコアが高い方からの順序に対する順位閾値であり、
前記検出基準設定部は、前記検出基準が厳しいほど前記順位閾値を小さくし、
前記第1の照合部は、前記複数の区間のうち、対応する前記照合スコアの順位が高い方から順に前記順位閾値以下となる区間を前記候補区間として検出する、付記3〜5のいずれかに記載の音声検索装置。
(付記7)
前記検出基準は、前記照合スコアに対するスコア閾値であり、
前記検出基準設定部は、前記検出基準が厳しいほど、前記スコア閾値を高くし、
前記第1の照合部は、前記複数の区間のうち、対応する前記照合スコアが前記スコア閾値以上となる区間を前記候補区間として検出する、付記3〜5のいずれかに記載の音声検索装置。
(付記8)
前記検出基準は、前記照合スコアが高い方からの順序に対する順位閾値及び前記照合スコアに対するスコア閾値であり、
前記検出基準設定部は、前記検出基準が厳しいほど、前記順位閾値を小さくするとともに前記スコア閾値を高くし、
前記第1の照合部は、前記複数の区間のうち、対応する前記照合スコアが前記スコア閾値以上となり、かつ、前記照合スコアの順位が高い方から順に前記順位閾値以下となる区間を前記候補区間として検出する、付記3〜5のいずれかに記載の音声検索装置。
(付記9)
前記検出基準は、前記照合スコアが高い方からの順序に対する順位閾値及び前記照合スコアに対するスコア閾値であり、
前記検出基準設定部は、前記検出基準が厳しいほど、前記順位閾値を小さくするとともに前記スコア閾値を高くし、
前記第1の照合部は、前記複数の区間のうち、対応する前記照合スコアが前記スコア閾値以上となるか、または、前記照合スコアの順位が高い方から順に前記順位閾値以下となる区間を前記候補区間として検出する、付記3〜5のいずれかに記載の音声検索装置。
(付記10)
前記検索語を指定する入力部をさらに有する、付記1〜9のいずれかに記載の音声検索装置。
(付記11)
検索語の特徴に基づいて、該検索語の検出精度が高いほど、該検索語の発音難易度が低いほど、あるいは該検索語の出現確率が低いほど厳しくなるように、該検索語の検出基準を設定し、
音声データに対して前記検出基準に従って第1の音声検索処理を行うことにより、前記音声データから前記検索語が含まれる可能性がある区間を候補区間として検出し、
前記候補区間のそれぞれに対して前記第1の音声検索処理と異なる第2の音声検索処理を行うことにより、前記候補区間のそれぞれについて検索語が含まれるか否か判定する、
ことを含む音声検索方法。
2 マイクロホン
3 通信部
4 記憶媒体アクセス装置
5 記憶部
6 ユーザインターフェース部
7 処理部
8 スピーカ
9 記憶媒体
11 発話区間検出部
12 閾値設定部(検出基準設定部)
13 簡易照合部(第1の照合部)
14 精密照合部(第2の照合部)
Claims (7)
- 検索語に含まれるモーラ数が多いほど、あるいは、該検索語の発音難易度が低いほど、該検索語が含まれるか否かの判定対象となる候補区間が検出され難くなるように、該候補区間の検出基準を設定する検出基準設定部と、
音声データに対して前記検出基準に従って第1の音声検索処理を行うことにより、前記音声データから前記検索語が含まれる可能性がある区間を前記候補区間として検出する第1の照合部と、
前記候補区間のそれぞれに対して前記第1の音声検索処理と異なる第2の音声検索処理を行うことにより、前記候補区間のそれぞれについて前記検索語が含まれるか否か判定する第2の照合部と、
を有する音声検索装置。 - 前記第1の照合部は、前記音声データに含まれる複数の区間のそれぞれごとに、前記第1の音声検索処理に従って前記検索語が含まれる可能性を表す照合スコアを算出し、前記照合スコアが前記検出基準を満たす区間を前記候補区間として検出する、請求項1に記載の音声検索装置。
- 前記検出基準は、前記照合スコアが高い方からの順序に対する順位閾値であり、
前記検出基準設定部は、前記候補区間が検出され難くなるほど前記順位閾値を小さくし、
前記第1の照合部は、前記複数の区間のうち、対応する前記照合スコアの順位が高い方から順に前記順位閾値以下となる区間を前記候補区間として検出する、請求項2に記載の音声検索装置。 - 前記検出基準は、前記照合スコアに対するスコア閾値であり、
前記検出基準設定部は、前記候補区間が検出され難くなるほど、前記スコア閾値を高くし、
前記第1の照合部は、前記複数の区間のうち、対応する前記照合スコアが前記スコア閾値以上となる区間を前記候補区間として検出する、請求項2に記載の音声検索装置。 - 前記検出基準は、前記照合スコアが高い方からの順序に対する順位閾値及び前記照合スコアに対するスコア閾値であり、
前記検出基準設定部は、前記候補区間が検出され難くなるほど、前記順位閾値を小さくするとともに前記スコア閾値を高くし、
前記第1の照合部は、前記複数の区間のうち、対応する前記照合スコアが前記スコア閾値以上となり、かつ、前記照合スコアの順位が高い方から順に前記順位閾値以下となる区間を前記候補区間として検出する、請求項2に記載の音声検索装置。 - 前記検出基準は、前記照合スコアが高い方からの順序に対する順位閾値及び前記照合スコアに対するスコア閾値であり、
前記検出基準設定部は、前記候補区間が検出され難くなるほど、前記順位閾値を小さくするとともに前記スコア閾値を高くし、
前記第1の照合部は、前記複数の区間のうち、対応する前記照合スコアが前記スコア閾値以上となるか、または、前記照合スコアの順位が高い方から順に前記順位閾値以下となる区間を前記候補区間として検出する、請求項2に記載の音声検索装置。 - 処理部により、検索語に含まれるモーラ数が多いほど、あるいは、該検索語の発音難易度が低いほど、該検索語が含まれるか否かの判定対象となる候補区間が検出され難くなるように、該候補区間の検出基準を設定し、
前記処理部により、音声データに対して前記検出基準に従って第1の音声検索処理を行うことにより、前記音声データから前記検索語が含まれる可能性がある区間を前記候補区間として検出し、
前記処理部により、前記候補区間のそれぞれに対して前記第1の音声検索処理と異なる第2の音声検索処理を行うことにより、前記候補区間のそれぞれについて検索語が含まれるか否か判定する、
ことを含む音声検索方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013218422A JP6176055B2 (ja) | 2013-10-21 | 2013-10-21 | 音声検索装置及び音声検索方法 |
US14/515,882 US9466291B2 (en) | 2013-10-21 | 2014-10-16 | Voice retrieval device and voice retrieval method for detecting retrieval word from voice data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013218422A JP6176055B2 (ja) | 2013-10-21 | 2013-10-21 | 音声検索装置及び音声検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015082138A JP2015082138A (ja) | 2015-04-27 |
JP6176055B2 true JP6176055B2 (ja) | 2017-08-09 |
Family
ID=52826944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013218422A Active JP6176055B2 (ja) | 2013-10-21 | 2013-10-21 | 音声検索装置及び音声検索方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9466291B2 (ja) |
JP (1) | JP6176055B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7153998B2 (ja) | 2017-02-15 | 2022-10-17 | 住友重機械工業株式会社 | モータ |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6501259B2 (ja) * | 2015-08-04 | 2019-04-17 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
JP6794990B2 (ja) * | 2015-09-30 | 2020-12-02 | ヤマハ株式会社 | 楽曲検索方法および楽曲検索装置 |
US10601599B2 (en) * | 2017-12-29 | 2020-03-24 | Synaptics Incorporated | Voice command processing in low power devices |
CN108564941B (zh) * | 2018-03-22 | 2020-06-02 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置、设备及存储介质 |
US10847162B2 (en) * | 2018-05-07 | 2020-11-24 | Microsoft Technology Licensing, Llc | Multi-modal speech localization |
KR102418953B1 (ko) * | 2020-05-11 | 2022-07-11 | 네이버 주식회사 | 쇼핑 검색 결과 확장 방법 및 시스템 |
KR102517661B1 (ko) | 2022-07-15 | 2023-04-04 | 주식회사 액션파워 | 텍스트 정보에서 타겟 단어에 대응하는 단어를 식별하는 방법 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62206597A (ja) | 1986-03-07 | 1987-09-11 | 日本電気株式会社 | 音声認識用単語予備選択方式 |
JPH0575119A (ja) | 1991-09-17 | 1993-03-26 | Nippon Telegr & Teleph Corp <Ntt> | Soi型半導体装置 |
JP3428058B2 (ja) | 1993-03-12 | 2003-07-22 | 松下電器産業株式会社 | 音声認識装置 |
JP3583299B2 (ja) | 1998-09-22 | 2004-11-04 | 三菱電機株式会社 | 連続音声認識用の探索装置および連続音声認識用の探索方法 |
JP2002278579A (ja) * | 2001-03-16 | 2002-09-27 | Ricoh Co Ltd | 音声データ検索装置 |
US6473573B2 (en) | 2001-03-21 | 2002-10-29 | Toshiba Tec Kabushiki Kaisha | Developing apparatus with temperature sensor |
US7039585B2 (en) * | 2001-04-10 | 2006-05-02 | International Business Machines Corporation | Method and system for searching recorded speech and retrieving relevant segments |
US7117159B1 (en) * | 2001-09-26 | 2006-10-03 | Sprint Spectrum L.P. | Method and system for dynamic control over modes of operation of voice-processing in a voice command platform |
JP2004037813A (ja) | 2002-07-03 | 2004-02-05 | Auto Network Gijutsu Kenkyusho:Kk | 車載用音声認識装置およびそれを用いた音声認識システム |
US7076427B2 (en) * | 2002-10-18 | 2006-07-11 | Ser Solutions, Inc. | Methods and apparatus for audio data monitoring and evaluation using speech recognition |
US7542904B2 (en) * | 2005-08-19 | 2009-06-02 | Cisco Technology, Inc. | System and method for maintaining a speech-recognition grammar |
US7788095B2 (en) * | 2007-11-18 | 2010-08-31 | Nice Systems, Ltd. | Method and apparatus for fast search in call-center monitoring |
US8548812B2 (en) * | 2008-12-22 | 2013-10-01 | Avaya Inc. | Method and system for detecting a relevant utterance in a voice session |
US9800721B2 (en) * | 2010-09-07 | 2017-10-24 | Securus Technologies, Inc. | Multi-party conversation analyzer and logger |
JP5549506B2 (ja) * | 2010-09-28 | 2014-07-16 | 富士通株式会社 | 音声認識装置及び音声認識方法 |
JP5824829B2 (ja) * | 2011-03-15 | 2015-12-02 | 富士通株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
JP5668553B2 (ja) * | 2011-03-18 | 2015-02-12 | 富士通株式会社 | 音声誤検出判別装置、音声誤検出判別方法、およびプログラム |
US9672815B2 (en) * | 2012-07-20 | 2017-06-06 | Interactive Intelligence Group, Inc. | Method and system for real-time keyword spotting for speech analytics |
JP2014106247A (ja) * | 2012-11-22 | 2014-06-09 | Fujitsu Ltd | 信号処理装置、信号処理方法および信号処理プログラム |
US20140310000A1 (en) * | 2013-04-16 | 2014-10-16 | Nexidia Inc. | Spotting and filtering multimedia |
-
2013
- 2013-10-21 JP JP2013218422A patent/JP6176055B2/ja active Active
-
2014
- 2014-10-16 US US14/515,882 patent/US9466291B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7153998B2 (ja) | 2017-02-15 | 2022-10-17 | 住友重機械工業株式会社 | モータ |
Also Published As
Publication number | Publication date |
---|---|
JP2015082138A (ja) | 2015-04-27 |
US20150112681A1 (en) | 2015-04-23 |
US9466291B2 (en) | 2016-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6176055B2 (ja) | 音声検索装置及び音声検索方法 | |
JP6024180B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
US7013276B2 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
US7921014B2 (en) | System and method for supporting text-to-speech | |
KR20080050311A (ko) | 음성 처리 장치 및 음성 처리 방법 및 프로그램 | |
JP2008275731A (ja) | テキスト発音記号変換辞書作成装置、認識語彙辞書作成装置、及び音声認識装置 | |
JP6111802B2 (ja) | 音声対話装置及び対話制御方法 | |
JP2014232268A (ja) | 音声認識における読み精度を改善するシステム、方法、およびプログラム | |
JP2018040982A (ja) | 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム | |
JP2016062069A (ja) | 音声認識方法、及び音声認識装置 | |
JP6127422B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JPWO2013018294A1 (ja) | 音声合成装置および音声合成方法 | |
Jothilakshmi et al. | Large scale data enabled evolution of spoken language research and applications | |
JP6028556B2 (ja) | 対話制御方法及び対話制御用コンピュータプログラム | |
JP4758919B2 (ja) | 音声認識装置及び音声認識プログラム | |
JP2018045127A (ja) | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
JP5152588B2 (ja) | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム | |
JP2019053233A (ja) | 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム | |
Feraru et al. | Comparative analysis between SROL-Romanian database and Emo-German database | |
JPWO2011077924A1 (ja) | 音声検出装置、音声検出方法、および音声検出プログラム | |
JP2003271183A (ja) | 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体 | |
Qader et al. | Probabilistic speaker pronunciation adaptation for spontaneous speech synthesis using linguistic features | |
JP2011180308A (ja) | 音声認識装置及び記録媒体 | |
JP6183147B2 (ja) | 情報処理装置、プログラム、及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170425 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170613 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170626 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6176055 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |