JP6221267B2 - 音声認識装置及び方法、並びに、半導体集積回路装置 - Google Patents
音声認識装置及び方法、並びに、半導体集積回路装置 Download PDFInfo
- Publication number
- JP6221267B2 JP6221267B2 JP2013042664A JP2013042664A JP6221267B2 JP 6221267 B2 JP6221267 B2 JP 6221267B2 JP 2013042664 A JP2013042664 A JP 2013042664A JP 2013042664 A JP2013042664 A JP 2013042664A JP 6221267 B2 JP6221267 B2 JP 6221267B2
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- integrated circuit
- circuit device
- semiconductor integrated
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000004065 semiconductor Substances 0.000 title claims description 53
- 238000000034 method Methods 0.000 title claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 94
- 230000005236 sound signal Effects 0.000 claims description 59
- 230000004044 response Effects 0.000 claims description 54
- 238000001514 detection method Methods 0.000 claims description 42
- 238000000605 extraction Methods 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 238000003786 synthesis reaction Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 7
- 235000013305 food Nutrition 0.000 description 31
- 235000021438 curry Nutrition 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 3
- 240000008620 Fagopyrum esculentum Species 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 2
- 210000000707 wrist Anatomy 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 230000009118 appropriate response Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Description
図1は、本発明の一実施形態に係る音声認識装置の構成例を示す図である。この音声認識装置は、例えば、自動販売機、家電製品、住宅設備、車載装置(ナビゲーション装置等)、又は、携帯端末等に搭載され、ユーザーの音声を認識し、その認識結果に対応する応答や処理を行うものである。
A1a(i)=A1(i)−k・(M−R)・(A2(i)−A1(i))
A2a(i)=A2(i)+k・(M−R)・(A2(i)−A1(i))
ここで、kは定数である。
A1a(i)≦B(i)≦A2a(i)
一致検出部37は、入力された音声信号の少なくとも一部から生成された特徴パターンが標準パターンの広がりの範囲内に入っていれば、両者の一致を検出する。
Claims (7)
- 所定の言語において用いられる複数の音素の周波数成分の分布状態を表す標準パターンを含む音声認識データベースを格納する音声認識データベース格納部と、
変換候補となる単語又は文章を表すテキストデータ、及び、前記変換候補となる単語又は文章を認識する際に適用される認識精度の厳密さを表す認識精度パラメーターを、コマンドと共に受信し、前記コマンドに従って、変換リストにテキストデータを設定する変換情報設定部と、
前記変換リストを格納する変換リスト格納部と、
前記変換リストに設定されたテキストデータによって表される各々の単語又は文章の少なくとも一部に対応する前記標準パターンを前記音声認識データベースから抽出する標準パターン抽出部と、
前記認識精度パラメーターに従って、前記音声認識データベースから抽出された前記標準パターンの広がりの範囲を調整する認識精度調整部と、
入力された音声信号にフーリエ変換を施すことにより前記音声信号の周波数成分を抽出し、前記音声信号の周波数成分の分布状態を表す特徴パターンを生成する信号処理部と、
前記音声信号の少なくとも一部から生成された前記特徴パターンが前記標準パターンの広がりの範囲内に入っていれば両者の一致を検出し、変換候補となる単語又は文章の内で一致が検出された単語又は文章を特定する音声認識結果を出力する一致検出部と、
を具備する半導体集積回路装置。 - 前記音声認識結果に対する応答内容を表す応答データを受信し、前記応答データに基づいて出力音声信号を合成する音声信号合成部をさらに具備する、請求項1記載の半導体集積回路装置。
- 前記信号処理部が、前記音声信号のレベルが所定の値を超えたときに音声検出信号を活性化する、請求項1又は2記載の半導体集積回路装置。
- 請求項1記載の半導体集積回路装置と、
前記変換候補となる単語又は文章を表すテキストデータ、及び、前記認識精度パラメーターを、前記コマンドと共に前記半導体集積回路装置に送信する制御部と、
を具備する音声認識装置。 - 請求項2記載の半導体集積回路装置と、
前記半導体集積回路装置から出力される前記音声認識結果に応じて複数の応答内容の中から前記応答内容を選択し、選択された前記応答内容を表す前記応答データ、前記応答内容に対する回答として前記変換候補となる単語又は文章を表すテキストデータ、及び、前記変換候補となる単語又は文章に応じて選択された前記認識精度パラメーターを、前記コマンドと共に前記半導体集積回路装置に送信する制御部と、
を具備する音声認識装置。 - 請求項3記載の半導体集積回路装置と、
前記音声検出信号が活性化されてから所定の期間内に前記特徴パターンと前記標準パターンとの一致を表す前記音声認識結果が得られない場合に、新たな前記認識精度パラメーターを新たな前記コマンドと共に前記半導体集積回路装置に送信し、一致検出を行うように前記半導体集積回路装置を制御する制御部と、
を具備する音声認識装置。 - 変換候補となる単語又は文章を表すテキストデータ、及び、前記変換候補となる単語又は文章を認識する際に適用される認識精度の厳密さを表す認識精度パラメーターを、コマンドと共に受信し、前記コマンドに従って、変換リストにテキストデータを設定するステップ(a)と、
所定の言語において用いられる複数の音素の周波数成分の分布状態を表す標準パターンを含む音声認識データベースから、前記変換リストに設定されたテキストデータによって表される各々の単語又は文章の少なくとも一部に対応する前記標準パターンを抽出するステップ(b)と、
前記認識精度パラメーターに従って、前記音声認識データベースから抽出された前記標準パターンの広がりの範囲を調整するステップ(c)と、
入力された音声信号にフーリエ変換を施すことにより前記音声信号の周波数成分を抽出し、前記音声信号の周波数成分の分布状態を表す特徴パターンを生成するステップ(d)と、
前記音声信号の少なくとも一部から生成された前記特徴パターンが前記標準パターンの広がりの範囲内に入っていれば両者の一致を検出し、前記変換候補となる単語又は文章の内で一致が検出された単語又は文章を特定する音声認識結果を出力するステップ(e)と、
を具備する音声認識方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013042664A JP6221267B2 (ja) | 2013-03-05 | 2013-03-05 | 音声認識装置及び方法、並びに、半導体集積回路装置 |
US14/180,672 US9886947B2 (en) | 2013-02-25 | 2014-02-14 | Speech recognition device and method, and semiconductor integrated circuit device |
CN201410065495.6A CN104008752B (zh) | 2013-02-25 | 2014-02-25 | 语音识别装置及方法、以及半导体集成电路装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013042664A JP6221267B2 (ja) | 2013-03-05 | 2013-03-05 | 音声認識装置及び方法、並びに、半導体集積回路装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014170163A JP2014170163A (ja) | 2014-09-18 |
JP6221267B2 true JP6221267B2 (ja) | 2017-11-01 |
Family
ID=51692584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013042664A Active JP6221267B2 (ja) | 2013-02-25 | 2013-03-05 | 音声認識装置及び方法、並びに、半導体集積回路装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6221267B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02106800A (ja) * | 1988-10-17 | 1990-04-18 | Matsushita Refrig Co Ltd | 音声認識システム |
JPH03231297A (ja) * | 1990-02-06 | 1991-10-15 | Matsushita Refrig Co Ltd | 音声認識システム |
JP3006496B2 (ja) * | 1996-03-21 | 2000-02-07 | 日本電気株式会社 | 音声認識装置 |
JP4471128B2 (ja) * | 2006-11-22 | 2010-06-02 | セイコーエプソン株式会社 | 半導体集積回路装置、電子機器 |
-
2013
- 2013-03-05 JP JP2013042664A patent/JP6221267B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014170163A (ja) | 2014-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9886947B2 (en) | Speech recognition device and method, and semiconductor integrated circuit device | |
US11450313B2 (en) | Determining phonetic relationships | |
KR102582291B1 (ko) | 감정 정보 기반의 음성 합성 방법 및 장치 | |
US9190060B2 (en) | Speech recognition device and method, and semiconductor integrated circuit device | |
US20140303958A1 (en) | Control method of interpretation apparatus, control method of interpretation server, control method of interpretation system and user terminal | |
EP1701338A1 (en) | Speech recognition method | |
CN110675866B (zh) | 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质 | |
US11676572B2 (en) | Instantaneous learning in text-to-speech during dialog | |
JP6127422B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
US11302329B1 (en) | Acoustic event detection | |
KR20230056741A (ko) | 목소리 변환 및 스피치 인식 모델을 사용한 합성 데이터 증강 | |
JP2018159788A (ja) | 情報処理装置、方法及びプログラム | |
JP2015055653A (ja) | 音声認識装置及び方法、並びに、電子機器 | |
JP2010197644A (ja) | 音声認識システム | |
KR102140770B1 (ko) | 음성에 기반한 잠금 해제를 수행하는 사용자 장치, 음성에 기반한 사용자 장치의 잠금 해제 방법 및 컴퓨터 프로그램이 기록된 기록매체 | |
CN107251137B (zh) | 利用语音改善至少一种语义单元的集合的方法、装置及计算机可读记录介质 | |
JP6221253B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP6221267B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
KR20210098250A (ko) | 전자 장치 및 이의 제어 방법 | |
Prasangini et al. | Sinhala speech to sinhala unicode text conversion for disaster relief facilitation in sri lanka | |
JP2017068153A (ja) | 半導体装置、システム、電子機器、及び、音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150109 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151210 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20160609 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20160621 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6221267 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |