JP2007072481A - 音声認識システムおよび音声認識方法および記録媒体 - Google Patents
音声認識システムおよび音声認識方法および記録媒体 Download PDFInfo
- Publication number
- JP2007072481A JP2007072481A JP2006313125A JP2006313125A JP2007072481A JP 2007072481 A JP2007072481 A JP 2007072481A JP 2006313125 A JP2006313125 A JP 2006313125A JP 2006313125 A JP2006313125 A JP 2006313125A JP 2007072481 A JP2007072481 A JP 2007072481A
- Authority
- JP
- Japan
- Prior art keywords
- communication terminal
- recognition
- noise
- voice
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Mobile Radio Communication Systems (AREA)
Abstract
【解決手段】 通信端末1と通信網200を介して接続される記憶手段2を備え、通信端末1は、音声や周囲の騒音が入力される音声入力手段11と、音声入力手段11から入力された音声の特徴量を抽出する特徴抽出手段12と、音声の特徴量を所定の認識モデルパラメータと照合することにより音声を認識する音声認識手段13と、音声入力手段11から入力された周囲の騒音を検証する騒音検証手段14とを有し、騒音検証手段14は、周囲の騒音を検証したときに、検証した騒音の種類に応じた認識モデルパラメータを記憶手段2に記憶されている複数の認識モデルパラメータセットの中から選択し、音声認識手段13は、騒音検証手段14によって選択された認識モデルパラメータを用いて、音声認識を行なう。
【選択図】 図1
Description
2 記憶手段
11 音声入力手段
12,42 特徴抽出手段
13,23 音声認識手段
14,34 騒音検証手段
15 通信端末中央処理装置
16 比較器
51 CPU
52 ROM
53 RAM
54 ハードディスク
55 音声入力部
56 通信インタフェース
200,300,400,500 通信網
Claims (14)
- 通信端末と、前記通信端末と通信網を介して接続される記憶手段とを備え、前記通信端末は、音声および/または周囲の騒音が入力される音声入力手段と、音声入力手段から入力された音声の特徴量を抽出する特徴抽出手段と、前記音声の特徴量を所定の認識モデルパラメータセットと照合することにより音声を認識する音声認識手段と、前記音声入力手段から入力された周囲の騒音を検証する騒音検証手段とを有し、前記騒音検証手段は、周囲の騒音を検証したときに、検証した騒音の種類に応じた認識モデルパラメータセットを記憶手段に記憶されている複数の認識モデルパラメータセットの中から選択し、前記音声認識手段は、前記騒音検証手段によって選択された認識モデルパラメータセットを用いて、音声認識を行なうようになっていることを特徴とする音声認識システム。
- 通信端末と、前記通信端末と通信網を介して接続される音声認識手段と、前記通信端末と通信網を介して接続される記憶手段とを備え、前記通信端末は、音声および/または周囲の騒音が入力される音声入力手段と、音声入力手段から入力された音声の特徴量を抽出する特徴抽出手段と、前記音声入力手段から入力された周囲の騒音を検証する騒音検証手段とを有し、前記騒音検証手段は、周囲の騒音を検証したときに、検証した騒音の種類に応じた認識モデルパラメータセットを記憶手段に記憶されている複数の認識モデルパラメータセットの中から選択し、前記音声認識手段は、通信端末の特徴抽出手段によって抽出された音声の特徴量が通信端末から送られたときに、送られた音声の特徴量を前記騒音検証手段によって選択された認識モデルパラメータセットと照合することにより音声認識を行なうようになっていることを特徴とする音声認識システム。
- 通信端末と、前記通信端末と通信網を介して接続される音声認識手段と、前記通信端末と通信網を介して接続される騒音検証手段と、前記通信端末と通信網を介して接続される記憶手段とを備え、前記通信端末は、音声および/または周囲の騒音が入力される音声入力手段と、音声入力手段から入力された音声の特徴量を抽出する特徴抽出手段とを有し、前記騒音検証手段は、前記音声入力手段から入力された周囲の騒音を検証したときに、検証した騒音の種類に応じた認識モデルパラメータセットを記憶手段に記憶されている複数の認識パラメータセットの中から選択し、前記音声認識手段は、通信端末の特徴抽出手段によって抽出された音声の特徴量が通信端末から送られたときに、送られた音声の特徴量を前記騒音検証手段によって選択された認識モデルパラメータセットと照合することにより音声認識を行なうようになっていることを特徴とする音声認識システム。
- 通信端末と、前記通信端末と通信網を介して接続される音声認識手段と、前記通信端末と通信網を介して接続される騒音検証手段と、前記通信端末と通信網を介して接続される特徴抽出手段と、前記通信端末と通信網を介して接続される記憶手段とを備え、前記通信端末は、音声および/または周囲の騒音が入力される音声入力手段を有し、前記特徴抽出手段は、通信端末の音声入力手段で入力された音声が通信端末から送られるときに、入力された音声の特徴量を抽出し、前記騒音検証手段は、通信端末の音声入力手段で入力された周囲の騒音が通信端末から送られるときに、周囲の騒音を検証し、検証した騒音の種類に応じた認識パラメータセットを記憶手段に記憶されている複数の認識パラメータセットの中から選択し、前記音声認識手段は、特徴抽出手段によって抽出された音声の特徴量を前記騒音検証手段によって選択された認識モデルパラメータセットと照合することにより音声認識を行なうようになっていることを特徴とする音声認識システム。
- 請求項1乃至請求項4のいずれか一項に記載の音声認識システムにおいて、前記通信端末は、移動用通信端末であることを特徴とする音声認識システム。
- 通信端末から入力した音声の特徴量を抽出する特徴抽出手段と、前記特徴量より音声を認識する音声認識手段と、前記通信端末から入力した周囲の騒音を検証する騒音検証手段と、前記通信端末と通信網を介して接続された記憶手段とを備え、前記音声認識手段は、前記記憶手段に記憶されている複数の認識モデルパラメータセットの中から前記騒音検証手段を用いて選択された認識モデルパラメータセットを用いて、音声認識を行うことを特徴とする音声認識方法。
- 請求項6記載の音声認識方法において、前記音声認識手段に記憶されている認識モデルパラメータセットを、通信網を介して前記記憶手段に転送することを特徴とする音声認識方法。
- 請求項6または請求項7記載の音声認識方法において、特徴抽出手段,音声認識手段,騒音検証手段を前記通信端末に備え、前記騒音検証手段を用いて前記記憶手段に記憶されている認識モデルパラメータセットを選択し、選択された認識モデルパラメータセットを通信網を介して前記通信端末に取り込み、音声認識手段に記憶することを特徴とする音声認識方法。
- 請求項6記載の音声認識方法において、特徴抽出手段と騒音検証手段とを前記通信端末に備え、また、通信端末と通信網を介して音声認識手段を備え、前記騒音検証手段を用いて前記記憶手段に記憶されている認識モデルパラメータセットを選択し、選択された認識モデルパラメータセットを音声認識手段に用いることを特徴とする音声認識方法。
- 請求項6記載の音声認識方法において、特徴抽出手段を前記通信端末に備え、また、通信端末と通信網を介して騒音検証手段,音声認識手段を備え、前記騒音検証手段を用いて前記記憶手段に記憶されている認識モデルパラメータセットを選択し、選択された認識モデルパラメータセットを音声認識手段に用いることを特徴とする音声認識方法。
- 請求項6記載の音声認識方法において、通信端末と通信網を介して特徴抽出手段,騒音検証手段,音声認識手段を備え、前記騒音検証手段を用いて前記記憶手段に記憶されている認識モデルパラメータセットを選択し、選択された認識モデルパラメータセットを音声認識手段に用いることを特徴とする音声認識方法。
- 請求項6乃至請求項11のいずれか一項に記載の音声認識方法において、騒音検証手段の検証モデルと音声認識手段および/または記憶手段の認識モデルパラメータを入力音声特徴量を用いて更新することを特徴とする音声認識方法。
- 請求項6乃至請求項11のいずれか一項に記載の音声認識方法において、騒音検証手段の検証モデルと記憶手段の認識モデルパラメータセットとを追加可能であって、追加された検証モデルと追加された認識モデルパラメータセットとを、入力音声特徴量を用いて更新することを特徴とする音声認識方法。
- 周囲の騒音を検証したときに、検証した騒音の種類に応じた認識モデルパラメータセットを記憶手段に記憶されている複数の認識モデルパラメータセットの中から選択し、選択された認識モデルパラメータセットを用いて、音声認識を行なう処理をコンピュータに実行させるためのプログラムを記録したコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006313125A JP4658022B2 (ja) | 2006-11-20 | 2006-11-20 | 音声認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006313125A JP4658022B2 (ja) | 2006-11-20 | 2006-11-20 | 音声認識システム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000057941A Division JP4201455B2 (ja) | 2000-02-29 | 2000-02-29 | 音声認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007072481A true JP2007072481A (ja) | 2007-03-22 |
JP4658022B2 JP4658022B2 (ja) | 2011-03-23 |
Family
ID=37933907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006313125A Expired - Fee Related JP4658022B2 (ja) | 2006-11-20 | 2006-11-20 | 音声認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4658022B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012132950A (ja) * | 2010-12-17 | 2012-07-12 | Fujitsu Ltd | 音声認識装置、音声認識方法および音声認識プログラム |
DE112010003461T5 (de) | 2009-08-28 | 2012-07-26 | International Business Machines Corp. | Vorrichtung zur extraktion von sprachmerkmalen,verfahren zur extraktion von sprachmerkmalen und programm zurextraktion von sprachmerkmalen |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6191700A (ja) * | 1984-10-11 | 1986-05-09 | 株式会社日立製作所 | 音声入力装置 |
JPS6242198A (ja) * | 1985-08-20 | 1987-02-24 | 松下電器産業株式会社 | 音声認識装置 |
JPH01260495A (ja) * | 1988-04-12 | 1989-10-17 | Matsushita Electric Ind Co Ltd | 音声認識法 |
JPH03276196A (ja) * | 1990-03-27 | 1991-12-06 | Matsushita Refrig Co Ltd | 音声認識システム |
JPH086589A (ja) * | 1994-06-21 | 1996-01-12 | Nec Corp | 電話回線音声入力システム |
JPH09507105A (ja) * | 1993-12-22 | 1997-07-15 | クゥアルコム・インコーポレーテッド | 分散音声認識システム |
JPH10282990A (ja) * | 1997-04-04 | 1998-10-23 | Sony Corp | テキスト入力方法及び装置 |
WO1999021172A2 (en) * | 1997-10-20 | 1999-04-29 | Koninklijke Philips Electronics N.V. | Pattern recognition enrolment in a distributed system |
JP2000194392A (ja) * | 1998-12-25 | 2000-07-14 | Sharp Corp | 騒音適応型音声認識装置及び騒音適応型音声認識プログラムを記録した記録媒体 |
-
2006
- 2006-11-20 JP JP2006313125A patent/JP4658022B2/ja not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6191700A (ja) * | 1984-10-11 | 1986-05-09 | 株式会社日立製作所 | 音声入力装置 |
JPS6242198A (ja) * | 1985-08-20 | 1987-02-24 | 松下電器産業株式会社 | 音声認識装置 |
JPH01260495A (ja) * | 1988-04-12 | 1989-10-17 | Matsushita Electric Ind Co Ltd | 音声認識法 |
JPH03276196A (ja) * | 1990-03-27 | 1991-12-06 | Matsushita Refrig Co Ltd | 音声認識システム |
JPH09507105A (ja) * | 1993-12-22 | 1997-07-15 | クゥアルコム・インコーポレーテッド | 分散音声認識システム |
JPH086589A (ja) * | 1994-06-21 | 1996-01-12 | Nec Corp | 電話回線音声入力システム |
JPH10282990A (ja) * | 1997-04-04 | 1998-10-23 | Sony Corp | テキスト入力方法及び装置 |
WO1999021172A2 (en) * | 1997-10-20 | 1999-04-29 | Koninklijke Philips Electronics N.V. | Pattern recognition enrolment in a distributed system |
JP2000194392A (ja) * | 1998-12-25 | 2000-07-14 | Sharp Corp | 騒音適応型音声認識装置及び騒音適応型音声認識プログラムを記録した記録媒体 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112010003461T5 (de) | 2009-08-28 | 2012-07-26 | International Business Machines Corp. | Vorrichtung zur extraktion von sprachmerkmalen,verfahren zur extraktion von sprachmerkmalen und programm zurextraktion von sprachmerkmalen |
US8468016B2 (en) | 2009-08-28 | 2013-06-18 | International Business Machines Corporation | Speech feature extraction apparatus, speech feature extraction method, and speech feature extraction program |
US8930185B2 (en) | 2009-08-28 | 2015-01-06 | International Business Machines Corporation | Speech feature extraction apparatus, speech feature extraction method, and speech feature extraction program |
DE112010003461B4 (de) | 2009-08-28 | 2019-09-05 | International Business Machines Corporation | Vorrichtung zur Extraktion von Sprachmerkmalen, Verfahren zur Extraktion von Sprachmerkmalen und Programm zur Extraktion von Sprachmerkmalen |
JP2012132950A (ja) * | 2010-12-17 | 2012-07-12 | Fujitsu Ltd | 音声認識装置、音声認識方法および音声認識プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4658022B2 (ja) | 2011-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100976643B1 (ko) | 자동 음성 인식 시스템용 적응형 콘텍스트 | |
CN106683677B (zh) | 语音识别方法及装置 | |
US8738375B2 (en) | System and method for optimizing speech recognition and natural language parameters with user feedback | |
JP6464650B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
US8180641B2 (en) | Sequential speech recognition with two unequal ASR systems | |
KR101183344B1 (ko) | 사용자 정정들을 이용한 자동 음성 인식 학습 | |
US9280969B2 (en) | Model training for automatic speech recognition from imperfect transcription data | |
JP5229478B2 (ja) | 統計モデル学習装置、統計モデル学習方法、およびプログラム | |
US9396725B2 (en) | System and method for optimizing speech recognition and natural language parameters with user feedback | |
KR100897553B1 (ko) | 사용자의 기기 사용 패턴을 이용한 음성 인식 방법 및 장치 | |
KR20180064504A (ko) | 개인화된 엔티티 발음 학습 | |
US11024298B2 (en) | Methods and apparatus for speech recognition using a garbage model | |
JP5932869B2 (ja) | N−gram言語モデルの教師無し学習方法、学習装置、および学習プログラム | |
JP2012037619A (ja) | 話者適応化装置、話者適応化方法および話者適応化用プログラム | |
US6961702B2 (en) | Method and device for generating an adapted reference for automatic speech recognition | |
JP2007279349A (ja) | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム | |
US20040199386A1 (en) | Method of speech recognition using variational inference with switching state space models | |
CN107871503A (zh) | 语音对话系统以及发声意图理解方法 | |
JP6468258B2 (ja) | 音声対話装置および音声対話方法 | |
JP5988077B2 (ja) | 発話区間検出装置及び発話区間検出のためのコンピュータプログラム | |
JP2017167270A (ja) | 音声処理装置および音声処理方法 | |
JP4658022B2 (ja) | 音声認識システム | |
JP4201455B2 (ja) | 音声認識システム | |
JP2008241970A (ja) | 話者適応装置、話者適応方法及び話者適応プログラム | |
US20030055642A1 (en) | Voice recognition apparatus and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061219 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100831 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101027 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101130 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101222 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140107 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |