JP4905361B2 - 音声認識装置、音声認識方法、及び音声認識用プログラム - Google Patents
音声認識装置、音声認識方法、及び音声認識用プログラム Download PDFInfo
- Publication number
- JP4905361B2 JP4905361B2 JP2007557797A JP2007557797A JP4905361B2 JP 4905361 B2 JP4905361 B2 JP 4905361B2 JP 2007557797 A JP2007557797 A JP 2007557797A JP 2007557797 A JP2007557797 A JP 2007557797A JP 4905361 B2 JP4905361 B2 JP 4905361B2
- Authority
- JP
- Japan
- Prior art keywords
- call
- information
- voice
- speech
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 78
- 238000012937 correction Methods 0.000 claims description 98
- 230000008569 process Effects 0.000 claims description 53
- 238000012545 processing Methods 0.000 claims description 39
- 230000005236 sound signal Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 description 33
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Description
2 公衆電話網
11 通信受信部
12 通話音声信号入力手段
13 受付電話番号入力手段
14 音声補正手段
15 前処理用モジュール記憶部
16 音声補正処理選択手段
17 音声認識手段
18 認識辞書・モデル・パラメータ記憶部
19 音声認識処理選択手段
20 認識結果出力手段
Claims (12)
- 複数ある受信用電話番号への通話を受信する通話受信部と、受信した通話の通話音声信号を入力する通話音声信号入力手段と、入力した通話音声信号に係る前記受信用電話番号を受付電話番号として入力する受付電話番号入力手段と、音声を言語情報に認識する音声認識に用いる音声認識用情報を前記受信用電話番号に対応づけて記憶した音声認識用情報記憶手段と、この記憶した音声認識用情報から前記受付電話番号に対応した音声認識用情報を選択する音声認識用情報選択手段と、この選択した音声認識用情報を用いて前記通話音声信号入力手段に入力された通話音声信号を言語情報として認識し音声内容を特定する音声認識手段とを備えることを特徴とした音声認識装置。
- 前記請求項1に記載の音声認識装置において、
前記音声認識用情報が、音声と語彙の対応を示す認識辞書と、音声の最小認識単位における音響的特徴を表す音響モデルと、単語間の接続関係を表す言語モデルと、音声認識の手順を示す情報あるいは認識パラメータとのうち少なくとも1つであることを特徴とした音声認識装置。 - 複数ある受信用電話番号への通話を受信する通話受信部と、受信した通話の通話音声信号を入力する通話音声信号入力手段と、入力した通話音声信号に係る前記受信用電話番号を受付電話番号として入力する受付電話番号入力手段と、音声信号補正の内容を示す補正内容情報を前記受信用電話番号に対応付けて記憶した補正内容情報記憶手段と、この記憶した補正内容情報から前記受付電話番号に対応した補正内容情報を選択する補正内容情報選択手段と、この選択した補正内容情報が示す音声補正処理を前記通話音声信号入力手段に入力された通話音声信号に施す音声補正手段と、この音声補正手段によって補正された音声信号を言語情報として認識し音声内容を特定する音声認識手段とを備えたことを特徴とした音声認識装置。
- 前記請求項3に記載の音声認識装置において、
前記補正内容情報が、雑音除去処理のための情報と、音声信号歪み補正のための情報と、圧縮音声補正のための情報とのうち少なくとも1つであることを特徴とした音声認識装置。 - 複数ある受信用電話番号への通話を受信する通話受信工程と、受信した通話の通話音声信号を入力する通話音声信号入力工程と、入力した通話音声信号に係る前記受信用電話番号を受付電話番号として入力する受付電話番号入力工程と、音声を言語情報に認識する音声認識に用いる音声認識用情報を前記受信用電話番号に対応付けて予め記憶している中から前記受付電話番号に応じて選択する認識用情報選択工程と、この選択した音声認識処理用情報を用いて通話音声入力工程で入力した通話音声信号を言語情報として認識し音声内容を特定する音声認識工程とを有することを特徴とした音声認識方法。
- 前記請求項5に記載の音声認識方法において、
前記音声認識用情報が、音声と語彙の対応を示す認識辞書と、音声の最小認識単位における音響的特徴を表す音響モデルと、単語間の接続関係を表す言語モデルと、音声認識の手順を示す情報あるいは認識パラメータとのうち少なくとも1つであることを特徴とした音声認識方法。 - 複数ある受信用電話番号への通話を受信する通話受信工程と、受信した通話の通話音声信号を入力する通話音声信号入力工程と、入力した通話音声信号に係る前記受信用電話番号を受付電話番号として入力する受付電話番号入力工程と、音声信号補正の内容を示す補正内容情報を前記受信用電話番号に対応付けて予め記憶している中から前記受付電話番号に応じて選択する補正内容情報選択工程と、この選択した補正内容情報が示す音声補正処理を前記通話音声信号入力工程で入力した通話音声信号に施す音声補正工程と、前記音声補正工程で補正した音声信号を言語情報として認識し音声内容を特定する音声認識工程とを有することを特徴とした音声認識方法。
- 前記請求項7に記載の音声認識方法において、
前記補正内容情報が、雑音除去処理のための情報と、音声信号歪み補正のための情報と、圧縮音声補正のための情報とのうち少なくとも1つであることを特徴とした音声認識方法。 - 複数ある受信用電話番号への通話を受信する通話受信処理と、受信した通話の通話音声信号を入力する通話音声信号入力処理と、入力した通話音声信号に係る前記受信用電話番号を受付電話番号として入力する受付電話番号入力処理と、音声を言語情報に認識するのに用いる音声認識用情報を前記受付電話番号に応じて選択する認識用情報選択処理と、この選択された音声認識用情報を用いて前記通話音声入力処理で入力された通話音声信号を言語情報として認識し音声内容を特定する音声認識処理とをコンピュータに実行させることを特徴とした音声認識用プログラム。
- 前記請求項9に記載の音声認識用プログラムにおいて、
前記音声認識用情報が、音声と語彙の対応を示す認識辞書と、音声の最小認識単位における音響的特徴を表す音響モデルと、単語間の接続関係を表す言語モデルと、音声認識の手順を示す情報あるいは認識パラメータとのうち少なくとも1つであることを特徴とした音声認識用プログラム。 - 複数ある受信用電話番号への通話を受信する通話受信処理と、受信した通話の通話音声信号を入力する通話音声信号入力処理と、入力した通話音声信号に係る前記受信用電話番号を受付電話番号として入力する受付電話番号入力処理と、音声信号補正の内容を示す補正内容情報を前記受信用電話番号毎に予め決められたうちから前記受付電話番号に応じて選択する音声補正選択処理と、この選択した補正内容情報に従って前記通話音声入力処理で入力された通話音声信号を補正する音声補正処理と、この音声補正処理によって補正された音声信号を言語情報として認識し音声内容を特定する音声認識処理とをコンピュータに実行させることを特徴とした音声認識用プログラム。
- 前記請求項11に記載の音声認識用プログラムにおいて、
前記補正内容情報が、雑音除去処理のための情報と、音声信号歪み補正のための情報と、圧縮音声補正のための情報とのうち少なくとも1つであることを特徴とした音声認識用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007557797A JP4905361B2 (ja) | 2006-02-06 | 2007-01-31 | 音声認識装置、音声認識方法、及び音声認識用プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006028688 | 2006-02-06 | ||
JP2006028688 | 2006-02-06 | ||
PCT/JP2007/051579 WO2007091462A1 (ja) | 2006-02-06 | 2007-01-31 | 音声認識装置、音声認識方法、及び音声認識用プログラム |
JP2007557797A JP4905361B2 (ja) | 2006-02-06 | 2007-01-31 | 音声認識装置、音声認識方法、及び音声認識用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007091462A1 JPWO2007091462A1 (ja) | 2009-07-02 |
JP4905361B2 true JP4905361B2 (ja) | 2012-03-28 |
Family
ID=38345065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007557797A Expired - Fee Related JP4905361B2 (ja) | 2006-02-06 | 2007-01-31 | 音声認識装置、音声認識方法、及び音声認識用プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9165557B2 (ja) |
JP (1) | JP4905361B2 (ja) |
CN (1) | CN101379550B (ja) |
WO (1) | WO2007091462A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9826085B2 (en) | 2012-02-14 | 2017-11-21 | Koninklijke Philips N.V. | Audio signal processing in a communication system |
CN102611799A (zh) * | 2012-03-21 | 2012-07-25 | 上海车音网络科技有限公司 | 联系人号码的获取方法、装置及系统 |
CN108122555B (zh) * | 2017-12-18 | 2021-07-23 | 北京百度网讯科技有限公司 | 通讯方法、语音识别设备和终端设备 |
WO2020017243A1 (ja) * | 2018-07-19 | 2020-01-23 | ソニー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
JP7243567B2 (ja) | 2019-10-18 | 2023-03-22 | トヨタ自動車株式会社 | 変更操作支援装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1063293A (ja) * | 1996-08-23 | 1998-03-06 | Kokusai Denshin Denwa Co Ltd <Kdd> | 電話音声認識装置 |
JPH10190842A (ja) * | 1996-12-27 | 1998-07-21 | Hitachi Ltd | 音声対話システム |
JP2003060769A (ja) * | 2001-08-15 | 2003-02-28 | Ricoh Co Ltd | 通信装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5371779A (en) * | 1992-03-13 | 1994-12-06 | Nec Corporation | Call initiating system for mobile telephone units |
DE69635015T2 (de) | 1995-11-17 | 2006-03-30 | At & T Corp. | Automatische vokabularerzeugung für auf einem telekommunikationsnetzwerk basierte sprachgesteuerte wahl |
JP4049449B2 (ja) | 1998-06-19 | 2008-02-20 | 保 目崎 | スリップリング |
JP2000010590A (ja) | 1998-06-25 | 2000-01-14 | Oki Electric Ind Co Ltd | 音声認識装置およびその制御方法 |
JP2000125006A (ja) | 1998-10-19 | 2000-04-28 | Ntt Data Corp | 音声認識装置、音声認識方法、及び電話自動応答装置 |
US6408066B1 (en) * | 1999-12-15 | 2002-06-18 | Lucent Technologies Inc. | ACD skill-based routing |
US20030191639A1 (en) | 2002-04-05 | 2003-10-09 | Sam Mazza | Dynamic and adaptive selection of vocabulary and acoustic models based on a call context for speech recognition |
JP2005123869A (ja) | 2003-10-16 | 2005-05-12 | Advanced Media Inc | 通話内容書き起こしシステムおよび通話内容書き起こし方法 |
JP2005208483A (ja) | 2004-01-26 | 2005-08-04 | Neikusu:Kk | 音声認識装置、音声認識プログラム、言語モデル生成方法、及び言語モデル生成装置 |
-
2007
- 2007-01-31 CN CN2007800046944A patent/CN101379550B/zh not_active Expired - Fee Related
- 2007-01-31 JP JP2007557797A patent/JP4905361B2/ja not_active Expired - Fee Related
- 2007-01-31 US US12/087,287 patent/US9165557B2/en not_active Expired - Fee Related
- 2007-01-31 WO PCT/JP2007/051579 patent/WO2007091462A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1063293A (ja) * | 1996-08-23 | 1998-03-06 | Kokusai Denshin Denwa Co Ltd <Kdd> | 電話音声認識装置 |
JPH10190842A (ja) * | 1996-12-27 | 1998-07-21 | Hitachi Ltd | 音声対話システム |
JP2003060769A (ja) * | 2001-08-15 | 2003-02-28 | Ricoh Co Ltd | 通信装置 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2007091462A1 (ja) | 2009-07-02 |
US20090168976A1 (en) | 2009-07-02 |
CN101379550B (zh) | 2012-06-27 |
WO2007091462A1 (ja) | 2007-08-16 |
CN101379550A (zh) | 2009-03-04 |
US9165557B2 (en) | 2015-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8605868B2 (en) | System and method for externally mapping an interactive voice response menu | |
US7907705B1 (en) | Speech to text for assisted form completion | |
US20110264451A1 (en) | Methods and systems for training dictation-based speech-to-text systems using recorded samples | |
US8369492B2 (en) | Directory dialer name recognition | |
EP1994529B1 (en) | Communication device having speaker independent speech recognition | |
US20080255848A1 (en) | Speech Recognition Method and System and Speech Recognition Server | |
JPH07210190A (ja) | 音声認識方法及びシステム | |
JP4905361B2 (ja) | 音声認識装置、音声認識方法、及び音声認識用プログラム | |
CN109559744B (zh) | 语音数据的处理方法、装置及可读存储介质 | |
KR20080054591A (ko) | 휴대단말기의 통화 서비스 방법 | |
JP2005520194A (ja) | テキストメッセージの生成 | |
CN1631045A (zh) | 用于基于生成应答呼叫消息的音频信号的方法和装置 | |
JP2010041301A (ja) | 音声文字化サーバー及び音声文字化方法 | |
EP1385148B1 (en) | Method for improving the recognition rate of a speech recognition system, and voice server using this method | |
JP2002252705A (ja) | 話者id検出方法及び装置 | |
CA2716732C (en) | System and method for externally mapping an interactive voice response menu | |
JPH11261683A (ja) | 電話装置、プログラムを記録した記録媒体及びデータを記録した記録媒体 | |
JP2024084170A (ja) | 音声認識システム、及び、音声認識方法 | |
JP4466171B2 (ja) | 情報検索装置 | |
CN112399017A (zh) | Ip话机语音输入编辑短信的方法及系统 | |
GB2406471A (en) | Mobile phone with speech-to-text conversion system | |
CN112671974A (zh) | 一种通信系统中特殊语音通话的处理方法 | |
KR20220097773A (ko) | It기기와 대화를 통한 음성기반 인터넷 미디어 댓글작성 시스템 및 그 방법 | |
JP2001184084A (ja) | 音声認識方法及びその装置並びにそのプログラムを記録した媒体 | |
CN117854502A (zh) | 一种车牌号码的语音识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111213 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111226 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150120 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4905361 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |