JP5152016B2 - 音声認識用辞書作成装置及び音声認識用辞書作成方法 - Google Patents
音声認識用辞書作成装置及び音声認識用辞書作成方法 Download PDFInfo
- Publication number
- JP5152016B2 JP5152016B2 JP2009018919A JP2009018919A JP5152016B2 JP 5152016 B2 JP5152016 B2 JP 5152016B2 JP 2009018919 A JP2009018919 A JP 2009018919A JP 2009018919 A JP2009018919 A JP 2009018919A JP 5152016 B2 JP5152016 B2 JP 5152016B2
- Authority
- JP
- Japan
- Prior art keywords
- reading information
- speech recognition
- similarity
- speech
- additional candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
図1は、本発明に係る音声認識用辞書作成装置の構成図である。
「確認」、「受付」、「設定」などの普通名詞、「○○株式会社」などの固有名詞を含む358単語を記憶させた音声認識用辞書を用いて、70分間の音声データ(コールセンタの44通話分)について音声認識を行った。なお、音声認識用辞書に記憶されている358単語であってこの音声データ中に出現する延べ回数を人手により書き起こした正解単語数は381語であった。
音声認識用辞書に記憶された358語の単語に対して、それぞれ標準読み情報以外の読み情報を追加しなかった場合に、音声認識装置は、正解単語数381語のうち248語を正確に認識できた。この場合の音声認識装置における音声認識率は、248/381=65%である。
音声認識用辞書に記憶された358語の単語に対して、それぞれ学習により得られた読み情報をそのまま追加した場合に、音声認識装置は、正解単語数381語のうち315語を正確に認識できた。この場合の音声認識装置における音声認識率は、315/381=83%である。
音声認識用辞書に記憶された358語の単語に対して、それぞれ本発明により読み情報を追加した場合に、音声認識装置は、正解単語数381語のうち356語を正確に認識できた。この場合の音声認識装置における音声認識率は、356/381=93%である。
前述した第1実施形態では、標準読み情報に対応して発生された音声信号を音声認識して、標準読み情報との類似度が認識結果読み情報と標準読み情報との類似度より高い読み情報を追加候補データとして、このうちから音声認識できた読み情報を音声認識用辞書に追加読み情報として追加している。
音声認識用辞書中の1つの単語に対して、複数の標準読み情報が対応して記憶されているような場合には、複数の標準読み情報との類似度および複数の標準読み情報に対応して得られた認識結果読み情報との類似度を用いて、追加読み情報を決定するように構成できる。
第3実施形態の変形例として、第2選出スコアを複数の標準読み情報との類似度を用いて算出するように構成できる。
12:第1音声認識部
13:追加候補選択部
14:第2音声認識部
15:辞書更新部
16:音声認識用辞書
17:音響モデル
Claims (5)
- 利用者が発声する音声を入力して、音声信号にして受け付ける音声信号入力部と、
単語に対応する標準読み情報を前記単語と対応付けて記憶する音声認識用辞書と、
前記音声認識用辞書に記憶された単語に対応して発声された音声を、音声信号にして前記音声信号入力部により受け付けて音声認識し、前記単語に対応する認識結果読み情報を決定する第1音声認識部と、
前記標準読み情報または認識結果読み情報に基づいて複数の読み情報データを生成し、前記複数の読み情報データと前記標準読み情報との類似度を求め、前記標準読み情報との類似度が前記第1音声認識部で決定された認識結果読み情報と前記標準読み情報との類似度よりも高い読み情報データを追加候補データとして前記複数の読み情報データから選択する追加候補選択部と、
前記追加候補選択部で選択された追加候補データに対応する音節または音素モデル列を生成し、前記受け付けた音声信号を前記生成された音節または音素モデル列により認識できるか否かを判定する第2音声認識部と、
前記受け付けた音声信号が前記第2音声認識部において認識できた追加候補データのうち前記単語の標準読み情報との類似度が高い追加候補データを前記音声認識用辞書の該当する単語の読み情報として追加する辞書更新部と、
を備える音声認識用辞書作成装置。 - 前記追加候補選択部は、音節または音素間の置換、挿入および脱落に対して類似度を定義した類似度テーブルに基づいて、前記認識結果読み情報と標準読み情報との類似度を算出する、請求項1に記載の音声認識用辞書作成装置。
- 前記追加候補選択部は、第1の選出スコア=標準読み情報との類似度×(1−α)+認識結果読み情報との類似度×α(0<α≦1)を算出して、前記第1の選出スコアが所定値以上である読み情報を追加候補データとして選択する、請求項1に記載の音声認識用辞書作成装置。
- 前記単語辞書更新部は、前記第2音声認識部において認識できた追加候補データに対し、第2選出スコア=標準読み情報との類似度×(1−β)+認識結果読み情報との類似度×β(0≦β<1)を算出して、前記第2の選出スコアが最も高い追加候補データを前記音声認識用辞書の該当する単語の読み情報として追加する、請求項3に記載の音声認識用辞書作成装置。
- 単語に対応する標準読み情報を前記単語と対応付けて記憶する音声認識用辞書を作成する方法であって、
前記音声認識用辞書に記憶された単語に対応して発声された音声を入力して、音声信号にして受け付ける段階と、
前記受け付けた音声信号を音声認識し、前記単語に対応する認識結果読み情報を決定する段階と、
前記標準読み情報または認識結果読み情報に基づいて複数の読み情報データを生成し、前記複数の読み情報データと前記標準読み情報との類似度を求め、前記標準読み情報との類似度が前記決定された認識結果読み情報と前記標準読み情報との類似度よりも高い読み情報データを追加候補データとして前記複数の読み情報データから選択する段階と、
前記選択された追加候補データに対応する音節または音素モデル列を生成し、前記受け付けた音声信号を前記生成された音節または音素モデル列により認識できるか否かを判定する段階と、
前記受け付けた音声信号を認識できた前記追加候補データのうち、前記単語の標準読み情報との類似度が高い追加候補データを前記音声認識用辞書の該当する単語の読み情報として追加する段階と、
を備える音声認識用辞書作成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009018919A JP5152016B2 (ja) | 2009-01-30 | 2009-01-30 | 音声認識用辞書作成装置及び音声認識用辞書作成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009018919A JP5152016B2 (ja) | 2009-01-30 | 2009-01-30 | 音声認識用辞書作成装置及び音声認識用辞書作成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010175869A JP2010175869A (ja) | 2010-08-12 |
JP5152016B2 true JP5152016B2 (ja) | 2013-02-27 |
Family
ID=42706915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009018919A Expired - Fee Related JP5152016B2 (ja) | 2009-01-30 | 2009-01-30 | 音声認識用辞書作成装置及び音声認識用辞書作成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5152016B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62111292A (ja) * | 1985-11-08 | 1987-05-22 | 松下電器産業株式会社 | 音声認識装置 |
JPH08123470A (ja) * | 1994-10-25 | 1996-05-17 | Nippon Hoso Kyokai <Nhk> | 音声認識装置 |
JP3992586B2 (ja) * | 2002-10-18 | 2007-10-17 | 富士通株式会社 | 音声認識用辞書調整装置及び方法 |
-
2009
- 2009-01-30 JP JP2009018919A patent/JP5152016B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010175869A (ja) | 2010-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5480760B2 (ja) | 端末装置、音声認識方法および音声認識プログラム | |
US10319373B2 (en) | Information processing device, information processing method, computer program product, and recognition system | |
JP5200712B2 (ja) | 音声認識装置、音声認識方法及びコンピュータプログラム | |
JP4784120B2 (ja) | 音声書き起こし支援装置及びその方法ならびにプログラム | |
JP2012037619A (ja) | 話者適応化装置、話者適応化方法および話者適応化用プログラム | |
JP6284462B2 (ja) | 音声認識方法、及び音声認識装置 | |
US8645139B2 (en) | Apparatus and method of extending pronunciation dictionary used for speech recognition | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
KR101483947B1 (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
JP4966324B2 (ja) | 音声翻訳装置、および方法 | |
JP5184467B2 (ja) | 適応化音響モデル生成装置及びプログラム | |
KR100848148B1 (ko) | 음절 단위의 음성 인식 장치, 음절 단위의 음성 인식을이용한 문자 입력 장치, 그 방법 및 기록 매체 | |
JP4296290B2 (ja) | 音声認識装置、音声認識方法及びプログラム | |
KR102299269B1 (ko) | 음성 및 스크립트를 정렬하여 음성 데이터베이스를 구축하는 방법 및 장치 | |
JP5196114B2 (ja) | 音声認識装置およびプログラム | |
JP2011007862A (ja) | 音声認識装置、音声認識プログラム、および音声認識方法 | |
JP5152016B2 (ja) | 音声認識用辞書作成装置及び音声認識用辞書作成方法 | |
JP5152020B2 (ja) | 音声認識装置及び音声認識方法 | |
US11043212B2 (en) | Speech signal processing and evaluation | |
JP5673239B2 (ja) | 音声認識装置、音声認識方法、および音声認識プログラム | |
JP2004309928A (ja) | 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム | |
JP5772219B2 (ja) | 音響モデル生成装置、音響モデル生成方法及び音響モデル生成用コンピュータプログラム | |
JP6991409B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
KR102392992B1 (ko) | 음성 인식 기능을 활성화시키는 호출 명령어 설정에 관한 사용자 인터페이싱 장치 및 방법 | |
JP7035476B2 (ja) | 音声処理プログラム、音声処理装置、及び音声処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111006 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5152016 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |