JP2820093B2 - 単音節認識装置 - Google Patents
単音節認識装置Info
- Publication number
- JP2820093B2 JP2820093B2 JP7339493A JP33949395A JP2820093B2 JP 2820093 B2 JP2820093 B2 JP 2820093B2 JP 7339493 A JP7339493 A JP 7339493A JP 33949395 A JP33949395 A JP 33949395A JP 2820093 B2 JP2820093 B2 JP 2820093B2
- Authority
- JP
- Japan
- Prior art keywords
- syllable
- standard pattern
- pattern
- standard
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
し、特に任意の単語あるいは文を入力するための単音節
認識装置に関する。
ば、電話や無線等の通話品質が低い環境で認識が困難な
単音節を伝えようとする場合、目的の単音節そのものを
発声するのではなく、関連した単語を発声することが行
われている。一例として、図6として従来の単音節認識
方法の文字と関連する単語の説明図を掲示する。これ
は、電報等で使用されていたもので、平仮名を伝える際
には「朝日のあ」、「葉書のは」等と唱えて伝達してい
た。そして、この方法は、音声認識装置にも応用可能
で、認識が困難な単音節そのものを認識するのではな
く、その単音節に関連した単語を認識することにより、
任意の単語あるいは文を高精度に入力することができ
る。
認識装置は、予め各単音節に対応した単語を記憶しなけ
ればならないため、効率よく入力を行うためには熟練が
必要であるという問題点がある。
度の単音節認識装置を提供することにある。
は、単音節の音声を入力し認識する単音節認識装置にお
いて、任意の単音節の標準パターンとして一つ以上の当
該音節を特定の位置に含んだ任意の音節系列を許容した
標準パターンを記憶する標準パターン記憶部と、前記入
力する音声から特徴量を抽出し入力パターンに変換する
分析部と、前記入力パターンと前記標準パターン記憶部
に蓄えられた複数の標準パターンとを照合し前記複数の
標準パターンの中で最も類似度の高い標準パターンを選
択し出力する照合部と、前記照合部が選択した標準パタ
ーンに対応する単音節を出力する出力部とを備える構成
である。
記憶部で記憶する任意の単音節の標準パターンとして、
当該音節を先頭に持つ任意の音節系列に助詞の「の」お
よび前記当該単音節が継続する標準パターンを記憶して
もよい。
の音節系列の日本語における出現頻度情報を蓄える音節
連鎖情報記憶部を備え、照合部が入力パターンと標準パ
ターンとを照合する際に前記出現頻度情報を参照しても
よい。
語の代わりに各単音節を特定の位置に含む任意の音節系
列が許される標準パターンを用いることにより、熟練を
必要としない高精度の単音節入力装置を提供するもので
ある。
の「あ」に任意の音節系列が続き、「のあ」で終る標準
パターンを用いる。これにより「朝日のあ」、「明日の
あ」、「頭のあ」等が発声可能となり発声の自由度が向
上するため初心者でも簡単に使用可能である。「ん」の
ように語頭に来得ない文字や単独では発音不能な濁点等
(以下、特殊文字)については従来の標準パターンを併
用するものとする。また、任意の音節系列を受理するに
当たっては日本語における音節系列の頻度情報を利用す
ることにより、より精度の高い入力が可能となる。
て図面を参照して説明する。
ロック図である。
から入力する音声波形から特徴量を抽出し入力パターン
に変換する分析部3と、任意の単音節の標準パターンと
して一つ以上の当該音節を特定の位置に含んだ任意の音
節系列を許容した標準パターンを記憶する標準パターン
記憶部4と、分析部3の出力する入力パターンと標準パ
ターン記憶部4に蓄えられた複数の標準パターンとを照
合し複数の標準パターンの中で最も類似度の高い標準パ
ターンを選択し出力する照合部5と、照合部5が選択し
た標準パターンに対応する単音節を出力端子7に出力す
る出力部6とから成る。
ら入力された音声波形は、これを受けた分析部3により
特徴ベクトル系列に変換され、分析部3はこの特徴ベク
トルを入力パターンとして照合部5に出力する。このと
きの特徴ベクトルとしては、例えば古井著「ディジタル
音声処理」東海大学出版会(以下文献1と記す)にあげ
られているFFT分析および線形予測分析、等により得
られるケプストラムおよびLPC係数の時間変化量等が
利用可能である。
入力パターンと標準パターン記憶部4から各単音節の標
準パターンを読み出した複数の標準パターンとを照合
し、複数の標準パターンの中で最も類似度の高い標準パ
ターンを選択し出力部6に出力する。このとき、標準パ
ターン記憶部4に蓄えられた複数の標準パターンとして
は、図3の日本語の任意音節系列を受理可能なモデル
(以下ガーベージモデルと記す)の説明図に示すモデル
を用いたものである。このモデルは、一つの状態と各単
音節に対応した自状態への弧を持ち、任意の音節を任意
の個数受理可能なモデルとなっている。
4に格納してある標準パターンを説明する説明図であ
る。
いて、図3に示した任意の音節系列が受理可能なパター
ン、即ち、助詞の「の」と当該単音節が継続することを
許した単音節の標準パターンと、図4分図(B)に示す
「ん」のように語頭に来得ない文字や単独では発音不能
な特殊文字の標準パターンとの2種類とから構成されて
いる。また、入力パターンと標準パターンとの比較にあ
たっては、文献1の172〜177ページにあげられる
2段DP,OSDP法等の連続音声認識方式の利用が可
能である。出力部6は、照合部5で選択された標準パタ
ーンに対応する単音節あるいは特殊文字を標準パターン
記憶部4からの文字情報に基づき出力端子7に出力す
る。また、図3では、任意音節系列を受理可能な標準パ
ターンとして、音節を認識単位とする場合を示したが、
これに限らず音素等のより短い単位や、音節よりも長い
単位を用いて、任意の音節系列を受理可能な標準パター
ンを作成し、利用することができる。
ロック図である。本発明の単音節認識装置8は、第1の
実施の形態と比較し、音節連鎖情報記憶部10が追加さ
れたものである。これに伴い、照合部9にも機能的には
追加がある。その他、第1の実施の形態と比較し変更の
ないものは、同一の名称および符号を付与してあり、機
能の説明は省略する。照合部9は、標準パターン記憶部
4から各単音節の標準パターンを読み出し、受けとった
音節連鎖情報を参照し頻度に応じた重み付けを行い、分
析部3から受けとった入力パターンと比較し、もっとも
類似した標準パターンを選択する。
明で用いる音節連鎖情報の説明図に示すように、日本語
における1つ以上の音節系列の出現頻度情報を蓄えてお
く。この出現頻度情報は、予め大規模な日本語文章デー
タから求めておくものとし、医学、法学等の分野ごとに
複数個の出現頻度情報を持つことも可能である。図5分
図(A)では1音節系列の出現頻度情報を、図5分図
(B)では2音節系列の出現頻度情報を示したが、これ
より長い音節系列の出現頻度情報を用いることも可能で
ある。
単音節の標準パターンとして一つ以上の当該音節を特定
の位置に含んだ任意の音節系列を許容した標準パターン
を記憶する標準パターン記憶部と、入力する音声から特
徴量を抽出し入力パターンに変換する分析部と、入力パ
ターンと標準パターン記憶部に蓄えられた複数の標準パ
ターンとを照合し複数の標準パターンの中で最も類似度
の高い標準パターンを選択し出力する照合部と、照合部
が選択した標準パターンに対応する単音節を出力する出
力部とを備えるとにより、単音節を入力するにあたっ
て、あらかじめ各単音節に関連した単語を記憶する必要
がないため、熟練を必要としない高い認識性能をもつ単
音節認識装置が実現できるという効果が有る。
ある。
ある。
明図である。
ある標準パターンを説明する説明図である。
説明図である。
Claims (3)
- 【請求項1】 単音節の音声を入力し認識する単音節認
識装置において、任意の単音節の標準パターンとして一
つ以上の当該音節を特定の位置に含んだ任意の音節系列
を許容した標準パターンを記憶する標準パターン記憶部
と、前記入力する音声から特徴量を抽出し入力パターン
に変換する分析部と、前記入力パターンと前記標準パタ
ーン記憶部に蓄えられた複数の標準パターンとを照合し
前記複数の標準パターンの中で最も類似度の高い標準パ
ターンを選択し出力する照合部と、前記照合部が選択し
た標準パターンに対応する単音節を出力する出力部とを
備えることを特徴とする単音節認識装置。 - 【請求項2】 標準パターン記憶部で記憶する任意の単
音節の標準パターンとして、当該音節を先頭に持つ任意
の音節系列に助詞の「の」および当該単音節が継続する
標準パターンを記憶することを特徴とする請求項1記載
の単音節認識装置。 - 【請求項3】 1および複数の音節系列の日本語におけ
る出現頻度情報を蓄える音節連鎖情報記憶部を備え、照
合部が入力パターンと標準パターンとを照合する際に前
記出現頻度情報を参照することを特徴とする請求項1ま
たは2記載の単音節認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7339493A JP2820093B2 (ja) | 1995-12-26 | 1995-12-26 | 単音節認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7339493A JP2820093B2 (ja) | 1995-12-26 | 1995-12-26 | 単音節認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09179578A JPH09179578A (ja) | 1997-07-11 |
JP2820093B2 true JP2820093B2 (ja) | 1998-11-05 |
Family
ID=18327994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7339493A Expired - Fee Related JP2820093B2 (ja) | 1995-12-26 | 1995-12-26 | 単音節認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2820093B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1135768B1 (en) * | 1999-09-29 | 2008-01-23 | Koninklijke Philips Electronics N.V. | Spell mode in a speech recognizer |
US7865363B2 (en) * | 2004-03-09 | 2011-01-04 | Ashwin Rao | System and method for computer recognition and interpretation of arbitrary spoken-characters |
US7418387B2 (en) * | 2004-11-24 | 2008-08-26 | Microsoft Corporation | Generic spelling mnemonics |
US8457946B2 (en) * | 2007-04-26 | 2013-06-04 | Microsoft Corporation | Recognition architecture for generating Asian characters |
JP2011007862A (ja) * | 2009-06-23 | 2011-01-13 | Fujitsu Ltd | 音声認識装置、音声認識プログラム、および音声認識方法 |
CN103827962B (zh) * | 2011-09-09 | 2016-12-07 | 旭化成株式会社 | 声音识别装置 |
-
1995
- 1995-12-26 JP JP7339493A patent/JP2820093B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH09179578A (ja) | 1997-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rudnicky et al. | Survey of current speech technology | |
US5787230A (en) | System and method of intelligent Mandarin speech input for Chinese computers | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
US5949961A (en) | Word syllabification in speech synthesis system | |
US5794204A (en) | Interactive speech recognition combining speaker-independent and speaker-specific word recognition, and having a response-creation capability | |
EP2048655B1 (en) | Context sensitive multi-stage speech recognition | |
EP1693828A1 (en) | Multilingual speech recognition | |
EP0769184B1 (en) | Speech recognition methods and apparatus on the basis of the modelling of new words | |
KR19980070329A (ko) | 사용자 정의 문구의 화자 독립 인식을 위한 방법 및 시스템 | |
JP2004053742A (ja) | 音声認識装置 | |
JP2820093B2 (ja) | 単音節認識装置 | |
JPS597998A (ja) | 連続音声認識装置 | |
Comerford et al. | The voice of the computer is heard in the land (and it listens too!)[speech recognition] | |
JPH0283593A (ja) | ノイズ適応形音声認識装置 | |
JPH1124693A (ja) | 音声認識装置 | |
CA2597826C (en) | Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance | |
JP2007535692A (ja) | 任意に話されたキャラクタのコンピュータによる認識及び解釈のためのシステム及び方法 | |
CN1979636B (zh) | 一种音标到语音的转换方法 | |
JP2980382B2 (ja) | 話者適応音声認識方法および装置 | |
JPH119847A (ja) | おしゃべりオウム発声装置 | |
JP3039453B2 (ja) | 音声認識装置 | |
JP2005534968A (ja) | 漢字語の読みの決定 | |
JPH07210193A (ja) | 音声対話装置 | |
JP2615649B2 (ja) | 単語音声認識装置 | |
JPH11212587A (ja) | 音声認識における雑音適応方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19980728 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070828 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080828 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080828 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090828 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090828 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100828 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |