JP2820093B2 - 単音節認識装置 - Google Patents

単音節認識装置

Info

Publication number
JP2820093B2
JP2820093B2 JP7339493A JP33949395A JP2820093B2 JP 2820093 B2 JP2820093 B2 JP 2820093B2 JP 7339493 A JP7339493 A JP 7339493A JP 33949395 A JP33949395 A JP 33949395A JP 2820093 B2 JP2820093 B2 JP 2820093B2
Authority
JP
Japan
Prior art keywords
syllable
standard pattern
pattern
standard
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7339493A
Other languages
English (en)
Other versions
JPH09179578A (ja
Inventor
浩明 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7339493A priority Critical patent/JP2820093B2/ja
Publication of JPH09179578A publication Critical patent/JPH09179578A/ja
Application granted granted Critical
Publication of JP2820093B2 publication Critical patent/JP2820093B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は単音節認識装置に関
し、特に任意の単語あるいは文を入力するための単音節
認識装置に関する。
【0002】
【従来の技術】従来の単音節認識の実例としては、例え
ば、電話や無線等の通話品質が低い環境で認識が困難な
単音節を伝えようとする場合、目的の単音節そのものを
発声するのではなく、関連した単語を発声することが行
われている。一例として、図6として従来の単音節認識
方法の文字と関連する単語の説明図を掲示する。これ
は、電報等で使用されていたもので、平仮名を伝える際
には「朝日のあ」、「葉書のは」等と唱えて伝達してい
た。そして、この方法は、音声認識装置にも応用可能
で、認識が困難な単音節そのものを認識するのではな
く、その単音節に関連した単語を認識することにより、
任意の単語あるいは文を高精度に入力することができ
る。
【0003】
【発明が解決しようとする課題】上述した従来の単音節
認識装置は、予め各単音節に対応した単語を記憶しなけ
ればならないため、効率よく入力を行うためには熟練が
必要であるという問題点がある。
【0004】本発明の目的は、熟練を必要としない高精
度の単音節認識装置を提供することにある。
【0005】
【課題を解決するための手段】本発明の単音節認識装置
は、単音節の音声を入力し認識する単音節認識装置にお
いて、任意の単音節の標準パターンとして一つ以上の当
該音節を特定の位置に含んだ任意の音節系列を許容した
標準パターンを記憶する標準パターン記憶部と、前記入
力する音声から特徴量を抽出し入力パターンに変換する
分析部と、前記入力パターンと前記標準パターン記憶部
に蓄えられた複数の標準パターンとを照合し前記複数の
標準パターンの中で最も類似度の高い標準パターンを選
択し出力する照合部と、前記照合部が選択した標準パタ
ーンに対応する単音節を出力する出力部とを備える構成
である。
【0006】本発明の単音節認識装置は、標準パターン
記憶部で記憶する任意の単音節の標準パターンとして、
当該音節を先頭に持つ任意の音節系列に助詞の「の」お
よび前記当該単音節が継続する標準パターンを記憶して
もよい。
【0007】本発明の単音節認識装置は、1および複数
の音節系列の日本語における出現頻度情報を蓄える音節
連鎖情報記憶部を備え、照合部が入力パターンと標準パ
ターンとを照合する際に前記出現頻度情報を参照しても
よい。
【0008】[作用]本発明では各単音節に対応した単
語の代わりに各単音節を特定の位置に含む任意の音節系
列が許される標準パターンを用いることにより、熟練を
必要としない高精度の単音節入力装置を提供するもので
ある。
【0009】例えば「あ」の標準パターンとして、語頭
の「あ」に任意の音節系列が続き、「のあ」で終る標準
パターンを用いる。これにより「朝日のあ」、「明日の
あ」、「頭のあ」等が発声可能となり発声の自由度が向
上するため初心者でも簡単に使用可能である。「ん」の
ように語頭に来得ない文字や単独では発音不能な濁点等
(以下、特殊文字)については従来の標準パターンを併
用するものとする。また、任意の音節系列を受理するに
当たっては日本語における音節系列の頻度情報を利用す
ることにより、より精度の高い入力が可能となる。
【0010】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0011】図1は本発明の第1の実施の形態を示すブ
ロック図である。
【0012】本発明の単音節認識装置1は、入力端子2
から入力する音声波形から特徴量を抽出し入力パターン
に変換する分析部3と、任意の単音節の標準パターンと
して一つ以上の当該音節を特定の位置に含んだ任意の音
節系列を許容した標準パターンを記憶する標準パターン
記憶部4と、分析部3の出力する入力パターンと標準パ
ターン記憶部4に蓄えられた複数の標準パターンとを照
合し複数の標準パターンの中で最も類似度の高い標準パ
ターンを選択し出力する照合部5と、照合部5が選択し
た標準パターンに対応する単音節を出力端子7に出力す
る出力部6とから成る。
【0013】次に動作について説明する。入力端子2か
ら入力された音声波形は、これを受けた分析部3により
特徴ベクトル系列に変換され、分析部3はこの特徴ベク
トルを入力パターンとして照合部5に出力する。このと
きの特徴ベクトルとしては、例えば古井著「ディジタル
音声処理」東海大学出版会(以下文献1と記す)にあげ
られているFFT分析および線形予測分析、等により得
られるケプストラムおよびLPC係数の時間変化量等が
利用可能である。
【0014】つぎに、照合部5は、分析部3の出力する
入力パターンと標準パターン記憶部4から各単音節の標
準パターンを読み出した複数の標準パターンとを照合
し、複数の標準パターンの中で最も類似度の高い標準パ
ターンを選択し出力部6に出力する。このとき、標準パ
ターン記憶部4に蓄えられた複数の標準パターンとして
は、図3の日本語の任意音節系列を受理可能なモデル
(以下ガーベージモデルと記す)の説明図に示すモデル
を用いたものである。このモデルは、一つの状態と各単
音節に対応した自状態への弧を持ち、任意の音節を任意
の個数受理可能なモデルとなっている。
【0015】図4は本発明に用いる標準パターン記憶部
4に格納してある標準パターンを説明する説明図であ
る。
【0016】図4分図(A)に示すように各単音節に続
いて、図3に示した任意の音節系列が受理可能なパター
ン、即ち、助詞の「の」と当該単音節が継続することを
許した単音節の標準パターンと、図4分図(B)に示す
「ん」のように語頭に来得ない文字や単独では発音不能
な特殊文字の標準パターンとの2種類とから構成されて
いる。また、入力パターンと標準パターンとの比較にあ
たっては、文献1の172〜177ページにあげられる
2段DP,OSDP法等の連続音声認識方式の利用が可
能である。出力部6は、照合部5で選択された標準パタ
ーンに対応する単音節あるいは特殊文字を標準パターン
記憶部4からの文字情報に基づき出力端子7に出力す
る。また、図3では、任意音節系列を受理可能な標準パ
ターンとして、音節を認識単位とする場合を示したが、
これに限らず音素等のより短い単位や、音節よりも長い
単位を用いて、任意の音節系列を受理可能な標準パター
ンを作成し、利用することができる。
【0017】図2は本発明の第2の実施の形態を示すブ
ロック図である。本発明の単音節認識装置8は、第1の
実施の形態と比較し、音節連鎖情報記憶部10が追加さ
れたものである。これに伴い、照合部9にも機能的には
追加がある。その他、第1の実施の形態と比較し変更の
ないものは、同一の名称および符号を付与してあり、機
能の説明は省略する。照合部9は、標準パターン記憶部
4から各単音節の標準パターンを読み出し、受けとった
音節連鎖情報を参照し頻度に応じた重み付けを行い、分
析部3から受けとった入力パターンと比較し、もっとも
類似した標準パターンを選択する。
【0018】音節連鎖情報記憶部10には、図5の本発
明で用いる音節連鎖情報の説明図に示すように、日本語
における1つ以上の音節系列の出現頻度情報を蓄えてお
く。この出現頻度情報は、予め大規模な日本語文章デー
タから求めておくものとし、医学、法学等の分野ごとに
複数個の出現頻度情報を持つことも可能である。図5分
図(A)では1音節系列の出現頻度情報を、図5分図
(B)では2音節系列の出現頻度情報を示したが、これ
より長い音節系列の出現頻度情報を用いることも可能で
ある。
【0019】
【発明の効果】以上説明したように、本発明は、任意の
単音節の標準パターンとして一つ以上の当該音節を特定
の位置に含んだ任意の音節系列を許容した標準パターン
を記憶する標準パターン記憶部と、入力する音声から特
徴量を抽出し入力パターンに変換する分析部と、入力パ
ターンと標準パターン記憶部に蓄えられた複数の標準パ
ターンとを照合し複数の標準パターンの中で最も類似度
の高い標準パターンを選択し出力する照合部と、照合部
が選択した標準パターンに対応する単音節を出力する出
力部とを備えるとにより、単音節を入力するにあたっ
て、あらかじめ各単音節に関連した単語を記憶する必要
がないため、熟練を必要としない高い認識性能をもつ単
音節認識装置が実現できるという効果が有る。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態を示すブロック図で
ある。
【図2】本発明の第2の実施の形態を示すブロック図で
ある。
【図3】日本語の任意音節系列を受理可能なモデルの説
明図である。
【図4】本発明に用いる標準パターン記憶部に格納して
ある標準パターンを説明する説明図である。
【図5】本発明で用いる音節連鎖情報の説明図である。
【図6】従来の単音節認識方法の文字と関連する単語の
説明図である。
【符号の説明】
1,8 単音節認識装置 2 入力端子 3 分析部 4 標準パターン記憶部 5 照合部 6 出力部 7 出力端子 9 照合部9 10 音節連鎖情報記憶部

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 単音節の音声を入力し認識する単音節認
    識装置において、任意の単音節の標準パターンとして一
    つ以上の当該音節を特定の位置に含んだ任意の音節系列
    を許容した標準パターンを記憶する標準パターン記憶部
    と、前記入力する音声から特徴量を抽出し入力パターン
    に変換する分析部と、前記入力パターンと前記標準パタ
    ーン記憶部に蓄えられた複数の標準パターンとを照合し
    前記複数の標準パターンの中で最も類似度の高い標準パ
    ターンを選択し出力する照合部と、前記照合部が選択し
    た標準パターンに対応する単音節を出力する出力部とを
    備えることを特徴とする単音節認識装置。
  2. 【請求項2】 標準パターン記憶部で記憶する任意の単
    音節の標準パターンとして、当該音節を先頭に持つ任意
    の音節系列に助詞の「の」および当該単音節が継続する
    標準パターンを記憶することを特徴とする請求項1記載
    の単音節認識装置。
  3. 【請求項3】 1および複数の音節系列の日本語におけ
    る出現頻度情報を蓄える音節連鎖情報記憶部を備え、照
    合部が入力パターンと標準パターンとを照合する際に前
    記出現頻度情報を参照することを特徴とする請求項1ま
    たは2記載の単音節認識装置。
JP7339493A 1995-12-26 1995-12-26 単音節認識装置 Expired - Fee Related JP2820093B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7339493A JP2820093B2 (ja) 1995-12-26 1995-12-26 単音節認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7339493A JP2820093B2 (ja) 1995-12-26 1995-12-26 単音節認識装置

Publications (2)

Publication Number Publication Date
JPH09179578A JPH09179578A (ja) 1997-07-11
JP2820093B2 true JP2820093B2 (ja) 1998-11-05

Family

ID=18327994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7339493A Expired - Fee Related JP2820093B2 (ja) 1995-12-26 1995-12-26 単音節認識装置

Country Status (1)

Country Link
JP (1) JP2820093B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1135768B1 (en) * 1999-09-29 2008-01-23 Koninklijke Philips Electronics N.V. Spell mode in a speech recognizer
US7865363B2 (en) * 2004-03-09 2011-01-04 Ashwin Rao System and method for computer recognition and interpretation of arbitrary spoken-characters
US7418387B2 (en) * 2004-11-24 2008-08-26 Microsoft Corporation Generic spelling mnemonics
US8457946B2 (en) * 2007-04-26 2013-06-04 Microsoft Corporation Recognition architecture for generating Asian characters
JP2011007862A (ja) * 2009-06-23 2011-01-13 Fujitsu Ltd 音声認識装置、音声認識プログラム、および音声認識方法
CN103827962B (zh) * 2011-09-09 2016-12-07 旭化成株式会社 声音识别装置

Also Published As

Publication number Publication date
JPH09179578A (ja) 1997-07-11

Similar Documents

Publication Publication Date Title
Rudnicky et al. Survey of current speech technology
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US5949961A (en) Word syllabification in speech synthesis system
US5794204A (en) Interactive speech recognition combining speaker-independent and speaker-specific word recognition, and having a response-creation capability
EP2048655B1 (en) Context sensitive multi-stage speech recognition
EP1693828A1 (en) Multilingual speech recognition
EP0769184B1 (en) Speech recognition methods and apparatus on the basis of the modelling of new words
KR19980070329A (ko) 사용자 정의 문구의 화자 독립 인식을 위한 방법 및 시스템
JP2004053742A (ja) 音声認識装置
JP2820093B2 (ja) 単音節認識装置
JPS597998A (ja) 連続音声認識装置
Comerford et al. The voice of the computer is heard in the land (and it listens too!)[speech recognition]
JPH0283593A (ja) ノイズ適応形音声認識装置
JPH1124693A (ja) 音声認識装置
CA2597826C (en) Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance
JP2007535692A (ja) 任意に話されたキャラクタのコンピュータによる認識及び解釈のためのシステム及び方法
CN1979636B (zh) 一种音标到语音的转换方法
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPH119847A (ja) おしゃべりオウム発声装置
JP3039453B2 (ja) 音声認識装置
JP2005534968A (ja) 漢字語の読みの決定
JPH07210193A (ja) 音声対話装置
JP2615649B2 (ja) 単語音声認識装置
JPH11212587A (ja) 音声認識における雑音適応方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980728

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070828

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080828

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080828

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090828

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090828

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100828

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees