JPS62166400A - 音声ワ−ドプロセツサ装置 - Google Patents

音声ワ−ドプロセツサ装置

Info

Publication number
JPS62166400A
JPS62166400A JP61009665A JP966586A JPS62166400A JP S62166400 A JPS62166400 A JP S62166400A JP 61009665 A JP61009665 A JP 61009665A JP 966586 A JP966586 A JP 966586A JP S62166400 A JPS62166400 A JP S62166400A
Authority
JP
Japan
Prior art keywords
word
monosyllable
recognition
absence
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61009665A
Other languages
English (en)
Inventor
沢井 秀文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61009665A priority Critical patent/JPS62166400A/ja
Publication of JPS62166400A publication Critical patent/JPS62166400A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 1艶分更 本発明は、音声によって文章を入力する音声ワードプロ
セッサ装置に関する。
血米挟亙 特開昭56−116148号公報によれば、単語と単音
節の両方を入力できる音声タイプライタ装置において、
単語と単音節の認識に先立って未知入力音声が両者のい
ずれであるかを判別する際に、時間長、音節数、類似度
のいずれかを用いている。音節数による判別では、パワ
ーの山と谷が明確に現れている場合には比較的容易であ
るが、撥音の前や鼻音や半母音の前後では明確にパワー
の高低が現われ難く、音節数による判定で判定誤りを生
ずる危険がある。
■−−旗 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、単語と単音節を併用して文章を入力する音声認識
装置において、両者の認識モードを自動的に切り換える
ことによって迅速に音声を入力できる装置を提供するこ
とを目的としてなされたものである。
諸−一」叉 本発明は、上記目的を達成するために、単語と単音節の
組み合せで文章を入力する音声ワードプロセッサ装置に
おいて、発声された音声が単語であるか、単音節である
かの判定を行なう単語・単音節判定部と、単語音声を認
識する単語認識部と、単音節音声を認識する単音節認識
部と、単語と単音節音声の標準パターンを格納しておく
辞書格納部と、単語又は単音節認識結果を出力する認識
結果出力部とから成り、未知入力音声が単語であるか単
音節であるかの判定を、継続時間長、無音区間の存在の
有無、パワーディップの有無、音声中の母音または撥音
フレームの出現頻度分布形状等の少なくとも1つ以上の
情報を用いて行うことを特徴としたものである。以下、
本発明の実施例に基いて説明する。
第1図は、単語と単音節の組み合せで文章を入力する場
合の基本的な構成を示すブロック図で。
図中、1はマイクロフォン、2は音声信号の前処理部、
3は特徴パラメータを抽出する特徴分析部。
4は辞書パターンの登録か、入カバターンの認識かを選
択するモードスイッチ、5は登録モード端子、6は認識
モード端子、7は辞書パターン格納部、71.72は各
々、単語、単音節パターン登録部、8は認識処理部、9
は辞書パターン選択モードスイッチ、10.11は各々
単語、単音節パターン選択端子、12は認識結果出力端
子である。
今、マイク1から入力された単語または単音節音声は前
処理部2を経て特徴分析部3に供給され。
該特徴分析部3でBPF群出力のパワースペクトルパタ
ーンやLPG分析によるLPGパラメータ等の特徴パラ
メータに変換される。これらのパラメータはモードスイ
ッチ4が端子5にあるときに、辞書パターンとして登録
しておく。
未知入力音声を認識する時には、マイクロフォン1乃至
特徴分析部3を通過後、モードスイッチ4を認識モード
端子6にし、認識部8で認識を行う。その際に、辞書格
納部7から標準パターン71か72のいずれか一方をパ
ターン選択モードスイッチ9にて選択(10か11に設
置)して行うか。
71.72の両方について行う、いずれにしても未知入
力が単語であるか単音節であるかの判定手段(第1図で
は選択モードスイッチ9)が必要である。なお、認識結
果は端子12で出力する。
第2図は、第1図における選択モードスイッチ9の代わ
りに自動的に単語か単音節かを判定する手段13を設け
たもので、認識部14はこの判定結果を基に単語認識部
15と単音節認識部16のいずれかを選択し、いずれか
において認識を行い。
結果を出力端子17か18にて出力する。
第3図は、第2図の単語と単音節とを判定する判定部1
3における処理ルーチンのフローを示す図で、13aで
入力された音声パターンのフレーム長がある一定値TH
1より小さいときは13bにて単音節であるとみなし、
別の閾値TH,(TH,)THl)より大きいときは1
3cにて単語と見なす。フレーム長がTH,より小さい
場合には13dにて無音区間の有無を判定し、もし存在
すれば単語と見なす。存在しなければ、次に13sにて
パワーディップの有無を判定し、もし存在すれば、単語
と見なす、存在しない場合は、パワー定常部のセグメン
テーションを13fで行い、前記パワー定常部における
各フレーム毎の母音認識を13hにおける母音と撥音の
標準パターンとのパターンマツチングによって行い、母
音ないし撥音の同定を13iで行う。次に、母音又は撥
音のフレーム数の分布を135で求め、この分布形状に
基づいて最終段階での判定を13にで行う。即ち、顕著
な母音又は撥音の分布の山が1つなら単音節、2つ以上
又は顕著な山が存在しない場合には単語であると判定す
る。
第4図(、)は、第3図13dで述べた無音区間Aの検
出の様子、第4図(b)は第3図13eにおけるパワー
ディップBの検出の様子、第4図(c)は第3図の13
f、13gのパワー定常部Cのセグメンテーションおよ
び定常部におけるフレーム毎の母音又は撥音の認識の様
子を模式的に示したものである。
第5図は、第3図の13jと13kにおける母音又は撥
音のフレーム数の分布と分布形状による単語か単音節の
判定の様子を示したもので、第5図(a)は、母音/ 
a /のラベル出現頻度(フレーム数)がある閾値TH
,より大きく、他のラベル出現頻度が全てTH,より小
さいので、パワー定常部は/a/であると判定する場合
である。また、第5図(b)は母音/ a /と撥音7
N/が前記閾値TH,を越えており、パワー定常部は/
 a N /と判定でき、したがって2音節の単語であ
るとみなす場合である。
第6図は、本発明における他の実施例を説明するための
ブロック図であり、図中、19は単語認識部15と単音
節認識部16で得られた各認識結果を比較する総合判定
部で、その他第1図及び第2図の実施例と同様の作用を
する部分には第1図及び第2図の場合と同一の参照番号
が付しである。
而して、第6図に示した実施例においては、単語認識部
15と単音節認識部16で並列に認識処理され、総合判
定部19でどちらかの結果を選択するものである。
第7図は、第6図の総合判定部19での処理のフローを
示した図で、図中、19aは単語認識結果類似度Sw格
納部、19bは単音節認識結果類似度Sa格納部、19
cは類似度判定部であり。
19aと19bで得られた両者の類似度を19cで大小
比較し、Scv(Swなるときは単語であると判定する
第3図13gでの判定部分で、パワー定常部での各フレ
ーム毎の母音、撥音の認識を行う代わりに、パワー定常
部でのパワースペクトラムパターンの変化をフレーム毎
に求め、パターンの変化が少ない場合には定常部は母音
又は撥音であり、したがって未知入力音節は単音節であ
ると判定する。
また、一方、パワー定常部でのパワースペクトラムパタ
ーンの変化が激しい場合には、2種以上の母音(又は撥
音)が存在するものとして、未知入力を2音節以上の単
語と判定することも可能である。
効   果 以上の説明から明らかなように、本発明によると、未知
入力音声が単語であるか単音節であるかの判定を音声パ
ターンの継続時間長、無音区間の有無、パワーディップ
の有無、母音又は撥音フレーム数の出現頻度分布形状、
パワースペクトル変化、単語認識結果類似度と単音節認
識結果類似度との大小比較部、総合的に行うので正確な
判別が可能となる。
【図面の簡単な説明】
第1図及び第2図は、それぞれ本発明による音声ワード
プロセッサ装置の実施例を説明するためのブロック線図
、第3図は、第2図に示した単語/単音節判定部13に
おける処理ルーチンのフローを示す図、第4図(a)〜
(Q)は、それぞれ、無音区間、パワーディップ、パワ
ー定常部の様子を示す図、第5図(a)は、パワー定常
部が/ a /である判定する場合の説明図、第5図(
b)は、パワー定常部が/aN/であると判定する場合
の説明図、第6図は1本発明の他の実施例を説明するた
めのブロック図、第7図は、第6図の総合判定部の処理
フローを示す図である。 1・・・マイクロフォン、2・・・前処理部、3・・・
特微分析部、4・・・モードスイッチ、5・・・登録モ
ード端子。 6・・・認識モード端子、7・・・辞書パターン格納部
。 8・・・認識処理部、9・・・辞書パターン選択モード
スイッチ、10.11・・・パターン選択端子、12・
・・認識結果出力端子、13・・・単語と単音節判定部
。 15・・・単語認識部、16・・・単音節認識部、17
゜18・・・出力端子、19・・・総合判定部。 特許出願人  株式会社 リコー 第3図 第4図

Claims (3)

    【特許請求の範囲】
  1. (1)、単語と単音節の組み合せで文章を入力する音声
    ワードプロセッサ装置において、発声された音声が単語
    であるか、単音節であるかの判定を行なう単語・単音節
    判定部と、単語音声を認識する単語認識部と、単音節音
    声を認識する単音節認識部と、単語と単音節音声の標準
    パターンを格納しておく辞書格納部と、単語又は単音節
    認識結果を出力する認識結果出力部とから成り、未知入
    力音声が単語であるか単音節であるかの判定を、継続時
    間長、無音区間の存在の有無、パワーディップの有無、
    音声中の母音または撥音フレームの出現頻度分布形状等
    の少なくとも1つ以上の情報を用いて行うことを特徴と
    する音声ワードプロセッサ装置。
  2. (2)、未知入力音声が、単語か単音節であるかの判定
    を、継続時間長、無音区間の有無、パワーディップの有
    無による判定後、パワー定常部でのパワースペクトル変
    化に基づいて行うことを特徴とする特許請求の範囲第(
    1)項記載の音声ワードプロセッサ装置。
  3. (3)、未知入力音声が、単語か単音節であるかの判定
    を、単語認識部で得られる類似度と、単音節認識部で得
    られる類似度の大小比較により行うことを特徴とする特
    許請求の範囲第(1)項記載の音声ワードプロセッサ装
    置。
JP61009665A 1986-01-20 1986-01-20 音声ワ−ドプロセツサ装置 Pending JPS62166400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61009665A JPS62166400A (ja) 1986-01-20 1986-01-20 音声ワ−ドプロセツサ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61009665A JPS62166400A (ja) 1986-01-20 1986-01-20 音声ワ−ドプロセツサ装置

Publications (1)

Publication Number Publication Date
JPS62166400A true JPS62166400A (ja) 1987-07-22

Family

ID=11726509

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61009665A Pending JPS62166400A (ja) 1986-01-20 1986-01-20 音声ワ−ドプロセツサ装置

Country Status (1)

Country Link
JP (1) JPS62166400A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008176155A (ja) * 2007-01-19 2008-07-31 Kddi Corp 音声認識装置およびその発声判定方法、発声判定プログラムならびにその記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008176155A (ja) * 2007-01-19 2008-07-31 Kddi Corp 音声認識装置およびその発声判定方法、発声判定プログラムならびにその記憶媒体

Similar Documents

Publication Publication Date Title
JP3162994B2 (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
US6553342B1 (en) Tone based speech recognition
JPS6147440B2 (ja)
US4769844A (en) Voice recognition system having a check scheme for registration of reference data
JP2996019B2 (ja) 音声認識装置
JPS6138479B2 (ja)
Yavuz et al. A Phoneme-Based Approach for Eliminating Out-of-vocabulary Problem Turkish Speech Recognition Using Hidden Markov Model.
KR100391123B1 (ko) 피치 단위 데이터 분석을 이용한 음성인식 방법 및 시스템
EP0177854B1 (en) Keyword recognition system using template-concatenation model
JPS63165900A (ja) 会話音声認識方式
JPS62166400A (ja) 音声ワ−ドプロセツサ装置
CN111429921A (zh) 声纹识别方法、系统、移动终端及存储介质
JP3039453B2 (ja) 音声認識装置
JP3110025B2 (ja) 発声変形検出装置
JP2664136B2 (ja) 音声認識装置
Combrinck et al. Automatic language identification: Performance vs. complexity
JPS63161499A (ja) 音声認識装置
JP2529207B2 (ja) 音韻認識装置
JPH09198382A (ja) 音声入力かな漢字変換装置
JP2001013983A (ja) 音声合成を用いた音声認識装置および音声認識方法
JPS6240497A (ja) 音声パタ−ン分類方式
JPH096387A (ja) 音声認識装置
JP2005189294A (ja) 音声認識装置
JPS6033599A (ja) 音声認識装置
JPH0695684A (ja) 音声認識システム