JPS58123596A - 補助情報を併用する音声認識方式 - Google Patents

補助情報を併用する音声認識方式

Info

Publication number
JPS58123596A
JPS58123596A JP57005998A JP599882A JPS58123596A JP S58123596 A JPS58123596 A JP S58123596A JP 57005998 A JP57005998 A JP 57005998A JP 599882 A JP599882 A JP 599882A JP S58123596 A JPS58123596 A JP S58123596A
Authority
JP
Japan
Prior art keywords
recognition
speech
information
auxiliary information
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57005998A
Other languages
English (en)
Inventor
中田 和男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP57005998A priority Critical patent/JPS58123596A/ja
Publication of JPS58123596A publication Critical patent/JPS58123596A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は音声認識、とくに任意の連続音声の認識方式に
係り、確実で有効な音声認識に好適な音声認識方式に関
する。
従来の音声認識方式の大部分は音響的な音声波形の情報
のみによって音声を認識することになっているので、子
音、とくに破裂音/p、t、k。
b、d、g/や/r、z/などの確実で正確な認識がで
きにくいという欠点があった。
これを解決するため、音声発生時に子音を指定するキー
ボードを押して補助情報を入力するという考え方が提案
されていべ特公昭47−21323号公報参照)が子音
は数が多く、連続的な発声に対応する速さで対応する子
音を正確にえらんでキーインすることは、タイプになれ
ない素人にかなり難しいことである。
一方、仮名キー・ボードを打つ代シに、オンライン手1
き仮名文字の認識を考えると、片仮名文字については比
較的簡単なアルゴリズムでかなシの正しきで認識して入
力することができる(寺井。
中口;オンライン手書き片仮名文字認識、情報処理、1
972年3月、寺井、中田、手誓き漢字・片仮名文字の
オンライン実時間g識、電子通信学会論文誌り、 19
73年5月)。
本発明の目的は、各種、簡便な補助手段を使って音声、
とくに音声だけからは認識のむずがしい子音をも確実、
正確に認識できる音声認識方式を提供することにある。
音声認識とくに連続発声の音声認識がむずかしいのは次
の理由による。
l)連続発声の音声を音節単位に正しく区分することが
難しい一セグメンテーションの困難さ2)セグメントさ
れた音節の母音を正しく認識することが難しい一母音認
識の困難さ 3)ある種の子音、たとえば破裂音/p、t、に/、/
b、d、g/や/r、z/の区別、認識が難しい一子音
認識の困難さ 音声認識においては、これらの困難さは階層をなしてい
る。すなわち、3)の子音認識の困難さはすべての場合
に共通して存在し、2)の母音認識の困難さは単音節学
位の離散発声の場合には比較的少なく、1)のセグメン
テイションの困難さは連続発声の場合にのみ存在する。
これらの困難さを解決する補助手段として、たとえば次
のようなものを考える。
11)に対応して、a)押しボタンスイッチによる音節
数の入力−発声時に手もとのスイッチを押してそのオン
オフ数で音節数を入力する。この情報は単に一個の単語
を構成する音節数の情報を与えるだけでなく、音節発声
のタイミングをも与えうる可能性がある。
2)に対応して、l))手もとにある5個のキー(5母
音に対応)から発声lト語の母音系列の情報を与える。
日本語の場合母音は5個しかないから、子音の情報を入
力するのにくらべてずつと容易であシ、素人でも発声の
速度をおとすことなく入力することができる。
3)に対応して、オンライン手書き仮名人力を併用する
。オンライン手書き文字認識では、文字わくの情報を使
ってまず文字別のセグメンテイションを行うが、これは
a)の音節数情報に対応しており、入力連続発声音声を
音節単位にセグメントするのに役立つ。
音声としてもつとも区別の困難な/p、t、に/、/b
、d、g/などの音は、パ、り、力、バ。
ダ、力などとなり文字としては容易に区別される。
一方、スと夕、マとす、コとユ、セとヤなど文字として
は単にストロークの数や形だけでは区別しに<<、その
相互位置関係、大小関係などをみなければならず、その
ことによって認識アルゴリズムを複雑化しているものは
、その区別を廃止しても、音声による分類によって正し
く認識できる。
たとえば「ヌ」は鼻音でありすべて有声であるが「ス」
は無声まさつ子音であシ、「ヌ」か「ス」かの判定は音
声の音響的な特徴による方が容易である。
、この例のように文字と音声の相互の認識結果には相補
的な性質があるから、それを活用することによって確実
な認識を行うことができる。
以下、本発明の一実施例を図により説明する。
本音声認識方式は2個の入力情報を使う。
一つは必ず音声であり、もう一つは手によるキー人力か
オンライン文字認識のストローク情報のいずれかである
人間1の発声する音声信号2はマイクロフォン3、前置
増幅器4をへて音声分析装置5へ入力される。
一方、人間の手6によるキー人カフまたはオンライン入
力用ペン8によるストローク人力9はスイッチ10をへ
て音節カウンター11へ入力される。音節カウンタ11
は入力されてきたキータッチの数、またはストローク位
置によるセグメント結果から、入力音声の音節数(仮名
文字数)を判定し、セグメント数情報12として音声分
析装置5へ提供する。入力が5母音(ア、イ、つ、工。
オ)を指示する母音キーであった場合には、その母音系
列情報を解読し、母音系列情報13として分析装置5へ
提供する。
分析装置5はこれらの情報にもとづいて入力音声の音i
lへのセグメンテーションおよび母音部の判定を行い、
その結果を子音認識部6へ送る。ここでは母音部分が既
知の音節として単音節標準バタンメモリ14からの標準
バタンと比較し、その判定結果を最終判定部17へ送る
入力がオンライン手書き人力であるときは、その−文字
毎に区分されたストローク情報15から、文字認識部1
6において文字認識を行い、その結果を最終判定部17
へ送る。
この場合、文字認識部161′iさきに説明したように
ストロークのセットとして等しい文字、たとえばヌとス
、コとユなどは区別せず、それ會一つのカテゴリとみな
して認識するようアルゴリズムを簡略化してもよい〇 最終判定部17では音声による認識の結果と文字による
認識の結果を比較参照し、最終認識結果18をうる。
各部での処理の詳細については、現在常識的に行なわれ
ているもので十分であり、また本発明の主張点でもない
ので、これ以上の説明は行なわない。
以上説明したように、本発明によれば、音声のみによる
音声認識の欠点を補う補助情報全活用することによって
、子音金も含めた音声の確実容易な認識ができるので、
音声認識の実用化に大きな効果がある。
【図面の簡単な説明】
図は本発明の詳細な説明図である。 5・・・音声分析装置。 代理人 弁理士 薄田利幸 (7)

Claims (1)

    【特許請求の範囲】
  1. 1、連続音声全音節単位で認識する音声認識方式におい
    て、上記連続音声中に含まれる音節数、各音節の発生タ
    イミング、キー人力された母音系列、およびオンライン
    手書き文字認識によシ入力された仮名文字を認識のため
    の補助情報とすることを特徴とする補助情報を併用する
    音声認識方式。
JP57005998A 1982-01-20 1982-01-20 補助情報を併用する音声認識方式 Pending JPS58123596A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57005998A JPS58123596A (ja) 1982-01-20 1982-01-20 補助情報を併用する音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57005998A JPS58123596A (ja) 1982-01-20 1982-01-20 補助情報を併用する音声認識方式

Publications (1)

Publication Number Publication Date
JPS58123596A true JPS58123596A (ja) 1983-07-22

Family

ID=11626437

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57005998A Pending JPS58123596A (ja) 1982-01-20 1982-01-20 補助情報を併用する音声認識方式

Country Status (1)

Country Link
JP (1) JPS58123596A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS595294A (ja) * 1982-07-01 1984-01-12 日本電気株式会社 音声認識装置
JP2005071073A (ja) * 2003-08-25 2005-03-17 Ricoh Co Ltd 文字入力装置およびその方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS595294A (ja) * 1982-07-01 1984-01-12 日本電気株式会社 音声認識装置
JP2005071073A (ja) * 2003-08-25 2005-03-17 Ricoh Co Ltd 文字入力装置およびその方法
JP4520123B2 (ja) * 2003-08-25 2010-08-04 株式会社リコー 文字入力装置およびその方法

Similar Documents

Publication Publication Date Title
JPS6147440B2 (ja)
US4769844A (en) Voice recognition system having a check scheme for registration of reference data
Fellbaum et al. Principles of electronic speech processing with applications for people with disabilities
JPS6138479B2 (ja)
JPS6316766B2 (ja)
JPS58123596A (ja) 補助情報を併用する音声認識方式
Welch Automatic Speech Recognition? Putting It to Work in Industry
JP2001318915A (ja) フォント変換装置
Pranjol et al. Bengali speech recognition: An overview
Jamil et al. Sentence boundary detection without speech recognition: A case of an under-resourced language.
JPH0968998A (ja) 音声認識方法及び音声認識装置
JPS59121400A (ja) 音声処理装置
US20220189462A1 (en) Method of training a speech recognition model of an extended language by speech in a source language
JPS58186836A (ja) 音声入力デ−タ処理装置
JPH05173589A (ja) 音声認識応答装置
JPS6027433B2 (ja) 日本語情報入力装置
JPS60158496A (ja) 音声認識装置
JPS6288026A (ja) 文章発声装置
JPH0573039B2 (ja)
Derkach et al. An attempt of automatic recognition of some Russian words
JPH0585918B2 (ja)
JPS60225272A (ja) 音声入力仮名漢字変換装置
JPH0157370B2 (ja)
JPS63155229A (ja) ワ−ドプロセツサの変換方式
Akintola et al. Speech Processing Algorithm for Automatic Speaker Recognition-Based Telephone Voice Dialing in Yorùbá