JPS62226196A - 標準パタン逐次学習方式 - Google Patents

標準パタン逐次学習方式

Info

Publication number
JPS62226196A
JPS62226196A JP61067708A JP6770886A JPS62226196A JP S62226196 A JPS62226196 A JP S62226196A JP 61067708 A JP61067708 A JP 61067708A JP 6770886 A JP6770886 A JP 6770886A JP S62226196 A JPS62226196 A JP S62226196A
Authority
JP
Japan
Prior art keywords
pattern
standard
patterns
sentences
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61067708A
Other languages
English (en)
Inventor
良平 中津
管村 昇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP61067708A priority Critical patent/JPS62226196A/ja
Publication of JPS62226196A publication Critical patent/JPS62226196A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は、文節、文章等の単位で連続的に発声された
日本語文に対し、あらかじめ蓄えられた単音節や単語標
準パタンを用いてi!!!続音声中の音節や単語を認識
し、その認識結果に対して日本語文に変換を行う音声日
本語入力方式における、標Y1乞パタンを得るための標
準パタン学習方式に関するものである。
「従来の技術」 音声を利用した日本語入力方式の多くは、日本語がカナ
系列からなっていることに着目し、単音節(以71CV
パタンとよぶ、C:子音、■:母音)単位に入力文を発
声し、これを認識する方法が多く用いられている。この
場合、標準パタンとしては、孤立発声されたCVパタン
か用いられている。
しかしながら、単音節単位で発声し入力する場合には、
利用者の発声負担が大きい、入力速度が低いなどの問題
点がある。このようなことから、文節もしくは文章単位
に連続して発声された音声を認識して、日本語入力を行
う方式が検討されている。しかしこの場合、連続音声中
のCvパタンは、調音結合の影響により孤立発声された
場合のCVパタンとは、その特徴が大きく異なり、孤立
発声されたCV標準パタンを用いるだけでは、認識精度
が向上しないという問題点があった。これを改良するた
めに、単語中やVCV音節等から切りだしたC■パタン
の組み合わせからC■標準パタンを作成する方法が試み
られているが、この場合には、日本語入力装置の使用に
先立って利用者に多くの発声負担を強いることになり現
実的でない。
この発明の目的は音声日本語入力方式に用いられ、使用
前における標準パタン登録のための発声負担を低域し、
かつ高い認識精度が得られ標〈?パタン逐次学習方式を
提供することにある。
1−問題点を解決するための手段」 文節、文章などの単位で連続的に発声された日本語文に
対し、あらかじめ蓄えられた単音節、単語などの標準パ
タンを用いて連続音声中の音節や単語を認識し、その認
識結果に対して日本語文に変換する処理を行い、その変
換結果を表示して、利用者に確認ないしはイB正処理を
行わしめることによって日本語文書の入力を行う音声日
本語入力方式において、 この発明では複数の文節もしくは文章の内容とその文節
もしくは文章に対する上記認識結果との  ″比較を行
い、認識に悪影舌を及ぼす標準パタンか存在する場合に
は、それらのパタンを標準パタンより除去するパタン選
択処理を行い、その選択処理された標準パタンを用いて
再度同一の文節もしくは文章を認識し、その再度の認識
で認識できない音節、単語などに関しては確認、修正の
情報を利用して入力音声中より当該パタンを抽出して標
準パタンとして追加するパタン追加処理を行い、その結
果得られた標準パタンを用いて、次の複数の文節もしく
は文章の認識を行い、これら一連の処理をつぎつぎに新
たな入力文章に適用することにより、標準パタンを逐次
的に更新していく。
このように使用前の学習のみではなく、実際に入力され
る音声により標に%パタンを修正してゆくため、高い認
識精度が得られる。
「実施例」 第1図にこの発明の実施例を示す。
日本語入力装置の使用に先立ち学習音声を例えば101
個(標準的な音節のすべて)CVパタンの孤立発声によ
り入力して標準パタンを蓄積する。
この孤立音声は音声入力端子1)より入力され、音声分
析部12で音声の特徴パラメータが抽出され、この標準
パタンは切換えスイッチ13のa側を通じてCV標準パ
タン蓄積部14に蓄積される。
このl!!串パタンの蓄積のために通常は、認識精度を
向上させる点から同−C■音節に対して複数の標準パタ
ンを用意するマルチテンプレート方式を用いる。
次に文章入力時には切換えスイッチ13はb側に接続さ
れ、入力したい文書の内容を文節もしくは文章単位に連
続発声し、この入力音声は入力端子1)より音声分析部
12に入力されてその特徴パラメータ(相関係数、LI
’Cケプストラム係数など)が抽出されて音声認識部1
5及び入力音声−特記4.2部16に入力される。音声
認識部15ばその入力された音声を、Cv標準パタン蓄
積部14に蓄積されている標準パタン、例えばこの時点
では、初期登録した孤立発声のCVパタンを用いて認識
する。この認識方式としては特願昭206040号「連
続音声認識方式」で示した方法などを用いることができ
、ここではその詳細説明を省略する。
音声認識部15での認識結果は日本語変換部17で日本
語変換が行われる。その日本語変換の具体的な方法は、
例えば昭和59年度電子通信学会総合全国大会(p、6
−230)に記述しである方法等を用いればよい。この
日本語変換の結果は、確認・修正部18に送られ、利用
者によりその日本語変換結果に対する確認・修正が行わ
れる。確認、修正の方法としては、日本語変換の結果得
られる複数の候補をつぎつぎ表示し、その中に正解があ
る場合にはそれを選択する1桑作を行い、正解がない場
合は再度音声で入力するか、キーボードから正解を入力
する。
この確認・修、正から得られる情報によって、入力音声
一時記憶部16に蓄積されている音声の内容を知ること
ができる。この内容と音声のパワー情報などの特徴パラ
メータとを手掛かりに、入力音声一時記憶部16に蓄積
されている入力音声は、CVパタン切り出し部19でC
V小単位切りだされ、C■パタン一時記憶部21に蓄積
される。
一方これらの処理とは別に、複数の文節もしくは文章が
入力された時点で入力音声の認識に用いたCV標準パタ
ン、つまりCV標準パタンM積部14に蓄積されている
CV標準パタンに対して、認識率が最大になるようにC
v標準パタンの選択処理をCVパタン選択・追加処理部
22で行う。
その具体的な手法は次の通りである。まず音声認識部1
5の認識結果は認識結果蓄積部23に順次記憶する。そ
の記憶の形式としては、第2図に示すように入力音声の
各音節(区間)ごとに、認識結果にどのC■標準パタン
が用いられたかを記憶する。その標準パタンとしては第
1位の他に複数の候補をも記憶しておく。通常、認識結
果はかな文字の系列として表現されている。第2図にお
いて例えば「コー2」は「コ」の2番目の標準パタンと
の認識結果を示す。
一方上述した確認・修正処理の結果、正しいかな文字の
系列が確認・修正部18から得られ、これらは変換結果
蓄積部24に順次記憶される。認識結果蓄積部23の認
識結果と変換結果蓄積部24の変換結果との両者の結果
を比較し、認識結果蓄積部23に記憶されているデータ
に対して認識率を最大にするCvパタンをCV標準パタ
ンから選択し、認識に悪影うを与えるようなCV標準パ
タンは除去する。この選択処理の方法としては、日本音
ツ学会講演論文集pp、  17−18 (1985−
9,10)の方法を用いればよい。その選択したCVバ
クンか有効であることを示す情報をCV積標準パタン蓄
積14に送り、そのCV4!!準パタン全パタン不要な
パタンについては無効であることを示す情報をCV積標
準パタン蓄積14に送り、選択されたパタンのみをCv
標4艦パタン蓄積部14に残すようにする。
つぎにこの選択されたC■標準パタンを用いて再度同一
の入力音声の認識を行う、つまり入力音声一時記憶部1
6に記憶されている入力音声について音声認識を行う。
この場合、実際にはすでに認識結果蓄積部23に、第2
図に示した形式で認識結果が記憶されているので、この
中から選択されたCvパタンのU17jh結果だけを抽
出すれば、容易に認識結果が得られる。つまり、前記C
Vパタン選択処理の際に、認識結果蓄積部23の各認識
結果について保存するか除去するかの区別を付け、第2
図において、各音節について保存するとされたC■パタ
ンに対する認識結果のみを集計すれば良い。このように
すれば入力音声一時記憶部16に蓄えられている入力音
声について音声認識部15で再度認識処理をする必要な
く、簡単にその認識結果を得ることができる。
もしこの再入力された音声の認識に対しても、有効に作
用するC■標準パタンがCV積標準パタン蓄積14に存
在しない場合には、入力音声のその部分に相当するCv
パタンをCvパタン一時記憶部21から取り出し、Cv
標準パタン蓄積部14に送り、新しいC■標準パタンと
して追加して蓄積する。このC■パタン追加の方法とし
ては、例えば再認識の結果第1位に認識できなかったC
Vパタンをすべて追加する方法などがある。
つぎの新たな入力音声に対しては、CV積標準パタン蓄
積14のこの新しいCv標準パタンを用いて認識を行う
。このような操作を繰り返すことにより、逐次的にC■
標準パタンの更新を行っていく。前記CVパタンの選択
処理の時点としては、短期間での判断を避け、例えば入
力文字数が一定値以上とか、−文書の入力を終えて文書
格納命令を受けた時点などが考えられる。
第3図は、この発明の別の実施例を示し、第1図と対応
する部分には同一符号を付けである。認識精度を考えた
場合、標準パタンはCvパタンのように短い単位よりも
、単語などのようにより長い単位のほうが望ましい、従
って、第3図は、第1図におけるCv標準パタンに加え
、単語標準パタンをも用いて認識する構成とした例であ
る。入力音声一時記憶部16に記憶された入力音声は、
確認・修正部18における確認・修正により得られた正
しい音声の内容と、パワー情報などの特徴パラメータと
を手掛かりに単語パタン切り出し部26で単語パタンに
切り出され、その単語パタンは単語パタン一時記憶部2
7に記憶される。最初はその単語パタンのすべてかその
まま単語標準パタン蓄積部28に蓄積される。その後の
入力音声については、音声認識部15においてCv標準
パタンを用いる認識のみならず、単語標準パタン蓄積部
28の単語標準パタンを用いる認識をも行い、これらの
認識結果は前述の例と同様に認識結果蓄積部23に蓄積
され、そのCvパタンについての処理は前述と同様に行
われ、かつ単語パタンについても認識結果と、変換結果
とを比較し、認識に悪影口を及ぼすような単語標準パタ
ンを除去し、有効なφ、詔標準パタンを単語標準パタン
蓄積部28に残し、その後再認識を行い、それでも有効
な単語パタンかない場合は対応する単語パタンを単語パ
タン一時記憶部27から取出して単語標準パタン蓄積部
28に単語標準パタンとして追加することを単語パタン
選択・追加処理部29で行う。
なお、使用者が頻繁に使用する単語を予め知っている場
合は、使用の始めに、スイッチ13をa側に接続し、C
vパタンを孤立発声して、Cv標準パタンとしてCV標
準パタンM積部14に蓄え、またよく使用する単語を発
声してm語標準パタンとして単語標準パタン′rt積部
28に予め蓄えてもよい。また個人が文書作成時に使用
する誘電には、限度があるので単語標準パタン蓄積部2
8としては、5Q(1語程度を用意しておけばよい、単
語標準パタンの更新法に関しては、前述したようにcv
4!:4準パクンの場合と同様に、選択・追加処理を行
うと共に、単語の使用頻度の管理を行い、ある時点で使
用頻度の低い標準パタンは除去し、使用頻度の高いもの
を新たな単語標準パタンとして登録する方法を併用する
ことも考えられる。
「発明の効果」 以上説明したように、この発明においては、利用者の初
期の標準パタン作成のための発声負担は少なく、しかも
利用者の文書入力時の音声を用いて、標準パタンの更新
を行っていく方法であるから、利用に先立って多くの発
声負担を利用者に強いることなく、使用しているうちに
、利用者が意識しなくても標準パタンの自動更新がなさ
れ、認識率が向上していく利点がある。さらに第3図に
示した例では利用者が頻繁に用いる単語については、単
語単位の認識が行われ、認識率および日本語変換率の向
上が図られる。
【図面の簡単な説明】
第1図はこの発明の実施例で標準パタンとじてCvパタ
ンのみを用いる場合を示すブロック図、第2図は第1図
中の認識結果蓄積部23における認識結果の記憶の形式
例を示す図、第3図はこの発明の他の実施例で標準パタ
ンとしてC■パタンと単語パタンを用いる場合を示すブ
ロック図である。

Claims (1)

    【特許請求の範囲】
  1. (1)文節、文章等の単位で連続的に発声された日本語
    文に対し、あらかじめ蓄えられた単音節標準パタンや単
    語標準パタンなどの標準パタンを用いて連続音声中の音
    節や単語を認識し、その認識結果に対して日本語文に変
    換する処理を行い、その変換結果を表示して、利用者に
    確認ないしは修正処理を行わしめることによって日本語
    文書の入力を行う音声日本語入力方式において、 複数の文節もしくは文章の入力終了後、上記確認修正処
    理によって知ることのできた上記複数の文節もしくは文
    章の内容とその文節もしくは文章に対する上記認識結果
    との比較を行い、認識に悪影響を及ぼす標準パタンが存
    在する場合には、それらのパタンを標準パタンより除去
    するパタン選択処理を行い、 その選択処理された標準パタンを用いて再度同一の文節
    もしくは文章を認識し、 その再度の認識で認識できない音節、単語などに関して
    は、確認、修正の情報を利用して入力音声中より当該パ
    タンを抽出して標準パタンとして追加するパタン追加処
    理を行い、 その結果得られた標準パタンを用いて、次の複数の文節
    もしくは文章の認識を行い、これら一連の処理をつぎつ
    ぎに新たな入力文章に適用することにより、標準パタン
    を逐次的に更新していくことを特徴とする標準パタン逐
    次学習方式。
JP61067708A 1986-03-26 1986-03-26 標準パタン逐次学習方式 Pending JPS62226196A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61067708A JPS62226196A (ja) 1986-03-26 1986-03-26 標準パタン逐次学習方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61067708A JPS62226196A (ja) 1986-03-26 1986-03-26 標準パタン逐次学習方式

Publications (1)

Publication Number Publication Date
JPS62226196A true JPS62226196A (ja) 1987-10-05

Family

ID=13352726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61067708A Pending JPS62226196A (ja) 1986-03-26 1986-03-26 標準パタン逐次学習方式

Country Status (1)

Country Link
JP (1) JPS62226196A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02136899A (ja) * 1988-11-18 1990-05-25 Nec Corp 音声認識装置
JP2018040906A (ja) * 2016-09-06 2018-03-15 株式会社東芝 辞書更新装置およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5766497A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Voice registration pattern adding system
JPS60201397A (ja) * 1984-03-26 1985-10-11 富士通株式会社 正解候補選択方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5766497A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Voice registration pattern adding system
JPS60201397A (ja) * 1984-03-26 1985-10-11 富士通株式会社 正解候補選択方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02136899A (ja) * 1988-11-18 1990-05-25 Nec Corp 音声認識装置
JP2018040906A (ja) * 2016-09-06 2018-03-15 株式会社東芝 辞書更新装置およびプログラム

Similar Documents

Publication Publication Date Title
US20050033575A1 (en) Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer
JP2000122691A (ja) 綴り字読み式音声発話の自動認識方法
JPH0422276B2 (ja)
WO2008084476A2 (en) Vowel recognition system and method in speech to text applications
JP2955297B2 (ja) 音声認識システム
EP0562138A1 (en) Method and apparatus for the automatic generation of Markov models of new words to be added to a speech recognition vocabulary
CN112686041B (zh) 一种拼音标注方法及装置
JP3948260B2 (ja) テキスト入力方法及びその装置
JPS62226196A (ja) 標準パタン逐次学習方式
KR101250897B1 (ko) 전자사전에서 음성인식을 이용한 단어 탐색 장치 및 그 방법
JP3039453B2 (ja) 音声認識装置
JP2980382B2 (ja) 話者適応音声認識方法および装置
JP3357752B2 (ja) パターンマッチング装置
JP2001282098A (ja) 外国語学習装置、外国語学習方法および媒体
JPH0736481A (ja) 補完音声認識装置
JPH1097270A (ja) 音声認識装置
JPS62217297A (ja) 単語音声認識装置
KR100317215B1 (ko) Plu를 이용한 화자독립/어휘독립 음성모델 등록장치 및그 방법
JPS62147492A (ja) 音声認識装置における標準パラメ−タの修正方法
JPH0229799A (ja) 音素を単位とした音声認識装置
JPH08110790A (ja) 音声認識装置
JPH03149598A (ja) 音声認識装置
JPS63161498A (ja) 音声情報入力装置
JPH0119596B2 (ja)
JPS6180298A (ja) 音声認識装置