JPS63153596A - 音声文章入力装置 - Google Patents

音声文章入力装置

Info

Publication number
JPS63153596A
JPS63153596A JP61300966A JP30096686A JPS63153596A JP S63153596 A JPS63153596 A JP S63153596A JP 61300966 A JP61300966 A JP 61300966A JP 30096686 A JP30096686 A JP 30096686A JP S63153596 A JPS63153596 A JP S63153596A
Authority
JP
Japan
Prior art keywords
word
section
matching
standard
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61300966A
Other languages
English (en)
Inventor
英行 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61300966A priority Critical patent/JPS63153596A/ja
Publication of JPS63153596A publication Critical patent/JPS63153596A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声で文章を作成する音声文章入力装置に関す
るものである。
従来の技術 従来の音声文章入力装置としては、例えば「連続音声認
識における頻出単語スポツティングの併用効果」(日本
音響学会昭和61年度秋季研究発表会講演論文集2−3
−10)に示されている。
第7図はこの従来の音声文章入力装置の構成図を示すも
の↑あり、1は入力された音声を分析して音響的特徴パ
ラメータを出力する音響分析部、23ページ は音声の音韻単位の音響的特徴パラメータを貯えている
音韻標準パタン辞書、8は音韻標準パタン辞書2の音韻
標準パタンを音響分析部1から得られた音響的特徴パラ
メータに順次照合して似通った音韻標準パタンに対応す
る文字記号及び照合時の信頼度を対にして出力する音韻
パタン照合部、4は音韻パタン照合部3から得られた信
頼度を基に対になっている文字記号を並び替えて入力音
声の認識候補文字列を出力する文字列生成部、5は音声
の単語単位の音響的特徴パラメータを貯えている単語標
準パタン辞書、6は単語標準パタン辞書5の単語標準パ
タンを音響分析部1から得られた音響的特徴パラメータ
に順次照合して似通った単語標準パタンに対応する文字
記号及び照合時の信頼度を対にして出力する単語照合部
、9は文字列生成部4および単語照合部6から得られた
文字記号から最終的な認識文字記号を決定し出力する認
識候補決定部である。第8図は認識候補決定部9の詳細
な構成図であり、91は形態素情報等の日本語文法情報
を登録した文法辞書、92は文字列生成部4および単語
照合部6から出力された文字列から文法辞書91を用い
て最終的な認識結果を決定する文法チェック部である。
以上のように構成された従来の音声文章入力装置の動作
を以下に説明する。
入力された音声は音響分析部1で線形予測分析されLP
Cケプストラム等の音響的特徴パラメータに変換される
。音響分析部1で得られた音響的特徴パラメータは音韻
パタン照合部3と単語照合部6とに送られ、各々の照合
単位で認識される。
初めに音韻パタン照合を行う処理系の説明を行う。音韻
標準パタン辞書2には音響分析部1の分析に使われてい
る音響的特徴パラメータを音韻単位に貯えられている。
具体的には子音部(C)と母音部(V)とを組み合わせ
たC■パタンやVC■パタンとして貯えられている。音
韻パタン照合部3は音韻標準パタン辞書2の音韻標準パ
タンを音響分析部1から得られた音響的特徴パラメータ
に順次照合して似通った音韻標準パタンに対応する文字
記号及び照合時の信頼度を対にして出力す5ページ る。この照合方法としては、例えば、音声認識の分野で
よく知られた5PLIT形の連続DP法等が知られてい
る。この照合の結果、最も似通っている順に照合結果を
出力する。照合結果は音韻標準パタンに対応する文字記
号と照合の確からしさを表わす信頼度との対(ラティス
)になっている。
この信頼度は、DPマツチングの過程で得られる。
文字列生成部4は音韻パタン照合部3から得られた照合
結果を貯える。次に、各認識結果を組み合わせた時の累
積信頼度を基に文字記号を並び替え、入力された音声の
認識候補文字列を生成する。
この具体的方法の例として、音声で「磁石の」と発声し
た場合を見てみよう。音韻パタン照合部3は例えば、表
1のような認識結果を出力する。
(以下余白) 6ページ 表1 各照合結果には照合時の信頼度が付けられている。
文字列生成部4は各認識結果を組合わせて入力音声に対
応する文字列候補を作成する。この際、各認識結果に付
けられている信頼度を加算して文字列全体としての信頼
度を算出し、この総合信頼度の高い順に文字列候補順位
を付けて出力する。こうして得られた文字列生成部4の
出力の例を表2に示す。
(以下余白) 7ページ 表2 次に、単語照合を行う処理系の説明を行う。前述したよ
うに音韻パタン単位に照合する処理系に並行して、単語
単位に同様な照合を行う系が単語照合部6である。音韻
標準パタン辞書2にC■や■CVの形で標準パタンが登
録されていたように、単語標準パタン辞書5には音声の
単語単位の音響的特徴パラメータを貯えている。この単
語は予め予備調査で使用頻度が高い単語を選び出してお
く。
使用頻度が高い単語は個人に依存するため、音声文章入
力装置の認識性能を高めるためには、個人毎に標準単語
を替えることが望ましい。これらの単語を発声した時の
音響分析部1の出力を単語標準パタンとして、単語標準
パタン辞書5に登録しておく。単語照合部6は単語標準
パタン辞書5の単語標準パタンを音響分析部1から得ら
れた音響的特徴パラメータに順次照合して似通った単語
標準パタンに対応する文字記号及び照合時の信頼度を対
にして出力する。この照合方法も、前述の連続DPマツ
チングが利用できる。
こうして得られた音韻パタン照合および単語照合の二系
統からの照合結果は、最終的な認識文字記号を決定し出
力する認識候補決定部9へ送られる。認識候補決定部9
は、初めに単語照合部6から入力した文字列に対になっ
ている信頼度が一定値以上に高い場合は、この文字列を
優先し、単語マツチングできなかった音声区間は文字列
生成部4の出力から補って文字列を作り、最終的な出力
を決定する。逆に信頼度が一定値以下に低い場合は入力
音声中には単語標準パタン辞書に登録した9ページ 標準単語が含まれていないと判断し、文字列生成部4か
らの文字列候補から最終出力を決定する。
これらの最終決定には例えば、ワードプロセッサで用い
られているかな漢字変換技術を利用する。
文法チェック部92は文法辞書91を検索しながら文字
列を形態素解析し、正しく解析できた場合、文法的に正
しいと判断し出力する。この出力が、入力音声の認識結
果である。
先程の表2を例に、この様子を具体的に説明する。
1)単語標準パタン辞書5に「じしやく」の音響的特徴
バタメータが登録されており、単語照合部6から「じし
忙0が出力された場合二文字列の初め3音節は「じしや
く」を優先する。
残りの1音節分を表2の文字列生成部4から出力された
文字列から補う。本例の場合「の」「は」順に候補とす
る。その後、形態素解析を行ない、正しく解析されれば
正しい認識結果として出力される。従って、「じしやく
の」が出力される。
2)単語照合部6からの出力の信頼度が一定値以10ペ
ージ 下の場合: 文字列生成部4からの出力(表2)を順次形態素解析す
る。その結果、第5位文字列候補の「じしやくの」が最
終認識結果として出力される。
発明が解決しようとする問題点 一般に、長時間発声したり体調・気分によって音声に変
化があることは知られており、このような音声の継時変
化に対応することが音声認識の実用化の上で重要である
。しかしながら上記のような構成では、初めに音声単語
の特徴パラメータを登録してしまえば変更することがで
きず、単語標準パタンの継時変化対応が問題となってい
た。本発明はかかる点に鑑み、単語標準パタン辞書に学
習機能を持たせた音声文章入力装置を提供することを目
的とする。
問題点を解決するための手段 本発明は、単語照合部で単語標準パタン辞書の単語と照
合された単語区間を切出しその音響的特徴パラメータを
前記単語標準パタン辞書に追加・書き換えを行う単語切
出し部と、文字列生成部お11ページ よび前記単語照合部から得られた文字記号から最終的な
認識文字記号を決定する認識候補決定部とを備えた音声
文章入力装置である。
作用 本発明では、単語切出し部が単語照合部で照合された単
語区間に相当する音響分析部の出力を切出して一時保持
しておき、単語照合結果の信頼度が高い時はこの切出し
た音響分析部の出力を単語標準パタン辞書に追加・修正
させることによって、単語標準パタン辞書に学習機能を
持たすことができる。
実施例 第1図は本発明の第1の実施例における音声文章入力装
置の構成図を示すものである。第1図において、7は単
語照合部6で単語標準パタン辞書5の単語と似通った音
響分析部1の単語区間を切出しその音響的特徴パラメー
タを単語標準パタン辞書5に追加・修正を行う単語切出
し部、8は文字列生成部4および単語照合部6から得ら
れた文字記号を入力して最終的な認識文字記号を決定す
る認識候補決定部で、単語照合部6の照合結果の信頼度
が高い場合は単語切出し部7へ制御信号を送って単語切
出し部7が切出し保持している音響パラメータを単語標
準パタン辞書5に追加・修正させる。
また本発明の第1の実施例において、第2図は認識候補
決定部8の第1の実施例における詳細構成図であり、8
1は形態情報を主とした文法情報を記述した文法辞書、
82は文字列生成部4から得られた認識候補文字列と単
語照合部6から得られた単語標準パタンに対応する文字
記号とを基に最終的な入力音声の認識候補の文字列を生
成する文法チェック部で、単語照合部6からの出力があ
る場合はこの出力を優先して最終候補とし、かつ単語切
出し部7に制御信号を送って単語切出し部7で切りださ
れた音響的特徴パラメータを単語標準パタン辞書5に追
加・修正させる。単語照合部6からの出力の信頼度が一
定値以下の場合は、文字列生成部4の出力文字列から文
法辞書81を使って日本語文法を満足する文字列が捜し
出されるま13ページ で文法チェックを行う。
以上のように構成された第1の実施例の音声文章入力装
置について、以下その動作を説明する。
単語切出し部7は単語照合部6で標準単語が照合された
区間を検出し、この区間の音響分析部1からの音響的特
徴パラメータを一時記憶に貯えておく。認識候補決定部
8では初めに単語照合部6から入力した文字列に対にな
っている信頼度が一定値以上に高い場合は、この文字列
を優先し、単語マツチングできなかった音声区間を文字
列生成部4からの入力で補って文字列を作る。そして最
終的な出力を決定する。逆に信頼度が一定値以下に低い
場合は入力音声中には単語標準パタン辞書に登録した標
準単語が含まれていないと判断し、文字列生成部4から
入力した文字列候補から最終出力を決定ザる。これらの
最終決定にはかな漢字変換技術を利用する。文法チェッ
ク部82は文法辞書81を検索しながら文字列を形態素
解析し、正しく解析できた場合、文法的に正しいと判断
し出力する。この出力が、入力音声の認識結果であ14
ページ る。
この時、単語照合部からの信頼度が一定値以上で最終認
識結果に反映され、かつ、最終出力が形態素解析に成功
して文法的に正しいと判断された場合、文法チェック部
81は単語切出し部7へ制御信号を送る。単語切出し部
7がこの制御信号を受信すると、一時記憶に貯えていた
特徴パラメータを単語標準パタン辞書5へ送って、標準
単語の学習を行う。学習方法は色々考えられる。最も簡
単な方法は、辞書内容を単語切出し部7の一時記憶内容
と入れ換えることである。また別の方法としては、加算
平均して徐々に学習する方法である。
また別の方法としては、単語標準パタン辞書5内のパタ
ンを一単語当たり複数用意し、非常に近いパタンがあれ
ばそのパタンに学習し、いずれのパタンにも遠ければ、
新規に登録する方法も考えられる。照合回数を単語標準
パタン辞書5内の各パタン毎に持っておれば、照合回数
の少ないものがら順次削除することで単語標準パタン辞
書5のサイズを一定に保つことができる。
15ページ また、本発明第1の実施例において、第3図は認識候補
決定部8の第2の実施例における詳細構成図である。第
3図において、83は本発明の音声文章入力装置からの
出力を見て操作者が正しい認識結果を選択するキーボー
ド、84は最終認識結果を作成して出力する認識候補選
択部で、キーボード83から正しい認識結果が選ばれ、
かつ、単語照合部6からの出力がその認識結果に反映さ
れていれば制御を単語切出し部7に送る。
以上のように構成された本発明の実施例における音声文
章入力装置の認識候補決定部8では、文法チェック部8
2のように形態素解析を利用して文法的に正しい文字列
を選択できないので、そのまま出力して操作者に正しさ
の判定を委ねる。操作者がキーボード83を介して正し
い文字列を選択した後は、文法チェック部82が文法的
に正しい文字列を検出した時と同様に機能する。第3図
の構成を持つ本発明の音声文章入力装置は、文法処理の
ための辞書が不要になるため、操作性の低下と引き替え
に低コスト化が実現できる。
以上のように本実施例によれば、単語切出し部7と、単
語切出し部7へ制御信号を送る認識候補決定部8とを設
けることにより、単語標準パタン辞書5に学習機能を持
たせることができる。
また、第4図は本発明の第2の実施例における音声文章
入力装置の構成図を示すものである。第4図において、
単語切出し部7は単語照合部6から照合時の信頼度を入
力し、この信頼度が一定以上の場合、切出した音響分析
部1からの音響的特徴パラメータで単語標準パタン辞書
5へ追加・修正する。第5図は認識候補決定部9の第1
の実施例における詳細構成図である。
以上のように構成された第2の実施例の音声文章入力装
置では、単語切出し部7は単語照合部6で標準単語が照
合された区間を検出し、この区間の音響分析部1の音響
的特徴パラメータを一時記憶に貯えておく。この時、単
語照合部6から照合時の信頼度も同時に入力する。この
信頼度が一定値以上に高い場合は、一時記憶に貯えてい
た特徴パラメータを単語標準パタン辞書5へ送って、標
17ページ 準単語の学習を行う。
また、本発明第2の実施例において、第6図は認識候補
決定部9の第2の実施例における詳細構成図である。第
6図において、93は本発明の音声文章入力装置からの
出力を見て操作者が正しい認識結果を選択するキーボー
ド、94は最終認識結果を作成して出力する認識候補選
択部である。
以上のように構成された本発明の実施例における音声文
章入力装置の認識候補決定部9では、文法チェック部9
2のように形態素解析を利用して文法的に正しい文字列
を選択できないので、そのまま出力して操作者に正しさ
の判定を委ねる。第6図の構成を持つ本発明の音声文章
入力装置は、文法処理のための辞書が不要になるため、
操作性の低下と引き替えに低コスト化が実現できる。
以上のように本実施例によれば、単語切出し部7を設け
ることにより、単語標準パタン辞書5に学習機能を持た
せることができる。
発明の詳細 な説明したように、音韻パタン照合・単語バ18ページ タン照合を組み合わせる方式の音声文章入力装置におい
て、本発明によれば、単語標準パタン辞書に学習機能を
持たせることによって、音声の継時変化に適応できるた
め、認識率を高めることがことができ、その実用的価値
には大なるものがある。
【図面の簡単な説明】
第1図は本発明における第1の実施例における音声文章
入力装置の構成図、第2図は第1の実施例における認識
候補決定部の第1の構成図、第3図は第1の実施例にお
ける認識候補決定部の第2の構成図、第4図は本発明に
おける第2の実施例における音声文章入力装置の構成図
、第5図は第2の実施例における認識候補決定部の第1
の構成図、第6図は第2の実施例における認識候補決定
部の第2の構成図、第7図は従来の音声文章入力装置に
おける構成図、第8図は従来の音声文章入力装置におけ
る認識候補決定部の構成図である。 1 ・・・音響分析部、2・・・音韻標準パタン辞書、
3 ・・・音韻パタン照合部、4 ・・・文字列生成部
、5 ・・・単語標準パタン辞書、6 ・・・単8照合
部、19ペー 7・・・単語切出し部、8 ・・・認識候補決定部、9
・・・認識候補決定部、81 ・・・文法辞書、82・
・・文法チェック部、83 ・・・キーボード、84・
・・認識候補選択部、91 ・・・文法辞書、92 ・
・・文法チェック部、93 ・・・キーボード、94 
・・・認識候補選択部。 代理人の氏名 弁理士 中尾敏男はか1名ン

Claims (1)

    【特許請求の範囲】
  1. 入力された音声を分析して音響的特徴パラメータを出力
    する音響分析部と、音声の音韻単位の音響的特徴パラメ
    ータを貯えている音韻標準パタン辞書と、前記音韻標準
    パタン辞書の音韻標準パタンを前記音響分析部から得ら
    れた音響的特徴パラメータに順次照合して似通った音韻
    標準パタンに対応する文字記号及び照合時の信頼度を対
    にして出力する音韻パタン照合部と、前記音韻パタン照
    合部から得られた信頼度を基に対になっている文字記号
    を並び替えて入力音声の認識候補文字列を出力する文字
    列生成部と、音声の単語単位の音響的特徴パラメータを
    貯えている単語標準パタン辞書と、前記単語標準パタン
    辞書の単語標準パタンを前記音響分析部から得られた音
    響的特徴パラメータに順次照合して似通った単語標準パ
    タンに対応する文字記号及び照合時の信頼度を対にして
    出力する単語照合部と、前記単語照合部で前記単語標準
    パタン辞書の単語と照合された単語区間を切出しその音
    響的特徴パラメータを前記単語標準パタン辞書に追加・
    書き換えを行う単語切出し部と、前記文字列生成部およ
    び前記単語照合部から得られた文字記号から最終的な認
    識文字記号を決定する認識候補決定部とを備えたことを
    特徴とする音声文章入力装置。
JP61300966A 1986-12-17 1986-12-17 音声文章入力装置 Pending JPS63153596A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61300966A JPS63153596A (ja) 1986-12-17 1986-12-17 音声文章入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61300966A JPS63153596A (ja) 1986-12-17 1986-12-17 音声文章入力装置

Publications (1)

Publication Number Publication Date
JPS63153596A true JPS63153596A (ja) 1988-06-25

Family

ID=17891217

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61300966A Pending JPS63153596A (ja) 1986-12-17 1986-12-17 音声文章入力装置

Country Status (1)

Country Link
JP (1) JPS63153596A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006058479A (ja) * 2004-08-18 2006-03-02 Matsushita Electric Works Ltd 音声認識機能付制御装置
WO2013027360A1 (ja) * 2011-08-19 2013-02-28 旭化成株式会社 音声認識システム、認識辞書登録システム及び音響モデル識別子系列生成装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006058479A (ja) * 2004-08-18 2006-03-02 Matsushita Electric Works Ltd 音声認識機能付制御装置
WO2013027360A1 (ja) * 2011-08-19 2013-02-28 旭化成株式会社 音声認識システム、認識辞書登録システム及び音響モデル識別子系列生成装置
JP5613335B2 (ja) * 2011-08-19 2014-10-22 旭化成株式会社 音声認識システム、認識辞書登録システム及び音響モデル識別子系列生成装置
JPWO2013027360A1 (ja) * 2011-08-19 2015-03-05 旭化成株式会社 音声認識システム、認識辞書登録システム及び音響モデル識別子系列生成装置
US9601107B2 (en) 2011-08-19 2017-03-21 Asahi Kasei Kabushiki Kaisha Speech recognition system, recognition dictionary registration system, and acoustic model identifier series generation apparatus

Similar Documents

Publication Publication Date Title
JP5072415B2 (ja) 音声検索装置
US7107216B2 (en) Grapheme-phoneme conversion of a word which is not contained as a whole in a pronunciation lexicon
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JPWO2007097176A1 (ja) 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
JP4269625B2 (ja) 音声認識辞書作成方法及びその装置と音声認識装置
JP4220151B2 (ja) 音声対話装置
JP2011007862A (ja) 音声認識装置、音声認識プログラム、および音声認識方法
JP2002278579A (ja) 音声データ検索装置
Al-Anzi et al. Performance evaluation of Sphinx and htk speech recognizers for spoken Arabic language
JPS63153596A (ja) 音声文章入力装置
JP3378547B2 (ja) 音声認識方法及び装置
JPS6229796B2 (ja)
JPS63153595A (ja) 音声文章入力装置
JPH11338498A (ja) 音声合成装置
JPH0634175B2 (ja) 文章読上げ装置
JP2005345846A (ja) 入力テキストのポーズ位置予測装置
JPH10187185A (ja) 言語処理装置および方法
JPH08171396A (ja) 音声認識装置
JP2005534968A (ja) 漢字語の読みの決定
Louw A new definition of Xhosa grapheme-to-phoneme rules for automatic transcription
JP3402480B2 (ja) 文書朗読装置
JPH04296898A (ja) 音声認識装置
JPH04127199A (ja) 外国語単語の日本語発音決定方法
JPS6162166A (ja) 日本語文章作成装置