JPH0222730A - 音声入力による文書作成装置 - Google Patents

音声入力による文書作成装置

Info

Publication number
JPH0222730A
JPH0222730A JP63172876A JP17287688A JPH0222730A JP H0222730 A JPH0222730 A JP H0222730A JP 63172876 A JP63172876 A JP 63172876A JP 17287688 A JP17287688 A JP 17287688A JP H0222730 A JPH0222730 A JP H0222730A
Authority
JP
Japan
Prior art keywords
syllable
kana
recognition result
recognition
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63172876A
Other languages
English (en)
Inventor
Hidefumi Sawai
沢井 秀文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63172876A priority Critical patent/JPH0222730A/ja
Publication of JPH0222730A publication Critical patent/JPH0222730A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 挟先分裏 本発明は、音声入力による文書作成装置、より詳細には
、音声認識装置を利用した文書作成装置(音声ワードプ
ロセッサ等)に関するものであるが、OCR(文字認識
装置)による文書作成システムにも応用可能なものであ
る。
又に遺宜 単音節音声入力または文節音声入力による文書作成装置
(音声ワードプロセッサ等)において、1つの単音節入
力に対して、通常は複数の認識結果を出力し、これらを
連結することにより「音節ラティス」と呼ばれるものを
作成する。その後、音節ラティスを展開して可能な音節
列を構成するが、日本語中には遷移しない音節の組み合
わせが存在するので、これらを含む音節列を除外したり
、音節認識結果の信頼性(類似度や距離を用いることが
多い)に基づいて音節列を評価する。さらに、自立語と
付X語間の接続関係をチエツクしながら、カナ漢字変換
される。この時、従来技術では、音節間の遷移情報を用
いた処理においては、単に、接続するか否かのチエツク
を行っているだけであリ、これでは依然として音節列候
補数の削減が不十分なためにカナ漢字変換すべき音節列
候補が多く、変換処理に時間がかかりすぎる等の非効率
的な処理を残していた。
M的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、単音節入力または文節入力による音声認識装置に
おいて、カナ漢字変換効率の向」二を図ることを目的と
してなされたものである。
青−−−減 本発明は、上記目的を達成するために、音声を入力する
マイクロフォン、入力された音声を認識する音声認識部
、認識された音声中の音節認識結果を処理する認識結果
処理部、音節間の遷移情報を格納しておく音節間遷移情
報格納テーブル(ng r a mテーブル)、音節認
識結果の類似度と前記n−1:ralnテーブルとから
認識結果を再評価する認識結果再評価部、認識結果再評
価部で評価された音節列に基づいてカナ漢字変換を行な
うカナ漢字変換部、カナ漢字変換された結果を表示する
変換結果表示部とから構成され、認識結果再評価部での
音節列の再評価を音節認識結果の類似度と、前記n−g
ramテーブルの遷移のし易さ(m移カウント数)とを
用いて総合的に行なうことを特徴としたものであり、更
には、認識結果再評価部での音節列の評価値が、音節の
認識結果の類似度の合計と、認識結果の音節間の遷移カ
ウントの合計とを各々適当な定数で重み付けした総和に
基づいた値に設定されることを特徴とするものである。
以下、本発明の実施例に基づいて説明する。
第1図は1本発明の一実施例を説明するためのブロック
図で、図中、1はマイクロフォン、2は音声認識部、3
は認識結果処理部、4は認識結果再評価部、5は音節間
遷移情報格納テーブル(n−grmテーブル)、6はカ
ナ漢字変換部、7は変換結果表示部である。まず、マイ
クロフォン1で入力された音声は、音声認識部2で分析
・認識され、認識結果が複数の候補と共に、認識結果処
理部3に出力される。認識結果再評価部4においては、
認識結果の類似度とn −gramテーブル5(距離で
もよい)とを参照しながら認識結果を再評価して、候補
となる音節列を形成する。カナ漢字変換部6では、認識
結果再評価部4の音節列をカナ漢字変換する。そして、
この結果を変換結果表示部7に出力する。
第2図は、音声入力から認識結果を処理してカナ漢字変
換結果を得るまでの過程を説明するための図で1図中、
61は正しい例文で、今、「おんせいをにんしきする」
と発声した場合を考えるものとすると、第1図に示した
認識結果処理部3には、31に示すように第1〜第n位
までの認識結果(n=3とした)が順に出力される。3
2は31の音声認識装置に対応する類似度の値を示し、
これは人力音節と標準パターンとの類似の度合を示す。
なお、値は相対値である。41は類似度32とn−gr
amテーブル5を引用して音節列を総合的に評価する部
分である。いま、n −gramテーブル5の1番目の
第に位候補の音節からj番目の音節の第0位候補への遷
移のし易さをCkQ(実際には、学習サンプル内での音
節間遷移頻度の値)とする。また、32の類似度の値の
内、i番目の第に位(1≦に≦n)候補の類似度をSk
とすると、総合的な音節列スコア(Score :信頼
度)は、5core = a ・Count + (1
−a )・51m1lanty、 (0≦α≦1)・・
・(1) と定義する。ここで、 51m1larityE Σ S。
l=1  1 (fflは入力音節数、l≦に、fl≦n)である。但
し、αは適当な定数である。
(1)式のスコアをもとに、信頼性の高い方からカナ文
字列を生成する。42は生成されたカナ文字列の例であ
る。この内、第1と第2の候補の音節列は、文法チエツ
ク43と見出し語辞書との照合により除外され、第3候
補のみが正しい音節列として残る。これをカナ漢字変換
した結果を71に示す。
このように、単音節認識結果より音節列を生成した時に
、音節列の信頼性の評価を、音節認識結果の類似度と音
節間の遷移情報の重み付けとの総合的な評価値に基づい
て行なうために、所望の音節列を上位候補中に含ませる
ことが可能となる。
したがって、音節列候補数を大幅に削減でき、効率的な
カナ漢字変換が可能となる。さらに、変換効率の向上に
伴い、正確で高速な文書入力ができる。
効果 以上の説明から明らかなように、本発明によると、単音
節音声の認識結果から音節ラティスを生成し、音節列に
展開して文法的に可能な音節列を評価する際に、各音節
毎の類似度と、各音節間のn−gramテーブルの遷移
のし易さとを総合的に評価するため、音節列の候補数が
大幅に削減でき、よって、効率的にカナ漢字変換でき、
処理速度が大1福に向上する。さらに、変換効率の向上
に伴い、正確なカナ漢字変換が可能となる。
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するためのブロック
図、第2図は1本発明の動作説明をするだめの図である
。 1・・・マイクロフォン、2・・・音声認識部、3・・
・認識結果処理部、4・・・認識結果再評価部、5・・
・音節間遷移情報格納テーブル(n−gramテーブル
)、6・・・カナ漢字変換部、7・・・変換結果表示部

Claims (1)

    【特許請求の範囲】
  1. 1.音声を入力するマイクロフオン、入力された音声を
    認識する音声認識部、認識された音声中の音節認識結果
    を処理する認識結果処理部、音節間の遷移情報を格納し
    ておく音節間遷移情報格納テーブル、音節認識結果の類
    似度と音節間遷移情報格納テーブルとから認識結果を再
    評価する認識結果再評価部、認識結果再評価部で評価さ
    れた音節列に基づいてカナ漢字変換を行なうカナ漢字変
    換部、カナ漢字変換された結果を表示する変換結果表示
    部とから構成され、認識結果再評価部での音節列の再評
    価を音節認識結果の類似度と、音節間遷移情報格納テー
    ブルの遷移のし易さとを用いて総合的に行なうことを特
    徴とする音声入力による文書作成装置。
JP63172876A 1988-07-12 1988-07-12 音声入力による文書作成装置 Pending JPH0222730A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63172876A JPH0222730A (ja) 1988-07-12 1988-07-12 音声入力による文書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63172876A JPH0222730A (ja) 1988-07-12 1988-07-12 音声入力による文書作成装置

Publications (1)

Publication Number Publication Date
JPH0222730A true JPH0222730A (ja) 1990-01-25

Family

ID=15949946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63172876A Pending JPH0222730A (ja) 1988-07-12 1988-07-12 音声入力による文書作成装置

Country Status (1)

Country Link
JP (1) JPH0222730A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010231149A (ja) * 2009-03-30 2010-10-14 Kddi Corp 音声認識に仮名漢字変換システムを用いた端末、方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010231149A (ja) * 2009-03-30 2010-10-14 Kddi Corp 音声認識に仮名漢字変換システムを用いた端末、方法及びプログラム

Similar Documents

Publication Publication Date Title
US9978364B2 (en) Pronunciation accuracy in speech recognition
US11817079B1 (en) GAN-based speech synthesis model and training method
Mabokela et al. An integrated language identification for code-switched speech using decoded-phonemes and support vector machine
JP2002268680A (ja) 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術
JPH0222730A (ja) 音声入力による文書作成装置
JPH11143493A (ja) 音声言語理解装置及び音声言語理解システム
Akinwonmi Development of a prosodic read speech syllabic corpus of the Yoruba language
JPS6229796B2 (ja)
JP3240691B2 (ja) 音声認識方法
Suhasini et al. Attention‐Based End‐to‐End Automatic Speech Recognition System for Vulnerable Individuals in Tamil
JPS6219899A (ja) 文章音声認識装置
JPH049320B2 (ja)
JPH03179498A (ja) 音声日本語変換方式
Akinwonmi Rule-Induced Misanalysis of Nasal Syllables in Yoruba Declarative Syllabification Algorithm
Nagabhushan et al. Dictionary supported generation of English text from Pitman shorthand scripted phonetic text
JP3430265B2 (ja) 日本語音声認識方法
JPS5837698A (ja) 音声入力和文タイプライタにおける変換方法
JPH06289894A (ja) 日本語音声認識方法
JPS63155263A (ja) 音声ワ−ドプロセツサ
JPH04112269A (ja) 認識候補間類似度の差を利用したラティス探索方式
JPH04296898A (ja) 音声認識装置
JPS61149997A (ja) 音声認識装置
JPH0760317B2 (ja) 音声情報入力装置
JPH0473694A (ja) 日本語音声認識方法
JPS61177575A (ja) 日本語文章作成装置