JPS59116837A - 音声入力式日本語文書処理装置 - Google Patents

音声入力式日本語文書処理装置

Info

Publication number
JPS59116837A
JPS59116837A JP57232213A JP23221382A JPS59116837A JP S59116837 A JPS59116837 A JP S59116837A JP 57232213 A JP57232213 A JP 57232213A JP 23221382 A JP23221382 A JP 23221382A JP S59116837 A JPS59116837 A JP S59116837A
Authority
JP
Japan
Prior art keywords
memory
candidate
clause
stored
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57232213A
Other languages
English (en)
Other versions
JPH049320B2 (ja
Inventor
Mitsuhiro Toya
充宏 斗谷
Fumio Togawa
外川 文雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP57232213A priority Critical patent/JPS59116837A/ja
Publication of JPS59116837A publication Critical patent/JPS59116837A/ja
Publication of JPH049320B2 publication Critical patent/JPH049320B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 く技術分野〉 本発明は文節単位に発声された音声を音節単位に認識し
、この認識された音節候補の組合せにより複数の文節候
補列を作成し、辞書照合を含む文法処理を行なって文節
単位の認識結果を出力する音声入力式日本語文書処理装
置の改良に関するものであり、更に詳細には認識結果の
複数の候補を音声認識結果の確からしさ以外の条件によ
り評価して認識結果の出力順序を変更するようにした音
声入力式日本語文書処理装置に関するものである。
〈従来技術〉 従来の音声入力式日本語文書処理装置において。
例えば入力音声を音節単位に認識し、この認識された音
節候補の組合せにより複数の文節候補列を作成し、辞書
照合を含む文法処理を行なって文節単位の認識結果を出
力している。そしてこの時文節の長さと各音節毎の候補
数を組合せた数の文節候補列が作成され、また辞書照合
の結果も複数の認識結果が出力される。
この場合、音声認識結果の確からしさの順序で複数の認
識結果を順次出力している。
しかし、従来のこのような方法において、単音節の認識
結果がほとんど誤まりの無い場合、あるいは対象とする
語粟が少ない場合には特に問題は生じないが、現在の音
声認識の技術レベルでは充分に区切った音節でも識別し
にくい音節があり、また連続的に発声した音声では調音
結合等の影響により識別率が更に低下する。
また辞書に収納された語文が多くなれば思ってもみない
語が最初に認識結果として出力されることがある。
〈目的〉 本発明は上記の点に鑑みて成されたものであり、音声認
識結果の確からしさ以外の自立語の長さ。
頻度等の条件を考慮に入れて認識結果の出力順序を決定
するようにした音声入力式日本語文書処理装置を提供す
ることを目的としている。
〈実施例〉 以下、本発明を一実施例を挙げて詳細に説明する。
第1図は本発明の音声入力式日本語文書処理装置の一実
施例の構成を示すブロック図である。
第1図において、1は音声入力をピックアップするマイ
クロホンであり、このマイクロホン1により検出された
音声は単音節認識部2に入力される。この単音節認識部
2は従来公知のものであり、マイクロホン1を介して入
力された文節単位の音声が音節単位に区分されて単音節
毎の特徴抽出が行なわれる。一方メモリ3には各単音節
毎の標準パターンが記憶されており、単音節認識部2に
おいて入力音声の特徴パターンと標準パターンとのマツ
チング計算処理が行なわれ、このマツチング計算処理の
結果、最も近似したものが第1候補として、また順次近
似したものが次候補として選出され、その結果が近似度
(確からしさ)を示す距離差情報と共にメモリ4に音節
ラティスとして記憶される。
」二記単音節認識部2において認識され、音節ラティス
としてメモリ4に記憶された内容は候補列作成部5に入
力されて近似度(確からしさ)を示す距離差情報を用い
て確度の高い順に文節候補(かな文字列)が作成されて
文節候補メモリ6に記憶される。なおメモリ6において
領域6aは文節候補の確からしさを示す情報の記憶領域
領域6bは後述する評価点を記憶する評価レジスタ領域
である。
上記候補列作成部5において作成され、メモリ6内に記
憶された複数の候補列は順次文節分析部7に入力されて
文法的な分析が行なわれると共に分析に必要な文法情報
及び見出し語辞書、接辞語辞書等を含む辞書メモリ8の
内容と照合され、一致したものが認識結果メモリ9に文
節(単語)の漢字候補情報として記憶される。更に文節
分析部7は後述するようにメモリ9に記憶される文節(
漢字)候補の構成要素を分析して評価点を算出し、仮名
漢字変換処理における同音語の最高評価点を得た漢字候
補が認識結果メモリ9に記憶されまたメモリエリア9a
にその候補に対する評価点が記憶される。
なお10は評価点算出のために用いられるバッファであ
り、メモリ領域A、B、C,ST、SB、X、を有して
いる。また11は認識結果等を表示する表示装置、12
はかなキー、ファンクションキー等を有する入力装置、
13は上記各装置を制御するコントローラ(CPU)で
ある。
次に上記の如く構成された装置の動作を第2図に示す1
文節の処理フローに従って説明する。
文節単位に発声された音声はマイクロホン1によって検
出されて単音節認識部2により、単音節単位に認識され
(n O=n 3 )、その認識結果が音節ラティスメ
モリ4に入力記憶される。
例えば入力音声「/こ〃<〃み〃ん〃は/」(「国民は
」)に対する単音節認識結果として第1表に示すような
音節ラティスが形成される。
第1表 ナオ、」二記第1表において音節ラティスの()内に示
した数字は第1位の認識結果を1.0とした時の2位以
下の確度を表わしている。
上記単音節認識部2において認識され、音節ラティスと
してメモリ4に記憶された音節単位の各候補は候補列作
成部5に入力される。
候補列作成部5は音節ラティスメモリ4に記憶された音
節単位の認識結果を用いて、最初に上記メモリ4に記憶
された1位の認識結果ばかりを並の小さい順に候補列(
文節候補)を作成してメモリ6に記憶する。またこの時
各文節候補に対する確度情報がメモリエリア6aに記憶
される(n4)。
上記第1表に示した例では24個の候補列が第2表の如
く作成されてメモリ6に記憶される。
第2表 次にメモリ6に記憶された候補列は順次文節分析部7に
入力され、文節の分析が行なわれる(n5)。
即ち文節分析部7では入力される候補列を次のように分
析処理する。
候補列→(接頭語)十自立語+(接尾語)+(活用語尾
)+(付属語列) ただしく)内の要素は無(でも良い。
ステップn5において行なわれる文節の分析処理フロー
は第3図に詳細に示されており、文節分析部7はまず入
力された候補列と辞書メモリ8の記憶内容との照合を行
なって仮名漢字変換処理を実行する(nlo、n11)
。この時変換ができなかった場合には入力された候補列
が文節として不可能なかな配列と判定して、メモリエリ
ア6bのその候補列に対応した位置(評価値レジスタ)
に「0」を入れて、文節分析結果(評価)「X」の決定
を行う(ステップn12.13.14)。
一方、仮名漢字変換処理動作(nll)の結果、変換が
可能であった場合には、評価値レジスタエリア6bの対
応位置(評価値レジスタ)を「0」にリセットする(n
+5)と共にステップn16以後の評価点算出動作に移
行する。
即ち、本発明において各文節候補についてnl。
〜n15の動作を実行することにより上記第2表の評価
欄に示したように[0を付加した5個の候補列が文節と
して可能であることが分析される。
また、本発明においては文節として可能な候補列につい
てステップn16以後において文節の構成要素において
重み付は首付なって出力順序付けを行なっているがその
一例を以下に示す。
文節として可能な候補列に対する評価点は上記した文節
の要素の接頭語、自立語、接尾語の各々に対して次の3
点において点数を与え、各要素ごとに重みをかけて加算
した点数の合計として算出される。
■ 語長 ■ 頻度 ■ 直前の数百文節での使用の有無 次に各項目に対する評価点を算出動作を説明する。
(i)  自立語に対する評価点(n16〜n21)自
立語長は、その自立語の活用語尾の長さも含めた長さと
する。例えば1歩いた」では、1歩」が自立語の語幹で
あり、「い」が活用語尾であり、「た」が付属語となる
。従って自立語長は3となり、この自立語の長さはAし
、ジスタに記憶される(n16)。
自立語に対する頻度情報は3ランクに分け、少ないもの
から0.1.2の値が与えられた例えば辞書メモリ8に
記憶されており、この辞書メモリ8より所望の頻度情報
が取出されてBレジスタに記憶される(n17)。
次にステップn18に移行して直前の数十文節で使用さ
れているか否かが判定され、使用されていれば「1」、
使用されていなければ「0」がCレジスタに記憶される
(n+9.20)。
次にステップn21に移行して自立語の評価点Jが次式 %式% に従って算出され、その結果がJレジスタに記憶される
なお、自立語の場合には、−変相いたものを再度用いる
碇率が高いため、使用の有無の情報Cに重みをかけてい
る。
(11)接頭語、接尾語に対する評価点(n22〜n3
7)接頭語はその文字数(拗音は除く)を2倍したもの
を用いる。ただし、文字数が0(接頭語がない時)の時
には「4」を与える(n2B)。また頻度は2ランクに
分けられており、少ないものを「0」、多いものを「月
としている。更に使用の有無は無い時には「O」、有の
時には「1」を与えている。
接頭語長はAレジスタに記憶され(n24)、頻度情報
はBレジスタに記憶され(n25)、使用の有無情報は
Cレジスタに記憶され(n27.28)、その後ステッ
プn29に移行して接頭語の評価点STが次式 %式% に従って計算され、その結果がSTレジスタに記憶され
る。
接尾語の場合には接頭語と同様の動作がステップn30
〜n87において実行され、その結果がSBレジスタに
記憶される。
次にステップn88に移行して1文節全体の評価点Xが
次式 %式% に従って計算され、その結果がXレジスタに記憶される
次にステップn89に移行してXレジスタの値が評価値
レジスタの値より大きいか否かが判定され、Xレジスタ
の値が評価値レジスタの値より大きい場合には評価値レ
ジスタにXレジスタの内容を記憶すると共に、ステップ
nll、n12において変換された漢字候補をその評価
点と共にメモリ9に記憶する(n41)。
一方n39においてXレジスタの値が評価値レジスタの
値より大きくない場合にはステップn40を飛び越して
ステップn41に移行する。
ステップn41においては次の同音語の候補があるか否
かが判定され、同音語の候補があればステップn16以
降に戻って新たな同音語候補に対する評価点の計算が行
なわれる。
ま゛た同音語の補候がなければステップn42に移行し
て1候補列に対する文節の分析動作が終了する(n5)
このような動作により1候補列に対する漢字候補がその
評価点と共に認識結果メモリ9に記憶され、また1候補
列に対して同音語(複数の漢字候補)が存在する場合に
は評価点の最も大きい漢字候補がメモリ9に記憶される
ことになる。
第2表に示した例においては 「ごふにんは」 → 「ご赴任は」 「とふにんは」 → 「塗布人は」 「ごふみんは」 → 「ご不眠は」 「とふみんは」 → 「塗布民は」 「こくみんは」 → 「国民は」 の漢字候補が得られる。また接頭語「ご」に関しては頻
度が高いため 5T=2+1十〇=3 とし、「赴任」は頻度1.「国民」は頻度2.不眠」、
「塗布」「人」「民」は頻度0とした場合、各文節を評
価すると、 「ご赴任は」:(接頭)(自立語・・・3文字)(付属
語)X=3+16X(3+1十〇)+4=71「塗布人
は」=(自立語・・・2文字)(接尾)(付属語)X=
4+l6X(2+0+0)+4=40「ご不眠は」:(
接頭)(自立語・・・3文字)(付属語)X=3+I 
6x(3十〇十〇)+4=55「塗布民は」:(自立語
・・・2文字)(接尾)(付属語)X=4+16x(2
+0+O)+4=40「国民は」:(自立語・・・4文
字)(付属語)X=4+16X(4+2十〇)+4=1
04となり、「国民は」が最高の評価点となる。
従ってステップn7(第2図)において文節認識結果を
ソートすることによりメモリ9の記憶内容は第3表の如
くなる。
第3表 このような一連の動作により漢字候補「国民は」が第1
位の認識候補となりステップn8に移行して、その第1
位の認識候補「国民は」が最初に出力されることになる
なお、−に記の例では、使用の有無の情報を全て無とし
たが、「赴任」という自立語が以前に用いられていたと
すれば「ご赴任は」に対する評価点Xは X=3+16x(3千1+4)+4=135となり、「
ご赴任は」が1位の認識候補としてソートされることに
なる。
以上のにうな処理手順により、音声認識の確度に従った
認識結果を並び換えることにより、妥当′性の高い文節
から順次表示出力され、また以前に使用した自立語を含
む文節が優先されるため、候補選択が容易となる。
なお文節の各要素の評価方法は上記の例に限定されるこ
となく、種々の変形が可能なことは言うまでもない。
からの意味のつながりによる評価、あるいは「新」「開
発の」の如き用例等による評価を加味することも可能で
ある。
また前記した「歩いた」のような自立語の場合の自立語
長として、活用語尾では終了可能性のある最初の付属語
までを自立語長としてもよい。なお1歩いた」の場合に
は「歩い」では終了可能でないので1歩いた」までを自
立語とすることになる。
〈効果〉 以上述べたように、本発明によれば認識結果の複数の候
補を音声認識結果の確からしさ以外の自立語の長さ、頻
度を含む条件により評価して認識結果の出力順序を変更
するように成しているため、妥当性の高い文節から順次
出力されることになり、候補選択が容易となる。
【図面の簡単な説明】
第1図は本発明の一実施例装置の構成を示すブロック図
、第2図は1文節の処理フローを示す図、第3図は本発
明による1候補列(文節)に対する文節の分析処理フロ
ーを示す図である。 2・・・単音節認識部、訃・・標準パターンメモリ、4
・・・音節ラティスメモリ、5・・・候補列作成部、6
・・・・  文節候補メモリ、7・・・文節分析部、8
・・・辞書メモリ、9・・・契識結果メモリ、10・・
・評価点算出用バッファメモリ、 代理人 弁理士 福 士 愛 彦(他2名)1、事件の
表示 特願昭57−232213 2、−発明の名称 音声入力式日本語文書処理装置 3、補正をする者 事件との関係  特許出願人 住 所 〒108東京都港区三田1丁目4番28号理事
長 関 本 忠 弘 4、代理人 住 所 〒545大阪市阿倍野区長池町22番22号自
     発 明胛1冊の兄明の評#l T、に祝明り樒7、補正の内
容 [)  明細書第4頁第19行目の[記憶領域領域6b
Jの記載を「記憶領域、領域6bJと訂正致します。 (2)  回書第8頁の第2表中の第1行目の「確定」
の記載を「確度」と訂正致します。 (3)同書第10頁第18行目の「数百文節」の記載を
「数十文節」と訂正致します。 (4)同書第13頁第15行目のr (n41)Jの記
載をr (n40)Jと訂正致します。 (5)同書第14頁第3行目の「補候」の記載を「候補
」と訂正致します。 以  上

Claims (1)

    【特許請求の範囲】
  1. 1 文節単位に発声された音声を音節単位に認識し、該
    認識された音節候補の組合せにより複数の文節候補列を
    作成し、辞書照合を含む文法処理を行なって文節単位の
    認識結果を出力する音声入力式日本語文書処理装置にお
    いて、認識結果の複数の候補を音声認識結果の確からし
    さ以外の自立語の長さ、頻度を含む条件により評価して
    認識結果の出力順序を変更する手段を備えたことを特徴
    とする音声入力式日本語文書処理装置。
JP57232213A 1982-12-23 1982-12-23 音声入力式日本語文書処理装置 Granted JPS59116837A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57232213A JPS59116837A (ja) 1982-12-23 1982-12-23 音声入力式日本語文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57232213A JPS59116837A (ja) 1982-12-23 1982-12-23 音声入力式日本語文書処理装置

Publications (2)

Publication Number Publication Date
JPS59116837A true JPS59116837A (ja) 1984-07-05
JPH049320B2 JPH049320B2 (ja) 1992-02-19

Family

ID=16935755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57232213A Granted JPS59116837A (ja) 1982-12-23 1982-12-23 音声入力式日本語文書処理装置

Country Status (1)

Country Link
JP (1) JPS59116837A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63158600A (ja) * 1986-12-22 1988-07-01 日本電気株式会社 単語検出装置
JPS63158599A (ja) * 1986-12-22 1988-07-01 日本電気株式会社 単語検出方式
JPH01290032A (ja) * 1988-05-17 1989-11-21 Sharp Corp 音声認識表示装置
JP2017026808A (ja) * 2015-07-22 2017-02-02 日本電信電話株式会社 音声認識装置、音声認識方法、プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5775349A (en) * 1980-10-28 1982-05-11 Nippon Telegr & Teleph Corp <Ntt> Japanese input device of voice recognition type
JPS57109997A (en) * 1980-12-26 1982-07-08 Tokyo Shibaura Electric Co Word information input device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5775349A (en) * 1980-10-28 1982-05-11 Nippon Telegr & Teleph Corp <Ntt> Japanese input device of voice recognition type
JPS57109997A (en) * 1980-12-26 1982-07-08 Tokyo Shibaura Electric Co Word information input device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63158600A (ja) * 1986-12-22 1988-07-01 日本電気株式会社 単語検出装置
JPS63158599A (ja) * 1986-12-22 1988-07-01 日本電気株式会社 単語検出方式
JPH01290032A (ja) * 1988-05-17 1989-11-21 Sharp Corp 音声認識表示装置
JP2017026808A (ja) * 2015-07-22 2017-02-02 日本電信電話株式会社 音声認識装置、音声認識方法、プログラム

Also Published As

Publication number Publication date
JPH049320B2 (ja) 1992-02-19

Similar Documents

Publication Publication Date Title
US8126714B2 (en) Voice search device
US7263488B2 (en) Method and apparatus for identifying prosodic word boundaries
JP4473193B2 (ja) 混合言語テキスト音声合成方法および音声合成装置
US9384730B2 (en) Pronunciation accuracy in speech recognition
CN107610693B (zh) 文本语料库的构建方法和装置
Chotimongkol et al. Statistically trained orthographic to sound models for Thai.
JPS59116837A (ja) 音声入力式日本語文書処理装置
Damper et al. Information fusion approaches to the automatic pronunciation of print by analogy
JPS59180629A (ja) 日本語音声入力装置
JPS60196869A (ja) 音声入力式日本語文書処理装置
JPH10269204A (ja) 中国語文書自動校正方法及びその装置
JP4733436B2 (ja) 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体
JP2001229162A (ja) 中国語文書自動校正方法及び装置
JPS6321214B2 (ja)
JPS61122781A (ja) 音声ワ−ドプロセツサ
JPH11338498A (ja) 音声合成装置
JPS60189069A (ja) かな漢字変換装置
JPH04296898A (ja) 音声認識装置
JPH0630052B2 (ja) 音声認識表示装置
JPS60205594A (ja) 認識結果表示方式
Wang et al. The broad study of homograph disambiguity for mandarin speech synthesis
JP2005534968A (ja) 漢字語の読みの決定
JPH0740262B2 (ja) カナ漢字変換装置
KR20130017260A (ko) 연속어 음성인식 시스템에서 언어모델의 고유 명사 추가 장치 및 방법
JP2019101273A (ja) 押韻評価装置、コンピュータの制御方法、及び押韻評価プログラム