JPH01245297A - 文音声認識装置における文節候補検証方法 - Google Patents

文音声認識装置における文節候補検証方法

Info

Publication number
JPH01245297A
JPH01245297A JP63073648A JP7364888A JPH01245297A JP H01245297 A JPH01245297 A JP H01245297A JP 63073648 A JP63073648 A JP 63073648A JP 7364888 A JP7364888 A JP 7364888A JP H01245297 A JPH01245297 A JP H01245297A
Authority
JP
Japan
Prior art keywords
candidate
sentence
candidates
clause
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63073648A
Other languages
English (en)
Inventor
Junko Komatsu
小松 順子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63073648A priority Critical patent/JPH01245297A/ja
Publication of JPH01245297A publication Critical patent/JPH01245297A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、文節単位に区切って音声入力することを前提
とする文音声認識装置における文節候補検証方法に関す
る。
従来技術 従来、この種の文音声認識装置においては、音響処理部
によって文法的に正しい文節候補列を出力させた後、こ
れらの文節候補列から最も確からしい文を推定するよう
にしている。
このような文節候補列から最も確からしい文を推定する
方法として、従来は、主として次の3つ方法がある。
第1は、文節候補列から考えられる全ての文節列(文候
補)に対して係り受けの整合度を計算し、整合の最も良
いものを認識結果とす°る方法である。
第2は、文音声認識装置の扱えるタスクを限定し、入力
可能な構文に強い限定を付けることにより、トップダウ
ン的な検証を行なう方法である。
第3は、単語の深い意味や文脈などを扱える認知モデル
を作り、トップダウン、ボトムアップの両面から検証を
行なう方法である。
第1の方法においては、種々の計算処理量の削減の工夫
がなされているものの、文節列の紺合せの数は膨大であ
り、多くの文節を含む長い文章を扱おうとすると計算処
理量が急激に増加してしまうものである。
第2の方法では、扱えるタスクが限定されるので、より
汎用的な文音声認識装置を作ることが不可能となる。
また、第3の方法は、人間の認知過程には未知の部分が
多く、現実には認知モデルの作成が困難である。
目的 ・本発明は、このような点に鑑みなされたもので、音響
処理部により文法的に正しい文節候補列が出力された後
、この文節候補列から文法的知識、意味的知識を用いて
最も確からしい文を推定し、音響処理部の精度による曖
昧性と同音異義語による曖昧性とを補い得る文音声認識
装置における文節候補検証方法を提供することを目的と
する。
構成 本発明は、上記目的を達成するため、文節単位に区切っ
て音声入力し、1文の文末まで入力した後で認識結果を
出力することを前提とし、入力音声を分析して音響的な
特徴と文節内の文法的知識から文節候補列を出力する音
響処理部と、この音響処理部から出力される文節候補列
を人力として文法的知識及び意味的知識を用いて各々の
文節候補間の関係を調べ最も確からしい文を推定する文
節候補検証部とを備えた文音声認識装置において、まず
、文節候補の中で複数の文節を結合する役割を持つキー
となる用言、属性を表す名詞などの文節候補に着目し、
このキーとなる文節候補を中心として成立し得る複数の
文節のかたまりなるユニットの候補を拳げ、このユニッ
トに得点付けをする。次に、このユニットを文法的に矛
盾しないように糾合せて作られる文の骨組みの候補を挙
げる。
さらに、この文の骨組候補を基に考えられる文の候補を
挙げる。最後に、各文候補について確からしさを求め、
最も確からしさの高いものを認識結果として出力させる
。これにより、効率的に文節候補を絞り込むことが可能
で、かつ、必ずしも全ての文節候補間の係り受は関係を
調べる必要がないので、処理量も少なくでき、タスクを
限定しない汎用的な文や、多くの文節からなる長い文に
も対応できることになる。
さらには、各文節候補間の文法的或いは意味的な共起関
係を予め調べておき、この共起関係からもユニットを作
り、このユニットの得点付けを共起の強さに比例した値
とする。このように共起関係に関する情報を用いること
により、文節候補の検証精度が向上する。
また、文候補の確からしさを、その文候補を構成する文
節候補の音響処理部の得点とその文候補を構成するユニ
ットの得点を総合して求めるようにする。
以下、本発明の一実施例を図面を参照して説明する。ま
ず、本実施例で用いる文音声認識装置は、特に図示しな
いが、文節単位に区切って音声入力し、1文の文末まで
入力した後で認識結果を出力することを前提とし、入力
音声を分析して音響的な特徴と文節内の文法的知識から
文節候補列を出力する音響処理部と、この音響処理部か
ら出力される文節候補列を入力として文法的知識及び意
味的知識を用いて各々の文節候補間の関係を調べ最も確
からしい文を推定する文節候補雌証部とを備えてなる。
ここに、音響処理部の出力である文節候補列は第2図に
示すような形式であるとする。第2図中、B I l 
l 821、一般にはBijで示すものが文節候補であ
る。ここに、1つの文節が占有する時間区間をセグメン
トと称する。第1図では5IISIT〜等で示す。また
、動詞辞書には第3図に示すような通常の文法情報(例
えば、品詞、活用形等)の他に、意味素性、格文法に基
づく格フレーム(多義の動詞にあっては複数あってもよ
い)が登録されているものとする。格フレーム情報とし
ては、それが必須路(図面中、(必)で示す)か、任意
路(図面中、(任)で示す)かを表すフラグ(図面中、
○かΔ)、表層路を表す格助詞(格助詞相当語を含む)
、深層路、その格を構成する自立語のとり得る意味素性
コードなどが含まれる。
ここで使用する自立語の意味素性は、例えば「自然物」
の場合を例に示す第4図のように階層的に分類されてい
る。ここに、第3図に示したような動詞辞書に登録され
ている意味素性コードは階層の最下位の分類を表してい
るが、そのコードを基に上位の意味分類を辿ることが可
能なコード体系とされている。
また、文節候補の検証精度を上げるためには、文節候補
間の共起関係も利用するのがよい。このような文節候補
間の共起関係を調べるため、第5図に示すような共起辞
書を予め作成しておくことや、共起に関する規則(第1
図参照)を用意しておくことが考えられる。これらは、
何れか一方でもよいが、第1図に基づ〈実施例では共起
辞書と共起に関する規則との両方を使用するものとする
ここに、共起辞書はサンプル文を分析して作成し、慣用
句や連語の対を登録しておくもので、その内容としては
第5図に示す如く、見出しとなる自立語とその意味素性
、意味素性コード、通常使用される助詞等が考えられる
しかして、入力文に応じた一連の文節候補検証処理を第
1図のフローチャートを参照して説明する。
(1)入力文が単文と仮定される場合 (述語文節候補が最後のセグメントにのみ存在する場合
) まず、文節候補間の共起関係の有無と、共起の強さ(例
えば、1〜5の5段階で表す)を調べ。
共起関係によるユニットを作成し、共起の強さに比例し
た得点付けをし、全てのユニットをワークエリア! (
第1図参照)に書出す。例えば、規則による共起関係の
チエツクは、′異なるセグメントSに属する全ての文節
候補間で行ない、共起関係が成立するような文節候補対
を記憶し、共起の強さを5にする。また、共起辞書によ
る共起関係のチエツクは、隣接するセグメントに属する
文節候補間についてのみ行ない、2つの文節候補の関係
が次頁の表のような場合に該当する時には共起関係が成
立するとみなし、共起の強さを同表のように定める。
つぎに、以下の処理を行なう。
■ 文節候補の中からキーとなる文節候補(以下、Bと
略す)を1つ選ぶ。キーになる文節とは、キーとなる単
語、例えば用言や属性を表す名詞などのように複数の文
節を結び付ける役割りをする単語を含む文節である。
■ 文節候補Bを中心として成立し得る文節のかたまり
=ユニットを調べ、それに得点付けをし、それらのユニ
ット全てをワークエリア■に書出す。例えば、文節候補
Bが動詞を含む文節の場合には、辞書に登録しであるそ
の動詞の格フレームのスロットの入り得る文節候補と文
節候補Bとをまとめて1つのユニットを作る。その他の
品詞の場合にもキーとなる単語には格フレームに類似の
ものを辞書に登録しておき、スロットに入り得る文節候
補と文節候補Bとをまとめてユニットを作る。
スロットに入り得る文節候補は表層路が文節候補Bの格
フレームと一致し、かつ、その文節を構成する自立語の
意味素性が一致し、がっ、文節候補Bとの順序関係が文
法的に正しいものである。
■ 全てのキーとなる文節候補Bに対して、上記■〜■
の処理を繰返し、文節候補から考えられる全てのユニッ
トをワークエリアIに書出す。
■ ワークエリアに書かれたユニットを組合せて文の骨
組み候補を作り、これをワークエリア■(第1図参照)
に書出す。この際、1文1格の原理、係り受は関係の交
差が生じないようにユニットを組合せる。
■ ワークエリア■に書出された文の骨組み候補を基に
セグメントが連続するように文候補を作り、その確から
しさを求める。確からしさを求める方法としては、次の
ようなものが考えられる。
但し、Aド文節iの音響処理部の得点 BJ:ユニットjの得点 α1:文節iの重み (使用頻度などの関数) βJ:ユニットjの重み n :文を構成する文節の数 m :文を構成するユニットの数 である。
即ち、文候補の確からしさは、その文候補を構成する文
節候補の音響処理部での得点と、その文候補を構成する
ユニットの得点とを総合して求めるものである。
■ 最後に全ての文候補の中から、確からしさの最大の
ものを認識結果として出力する。
このような■〜■の処理の具体例を考える。例えば、文
節候補列として、 r山の 木のを 葉のを 上に 休んで いた」[山の
を 木の 葉の 目に 並んで 見た」「山を 木も 
田だのを 上へ 何でも いたい」が挙げられた場合、
共起によるユニットとして(木の 葉のを)(木の 葉
の) (休んで いた)(休んで いたい) (並んで いた)(並んで いたい) が作られ、格フレームによるユニットとして(葉の 上
に)(葉の 上へ) (上に 休んで)(上に 並んで)(上に いた)(木
のを 見た)(葉のを 見た) が作られる。
つぎに、ユニットの組合せにより文の骨組み候補として
、 (木の 葉の 上に 休んで いた) (木の 葉の 上に 休んで いたい)(木の 葉の 
上に 並んで いた) (木の 葉の 上に 並んで いたい)(木の 葉の 
上に いた) (木の 葉のを 見た) (木のを 見た) がワークエリア■に出力される。
そして、立候補として 1、(木の 葉の 上に 休んで いた)2、(木の 
葉の 上に 並んで いた)3、(木の 葉の 上に 
休んで いたい)4、(木の 葉の 上に 並んで い
たい)が認識結果として出力される。
(2)入ノJ文が重文又は複文と仮定される場合文の骨
組み候補を作る時に重文又は複文を仮定して文法的に矛
盾がないようにユニットを組合せるようにする。
何れの場合も、本実施例の文節候補検証処理方法によれ
ば、少ない処理量にて、タスクを限定しない汎用的な文
や、多くの文節からなる長い文章であっても扱い得るこ
とになる。
効果 本発明は、上述したように文節候補列から文法的知識及
び意味的知識を用いて最も確からしい文を推定するよう
にしたので、形式的な文法の知識だけでなく、意味的な
知識や慣用的な知識などを総合的に利用するものであり
、処理量を現実的なレベルに削減でき、特に、予め調べ
た共起関係の情報を用いることにより、文節候補の検証
精度を向上させることができ、よって、タスクが特に限
定されることのない汎用的かつ実用的な文音声認識装置
の構築を可能とするものである。
【図面の簡単な説明】
図面は本発明の一実施例を示し、第1図は文節候補検証
処理を示すフローチャート、第2図は文節候補列の出力
例を示す説明図、第3図は辞書の構成図、第4図は意味
分類の内容を示す説明図、第5図は共起辞書の構造図で
ある。

Claims (1)

  1. 【特許請求の範囲】 1、文節単位に区切つて音声入力し、1文の文末まで入
    力した後で認識結果を出力することを前提とし、入力音
    声を分析して音響的な特徴と文節内の文法的知識から文
    節候補列を出力する音響処理部と、この音響処理部から
    出力される文節候補列を入力として文法的知識及び意味
    的知識を用いて各々の文節候補間の関係を調べ最も確か
    らしい文を推定する文節候補検証部とを備えた文音声認
    識装置において、文節候補の中で複数の文節を結合する
    役割を持つキーとなる用言、属性を表す名詞などの文節
    候補に着目し、このキーとなる文節候補を中心として成
    立し得る複数の文節のかたまりなるユニットの候補を挙
    げ、このユニットに得点付けをし、このユニットを文法
    的に矛盾しないように組合せて作られる文の骨組みの候
    補を挙げ、この文の骨組候補を基に考えられる文の候補
    を拳げ、各文候補の確からしさを求めて最も確からしさ
    の高いものを認識結果として出力させることを特徴とす
    る文音声認識装置における文節候補検証方法。 2、各文節候補間の文法的或いは意味的な共起関係を予
    め調べておき、この共起関係に基づくユニットを挙げ、
    このユニットには共起関係に比例した得点付けをするこ
    とを特徴とする請求項1記載の文音声認識装置における
    文節候補検証方法。 3、文候補の確からしさを、その文候補を構成する文節
    候補の音響処理部の得点とその文候補を構成するユニッ
    トの得点を総合して求めることを特徴とする請求項1記
    載の文音声認識装置における文節候補検証方法。
JP63073648A 1988-03-28 1988-03-28 文音声認識装置における文節候補検証方法 Pending JPH01245297A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63073648A JPH01245297A (ja) 1988-03-28 1988-03-28 文音声認識装置における文節候補検証方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63073648A JPH01245297A (ja) 1988-03-28 1988-03-28 文音声認識装置における文節候補検証方法

Publications (1)

Publication Number Publication Date
JPH01245297A true JPH01245297A (ja) 1989-09-29

Family

ID=13524318

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63073648A Pending JPH01245297A (ja) 1988-03-28 1988-03-28 文音声認識装置における文節候補検証方法

Country Status (1)

Country Link
JP (1) JPH01245297A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06342298A (ja) * 1993-06-01 1994-12-13 A T R Jido Honyaku Denwa Kenkyusho:Kk 音声認識方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06342298A (ja) * 1993-06-01 1994-12-13 A T R Jido Honyaku Denwa Kenkyusho:Kk 音声認識方式

Similar Documents

Publication Publication Date Title
US7769339B2 (en) Automated essay scoring
US7321850B2 (en) Language transference rule producing apparatus, language transferring apparatus method, and program recording medium
EP1522930A2 (en) Method and apparatus for identifying semantic structures from text
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
JP2001523019A (ja) テキストの本文の談話構造の自動認識
JPH0242572A (ja) 共起関係辞書生成保守方法
KR20140021838A (ko) 문법 오류 검출 방법 및 이를 위한 오류검출장치
CN111626042A (zh) 指代消解方法及装置
Harper et al. Integrating language models with speech recognition
JP2003167898A (ja) 情報検索システム
CN107818078B (zh) 汉语自然语言对话的语义关联与匹配方法
JPH01245297A (ja) 文音声認識装置における文節候補検証方法
Zhang Language generation and speech synthesis in dialogues for language learning
Horvat Hierarchical statistical semantic translation and realization
JP2812511B2 (ja) キーワード抽出装置
JP2005332271A (ja) 質問種別判定装置、質問種別判定方法、および質問種別判定プログラム
Richardson et al. A Generalized Dependency Tree Language Model for SMT
JPS61210479A (ja) 日本語文の形態素解析方式
JPH01114976A (ja) 文書処理装置の辞書構造
Talukdar et al. Deep Learning based UPoS Tagger for Assamese Religious Text
Zakharov The Concept of'empire'in Russian and Czech.
JP3333952B2 (ja) 話題構造認識方法及び装置
Narayan et al. Pre-Neural Approaches
JP2838849B2 (ja) 言語処理装置
Guo et al. Research on Knowledge Representation and Automatic Recognition of Dynamic Words for Chinese Automatic Syntactic Analysis