JPS60189069A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPS60189069A
JPS60189069A JP59044338A JP4433884A JPS60189069A JP S60189069 A JPS60189069 A JP S60189069A JP 59044338 A JP59044338 A JP 59044338A JP 4433884 A JP4433884 A JP 4433884A JP S60189069 A JPS60189069 A JP S60189069A
Authority
JP
Japan
Prior art keywords
clause
kana
independent word
information
independent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59044338A
Other languages
English (en)
Inventor
Makoto Tatebayashi
誠 館林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59044338A priority Critical patent/JPS60189069A/ja
Publication of JPS60189069A publication Critical patent/JPS60189069A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明はかな漢字変換装置に関する。
従来例の構成とその問題点 近年、かな漢字変換装置の開発が盛んになり、各種のか
な漢字変換方式が開発されている。この中でも、入力さ
れるかな列中に句読点以外の特殊記号を挿入しない、い
わゆるベタ狽きの日本語文を入力する方式d操作性に優
れる方式として注目されている。
しかしながらベタ書きかな列を正しい漢字かな混じり文
に変換することは容易ではない。なぜならばベタ書きの
かな列を読みとする幾通りもの単語の分割の可能性があ
るからである。そこでIFしく変換するために従来から
知られている技術として、入力されたかな列を枚数の文
節の組と考え、可能性のあるすへての組み合わせを調へ
た−にで一番文節数の少ないものを決定するという力法
力・ある。しかしこの方法をマイクロコンピー−IJ−
のプログラミングという形で実現すると、処1l−J−
べき−(■か膨大なものとなり、多大な変換時間を吸−
1−るものである。
そこでこの欠点を改良するだめの工夫として、入力され
たかな列の先頭から2文節ずつ解釈を#−rない、寸だ
第1文節についても複数の解釈を行なって、2文節の対
の2通りの組み合わせを1ヒ較して長い方の対から第1
文節を決定するという方法が考案されている。しかし、
できる限り正確なかな漢字変換を行なうためには一つの
文節の解釈を行なうにしても自X力語辞書の検索、イ・
」属詔辞宵の検索、自立語と伺属語、又U: (=J属
語と刊属語の接続検定などの処理が必要であり、丑だ自
立語の検索結果として得られる多数の同音語についての
処理や最長−敬語のみならず部分−敬語についての処理
が必要である。従って上記の方法をマイクロコンピー−
一夕のプログラムとして実現するためには多大な変換時
間を必要とするものであり実用性に欠けるものであった
発明の目的 本発明は従来のこの神のかな漢字変換装置の有していた
欠点に鑑み、ベタ書きのかな列を正確にかつ実用的速度
で漢字かな混じり列に変換する装置を提供するものであ
る。
発明の構成 本発明は−1−配置的を達するために、入力されたべた
書きのかな列内の、指定されたかな位置以降の部分かな
列の先頭部を読みとする、第1の文節とこれに続く第1
の自立語からなる第1の文節自立語対を検索しこの読み
がな数と漢字表記情報と先度を記憶する第1の文節自立
語対作成手段と、上記部分かな列の先頭部を読みとする
、」二記第1の文節とは異なる第2の文節とこれに続く
第2の自立語からなる第2の文節自立語対を検索しこの
読みがな数と漢字表記情報尤度を記憶する第2の文節自
立dj十対作成手段と、上記第1および第2の文節自立
語対の読みがな数と漢字表記情報尤度によっていず〕1
か一方のみを選択する文節自立語対作成手段と、上記選
1バされ/こ文節自克dtトχ・1の文節の読み長さに
よって上記人力かな列内の部分かな列を内設定する部分
かな列史新手段をf+ifiえ、人力さノ1.ソこかな
列を文節と自立8hの対として順次解釈を行ない、」−
言1顆択された文節自立語対に含寸ノLる文節の漢字表
記を出力表示するものである。
実施例の説明 第1図一本発明の一実施例におけるかな漢字変電・な文
字列入力部で、たとえば日本工業規格JISC−623
3で規定されるカナ鍵盤、あるいはo −マ字かな変換
装置又は単音節認識装置である。2は入力かな列−喝記
憶部で、かな文字列入力部1から入力されたかな列とか
な数Nを記憶する。1だ、以下では簡単のためにかな列
人力部1かCつ人力されたかな列は清音(あ、か、の等
)も、/iii音・半濁音(が、げ、は等)も、1幼音
(きゃ、シ父・宿)もすべて一単位としてコード化され
て入力かな列一時記憶部2に格納されるものとする。
3は文節検索位置記憶部で、後述する前接第1文節検索
部又は前接第2文節検索部か検索ずべき部分かな列の先
頭の、人力かな列−114記憶部2内のかな位1ijf
f、 Kを記憶する。4d前接第1文節倹索)“−(3
で、入力かな列一時記憶部2のうち文節検索位置記憶部
3で指定される位置以1弁の部分かな列を、後述する自
立語1梓毘、後述する付属1冶辞古1・・よひ後述する
文法辞膚を参照しつつ、上記部分かな列の先頭部を読み
とし日本語文法でいう「−文節」(1=2、して最も最
く解釈できる系列に変換する。ここてセハ立語辞書には
日本語文法でいう名詞、動詞、形容詞等の自立語のよみ
がなと漢字表記情報と品詞情報と、尤度情報が記憶され
ている。−!た付属語辞書23には日本語文法でいう助
詞、助動詞等の付属語のよみがなと漢字表記情報と品詞
情報と、他のイ」属語との接続情報と尤度情報が記憶さ
れている。文法辞書24には上記自立語および伺属語の
間の、日本語としてγF容される接続情報が記憶されて
いる。そして前接第1文節検索部4が解釈する文節とは
、自立語といくつかの+JKiAがら成る系列をいう。
、寸/ζ上記尤度情報とは、自立語又は伺属語が使用さ
れる度合を表わす情報や、文節の終端に使用される度合
を表わす情報が用いられる。5は前接第1文節情報記憶
部で前接第1文節検索部4が検索した文貿J(以下前接
文節B1という)のよみがな数BY1と漢字表記と尤度
情報と(以下これを文節情報という)を記憶する。6は
後接第1自立語検索位置記憶部で文節検索位置記憶部3
の記憶している入力かな一時記憶部2内のかな位置にと
、前接第1文節情報記憶部5の記憶している前接文節B
1のよみがな数BY1との和L1を記憶する。7は後接
第1自立語検索部で、入力かな列一時記憶部2のうち後
接第1自立第検索位置記憶部6が記憶しているかな位置
L1以降のかな列に対し、このかな列に最も長く一致す
るかな列を読みとする自立語(後接自立語J1という)
を後述する自立語辞書内で検索する。8は後接第1自立
語情報記憶部で、後接第1自立語検索部7が検索した後
接自立語J1のよみがな数JY1と漢字表記と尤度情報
と(以Fこれを自立語情報という)を記憶する。9は第
1の文節自立語対情 ・報作成部で前接第1文節情報記
憶部5の記憶している前接文節B1の文節情報と後接第
1自立語情報記憶部8の記憶している自立語情報より、
前接文節B1と後接自立語J1との対から成る第1の文
節自立語対P1のよみがな数と漢字表記と尤度情報と(
以下これを文節自立語対情報という)を予め定められた
方法で作成しこれを記憶する。
この方法は次のように行なう。1.すなわち第1の文節
自立語対情報のよみがな数PY1はBYlとJYlとの
和とする。漢字表現情報はそれぞれの漢字表現情報を結
合したものとする。さらに尤度情報P M 1はそれぞ
れの尤度情報の和とする。
1oは前接第2文節検索部で入力かな列一時記憶部2の
うち文節検索位置記憶部3で指定される位置に以降のか
な列を文節として解釈する。この解釈の手順は前接第1
文節検索部4と同じである。
但し、この場合には文節として前記かな列と最も長く一
致するものではなく、その次に長く一致するものを解釈
する。すなわち、前接第1文節検索部4が 自立ef:I−十伺属語(1)十 十付属詔(n)なる
文節を検索した場合、前接第2文節検索部1oは 自立語→−付属語(1)−ト ・伺属語(ホ)なる文節
を検索する。ここでm (nである。寸だmの値は、+
]属語(ホ)が文節の終端になりうるという条件を満足
するように決定される。11は前接第2文節情報記憶部
で、前接第2文節検索部1゜文節検索位置記憶部3の記
憶している入力かな一時記憶部2内のかな位置にと前接
第2文節情報記憶部11の記憶している前接文節B2の
よみがな数BY2との和L2を記憶する。13け後接第
2自立語検索部で、入力かな列一時記憶部2のうち後接
第2自立語検索位置記憶部12の記憶しているかな位置
L2以降のかな列に対し7、このかな列に最も長く一致
するかな列を読みとする自立語(後接自立語J2という
)を後述する自立語辞書内で検索する。14は後接第2
自立語情報記憶部で、後接第2自立語検索部13が検索
しプを後接自立語■2のよみがな数JY2と漢字表記と
尤度情報からなる自立語情報を記憶する。15は第2の
文節自立語対情報作成部で前接第1文節情報記憶シ憶部
11の記憶している前接文節B2の文節情報と後接第2
自立語情報記憶部14の記憶している自立語情報より、
前接文節B2と後接自立語J2との対からなる文節自立
語対P2のよみがな数PY2と漢字表記と尤度情報PM
2とを作成する。
16は文節自立語対尤度比較部で第1の文節自立語対情
報作成部9と第2の文節自立語対情報作成部15に記憶
されている文節自立語対P1とP2のよみがな数と光度
情報を比較する。比軸過程は例えば次のように行なう。
寸ず文節自立語対P1とP2のそれぞれのよみがな数P
Y1とPY2の大小を比較し、PYl)PY2又1dP
Y1<PY2ならこの旨の情報を後述する前接文節決定
部に通知する3、捷たPY’1=PY2なら文節自立語
対P1とP2の尤度情報PMIとpM2f7)大小を比
較し、PMl>PM2又dPMISPM2のいずれであ
るか旨の情報を後述する前接文節決定部に通知する。1
7は前接文節決定部で文節自立語対尤度比較部16から
通知される情報に従って文節自立語対を決定する。この
決定ノが程は次のように行なう。文節自立語対尤度比較
部16よりPYl>PY2であると通知された場合は文
節自立語対P1を決定する。捷だPYl<PY2である
と通知された場合−文節自立語対P2を決定する。′2
1:たPY1=PY2でありかつPMl:>PM’2で
あると通知された場合にd−文節自立語対P1を決定し
、PY1=PY2でありかつPM1≦PM2であると通
知された場合には文節自立語対P2を決定する。
」二記文節自立語対の決定を行なった後、前接文節決定
部17はどちらの文節自立語対を決定したかの決定情報
Ωを一時記憶する。
18は出力部で、前接文節決定部1了によって決定され
た文節自立語対の決定情報Qを前接文節決定部17より
読み込み、こ力によって決定される、前接第1文節情報
記憶部5又U1前接第2文節情報記憶部11のうちのい
ずれかの前接文節情報の漢字表記情報を読み込み、これ
を出力表示する。
19は文節検索位置記憶部で、AiJ接文節決定部17
によって決定された文節自立語対の決定情報Qを読み込
み、とれによって前接第1文節情報記1、い、部6又は
前接第2文節情報記憶部11のうちのいずれかの前接文
節情報のよみがな数EYを読み込み、これと文節検索位
置記憶部3に記憶されている値にの和を割算し、これを
文節検索位置記憶部3に格納する。20は終了判定部で
、前接文節決定部17が決定し/こ文節自立語対の決定
情報Qを前接文節決定部17より読み込み、これによっ
て決定される第1の文節自立語対情報作成部9又は第2
の文節自立語対+7’+報作成部15のうちのいずれか
の文節自立語対のよみがな数PYを杭み込み、さらに当
該文節自立語対の前接文節自立語対の前接文節決定部1
6″Lを前接第1文節情報記憶部5又は自iJJ※第2
文節情報記憶部11から読み込み、P’YとLとの和を
刷貌することに」:って当該文節自立語対のよみかなの
最後尾の、入力かな一時記憶部2内の最終位置Eを算出
する。そして人力かな一時記憶部2に記憶されているか
な数Nと比較する。
そしてE2Nのとき当該文節自立J8対の漢字表記情報
をJl!’lの文節自立語対情報作成部9又−第2の文
節自立語対情報作成部15から読み込み、これを出力部
18に対して出力したのちかな漢字変換処理を終了する
1、21は第2の終了判定部で、後接第1自立語検索位
置記憶部6に格納されている後接自立語検索で171途
L1と、入力かな一時記憶部2に格納されているかな数
Nとを比較する。そしてLlqNであれば前接第1文節
情報記憶部5に格納されている前接文節B1の漢字表記
情報を読みこみ、これを出力部18に対しで出力したの
ち本かな漢字変換処理を終了する。
22は自立語辞書で、日本語のjli詔のうち日本語文
法でいう名詞、動詞、形容詞等の自立語のよみかなと漢
字表記・lt’7報と尤度情報が記憶されている。ここ
で尤度情報とはある自立語かかな漢字変換の変換結果と
して生じる可能相を別の自立語のもつ可能性と区別する
だめの情報てあり、例えばある自立語が1吏用される度
合を表わす情報か用いられる。第3図は自立語辞書の記
憶状態の一例を示す図である。同図では簡単のために自
立語の尤度はすべて○としている。23け付属語肩山で
日本語の単語のうち日本W8文法でいう助詞、助動詞等
の(=j属語のよみがなと漢字表記情報< 0−らがな
も漢字表記に含める)と品詞t6報と先度情報か記憶さ
れている。ここでは先度情報として、日本語の文節の末
尾にきやすい格助詞のFをJ、格助詞の「の」、係助詞
の「は」、格助詞の「に」、格助詞の「が」等に尤度値
1を力え、その他の(=j属)には尤度値0を与えるも
のとする。第4図に伺g語辞釧の記憶状態の一例を示す
。24は文法辞書で、日本語の自立語と伺属語、又は伺
属語と付属語の間の、日本語として許容される接続情報
が記憶されている。第5図は文法辞書の記憶状態の一例
でちシ、上記品詞情報によって定寸る行および列に対応
して110の情報を記憶した行列状の接続規則を示して
いる。同図において例えば[名詞jから格助詞「にコ(
第5図では助詞2と示している)への接続は可能であり
、丁寧の助動詞「ます」(助動詞1)への接続は不例で
あることが示されている。また、断定の助動詞[である
Jの未然型「であっj(助動詞2)から文節終端への接
続可能性がないこと、すなわち「てあっ」では文節は終
了しえないことなどが示されている。
上記のように構成された装置において、以下かな漢字変
換を行なう際の概略の動作について、第2図に示すフロ
ーチャートに従って説明する。なお各処理に続く処理番
号が明示されていない場合はイロハ順の次の処理に進む
一鯨セ)・−(かな文字列入力)かな文字列入力部1よ
りかな文字列を入力する。
(ロ)−・(かな文字列格納)このかな文字列は入力か
な一時記憶部2に格納される。
格納されたかな文字数Nは一時記憶される。
(ハ)・・(初期化)文節検索位置記憶部3に初期値0
を設定する。
に)・ (前接第1文節検索)前接第1文節検索部4は
入力かな一時記憶部2のうち文節検索位置記憶部3で指
定される位置に以降のかな列を文節として最も長く解釈
できる系列に変換する。
(ホ)−(前接第1文節情報の格納)前接第1文節情報
記憶部5は前接第1文節検索部4が検索しだ前接文節B
1の文節情報を格納する。
(へ)・ (後接第1自立詔検索位置の格納)後接第1
自立語検索位置記憶部6け文節検索位置記憶部3の記憶
しているかな文字列入力部1内のかな位置にと、前接第
1文節情報記憶部6の記憶している前接文節B1のよみ
がな数BY1との和L1を格納する。
())−(終了判定)第2の終了判定部は後接第1自立
語検索位置記憶部6に格納されている後接自立語検索t
X @ L 1と、入力かな一時記憶部2に格納されて
いるかな数Nとを比較する。そして、L12Nであれば
(3)に進む。
けう・ (後接第1自立語検索)後接第1自立誤検索部
7は入力かな一時記憶部2のうち後接第1自立語検索位
置記憶部6で指定されるかな位置L1以降のかな列に対
し、このかな列に最も長く一致するかな列を読みとする
自立語を自立詔辞州内で検索する。
(ワ)・ (後接第1自立語情報の格納)後接第1自立
語情報記憶部8は後接第1自立語検索部7が検索した後
接自立招J1の自立語情報を格納する。
し) (第1の文節自立語対情報の作成)第1の文節自
立語対情報作成部9は第2の文節自立語対情報作成部1
6の記1.ヒしている前接文@ B 10文節情報と後
接第1自立語情報記憶部8の記憶している後接自立語J
1の自立語情報より、第1の文節自立語対P1の文節自
立語対情報を作成し、これを記憶する。
Qす・・(前接第2文節検索)前接第1文節検索蔀10
は入力かな一時記憶部2のうち文節検索位置記憶部3で
指定される位置により文節検索を行なう。ここで検索さ
れる文節とは前接第1文節検索部4で検索された文節の
次に長く、入力かな列を読み列として解釈する文節であ
る。
(ヲ)・・(前接第2文節情報の格納)前接第2文節情
報記憶部11は前接第2文節検索部10が検索した前接
文節B2の文節情報を格納する。
(ワ)・・(後接第2自立語検索位置の格納)後接第2
自立語検索位置記憶部12は文節検索位置記憶部3の記
憶しているかな位13j Kと前接第2文節情報記憶部
11の記憶している前(ど文節B2のよみがな数BY2
との和L2を格納する。
(効・・・(後接第2自立語検索)後J&第2自立語検
索部13は入力かな一時記憶部2のうち後接第2自立語
検索位置記憶部12で指定されるかな位置し2以降に最
長一致する自立語を検索する。
(ヨ)−・(後接第2自立語情報の格納)後接第2自卑
語情報記憶部14は後接第2自立語検索部13が検索し
/こ後接自立語J2の自立語情報を格納する。
し)−(第2の文節自立語対情報の作成)第2の文節r
1立語対情報作成部15は前接第2文節情報記憶部11
の記憶しでいる前接文節B2の文節情報と後接第2自立
語隋報記憶部14の記憶している後接自立語工2の自立
語情報より、第2の文節自立Rj4対情報P2の文節自
立QM対情報を作成し、これを記憶する。
(−一 (文節自立1治対尤度比較)文節1自立語対尤
度比軸部16は第1の文節自立語対情報作成部9と第2
の文節自立gf4対情報作成部15にそt′Tそれ記1
,6されている文節自立語対P1とP2のよみがな数と
先度情報を比較する。この後、(す。
(7) 、 ())、0→のいずれかに進む。
(1)−、、(PYl)PY2の場合)16が第1の文
節自立語対P1のよみがな数PY1が第2の文節自立語
対P2のよみがな数PY2よりも太きいと通知したとき
、前接文節決定部17は第1の文節自立語対P1を選択
する。そしてPlを決定した旨の情報Qを記憶する。こ
の後(う)へ進む。
(ン)・・(PYl<PY2の場合)文節自立語対尤度
比較部16PY1がPY2よりも小さいと通知1〜だと
き、前接文節決定部17は第2の文節自立語対P2を選
択する。そしてP2を決定した旨の情報を記憶する。こ
の後(う)へ進む。
休)−(PY1=PY2かつPMl)PM2の場合)文
節自立語対尤度比較部16がPYlとPY2が等しくか
つ、第1の文節自立語対P1の尤度情報PM1がP2の
尤度情報PM2よりも大きいと通知したとき、前接文節
決定部17−第1の文節自立語対P1を選択する。ぞし
てPlを決定し/こ旨の決定情報Qを記憶する。この後
(う)へ進む。
0→ (PY1=PY2かつPM1≦PM2の場合)文
節自立語対尤度比較部16がPY1=PY2でありPM
1≦PM2であると通知したとき、前接文節決定部17
は第2の文節自立語対P2を選択する。そしてP2を決
定した旨の決定情報Qを記憶する。この後(う)へ進む
(う) (終了判定)終了判定部2oは前接文節決定部
17か決定し決定情報Qによって示される文節自立語対
のよみがな数を第1の文節自立語対情報作成部9又は第
2の文節自立語対情報作成部15から読み出し、さらに
当該文節自立語対の前接文節検索位置をnf+接第1文
節情報記憶部ら又は前接第2文節情報記1,0部11か
ら読み出し、この和をH算することによって当該文節自
立語対の最終よみがなの、入力かな一時記憶部2内の位
1iQ″Eを算出する。そして入力かな一時記憶部2に
記憶されているかな数Nと比較する。
E(Nならd、(〕◇へ進み、E二Nならば())−\
進む。
(l、) −(前接文節の漢字表記出力)出力部18は
t”+fJ Jヅ文節決定部17によって決定され決定
情報Qによって示される文節自立語列に対応する前接文
節情報を前接第1文節情報記憶部5又はOiJ接第2文
節情報記憶部11から読み込み、このうち漢字表記情報
を出力表示する。
(つ)・−(文節検索位置更新)文節検索位置更新部1
9は前接文節決定部17によって決定された文節自立語
対の決定情報Qを読み込み、これによって決定される前
接第1文節情報記憶部5又は前接第2文節情報記憶部1
1のうちのいずれかの前接文節情報を読み込み、そのう
ちのよみがな数BYを読み込み、これと文節検索位置記
憶部3に記憶されている値K(前接文節検索位置)の和
を計算し、これを文節検索位置記憶部3に格納する。こ
の後に)に進む。
(1)・・(文節自立語対の漢字表記出力)出力部18
は前接文節決定部17によって決定された文節自立語対
の決定情報Qを前接文節決定部17より読み込み、これ
によって決定さJする第1の文節自立語対情報作成部9
又は第2の文節自立語対情報作成部15のうちのいずれ
かの文節自立語対の漢字表記情報を出力表示する。この
後処理を終了する。
0ウ−(前接文節の漢字表記出力)出力部18は前接第
1文節情報記憶部5に格納されている前接文節B1の漢
字表記情報を読み込み、これを出力表示する。この後処
理を終了する。
以上、第2図のフローチー)・−トを用いて動作を説明
したか、動作をより具体的にするために第3図〜第6図
の白位語辞書、付属語辞書および文法辞書の例を参照し
つつ動作の一例を説明する。
い訃、オペレータが「計画には賛成したが見ていない」
という文章をかな漢字変換により出力させる場合を考え
る。
(1)iずオペレータはかな文字列入力部1から「てい
あんにはさんせいしだがみていない」というかな列を入
力する。このかな列は入力かな一時記憶部2部2に格納
される。(第2図(イ)、(ロ))(2)徒ず木かな漢
字変換装置は文節検素位置記憶部3のKのイ]11をQ
とする。そして前接第1文節検索部4は入力かな列のに
一〇の位置より最も長く循釈できる文節として「提案に
はJという前接文節B1を得る。第3図および第4図か
られかるようにこの文節は「提案」という名詞と、「に
」という格助詞と「は」という係助詞からなっている。
この文節B1の読み長さBYlは6である。また尤度B
U1は文節B1の終端の伺属語「は」の尤度が1である
ことからBUlは1となる。(第2図(ハ)、(ロ)、
(ホ))(3)後接第1自立語検索位首L1はKとBY
lの和すなわち6でありこの値が後接第1自立語検索位
置記憶部6に格納される。そして第2の終了判定部21
はLlの値が入力かな一時記憶部2に格納されているN
の値より少さいことを検知して処理を続行する。(第2
図(へ)、 (ト) )(4)次に後接第1自立詔検索
部7は入力かな一時記憶部2の入力かな列のうち文字位
置6以降の系列について自立m」検索を行ない後接自立
語として「賛成」を得る。このん゛じみJkさJYlは
4、尤度情報J U 11tJ、○である。これらの値
は後接第1自立語1h報記憶部8に格納される。
(第2図Cつ 、(l刀 ) (5)第1の文節自立語対1i!1′報作成部9I−1
前接文節B1と後接自立語J1とからなる第1の文節自
立語対P1 r提案には賛成Jを作成する。この読み長
さPYlは10.尤度情報PU1は1である。(第2図
し)) (6)次に前接第2文節検索部1oは入力かな一時記憶
部2のうぢに−Oの文字位置より第20前接文節検索を
行なう。この結果「提案」という自立語と、「にJとい
う格助詞から成る「提案に」という前接文節B2を得る
。格助詞「に」で文節が終了できることは第6図におい
て「に」から文節終端への接続か可能であることによっ
て示されている。この文節B2の読み長さBY2は5で
ある。捷た尤度BU2は文節終端のf+J属語「にJの
尤度が1であることから1となる。
(第2図Q→、(ヲ)) (7)後接第2自立語検索位置し2はKとBY2の和す
なわち5であり、この値が後接第2自立語検索位置記憶
部12に格納される。(紀2図(ワ))(8)次に後接
第2自立語検索位1叡記憶部12は入力かな一時記憶部
2の入力かな列のうち文字位置6以降の系列について後
接自立語検索を行ない「破産」を得る。この読み長さJ
Y2は3゜尤度TU2はOである。これらの値は後接第
2自立語情報記憶部14に格納される。(第2図Qリ 
、(ヨ)) (9)第2の文節自立語対情報作成部15は前接文節B
2と後接自立語■2とから第2の文節自立語対p2rN
I画に破産」を作成する。このハゲしみ長さP、Y2は
8.尤度PU2は1である。
(第2図し)) (1o)文節自立詔対尤度比較部16は文節自立語対P
1とP2のよみがな数PY1.PY2と尤度情報PUi
、PU2をそれぞれ比較する。この結果PY1>PY2
.PU1=PU2であることを前接文節決定部17に通
知する。(第2図(す)(11)PYl〉PY2である
ので前接文節決定部17は第1の文節自立語対P1を選
択し、この旨の情報を決定情報Qに記憶する。(第2図
し))(12)終了判定部20は文節自立語対B1の最
終よみの入力かな一時記憶部2内の文字位置Eが1oで
あることを知り、これが人力かな文字列一時記憶部2に
記憶されているかな数N−18より小さいことを知る。
そして出力部18は前接文節B1の漢字表記情報「刷動
にはj出力表示する。(第2図(う)、(ム)) (13)文節検索位置更新部19け前接文節B1のよみ
がな数BY1が6であることを知りこれと文節検索位置
記憶部3に記憶されているKの値0との和か6であるこ
とを算出してこれをKの力1らしい値とする。(第2図
(つ))(14)次に前接第1文節検索部4は入力かな
列のうちに=6以降の系列[−さんせいしたかみていな
いJに対して文節として最も長く解釈できる系列を検索
する。この結果前接文節B1として「賛成しだが一]を
得る。この文節は「賛成」というす変名詞語幹と「する
」というザ変名詞詔ツギ連用形の1−シ」と過去の助動
詞「た」と接続助詞[がJから成るものである。この文
節の読み長さBY2は7であり、最終付属胎「が」の尤
度が1であるので尤度BU1は1となる。そして次に後
接第2自立語の検索位置L2は8となり、後接第2自立
語情報記憶部14は入力かな列のL2の位置から自立語
検索を行なって「見」というよみがな数JY2=1の後
接自立語を検索する。さらに第2の文節自立語対情報作
成部15は上記前接文節B2と−1−記後接自立語■2
とから第1の文節自立語対P1 「賛成したが見」を得
る。このよみがな数PY1iJHs。
尤度PM1は1である2、(第2図に)〜(7り)(1
5)次いで前述の手順に従かい本かな漢字変換装置は前
接文節B2として「賛成し/こ」、後接文節として「紙
」を#@ +第2の文節自立語対P2として「賛成した
紙」を得る。この」:みかな数PY2はO9尤度けOで
ある。(第2図(/Q〜し))(16)文節自立語対尤
度比較部16はこの2つの文節自立語対の読み長さと尤
度を比較する3、そしてPY1=PY2でありPUl:
>PU2であることを前接文節決定部1了に対して通知
する。この通知を受けた前接文節決定部17は文節自立
語1)Plを選択する。そして次にこの文節自立語対P
1の最終のかな位置Eと入力かな文字列一時記憶部2の
かな数Nを比憎し、E(Nであることを知る。そして出
力部は前接文節B1の「賛成したが」という漢字表記を
出力表示する。そして文節検索位置更新部19は新らし
いKの値として13を設定する。(第2図(す〜(つ)
)(17)次に前接第1文節検索部4は入力かな文字列
一時記憶部2のかな位置に一13以降の系列「みていな
い」を文節として最も長く解釈する〇この結果「見てい
ない」という前接文節が得られる。そして後接第1自立
語検索位置記憶部6には後接自立語検索先頭位置L1=
18が格納される。(第2図に)〜(へ)) (18)第2の終了判定部21は上記L1の値と入力か
な文字列一時記憶部2に格納されているかな数Nとを比
較しLlQNであることを判定する〇そして前接文節B
1の漢字表記である[見ていないJを出力部18に対し
て出力する。これによって出力部には[計、画には賛成
したが見ていない」という漢字表記が得られる。この後
本装置は処[(ILを終了する。(第2図(ト))以」
二のように本実施例によれば、「ていあんにさんぜいし
だがみていない」というかな列に対し、ず「提案には賛
成」という文節自立語対と「提案に破産Jという文節自
立drf対をめ、これらのよみかなの数を比較してよみ
がな数の多い前者を決定し、さらに「賛成したが児コと
いう文節自立語対と[賛成した紙jという文節自立語対
をめ、これらのよみがな数が同じであることを検知した
のち、これらの尤度の差を比較し、前者の方がより高い
尤度をもつことを検知し7てこれを選択し、結局「提案
には賛成しだが見ていない」という漢字表記を得ること
ができる。
なお、上記具体例では前接文節の長い方が最終的に残る
場合について説明したがこの逆の場合があることはもち
ろんである。例えば「ひもととりし筐りの」というかな
列に対し、第1の前接文節として「火元とJが得られ、
第2の前接文fji’iとしては「火元」が得られる。
ところが第1の文節自立語対は「火元と利子」であり第
2の文節自立語対は「火元取締り」であるので、よみ長
さのより長い第2の文節自立語対の方が選択されるので
ある。
発明の効果 以上のように本発明によれば入力されたべた書きのかな
列に対し、前方から最も長い文節としての解釈とそれに
続く自立語としての解釈を行ない。
捷た同時に上記文節としての解釈とそれに続く自立語と
しての解釈を行なって、それぞれ得られた文節自立語対
のよみ長さと、確からしさを表わす尤度を元にしていず
れか一方の文節自立語対を決定する。という手順でかな
漢字変換を行なうので、正しい変換結果を得ることがで
きる確率を高く保つことができる一方、このだめの処、
(2H量としては比較的小さなものにおさえることがで
き、その実用的効果は大きい。
【図面の簡単な説明】
第1図は本発明の一実施例におけるかな漢字変換装置の
ブロック図、第2図は本発明の一実施例におけるかな漢
字変換装置の動作を示すフローチャート、第3図は自立
飴辞1の記憶状態の一例を示す図、第4図は付属語辞1
の記憶状態の一例を1・・ かな文字列入力部、2− 
・入力かな列一時記憶部、3−m−文節検索位置記憶部
、4−−前接第1文節検索部、7・ 後接第1自立語検
索部、9・・・第1の文節自立語対情報記憶部、1゜前
接第2文節検索部、13 ・後接第2自立語検索部、1
5− 第2の文節自立語対情報記憶部、16・ −文節
自立語対尤度比較部、17・・−前接文節決定部、18
・・−出力部、19 ・文節検索位置更新部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1基部 
2 図(モq1) 第2図(予。2) 第3図 第4図 第5図

Claims (2)

    【特許請求の範囲】
  1. (1)かな列を入力する手段と、入力かな列を一時記憶
    する手段と、少なくとも日本語の自立語や付属語からな
    る多数の単語の読みと上記単語の漢字表記と品詞情報と
    尤度情報とを対応づけて格納している単語記憶部と、日
    本語の単語の接続規則等の文法規則を記憶している文法
    記憶部と、上記入力かな列のうちの指定したかな位置以
    降の部分かな列の先頭部を読みとする、第1の文節とこ
    れに続く第1の自立語からなる第1の文節自立語対を検
    索しこの読みがな数と漢字表記情報と先度を記憶する第
    1の文節自立語対作成手段と、上記部分かな列の先頭部
    を読みとする、−に記憶1の文節とは異なる第2の文節
    とこれに続く第2の自立語からなる第2の文節自立語対
    を検索しこれらの読みがな数と漢字表記情報と尤度とを
    記憶する第2の文節自立語対作成手段と、上記部分かな
    列に対応する上記第1の文節自立語対と上記第2の文節
    自立語対の読み長さと尤度とを比較して予め定められた
    方法−その一方のみを選択する文節自立語対選択手段と
    、上記選択された文節自立語対に含まれる文節の漢字表
    記を出力する出力手段と、上記選択された文節自立語対
    の文節の読み長さによって、」二記入力かな列内の部分
    かな列を再設定する部分かな列更新手段を備えたことを
    特徴とするかな漢字変換装置。
  2. (2)単語の尤度情報としては、日本語の単語を、その
    単語が文節の終端に配置される頻度の大小によって分類
    し、各分類に異なった先度情報を対応させることを特徴
    とする特許請求の範囲第1項記載のかな漢字変換装置。
JP59044338A 1984-03-08 1984-03-08 かな漢字変換装置 Pending JPS60189069A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59044338A JPS60189069A (ja) 1984-03-08 1984-03-08 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59044338A JPS60189069A (ja) 1984-03-08 1984-03-08 かな漢字変換装置

Publications (1)

Publication Number Publication Date
JPS60189069A true JPS60189069A (ja) 1985-09-26

Family

ID=12688725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59044338A Pending JPS60189069A (ja) 1984-03-08 1984-03-08 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPS60189069A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61210479A (ja) * 1985-03-12 1986-09-18 Fujitsu Ltd 日本語文の形態素解析方式
JPS62251960A (ja) * 1986-04-25 1987-11-02 Seiko Epson Corp かな漢字変換装置
JPH02150956A (ja) * 1988-12-01 1990-06-11 Seiko Epson Corp かな漢字変換装置
JPH02224058A (ja) * 1988-11-15 1990-09-06 Ricoh Co Ltd 自然言語処理システム
JPH03129458A (ja) * 1989-07-03 1991-06-03 Ricoh Co Ltd 自然言語処理方式

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61210479A (ja) * 1985-03-12 1986-09-18 Fujitsu Ltd 日本語文の形態素解析方式
JPH0552543B2 (ja) * 1985-03-12 1993-08-05 Fujitsu Ltd
JPS62251960A (ja) * 1986-04-25 1987-11-02 Seiko Epson Corp かな漢字変換装置
JPH02224058A (ja) * 1988-11-15 1990-09-06 Ricoh Co Ltd 自然言語処理システム
JPH02150956A (ja) * 1988-12-01 1990-06-11 Seiko Epson Corp かな漢字変換装置
JPH03129458A (ja) * 1989-07-03 1991-06-03 Ricoh Co Ltd 自然言語処理方式

Similar Documents

Publication Publication Date Title
Chen et al. Recognize tone languages using pitch information on the main vowel of each syllable
Thet et al. Word segmentation for the Myanmar language
JPS60189069A (ja) かな漢字変換装置
JP3366253B2 (ja) 音声合成装置
KR100342785B1 (ko) 한국어 문자열간의 전역 유사도 측정 방법
Tolegen et al. A finite state transducer based morphological analyzer for the kazakh language
JP2812495B2 (ja) 漢字を使用する言語の音節入力語音逐次区切漢字逐次変換方式
Joshi et al. Input Scheme for Hindi Using Phonetic Mapping
Schafer Novel probabilistic finite-state transducers for cognate and transliteration modeling
JP2798931B2 (ja) 中国語の語音区切方式および語音漢字変換方式
JP2004206659A (ja) 読み情報決定方法及び装置及びプログラム
JP3001334B2 (ja) 認識用言語処理装置
Gafni A Universal System for Automatic Text-to-Phonetics Conversion
JPH07210571A (ja) 単語検索処理装置及び単語検索処理方法
JP2003263432A (ja) 翻字装置及びそのプログラム
JP3084864B2 (ja) 文章入力装置
Jowharpour Use Pronunciation by Analogy for text to speech system in Persian Language
Tsourakis et al. A generic methodology of converting transliterated text to phonetic strings case study: greeklish.
JPH0421063A (ja) 自然言語処理装置
JPH11327871A (ja) 音声合成装置
JP2000330998A (ja) 発音電子辞書
JPH04156668A (ja) 形態素解析装置
TW202016767A (zh) 應用於智慧行動裝置的四縣腔客語輸入系統及建立方法
JPH11344991A (ja) 音声認識装置および記憶媒体
Sadigh et al. A rule-based approach to farsi language text-to-phoneme conversion.