JPS5965342A - 漢字仮名変換装置 - Google Patents

漢字仮名変換装置

Info

Publication number
JPS5965342A
JPS5965342A JP57174573A JP17457382A JPS5965342A JP S5965342 A JPS5965342 A JP S5965342A JP 57174573 A JP57174573 A JP 57174573A JP 17457382 A JP17457382 A JP 17457382A JP S5965342 A JPS5965342 A JP S5965342A
Authority
JP
Japan
Prior art keywords
kanji
kana
word
pronunciation
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57174573A
Other languages
English (en)
Other versions
JPH0612539B2 (ja
Inventor
Kazuaki Tanaka
和明 田中
Makoto Itoga
糸賀 誠
Junji Tsuda
津田 順司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Microcomputer System Ltd
Hitachi Ltd
Original Assignee
Hitachi Ltd
Hitachi Microcomputer Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Microcomputer Engineering Ltd filed Critical Hitachi Ltd
Priority to JP57174573A priority Critical patent/JPH0612539B2/ja
Publication of JPS5965342A publication Critical patent/JPS5965342A/ja
Publication of JPH0612539B2 publication Critical patent/JPH0612539B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、漢字仮名混りデータの漢字に読み仮名を自動
付与する漢字仮名変換方式に関するものでろる。
〔従来技術〕
従来の漢字仮名変換方式においては、漢字の字単位の読
み仮名付けが基本であシ、−字単位に漢字の読みが一意
に決められている。そしてそれ以外の読みとなる場合は
、その漢字前後の文字を合わせた鵬語の例外辞書が用意
されておシ、変換処理において変換対象となる漢字が例
外辞書に登録されていれば、その読みを優先させる方式
をとっている。しかし、この方式では、幾つかの漢字熟
語が組み合わされた漢字文字列において、必ずしも各熟
語単位で読みが付与されるとは限らないため、本来意図
された熟語ではない漢字文字列の部分を熟語と判断して
読みが付与される可能性があった。例えば、「開発作業
」という熟語に読みを付与する場合、各漢字の読みが、
開(カイ)、発(ハラ)、作(す)、業(ギョウ)と決
められ、例外辞書には、発作(ホップ)という熟語が登
録されていると、開発作業(カイホツサギョウ)と誤ま
って読み仮名付けされる。
一方漢字仮名混シ文を音声で出力する際には漢字に読み
仮名全付与することが必要となるが、このような用途に
利用する場合には音調に抑揚をつけるため、熟語単位で
読み仮名付けを行うことが望ましい。しかしながら従来
の漢字仮名変換方式は字単位での変換を基本にしている
ため、上記のような用途には不向きでやった。
更に、漢字の読み仮名付与方法としては、漢字文字列の
先頭から漢字仮名辞書に登録されている漢字(−字の漢
字または、工学以上の漢字熟語)の中で、最艮一致する
もの(語基と呼ぶ。)を逐次見つけ、その語基の読みを
付与する方式が考えられるが、次の要因によシ誤まった
読みを付与する可能性がある。
(a)  接辞や、漢字仮名辞書に未登録な熟語の出現
によシ語基の認足を誤まることがある。
(b)  同一熟語が、複数個の読みを持つことがある
〔発明の目的〕
本発明の目的は、漢字仮名混シデータに読み仮名全自動
付与する方式において、読み仮名全付与する対象となる
漢字文字列が、複数個の読みを有する場合、及び漢字文
字列が複数連シに分割でき、その分割された文字列が漢
字仮名変換に登録されている場合に極めて高精度に読み
仮名付けを行い得る方式を提供することにある。
〔発明の概要〕
本発明方式は読み仮名付与の単位となる語基の認定と、
読み仮名の選択とを次の手順で確認しつつ行なうことに
特徴がある。
(1)  最長一致によシ仮認定された漢字語基(前方
語)に対する複数個の読み仮名の中から、その語基の品
詞や前後の文字の属性などを手掛シに、読み仮名付与規
則に基づきその読み仮名を付与する。
(2)  (1)で仮認定された語基に続く漢字文字列
に対して、同様に語基(後方語)を仮認定し、その読み
仮名を付与する。
(3)前方語、後方語の字数や、品詞情報などを手掛シ
に、変換処理制御規則に基づき、語基間の接続関係を調
べ、語基分割の妥当性をチェックして読みを確定する。
例えば、後方語が、1文字であると認定された場合、そ
れが接辞(この場合、接尾語)ならば、前方語は正しい
語基に分割されていると考えられるが、接辞でない場合
、前方語は本来意図された意味を持つ語基として認定さ
れていない可能性がろシ、再度、語基の認定rやシ直す
〔発明の実施例〕
以下、本発明全実施例を参照して詳細に説明する。本発
明の一災施例のハードウェア構成全第1図に示す。第1
図における1はプロセッサ、2は磁気テープや磁気ディ
スク等の漢字仮名混シデータ格納メモリ、3は漢字仮名
変換された漢字とその読み仮名データの格納メモリ、4
はプログラム格納メモリ、5はワーク・エリア、6it
、漢字仮名変換メそり、7は変換処理制御規則テーブル
・メモリ、8は読み仮名付与規則テーブル・メモリ、9
はラインプリンタを表わしている。漢字仮名辞書メモリ
6には、第2図に示す様な形式の辞書が格納されている
。つまり、1字以上の漢字文字列Affi見出し語とし
て、その読み仮名文字列81語属性コードC1頻度情報
りとが格納されている。
める漢字文字列に対して複数個の読みが存在する場合や
、ある漢字文字列とその読み仮名文字列に対して複数個
の語属性コードが存在する場合には、それぞれに1組の
構成をとるものとする。語属性コードCは、漢字文字列
Aとその読み仮名文字列Bとが有する文法情報や、音読
み訓読みといった語属性を示す符号でロシ、その例を第
3図に示す。
頻度情報は、漢字文字列とその読み仮名文字列および語
属性コードが漢字仮名変換時に用いられた頻度が格納さ
れている。
変換処理制御規則テーブル・メモリ7は、第4図に示す
様な論理的構成を有する。各変換処理制御規則は、条件
と、その条件が満足された場合に実行される処理との組
み合わせである。
各行が、各変換処理制御規則に対応し、右端を除く各列
が条件を示す。
配列内のyes、Ho、−は、それぞれ各規則での各条
件が(YeS)「満足されなければならない」、(No
)r満足されてはならない」、(−)「いずれでもよい
」、ことを示す右端の欄は、各規則の条件が満足された
と−き・実施すべき処理の内容を示す。
各規則は、規則番号が小さいほど優先される。
変換処理制御規則A 1 ’t”例によシ説明する。
「前方語の読み仮名が認定されたか」という条件を満足
し、「前方語直後の文字は漢字か」という条件全満足し
なければ、「前方語の読み仮名全確定し、当該文字列に
対する読み仮名付は処理を終了する。」 上記規則テーブル(第4図)の物理的な実施例を第5図
に示す。ここで、配列内の各位は、。2#がYes、@
1’がN0160#がPa5S’に意味する。従って第
5図の行a、b、Cの各位は、第4図の規則番号1,2
.3の条件にそれぞれ対応する。第6図の各位は、第5
図の各列に対応して条件の判定を行なう条件サブルーチ
ン番号を示す。
例えば条件番号1の「漢字文字列はあるか」という判定
を行う処理プログラムにはサブルーチン番号1100が
付与されている。第7図の各位は、第5図の各行に対応
して各条件が満足されたとき実行される処理サブ・ルー
チン番号を示す。例えば第7図の「1o」は、第4図に
おける規則番号1の条件が全部満足したときに行われる
処理、っまシ「前方後を確定する」という処理を実行す
るプログラムのサブルーチン番号金示す。抗与仮名付与
規則テーブル・メモリは、第8図に示す様な論理的構成
を有する。
第8図の見方や物理的実施方法は、変換処理制御規則テ
ーブルと同様である。
プログラムは、第9図のようなモジュール構成をとる。
漢字仮名変換メインモジュール2oでは、各規則テーブ
ル(第4図、第8図)をプロセッサlの主記憶装置にお
ける記憶領域7.8ヘロードする処理漢字仮名変換の対
象となる漢字データを漢字データ格納メモリ2がら取出
す処理、漢字データを、非漢字と漢字との間で区切シ、
漢字仮名変換処理単位(ここでは、文節と呼ぶ)を設定
する処理、処理単位毎に変換処理制御モジュールを参照
する処理、漢字仮名変換された漢字とその読み仮名デー
タを、仮名データ格納メモリ3へ出力する処理および、
処理実行中の工2−に対するエラーメツセージをライン
プリンタへ出力する処理を行なう。
変換処理制御モジュール21は、変換処理制御規則テー
ブル(第4図)釦従い、第6図で示したサブルーチン番
号に対応する条件サブルーチン22を参照し、リターン
・コードが、規則表の値とすべて一致したものであって
且つ規則番号の一番小さな規則に相当するサブルーチン
番号(第7図参照)の実行処理サブルーチン23を起動
する。
本実施例では、漢字仮名変換の対象となる漢字文字列が
、漢字仮名辞書に登録されている複数の漢字文字列(語
基とよぶ)から構成されている場合、語基の認定誤り’
r防止するため、連続する2つの語基(前方暗および後
方語とよぶ)の接続関係を調べて妥当性を確認しつつそ
の語基の読み仮名を付与する方式としている。それゆえ
、前方暗に対してその読み仮名を付与することや、後方
語に対してその読み仮名を付与することも、変換処理料
φ丁規則の一条件としている。それぞれ、前方暗に対す
る読み仮名付与条件サブルーチン22a1後方語に対す
る読み仮名付与条件サブルーチン22bと呼ぶ。
各サブルーチン22a、22bは、変換処理制御モジュ
ール21と同様に、読み仮名付与規則テーブルに基づき
、条件サブルーチン24と、実行処理サブルーチン25
とを起動して、複数個存在する読み仮名の中から、最適
なものを選択する。
次に、変換処理手順について、「新規則の追加」という
漢字仮名混シデータに読み仮名を付与する場合を例にと
って説明する。
初めに、漢字仮名変換メイン・ルーチン2oの処理内容
について、第10図のフローチャートに基づき説明する
漢字仮名変換メイン・ルーチンは、起動されると、変換
処理制御規則テーブル(第4図)を変換処理制御規則テ
ーブルメモリ7から、プロセッサ1上にロードし、ワー
クエリアCROLEに格納する(101)とともに、読
み仮名付与規則テーブル(第8図)を読み仮名付与規則
テーブル・メモリ8から、プロセッサ1上にロードし、
ワークエリアYRULEに格納する(102)。次に、
漢字仮名混シデータ格納メモリ2から、漢字仮名変換の
対象となるデータ「新規則の追加」を読み込む(103
)。もし対象とな、るデータが漢字仮名混シデータ格納
メモリ2にないと漢字仮名変換メインルーチンの処理を
終了する。読み込まれた漢字仮名混シデータは、非漢字
から漢字への変化点で分割され、ワークエリアKANJ
Iに格納される(104)。上記の例では、ワークエリ
アKANJI(1)に「新規則の」が格納され、ワーク
エリアKANJ I(2)に「追加」が格納される。
漢字仮名混フデータが分割されたものを、ここでは文節
と呼ぶが、その文節の個数を、パラメータNUMに格納
する(105)。上記の例では2が格納される。Kに1
個目の文節を示す1を格納(106) L、第に番目の
文節KANJI■をバッファAに格納する(107)。
上記の例では、第14図のように漢字仮名変換対象文字
列が格納される。
工2−コードER,C0DEに0を格納(108)後、
変換処理制瞬モジュール21を起動し、読み仮名処理を
行ない、結果全バッファBに格納する(109)。上記
の例では、第15図のように漢字とその読みが格納され
る。処理終了後、エラーコードが0でなければ、(11
0)、エラーメツセージをラインプリンタに出力して(
111) 、漢字仮名変換処理メイン・ルーチンの処理
を終了する。
エラーコードが0ならば(110) 、バッファBの内
容を仮名データ格納メモリ3に出力する(112)。K
に1を加えた後火の文節(113)があるかを判定しく
114)、存在すれば107以降の処理を繰返し、存在
しなければ、103以降の処理を繰返す。上記例では、
第2番目の文節「追加」について、107以降の処理が
行なわれ、その読み仮名が仮名データ格納メモリに出力
され、その後103で、漢字仮名変換の対象となる漢字
仮名データがないため、漢字仮名変換メイン・ルーチン
の処理を終了する。
変換処理制御方法について、第11図のフローチャート
に基づき説明する。
変換処理制御モジュール21は、起動されると、再処理
カウンタAGAINに0を格納t、(201)、■に第
1番目の変換処理制御規則を示す1を格納しく202)
 、Jに第1番目の変換処理制御条件を示す1を格納し
く203)、  リターンコードにOを格納しく204
) 、第1番目の変換処理制御条件サブルーチンを起動
する(205)。205を処理中にエラーが発生したか
どうかを判定しく206)、エラーがあれば変換処理制
御モジュール21の処理を終了する。エラーがなければ
、変換処理制御規則CRULF(I、J)の値が0か、
又は、変換処理制御規則CRULE(I、J)と205
の処理結果のリターンコードRCODEとが等しいかを
判定しく207) 、満足すれば208’k、満足しな
ければ210を実行する。208でJに1を加えた(2
08)後、第1番目の変換処理制御条件があるかを判定
して(209) 、満足すれば、204以降の処理を繰
返し、満足しなければ、第I番目の変換処理制御実行処
理サブルーチンを起動する(213)。213の処理中
にエラーが発生したかどうかを判定して(214)、エ
ラーが必れは変換処理制御モジュール21の処理を終了
し、エラーがなければ、213の処理で、再処理カウン
タAGAINに0以外の値が格納されたかを判定しく2
05) 、0以外の値が格納されていれば、202以降
の処理を繰返す。
再処理カウンタAGAINのフラグがOならば、バッフ
ァAに格納されている漢字のすべてに読みが付与されて
いるかを判定して(216) 、読みがすべての漢字に
付与されていれは変換処理制御モジュール21の処理を
終了し、読みがついていない漢字があれば、201以降
の処理を繰返す。
210で、■に1を加えた後、第1番目の変換処理制御
規則があるかを判定して(211) 、満足すれば、2
03以降の処理を繰返し、満足しなければエラーコード
EFLCODHに1を格納して(212)変換処理制御
モジュール21の処理を終了する。
本災施例では、変換処理制御規則の条件すブルーチン2
2として、ノ(ソファAの先頭文字が漢字か全判定する
サブルーチン(第4図の条件管号1)と、前方語に読み
を付与するサブルーチン(条件番号2)と、前方語直後
の文字が漢字力)を判定するサブルーチン(条件番号3
)と、再処理中力)全判定するサプルーチ/(≠件番号
4)と前方語カニ2文字以上かt判定するサブルーチン
(条件番号5)と前方語が接頭語かを判定するすブルー
チン(条件番号6)と、後方語に読みを付与するサフ。
ルーチン(条件番号7)と、後方語が2文字以上かを判
定するサブルーチン(条件番号8)と、後方語が接頭語
又は接尾語かどうかを判定するサフ。
ルーチン(条件番号9)と、後方語の直後の文字が漢字
か全判定するサブルーチン(条件番号10)がめ9、処
理叉行後、条件を満足していれば、JターンコードRC
ODEに2を格納し、条件を満足していなければ、リタ
ーンコードRCODEに1全格納する。
又、変換処理制御規則の実行処理すブルーチン23とし
て、バッファE内の前方語とその読み仮名をバッファB
に格納するすブルーチン(第4図の規則一番号1の処理
参照)と、バッファE内の前方語とその読み仮名および
バッファF内の後方語とその読み仮名をバッファBに格
納するサブルーチン(規則番号2,7.11参照)と、
バッファE内の前方語とその読み仮名をバッファBに格
納し、バッファA内の読み仮名未付与文字列をバッファ
Aの先頭に移すサブルーチン(規則番号3゜6.8.1
2)と、バッファEの前方語とその読み仮名およびバッ
ファFの後方語とその読み仮名をバッファBに格納し、
バッファA内の読み仮名未付与文字列をバッファAの先
頭に移すサブルーチン(規則番号4,9)と、再処理カ
ウンタAGAIN K 1 ’i 加jC−、ハラ77
E17)前方tT!Fとそ。
読み仮名およびバッファFの後方語とその読春仮名を第
20図に例示するような、バッファGに格納するサブル
ーチン(規則番号5.10)と、バッファGの漢字文字
列とその読み仮名をバッファBに格納し、バッファA内
の読み仮名未付与文字列をバッファAの先頭に移すサブ
ルーチン(規則番号13.14)と、バッファA内の非
漢字文字列があれば、バッファBに格納するサブルーチ
ン(規則番号15)がある。
同、処理中に、不合理な事象が発生したら、エラーコー
ドER,C0DE KO以外の数値を格納して処理を終
了する。
上記例の「新規則」では、漢字仮名辞書瞥6に、「新規
則」という熟語が登録されておらず、「新規」、「規則
」、「新」、「規」、「則」が登録されているとすると
、第1回目には、第4図に示す変換処理制御規則番号5
が適用され、「新規」と「則」とで読み仮名を付与して
、仮にバッファGに格納され、再処理カウンタAGAI
Nに1が格納される。再処理カウンタが0でないことか
ら(215) 、再度、変換処理制御規則に基づき変換
処理が行なわれ、変換処理規則番号11が適用され、「
新」と「規則」とで読み仮名が付与され、バッファBに
格納される(第15図参照)。その後、変換処理制御モ
ジュール21の処理が終了する。
上記例「追加」については、漢字仮名辞書に、「追加」
という熟語が登録されているとすると、第1回目に、変
換処理制御規則番号1が適用され「追加」に読み仮名「
ツイカ」が付与されて、バッファBに格納後、変換処理
制御モジュール21の処理が終了する。
次に、前方語や後方語に対する読み仮名付与方法につい
て、第12図および第13図のフローチャートに基づき
説明する。
前方mlに対する読み仮名付与サブルーチンは、第12
図に示すように、起動されると、再照合カウンタFAG
AINに0全格納しく1101)、再処理カウンタAG
A I Nが0かを判定(1102)して、0ならば1
104以降の処理を実行し、Oでなければ、再処理カウ
ンタFAGAINに再処理カウンタAGAINの値全代
入(1103) 後、1104以降の処理を実行する。
1104では、FIに、第1番目の読み仮名付与規則(
第8図参照)を示す1を格納する(1104)  とと
もに、FJに、第1番目の読み仮名付与条件を示す1を
格納(1105)後、リターンコードYRCODEに0
を格納(1106)して、第FJ番目の読み仮名付与条
件サブルーチンを起動する(1107)。
1107′!!−処理中にエラーが生じたかを判定して
(1108)、エラーがめれば前方語に対する読み仮名
付与サブルーチンの処、Jl終了し、ニジ−がなければ
、読み仮名付与規則YRULE(PI、FJ)の値が0
か、又はYRULE (FI、 FJ )と、1107
の処理結果のリターンコードYR,C0DEとの値が等
しいかを判定して(1109)、満足すれば1110以
降の処理を実行し、満足しなければ1112以降の処理
を実行する。
1110では、FJに1全加えた(1110)  後、
第FJ番目の読み仮名付与規則条件がおるかを判定して
(1111)、満足すれば、1106以降の処理を繰返
し、満足しなければ、第PI番目の読み仮名付与実行処
理サブルーチンを起動する(1115)。
1115では、付与した読み仮名データが、第17図に
例示するような、バッファDに格納される。
1115の処理中にエラーが発生したかどうかを判定し
て(1116)、エラーがあれば、前方語に対する読み
仮名付与サブルーチンの処理を終了し、エラーがなけれ
ば、バッファDのデータを、第18図に例示するような
、バッファEに移した(1117)  後、1115の
処理で、再照合カウンタFAGAINに0以外の値が格
納されていないが全判定して(1118)、0以外の値
が格納されていれば、1102以降の処理を繰返し、0
が格納されていれば、前方語に対する読み仮名付与処理
を終了する。
1112で、FIに1を加えた(1112) 後、第F
1番目の読み仮名付与規則があるがを判定して(111
3)、存在すれば% 1105以降の処理を繰返し、存
在しなければ、エラーコードERCODEに、2を格納
して前方語に対する読み仮名付与サブルーチンの処理を
終了する。
後方語に対する読み仮名付与サブルーチンは、第13図
に示すように起動されると、再照合カラ/りBAGAI
Nに0を格納しく1201)、パラメータBIに、第1
番目の読み仮名付与規則ケ示すlを格納しく1202)
、パラメー/BJに、第1番Vの読み仮名付与条件を示
す1を格納(1203) 後、リターンコードYRCO
DEに0を格納(1204)して、第BJ番目の読み仮
名付与条件サブルーチン全起動する(1205)。12
05e処理中に、エラーが発生したか全判定し’p (
1206)、エラーがろれば後方語に対する読み仮名付
与サブルーチンの処理を終了し、エラーがなければ、読
み仮名付与規則YR,ULE(BI、 BJ)の値が0
か、又は、YR,OLE (BI、 BJ )と、12
05の処理結果のリターンコードYRC0DEとの値が
等しいかを判定して(1207)、満足すれば1208
以降の処理を実行し、満足しなければ、1211以降の
処理を実行する。
1208では、BJに1を加えた(1208)  後、
第BJ番目の読み仮名付与条件があるかを判定して(1
209)、満足すれば、1204以降の処理を繰返し、
満足しなければ、第BJ番目の読み仮名付与実行処理サ
ブルーチンを起動する(1210)。
1210では、付与した読み仮名データが、バッファD
に格納される。
1210の処理中にエラーが発生したかどうか全判定し
て(1214)、エラーがおれば、抜力11t1に対す
る読み仮名付与サブルーチンの処理?f:+1”了し、
エラーがなければ、バッファDのデータを、第19図に
例示するような、バッファFに移した(1215) 後
、1210の処理で、再照合カウンタBAGAINに0
以外の値が格納されていないかを判定して(1216)
、O以外の値が格納されていれば、1202以降の処理
を繰返し、0が格納されていれば、後方語に対する読み
仮名付与処理全終了する。
1211で、BIに1を加え7’C(1211ン 後、
第BI番目の読み仮名付与規則があるかを判定して(1
212)、存在すれば、1203以降の処理を繰返し、
存在しなければ、エラーコードERCODEに、3を格
納して後方語に対する読み仮名付与サブルーチンの処理
を終了する。
本実施例では、読み仮名付与規則の条件サブルーチンと
して、漢字仮名辞書に登録されている漢字文字列の中で
、バッファAの漢字仮名変換文字列の先頭から、最長一
致するものあるいは、もし、再照合フラグが0以外の値
ならば、最長一致文字数から再照合フラグの°値を引い
た文字数のものを取出し、第16図に示すバッファCに
格納後、それが2文字以上の文字列接)全判定するサブ
ルーチン(第8図条件番号1参照)と、バッファCの漢
字文字列が1文字かを判定するサブルーチン(条件番号
2)と、バッファCの漢字文字列の中で、二段動詞と認
定できるものかめるかを判定するサブルーチン(条件番
号3)と、バッファCの漢字文字列の中で、接頭語と認
定できるものがるるかを判定するサブルーチン(条件番
号4)と、バッファCの漢字文字列の中で、接尾語と認
定できるものがあるかを判定するサブルーチン(条件番
号5)と、バッファCの漢字文字列の中で、形容詞と認
定できるものがあるかを判定するサブルーチン(条件番
号6)と、バッファCの漢字文字列の中で、二段動詞、
接頭語、接尾語、形容詞、音読み、W11読み以外のも
のがめるかを判定するサブルーチン(条件番号7)と、
バッファCの漢字文字列が、音読みとI11読みの両方
の読みがろるかを判定するサブルーチン(条件番号8)
と、バッファA内の最長一致した文字/IIの直後の文
字が漢字かを判定するサブルーチン(条件番号9)かめ
シ、処理実行後、条件を満足していれば、リターンコー
ドYl’t、C0DEに2が格納され、条件を満足して
いなければ、YRCODEに1が格納される。
又、読み仮名付与規則の実行処理サブルーチンとして、
バッファCの漢字文字列の中で、語属性が五段動詞であ
るものを、バッファDに、格納するサブルーチン(第8
図の規則番号1,7に対応する処理)と、バッファCの
漢字文字列の中で、語属性が接頭語であるものを、バッ
ファDに格納するサブルーチン(規則番号2,8)と、
語属性が接尾語でるるものを、バッファDに格納するサ
ブルーチン(規則番号3,9)と、バッファCの漢字文
字列の中で、語属性が形容詞でおるものを、バッファD
に格納するサブルーチン(規則番号4゜10)と、バッ
ファCの漢字文字列の中で、語属性が五段動詞、接頭語
、接尾語、形容詞、音読み、1+1読み以外であるもの
を、バッファDに格納するザブルーチン(規則番号5.
11)と、再照合フラグに1を加算するサブルーチン(
規則番号6)と、バッファCの漢字文字列の中で、語属
性が音読みであるものを、バライアDに格納するサブル
ーチン(規則番号12)と、バッファCの漢字文字列の
中で、語属性が訓読みであるもの全1バツフアDに格納
するサブルーチン−(規則番号13)と、語属性が音読
み又は訓読みであるものを、バッファDに格納するサブ
ルーチン(規則番号14)とがめる。尚、各実行処理サ
ブルーチンの処理中、バッファDに格納すべきものが複
数個存在する場合は、バッファCの各漢字文字列の頻度
の最大のもの?選ぶものとし、頻度が同じならば、バッ
ファCの上段に位置するものを選ぶものとする。
又、各条件サブルーチンおよび各実行処理サプルーチ/
を処理中に、不合理な事象が発生したら、エラーコード
ERCODEに0以外の数値を格納して処理を終了する
〔発明の効果〕
本発明によれば、次のような効果が得られる。
(1)漢字仮名辞書文の漢字文字列に、語基単位で読み
仮名を付与することができる。
(2)複数個の読み仮名を持つ漢字文字列に対する読み
仮名選定基準を、条件と実行処理とを1組とした規則と
して登録する方式としたことによシ、規則の変更や追加
・削除は、規則テーブルの修正、条件サブルーチンの追
加・削除、実行サブルーチンの追加・削除という形態を
とシ、変換処理プロシジャの変更が不要なため、規則の
改良および拡張が容易に行なえる。
(3)変換処理手順についても、変換処理制御規則とし
て規則化することによシ、規則の改良および拡張が容易
に行なえる。
(4)変換処理−を制御する規則と、読み仮名全付与す
る規則とを分離したことによシ、漢字仮名変換規則の数
を少なくすることができる。
実施例は一変換処理制御規則が15個、読み仮名付与規
則が14個、合計29個の規則で構成されているが、分
離されていないと、前方飴と後方語に読み仮名を付与す
ることから約100倍の14X14X15=2940個
モ(7)規則を必要とする。
【図面の簡単な説明】
第1図は、本発明の一実施例の漢字仮名変換方式のハー
ドウェア構成図、第2図は、漢字仮名辞書の項目を示す
図、第3図は、漢字仮名辞書の一項目である語属性の例
を示す図、第4図は、漢字仮名変換処理の制御規則の論
理的な構成例を示す図、第5図は、漢字仮名変換制御規
則のメモリ内での格門(れ方を示す図、第6図は、漢字
仮名変換制御規則の各条件に対応するサブルーチン番号
のメモリ内での格納のされ方を示す図、第7図は、漢字
仮名変換制御規則の各実行処理に対応するサブルーチン
番号のメモリ内での格納のされ方を示す図、第8図は、
読み仮名付与規則の論理的な構成例を示す図、第9図は
、本発明実施例のソフトウェア・モジュール構成を例示
する図、第10図(A)、■は、漢字仮名変換メイン・
モジュールの処理手順を示す図、第11図(2)、(ト
)は、変換処理制御規則に基づく、変換処理制御モジュ
ールの処理手順を示す図、第12図(5)、0は、読み
仮名付与規則に基づく、前方胎の読み仮名付与処理手順
を示す図、第13図(4)、(ト)は、読み仮名付与規
則に基づく、後方語の読み仮名付与処理手順を示す図、
第14図は、バッファAの構成を例示した図、第15図
は、バッファBの構成を例示した図、第16図は、バッ
ファCの構成を例示した図、第17図は、バッファDの
構成全例示した図、第18図は、バッファEの構成を例
示した図、第19図は、バッファFの構成を例示した図
、第茅  1  図 第  Z 図 葛 3  図 話A 桂 の 49’l    (一部)■ 4 図 舅 5 図 15  6    図 閣肩口;遍=豐翌=扉 ′¥57  目 第 g  図 vllo図(A) 箒tθ図CB) ′iJ   /I   m   (A)■ 1t 図 
(6ジ 第1z図(A) ’f、  12  図 (B) 第13 図(A) 循 13  図 (B) 第 74 図 第16図 ハ゛ツ7了り

Claims (1)

  1. 【特許請求の範囲】 1、漢字仮名混シ文における漢字に仮名を付与する方式
    において、 (a)1文字以上の漢字文字列の読み仮名と品詞情報と
    を有する漢字仮名辞書を格納したメモリ領域と、 対応して付与すべき読み仮名の関係を定めた読み仮名付
    与規則テーブルを格納したメモリ領域とを有し、 (C)  上記漢字仮名混シ文を漢字とに区切る段階と
    、 (d)  漢字で始まる文字列に対して、上記漢字仮名
    辞書全検索する段階と、 (e)  同一漢字文字列に対して2個以上の読みがあ
    る場合に、上記読み仮名、付与規則テーブルを参照し、
    所定の読み仮名全付与する段階と全備えたことを特徴と
    する漢字仮名変換方式。 2、漢字仮名混り文における漢字に仮名を付与する方式
    において、 (a)1文字以上の漢字文字列の読み仮名と品詞情報と
    を有する漢字仮名辞書を格納したメモリ領域と、 (b)  上記漢字文字列を複数連シに分割でき、それ
    ぞれ分割された文字列が上記辞書に登録さに対応してと
    るべき文字構成列の関係を定めた変換処理制御テーブル
    全格納するメモリ領域とを有し、 (C)  上記漢字仮名混シ文を漢字と非漢字とに区切
    る段階と、 (d)  漢字で始まる文字列に対して仮の前方語と後
    方語を定める段階と、 (e)  上記変換処理制御テーブルを参照して前方語
    と後方語との接続関係を調べ、分割の妥当性をチェック
    する段階と、 (f)  上記漢字仮名辞書を参照して前方語と後方語
    の読みを付与し、上記漢字文字列の読みを定める段階と
    を備えた漢字仮名変換方式。 3、漢字仮名混9文における漢字に仮名を付与する方式
    において、 (a)1文字以上の漢字文字列の読み仮名と品詞情報と
    を有する漢字仮名辞書を格納したメモリ領域と、 (b)  同一漢字文字列に対して2個以上の読みがあ
    る場合に、その漢字文字列の属性とそれに対応して付与
    すべき読み仮名の関係全定めた読み仮名付与規則テーブ
    ルを格納したメモリ領域と、 (C)  漢字文字列を複数個に分割でき、それぞれ分
    割された文字列が上記辞書に登録されている場合に、そ
    の分割点の前方にある前方語と後方にある後方語の属性
    と、その属性に対応してとるべき文字構成列の関係を定
    めた変換処理制御テーブルを格納するメモリ領域と?有
    し、 (d)  最長一致によシ仮認定された前方語に対する
    複数個の睨み仮名の中から、上記前方語の品詞及び前後
    の文字の属性から上記読み仮名付与規則テーブルに基づ
    き(その読み仮名を付与する段階と、 (e)  上記仮認定された前方語に続く漢字文字列に
    対して最長一致により後方語を仮認定し、その読み仮名
    を付与する段階と、 (f)  上記前方語及び後方語の字数及び品詞情報を
    基にして上記変換処理制御規則テーブルを参照し、前方
    語及び後方語の接続関係を調べ、分割の妥当性をチェッ
    クして読みを確定する段階とを備えたことを特徴とする
    漢字仮名変換方式。
JP57174573A 1982-10-06 1982-10-06 漢字仮名変換装置 Expired - Lifetime JPH0612539B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57174573A JPH0612539B2 (ja) 1982-10-06 1982-10-06 漢字仮名変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57174573A JPH0612539B2 (ja) 1982-10-06 1982-10-06 漢字仮名変換装置

Publications (2)

Publication Number Publication Date
JPS5965342A true JPS5965342A (ja) 1984-04-13
JPH0612539B2 JPH0612539B2 (ja) 1994-02-16

Family

ID=15980917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57174573A Expired - Lifetime JPH0612539B2 (ja) 1982-10-06 1982-10-06 漢字仮名変換装置

Country Status (1)

Country Link
JP (1) JPH0612539B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62174871A (ja) * 1986-01-28 1987-07-31 Casio Comput Co Ltd 仮名漢字相互変換装置
JPS62174866A (ja) * 1986-01-28 1987-07-31 Casio Comput Co Ltd 仮名漢字相互変換装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5692677A (en) * 1979-12-26 1981-07-27 Fujitsu Ltd Kanji (chinese character)/kana (japanese syllabary) converter

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5692677A (en) * 1979-12-26 1981-07-27 Fujitsu Ltd Kanji (chinese character)/kana (japanese syllabary) converter

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62174871A (ja) * 1986-01-28 1987-07-31 Casio Comput Co Ltd 仮名漢字相互変換装置
JPS62174866A (ja) * 1986-01-28 1987-07-31 Casio Comput Co Ltd 仮名漢字相互変換装置

Also Published As

Publication number Publication date
JPH0612539B2 (ja) 1994-02-16

Similar Documents

Publication Publication Date Title
US4994966A (en) System and method for natural language parsing by initiating processing prior to entry of complete sentences
US4641264A (en) Method for automatic translation between natural languages
US5610812A (en) Contextual tagger utilizing deterministic finite state transducer
EP0266001B1 (en) A parser for natural language text
US7529657B2 (en) Configurable parameters for grammar authoring for speech recognition and natural language understanding
US4685060A (en) Method of translation between languages with information of original language incorporated with translated language text
US5220503A (en) Translation system
US6169972B1 (en) Information analysis and method
JPH0418346B2 (ja)
JPH0689302A (ja) 辞書メモリ
US5784489A (en) Apparatus and method for syntactic signal analysis
EP0403660A1 (en) Machine translation system
KR20050033420A (ko) 텍스트로부터 세만틱 구조들을 식별하기 위한 방법 및장치
US20160335254A1 (en) Machine Translation System and Method
WO2000063880A1 (en) Compound words in speech recognition systems
JPH08292955A (ja) 言語処理方法及びそれを適用するデータ処理装置
JPS5965342A (ja) 漢字仮名変換装置
JP2999768B1 (ja) 音声認識誤り訂正装置
Evans et al. Automaton-based Parsing for Lexicalised Grammars
KR100303171B1 (ko) 형태소 접속 그래프를 사용한 형태소 및 구문 분석 방법
JPS5918730B2 (ja) 仮名・漢字変換装置
EP0314503A2 (en) Dictionary structure for document processing apparatus
JPH0612451A (ja) 例文検索システム
JP3524189B2 (ja) 文字処理装置
JPS5899829A (ja) 誤り文字検出・修正支援装置