JPS60207948A - カナ漢字変換処理装置 - Google Patents

カナ漢字変換処理装置

Info

Publication number
JPS60207948A
JPS60207948A JP59062170A JP6217084A JPS60207948A JP S60207948 A JPS60207948 A JP S60207948A JP 59062170 A JP59062170 A JP 59062170A JP 6217084 A JP6217084 A JP 6217084A JP S60207948 A JPS60207948 A JP S60207948A
Authority
JP
Japan
Prior art keywords
kana
key
kanji
conversion
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59062170A
Other languages
English (en)
Inventor
Tsuneo Meguro
目黒 常雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59062170A priority Critical patent/JPS60207948A/ja
Publication of JPS60207948A publication Critical patent/JPS60207948A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 皮乳欠1 本発明はカナ漢字変換処理装置、とくに、たとえば日本
語ワードプロセッサや翻訳機械などの11禾J6処JI
IERηにおいて、入力表音文字列からそれに対応する
漢字カナ混在文字列を導出するカナ漢字変換処理装置に
関するものである。
良末孜l たとえば日本語ワードプロセッサにおいて広く採用され
ている「カナ漢字変換」方式では、人力文字列から単語
単位、分節単位またはべた書き変換で変換文字列を生成
する。これは、キーボードなどの人力装置からカナまた
はローマ字表記で人力された読み情報と、これに基づい
て単語11f:i’Fおよび文法辞書を索引して解析し
た各単語間の文法的構造の情報とによって漢字カナ混在
文字列が導出される。
一般に単語辞書は、自立語を索引する自立J/i辞書を
中心に構成される。従来、自立語辞、!りは、各自−’
/、’ j+jごとに、中171FIの読み、表記1品
、1,4および使用頻度等に関するデータを所定の記憶
フォーマットで含んでいた。−例として第2図(A)を
参照すると、たとえば「頭J薯という単語は、読み「ず
じょう」を示す読みデータ部10と1表記r頭に」を示
す表記データ部12と1品詞や頻度についての情報(t
、で示す)を示す属性データ部14とからなる。
しかしこのような自立語辞書は、従来、漢字表記のない
単語、すなわち、ひらがなまたはカタカナで表記される
単語についても、必ず表記データ部】2を右し、通常の
データスペース、すなわちビット数の記憶領域を占有し
ていた。この例において「ずたずた」や「ずっしり」な
どで示すように、表記が読みと同一であるにもがかわら
ず、各単語ごとに表記データ部12が割り当てられてい
る。これかられかるように、自立語のうちいわゆる状態
副詞が多くこれに該当する。このような表記が読みと同
じである語も自立語辞書に収容することによって1.:
bの表記を確定する際に、その前後の語の情報も効率的
に得ることができる。
これらの語は、日本語の単語のうちでも比較的数が多い
ので、自立語辞書の記憶領域の無視しえない割合を占有
していた。したがって、このような、重複ともいえるデ
ータ部分を何らかの方法で省略することができれば、′
自立語辞書の構成が簡略化され、記憶領域が節減される
。とくに、自立、:/l辞書をROMに格納しておくよ
うなシステム構成の場合は、記憶容量の少ないROMを
効果的に採用することができるので有利となろう。
几−」 本発明はこのような従来技術の欠点を解消し、自立語辞
書に要求される記憶容量が少ないカナ漢字変換処理装置
を提供することを目的とする。
欅−減 本発明の構成について以下、一実施例にツムづいて説明
する。
第1図を参照すると、本発明を11本語ワードプロセッ
サに適用した実施例が概念的機能ブロック図にて示され
ている。同図に示すように、本実施例は、キーボード2
0と、キー人力制御部22と、自〜’/、’++/i辞
占24や他の文法辞書などを参照してカナ漢字変換を実
行するカナ漢字変換部2Gと、変換された文字列を編集
して出力する出力編集部28と、表示装置30とを有す
る。
キーボード20は、本実施例ではカナまたはアルファベ
ット(たとえばローマ字表記)などの読み(表音)文字
を人力する読み文字キー、カナ漢字変換を指示する変換
キー、および本装置の入力モートを指定するモードキー
を有する。勿論キーボード20は、その他の機能キーな
どを有するが、これらは本発明の理解に直接関係ないの
で説明を省略する。なお、本明細書において用語「文字
」は、カナまたはアルファベア)のみならず、句読点や
他の記t)などをも含むものとする。
キー人力ffj+御部22は、キーボード20において
押されたキーに対応した信号が入力されると、これを識
別する回路である。本実施例では、2つの入力モード、
すなわち直接入力モードと、カナ漢字変換モードとが利
用できる。したがってキー人力制御部22は、直接入力
モードでは、キー人力されたデータを接続線32によっ
て出力編集部28に転送し、カナ漢字変換モードでは、
キー人力されたデータを接続線34によってカナ漢字変
換部26に転送する。
カナ漢字変換部26は、通常利用できるカナ浅学変換方
式にて入力文字列を漢字カナ混在文字列に変換する機能
ブロックである。これは、大きく分けて、人力の読み文
字データから単語を抽出する単語抽出機能と、抽出した
単語のうち漢字に相当する部分を漢字に変換する漢字変
換機能とを有する。カナ漢字変換部2Bは本実施例では
、キーボード20の変換キーに応動して入力文字列を示
すデータに基づき、自立語辞書24を含む単語辞書およ
び文法辞書を索引してカナ漢字変換処理を実行する。こ
れらの機能における具体的処理は1本発明の理解に直接
関係ないので、説明を省略する。
自立語辞書24は、本実施例では、第2図(B)に示す
ような記憶フォーマットで自立語に関するデータを単語
ごとに規定し、蓄積した記憶装置である。これは、ファ
イル記憶装置やROMであってもよく、前者の場合は、
システム稼動状態ではRANのシステムメモリに転送蓄
積されるのが有利である。
第2図(B)を参照して自立語辞書24のデータフォー
マットを説明する。自立語は、本実施例では五十音順に
ファイルされ、各語は原則として、読みデータ部lO1
表記データ部12および属に1デ一タ部14からなる。
本実施例では、読みデータ部10は読みを1バイトコー
ド(JIS C622Bの低位バイト)で表わし、表記
データ部12は表記を2バイトコード(高位バイトの最
上位ビットが1になるシフトJISコード)で表わす方
式をとっている。これにより、読みデータ部IOと表記
データ部12を区別できる構成になっている。また、属
性データ部14は1語の品詞分類、使用順Jffなどの
情?Mを含み、固定長で表わされる。
この原則データ形式は、図示のように、たとえば「頭上
」なと、読みと表記が異なる語の場合に適用される。し
かし、たとえば「ずたずた」などのように表記が読みと
同じ語の場合には、表記データ部12の代りに、等読み
コード部12aを含む別のデータ形式が使用される。
r等読みコード」とは、語の表記が読みと同じであるこ
とを示すコードであり、同図では※で示す。本実施例で
は、等読みコード128は、高位バイトの最り位ビット
が1の2バイトコードで表わし、文字コードと区別でき
るコードを割り当てるのが有利である。これによって、
たとえば副詞。
とくに状態副詞など、表記が読みと同一である8nにつ
いて表記データ部12よりはるかにビット数の少ない等
読みコード12aを割り当て、その語の全体のデータ長
を1υ縮している。
出力編集部28は、キー人力制御部22またはカナ漢字
変換部26から入力された文字列を、キーボード20の
機能キーの操作に応じて編集し、表示装置30に表示す
る機能部である。
キー人力11jl11部22、カナ漢字変換部2Bおよ
び出力編集部28などのブロックは、たとえばマイクロ
プロセッサなどの処理システトにょって右利に実現され
、同図では、その機能別にブロックで示されている。
表示装置30は、たとえばCRT文字表示装置でよ〈1
本システムに人力された読み文字列や、カナ漢字変換さ
れた変換結果の文字列などが可視表示される。表示装置
30に加えて印字装置などの他の出力装置が右利に使用
される。
第3図のフローを参照して本装置の動作を説IJする。
キーボード20によってキー人力があると(+00)、
キー人力制御部22はそれが文字キーであるか機能キー
であるかを判断する(102.110)。文字キーであ
れば、そのときの人力モードが直接人力モードである場
合は(+04)、キー人力制御部22はその文字データ
を出力編集部28に直接転送する(+20)。しかし、
カナ漢字変換入力モードである場合は、キー人力制御部
22はそのキーパ・ンファにこの文字データをセットす
る(106)。このようにして、キー人力1ノ制御部2
2のキーバッフγに1士キー入力された文字データが順
次蓄積される。
そこで本実施例では、操作者がキーボード20の変換キ
ーを操作すると、キー人力制御部22がこれを検出しく
110)、カナ漢字変換部26にキバッファの蓄積内容
を転送する。カナ漢字変換部26はこれに応動して、キ
ー人力制御部22から転送された文字データを読みデー
タとして認識し、これに基づいて自X′1語辞書24を
索引する(112)。
カナ漢字変換部26は、自立語辞iす24から、その読
みについての表記コード情報、および品詞分類情?Mな
どを得る。その際、その語についての表記情報を得るだ
けでなく、前後の品詞情報も抽出し、これは、同音異義
語があったときに最も妥当な候補をI定するのに使用さ
れる。そのために、自立語辞書24には表記がカナのみ
である語も登録しておくのが有利である。
カナ漢字変換部26は、読みについての候補を自を語辞
書24から索出し、それらのうちから所定の判:li′
ス(準に従って最尤′度の候補を決定する(+14) 
、その際、表記データ部12に対応する等読みコード部
12aか見つか−)たときは(Ill()、カナ炊字変
換部26は、その1:)tみに対応するシフ) JIS
コードのひらがな(場合によってはカタカナ)を生成す
る(+18)。つまり、これがその読みに対応するひら
がな(カタカナ)の表記として決定される。このように
して決定された表記がカナ漢字変換部26から出力編集
部28に転送され(+20) 、この操作を順次繰り返
すことによってカナ漢字変換された文字列が出力編集部
28に順次蓄積される。
なお、ここで説明した実施例は本発明を説明するための
ものであって1本発明は必ずしもこれに限定されるもの
ではなく、本発明の精神を逸脱することなく当業者が可
能な変形および修正は本発明の範囲に含まれる。たとえ
ば、図示の実施例では変換キーによる逐次変換を例によ
って説明したが、必ずしもこれによらなくてもよく、た
とえばべた古き変換方式にも本発明は右利に適用される
。また、読み文字列がキーボードで人力される例につい
て説明したが、キーボード入力に限定されず、たとえば
通信回線やファイル記憶装pVJなどから読み文字列が
人力されてもよい。
肱−】 本発明によるカナ漢字変換処理装置はこのように、表記
が読みと同じである自立語は、自立語辞書にその旨を表
示して登録し、カナ漢字変換においてこの表示を検出し
たときは、読みと同じ表記を生成する。これによって、
本カナ漢字変換処理装置は、自立語辞書に要求される記
憶容量が少なくてすむ特徴がある。とくに、自立語辞書
をROMに格納しておくようなシステム構成の場合は、
小さい記憶容量のROMを効果的に採用することができ
る。
【図面の簡単な説明】
第1図は、木発す1を日木開ワードプロセッザに適用し
た実施例を概念的に示す機能ブロック図、 第2図は自立語辞書のデータフォーマットの例を示す説
明図、 第3図は、第1図に示す実施例の動作を説明するフロー
図である。 一= 1 ) ・μの1 10、、、読みコード部 +2.、、表記コード部 12a、、、等読みコード部 20、、、キーボード 22、、、キー人力制御部 24、、、自立語辞書 26、、、カナ漢字変換部 28、、、出力編集部 3060表示装置 4、νa1出願人 株式会社リコー 1′

Claims (1)

  1. 【特許請求の範囲】 読み文字によって入力文字列を入力する入力手段と、 自94語の読み、表記および属性を自立語ごとに規定し
    た自立語辞書と、 該自ヴ+i5辞書を参照して、前記人力文字列を対応す
    る漢字カナ混在文字列に順次変換する変換手段とを有す
    るカナ漢字変換処理装置において、前記自立語辞書は、
    表記が読みと同じである語については、その旨を示す表
    示データを表記の代りに含み、 前記変換1段は、人力文字列に含まれる語について+i
    ij記r1立晶辞書を参照し、索出した語について前記
    表7+<データが得られたときは類語の読みをその1;
    11の表記とし、前記表記が得られたときは該(1)ら
    れた表記をその語の表記としてカナ漢字変換を行なうこ
    とを特徴とするカナ漢字変換処理装置。
JP59062170A 1984-03-31 1984-03-31 カナ漢字変換処理装置 Pending JPS60207948A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59062170A JPS60207948A (ja) 1984-03-31 1984-03-31 カナ漢字変換処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59062170A JPS60207948A (ja) 1984-03-31 1984-03-31 カナ漢字変換処理装置

Publications (1)

Publication Number Publication Date
JPS60207948A true JPS60207948A (ja) 1985-10-19

Family

ID=13192379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59062170A Pending JPS60207948A (ja) 1984-03-31 1984-03-31 カナ漢字変換処理装置

Country Status (1)

Country Link
JP (1) JPS60207948A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03217971A (ja) * 1990-01-23 1991-09-25 Sharp Corp 機械翻訳装置
JPH08249322A (ja) * 1996-04-04 1996-09-27 Sharp Corp 文字処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03217971A (ja) * 1990-01-23 1991-09-25 Sharp Corp 機械翻訳装置
JPH08249322A (ja) * 1996-04-04 1996-09-27 Sharp Corp 文字処理装置

Similar Documents

Publication Publication Date Title
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
EP0370774A2 (en) Machine translation system
JPS60207948A (ja) カナ漢字変換処理装置
JPS59100941A (ja) 仮名漢字変換装置
JP2862236B2 (ja) 文字処理装置
JPH0380363A (ja) 文書処理装置
JP3220133B2 (ja) 仮名漢字変換装置
JPS6172361A (ja) かな漢字変換装置
JPS6172360A (ja) べた書きかな漢字変換方式
JPS60189573A (ja) 文字変換装置
JPH07104863B2 (ja) かな漢字変換装置
JPS5998236A (ja) 日本文入力装置
JPS6061824A (ja) 文字変換装置
JPS5840650A (ja) 日本文入力方式
JPS60217452A (ja) 日本語入力処理装置
JPH06110878A (ja) 仮名漢字変換方法
JPH05174018A (ja) かな漢字変換装置
JPH04160668A (ja) 文字処理装置
JPH0397066A (ja) 機械翻訳システム
JPH0512251A (ja) 文書処理装置
JPH0468466A (ja) かな漢字変換装置
JPH07200569A (ja) 文字処理装置
JPH06131329A (ja) 日本語文字処理装置
JPH0981555A (ja) 文書処理装置及びその方法
JPH01197876A (ja) 電子辞書