JPH027160A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH027160A
JPH027160A JP63156909A JP15690988A JPH027160A JP H027160 A JPH027160 A JP H027160A JP 63156909 A JP63156909 A JP 63156909A JP 15690988 A JP15690988 A JP 15690988A JP H027160 A JPH027160 A JP H027160A
Authority
JP
Japan
Prior art keywords
conversion
notation
character string
converted
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63156909A
Other languages
English (en)
Inventor
Yuji Kobayashi
雄二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63156909A priority Critical patent/JPH027160A/ja
Publication of JPH027160A publication Critical patent/JPH027160A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、入力される文字列を解析して所定の漢字候
補を変換出力する文字処理装置に関するものである。
〔従来の技術〕
従来、文字列の変換を行う文字処理装置として、例えば
操作者が入力したい漢字に対応する読みを入力して、変
換指示を与えることにより、読みを漢字に変換して入力
するいわゆるカナ漢字変換を行う文字処理装置が実現さ
れている。
通常、カナ漢字変換では多数具れる同音語について、個
々の単語の出願頻度や、構文解析、意味解析によフてそ
の第1候補を決定する手段が採用されてきた。
〔発明が解決しようとする課題〕
ところが、日本語のように膠着言語は、欧米語のように
単語毎に空白で区切って書き表す、いわゆる分かち書き
の正書法というものがない。そのため、同じ文字種が連
続して使用されると、どこが意味上の区切りなのか判別
し難く、読みづらいものになり、誤読を与える原因とな
る。また、特に日本語の和語においては、同じ読みに対
して漢字表記したり、平板名にしたりすると、その表記
は揺れた状態となる。
従って、上記従来例では、変換結果としては尤もらしい
ものであっても、出力表記による見た目の分かち書き効
果が考慮されていないため、必ずしも読み易い変換結果
になるとは限らない。
例えば「よのなかにはいろいろなくにがあります」とい
う入力読みに対し、「世の中にはいろいろな国がありま
すjと変換1ノたどすると、「世の中」から「国」まで
の間に平板名が連続しており、「には」とか「はい」な
ど連続1ノて現れることの多い文字連糸があるため、「
世の中に/はいろいろな・・・」のように8売み誤りや
すし)。
しかしながら、仮名漢字混用による分かち書き効果のた
めに、すべでの変換候補表記を漢字に1ノでしまうと、
「こね」、「それjなど通常平仮名で表記することの多
い単語まで漢字表記になりでしまい、文中での漢字使用
率が非常に高くなるため、読み易い文とは言えなくなっ
てしまう。
この発明は、」=記の問題点を解消するためになされた
もので、人力された連続する読み入力の各連糸関係を考
慮しながら人力された読みユカを仮名漢字変換すること
により、連続人力される読み入力に左右されにくい正確
な区切り東語候補に自動変換できる文字処理装置を得る
ことを目的とする。
〔課題を解決するための手段) この発明に係る文字/A埋装置は、変換手段により変換
された表記を出力する出力手段と、入力手段から連続し
て入力される読み入力に隣接する文字対の文字連糸関係
情報を記憶する隣接文字連糸メモリと、この隣接文字連
糸メモリに記憶される文字連糸関係情報と変換手段によ
り順次変換される変換候補表記文字対とを比較して、変
換手段により変換された第1変換表記候補の出力手段へ
の送出を抑制する抑制手段とを設けたものである。
〔作用〕
この発明においては、人力手段から読み入力が開始され
ると、変換手段が1語辞書メモリを検索しながら第1変
換表記候補を変換する。その際、抑制手段が変換手段に
より変換された第1変換表記候補と隣接文字連糸メモリ
に記憶される文字連糸関係情報とを比較して、変換した
第1変換表記候補と隣接文字連糸メモリに記憶される文
字連糸関係情報とが一致する場合に限って変換手段によ
り変換された第1変換表記候補の出力手段への送出を抑
制し、さらに次の読み入力の変換を実行させる。
(実施例) 第1図はこの発明の一実施例を示す文字処理装置の〜例
を説明する制御ブロック図であり、CPUはマイクロプ
ロセッサで、文字処理のための演算、論理判断等を行い
、アトlノスバスAD、コントロールバスCB、データ
バスDBを介してそれらのバスに接続さ」]た各構成要
素を制御する。
アドレスバスABは、マイクロプロセッサCPUの制御
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセッサCPUの
制御対象とする各構成要素のコントロール信号を転送し
て印加する。
データバスDBは各構成機器相互間のデータの転送を行
う。
ROMは読み出し専用固定メモリで、プログラムエリア
PAにこの発明の表記候補出力制御手順および文字編集
処理に必要な制御手順、例えば第7図および第8図に示
す手順が格納されている。
RAMはランダムアクセスメモリで、1ワード16ビツ
トの構成の書き込みが可能な構成となっており、各構成
要素からの各データを一次記憶する文書バッファエリア
TBUF、読みバッファエリア¥BUF、この発明の隣
接文字連糸メモリとなる連糸辞書メモリエリアREN、
辞書メモリエリアDIC,表記格納バッファCBUF等
が確保されており、文書バッファエリアTBUFにはキ
ーボードKBより入力さねた文書情報を蓄えらねる。
また、読みバッファエリアYBUFにはギーボドKBよ
り大力された読みが格納される。また、辞書メモリエリ
アDICには、仮名漢字変換を実行するための読みと表
記とが対応する一連の単語候補群が格納されている。ま
た、表記格納バッファCBUFには変換表記候補を一時
的に格納する。
なお、キーボードKBには、アルファベットキひらがな
キー、カタカナキー等の文字記号キーおよび変換を指示
する変換キー等の各種のファンクションキーが一定の配
列で僅えられており、YOMIは読み入カキ−、C0N
Vは仮名漢字変換を指示するための変換キーである。
DISKは定形文書を記憶するためのメモリで、作成さ
れた文書を保管し、保管された文書はキーボードKBの
指示により必要なときに呼び出される。
CRはカーソルレジスタで、マイクロプロセッサCPU
がこのカーソルレジスタCRの内容を読み書きできるよ
うに構成されている。
CRTCはCRTコントローラで、ここてに蓄えられた
アドレスに対する表示装置CRT上の位置にカーソルを
表示する。
DBUFは表示用バッファメモリで、文書バッファエリ
アTBUFに蓄えられたアドレスに対する文書情報等の
パターンを蓄える。
なお、CRTコントローラCRTCは、カーソルレジス
タCR,表示用バッファメモリDBUFに蓄えられた内
容を表示装置CRTに表示する。
また、表示装置CRTは陰極線管等を用いた表示装置で
あり、この表示装置CRTにおけるドツト構成のパター
ンおよびカーソルの表示はCRTコントローラCRTC
により制御される。
CGはキャラクタジェネレータで、表示装置CRTに表
示する文字、記号のパターンを文字コードに対応して記
憶している。なお、PRTはプリンタである。
かかる各構成要素からなる文字処理装置においては、キ
ーボードKBからの各種の入力に応じて作動するもので
あって、キーボードKBからの入力が供給されると、ま
ずインタラブド信号がマイクロプロセッサCPUに送ら
れ、そのマイクロプロセッサCPUが読み出し専用固定
メモリROM内に記憶しである各種の制御信号を読み出
し、それらの制御信号に従って各種の制御が行われる。
なお、マイクロプロセッサCPUは、この発明の変換手
段、抑制手段を兼ねており、入力手段となるキーボード
KBから読み人力が開始されると、単語辞書メモリとな
る辞書メモリエリアDICを検索しながら読みを第1変
換表記候補に変換する。その際、変換された第1変換表
記候補と隣接文字連糸メモリとなる連糸辞書メモリエリ
アRENに記憶される文字連糸関係情報とを比較して、
変換した第1変換表記候補と隣接文字連糸メモリに記憶
される隣接文学連糸関係情報とが一致する場合に限って
、変換された第1変換表記候補の出力手段となる表記格
納バッファCBUFへの送出を抑制し、さらに次の読み
入力の変換を実行させる。
第2図は、第1図に示した文書データバッファTBUF
の構成を示す図であり、11は文書データで、1文字が
2バイトで構成され、未入力コードとしてOが格納され
る。
第3図は、第1図に示した読みバッファエリアYBUF
の構成を示す図であり、12は読みデータで、1文字が
2バイトで構成され、未人力コードとしてOが格納され
る。
第4図は、第1図に示した辞書メモリエリアDICの構
成を説明する図であり、YOMIは読みエリアで、例え
ば五十音順に読みが記憶されている。HYOUKIは表
記エリアで、読みエリアYOMIに対応する単語表記が
格納されている。HINSIは品詞エリアで、その単語
の品詞が格納されている。HINDは頻度エリアで、そ
の単語が持つ絶対頻度を「0」からrloOJ間での数
値で記憶している。
第5図は、第1図に示した連糸辞書メモリエリアREN
の構造を示す図であり、RENSIは連糸エリアで、隣
接して連続する仮名文字対、例えば「いか」、「いき」
等を記憶している。HINDはその単語の持つ絶対順度
を「0」から「100」までの数値で記憶している。
第6図は、第1図に示した表記格納バッファCBUFの
構成を示す図であり、21は格納表記数で、この格納表
記数21と候補表記コードブロック22から表記格納バ
ッファCBtJFが構成され、候補表記コードブロック
22は表示文字数23と2バイトの表記コード24から
構成されている。
次に第7図を参照しながらこの発明による文字処理動作
について説明する。
第7図はこの発明による文字処理手順の一例を示すフロ
ーチψ−トである。なお、(1)〜(6)は各ステップ
を示す。
まず、キーボードKBよりキーが押下され、割込みが発
生するのを待機する(1) キー人力がなされると、入力されたキーの判別を行い(
2)、入力されたキーが第1図に示したキーボードKB
の読み入カキ−YOMIの場合には、入力された文字を
読みバッファエリアYBUFに格納する入力処理を実行
しく3)  ステップ(6)以降に進み、入力されたキ
ーが第1図に示したキーボードKBの変換キーC0NV
である場合には、読みバッファエリアYBUFに格納さ
れた読みを辞書メモリエリアDICを参照して表記に変
換しく4)、ステップ(6)以降に進み、入力されたキ
ーが第1図に示したキーボードKBのキーのうち、上記
変換キーC0NV、読み入カキーYOMI以外のその他
のキーであった場合には、その他の文字処理装置に一般
のキー処理を実行する(5)。
次いで、ステップ(4)により変換された部分を表示す
る表示処理(文書中のデータを1文字読んではパターン
に展開し、表示用バッファメモリDBUFに出力する処
理)を実行しく6)、読み入力に対応する表記候補を表
示装置CRTに表示し、ステップ(1)に戻る。
第8図はこの発明による読み入力変換処理の一例を示す
詳細フローチャートである。なお、(1)〜(8)は各
ステップを示す。
第7図に示したステップ(2)のキー人力種別判定によ
り変換キーC0NVが押下されたとき、マイクロプロセ
ッサCPUが判定すると、先ず、読みバッファエリアY
BUFに格納された読みを辞書メモリエリアDICで検
索し、(1)、入力された読みが辞書メモリエリアDI
Cに存在するかどうか、すなわち見つかったかどうかを
判断しく2)、NOならばステップ(8)以降に進み、
YESならば文書バッファエリアTBυFに出力すべき
位置の直前文字を取得する前文字のGET処理を実行す
る(3) そして、ステップ(3)で得られた前文字とステップ(
1)にて検索された単語表記の先頭文字との対が第5図
に示した連糸辞書メモリエリアREHに存在するかどう
かの検索を開始する(4)。
次いで、検索された単語表記の先頭文字との対が第5図
に示した連糸辞書メモリエリアRENに存在する(見つ
かった)かどうかを判定しく5)NOならばステップ(
8)以降に進み、変換された表記を出力表記として文書
バッファエリアTBUFに出力する候補出力処理を実行
し、リターンする。
一方、ステップ(5)の判断で、YESの場合(読み誤
り易い表記が隣接していると判定した場合)は、ステッ
プ(2)で変換された表記候補の文書バッファエリアT
BUFへの出力を保留(抑制)し、他に候補がないかど
うかを検索するため、次の候補を検索しく7)  ステ
ップ(1)に戻る。
すなわち、ステップ(6)にて、読み誤り易い表記の保
留処理で、他に最適候補がなかった時にその候補を出力
表記とするために、−時的に保留にする処理を行う。そ
して、表記格納バッファCBUFの先頭に当該表記を格
納し、格納候補の値をセットする。
そして、ステップ(8)にて、表記格納バッファCBU
Fの表記格納数が「0」であったならば、すなわち変換
候補表記が1つもなかった場合には、読みバッファエリ
アYBUFに格納された読みを無変換表記として文書バ
ッファエリアTBUFへ出力する。
これにより、キーボードKBからの読み入力により言語
に特有の連糸関係が発生しても、即座に表記に変換され
ることが抑制され、後続する読みとの関係を考慮しなが
ら読み人力が表記に変換されるため、正確な読み人力表
記処理を実行できるようになる。
なお、上記実施例においては、連糸辞書メモリエリアR
ENに仮名文字連糸情報を記憶させて仮名読み入力に対
する表記変換抑制処理を実行する場合について説明した
が、英字、数字等の他の文字種についても固有の連糸辞
書を構築して記憶することにより、英字や数に等の他の
文字に対しても同様の効果を奏する。
(発明の効果) 以上説明したように、この発明は変換手段により変換さ
れた表記を出力する出力手段と、入力手段から連続して
入力される読み入力に隣接する文字対の文字連糸関係情
報を記憶する隣接文字連糸メモリと、この隣接文字連糸
メモリに記憶される文字連糸関係情報と変換手段により
順次変換される変換候補表記文字対とを比較して、変換
手段により変換された第1変換表記候補の出力手段への
送出を抑制する抑制手段とを設けたので、読み入力によ
り隣接する文字に特有の連糸関係が発生しても、常に入
力される前後関係が考慮されながら表記に変換されるた
め、誤読の少ない、例えば仮名漢字変換入力を実行でき
る。
従って、表記変換処理に際し一定の歯止めがかかった状
態で読み人力が文字に変換され、不必要な変換のための
、変換文字修正処理、例えば人力文字の削除および再入
力処理等を大幅に減らすことができ、読み入力に対応す
る区切りを正確に認識しながら読み入力表記変換処理を
実行できる優れた効果を奏する。
【図面の簡単な説明】
第1図はこの発明の一実施例を示す文字処理装置の一例
を説明する制御ブロック図、第2図は、第1図に示した
文書データバッファの構成を示す図、第3図は、第1図
に示した読みバッファエリアの構成を示す図、第4図は
、第1図に示した辞書メモリエリアの構成を説明する図
、第5図は、第1図に示した連糸辞書メモリエリアの構
造を示す図、第6図は、第1図に示した表記格納バッフ
ァの構成を示す図、第7図はこの発明による文字処理手
順の一例を示すフローチャート、第8図はこの発明によ
る読み入力変換処理の一例を示す詳細フローチャートで
ある。 図中、CPUはマイクロプロセッサ、RAMはランダム
アクセスメモリ、KBはキーボード、ROMは読み出し
専用固定メモリ、CRTは表示装置、DISKはメモリ
である。 第2図 第3図 第4図 第 図 第 図 第 図

Claims (1)

    【特許請求の範囲】
  1. 変換対象の読みを入力する入力手段と、読みと表記との
    対応をとって格納した単語辞書メモリと、前記入力手段
    により入力された読み列を前記単語辞書メモリを検索し
    て表記に変換する変換手段とを有する文字処理装置にお
    いて、この変換手段により変換された表記を出力する出
    力手段と、前記入力手段から連続して入力される読み入
    力に隣接する文字対の文字連糸関係情報を記憶する隣接
    文字連糸メモリと、この隣接文字連糸メモリに記憶され
    る文字連糸関係情報と前記変換手段により順次変換され
    る変換候補表記文字対とを比較して、前記変換手段によ
    り変換された第1変換表記候補の前記出力手段への送出
    を抑制する抑制手段とを具備したことを特徴とする文字
    処理装置。
JP63156909A 1988-06-27 1988-06-27 文字処理装置 Pending JPH027160A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63156909A JPH027160A (ja) 1988-06-27 1988-06-27 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63156909A JPH027160A (ja) 1988-06-27 1988-06-27 文字処理装置

Publications (1)

Publication Number Publication Date
JPH027160A true JPH027160A (ja) 1990-01-11

Family

ID=15638036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63156909A Pending JPH027160A (ja) 1988-06-27 1988-06-27 文字処理装置

Country Status (1)

Country Link
JP (1) JPH027160A (ja)

Similar Documents

Publication Publication Date Title
EP0370774A2 (en) Machine translation system
JP2943791B2 (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JPH027160A (ja) 文字処理装置
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP2833650B2 (ja) 文書処理装置
JP2634926B2 (ja) かな漢字変換装置
JP2862236B2 (ja) 文字処理装置
JPH0380363A (ja) 文書処理装置
JPH027161A (ja) 文字処理装置
JPH04191966A (ja) 文字処理装置
JPS63316162A (ja) 文書作成装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JP2761622B2 (ja) 文字変換装置
JPS5998236A (ja) 日本文入力装置
JPH0574867B2 (ja)
JPH06208560A (ja) 曖昧漢字変換装置
JPH03156663A (ja) 文書作成装置
JPH0567080A (ja) かな漢字変換装置
JPS63261459A (ja) 文書処理装置
JPH0991278A (ja) 文書作成装置
JPH0769909B2 (ja) 文書処理装置
JPS58155440A (ja) 日本語処理装置
JPH07200569A (ja) 文字処理装置
JPH04160668A (ja) 文字処理装置
JPS63255768A (ja) 文字処理装置