JPS60110075A - 文字処理方法 - Google Patents

文字処理方法

Info

Publication number
JPS60110075A
JPS60110075A JP58218125A JP21812583A JPS60110075A JP S60110075 A JPS60110075 A JP S60110075A JP 58218125 A JP58218125 A JP 58218125A JP 21812583 A JP21812583 A JP 21812583A JP S60110075 A JPS60110075 A JP S60110075A
Authority
JP
Japan
Prior art keywords
dictionary
prefix
word
conversion
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58218125A
Other languages
English (en)
Other versions
JPH069043B2 (ja
Inventor
Eiichiro Toshima
戸島 英一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP58218125A priority Critical patent/JPH069043B2/ja
Publication of JPS60110075A publication Critical patent/JPS60110075A/ja
Publication of JPH069043B2 publication Critical patent/JPH069043B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Document Processing Apparatus (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [技術分野] 本発明は漢字混じりの日本語文書を作成mlKする文字
処理装置に関するものである。
[従来技術] 漢字混じりの日本語文章を入力する文字処理装置におい
ては、漢字の読みであるかなを入力し、その読みに対応
する漢字を辞書を参照することによりめ、そのめた結果
を出力するという仮名漢字変換入力方式が広く採用され
ている。かかる方式においては、読みを漢字に変換する
ために読みと漢字との対応テーブルである辞書の存在が
不可欠である。この辞書は通常かなりの容量となるため
に、フロッピーディスク等の外部記憶上に展開されるこ
とか多い。また、日本語には単に名詞に「貴」、「上」
などの接頭語をつけて合成しただけの単語が多いために
、それらに対しては、語幹部だけを辞書に登録しておき
、仮名漢字変換を行う際に自動的に接頭語、接尾語をつ
けた合成語を生成し、あたかもその合成語が辞書中に登
録されているかのように変換処理を行うことか多い。
例えば、「きこうじょう」という読み列の漢字への変換
に際しては、辞書中に「機構」、「工場」などの単語が
存在するだけで、「貴工場」「機構上」などの合成語へ
の変換が可能である。
ここ1で、このような接頭語処理を行うためには、変換
に必要な辞書の内容(上述の例では「こうじょう」を含
む部分)を、外部記憶から主記憶上のバッファにロード
しなければならない。しかしながら、従来はこのロード
処理を漢字変換が指示された後に実行していた。そのた
めに、オペレータにとってみれば変換指示を入力してか
ら変換結果が表示されるまでの待ち時間が長く、その分
だけ入力速度が遅くなるという問題点があった。
[目的コ 本発明の目的は、上述の点に鑑みてなされたもので、漢
字変換指示があった後その変換結果を表示するまでの間
の処理時間を短縮可能となし、以て高速入力の可能な文
字処理装置を提供することにある。
[実施例] 以下に、図面を参照して本発明の詳細な説明する。
第1図は本発明の全体構成を示す。
図において、入力手段1から入力された漢字の読み列は
、変換指示手段2から変換開始が指示される以前におい
て接頭語辞書検索手段3にとり込まれる。接頭語辞書検
索手段3は接頭語辞書4中にある接頭語のうち、入力読
み列の先頭部と一致するものを検索し、検索された接頭
語を合成手段5へ送る。一方、入力読み列から上記の検
索された接頭語の読みを取り除いた残りの部分(部分読
み列)を辞書ロード手段6.単語辞書検索手段7へ送る
。辞書ロード手段6は接頭語辞書検索手段3から部分読
み列を受け取ると、単語辞書8中にその部分読み列の存
在する部分を単語辞書バッファ9にロードする。単語辞
書検索手段7は、単語辞書バッファ9に単語辞書8の一
部がロードされると、接頭語辞書検索手段3から受けと
った部分読み列を読みとしてもつ単語をめて、単語辞書
バッファ9を検索する。その検寝結菓を合成手段5へ送
る。合成手段5は変換指示手段2から変換開始を指示さ
れると、接頭語辞書検索手段3から接頭語、単語検索手
段7から語幹を受け取り、両者を合成して得られた合成
語を出力手段10に送り、この出力手段10によりその
合成語を出力する。
第2図は本発明文字処理装置の一実施例の構成を示す。
図示の構成において、CPUはマイクロプロセッサであ
り、文字処理のための演算、論理判断等を行い、アドレ
スバスAB、コントロールパスCB。
データバスDBを介して、それらのパスに接続された各
構成要素を制御する。アドレスバスABは、マイクロプ
ロセッサCPUの制御の対称とする構成要素を指示する
アドレス信号を転送する。コントロールパスCBはマイ
クロプロセッサCPUの制御の対称とする各構成要素の
コントロール信号を転送する。データ/ヘス[lBは各
構成要素相互間のデータの転送を行う。ROMは、読出
し専用の固定メモリであり、第8図〜第10図につき後
述するマイクロプロセッサCPUによる制御の手順等を
記憶させておく。RAMは、1ワード16ビツ°ト構成
の書込み可能のランダムアクセスメモリであって、各構
成要素からの各種データの一時記憶に用いる。
このメモリRAMは次に述べる各領域を有する。
PREDは接頭語処理用の接頭語辞書である。PRED
Nはその接頭語辞書の大きさを制御する変数である。D
INDは単語辞書のロードに必要な辞書索引である。D
INDNはその辞書索引の大きさを制御する変数である
。5UBBUFは単語辞書の一部をロードする単語辞書
バッファである。C0BUFはコマンドバッファであり
、キーボードKBよりのキーデータを一時的に記憶する
バッファC0BtlFの大きさを変aCODLにより管
理する。PRENOは処理の途中で一時的に用いられる
変数であり、入力に含まれる接頭語部分の読みの長さを
表す。5UBNOは接頭語処理に必要な部分辞書の番号
を表わす変数である。
次にKBは、キーボードであって、アルファベットキー
、平仮名キー等1片仮名キー痔の文字記号入カキ−1お
よび漢字部始め/終り指定キー等の文字処理に対する各
種機能を指示するための各種のファンクションキーを備
えている。DISKは外部メモリであり、定型文書を記
憶するためのメモリで作成された文書の保管を行い、保
管された文書はキーボードの指示により、必要な時呼び
出される。また、このメモリD ISKは仮名模字変換
用の単語辞書DICを有する。CRはカーソルレジスタ
である。CPUにより、このカーソルレジスタの内容が
読み書き可能である。後述するCRTコントローラCR
TCは、ここに蓄えられたアドレスに対応する表示装置
CRT上の位置にカーソルを表示する。DBUFはバ・
ンファメモリで、キーボードKBから入力された文書情
報等を蓄える。CRTCはCRTコントローラでアリ、
カーソルレジスタCRおよびバッファDBUFに蓄えら
れた内容を表示装置CRTに表示する役割を担う。また
、CRTは陰極線管等を用いた表示装置であり、その表
示装置CRTにおけるド・ント構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。さ
らに、CGはキャラクタジェネレータであって、表示装
置08丁に表示する文字、記号、カーソル等のキャラク
タ信号を発生させるものである。
かかる各構成要素からなる実施例は、キーホードKBか
らの各種の入力に応じて作動するものであって、キーボ
ードKBがらの入力が供給されると、まず、インタラブ
ド信号がマイクロプロセッサCPUに送られ、そのマイ
クロプロセッサcPUがメモリROM内に記憶しである
各種の制御手順を読出し、それらの制御手順に従って各
種の制御が行われる。
第3図は接頭語辞書PREDの構成を示す。図に示すよ
うに、読み部は6バイトからなり接頭語の読みを収容す
る。コードはJISC−13226コードを使用し、2
ハイドで1文字を収容する。漢字部は接頭語の漢字を収
容する。コードはJISC−8226コードを使用し、
2バイトで1漢字を収容する。なあ、接頭語辞書の大き
さを管理する変数PREDNは、最後の接頭語の収容さ
れているアドレスとなっている。
第4図はメモリDISK上に存在する単語辞書DIGと
辞書索引DINDとの対応関係を示す。単語辞書DIC
はその中に収容されいる単語の読みに従って一定長1か
らなるいくつかのブロックに分割されている。各ブロッ
クの大きさは1024バイトからなり、これらの各ブロ
ックを部分辞書DICBと呼ぶものとする。部分辞書に
含まれる単語の読みの範囲は定まっており、例えば部分
辞書DIC−Hの読みの範囲は、読み「あ」から「か」
で始まる読みの前までである。各部分辞書の先頭の読み
は辞書索引DINDにより管理される。その辞書索引D
INDの読み部は8バイトで構成され、コードはJ l
5G−6228コードを用いており、1文字2バイトで
読みが収容される。番号部には、その読みに対応する部
分辞書の番号が収容される。なお、辞書索引DIN[l
の大きさを管理する変数DINDNは、最後の読み(図
示の例では読み「わ」)の収容されているアドレスとな
っている。
第5図は上述した部分辞書D IC:Bの構成を示す。
図に示すように、1単語は24バイトで構成される。読
み部はIBバイトであり、各単語の読みが収容される。
コードはJIS C−6t228コードを用い、2バイ
トで1文字が構成される。漢字部は6バイトであり、J
ISC−8228コードを用い、2バイトで1文字が構
成される。
第8図はキーボードKBよりのキーデータの内容を一時
記憶するコマンドバッファC0BUFの構成を示す。図
に示すように、コマンドバッファC0BUFは128バ
イトで構成され、キーデータが1文字2バイトで格納さ
れる。平仮名1井仮名などの通常文字のデータはJTS
C−6226コードを用い、ファンクションキーのデー
タ等はJ+5C−6228の空いた部分を利用する符号
系を用いる。なお、/<ッファC0BtlFの大きさを
管理する変数C0DLは、((COBIIF上のキーデ
ータの数−1)X2)の値をとり、バッファC0BUF
上の最終データのアドレスを示すことになる。
第7図は、上述のように構成した本実施例において、操
作にしたがって変化する表示態様を示す。
第7図(A)は初期状態の表示画面Sを示す。ここで、
CMはカーソルであり、次回の文字入力位置を示す。M
Lはモニタラインであり、仮名漢字変換を行う弓こあた
り、変換すべき読みがなが入力されると、その読みがな
がモニタ表示される。
第7図(B)は漢字始めキー゛′(”′とそれに引続き
「き」を入力したときの状態を示す。この状態で接頭語
辞書の検索(第9図参照)が行われ、その結果、「貴」
が得られる。
第7図(C)は、引き続いて「こうじよう」と入力した
ときの状態を示す。この段階では既に、接頭語処理に必
要な辞書がメモリDISK上から単語辞書バッファ5t
lBBUFにロードされている。
第7図(D)はこの後漢字路りキー゛)“を入力した時
点の状態を示す。漢字路りキーは漢字に変換される読み
列の終りを指示するとともに、変換処理の開始を指示す
るキーである。この状態になって初めて変換処理が開始
される。
第7図(F)は変換処理が終了した時点の状態を示し、
変換された(接頭語)+(語幹)の合成語「貴工場」が
画面S上に出力される。
ここで、前述したように、従来の装置においては、変換
すべき読みが入力され終った後の第7図(D)に示す状
態になってから接頭語検索および単語辞書ロードを行っ
ていたので、読みがな入力が終了してから変換処理が終
了するまでに多くの時間を要した。しかるに、本例にお
いては、かかる弊害を除去することができる。
第8図は本実施例の動作を示す。
ステップ8−1において、キーボードKBよりキー人力
の有無を検出し、キー人力がなければキー人力があるま
で待機する。キー人力があれば、そのキーデータをコマ
ンド/ヘッファC0BUF上に追加し、以下のステップ
を実行する。
ステンプ8−2において、バッファC0BUF上の最初
のデータが漢字始めコード゛(パであるかどうかを判定
する。漢字始めコードであれば、ステップ8−4に進む
。漢字始めコード以外のコードであれば、ステップ8−
3に進み、挿入処理、削除処理1通常の文字入力処理等
の一般Q文学処理装置に共通のその他の処理を行い、ス
テップ8−1へ戻る。
ステップ8−4において、第9図にその詳細を示す接頭
語辞書検索処理を行う。検索の結果、得られた接頭語の
読みの長さの2倍の値が変数PRENOの値とされる。
しかるに、検索により見つからなかったときは、変数p
RENo = r OJに設定される。
ステップ8−5において、/ヘツファC0BUF上に接
頭語部以外の入力があるかどうかを調べるために、変数
PRENOと変数C0DL とを比較し、(PRENO
)≧(CODL)であれば接頭語部以外の入力か無いと
判断してステップ8−8にジャンプする。更に、このス
テップにおいては、接頭語が見つかったか否かを判断1
7、見つからなかった場合、すなわち(PRENO) 
= r OJの場合には、同じくステ・ンプ8−8ヘジ
ャンプする。
ステップ8−6において、第10図に云の詳細を示す部
分辞書番号の検索を行い、ロードすべき部分辞書の番号
をめる。処理の結果、求まったロードすべき部分辞書番
号が変数5UBNOの値として保持される。
ステップ8−7において請求められた番号の部分辞書D
ICBを単語辞書バッファ5UBBUFにロードする処
理を行う。
ステップ8−8において、パックァC0BUF内に漢字
路りコード゛)″が存在するか否かを判別し、もし存在
しなければステップ8−1へ戻る。存在すれば、ステッ
プ8−9に進み、バッファC0BtlF上の読みに対し
、接頭語と単語辞書パ・ソファ5UBBUF上の部分辞
書に含まれる語幹とを組合わせて合成語を作成し、それ
を画面上に出力する。更に、ステップ8−10において
、バッファC0BIJFをクリア、すなわち変数C0D
Lを「−1」 とし、ステップ8−1へ戻る。
第8図は上述したステップ8−4の接頭語辞書検索処理
を示す。
ステップ9−1において、レジスタSI、レジスタ0■
の値を初期化する。すなわち、レジスタs■の内容を「
2」とし、レジスタDIの内容を「0」とする。
ステップ9−2において、バッファC0BUFの内容C
0BUF [、SI]と接頭語辞書の内容PRENO[
DI]が同じコードか否かを比較し、等しければステッ
プ9−3に進む。等しくなければ、ステップ8−7にジ
ャンプする。
ステップ8−3において、PRED [DI+2]のコ
ードがスペースか否かを判別し、スペースならばステッ
プ8−10に進み、変数PRENOを「2」となし、リ
ターンする。スペースでなければステップ9−4へ進む
ステップ8−4において、C0BUF [ST+2]と
PRE [1[DI+21とが同じコードか否かを比較
し、同一コードならばステップ9−5へ進む。同一でな
ければ、ステップ9−7へ進む。
ステップ9−5において、PRED [DI+4]のコ
ードがスペースか否かを判別し、スペースならばステッ
プ9−9へ進む。ステップ8−8において、変数PRE
NOを「4」となしてリターンする。スペースでなけれ
ばステップ9−6へ進む。
不テ・ンプ8−6において、C0BUF [SI+4]
とPRE D[DI+4]とが同じコードか否かを比較
し、同一ならばステップ8−8へ進み、変数PRENO
を「8」となしてリターンする。同一でなければ、ステ
ップ8−7へ進み1次の接頭語を得るためにレジスタD
Iの内容に「8」を加え、ステップ9−11においてレ
ジスタDIの値が接頭語辞書の大きさく変数PREDN
)を超えたか否かを判別する。超えていなければ、ステ
ップ8−2に戻る。超えていれば、ステップ8−12へ
進み、該当する接M語がなかったわけであるから変数P
RENOに「0」を代入してリターンする。
第10図は前述したステップ8−Bの部分辞書検索処理
を示す。
ステップ10−1において、レジスタ!SI、IIIの
値を初期化する。すなわち、レジスタSIの内容を(P
RENO+2)とし、レジスタDIの内容を「8」とす
る。レジスタ、51はコーマンドバッフy C0BUF
上の文字へのポインタとして用い、レジスタDIは辞書
索引DIND上の文字へのポインタとして用いる。
ステップ10−2において、辞書索引DINDの第1文
字目とバッファC0BUFの第1文字目とを比較する。
辞書索引DINDの文字が大きければステップ10−5
へ進−み、小さければステップ10−8に進む。等しけ
ればステップ1O−3へ進ム。
ステップ10−3において辞書索引DINDの2文字目
とバッファC0BUF上の2文字目とを比較する。辞書
索引DINDの文字が大きければステ・シブ1o−5へ
進み、小さければステップ10−8へ進む。等しければ
ステップ1(1−4へ進む。
ステップ10−4において、辞書索引DINDの3文字
目とバッファC0BtlF上の3文字目とを比較する。
もし辞書索引[)INIIの文字が大きければステップ
10−5へ進み、小さいかもしくは等しければステップ
10−8へ進む。
ステップ10−5において、辞書索引DIND上の次の
読みをレジスタDIにより指示すべくレジスタDIの内
容に「8」を加える。
ステップ10−8において、レジスタDIの値が索引D
INDの大きさを超えたか否かを判定し、超えていなけ
ればステップ10−2 に戻る。超えていれば、ステッ
プ10−7へ進み、変数5UBBNOに部分辞書[11
08の最後の番号を与える。
ステ・ンプ10−8において、変数5UBBNOの値と
して、現在の索引の1つ前の索引の示す部分辞書DIC
Bの番号を代入する。
なお、上述した実施例においては、接頭語処理のみを行
う場合について説明したが、通常の1単語の変換処理、
あるいは接尾語つきの合成語を生成する接尾語処理等を
更に行うようにすれば、より自然な仮名漢字変換を行う
ことができる。
[効果] 以上説明したように、本発明によれば、接頭語つきの合
成語を生成する接頭語処理を行う場合において、変換指
示を与える前に辞書の先読みを行うようにしたので、単
語辞書がフロッピーディスク等の外部記憶上にある場合
においても、変換開始指示から変換結果が表示されるま
でに要する時間か少なくて済み、高速入力の可能な操作
性の良い文字処理装置を実現することができる。
【図面の簡単な説明】
第1図は本発明の全体構成を示す図。 第2図は本発明装置の一実施例を示すブロック図、 第3図は接頭語辞書の構成を示すズ匁〜久図、第4図は
単語辞書と辞書索引との対称関係を示す図、 第5図は部分辞書の構成を示す図、 第6図はコマンドバッファの構成を示す図、第7図(A
)〜(E)は操作に伴なう表示画面の変化を示す図、 第8図ないし第10図は第2図の装置の動作を示すフロ
ーチャートである。 PRED・・・接頭語辞書、 PREDN・・・変数、 DIND・・・辞書索引、 DINDN・・・変数、 5UBBUF・・・単語辞書バッファ、C0BtlF・
・・コマンドバッファ、GOOL・・・変数、 PRENO・・・変数。 5IIBNO・・・変数、 nIc・・・単語辞書、 DIC:B・・・部分辞書。 午 出 願 人 キャノン株式会社 PRED 1−6パ仕−÷−2バ什−一 第4図 IC 区 ば) 派 」」」 Σ Σ Σ

Claims (1)

  1. 【特許請求の範囲】 接頭語辞書および単語辞書を有し、入力読み仮名列を接
    頭Jh付きの合成語に変換する接頭語処理を実行する文
    字処理装置において、 入力読み仮名列の先頭部と同一の読みの接頭語を前記接
    頭語辞書内から検索する検ダ作業、および前記入力読み
    仮名列からその先頭部の読みを除いた読み仮名列と同一
    の読みの漢字を前記単語辞書内から検索するために当該
    単語辞書の一部を所定の記憶領域ヘロードするロード作
    業を、前記入力読み列の前記接頭語処理の開始が指示さ
    れるのに先立って行うようにしたことを特徴とする文字
    処理装置。 (以 下 余 白 )
JP58218125A 1983-11-19 1983-11-19 文字処理方法 Expired - Lifetime JPH069043B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58218125A JPH069043B2 (ja) 1983-11-19 1983-11-19 文字処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58218125A JPH069043B2 (ja) 1983-11-19 1983-11-19 文字処理方法

Publications (2)

Publication Number Publication Date
JPS60110075A true JPS60110075A (ja) 1985-06-15
JPH069043B2 JPH069043B2 (ja) 1994-02-02

Family

ID=16715021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58218125A Expired - Lifetime JPH069043B2 (ja) 1983-11-19 1983-11-19 文字処理方法

Country Status (1)

Country Link
JP (1) JPH069043B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0364878U (ja) * 1989-10-31 1991-06-25

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5592922A (en) * 1978-12-29 1980-07-14 Fuji Xerox Co Ltd Typewriter for japanese letter
JPS585829A (ja) * 1981-07-02 1983-01-13 Nec Corp 仮名漢字変換入力装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5592922A (en) * 1978-12-29 1980-07-14 Fuji Xerox Co Ltd Typewriter for japanese letter
JPS585829A (ja) * 1981-07-02 1983-01-13 Nec Corp 仮名漢字変換入力装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0364878U (ja) * 1989-10-31 1991-06-25

Also Published As

Publication number Publication date
JPH069043B2 (ja) 1994-02-02

Similar Documents

Publication Publication Date Title
CA1189976A (en) Displaying and correcting method for machine translation system
JPS60110075A (ja) 文字処理方法
JP2688651B2 (ja) 文字列変換装置
JPH0452500B2 (ja)
JP2592793B2 (ja) 文字処理方法
JP2688652B2 (ja) 文字列変換装置
JP2744241B2 (ja) 文字処理装置
JP2862236B2 (ja) 文字処理装置
JPS5951015B2 (ja) 文書作成装置
JPH0225544B2 (ja)
JPH0776964B2 (ja) 日本文入力方法
JPS5935227A (ja) カナ漢字変換方式
JPS60110074A (ja) 文字処理装置
JPS60251461A (ja) 仮名漢字変換装置
JPH02299060A (ja) 文字変換装置
JPH0452853A (ja) 文字処理装置
JPS63314672A (ja) 仮名漢字変換処理装置
JPS61196359A (ja) 文字処理装置
JPH01204174A (ja) 文字処理装置
JPH0131228B2 (ja)
JPH0488551A (ja) 文字処理装置
JPH0816908B2 (ja) 文字処理装置及び文字処理方法
JPS63221470A (ja) 文字処理装置
JPH05135010A (ja) 文字処理方法及び装置
JPS62198953A (ja) 文字処理装置