JPH069043B2 - 文字処理方法 - Google Patents

文字処理方法

Info

Publication number
JPH069043B2
JPH069043B2 JP58218125A JP21812583A JPH069043B2 JP H069043 B2 JPH069043 B2 JP H069043B2 JP 58218125 A JP58218125 A JP 58218125A JP 21812583 A JP21812583 A JP 21812583A JP H069043 B2 JPH069043 B2 JP H069043B2
Authority
JP
Japan
Prior art keywords
dictionary
prefix
word
reading
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58218125A
Other languages
English (en)
Other versions
JPS60110075A (ja
Inventor
英一郎 戸島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP58218125A priority Critical patent/JPH069043B2/ja
Publication of JPS60110075A publication Critical patent/JPS60110075A/ja
Publication of JPH069043B2 publication Critical patent/JPH069043B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [技術分野] 本発明は漢字混じりの日本語文書を作成編集する文字処
理方法に関するものである。
[従来技術] 漢字混じりの日本語文章を入力する文字処理装置におい
ては、漢字の読みであるかなを入力し、その読みに対応
する漢字を辞書を参照することにより求め、その求めた
結果を出力するという仮名漢字変換入力方式が広く採用
されている。かかる方式においては、読みを漢字に変換
するために読みと漢字との対応テーブルである辞書の存
在が不可欠である。この辞書は通常かなりの容量となる
ために、フロッピーディスク等の外部記憶上に展開され
ることが多い。また、日本語には単に名詞に「貴」,
「上」などの接頭語をつけて合成しただけの単語が多い
ために、それらに対しては、語幹部だけを辞書に登録し
ておき、仮名漢字変換を行う際に自動的に接頭語,接尾
語をつけた合成語を生成し、あたかもその合成語が辞書
中に登録されているかのように変換処理を行うことが多
い。例えば、「きこうじょう」という読み列の漢字への
変換に際しては、辞書中に「機構」,「工場」などの単
語が存在するだけで、「貴工場」「機構上」などの合成
語への変換が可能である。
ここで、このような接頭語処理を行うためには、変換に
必要な辞書の内容(上述の例では「こうじょう」を含む
部分)を、外部記憶から主記憶上のバッファにロードし
なければならない。しかしながら、従来はこのロード処
理を漢字変換が指示された後に実行していた。そのため
に、オペレータにとってみれば変換指示を入力してから
変換結果が表示されるまでの待ち時間が長く、その分だ
け入力速度が遅くなるという問題点があった。
[目的] 本発明の目的は、上述の点に鑑みてなされたもので、漢
字変換指示があった後その変換結果を表示するまでの間
の処理時間を短縮可能となし、以て高速入力の可能な文
字処理方法を提供することにある。
[実施例] 以下に、図面を参照して本発明を詳細に説明する。
第1図は本発明の全体の概略構成を示す。
図において、入力手段1から入力された漢字の読み列
は、変換指示手段2から変換開始が指示される以前にお
いて接頭語辞書検索手段3にとり込まれる。接頭語辞書
検索手段3は接頭語辞書4中にある接頭語のうち、入力
読み列の先頭部と一致するものを検索し、検索された接
頭語を合成手段5へ送る。一方、入力読み列から上記の
検索された接頭語の読みを取り除いた残りの部分(部分
読み列)を辞書ロード手段6,単語辞書検索手段7へ送
る。辞書ロード手段6は接頭語辞書検索手段3から部分
読み列を受け取ると、単語辞書8中にその部分読み列の
存在する部分を単語辞書バッファ9にロードする。単語
辞書検索手段7は、単語辞書バッファ9に単語辞書8の
一部がロードされると、接頭語辞書検索手段3から受け
とった部分読み列を読みとしてもつ単語を求めて、単語
辞書バッファ9を検索する。その検索結果を合成手段5
へ送る。合成手段5は変換指示手段2から変換開始を指
示されると、接頭語辞書検索手段3から接頭語、単語検
索手段7から語幹を受け取り、両者を合成して得られた
合成語を出力手段10に送り、この出力手段10によりその
合成語を出力する。
第2図は本発明の方法を適用した文字処理装置の一実施
例の構成を示す。
図示の構成において、CPUはマイクロプロセッサであ
り、文字処理のための演算,論理判断等を行い、アドレ
スバスAB、コントロールバスCB、データバスDBを介し
て、それらのバスに接続された各構成要素を制御する。
アドレスバスABは、マイクロプロセッサCPUの制御の対
称とする構成要素を指示するアドレス信号を転送する。
コントロールバスCBはマイクロプロセッサCPUの制御の
対称とする各構成要素のコントロール信号を転送する。
データバスDBは各構成要素相互間のデータの転送を行
う。ROMは、読出し専用の固定メモリであり、第8図〜第
10図につき後述するマイクロプロセッサCPUによる制御
の手順等を記憶させておく。RAMは、1ワード16ビット
構成の書込み可能のランダムアクセスメモリであって、
各構成要素からの各種データの一時記憶に用いる。
このメモリRAMは次に述べる各領域を有する。PREDは接
頭語処理用の接頭語辞書である。PREDNはその接頭語辞
書の大きさを制御する変数である。DINDは単語辞書のロ
ードに必要な辞書索引である。DINDNはその辞書索引の
大きさを制御する変数である。SUBBUFは単語辞書の一部
をロードする単語辞書バッファである。COBUFはコマン
ドバッファであり、キーボードKBよりのキーデータを一
時的に記憶するバッファCOBUFの大きさを変数CODLによ
り管理する。PRENOは処理の途中で一時的に用いられる
変数であり、入力に含まれる接頭語部分の読みの長さを
表す。SUBNOは接頭語処理に必要な部分辞書の番号を表
わす変数である。
次にKBは、キーボードであって、アルファベットキー,
平仮名キー等,片仮名キー等の文字記号入力キー、およ
び漢字部始め/終り指定キー等の文字処理に対する各種
機能を指示するための各種のファンクションキーを備え
ている。DISKは外部メモリであり、定型文書を記憶する
ためのメモリで作成された文書の保管を行い、保管され
た文書はキーボードの指示により、必要な時呼び出され
る。また、このメモリDISKは仮名漢字変換用の単語辞書
DICを有する。CRはカーソルレジスタである。CPUによ
り、このカーソルレジスタの内容が読み書き可能であ
る。後述するCRTコントローラCRTCは、ここに蓄えられ
たアドレスに対応する表示装置CRT上の位置にカーソル
を表示する。DBUFはバッファメモリで、キーボードKBか
ら入力された文書情報等を蓄える。CRTCはCRTコントロ
ーラであり、カーソルレジスタCRおよびバッファDBUFに
蓄えられた内容を表示装置CRTに表示する役割を担う。
また、CRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドット構成の表示パターンおよび
カーソルの表示をCRTコントローラで制御する。さら
に、CGはキャラクタジェネレータであって、表示装置CR
Tに表示する文字,記号,カーソル等のキャラクタ信号
を発生させるものである。
かかる各構成要素からなる実施例は、キーボードKBから
の各種の入力に応じて作動するものであって、キーボー
ドKBからの入力が供給されると、まず、インタラプト信
号がマイクロプロセッサCPUに送られ、そのマイクロプ
ロセッサCPUがメモリROM内に記憶してある各種の制御手
順を読出し、それらの制御手順に従って各種の制御が行
われる。
第3図は接頭語辞書PREDの構成を示す。図に示すよう
に、読み部は6バイトからなり接頭語の読みを収容す
る。コードはJISC-6226コードを使用し、2バイトで1文
字を収容する。漢字部は接頭語の漢字を収容する。コー
ドはJISC-6226コードを使用し、2バイトで1漢字を収容
する。なお、接頭語辞書の大きさを管理する変数PREDN
は、最後の接頭語の収容されているアドレスとなってい
る。
第4図はメモリDISK上に存在する単語辞書DICと辞書索引
DINDとの対応関係を示す。単語辞書DICはその中に収容
されている単語の読みに従って一定長からなるいくつか
のブロックに分割されている。各ブロックの大きさは10
24バイトからなり、これらの各ブロックを部分辞書DICB
と呼ぶものとする。部分辞書に含まれる単語の読みの範
囲は定まっており、例えば部分辞書DICBの読みの範囲
は、読み「あ」から「か」で始まる読みの前までであ
る。各部分辞書の先頭の読みは辞書索引DINDにより管理
される。その辞書索引DINDの読み部は6バイトで構成さ
れ、コードはJISC-6226コードを用いており、1文字2バ
イドで読みが収容される。番号部には、その読みに対応
する部分辞書の番号が収容される。なお、辞書索引DIND
の大きさを管理する変数DINDNは、最後の読み(図示の
例では読み「わ」)の収容されているアドレスとなって
いる。
第5図は上述した部分辞書DICBの構成を示す。図に示す
ように、1単語は24バイトで構成される。読み部は16バ
イトであり、各単語の読みが収容される。コードはJIS
C-6226コードを用い、2バイトで1文字が構成される。漢
字部は6バイトであり、JISC-6226コードを用い、2バイ
トで1文字が構成される。
第6図はキーボードKBよりのキーデータの内容を一時記
憶するコマンドバッファCOBUFの構成を示す。図に示す
ように、コマンドバッファCOBUFは128バイトで構成さ
れ、キーデータが1文字2バイトで格納される。平仮名,
片仮名などの通常文字のデータはJISC-6226コードを用
い、ファンクションキーのデータ等はJISC-6226の空い
た部分を利用する符号系を用いる。なお、バッファCOBU
Fの大きさを管理する変数CODLは、{(COBUF上のキーデ
ータの数−1)×2}の値をとり、バッファCOBUF上の
最終データのアドレスを示すことになる。
第7図は、上述のように構成した本実施例において、操
作にしたがって変化する表示態様を示す。
第7図(A)は初期状態の表示画面Sを示す。ここで、CMは
カーソルであり、次回の文字入力位置を示す。MLはモニ
タラインであり、仮名漢字変換を行うにあたり、変換す
べき読みがなが入力されると、その読みがながモニタ表
示される。
第7図(B)は漢字始めキー“{”とそれい引続き「き」を
入力したときの状態を示す。この状態で接頭語辞書の検
索(第9図参照)が行われ、その結果、「貴」が得られ
る。
第7図(C)は、引き続いて「こうじょう」と入力したとき
の状態を示す。この段階では既に、接頭語処理に必要な
辞書がメモリDISK上から単語辞書バッファSUBBUFにロー
ドされている。
第7図(D)はこの後漢字終りキー“}”を入力した時点の
状態を示す。漢字終りキーは漢字に変換される読み列の
終りを指示するとともに、変換処理の開始を指示するキ
ーである。この状態になって初めて変換処理が開始され
る。
第7図(F)は変換処理が終了した時点の状態を示し、変換
された(接頭語)+(語幹)の合成語「貴工場」が画面
S上に出力される。
ここで、前述したように、従来の装置においては、変換
すべき読みが入力され終った後の第7図(D)に示す状態に
なってから接頭語検索および単語辞書ロードを行ってい
たので、読みがな入力が終了してから変換処理が終了す
るまでに多くの時間を要した。しかるに、本例において
は、かかる弊害を除去することができる。
第8図は本実施例の動作を示す。
ステップ8-1において、キーボードKBよりキー入力の有
無を検出し、キー入力がなければキー入力があるまで待
機する。キー入力があれば、そのキーデータをコマンド
バッファCOBUF上に追加し、以下のステップを実行す
る。
ステップ8-2において、バッファCOBUF上の最初のデータ
が漢字始めコード“{”であるかどうかを判定する。漢
字始めコードであれば、ステップ8-4に進む。漢字始め
コード以外のコードであれば、ステップ8-3に進み、挿
入処理,削除処理,通常の文字入力処理等の一般の文字
処理装置に共通のその他の処理を行い、ステップ8-1へ
戻る。
ステップ8-4において、第9図にその詳細を示す接頭語辞
書検索処理を行う。検索の結果、得られた接頭語の読み
の長さの2倍の値が変数PRENOの値とされる。しかるに、
検索により見つからなかったときは、変数PRENO=「0」
に設定される。
ステップ8-5において、バッファCOBUF上に接頭語部以外
の入力があるかどうかを調べるために、変数PRENOと変
数CODLとを比較し、(PRENO)≧(CODL)であれば接頭語部
以外の入力が無いと判断してステップ8-8にジャップする。更
に、このステップにおいては、接頭語が見つかったか否かを判
断し、見つからなかった場合、すなわち(PRENO)=「0」の
場合には、同じくステップ8-8へジャンプする。
ステップ8-6において、第10図にその詳細を示す部分辞
書番号の検索を行い、ロードすべき部分辞書の番号を求
める。処理の結果、求まったロードすべき部分辞書番号
が変数SUBNOの値として保持される。
ステップ8-7において、求められた番号の部分辞書DICB
を単語辞書バッファSUBBUFにロードする処理を行う。
ステップ8-8において、バッファCOBUF内に漢字終りコー
ド“}”が存在するか否かを判別し、もし存在しなけれ
ばステップ8-1へ戻る。存在すれば、ステップ8-9に進
み、バッファCOBUF上の読みに対し、接頭語と単語辞書
バッファSUBBUF上の部分辞書に含まれる語幹とを組合わ
せて合成語を作成し、それを画面上に出力する。更に、
ステップ8-10において、バッファCOBUFをクリア、すな
わち変数CODLを「-1」とし、ステップ8-1へ戻る。
第9図は上述したステップ8-4の接頭語辞書検索処理を示
す。
ステップ9-1において、レジスタSI,レジスタDIの値を
初期化する。すなわち、レジスタSIの内容を「2」と
し、レジスタDIの内容を「0」とする。
ステップ9-2において、バッファCOBUFの内容COBUF [SI]
と接頭語辞書の内容PRENO[DI]が同じコードか否かを比
較し、等しなければステップ9-3に進む。等しくなけれ
ば、ステップ9-7にジャンプする。
ステップ9-3において、PRED [DI+2]のコードがスペース
か否かを判別し、スペースならばステップ9-10に進み、
変数PRENOを「2」となし、リターンする。スペースでな
ければステップ9-4へ進む。
ステップ9-4において、COBUF [SI+2]とPRED[DI+2]とが
同じコードか否かを比較し、同一コードならばステップ
9-5へ進む。同一でなければ、ステップ9-7へ進む。
ステップ9-5において、PRED[DI+4]のコードがスペース
か否かを判断し、スペースならばステップ9-6へ進む。
ステツプ9-9において、変数PRENOを「4」となしてリタ
ーンする。スペースでなければステップ9-6へ進む。
ステップ9-6において、COBUF [SI+4]とPRED[DI+4]とが
同じコードか否かを比較し、同一ならばステップ9-8へ
進み、変数PRENOを「6」となしてリターンする。同一で
なければ、ステップ9-7へ進み、次の接頭語を得るため
にレジスタDIの内容に「8」を加え、ステップ9-11にお
いてレジスタDIの値が接頭語辞書の大きさ(変数PRED
N)を超えたか否かを判別する。超えていなければ、ス
テップ9-2に戻る。超えていれば、ステップ9-12へ進
み、該当する接頭語がなかったわけであるから変数PREN
Oに「0」を代入してリターンする。
第10図は前述したステップ8-6の部分辞書検索処理を示
す。
ステップ10-1において、レジスタSI,DIの値を初期化す
る。すなわち、レジスタSIの内容を(PRENO+2)とし、レ
ジスタDIの内容を「8」とする。レジスタSIはコマンド
バッファCOBUF上の文字へのポインタとして用い、レジ
スタDIは辞書索引DIND上の文字へのポインタとして用い
る。
ステップ10-2において、辞書索引DINDの第1文字目とバ
ッファCOBUFの第1文字目とを比較する。辞書索引DINDの
文字が大きければステップ10-5へ進み、小さければステ
ップ10-8に進む。等しければステップ10-3へ進む。
ステップ10-3において辞書索引DINDの2文字目とバッフ
アCOBUF上の2文字目とを比較する。辞書索引DINDの文字
が大きければステップ10-5へ進み、小さければステップ
10-8へ進む。等しければステップ10-4へ進む。
ステップ10-4において、辞書索引DINDの3文字目とバッ
フアCOBUF上の3文字目とを比較する。もし辞書索引DIND
の文字が大きければステップ10-5へ進み、小さいかもし
くは等しければステップ10-8へ進む。
ステップ10-5において、辞書索引DIND上の次の読みをレ
ジスタDIにより指示すべくレジスタDIの内容に「8」を
加える。
ステップ10-6において、レジスタDIの値が索引DINDの大
きさを超えたか否かを判定し、超えていなければステッ
プ10-2に戻る。超えていれば、ステップ10-7へ進み、変
数SUBBNOに部分辞書DICBの最後の番号を与える。
ステップ10-8において、変数SUBBNOの値として、現在の
索引の1つ前の索引の示す部分辞書DICBの番号を代入す
る。
なお、上述した実施例においては、接頭語処理のみを行
う場合について説明したが、通常の1単語の変換処理,
あるいは接尾語つきの合成語を生成する接尾語処理等を
更に行うようにすれば、より自然な仮名漢字変換を行う
ことができる。
[効果] 以上説明したように、本発明によれば、仮名文字列を接
頭語に含む表記に変換する際に、変換指示に先立って、
ディスク上の単語辞書より接頭語に後続する部分の変換
に必要な辞書ブロックをバッファメモリにロードし、接
頭語に後続する仮名文字列を読みとする単語は、このバ
ッファメモリより検索するようにしたので、変換の指示
から変換結果の表示までに要する時間が短縮されるとい
う効果がある。
これにより、本発明によれば、高速入力可能な操作性の
良い文字処理装置を提供することができる。
【図面の簡単な説明】
第1図は本発明の全体の概略構成を示す図、 第2図は本発明の方法を適用した装置の一実施例を示す
ブロック図、 第3図は接頭語辞書の構成を示す図、 第4図は単語辞書と辞書索引との対称関係を示す図、 第5図は部分辞書の構成を示す図、 第6図はコマンドバッファの構成を示す図、 第7図(A)〜(E)は操作に伴なう表示画面の変化を示す
図、 第8図ないし第10図は第2図の装置の動作を示すフローチ
ャートである。 PRED…接頭語辞書、 PREDN…変数、 DIND…辞書索引、 DINDN…変数、 SUBBUF…単語辞書バッファ、 COBUF…コマンドバッファ、 CODL…変数、 PRENO…変数、 SUBNO…変数、 DIC…単語辞書、 DICB…部分辞書。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】接頭語の読み仮名と表記とを対応付けて記
    憶して接頭語辞書と、単語の読み仮名と表記とを対応付
    けて記憶したディスク上の単語辞書とを具えた文字処理
    装置において、入力された仮名文字列を、変換指示に応
    答して、前記接頭語辞書と前記単語辞書とを参照して漢
    字文字列に変換して出力する文字処理方法であって、 前記変換指示に先立って、入力された仮名文字列の先頭
    部と読みが一致する接頭語を前記接頭語辞書より検索
    し、 一致する接頭語が検索された場合には、前記入力された
    仮名文字列より当該接頭語の読みに対応する仮名文字列
    を除いた後続仮名文字列を読みとする単語を含む前記単
    語辞書のブロックを、前記変換指示に先立って前記ディ
    スクよりバッファメモリにロードし、 前記後続仮名文字列を読みとする単語を、前記バッファ
    メモリにロードされた前記ブロックより検索することを
    特徴とする文字処理方法。
JP58218125A 1983-11-19 1983-11-19 文字処理方法 Expired - Lifetime JPH069043B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58218125A JPH069043B2 (ja) 1983-11-19 1983-11-19 文字処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58218125A JPH069043B2 (ja) 1983-11-19 1983-11-19 文字処理方法

Publications (2)

Publication Number Publication Date
JPS60110075A JPS60110075A (ja) 1985-06-15
JPH069043B2 true JPH069043B2 (ja) 1994-02-02

Family

ID=16715021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58218125A Expired - Lifetime JPH069043B2 (ja) 1983-11-19 1983-11-19 文字処理方法

Country Status (1)

Country Link
JP (1) JPH069043B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0364878U (ja) * 1989-10-31 1991-06-25

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5592922A (en) * 1978-12-29 1980-07-14 Fuji Xerox Co Ltd Typewriter for japanese letter
JPS585829A (ja) * 1981-07-02 1983-01-13 Nec Corp 仮名漢字変換入力装置

Also Published As

Publication number Publication date
JPS60110075A (ja) 1985-06-15

Similar Documents

Publication Publication Date Title
CA1189976A (en) Displaying and correcting method for machine translation system
JPH069043B2 (ja) 文字処理方法
JPS61235977A (ja) カナ漢字変換装置
JPH0452500B2 (ja)
JPH0547858B2 (ja)
JPS62237495A (ja) 文字列処理装置
JPH0452859A (ja) 文字処理装置
JPS6246029B2 (ja)
JP2688651B2 (ja) 文字列変換装置
JPS62257570A (ja) 仮名漢字変換装置
JP2713942B2 (ja) かな漢字変換装置
JP2688652B2 (ja) 文字列変換装置
JP2786260B2 (ja) かな漢字変換装置
JP2744241B2 (ja) 文字処理装置
JP2629040B2 (ja) 日本語処理システム
JP3809238B2 (ja) 文書処理方法及びその装置
JPS5951015B2 (ja) 文書作成装置
JPH0225544B2 (ja)
JP3236038B2 (ja) 文字処理装置及びその方法
JPH025175A (ja) 文字処理装置
JPH0193857A (ja) 文書印字装置
JPS62119665A (ja) ワ−ドプロセツサ
JPH0666065B2 (ja) 振仮名付加機能付き文書処理装置
JPH06332666A (ja) データの圧縮方法
JPH0447446A (ja) 文字処理装置