JPH01106162A - 文書編集装置 - Google Patents

文書編集装置

Info

Publication number
JPH01106162A
JPH01106162A JP62262509A JP26250987A JPH01106162A JP H01106162 A JPH01106162 A JP H01106162A JP 62262509 A JP62262509 A JP 62262509A JP 26250987 A JP26250987 A JP 26250987A JP H01106162 A JPH01106162 A JP H01106162A
Authority
JP
Japan
Prior art keywords
character string
connection
converted
conversion
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62262509A
Other languages
English (en)
Other versions
JP3137329B2 (ja
Inventor
Ikuaki Kobayashi
小林 生明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP62262509A priority Critical patent/JP3137329B2/ja
Publication of JPH01106162A publication Critical patent/JPH01106162A/ja
Application granted granted Critical
Publication of JP3137329B2 publication Critical patent/JP3137329B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、例え;よ、入力されたかな文字列等の未変換
の文字列を漢字に変換する機能を備えた文書編集装置に
関する。
[従来の技術] 従来より日本語の文書編集装置では、文書を入力する作
業者の負担を軽減するために、入力されたかな文字列を
複数の文節からなる漢字かな混じり文に変換(以下、単
に複文節変換という)を行うものがある。この複文節変
換では、例えば、 「今日は雲ばかりの日です。」を入
力する際に、 「きゅうは」入力→変換→「今日は」確
定→「くもばかりの」入力→「雲ばかりの」確定→「ひ
てず。
」入力→「日です。」確定のように、文節単位で変換・
確定を行う必要はなく、「きょうはくもばかりのひてず
。」入力→変換→「今日は雲は°かりの日です。」確定
のように1回の変換操作で入力することができる。これ
は、文書編集装置が入力された文字列を、目動的に分割
・変換し、連続する変換文字列間の接続を辞書に格納さ
れる接続情報によって判定するからである。
この前記従来の文書編集装置の複文節変換では、入力さ
れた文字列に対して、所謂最長一致法を用い文字列を複
数の変換文字列にする。この最長−致法とは、入力され
た文字列と対応する変換文字列について辞書中を検索し
、対応する変換文字列が無いときには、入力文字列の区
切り位置を末尾から一字づつ先頭側にずらし、検索する
文字列を短くしながら対応する変換文字列を検索してい
く方法であり、変換文字列が発見された場合には、変換
された文字列より後方にある文字列に対し最長一致法を
更に適用することを順次行って、複数の変換文字列とす
る。そして、この複数の変換文字列間が接続できるか否
かの判定を、変換文字列の品詞等の接続情報に基づいて
行う。この接続判定は、文書編集装置内に格納された「
前の変換文字列が名詞であり、それに続く変換文字列が
動詞であるとこれらの変換文字列は接続できない」等の
接続判定条件が満たされるか否かによってなされる。
そして、接続ができないと判定されたときには、他の変
換文字列を辞書から検索したり、あるいは文字列の分割
位置を変更して再度前記処理を繰り返し行って、入力文
字列を漢字かな混じり文に変換する。
文書編集装置が内蔵している辞書(変換用データ)によ
っても異なるが、一つの例として、第7図に示す入力文
字列「きょうはくもばかりのひてず。」に前記複文節変
換を適用すると、先ず、変換キーにより文字列の変換を
指示すると、入力された文字列は、ステップ1のように
変換されるが、「も」と「ばかり」とは品詞の関係から
接続ができないので、ステ°ツブ2のように次の候補に
変換される。この場合も、「も」と「ばかり」とは品詞
の関係から接続ができないので、ステ・ンブ3のように
文字列の区切り直しを行い変換される。この場合、全て
の単語間の接続が正しいので、この変換文字列が変換候
補として表示される。次の変換候補の検索を指令する次
候補キーにより更に変換を指示すると、ステップ4或は
ステップ5のように変換されるが、これらの場合も、 
「も」と「ばかり」とは品詞の関係から接続ができない
ので、変換不能のメツセージが作業者に送られる。
[発明が解決しようとする間J点] 前述のように、従来の文書編集装置は、入力文字列に対
する複文節変換が成功するまで最長一致法に基づいた文
字列の区切り直しを行いながら、考えられる全ての絹合
せについて各変換文字列の接続情報に基づいた接続判定
を行うので、はぼ正しい複文節変換を可能にしている。
しかし、全ての矧合せについて各変換文字列の接続情報
に基づいた接続判定等を行うためには多くの処理を必要
とするとともに、無駄な判定も数多く含まれているため
、かな漢字変換処理に時間がかかる。
そのため、より高速な複文節変換機能を備えた文書編集
装置が望まれている。
[問題点を解決するための手段] 前記問題点を解決するためになされた本発明の文書編集
装置は、第1図に例示するように、未変換の文字列の入
力手段M1と、変換文字列および変換文字列の接続情報
を記憶する辞書部M2と、入力手段M1で入力された未
変換の文字列を複数の連続する文字列に分割する文字列
分別手段M3と、文字列分別手段M3で分割された未変
換の各文字列に対応する変換文字列を辞書部から検索し
抽出する検索手段M4と、検索手段M4で検索された連
続する変換文字列間の接続の正否を接続情報に基づいて
判定する接続判定手段M5とを備え、接続判定手段M5
にて、連続する変換文字列間の接続が正しくないと判定
されたときには検索手段M4にて該当する文字列に対応
する他の変換文字列を検索抽出すると共に、検索手段M
4にて、分割された未変換の文字列に対応する変換文字
列を発見できないときには文字列分別手段M3により入
力手段M1で入力された未変換の文字列を分割し直す文
書編集装置において、接続判定手段M5で連続する変換
文字列間の接続が正しくない9判定されたときに、接続
が正しくないと判定された未変換の文字列の分割位置お
よび分割位置の直前の変換文字列の接続情報を記憶する
接続記憶手段M6を設けると共に、検索手段M4にて検
索抽出された変換文字列が、接続記憶手段M6に記憶さ
れる分割位置の直前の文字列に対応しており、かつ接続
記憶手段M6に記憶される接続情報を有する場合には、
検索手段M4にて該当する文字列に対応する他の変換文
字列を検索抽出することを特徴とする文N編集装置にあ
る。
[作用] 本発明では、ある分割位置以降の入力文字列を種々に変
化させても接続できない場合の、分割位装置とその分割
装置の直前の変換文字列の接続情報とを接続記憶手段M
6に記憶している。
即ち、分割位置の直前の文字列の接続情報が前記接続情
報記憶手段M6に記憶されるものであるときには、その
分割位置以降の入力文字列を種々に変化させても接続で
きないことが分かる。
従って、本発明では、前記分割位置以降の文字列につい
ては処理を行わない。
そのため、かな漢字変換の処理量が従来より大幅に減り
、より高速なかな漢字変換処理が行える。
[実施例] 以下本発明の一実施例を図面に基づいて説明する。第2
図は本発明の適用された日本語ワードプロセッサの斜視
図、第3図はその構成を示すブロック図である・ 本実施例の日本語ワードプロセッサ10は、文字や編集
指示等を入力するキーボード20、文字や図形を表示す
る表示装置(液晶デイスプレィ)30、文字や図形を印
字するプリンタ40及びこれらに接続され文書の入力・
変換・編集・印刷を制御する83!能を備えた電子制御
装置50等から構成されている。
キーボード20には、第2図に示すように、文字を入力
する文字キー60、入力されたかな文字列を漢字に変換
する変換キー70、次の変換候補の検索を指令する次候
補キー75、変換時の変換文字列の選択等、各種動作の
実行を行う改行実行キー80、文書中の文字入力位置等
を変えるカーソルキー90等が設けられており、使用者
はこれらのキーを操作することによって、文書の入力、
変換、編集、印刷等の指示を前記電子制御装置50に与
える。
電子制′Ua装置50は、第3図に示すように、周矢口
の CPU  1 00、   ROMll01  R
AM120等を中心に算術論理演算回路として構成され
、前記したキーボード20等の外部装置の入出力信号を
CPU100の処理可能な信号に変換する人出力ボート
130等を備えている。
前記ROMll0には、後述する変換処理のプログラム
が格納される領域、この変換処理で使用される変換文字
列が格納される領域110a、該変換文字列の品詞等の
接続情報が格納される領域110b等が設けられている
又、前記RAM120には、入力された文字列が一時格
納される変換用バッファ120a、作成された文書が格
納される領域120b、接続が正しくなかったときの分
割位置、接続情報からなる後述する検査表のデータを格
納する接続記憶領域1200等が設けられている。
本実施例のかな漢字変換処理の基本的な流れを第4図の
流れ図を用いて説明する。
処理が開始されると、ステップ5100(以下単に51
00と記す。以下他のステップについても同様)にて、
5110で変換キー70が押されたことが検出されるま
で、キーボード20より文字入力を行う。変換キー70
が押されたことが8110で検出されると、後述する5
120の複文節変換処理を行う。変換処理が終了すると
、5130にて変換が成功したか否かを判定し、変換が
成功した場合には5140にて変換された候補文字列を
表示装置30に表示し、本処理を終了する。
一方、変換に失敗した場合には5150にて変換不能の
メツセージを表示する等のエラー処理を行い、本処理を
終了する。
前記複文節変換処理について、第5図の流れ図及び第6
〜7図の説明図を用いて説明する。
第7図に示す文字列「きようはくもはかりのひてず。」
が入力され、変換キー70により本処理が開始されると
、先ず、5200にて入力された文字列から予め定めら
れた条件にしたがって検索文字列を切り出す。、本実施
例では、最初し乙切り出す文字列の開始位置aとして1
が、切り出す文字列の長さbとしてIOが設定されてい
る。従って、検索文字列は「きようはくもはかりの」と
なる。
次いで5210にて検索文字列に対応する変換文字列を
辞書から検索し、5220にて変換文字列が発見された
と判定されると後述する5230以降の処理で接続判定
等を行い、一方、変換文字列が発見されないときには5
240に移行して文字列の切り直しを行う。この切り直
しでは、前記すにb−1を代入し、検索文字列は「きよ
うはくもはかり」となる。そして、5250にて文字列
の切り直しが可能かどうか判定し、可能であれは521
0に戻って再度辞書検索を行い、一方切り直しが不可能
であれは後述の8310以降の処理で検査表への書き込
み等を行う。前記例では、切り直しが可能であるので、
5210で対応する文字列が発見されるまで、5210
. 5220,5240.5250の処理ここよって、
検索文字列を短くしていく。
5220で検索文字列に対応する変換文字列が発見され
る(前記例では、「脅迫」)と、5230に移行して直
前の変換文字列との間で文法的に接続が可能であるか否
かを調べる。この判定は、例えは、「前の語の品詞が名
詞であり、かつ後の詔の品詞が動詞であるときには接続
できない」等の条件を予め図示しない行列データとして
記憶しておき、この行列データを検索することによって
行う。そして、8260にて接続が可能であると判定さ
れると、5270に移行し、一方接続が正しくないと判
定されたときには、5210に戻って辞書から他の変換
文字列を検索し直す。前記例のように、検索文字列が入
力文字列の最初であるときには、8260では接続が可
であるとして処理は5270に移行する。
5270では、前記検索された変換文字列の接続情報と
、同じ接続情報が検査表の前記検索された変換文字列の
最後尾の位置に記憶されていないか調べる。即ち、第6
図に示す検査表の分割位置a+b−1に変換文字列の接
続情報が記憶されていないか調べる。尚、第6図では、
接続情報を5種類しか記載していないが、実際には16
0〜200種程度の接続情報を用いている。又、第6図
の検査表では、記憶されているところに「1」を書き込
み、一方記憶されていないところには「0」が書き込ま
れている。前記例では、「脅迫」の品詞は名詞であり、
分割位置は1+5−1=5であるので、検査表の分割位
置「5」、接続情報「名詞」、を参照することにより、
この変換文字列の接続情報は記憶されていないことが分
かる。そして、5280にて接続情報が記憶されており
、この変換文字列の後方には文字列を接読することがで
きないこと分かった場合には、5210に戻って辞書か
ら他の変換文字列を検索し直す。一方、この変換文字列
の接続情報が検査表に記憶されていない場合には529
0にて、変換候補となる前記検索された変換文字列及び
その分割位置a、  bを変換用バッファ120aに格
納する。前記例では、変換候補「脅迫J、a=1.b=
5を変換用バッファ120aに格納する。
そして、5300にて前記変換候補が入力文字列の末尾
であるか否かを判定し、末尾であれば本処理を終了し、
末尾で無ければ5200に戻り次の文字列について変換
処理を行う。この末尾の判定は、前記a+b−1が入力
文字列の長さと一致するか否かを判定すればよい。
第6図に示す例では、変換候補は入力文字列の末尾では
ないので8200に戻り、次の検索文字列を設定する。
この設定は、a+a+b、b+10とすれはよく、前記
例では、「もばかりのひてず。」が検索文字列となる。
そして、前記と同様にして処理を行って「も」を変換候
補として変換用バッファ120aに格納する。
その次に検索された変換文字列「はかり」の品詞は副助
詞であり、又、変換文字列「も」の品詞は係助詞なので
、 「も」と「はかり」とは接続できず、又、 「はか
り」に対応する他の変換文字列あるいは「はか」 「は
」に対応する変換文字列の中にも「も」に接続可能な文
字列はない。従って、5250にて切り直しができない
と判定されて、処理は5310に移行する。5310で
は、既に変換候補になった部分も含めて再度変換し直す
ために、直前に検索された変換文字列、この場合「も」
に関する区切り位置a (=6)、  b (=1)を
取出す。そして、5320で、第6図の検査表の531
0にて呼び出された変換文字列の末尾に該当する分割位
置a+b−1、接続情報位置に「1」を書き込む。前記
例では、第6図の検査表の分割位置が「6」で接続情報
が「係助詞」のところに「1」を書き込む。
以上の処理によって、第7図のステップ1が終了し、次
いで第7図ステップ2の処理がなされる。
このステップ2では係助詞「もJを変換候補としたとき
に、検査衷から分割位置「6」の直前の文2字列に対応
して検索抽出された変換文字列が係助詞であるときは後
方に接続できる変換文字列が無いことが分かる(第5図
8270.3280)ので、第7図でステップ2の0で
示される以降の処理を行わずに、第7図ステップ3の処
理を行う。
このステップ3の場合には、変換された文字列間が何れ
も正しく接続されるので、変換候補としてステップ3の
変換文字列が表示装置に表示される。
そして、更に次候補キー75により、次の1喚補に変換
させると、第7図ステ・ンブ4、ステップ5のように処
理を行うが、何れも分割位置「6」直前の係助詞=+「
も」を変換(喚補としたときに、検査表から「も」の後
方に接続できる変換文字列が無いことが分かる(第5図
8270.8280)ので、第7図でステップ4及びス
テップ5の0で示される以降の処理を行わず入力文字列
を変換できない状態で本処理を終了する。尚、前記検査
衷は、新たな入力文字列が入力される直前にリセットさ
れる。
以上の如く、本実施例の文書編集装置では、検査表を用
いることによって、より少ない処理量で複文節変換が可
能となる。例えは、第7図の例では、従来の文書編集装
置では全ての0内の文字列まで変換文字列とし変換文字
列間の接続判定処理を行うのに対し、本実施例ではステ
ップ1で分割位置「6」の直前の文字列に対応する変換
文字列が係助詞の場合それ以降の変換が不可能であるこ
とを記憶しているので、ステップ2、ステップ4及びス
テップ5の0内の文字列については、変換文字列の検索
、接続の判定を行わない。従って、本実施例の文書編集
装置は複文節変換の処理速度が速く、より効率的な日本
語の文書作成が行える。
[発明の効果] 本発明の文書編集装置は、従来の構成に加えて、接続判
定手段M5および接続情報記憶手段M6を備える。そし
て、分割位置の直前の文字列の接続情報が接続情報記憶
手段M6に記憶されるものであるときにはそれ以降の変
換処理を行わないので、かな漢字変換の処理量が従来よ
り大幅に減り、より高速なかな漢字変換処理が行え、効
率的な日本語の入力作業が行える。
【図面の簡単な説明】
第1図は本発明の構成の一例を示す構成図、第2図は本
発明の一実施例による日本語ワードプロセッサの斜視図
、第3図はその構成図、第4図及び第5図はそのかな漢
字変換を処理する流れ図、第6図はそれに使用する検査
表の説明図、第7図は従来及び本発明のかな漢字変換処
理の説明図である。 Ml・入力手段、M2・辞N部、M3・文字列分V]手
段、M4・検索手段、M5・接続判定手段、M6・接続
記憶手段 20・・・キーボード、50−・・電子制御装置、60
・・・文字キー、70・・・変換キー

Claims (1)

  1. 【特許請求の範囲】 未変換の文字列の入力手段と、 変換文字列および該変換文字列の接続情報を記憶する辞
    書部と、 前記入力手段で入力された未変換の文字列を複数の連続
    する文字列に分割する文字列分割手段と、該文字列分別
    手段で分割された未変換の各文字列に対応する変換文字
    列を前記辞書部から検索し抽出する検索手段と、 該検索手段で検索された連続する変換文字列間の接続の
    正否を前記接続情報に基づいて判定する接続判定手段と を備え、 前記接続判定手段にて、連続する変換文字列間の接続が
    正しくないと判定されたときには前記検索手段にて該当
    する文字列に対応する他の変換文字列を検索抽出すると
    共に、 前記検索手段にて、前記分割された未変換の文字列に対
    応する変換文字列を発見できないときには前記文字列分
    別手段により前記入力手段で入力された未変換の文字列
    を分割し直す文書編集装置において、 前記接続判定手段で連続する変換文字列間の接続が正し
    くないと判定されたときに、該接続が正しくないと判定
    された未変換の文字列の分割位置および該分割位置の直
    前の変換文字列の接続情報を記憶する接続記憶手段を設
    けると共に、 前記検索手段にて検索抽出された変換文字列が、前記接
    続記憶手段に記憶される前記分割位置の直前の文字列に
    対応しており、かつ前記接続記憶手段に記憶される接続
    情報を有する場合には、前記検索手段にて該当する文字
    列に対応する他の変換文字列を検索抽出することを特徴
    とする文書編集装置。
JP62262509A 1987-10-16 1987-10-16 文書編集装置 Expired - Fee Related JP3137329B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62262509A JP3137329B2 (ja) 1987-10-16 1987-10-16 文書編集装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62262509A JP3137329B2 (ja) 1987-10-16 1987-10-16 文書編集装置

Publications (2)

Publication Number Publication Date
JPH01106162A true JPH01106162A (ja) 1989-04-24
JP3137329B2 JP3137329B2 (ja) 2001-02-19

Family

ID=17376788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62262509A Expired - Fee Related JP3137329B2 (ja) 1987-10-16 1987-10-16 文書編集装置

Country Status (1)

Country Link
JP (1) JP3137329B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56157565A (en) * 1980-05-08 1981-12-04 Canon Inc Character procession device
JPS61156466A (ja) * 1984-12-28 1986-07-16 Ricoh Co Ltd 単語抽出方式
JPS6210763A (ja) * 1985-07-08 1987-01-19 Ricoh Co Ltd 仮名漢字変換処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56157565A (en) * 1980-05-08 1981-12-04 Canon Inc Character procession device
JPS61156466A (ja) * 1984-12-28 1986-07-16 Ricoh Co Ltd 単語抽出方式
JPS6210763A (ja) * 1985-07-08 1987-01-19 Ricoh Co Ltd 仮名漢字変換処理装置

Also Published As

Publication number Publication date
JP3137329B2 (ja) 2001-02-19

Similar Documents

Publication Publication Date Title
JPH07114568A (ja) データ検索装置
JPH0365757A (ja) 文章処理装置
JPH01106162A (ja) 文書編集装置
JPH0412866B2 (ja)
JP3847801B2 (ja) 文字処理装置及びその処理方法
JP2553503B2 (ja) 文字処理装置
JP2862236B2 (ja) 文字処理装置
JPH0452500B2 (ja)
JPS6134668A (ja) 仮名漢字変換処理方式
JPS628259A (ja) かな漢字変換方式
JP2833650B2 (ja) 文書処理装置
JP3340124B2 (ja) かな漢字変換装置
JPS638860A (ja) かな漢字変換装置
JP2634596B2 (ja) かな漢字変換装置
JPH0697455B2 (ja) 仮名漢字変換装置
JPH03137768A (ja) 文書処理装置
JPH0623973B2 (ja) 文字処理装置の頻度変更方式
JPH0685169B2 (ja) 文書処理方式
JPH0154742B2 (ja)
JPH0385670A (ja) 二段階表示方式文書処理装置
JPS61177568A (ja) 文字処理装置
JPH0610804B2 (ja) かな漢字変換装置
JPH05120259A (ja) かな漢字変換装置
JPH0128977B2 (ja)
JPH0625990B2 (ja) 中文自動区切入力方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees