JPH07141345A - 日本語文章処理方法 - Google Patents

日本語文章処理方法

Info

Publication number
JPH07141345A
JPH07141345A JP5308595A JP30859593A JPH07141345A JP H07141345 A JPH07141345 A JP H07141345A JP 5308595 A JP5308595 A JP 5308595A JP 30859593 A JP30859593 A JP 30859593A JP H07141345 A JPH07141345 A JP H07141345A
Authority
JP
Japan
Prior art keywords
character
kana
paragraph
kanji
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5308595A
Other languages
English (en)
Inventor
Takahiro Okawa
貴広 大川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP5308595A priority Critical patent/JPH07141345A/ja
Publication of JPH07141345A publication Critical patent/JPH07141345A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】日本語ワードプロセッサに於いて、1つの単語
の途中で行の折り返しが発生しないようにすること。 【構成】かな漢字変換部16は、かな入力された文字列
を文節ごとに区切り、漢字かな混じり文字列に変換す
る。文章編集処理部20は、この漢字かな混じり文を、
各文字毎に制御コードとして当該文字が文節の先頭もし
くは最終文字かという情報と共に文書メモリ22に記憶
する。表示編集処理部30は、表示1行分の文字列を文
書メモリ22から1行バッファ32に読み込み、その最
終文字が文節終了文字でないことが制御コードにより判
断されると、その最終文字から前方へ文節終了文字を検
索し、1行分の文字列の先頭文字からその検索された文
節終了文字までの文字列を表示メモリ28に転送する。
そして、次の1行バッファ32への読み込みは、検索さ
れた文節終了文字の次の文節開始文字からとされる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語の文章を作成・
編集する日本語ワードプロセッサに於ける日本語文章の
処理方法に関する。
【0002】
【従来の技術】近年、パーソナルコンピュータのアプリ
ケーションとしてあるいは専用機として供給されるワー
ドプロセッサを使用して文書を作成,印刷出力すること
が多くなってきている。
【0003】このようなワードプロセッサには、英語文
章を取り扱う、いわゆる英文ワードプロセッサと、日本
語文章を取り扱う、いわゆる日本語ワードプロセッサと
がある。このうち、英文ワードプロセッサでは、単語の
途中で行の折り返しが発生する場合、スペースで区切ら
れた1単語を1つのまとまりとして判断し、単語単位で
の折り返しを行う、いわゆるワードラップ処理が行われ
ている。
【0004】
【発明が解決しようとする課題】それに対して、日本語
では、英語のようなスペースによる単語と単語との切れ
目を判断する手法がないため、日本語ワードプロセッサ
の場合は、ワードラップ処理が行えず、単語の途中で行
が折り返してしまう。そのため、ユーザが手入力で適宜
改行処理を行ったり、所望により均等割付の処理を行う
ことが必要であった。
【0005】本発明の課題は、日本語ワードプロセッサ
に於いて、1つの単語の途中で行の折り返しが発生しな
いようにすることである。
【0006】
【課題を解決するための手段】本発明の手段は次の通り
である。かな入力により漢字かな混じり文字列に変換
し、この変換された漢字かな混じり文から日本語の区切
れを検索し、この検索された区切れに基づいて、上記漢
字かな混じり文をレイアウト編集あるいはレイアウト出
力する。
【0007】
【作用】本発明の手段の作用は次の通りである。まず、
かな入力された文字列を変換して漢字かな混じり文字列
とし、この変換された漢字かな混じり文から日本語の区
切れを検索する。そして、この検索された区切れに基づ
いて、上記漢字かな混じり文をレイアウト編集あるいは
レイアウト出力する。
【0008】
【実施例】以下、本発明の実施例を、図1の(A)乃至
図6を参照して説明する。
【0009】図2は本発明の実施例の日本語文章処理方
法の適用された日本語ワードプロセッサの構成を示すブ
ロック図で、図中の参照番号10は全体の制御を行うC
PUである。12はデータ入力つまりかな入力及び編集
の指示を行うための入力部であり、14は入力部12か
ら入力された文字列を格納する入力バッファである。1
6は上記入力部12の不図示「変換」キーなどの操作に
応じて上記入力バッファ14の文字列に対してかな漢字
変換を行うかな漢字変換部であり、18はこのかな漢字
変換部16でのかな漢字変換の実行により得られた漢字
かな混じり文及びその文節の区切れ情報を格納する変換
バッファである。20はワードプロセッサの中核である
文書編集処理部であり、22は上記変換バッファ18に
格納された漢字かな混じり文と文節区切り情報より上記
文書編集処理部に20によって変換された文書データを
記憶する文書メモリである。24は文書メモリ22に記
憶された文書データを印刷出力するための印刷部であ
り、26は表示メモリ28に展開された入力データや文
書データを表示するCRT等の表示部である。そして、
30は詳細は後述するようなワードラップ表示の処理を
行う表示編集処理部であり、32はそのワードラップ表
示処理時に利用される表示1行文の文字列を格納する1
行バッファである。
【0010】次に、このような構成に於ける動作を説明
する。
【0011】図1の(A)は、上記日本語ワードプロセ
ッサの変換動作のフローチャートである。
【0012】入力部12からの読み文字列をかな入力し
(ステップS11)、かな漢字変換部16により漢字変
換処理を行う(ステップS12)。そして、文節区切り
の間違いによりユーザ所望の漢字かな混じり文に変換さ
れない場合には、入力部12より区切り修正指定を行っ
て(ステップS13)、再度かな漢字変換を行う。そし
て、ユーザ所望の漢字かな混じり文に変換されたなら
ば、入力部12より確定指定がなされ(ステップS1
4)、これに応じて文書編集処理部20は、文節区切り
開始,終了ビットを付加して、文書メモリ22に記憶す
る(ステップS15)。
【0013】例えば、図3に示すように、かな漢字変換
を行う場合、入力された読み文字列に対して構文解析な
どが行われ、文節ないしは単語ごとに文章が区切られ、
文節ないし単語ごとに、読みデータから漢字データへの
変換が行われる。仮に構文解析などによる文節区切りの
判断が誤っていた場合でも、正しい変換結果を得るため
には、文節区切りの修正指示が行われ、入力された文字
列が全文確定したときには、個々の文節,単語の区切り
は正しく認識されているのが普通である。
【0014】図3の例で示されるような形でかな漢字変
換が行われた場合、文節の区切りは図4に示されるよう
な形になる。
【0015】一方、文書メモリ22に記憶される文書デ
ータは、図5の(A)及び(B)に示すようなデータ構
造となる。即ち、一般的な文書データの構造としては、
図5の(A)に示すように、各文字毎にその文字のサイ
ズや修飾などを、制御コードとして付加し、制御コード
+文字コードを1文字として扱う手法が良く知られてい
る。そこで、本実施例では、この制御コードに、その文
字が文節の先頭文字か最終文字かという情報(上記文節
区切り開始,終了ビット)を持たせるようにしている。
【0016】図5の(B)は、図3の例の文書をこのデ
ータ構造に当てはめた例である。
【0017】以上のようにして日本語ワードプロセッサ
に於いても各文節ないし単語ごとの区切れ情報を持つこ
とができる。
【0018】そして、この区切れ情報をもとに、表示編
集処理部30により、図1の(B)に示すようなワード
ラップ表示の処理を行って、表示部26にワードラップ
表示を行う。
【0019】即ち、まず表示1行分の文字列を文書メモ
リ22から1行バッファ32に読み込む(ステップS2
1)。そして、その読み込んだ1行分の文字列の最後の
文字が文節終了文字であるかどうかをその制御コードを
参照して判断する(ステップS22)。
【0020】文節終了文字であれば、読み出された文字
列を表示メモリ28に転送する(ステップS23)。そ
して、表示部26の表示画面の表示行数分の転送が終わ
っていなければ(ステップS24)、次の文節開始文字
から表示1行分の文字列を1行バッファ32に読み込ん
で(ステップS25)、上記ステップS22から繰り返
す。
【0021】一方、上記ステップS22に於いて、最終
文字が文節終了文字でないと判断された場合には、ワー
ドラップ処理を行う。即ち、1行バッファ32に格納さ
れた文字列の最終文字から前方へ文節終了文字を検索し
(ステップS26)、1行バッファ32の文字列の先頭
文字からその検索された文節終了文字までの文字列を表
示メモリ28に転送する(ステップS27)。そして、
表示部26の表示画面の表示行数分の転送が終わってい
なければ(ステップS24)、上記ステップS26で検
索された文節終了文字の次の文節開始文字から表示1行
分の文字列を文書メモリ22から1行バッファ32に読
み込んで(ステップS25)、上記ステップS22から
繰り返す。
【0022】このようなワードラップ表示処理を行うこ
とにより、図6に示すように日本語ワードプロセッサに
於いてもワードラップ処理が可能となる。
【0023】このように、かな漢字変換による文字の入
力時に、文節の区切り情報を同時に取得すると共に、取
得された文節区切り情報をもとに、ワードラップ処理を
行うことにより、日本語ワードプロセッサに於いてもワ
ードラップ処理が可能になり、見やすい、読みやすい文
章の作成が可能となる。
【0024】なお、上記実施例では、全文節に対してワ
ードラップ処理を行っていたが、かな漢字変換実行時
に、品詞情報も同時に取得することにより、名詞だけ、
あるいは固有名詞だけワードラップ処理を行うなどのワ
ードラップ処理の実行レベルを変えるようにしても良
い。これにより、ワードラップ処理の機能を多彩にする
ことができる。
【0025】また、上記実施例では、文節の区切り情報
をワードラップ処理に利用していたが、文書の編集とい
う面から考えると、従来の文字単位,行単位,頁単位と
いった編集の単位に対して、文節単位の編集ということ
に利用できる。これにより、文書編集の操作性がより良
くなる。
【0026】
【発明の効果】本発明によれば、日本語ワードプロセッ
サに於いて、1つの単語の途中で行の折り返しが発生し
ないようにすることができる。
【図面の簡単な説明】
【図1】(A)は実施例の変換動作のフローチャートで
あり、(B)は実施例のワードラップ表示動作のフロー
チャートである。
【図2】実施例の日本語文章処理方法が適用された日本
語ワードプロセッサのブロック構成図である。
【図3】かな漢字変換による表示の変遷を示す図であ
る。
【図4】かな漢字変換により得られた文節区切り情報を
示す図である。
【図5】(A)は文書データ構造を示す図であり、
(B)は実際の文章に於ける文書データ構造を示す図で
ある。
【図6】日本語ワードラップ処理を示す表示例である。
【符号の説明】
10…CPU、12…入力部、14…入力バッファ、1
6…かな漢字変換部、18…変換バッファ、20…文書
編集処理部、22…文書メモリ、24…印刷部、26…
表示部、28…表示メモリ、30…表示編集処理部、3
2…1行バッファ。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 かな入力により漢字かな混じり文字列に
    変換し、 この変換された漢字かな混じり文から日本語の区切れを
    検索し、 この検索された区切れに基づいて、前記漢字かな混じり
    文をレイアウト編集あるいはレイアウト出力する、 ことを特徴とする日本語文章処理方法。
JP5308595A 1993-11-16 1993-11-16 日本語文章処理方法 Pending JPH07141345A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5308595A JPH07141345A (ja) 1993-11-16 1993-11-16 日本語文章処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5308595A JPH07141345A (ja) 1993-11-16 1993-11-16 日本語文章処理方法

Publications (1)

Publication Number Publication Date
JPH07141345A true JPH07141345A (ja) 1995-06-02

Family

ID=17982937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5308595A Pending JPH07141345A (ja) 1993-11-16 1993-11-16 日本語文章処理方法

Country Status (1)

Country Link
JP (1) JPH07141345A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008021115A (ja) * 2006-07-12 2008-01-31 Sharp Corp 文書処理装置、そのプログラムおよび該プログラムを記録したコンピュータ読取り可能な記録媒体、電子表示器、ならびに文書処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008021115A (ja) * 2006-07-12 2008-01-31 Sharp Corp 文書処理装置、そのプログラムおよび該プログラムを記録したコンピュータ読取り可能な記録媒体、電子表示器、ならびに文書処理方法

Similar Documents

Publication Publication Date Title
EP0370774B1 (en) Machine translation system
US5241674A (en) Electronic dictionary system with automatic extraction and recognition of letter pattern series to speed up the dictionary lookup operation
JPS62203273A (ja) 機械翻訳システム
JPH08161339A (ja) 文字列変換装置
JPH0658676B2 (ja) 多品詞訳語の校正方法
KR900008402B1 (ko) 기계번역장치
JPH07141345A (ja) 日本語文章処理方法
JPS61166676A (ja) 文字処理装置における辞書作成方式
JPS59100941A (ja) 仮名漢字変換装置
JP4050745B2 (ja) 文章入力システム
JP3881405B2 (ja) 機械翻訳システム
JP3147947B2 (ja) 機械翻訳装置
JPH07122875B2 (ja) 文書編集装置
JP2723908B2 (ja) 文書作成装置
JP2603269B2 (ja) 文字処理装置
JPH06101002B2 (ja) 文章作成装置
JPH0154742B2 (ja)
JPS5892065A (ja) 自然言語間の翻訳方法及び装置
JPH07182344A (ja) 機械翻訳装置
JPH0131229B2 (ja)
JPS6265162A (ja) かな漢字変換方法及び装置
JPH07105219A (ja) 機械翻訳装置
JPS6244876A (ja) 機械翻訳装置
JPH01211068A (ja) 日本語文入力装置
JPH0115105B2 (ja)