JPH03241460A - 文書出力書式制御方法 - Google Patents

文書出力書式制御方法

Info

Publication number
JPH03241460A
JPH03241460A JP2037202A JP3720290A JPH03241460A JP H03241460 A JPH03241460 A JP H03241460A JP 2037202 A JP2037202 A JP 2037202A JP 3720290 A JP3720290 A JP 3720290A JP H03241460 A JPH03241460 A JP H03241460A
Authority
JP
Japan
Prior art keywords
document
information
output format
output
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2037202A
Other languages
English (en)
Inventor
Yoko Asano
陽子 浅野
Katsuhiko Ogawa
克彦 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2037202A priority Critical patent/JPH03241460A/ja
Publication of JPH03241460A publication Critical patent/JPH03241460A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、データベース検索や電子新聞等のコンピュー
タシステムにおいて、通信文書やファイル等の文書情報
を出力する場合に、文書情報に応じて出力書式の制御を
行う文書出力書式制御方法に関するものである。
〔従来の技術〕
従来、データベース検索等のコンピュータシステムにお
いて、ファイル等の文書情報を出力する出力方法では、
出力制御゛システムや出力装置の制約上、はとんどのシ
ステムが横書きで文書を出力する方法で設計されている
。また、縦書きが可能な場面でも、予め縦書きの出力書
式を設定しておかねばならない。したがって、予め特別
な設定をしていない限り、文書情報は全て横書きで出力
されることになる。さらに、文字の大きさ、字間隔、業
間隔等の出力書式に関しても固定されている。
〔発明が解決しようとする課題〕
ところで、コンピュータシステムが広い分野に普及する
のに伴い、コンピュータシステムを介して出力される文
書の内容も、広い分野に及ぶようになってきた。中には
、英語やカタカナが多い文章もあれば、新聞等の縦書き
の文章をそのままデータベース化したような漢字や漢数
字が多い文章もある。一般に、文章はその文字の種類や
内容によっては、縦書きと横書きで読みやすさが大きく
異なることがある。例えば、英字やカタカナは、横書き
の方が読みやすいが、反対に漢数字などは横書きだとと
ても読みにくく感じる。
しかし、従来の出力制御システムでは、文書情報の内容
に関係なく横書きで出力してしまうという問題があった
本発明は、前記問題点を解決するために成されたもので
ある。
本発明の目的は、文書情報に応じて縦書き、横書き、文
字サイズ、書体、字間隔、行間隔等の出力書式の制御を
行うことができる文書出力書式制御方法を提供すること
にある。
〔課題を解決するための手段〕
前記目的を達成する本発明の文書出力書式制御方法の処
理手順が第1図に示される。
本発明の文書出力書式制御方法は、上位システムから送
られてくる文書情報信号を処理して出力装置に出力する
制御方法であって、第1図に示すように、字面統計量を
文書情報の特微量として抽出する段階S1と、抽出され
た字面統計量を予め設定された関数を用いてその文書内
容を評価する段階S2と、文書内容の評価値に対して予
め設定された判別関数より縦書きか横書きかの縦横書式
を決定する段階S3と、決定された縦横書式を文書情報
信号に付加して出力する段階S4と、を備えることを特
徴としている。
〔作用〕
本発明の文書出力書式制御方法における処理によれば、
出力書式を制御するシステムにおいて、字面統計量が文
書情報の特微量として抽出され、予め設定された該統計
量に関する関数を用いて文書内容が評価され、この評価
値に対して予め設定された判別関数より縦書きか横書き
かの出力書式が決定される。これにより、文書情報に応
じて縦書き横書きといった出力書式が制御される。
文書内容を評価し、縦書きか横書きかの出力書式を決定
する方法としては、例えば、文章中の漢字、カタカナ、
英字といった文字種の統計量を抽出し、これらの統計量
に関して予め定められた一次関数より文書を定量的に評
価し、その値から縦書きか横書きかを決定する判別関数
を予め定めておき、評価値より文書情報に応じて縦書き
か横書きかを決定する。このように、文書情報に応じて
出力書式を制御するため、文書情報の字面や内容に適し
た出力書式を設定することができる。
〔実施例〕
以下、本発明の文書出力書式制御方法の一実施例を図面
を用いて具体的に説明する。
なお、実施例を説明するための全図において、同一要素
のものは同一符号を付け、その繰り返しの説明は省略す
る。
第2図は本発明の文書出力書式制御方法を適用するシス
テムの出力制御部の要部の構成を示すブロック図である
。第2図において、10はコンピュータシステム等から
送信されてきた情報信号、11は情報記憶部、12は文
書情報、13は文書統計量抽出部、14は出力書式決定
部、15は出力書式情報、16は出力情報である。
情報記憶部11はコンピュータ等の上位システムから送
信されてきた情報信号10を、文書情報及び出力書式情
報として一時記憶するものである。
また、情報信号lOの中には字間隔、行間隔等いくつか
の出力書式情報も付加されているものとする。文書統計
量抽出部13は、情報記憶部11から送られてくる文書
情報12内の漢字、カタカナ、英字、算術記号を判別し
、各文字種の文字数を文書情報内容を評価するための統
計量として抽出するものである。
そして、出力書式決定部14は、文書統計量抽出部13
で抽出された統計量から、予め設定されている関数に基
づき出力書式、即ち、文章の縦書き、横書きを決定する
ものである。この決定には以下のような式のが用いられ
て、関数fが求められる。
f=  (k+e+s)/c ここで、kはカタカナ文字数、eは英字文字数、Sは算
術記号文字数、Cは漢字文字数である。出力書式決定部
14はこの関数fの値が0.10以上の場合は横書き、
0.10未満の場合は縦書きと決定するものとする。
以上のようにして、出力書式決定部14において文章の
縦書き、横書きが決定されると、出力書式情報15は情
報記憶部11にフィードバックされる。すると、情報記
憶部11は、−時記憶されていた文書情報及び出力書式
情報に、出力書式決定部14から送られてきた出力書式
情報15を加えて、出力情報16を作成し、これを出力
する。
次に、情報信号10として、第3図及び第4図に示すよ
うな具体的な文書情報が送信されてきた場合の第2図の
システムの出力制御部の動作を説明する。
第3図は情報信号10として送信されてくる文書情報2
0の一例を示す図であり、この文書情報20は、全文字
数218字、漢字文字数C=73字、カタカナ文字数に
一36字、英字文字数e=18字、算術記号文字数s=
8字から成る文書情報(この文書は、1989年11月
7日付けの日本経済産業新聞第1面より引用)である。
また、第4図は情報信号10として送信されてくる別の
文書情報30の例を示す図である。第4図における文書
情報30は、全文字数240字、漢字文字数c=122
字、カタカナ文字数に=o字、英字文字数e=o字、算
術記号文字数s=5から戊る文書情報である。
まず、第3図の文書情報20が情報信号10として送信
されてきた場合の第2図のシステムの出力制御部の動作
について説明する。文書情報20及びその出力書式情報
は、全て情報記憶部11に一時記憶される。情報記憶部
11からは文書統計量抽出部13に対して、文書情報1
2として第3図に示した内容の文書情報20が送られ、
文書統計量抽出部13ではこの文書情報20から漢字文
字数c=73字、カタカナ文字数に=36字、英字文字
数e=18字、算術記号文字数s=8字という統計量が
抽出され、これが出力書式決定部14に送られる。
出力書式決定部14では文書統計量抽出部13で抽出さ
れた統計量から前述の式のを用いて関数fの値が計算さ
れる。関数fの値は、 f= (k十e+s)/c = (36+18+ 8 ) /73=(L85≧0.
10となり、この文書情報20は横書きと決定される。
そして、出力書式決定部14はこの横書きという出力書
式情報を情報記憶部11に送出する。
情報記憶部11は、出力書式決定部14から送られてき
た横書きという出力書式情報15を受信し、情報記憶部
11に予め記憶されていた出力書式情報に付加して、第
3図の文書情報と共に出力情報16とする。従って、こ
の場合には第3図の情報は第3図に示した書式と同様に
横書きで印刷される。
次に、第4図の文書情報30が情報信号10として送信
されてきた場合の第2図のシステムの出力制御部の動作
について説明する。文書情報30及びその出力書式情報
は、同様に全て情報記憶部11に一時記憶される。情報
記憶部11から文書統計量抽出部13に文書情報30が
送られると、文書統計量抽出部13ではこの文書情報3
0から漢字文字数c=122字、カタカナ文字数に=o
字、英字文字数e=o字、算術記号文字数s=5字とい
う統計量が抽出され、この数値が出力書式決定部14に
送られる。従って、関数fは、f= (k+e+s)/
c = (0+O+ 5 ) / 122=0.04<0.
10となり、この文書情報30は縦書きと決定される。
そして、出力書式決定部14はこの縦書きという出力書
式情報を情報記憶部11に送出する。
情報記憶部11は、出力書式決定部14から送られてき
た縦書きという出力書式情報15を受信し、情報記憶部
11に予め記憶されていた出力書式情報に付加して、第
4図の文書情報と共に出力情報16とする。従って、こ
の場合には第4図に示した文書情報30の出力書式決定
後の出力情報は第5図に示すようになる。
以上に説明したように、本実施例の文書出力書式制御方
法においては、文書情報からの統計量の関数によって出
力書式を決定する。これにより、文書情報に応じた出力
書式を設定することができる。
なお、前述の実施例においては、情報信号10として、
第3図及び第4図に示すような文書情報が送信されてく
るものとしたが、文書情報の内容や大きさ等は任意であ
る。これらはすべて情報記憶部11に一時記憶されるも
のとしたが、送信される文書の全体はもっと長いもので
、−度に送信されてくる情報信号10はその一部で、何
回かに分けて送信されてきてもよい。また、情報記憶部
11に一時記憶した文書を、−度にすべて文書情報12
として文書統計量抽出部13に送信するとしたが、文書
統計量抽出部13に送信する文書情報12は、情報記憶
部11に一時記憶されている文書すべてではなく、任意
のひとまとまりだけでもよい。また、これらの情報信号
10には字間隔、行間隔等いくつかの出力書式情報も付
加されているものとしたが、予め送信されてくる出力書
式情報の内容は任意でよい。また、出力書式情報は全く
与えずに全て出力書式決定部14で決定するようにして
もよい。
更に、前述の実施例では文書統計量抽出部I3が、文書
情報12内の漢字、カタカナ、英字、算術記号を判別し
、各文字種の文字数を統計量として抽出するものとした
が、抽出する統計量は任意で、他の文字種や上下分離漢
字と左右分離漢字の文字数等でもよい。また、出力書式
決定部14では、文章の縦書き横書きを決定するものと
したが、ここで決定する出力書式は任意で、字間隔、行
間隔、文字サイズ、書体等でもよい。また、縦書き横書
きの決定を行う関数fを■式で求めるようにしたが、関
数fを求める式は■式に限定されるものではなく、例え
ば、全文字数をtとして、次式、f= (k+e+s)
/l  ・・・■を用いてもよく、また、A、B、Cを
係数として、f= (Ak+Be+Cs)/c  −■
という式を用いてもよく、更に、pを上下分離漢字文字
数、qを左右分離漢字文字数として、f=p/q  ・
・・■ 等の式を用いてもよい。そして、これに加えて、各文字
種の文字数に対する評価値の対応表などを用いてもよい
。ここでは、関数fの値が、0.10以上の場合は横書
き、0.IO未満の場合は縦書きと決定するものとした
が、この決定の基準値は以上の値に限定されるものでは
なく、0.15でも0.20でもよい。
以上、本発明を実施例に基づき具体的に説明したが、本
発明は、前記実施例に限定されるものではなく、その要
旨を逸脱しない範囲において種々変更可能であることは
言うまでもない。
〔発明の効果〕
以上説明したように、本発明の文書出力書式制御方法に
よれば、文書情報から統計量を抽出し、予め設定された
関数によって出力書式を決定する処理を行う。これによ
り、文書情報に応じて縦書き、横書き、文字サイズ、書
体、字間隔、行間隔等の出力書式の制御を行うことがで
き、文書を読み易い形で出力することができる。
【図面の簡単な説明】
第1図は本発明の文書出力書式制御方法の原理を示す流
れ図、 第2図は本発明を適用するシステムの出力制御部の要部
の構成を示すブロック図、 第3図は情報信号として送信されてくる文書情報の一例
を示す図、 第4図は情報信号として送信されてくる文書情報の別の
一例を示す図、 第5図は第4図の文書情報の出力書式決定後の出力情報
の一例である。 10・・・情報信号、 11・−情報記憶部、 12・・・文書情報、 13・・・文書統計量抽出部、 14・・・出力書式決定部、 15・−・出力書式情報、 16−・出力情報、 20・・・文書情報、 30・・−文書情報。

Claims (1)

  1. 【特許請求の範囲】 上位システムから送られてくる文書情報信号を処理して
    出力装置に出力する制御方法であって、字面統計量を文
    書情報の特徴量として抽出する段階と、 抽出された字面統計量を予め設定された関数を用いてそ
    の文書内容を評価する段階と、 文書内容の評価値に対して予め設定された判別関数より
    縦書きか横書きかの縦横書式を決定する段階と、 決定された縦横書式を文書情報信号に付加して出力する
    段階と、 を備えることを特徴とする文書出力書式制御方法。
JP2037202A 1990-02-20 1990-02-20 文書出力書式制御方法 Pending JPH03241460A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2037202A JPH03241460A (ja) 1990-02-20 1990-02-20 文書出力書式制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2037202A JPH03241460A (ja) 1990-02-20 1990-02-20 文書出力書式制御方法

Publications (1)

Publication Number Publication Date
JPH03241460A true JPH03241460A (ja) 1991-10-28

Family

ID=12491000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2037202A Pending JPH03241460A (ja) 1990-02-20 1990-02-20 文書出力書式制御方法

Country Status (1)

Country Link
JP (1) JPH03241460A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015187771A (ja) * 2014-03-26 2015-10-29 Kddi株式会社 表示形態決定装置、表示形態を決定する方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015187771A (ja) * 2014-03-26 2015-10-29 Kddi株式会社 表示形態決定装置、表示形態を決定する方法およびプログラム

Similar Documents

Publication Publication Date Title
CN1761976A (zh) 利用重排位图改善可读性
US5133067A (en) Method and apparatus for system for selectively extracting display data within a specified proximity of a displayed character string using a range table
JPH03241460A (ja) 文書出力書式制御方法
US5854860A (en) Image filing apparatus having a character recognition function
JPH02202689A (ja) 文字認識装置
JP3027834B2 (ja) 文書ファイル名表示装置
JPH09204511A (ja) ファイリング装置
CN116306493A (zh) 一种维吾尔语pdf文档中中英文文本、阿拉伯数字的提取和还原方法
MacKay The internationalization of T/sub E/X with special reference to Arabic
JPH10198705A (ja) 文書画像処理装置および文書画像処理方法および情報記録媒体
JP2931485B2 (ja) 文字切出し装置及び方法
JPH0950488A (ja) 異サイズ混在文字列の読取り方法
JPS61206090A (ja) 文字読取装置
JPH01209586A (ja) 倍角文字・半角文字混在文章の文字認識方式
Breslow GH Martin, ed. and trans. Knighton's Chronicle, 1337–1396.(Oxford Medieval Texts.) New York: The Clarendon Press, Oxford University Press. 1996. Pp. lxxxviii, 593. $98.00. ISBN 0-19-820503-1.
JPH09259225A (ja) 文字認識変換方法及び文字データ処理装置
JPS63245760A (ja) 文書整形装置
JPH04274579A (ja) 光学文字読取り装置における文字認識方法
JPH05266244A (ja) 文字読取装置
JPH03240184A (ja) 属性判定装置
JPH079653B2 (ja) 文字処理装置
JPH0520300A (ja) 文書処理装置
JPS60159783A (ja) 文字ピツチ制御方式
JPH02240789A (ja) 文字列切り出し方式
JPH02178765A (ja) 文書作成装置