JPS63244257A - 文書作成システム - Google Patents

文書作成システム

Info

Publication number
JPS63244257A
JPS63244257A JP62077861A JP7786187A JPS63244257A JP S63244257 A JPS63244257 A JP S63244257A JP 62077861 A JP62077861 A JP 62077861A JP 7786187 A JP7786187 A JP 7786187A JP S63244257 A JPS63244257 A JP S63244257A
Authority
JP
Japan
Prior art keywords
font
document
input
information
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62077861A
Other languages
English (en)
Inventor
Masatoshi Yamao
山尾 雅利
Masaie Amano
天野 真家
Kimito Takeda
武田 公人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP62077861A priority Critical patent/JPS63244257A/ja
Publication of JPS63244257A publication Critical patent/JPS63244257A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、コンピュータシステムにより原稿を認識し、
所定の変換処理を行なって出力する、例えば自動翻訳装
置等の文書作成システムに関する。
(従来の技術) 一般に、光学的文字読取装置(以下OCRと称する)に
より原稿を走査入力する機能を持つ文書作成システムは
、第8図に示したように構成されている。
このシステムにおいて、OCRの入力部と認識部をもつ
文書入力部1は、フォント文字辞書2に基づいて原稿中
の文字列を認識し、得られた文字列を編集制御部3に送
り出し、そこで入力部4からの制御情報に従って、■翻
訳等のように何らかの編集処理を行なう、■編集処理を
行なわずに文書を出力vtm部5に送り出して印字装置
6により印刷する、■表示装置7の画面に表示する、■
外部記憶装r!t8に格納する、■通信装置9で他のシ
ステムに伝達する、等の処理を行っていた。
(発明が解決しようとする問題点) しかしながらこのような文書作成システムでは、光学的
文字読取により原稿を入力する段階で、各フォントの修
飾形態は全く抽出されない。
すなわち文書中で字体(ゴシック体や明朝体等の区別)
や文字のサイズ(ポイント数)が異なる部分は、特定の
意味(強調、固有名詞、引用等)を表現している場合が
多いが、これらは全く無視されている。
したがって編集制御部3や出力制御部5が、入力文書中
のこのような特定の意味を反映させた出力文書を作成す
ることは不可能であった。
本発明はこのような事情によりなされたもので、入力文
書中のフォントの修飾形態の違いによる特定の意味を出
力文書に反映させることができる文書作成システムの提
供を目的としている。
[発明の構成] (問題点を解決するための手段) 本発明の文書作成システムは、入力原文を走査しイメー
ジデータを入力して認識する文書入力手段と、基準フォ
ントが格納されているフォント辞書と、フォントの修飾
形態に間する基準情報が格納されているフォント情報辞
書と、前記フォント辞書の基準フォントに基づいて認識
された前記イメージデータに対応するフォントを格納す
る入力フォント記憶手段と、前記フォント情報辞書から
出力された、前記認識されたフォントに対応する修飾形
態に関する基準情報を格納するフォント情報記憶手段と
、前記フォント記憶手段に格納されたフォントおよび前
記フォント情報記憶手段に格納された修飾情報に基づい
て新たな文書を編集する編集手段と、前記新たな文書を
前記原文書の修飾形態を反映させつつ出力する文書出力
手段とを備えている。
(作 用) 本発明の文書作成システムにおいて、文書入力手段は入
力原文のイメージデータを認識すると、このイメージデ
ータから抽出されたフォントを入力フォント記憶手段に
格納するとともにフォント情報記憶手段に前記フォント
の修飾情報を格納する0編集手段は、前記フォント記憶
手段に格納されたフォントおよび前記フォント情報記憶
手段に格納された修飾情報に基づいて新たな文書を編集
する。そして文書出力手段は前記新たな文書を前記入力
原文の修飾形態を反映させつつ出力するので、例えば入
力原文に斜字体等の強調部分があった場合には、出力さ
れる文書中でもその強調部分が表現される。
(実施例) 第1図は本発明を自動翻訳装置に適用した場合の実施例
である。
同図において11は原文書のイメージデータを走査入力
して認識するOCR等の文書入力部、12は比較対象と
なる基準フォントが格納されているフォント文字辞書、
13はフォントの修飾形態に関する基準情報、すなわち
字体・大きさ等を識別するために必要な情報(以下フォ
ント情報と称する)が格納されているフォント情報辞書
、14は認識されたフォントを格納する入力文書記憶部
、15は各フォントのフォント情報を格納する入力フォ
ント情報記憶部である。
また16は入力された文字列を形態素解析し、単語およ
び文を抽出する文抽山部、17は抽出された単語および
文のフォントを格納する原文記憶部、18は単語ごとに
まとめられたフォント情報を格納する原文フォント情報
記憶部、19は原文記憶部17に格納されている文を翻
訳し、訳文に変換する翻訳部、20は訳文を単語列とし
て格納する訳文記憶部である。
さらに21は訳文の単語に対応する原文の単語のフォン
ト情報を格納する訳文フォント情報記憶部、22は文字
キーの繰作により文字列を、機能キーの操作により制御
情報を入力する入力部、23は入力部22から入力され
た文字や作成した文書を表示するCRTディスプレイ等
の表示部、24は入力部22からの入力により文書のI
i集を行なう編集制御部、25は訳文フォント情報記憶
部21に格納されているフォント情報と入力・出力フォ
ント辞書26を参照し、漢字プリンタ等の印刷出力部2
7に出力データを送る出力制御部である。
第2図ないし第6図は本実施例装置の動作を示す流れ図
である。
まず文書入力部11は原稿を走査し、そのイメージデー
タを得て(ステップ1)、このイメージデータから文字
の部分を抜き出しくステップ2)、サイズや傾き等の正
規化を行ない(ステップ3)、正規化係数からフォント
の大きさや傾き等の情報の抽出を行なう(ステップ4)
そしてフォント文字辞書12内のパターンとのマツチン
グをとり(ステップ5)、マツチングがとれた文字を入
力文書記憶部14へ格納しくステップ6)、マツチング
がとれたフォントの字体、大きさ等の情報をフォント情
報辞書13から読み出して入力フォント情・報記憶部1
5へ格納しくステップ7)、原稿の最後を検出した段階
で文抽山部16に進む。
文抽山部16は、入力文書の文字列から単語および文を
抽出して原文記憶部17に格納するが、その途中で入力
フォント情報記憶部15からフォント情報を読み出して
自らのバッファに追加する(ステップ8)。
さらに文抽山部16は自らの形態素辞書を参照し、自ら
のバッファ内の単語がマツチングした語とその付加情報
とを原文記憶部17に格納する(ステップ9)。
さらに文抽山部16は自らのバッファ内のフォント情報
を原文の単語に対応づけて原文フォント情報記憶部18
に格納しくステップ10)、バッファを初期化する(ス
テップ11)。
翻訳部19は、原文記憶部17から文単位に原文を読出
し、訳文を生成して訳文記憶部20に格納する(ステッ
プ12)。
このとき原文の単語と訳文の単語との対応情報を生成し
、原文フォント情報記憶部18から読み出したフォント
情報を、対応する訳文の単語の位置の訳文フォント情報
記憶部21に格納する(ステップ13)。
出力制御部21は、訳文記憶部20から次の訳文を読み
出しくステップ14)、読み出した訳文の単語に対応す
るフォント情報を訳文フォント情報記憶部21から読み
出しくステップ15)、読み出したフォント情報に対応
するフォント情報を入力・出力フォント辞書26の中か
ら探しくステップ16)、発見した場合には、そのフォ
ント情報に適合した出力を印字出力部27が行なうよう
に、訳文単語の前後に制御コードを付加したりコード変
換を施す(ステップ17)。
発見できなかった場合には、訳文の文字列をそのまま印
字出力部27に送る(ステップ18)。
文の終わりを検出したら、再びステップ15に戻る。
訳文文書の最後を検出したら、すべての処理を終了する
か、次の文書の入力を行なうか、次の文書の編集操作を
行なう。
1itl&制御部24では、オペレータが入力部22の
キーボードから入力した文字列や制御キーの指定により
編集対象文書およびその格納場所を知り、入力文書記憶
部14、原文記憶部27または訳文記憶部20から編集
制御部24内の記憶装置に写す(ステップ19)。
フォント情報の反映の指定あれば、編集対象文書に対応
するフォント情報をフォント情報記憶部15、原文フォ
ント情報記憶部18または訳文フォント情報記憶部21
から読り出しくステップ20)、入力・出力フォント辞
書26を参照して、出力情報を編集制御部24内の記憶
装置に格納する(ステップ21)。
さらに入力部22からの次のキーボード入力の指示を待
ち(ステップ22)、表示要求を検出したとき、フォン
ト情報の反映指定を検出すれば、表示文字列に対応する
フォント情報に応じて制御コードの付加やコード変換を
行なって、表示文字列を表示部23に送出する(ステッ
プ23)。
フォント情報の反映指定が無ければ、編集制御部24内
の記憶装置内に格納されている文字列をそのまま表示部
23に送る(ステップ24)。
なお表示以外の要求を検出した場合には、編集処理を行
った上で再び入力待ちに戻るか、終了する(ステップ2
5)。
かくして本実施例によれば、オペレータが1i集操作(
たとえば翻訳)を行なう際に、フォント情報に基づいて
例えば原稿の斜字部分や倍角部分等を表示部23の画面
上で高輝度表示等により表示することができる。
これにより文書中のキーワードを把握しながら編集を行
う等、文書の内容に即した編集を効率的に行うことがで
きる。
例えば第7図に示したように、文書入力部1から入力し
た原稿D1におけるイタリック文字「hi m 」を、
印字出力部27が印字する訳文文書D2において、斜体
文字「彼を」と表現することができる。
またオペレータが特に編集操作を行わない場合でも、入
力フォント情報と出力フォント情報の辞書を定義してお
くことで原稿の内容を反映した出力文書を得ることがで
きる。
[発明の効果] 以上説明したように本発明の文書作成システムは、原文
書のフォントを認識する際に各フォントのフォント情報
を抽出して格納しておく機能を備えているので、原文書
の修飾形態を反映させた出力文書を作成することができ
る。
【図面の簡単な説明】
第1図は本発明を自動翻訳装置に適用した場合の実施例
の構成を示すブロック図、第2図ないし第6図は同実施
例システムの動作を示す流れ図、第7図は同実施例シス
テムにおける入力文書と出力文書とを比較して示す図、
第8図は従来の文書作成システムの構成の一例を示すブ
ロック図である。 11・・・・・・文書入力部 12・・・・・・フォント文字辞書 13・・・・・・フォント情報辞書 14・・・・・・入力文書記憶部 15・・・・・・入力フォント情報記憶部16・・・・
・・文抽山部 17・・・・・・原文記憶部 18・・・・・・原文フォント情報記憶部19・・・・
・・原文記憶部 20・・・・・・訳文記憶部 21・・・・・・訳文フォント情報記憶部22・・・・
・・入力部 23・・・・・・表示部 24・・・・・・編集制御部 25・・・・・・出力11i1J御部 26・・・・・・入力・出力フォント辞書27・・・・
・・印字出力部 、出願人  株式会社 東 芝 代理人  弁理士  須 山 佐 − 第1図 第2図 慨3図 錦4図 第5図

Claims (1)

    【特許請求の範囲】
  1. (1)入力原文を走査しイメージデータを入力して認識
    する文書入力手段と、基準フォントが格納されているフ
    ォント辞書と、フォントの修飾形態に関する基準情報が
    格納されているフォント情報辞書と、前記フォント辞書
    の基準フォントに基づいて認識された前記イメージデー
    タに対応するフォントを格納する入力フォント記憶手段
    と、前記フォント情報辞書から出力された、前記認識さ
    れたフォントに対応する修飾形態に関する基準情報を格
    納するフォント情報記憶手段と、前記フォント記憶手段
    に格納されたフォントおよび前記フォント情報記憶手段
    に格納された修飾情報に基づいて新たな文書を編集する
    編集手段と、前記新たな文書を前記原文書の修飾形態を
    反映させつつ出力する文書出力手段とを備えてなること
    を特徴とする文書作成システム。
JP62077861A 1987-03-31 1987-03-31 文書作成システム Pending JPS63244257A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62077861A JPS63244257A (ja) 1987-03-31 1987-03-31 文書作成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62077861A JPS63244257A (ja) 1987-03-31 1987-03-31 文書作成システム

Publications (1)

Publication Number Publication Date
JPS63244257A true JPS63244257A (ja) 1988-10-11

Family

ID=13645839

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62077861A Pending JPS63244257A (ja) 1987-03-31 1987-03-31 文書作成システム

Country Status (1)

Country Link
JP (1) JPS63244257A (ja)

Similar Documents

Publication Publication Date Title
EP0370774B1 (en) Machine translation system
US4962452A (en) Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence
US5587902A (en) Translating system for processing text with markup signs
JP3038079B2 (ja) 自動翻訳装置
JP2765665B2 (ja) タイポグラフィカル情報付き文書の翻訳装置
JP2848729B2 (ja) 翻訳方法および翻訳装置
JPS6244873A (ja) 機械翻訳装置
JP2818052B2 (ja) 光学的文字読み取り装置
JPS63244257A (ja) 文書作成システム
JPH0696288A (ja) 文字認識装置及び機械翻訳装置
JPH09284446A (ja) 情報処理装置およびデジタル複写機および情報記憶媒体
JPH0883280A (ja) 文書処理装置
JP3083171B2 (ja) 文字認識装置及び方法
JP2924955B2 (ja) 翻訳方法および翻訳装置
JP3147947B2 (ja) 機械翻訳装置
JP2894064B2 (ja) 機械翻訳装置
JP3204517B2 (ja) 未知語認定方法
JPS62143178A (ja) 自然言語翻訳方式
JPH0756924A (ja) 対訳装置
JPH027167A (ja) 翻訳方法及び装置
JPH0668136A (ja) 機械翻訳システム
JPH0554062A (ja) 機械翻訳システム
JPH0635955A (ja) 機械翻訳装置
JPH04167060A (ja) 翻訳方法
JPH05108703A (ja) 機械翻訳機