JP2971295B2 - 文書作成装置 - Google Patents

文書作成装置

Info

Publication number
JP2971295B2
JP2971295B2 JP5151527A JP15152793A JP2971295B2 JP 2971295 B2 JP2971295 B2 JP 2971295B2 JP 5151527 A JP5151527 A JP 5151527A JP 15152793 A JP15152793 A JP 15152793A JP 2971295 B2 JP2971295 B2 JP 2971295B2
Authority
JP
Japan
Prior art keywords
document
target
database
elements
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5151527A
Other languages
English (en)
Other versions
JPH06203067A (ja
Inventor
アンウイル フイリス
亜矢子 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP5151527A priority Critical patent/JP2971295B2/ja
Priority to US08/149,661 priority patent/US5675815A/en
Publication of JPH06203067A publication Critical patent/JPH06203067A/ja
Priority to US08/451,569 priority patent/US5646840A/en
Priority to US08/451,553 priority patent/US5845143A/en
Priority to US08/452,336 priority patent/US5652896A/en
Application granted granted Critical
Publication of JP2971295B2 publication Critical patent/JP2971295B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【技術分野】本発明は、文書作成装置に関し、より詳細
には、2言語で文書を作成する装置で、特に母国語を原
言語にし、外国語を目的言語にした上で、原言語で目的
言語文書を作成する文書作成装置に関する。例えば、機
械翻訳装置,文書作成装置,文書作成支援装置等に適用
されるものである。
【0002】
【従来技術】原言語で目的言語文書を作成する装置とし
て、次の2種類が主要である。 機械翻訳 計算機を用いて、原言語の文書を文毎に翻訳する装置。 穴埋め(例1:Macintosh版バイリンガルレター作成
ソフト"Ambassador" 例2:斉藤,富田:「外国語手紙文の自動作成につい
て」自然 言語処理技術シンポジウム 昭和59年11月 P97〜P10
6) 定型文書(手紙,ビジネスレター等)でよく利用している
テンプレートを用意し、固有データを原言語でユーザに
入力させる装置。さらに、外国語で文書を作成する支援
のために、次のツールもある。 grammar checkers, spell checkers 等 単語のつづりや文法的な間違い等を抽出し、ユーザに知
らせる装置。 outline aids 等 文書の概略(アウトライン)を有効に作成し、概略に基
づいて文書を作成する装置。
【0003】しかしながら、前記 機械翻訳において
は、文毎に翻訳する技術なので、文書の構成の知識を利
用していない。また、前記 穴埋めにおいては、文書
の構成を注目しているが、テンプレートを選択する仕様
として、メニュー等からの選択しかないシステムがほと
んどである。つまり、原文書の構成との関係はない(更
に、典型テンプレート以外で言いたいことが生じても、
全く対応できない)。さらに、前記 Outline aids,
grammar checkers, spell checkers 等においては、主
には、こういうものは1か国語しか使用できないもので
ある。つまり、出力文書の言語と違う言語で入力できる
装置ではない。
【0004】また、文書テンプレートを用いた文書作成
支援装置として、母国語または外国語の文書作成システ
ムが市販されている。これらは、手紙文など定型的な文
書の作成において、利用者があらかじめ用意されたテン
プレートを選択し、固有名詞や数値などの可変データを
穴埋め式に入力して文書を完成させるものである。テン
プレート以外に述べたい事柄がある場合には、文例集な
どを参考に利用者が自分で文を作成し、文書に挿入しな
ければならない。文書テンプレートの選択方式として
は、メニューによる選択やキーワード検索などの手段が
提供されているものがある。
【0005】
【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、原言語の文書の構成を分析し、その分析の結果
の上で目的言語における適切な典型文書構造を選択し、
選択した構造に基づいて文書を生成すること、また、原
文書から要求情報を抽出すること、また、ユーザが生成
した文書を柔軟に編集できるようにすること、また、文
書構造が文書構成要素の集合から成る点を利用して、述
べたい事柄から文書構造が選択できるようにすること、
また、原文の文書要素集合と文書構造データベースの複
数の文書構造が同じ適合度を持つ時に、文書構造を一つ
に決定すること、また、重要な文書要素と比較的重要で
ない文書要素を生成編集過程で同じように扱うため、利
用者はどの文が重要なのかわからないので、編集に際し
て文書構成要素の重要度に対応した文章編集を可能とす
ること、さらに、ひとつの文書構造からは常に同じ文章
しか生成できず、ワンパターンになるのを防止するため
に、柔軟な文章の生成を可能とし、文書要素の選択がよ
り自由で簡単で効率的に行えるようにした文書作成装置
を提供することを目的としてなされたものである。
【0006】
【構成】本発明は、上記目的を達成するために、(1)
原言語の文書を入力する文書入力手段と、原言語の文書
を構成する文書構成要素を複数持つ原文書構成要素デー
タベースと、前記文書構成要素を原言語の文書から検出
し、原文書を解析して文書構成要素を抽出する原文書分
析手段と、目的言語における典型文書構造を複数持つ典
型文書データベースと、前記原文書分析手段により得た
文書構成要素と前記典型文書データベースにある典型文
書構造の要素との適合度を評価し、適合度の高い目的文
書構造を選択する目的文書構造選択手段と、該目的文書
構造選択手段により選択された構造が必要とする情報を
原文書から抽出して目的言語に変換して生成された文に
入れ、その組み合せによって目的言語文書を生成する文
書生成手段と、該文書生成手段により生成された目的言
語文書を編集する文書編集手段とを有すること、更に
は、(2)前記文書構成要素データベースにある原言語
の文書構成要素と対応する目的言語の文書構成要素を複
数持つ目的文書構成要素データベースと、前記原文書分
析手段により検出された原言語の文書構成要素と対応す
る目的言語の文書構成要素を前記目的文書構成要素デー
タベースから検索する目的言語要素検索手段と、該目的
言語要素検索手段により得た対応する目的言語の文書構
成要素を集合する要素集合手段と、該要素集合手段によ
り得た目的言語の文書構成要素の集合と前記典型文書デ
ータベースにある典型文書との適合を評価し、適合
の高い目的文書構造を選択する目的文書構造選択手段と
を有すること、更には、(3)前記(1)又は(2)に
おいて、前記原文書構成要素データベースにある目的言
語の文書構成要素の集合で記述する目的文書構造を複数
持つ典型文書データベースと、前記要素集合手段により
得た目的言語の文書構成要素の集合と前記典型文書デー
タベースにある文書構成要素の集合との類似度を評価
し、類似の最大文書構造を選択する目的文書構造選択手
段とを有すること、或いは、(4)文書を構成する文書
要素の情報を保持する文書要素データベースと、文書要
素の集合である文書構造の情報を保持する文書構造デー
タベースと、各文書要素に対応する文を生成するための
情報を保持する文パターンデータベースと、前記文書要
素を前記文書要素データベースから選択するための文書
要素選択手段と、該文書要素選択手段により得られた文
書要素に基づき、文書構造を検索する文書構造検索手段
と、該文書構造検索手段により検索された文書構造に基
づき、前記文パターンデータベースの情報を用いて目的
文書を生成する文書生成手段と、該文書生成手段により
生成された目的文書を編集するための編集手段とを有す
ること、更には、(5)前記(4)において、前記文書
要素選択手段が文書要素データベースから選択可能な文
書要素を提示し、その中から選択した文書要素を選択し
た文書要素とすること、更には、(6)前記(4)にお
いて、前記文書要素選択手段が自然言語の表現を受け付
け、自然言語で入力したキーに対応する文書構成要素を
検索し、検索された文書構成要素を選択した文書構成要
素とすること、更には、(7)前記(4)において、前
記文書構造検索手段が検索した文書構造が複数ある場合
に、前記文書要素選択手段が再選択された文書要素を以
前に選択された文書要素とあわせて選択した文書要素と
するとともに、前記文書構造検索手段が検索した文書構
造が一つだけになるまで処理を繰り返すこと、更には、
(8)前記(7)において、前記文書構造検索手段が検
索した文書構造が複数ある場合に、該文書構造検索手段
により検索された文書構造に含まれる文書要素でまだ選
択されていないものを提示する文書要素提示手段を有
し、前記文書要素提示手段により提示された文書要素の
中から選択した文書要素を以前に選択された文書要素と
あわせて選択した文書要素とすること、更には、(9)
前記(7)において、前記文書構造検索手段が検索した
文書構造が複数ある場合に、前記文書要素提示手段が文
書構造検索手段により検索された文書構造に含まれる文
書要素でまだ選択されていないものの内、文書構造の識
別力が高いもののみを提示し、文書要素選択手段が提示
された文書要素の中から選択した文書要素を以前に選択
された文書要素とあわせて選択した文書要素とするこ
と、或いは、(10)原文書から文書要素を検出する原
文書分析手段と、文書を構成する文書要素の情報を保持
する文書要素データベースと、目的文書を構成する文書
要素とその文書要素の重要度情報とを集合としてまと
め、目的文書毎に保持するようにした目的文書構造デー
タベースと、各文書要素に対応する文を生成するための
情報を保持する文パターンデータベースと、前記原文書
の文書要素の集合と前記目的文書構造データベースの文
書要素との適合度を文書要素の重要度を用いて求め、
の適合度を用いて目的文書の文書構造を決定する目的文
書構造決定手段と、該目的文書構造決定手段で決定した
文書構造に基づいて文パターンデータベースの情報から
目的文書を生成する文書生成手段と、該文書生成手段に
より生成された目的文書を編集するための文書編集手段
とを有すること、或いは、(11)文書を構成する文書
要素の情報を保持する文書要素データベースと、目的文
書を構成する文書要素とその文書要素の重要度情報とを
集合としてまとめ、目的文書毎に保持する目的文書構造
データベースと、各文書要素に対応する文を生成するた
めの情報を保持する文パターンデータベースと、文書要
素を選択するための文書要素選択手段と、選択した文書
要素の集合と前記目的文書構造データベースの文書要素
との適合度を文書要素の重要度を用いて求め、この適合
度を用いて目的文書の文書構造を決定する目的文書構造
決定手段と、該目的文書構造決定手段で決定した文書構
造に基づいて、文パターンデータベースの情報から目的
文書を生成する文書生成手段と、該文書生成手段により
生成された目的文書を編集するための文書編集手段とを
有すること、更には、(12)前記(10)又は(1
1)において、前記文書生成手段が、文書要素の重要度
に応じて対応する文の表示方法を変えること、更には、
13)前記(10)又は(11)において、前記目的
文書構造決定手段により決定された文書構造の文書要素
のうち、重要度が低く、かつ原文書の文書要素集合また
は利用者が選択した文書要素集合に含まれないものに対
応する文を生成しないこと、成いは、(14)原文書か
ら文書要素を検出する原文書分析手段と、文書を構成す
る文書要素の情報を保持する文書要素データベースと、
目的文書に対する重要度情報とその目的文書を構成する
文書構造の集合を目的文書毎に保持する目的文書構造デ
ータベースと、各文書要素に対応する文を生成するため
の情報を保持する文パターンデータベースと、前記原文
書の文書要素の集合と前記目的文書構造データベースの
文書要素との適合度を目的文書の重要度を用いて求め、
この適合度を用いて目的文書の文書構造を決定する目的
文書構造決定手段と、該目的文書構造決定手段で決定し
た文書構造に基づいて、文パターンデータベースの情報
から目的文書を生成する文書生成手段と、該文書生成手
段により生成された目的文書を編集するための文書編集
手段とを有すること、或いは、(15)文書を構成する
文書要素の情報を保持する文書要素データベースと、
的文書に対する重要度情報とその目的文書を構成する文
書構造の集合を目的文書毎に保持する目的文書構造デー
タベースと、各文書要素に対応する文を生成するための
情報を保持する文パターンデータベースと、文書要素を
選択するための文書要素選択手段と、選択した文書要素
の集合と前記目的文書構造データベースの文書要素との
適合度を目的文書の重要度を用いて求め、この適合度を
用いて目的文書の文書構造を決定する巨的文書構造決定
手段と、該目的文書構造決定手段で決定した文書構造に
基づいて、文パターンデータベースの情報から目的文書
を生成する文書生成手段と、該文書生成手段により生成
された目的文書を編集するための文書編集手段とを有す
ることを特徴としたものである。以下、本発明の実施例
に基づいて説明する。
【0007】図1は、本発明による文書作成装置の一実
施例(請求項1)を説明するための構成図で、図中、1
は原文書入力部、2は原文書分析(解析)部、3は目的
文書選択部、4は目的文書生成部、5は目的文書編集部
であり、6は原文書からの抽出部で、7はユーザとの対
話部、8は制御部、9は文書構成要素データベース、1
0は典型文書データベースである。ここでは、原言語で
文書を入力する入力部,目的言語で文書を編集する編集
部とユーザとの対話部を外部に持つ場合を示している。
【0008】ユーザが原文書入力部1で原言語の文書を
本装置に入力する。文書構成要素データベース9には、
文書を構成する構成要素を蓄えており、入力された文書
を原文書分析部2によって分析(解析)し、原言語の文
書(原文書)から文書構成要素データベース9中の文書
要素を検出する。典型文書データベース10には、典型
文書と文書の構造と構造の構成要素集合を蓄えており、
前記原文書分析部により検出している原文書構成要素を
用い、さらに、必要に応じて、典型文書データベース1
0から典型文書を選択した後で、原文書から抽出部6や
ユーザとの対話部7によって必要な情報を獲得し、目的
文書選択部3によって原文書に類似する典型文書(構
造)を典型文書データベース10から選択する。目的文
書生成部4によって選択された典型文書を用い目的文書
を生成する。生成した文書をユーザが目的文書編集部5
で編集する。
【0009】前述の請求項1の説明では、原言語文書要
素を用い、適合度を評価して典型文書を選択するが、請
求項2では、原言語文書要素を目的言語の文書要素と対
応付け、その目的言語要素を用い、適合度を評価して典
型文書を選択する。さらに、請求項3では、適合度を評
価する方法の一つとして、原文書から得た目的言語文書
要素を集合し、その集合と典型文書データベースにある
文書構造に定義された文書要素の集合との類似度を評価
する方法を提案した。
【0010】図2は、本発明による文書作成装置の動作
を説明するためのフローチャートである。以下、各ステ
ップに従って順に説明する。step1 :ユーザが入力した原文書から文書構成要素デー
タベースに蓄えてある要素を検出する。step2 :検出した原言語の要素と対応する目的言語の構
成要素を文書構成要素データベースから検索する。step3 :検索した目的言語の構成要素を集合する。step4 :要素集合と適合する典型文書構造を典型文書デ
ータベースから選択する。step5 :選択した文書構造に基づいて、目的言語文書を
生成する。
【0011】まず、図9(a)〜(c)は、本発明で使
用する典型文書データベースの一実施例を示す図であ
る。すなわち、目的言語における典型文書構造を蓄えて
いるDBである。この例には、3つの典型文書を示し
て、それぞれのラベルが「基本アブストラクト」(図
(a)),「以前からの展開」(図(b)),「問題の解決」(図
(c))である。各文書には構造があって、その構造を構
成する要素がある。例えば、「this_paper」,「prior_w
ork」,「implement」等がこの目的文書構成要素であ
り、investigation, prior_work, this_paper, advanta
ges, implement という要素の組み合わせが「以前から
の展開」という文書の構造である。
【0012】次に、図8は、本発明に使用する文書構成
要素データベースの一実施例を示す図である。すなわ
ち、典型文書構造を構成する要素がこのDBに蓄積され
ている。例えば、図9で示した典型文書DBの例で利用
している構成要素「this_paper」,「prior_work」,「im
plement」等がある。そして、その目的言語の構造構成
要素(目的文書構成要素)を検索するための原言語の文
書構成要素、例えば、「この論文」,「これまで」,「実
現」等がある。この原言語の文書構成要素を原文書から
検出する。
【0013】次に、図3〜図7と図2に基づいて、本発
明による文書作成装置の動作を説明する。図3は、原言
語で入力した文書の例を示す。まず、この原文から文書
構成要素DB中の原言語文書構成要素を検出する。図4
(a)は、検出の結果の例を示す。それから、文書構成
要素DBを用い、検出結果にある各原言語文書構成要素
に対応する目的言語における要素を検索する。図4
(b)は、この検索結果の例を示す。それから、この目
的言語の文書要素を集合し、その集合に適合する文書構
造を典型文書DBから選択する。図4(c)は、選択さ
れている文書構造の例を示す。それから、典型文書構造
を用い、典型文書の文を生成する。図5(a)は、典型
文書構造にあった構成要素の例を示し、図5(b)は、
各要素によって生成した文の例を示す。図5(b)で大
文字で書いている単語や括弧で囲んでいる節は、構造が
要求する情報(構造上そこに入るべき項目)を表す。こ
の情報を原文書から抽出し、目的言語に変換して生成さ
れた文に入れる。図6はその結果の例を示す。図5
(b)や図6をユーザに表示してユーザが編集すること
ができる。その結果が図7である。
【0014】以上説明した文書作成装置は、文書の論理
構造に着目して固定された文書テンプレートではなく、
文書を構成する要素(以下、「文書要素」と呼ぶ)の配
列としての文書構造を用いた文書作成装置である。すな
わち、原文書を解析して文書構成要素を抽出するこ
と、抽出された文書構成要素の集合と最も適合する目
的文書構造をデータベースの中から検索すること、検
索された文書構造に基づいて目的文書を生成すること、
上記で生成された目的文書を利用者が編集すること、
を構成としている。しかしながら、原文書の存在を前提
としており、原文書がない場合に適切な目的文書構造を
選択するための手段を備えていないものである。そこ
で、原文書なしの文書作成に応用するための手段を提供
する他の実施例(請求項4〜9)について、以下に説明
する。
【0015】以下、英語論文の抄録を作成する場合を例
に説明する。請求項4〜6図10(a)〜(c)は、本
発明で使用するデータベースの内容例である。図(a)
は、文書要素データベースであり、文書を構成する要素
の集合である。各文書要素は、利用者が目的文書で述べ
たい事柄に対応し、それぞれ利用者に提示するためのラ
ベル,対応する文パターンID,検索用キーワードの情
報を有する。図(b)は、文書構造データベースであ
る。この文書構造データベースは、文書要素の配列とし
て定義される文書の典型構造の集合である。図(c)
は、文パターンデータベースである。この文パターンデ
ータベースは、先に提案した特願平3−351636号
で用いられている文パターンデータベースと同じデータ
構造を持つものであり、本来、各文パターンを構成する
各節パターンの情報,各節パターンの別候補情報などを
保持するものであるが、ここではID番号と本データベ
ース情報から生成される文の一例を併記したものを示
す。
【0016】図11は、本発明による文書作成装置の他
の実施例の動作を説明するためのフローチャートであ
る。以下、各ステップに従って順に説明する。step1 :文書要素の選択:利用者がこれから作成しよう
とする文書(この例では英語論文抄録)で述べたい事柄
を文書要素データベースの中から選択する。選択された
文書要素は、図13(a)〜(c)のような選択要素集
合として記憶される。step2 :文書構造の検索:前記step1で記憶した選択要
素集合に適合する文書構造を文書構造データベースから
検索する。step3 :文書の生成:前記step2で検索された文書構造
に基づいて、当該文書構造を構成する各文書要素に対応
する文を文パターンデータベースの情報から生成する。step4 :文書の編集:前記step3で生成された文書を表
示し、利用者が編集する。
【0017】次に、図11に示した各ステップについて
例を基に処理の流れを説明する。step1 :文書要素の選択 文書要素を選択する際のユーザインタフェースの一例と
して、文書要素データベースの文書要素を利用者に提示
し、利用者がその中からいくつかを選択するメニュー方
式について説明する。まず、図12(a)のように、選
択可能な文書要素を表示する。利用者はその内、目的文
書で述べたいと思う事柄を選択する。例えば、「本研究
の特徴」,「実装条件」,「本研究の概略」,「以前の研
究」の4つを選択したとする。なお、文書要素の提示を
行う前に、文書の分野や目的を選択しておくなどして、
表示する文書要素をあらかじめふるいにかけておく方式
をとってもよい。利用者が選択した文書要素のID番号
は、図13(a)のような選択要素集合として記憶さ
れ、step2に渡される。
【0018】別の例として、利用者が自然言語で目的文
書で述べたい事柄を入力する方式について説明する。例
えば、利用者が以下のような4つのキーを入力したとす
る。すなわち、前回の研究について、今回の研究の
特徴、研究概要、実装の条件、を入力したとする。
利用者が入力した各キーについて、文書要素データベー
スの検索用キーワードと照合して、それぞれ対応する文
書要素を検索する。その結果、「前回の研究について」
からはC001が、「今回の研究の特徴」からはC004が、
「研究概要」からはC006が、「実装の条件」からはC0
05が検索される。検索された文書要素は、前述のよう
に、図13(a)のような選択要素集合として記憶さ
れ、step2に渡される。
【0019】step2:文書構造の検索 前述した実施例(請求項1〜)の方式を用い、選択要
素集合に基づいて文書構造を検索する。これは、原文書
から抽出した文書要素の集合と、文書構造データベース
の各文書構造との適合度を評価し、最も適合度の高い文
書構造を検索する方式である。この方式を応用して、文
書構造データベースの文書構造の中から、図13(a)
の選択要素集合に適合する文書構造としてD002を検
索することができる。
【0020】step3:文書の生成 前記step2で選択された文書構造D002に基づいて、目
的文書を生成する。文の生成には、先に提案した特願平
3−175944号の方式を用いる。第一の文書要素C
006に対応する文が文パターンデータベースの情報から
生成される。同様に、C001,C003,C004,C005に対
応する文がそれぞれ生成され、目的文書が生成される。
図15(a)は、生成された文書の例である。
【0021】step4:文書の編集 前記step3で生成した文書を表示し、利用者が編集す
る。この時の編集方式としては、すでに提案されている
対話による方式などを用いることができる。図15
(b)は、利用者が編集した文書の例である。
【0022】請求項7 全体の処理の流れは、図11で示した実施例の流れとほ
ぼ同じである。但し、step2で検索した文書構造が
複数の場合、step1に戻って利用者に再度文書要素
の選択を行わせ、検索される文書構造が一つだけになる
まで、この処理を繰り返す点が異なる。step3,4
の内容は請求項4〜6の実施例と同様である。
【0023】図14(a)はstep1からstep2への処理
の流れを示すフローチャートである。以下、図13
(b)の選択要素集合を例に図14に基づいて説明す
る。step1 :図13(b)の選択要素集合が記憶された。step2−1 :文書データベースの中から、図13(b)
の選択要素集合と同じ文書要素を含む文書構造を検索す
る。その結果、D002,D006の2つの文書構造が検索さ
れる。step2−2 :前記step2−1で文書構造が複数検索され
ていれば、前記step1へ戻り、1つだけなら次のstep3
へ進む。2つの文書構造が検索されているので、前記st
ep1へ進む。step1 :利用者が文書要素を再度選択する。選択された
文書要素を図13(c)のように選択要素集合に加え、
次のstep2−1へ進む。step2−1 :文書データベースの中から、図13(c)
の選択要素集合と同じ文書要素を含む文書構造を検索す
る。その結果、D002が検索される。step2−2 :前記step2−1で検索された文書構造が一
つだけなので、step3へ進む。 以下、step3,step4は請求項5〜7の実施例と同様で
ある。
【0024】請求項8 請求項の実施例で説明した文書要素の再選択をシステ
ム主導で行う方式について説明する。図14(b)は、
システム主導方式のstep1からstep2への処理
の流れを示すフローチャートである。以下、各ステップ
に従って順に説明する。step1〜step2−1 :請求項の実施例と同様
に、図13(b)の選択要素集合により、文書構造D0
02とD006が検索される。step2−2 :前記step2−1で文書構造が複数
検索されていれば、次のstep2−3へ、1つだけな
ら、step3へ進む。step2−3 :前記step2−1で検索された文書
構造に含まれる文書要素の内、選択要素集合に含まれな
いものを表示する。すなわち、D002とD006に含
まれる文書要素の内、C003,C006,C008,
C040を表示する。図12(b)は、その表示例であ
る。step1 :利用者は表示された文書要素の中から目的
文書で述べたい事柄を選択する。選択された文書要素を
図13(c)のように選択要素集合に加え、次のste
p2−1へ進む。step2−1 :文書データベースの中から、図13
(c)の選択要素集合と同じ文書要素を含む文書構造を
検索する。その結果、D002が検索される。step2−2 :前記step2−1で検索された文書
構造が一つだけなので、次のstep3へ進む。以下、
step3,step4は請求項4−6の実施例と同様
である。
【0025】請求項9 システム主導方式の別な方式を説明する。処理の流れは
請求項の実施例と同じく、図14(b)に示したもの
である。step1 :step1でC001のみが選択された。step2−1 :文書構造D001,D002,D00
6の三つが検索される。step2−2 :三つの文書構造が検索されているの
で、次のstep2−3へ進む。step2−3 :前記step2−1で検索された文書
構造に含まれる文書要素で選択要素集合に含まれないも
ののうち、文書構造識別力の高い文書要素のみを表示す
る。前記step2−1で検索された文書構造に含ま
れ、かつ選択要素集合に含まれない文書要素には、{C
004,C005,C006,C008,C012,C
021,C040,C105}の8つがあるが、このう
ちC004とC005はC002とC006の両方に含
まれるため、利用者がこれらを選択しても文書構造を一
つに決定することはできない。そこで、この二つを除い
た{C006,C008,C012,C021,C04
0,C105}のみを表示する。step1 :前記step2−3で表示された文書要素
を利用者が再選択する。C006を選択した。step2−1 :D002が検索される。step2−2 :前記step2−1で文書構造が一つ
だけ検索されたので、次のstep3へ進む。 以下、step3,step4は請求項4−6の実施例
と同様である。
【0026】以上説明した文書作成装置において、更に
以下の〜の点を改善する必要がある。すなわち、 原文の文書要素集合と文書構造データベースの複数
の文書構造が同じ適合度を持つ時に、文書構造を一つに
決定することができない。 重要な文書要素と比較的重要でない文書要素を生成
編集過程で同じように扱うため、利用者はどの文が重要
なのかわからない。したがって、編集に際しての重点も
わからない。 ひとつの文書構造からは常に同じ文章した生成でき
ず、ワンパターンである。 以下、上記〜の点を改善した実施例について説明す
る。
【0027】図16は、本発明による文書作成装置の他
の実施例を示す図で、図中、11は入力部、12は原文
書分析部、13は目的文書構造決定部、14は文書生成
部、15は文書編集部、16は文書要素データベース
(DB)、17は文書構造データベース(DB)、18
は文パターンデータベース(DB)である。原文書分析
部12は、原文書から文書要素を検出する。文書要素D
B16は、文書を構成する文書要素の情報を保持する。
目的文書構造DB17は、文書要素の集合である目的文
書の文書構造を複数保持し、各文書要素の重要度情報を
保持する。文パターンDB18は、各文書要素に対応す
る文を生成するための情報を保持する。目的文書構造決
定部13は、前記目的文書構造DBから、原文書の文書
要素の集合と適合する文書構造を決定する。文書生成部
14は、該目的文書構造決定部13で決定した文書構造
に基づいて、文パターンDB18の情報から目的文書を
生成する。文書編集部15は、該文書生成部14により
生成された目的文書を利用者が編集するためのものであ
る。
【0028】図17〜図20は、データベースの内容例
を示す図で、図17は文書要素DBの内容例、図18は
請求項10及び11における文書構造DBの内容例、図
19は請求項14及び15における文書構造DBの内容
例、図20は文パターンDBの内容例を各々示してい
る。図17において、各文書要素は、ID番号,対応す
る文パターン番号,対応する原文中の表層語句の情報を
有する。図18において、各文書構造は、複数の文書要
素の集合により定義されており、各文書要素には、重要
度の高い順にA,B,Cの3段階の重要度の情報を有す
る。図19において、各文書構造は、複数の文書要素の
集合と、重要度の高い順にA,B,Cの3段階の重要度
が付与されている。図20において、この文パターンD
Bは、本来、各文パターンを構成する各節パターンの情
報,各節パターンの別候補情報などを保持するものであ
るが、ここでは説明の簡略化のため、ID番号とDB情
報から生成される文の一例を併記したものを示す。
【0029】図24は、図16における文書作成装置の
動作処理を示すフローチャートである。以下、各ステッ
プに従って順に説明する。step1 :入力部11により、図21に示す原文が入
力されると、原文分析部12により、図22に示すよう
な文書要素が抽出される。step2 :目的文書構造決定部13が、文書構造DB
17中から、図22の文書要素の集合と最も適合する文
書構造を決定する。請求項13では、図18に一部を示
した文書構造DB17の中から、図23(a)の文書要
素集合に適合するものとして、文書構造D002とD0
07が候補となったときに、D002では、重要度Cの
文書要素C001が欠けているが、D007では、重要
度Aの文書要素C008が欠けているため、D002が
選択される。様に図19に一部を示した文書構造DB
17の中から、重要度が高いD002が選択される。
【0030】step3:文書生成部14が、文書構造
DB17の文書構造D002の文書要素情報と、文パタ
ーンDBの対応する情報を用いて目的文書を生成する。
この際、各文書構成要素の重要度情報に応じて、生成さ
れた文の表示方法を変える(請求項12)。図23
(a)は、生成された文書の例である。重要度Aの文書
構成要素に対応する文はボールド体で、重要度Bの文書
構成要素に対応する文は通常の字体で、重要度Cの文書
構成要素に対応する文はイタリック体で表示される。ま
た、請求項13の発明では、文書生成部14が目的文書
を生成する時に重要度がCで、かつ原文から抽出された
文書要素にも含まれない文書要素C001に対応する文
は生成しないため、図23(b)のような文書が生成さ
れる。これにより、一つの文書構造から異なった典型文
書を生成することが可能になる。step4:文書編集
部15により、利用者が生成された文書を編集するが、
このとき、利用者はどの文が重要であるかを一目で知る
ことができる。
【0031】以上のことにより、原文などの文書要素集
合と文書構造データベースの複数の文書構造が同じ適合
度を持つ時に、文書構造を一つに決定することができ、
また、重要な文書要素と比較的重要でない文書要素を生
成編集過程で同じように扱うことにより、利用者がどの
文が重要なのかわからなくなることを避け、編集に際し
て文書構成要素の重要度に対応した文章編集を可能と
し、さらに、ひとつの文書構造からは常に同じ文章しか
生成できず、ワンパターンになるのを防止するために、
柔軟な文章の生成を可能とする。
【0032】
【効果】以上の説明から明らかなように、本発明による
と、以下のような効果がある。 (1)請求項1に対応する効果:原文書の構成を分析
し、その結果の上で目的言語における適切な典型文書構
造を選択することが可能である。また、原文書から必要
情報を抽出するので、ユーザの手間を減らすことができ
る。 (2)請求項2に対応する効果:現言語の構成要素とと
もに目的言語の文書要素を得ることができる。 (3)請求項3に対応する効果:最も類似する典型文書
を選択することができる。 (4)請求項4に対応する効果:利用者が目的文書で述
べたい事柄を文書要素と対応させることにより文書構造
を選択するので、述べたい事柄に基づいて適切な文書構
造の目的文書を作成することができる。 (5)請求項5に対応する効果:選択可能な文書要素を
提示するので、利用者が簡単にかつ効率よく文書要素を
選択することができる。 (6)請求項6に対応する効果:自然言語で入力したキ
ーを基に文書要素を検索するので、利用者がより自由に
述べたい事柄を入力することができる。 (7)請求項7に対応する効果:文書構造がひとつに決
定できない場合に、勝手にデフォルトを決めたりせず、
文書構造が一つに決定できるまで文書要素を再選択する
ので、利用者の意図通りの文書構造を決定することがで
きる。 (8)請求項8に対応する効果:請求項8の作用効果に
加えて、システム主導で選択すべき文書要素を提示する
ので、利用者が簡単にかつ効率よく文書要素を選択する
ことができる。 (9)請求項9に対応する効果:請求項9の効果に加え
て、必要最小限の文書要素を選択するだけで文書構造が
決定できるので、利用者の負担を軽減することができ
る。 (10)請求項10,11に対応する効果:文書要素の
重要度を用いて目的文書構造を決定することにより、よ
り効率的な文章構造の決定が行える。 (11)請求項10,11,12に対応する効果:文書
要素の重要度により生成された文の表示方法を変えるこ
とにより、より効率的な文章の編集が行える。 (12)請求項10,11,13に対応する効果:重要
度が低い文書要素に対応する文の生成を抑制することに
より、一つの文書構造から、より柔軟に文書を生成でき
る。 (13)請求項15,16に対応する効果:文書構造の
重要度を用いて目的文書構造を決定することにより、よ
り効率的な文章構造の決定が行える。
【図面の簡単な説明】
【図1】 本発明による文書作成装置の一実施例を説明
するための構成図である。
【図2】 本発明による文書作成装置の動作を説明する
ためのフローチャートである。
【図3】 本発明の原言語の文書を示す図である。
【図4】 本発明の原文書の要素とそれに対応する目的
言語要素,適合する典型文書を示す図である。
【図5】 本発明の典型文書の構成要素とそれに対応し
て生成されたセンテンスを示す図である。
【図6】 本発明の原文書から抽出要求情報を生成した
文に挿入した結果を示す図である。
【図7】 本発明のユーザが編集した結果を示す図であ
る。
【図8】 本発明の文書構成要素データベースの例を示
す図である。
【図9】 本発明の典型文書データベースの例を示す図
である。
【図10】 本発明によるデータベースの内容例を示す
図である。
【図11】 本発明による文書作成装置の他の実施例の
動作を説明するためのフローャートである。
【図12】 本発明による文書要素選択時のユーザイン
タフェース例を示す図である。
【図13】 本発明による選択要素集合の例を示す図で
ある。
【図14】 本発明によるシステム主導方式のフローチ
ャートである。
【図15】 本発明の文書例を示す図である。
【図16】 本発明による文書作成装置の他の実施例を
示す図である。
【図17】 本発明における文書要素DBを示す図であ
る。
【図18】 本発明における文書構造DB(請求項1
0,11)を示す図である。
【図19】 本発明における文書構造DB(請求項
4,15)を示す図である。
【図20】 本発明における文パターンDBを示す図で
ある。
【図21】 本発明における原文を示す図である。
【図22】 本発明における原文書の文書要素集合を示
す図である。
【図23】 本発明における生成文書例を示す図であ
る。
【図24】 本発明による文書作成装置の更に他の実施
例の動作を説明するためのフローチャートである。
【符号の説明】
1…原文書入力部、2…原文書分析(解析)部、3…目
的文書選択部、4…目的文書生成部、5…目的文書編集
部、6…原文書からの抽出部、7…ユーザとの対話部、
8…制御部、9…文書構成要素データベース、10…典
型文書データベース。
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06F 17/20 - 17/21 G06F 17/27 - 17/28

Claims (15)

    (57)【特許請求の範囲】
  1. 【請求項1】 原言語の文書を入力する文書入力手段
    と、原言語の文書を構成する文書構成要素を複数持つ原
    文書構成要素データベースと、前記文書構成要素を原言
    語の文書から検出し、原文書を解析して文書構成要素を
    抽出する原文書分析手段と、目的言語における典型文書
    構造を複数持つ典型文書データベースと、前記原文書分
    析手段により得た文書構成要素と前記典型文書データベ
    ースにある典型文書構造の要素との適合度を評価し、適
    合度の高い目的文書構造を選択する目的文書構造選択手
    段と、該目的文書構造選択手段により選択された構造が
    必要とする情報を原文書から抽出して目的言語に変換し
    て生成された文に入れ、その組み合せによって目的言語
    文書を生成する文書生成手段と、該文書生成手段により
    生成された目的言語文書を編集する文書編集手段とを有
    することを特徴とする文書作成装置。
  2. 【請求項2】 前記文書構成要素データベースにある原
    言語の文書構成要素と対応する目的言語の文書構成要素
    を複数持つ目的文書構成要素データベースと、前記原文
    書分析手段により検出された原言語の文書構成要素と対
    応する目的言語の文書構成要素を前記目的文書構成要素
    データベースから検索する目的言語要素検索手段と、該
    目的言語要素検索手段により得た対応する目的言語の文
    書構成要素を集合する要素集合手段と、該要素集合手段
    により得た目的言語の文書構成要素の集合と前記典型文
    書データベースにある典型文書との適合を評価し、適
    の高い目的文書構造を選択する目的文書構造選択手
    段とを有することを特徴とする請求項1記載の文書作成
    装置。
  3. 【請求項3】 前記原文書構成要素データベースにある
    目的言語の文書構成要素の集合で記述する目的文書構造
    を複数持つ典型文書データベースと、前記要素集合手段
    により得た目的言語の文書構成要素の集合と前記典型文
    書データベースにある文書構成要素の集合との類似度を
    評価し、類似の最大文書構造を選択する目的文書構造選
    択手段とを有することを特徴とする請求項1又は2記載
    の文書作成装置。
  4. 【請求項4】 文書を構成する文書要素の情報を保持す
    る文書要素データベースと、文書要素の集合である文書
    構造の情報を保持する文書構造データベースと、各文書
    要素に対応する文を生成するための情報を保持する文パ
    ターンデータベースと、前記文書要素を前記文書要素デ
    ータベースから選択するための文書要素選択手段と、該
    文書要素選択手段により得られた文書要素に基づき、文
    書構造を検索する文書構造検索手段と、該文書構造検索
    手段により検索された文書構造に基づき、前記文パター
    ンデータベースの情報を用いて目的文書を生成する文書
    生成手段と、該文書生成手段により生成された目的文書
    を編集するための編集手段とを有することを特徴とする
    文書作成装置。
  5. 【請求項5】 前記文書要素選択手段が文書要素データ
    ベースから選択可能な文書要素を提示し、その中から選
    択した文書要素を選択した文書要素とすることを特徴と
    する請求項4記載の文書作成装置。
  6. 【請求項6】 前記文書要素選択手段が自然言語の表現
    を受け付け、自然言語で入力したキーに対応する文書構
    成要素を検索し、検索された文書構成要素を選択した文
    書構成要素とすることを特徴とする請求項4記載の文書
    作成装置。
  7. 【請求項7】 前記文書構造検索手段が検索した文書構
    造が複数ある場合に、前記文書要素選択手段が再選択さ
    れた文書要素を以前に選択された文書要素とあわせて選
    択した文書要素とするとともに、前記文書構造検索手段
    が検索した文書構造が一つだけになるまで処理を繰り返
    すことを特徴とする請求項4記載の文書作成装置。
  8. 【請求項8】 前記文書構造検索手段が検索した文書構
    造が複数ある場合に、該文書構造検索手段により検索さ
    れた文書構造に含まれる文書要素でまだ選択されていな
    いものを提示する文書要素提示手段を有し、前記文書要
    素提示手段により提示された文書要素の中から選択した
    文書要素を以前に選択された文書要素とあわせて選択し
    た文書要素とすることを特徴とする請求項7記載の文書
    作成装置。
  9. 【請求項9】 前記文書構造検索手段が検索した文書構
    造が複数ある場合に、前記文書要素提示手段が文書構造
    検索手段により検索された文書構造に含まれる文書要素
    でまだ選択されていないものの内、文書構造の識別力が
    高いもののみを提示し、文書要素選択手段が提示された
    文書要素の中から選択した文書要素を以前に選択された
    文書要素とあわせて選択した文書要素とすることを特徴
    とする請求項7記載の文書作成装置。
  10. 【請求項10】 原文書から文書要素を検出する原文書
    分析手段と、文書を構成する文書要素の情報を保持する
    文書要素データベースと、目的文書を構成する文書要素
    とその文書要素の重要度情報とを集合としてまとめ、目
    的文書毎に保持するようにした目的文書構造データベー
    スと、各文書要素に対応する文を生成するための情報を
    保持する文パターンデータベースと、前記原文書の文書
    要素の集合と前記目的文書構造データベースの文書要素
    との適合度を文書要素の重要度を用いて求め、この適合
    度を用いて目的文書の文書構造を決定する目的文書構造
    決定手段と、該目的文書構造決定手段で決定した文書構
    造に基づいて文パターンデータベースの情報から目的文
    書を生成する文書生成手段と、該文書生成手段により生
    成された目的文書を編集するための文書編集手段とを有
    することを特徴とする文書作成装置。
  11. 【請求項11】 文書を構成する文書要素の情報を保持
    する文書要素データベースと、目的文書を構成する文書
    要素とその文書要素の重要度情報とを集合としてまと
    め、目的文書毎に保持する目的文書構造データベース
    と、各文書要素に対応する文を生成するための情報を保
    持する文パターンデータベースと、文書要素を選択する
    ための文書要素選択手段と、選択した文書要素の集合と
    前記目的文書構造データベースの文書要素との適合度を
    文書要素の重要度を用いて求め、この適合度を用いて目
    的文書の文書構造を決定する目的文書構造決定手段と、
    該目的文書構造決定手段で決定した文書構造に基づい
    て、文パターンデータベースの情報から目的文書を生成
    する文書生成手段と、該文書生成手段により生成された
    目的文書を編集するための文書編集手段とを有すること
    を特徴とする文書作成装置。
  12. 【請求項12】 前記文書生成手段が、文書要素の重要
    度に応じて対応する文の表示方法を変えることを特徴と
    する請求項10又は11記載の文書作成装置。
  13. 【請求項13】 前記目的文書構造決定手段により決定
    された文書構造の文書要素のうち、重要度が低く、かつ
    原文書の文書要素集合または利用者が選択した文書要素
    集合に含まれないものに対応する文を生成しないことを
    特徴とする請求項10又は11記載の文書作成装置。
  14. 【請求項14】 原文書から文書要素を検出する原文書
    分析手段と、文書を構成する文書要素の情報を保持する
    文書要素データベースと、目的文書に対する重要度情報
    とその目的文書を構成する文書構造の集合を目的文書毎
    に保持する目的文書構造データベースと、各文書要素に
    対応する文を生成するための情報を保持する文パターン
    データベースと、前記原文書の文書要素の集合と前記目
    的文書構造データベースの文書要素との適合度を目的文
    書の重要度を用いて求め、この適合度を用いて目的文書
    文書構造を決定する目的文書構造決定手段と、該目的
    文書構造決定手段で決定した文書構造に基づいて、文パ
    ターンデータベースの情報から目的文書を生成する文書
    生成手段と、該文書生成手段により生成された目的文書
    を編集するための文書編集手段とを有することを特徴と
    する文書作成装置。
  15. 【請求項15】 文書を構成する文書要素の情報を保持
    する文書要素データベースと、目的文書に対する重要度
    情報とその目的文書を構成する文書構造の集合を目的文
    書毎に保持する目的文書構造データベースと、各文書要
    素に対応する文を生成するための情報を保持する文パタ
    ーンデータベースと、文書要素を選択するための文書要
    素選択手段と、選択した文書要素の集合と前記目的文書
    構造データベースの文書要素との適合度を目的文書の重
    要度を用いて求め、この適合度を用いて目的文書の文書
    構造を決定する目的文書構造決定手段と、該目的文書構
    造決定手段で決定した文書構造に基づいて、文パターン
    データベースの情報から目的文書を生成する文書生成手
    段と、該文書生成手段により生成された目的文書を編集
    するための文書編集手段とを有することを特徴とする文
    書作成装置。
JP5151527A 1992-11-09 1993-05-28 文書作成装置 Expired - Fee Related JP2971295B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP5151527A JP2971295B2 (ja) 1992-11-13 1993-05-28 文書作成装置
US08/149,661 US5675815A (en) 1992-11-09 1993-11-09 Language conversion system and text creating system using such
US08/451,569 US5646840A (en) 1992-11-09 1995-05-26 Language conversion system and text creating system using such
US08/451,553 US5845143A (en) 1992-11-09 1995-05-26 Language conversion system and text creating system using such
US08/452,336 US5652896A (en) 1992-11-09 1995-05-26 Language conversion system and text creating system using such

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP4-328848 1992-11-13
JP32884892 1992-11-13
JP5151527A JP2971295B2 (ja) 1992-11-13 1993-05-28 文書作成装置

Publications (2)

Publication Number Publication Date
JPH06203067A JPH06203067A (ja) 1994-07-22
JP2971295B2 true JP2971295B2 (ja) 1999-11-02

Family

ID=26480751

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5151527A Expired - Fee Related JP2971295B2 (ja) 1992-11-09 1993-05-28 文書作成装置

Country Status (1)

Country Link
JP (1) JP2971295B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58201140A (ja) * 1982-05-20 1983-11-22 Toshiba Corp 文書作成装置
JPH01161576A (ja) * 1987-12-18 1989-06-26 Hitachi Ltd 文書作成装置

Also Published As

Publication number Publication date
JPH06203067A (ja) 1994-07-22

Similar Documents

Publication Publication Date Title
JP4504555B2 (ja) 翻訳支援システム
JP4654780B2 (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US20080162115A1 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
JPH07325827A (ja) ハイパーテキスト自動生成装置
KR101835994B1 (ko) 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치
JP5112027B2 (ja) 文書群提示装置および文書群提示プログラム
JP2971295B2 (ja) 文書作成装置
JP3139658B2 (ja) 文書表示方式
JP2019121164A (ja) 文書作成装置、文書作成方法、データベース構築装置、データベース構築方法、およびプログラム
US20040054677A1 (en) Method for processing text in a computer and a computer
JP5016333B2 (ja) 文書作成支援装置及び文書作成支援プログラム
JP2785692B2 (ja) 辞書検索表示装置
JP4574186B2 (ja) 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置
JP6451414B2 (ja) 情報処理装置、要約文編集方法、及びプログラム
JP3710463B2 (ja) 翻訳支援辞書装置
JP3353647B2 (ja) 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体
JP2006163645A (ja) 情報検索方法、情報検索装置、情報検索プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器
JPH08137892A (ja) 文書検索方法及び文書検索装置
JP4368550B2 (ja) 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
Mohtaj et al. PerPaDa: A Persian Paraphrase Dataset based on Implicit Crowdsourcing Data Collection
JP2003173335A (ja) 自然言語対話装置及び方法並びに記憶媒体
JP2868256B2 (ja) プログラム編集装置
JPH08329059A (ja) 汎用参照装置
JP2000090110A (ja) 全文検索方法、装置、および全文検索プログラムを記録した記録媒体
JPH1115826A (ja) 文書解析装置及び方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees