JPH09223129A - 文書処理支援方法および文書処理支援装置 - Google Patents

文書処理支援方法および文書処理支援装置

Info

Publication number
JPH09223129A
JPH09223129A JP8028867A JP2886796A JPH09223129A JP H09223129 A JPH09223129 A JP H09223129A JP 8028867 A JP8028867 A JP 8028867A JP 2886796 A JP2886796 A JP 2886796A JP H09223129 A JPH09223129 A JP H09223129A
Authority
JP
Japan
Prior art keywords
document
template
information
expression
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8028867A
Other languages
English (en)
Inventor
Yoshimi Saito
佳美 齋藤
Hiroyasu Nogami
宏康 野上
Tatsuya Uehara
龍也 上原
Yumi Mizutani
由美 水谷
Kazuhiro Kimura
和広 木村
Tatsuya Dewa
達也 出羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP8028867A priority Critical patent/JPH09223129A/ja
Publication of JPH09223129A publication Critical patent/JPH09223129A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】文書作成を容易にする支援装置を提供するこ
と。 【解決手段】入力された文書を解析し、該文書中の、少
なくとも単語の情報を含む表現情報を抽出する入力文書
解析手段 104と、この解析手段にて得られた表現情報を
前記文書対応に保持する表現情報保持手段 105と、表現
情報保持部に保持された情報のうち文書間で共通する表
現を選別する表現比較選別手段 106と、この表現比較選
別手段により選別された表現情報を保持する共通表現情
報保持手段107と、この共通表現情報保持手段に保持さ
れた情報に基づいて表示情報を生成する表示文字列情報
生成手段 108とを具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書の作成支援
し、あるいは文書の理解を支援する文書処理支援方法お
よび文書処理支援装置に関する。
【0002】
【従来の技術】近年、電子技術や半導体技術、そして、
ソフトウエア技術の飛躍的な進歩に伴い、コンピュータ
(電子計算機)はますます小型化、高性能化され、ディ
スクトップサイズ、ノートブックサイズ、そして、サブ
ノートサイズと使い易いサイズのものが供給されると共
に、価格も手頃となっていることから、広く普及してい
る。
【0003】そして、コンピュータ技術を用いた専用機
としてのワードプロセッサや、コンピュータ・アプリケ
ーションとしてのワードプロセッサ・ソフトウエアの利
用が広まるにつれ、コンピュータ処理のもとに文書を作
成することは極めて一般的となりつつある。
【0004】そして、これら専用機、あるいはソフトウ
エアアプリケーションを問わず、ワードプロセッサ機能
等の使用により誰でもが簡易に、文書を入力できるよう
になっている。
【0005】また特に、近年は、コンピュータネットワ
ークの普及により、コンピュータをネットワークに接続
してコンピュータ相互の通信を手軽に行なうことができ
るようになり、コンピュータ上での文書の通信によるコ
ミュニケーションが一般化しつつある。そして、それに
伴い、コンピュータ上で文書を作成したり、あるいは読
む機会はさらに増大している。
【0006】しかし、文書作成にあたり、コンピュータ
への入力が必要となるが、その入力装置としては、キー
ボード入力をはじめ、音声認識技術を用いた音声入力装
置や文字認識技術を用いたOCR(光学的文字読取り装
置)などを利用することができるが、認識率、手間、シ
ステムコスト、作業環境などの点から、キーボードを用
いるのが最も一般的である。
【0007】ところが、作成したい文書をすべてキーボ
ードにより入力することはなお労力を要する作業であ
り、また、案文を練るのもなかなか骨の折れる作業であ
り、文章作成のための知識や技術を要するなど、コンピ
ュータによる一層の支援が求められている。
【0008】また、何時でも、どこからでもコンピュー
タ相互の通信が可能になっていることから、読むべき文
書の量も増大し、そのための労力が負担となることが懸
念されると共に、例えば、社内資料の配布などを考えた
場合、一部の内容の変更があって訂正した文書が再配布
されるようなケースなど、似通った文書を複数読む必要
が生じた場合には、同じ内容を2度読むなどの無駄な時
間や、あるいは内容の差異を掴むための負担、あるいは
内容の差異が掴めないためのあやふやな理解などの問題
が残る。
【0009】これらの問題を解決する方法のひとつとし
て、文書作成の観点では、文書作成用テンプレートの使
用がある。これは、予め定められた幾つかの文言を、定
められた順序に配置し、その間を用件に応じた文章を入
力できるような形式に整えたテンプレート文書を様々な
シーン対応に用意しておき、文書作成者は、目的のシー
ンのテンプレートを利用して、必要な箇所を文章で穴埋
めすることにより、文書を作成できるようにするという
ものである。
【0010】しかし、文書作成の支援においては、テン
プレートの使用で支援できるのは必然的に、形式的な部
分の作成に限られ、本来文書を書く際の目的であるとこ
ろの、個々の内容を持つ部分への作成が支援できず、不
十分なものであった。
【0011】また、文書読解の観点からは、2つの文書
の差異を表示するために、2つの文書を行毎に比較する
ツールが各種知られている。
【0012】しかしこれらは、比較の単位が行であり、
しかも、文字列が同じであるかどうかの比較であるた
め、類似した内容の文書のいくつかをまとめて理解する
のを支援するに至らないものである。
【0013】
【発明が解決しようとする課題】コンピュータ技術を用
いて文書作成する機会が増大し、それに伴って定型文を
作成する必要も増大しているが、定型文といっても様々
なシーン対応に適切な文書を練るにはなかなか骨が折れ
る仕事であり、また、その文書を入力するのも労を伴
う。そこで、様々シーン対応に定型文の雛形を用意し、
これをテンプレートとして使用することが行なわれてい
る。
【0014】しかし、文書作成の支援において、テンプ
レートの使用で支援できるのは必然的に、形式的な部分
の作成に限られ、本来文書を書く際の目的であるところ
の、個々の内容を持つ部分への作成が支援できず、埋め
なけれならない部分が多くて不十分なものである。さら
には、複数種あるテンプレートの中から最適なものを探
すのも一苦労であった。
【0015】すなわち、案内文、返信文、報告文などは
テンプレートにし易い文書であるが、これらのうち、特
に返信文は往信文に対する返書であるから書くべき内容
が自ずと決まって来る。このような場合に、往信文の内
容から埋めることができる語句も決まるので、空欄の多
いテンプレートを表示して穴埋めは人手に頼るのは余り
に原始的である。
【0016】従って、テンプレートの選択を容易に行う
ことができると共に、テンプレート中において、埋める
ことのできる空欄は空欄として残さず、できるだけ完成
された文として提示することができるようにした支援装
置の出現が嘱望される。
【0017】さらにテンプレート自体においても、必要
な形式のテンプレートは、既成のものではユーザからみ
て必要なものが網羅されているわけではなく、不十分な
ことが多くて、様々な場面に対応しきれないという問題
点もある。一方、作成した文そのまま、テンプレートと
して使用するという方法では、テンプレートとして個別
的に過ぎ、利用が難しい。従って、必要なテンプレート
を容易に取得することができるようにする支援装置の出
現が嘱望される。
【0018】また、似通った文書を比較して差異を知り
たい場合に、文書の差異を指摘する従来のツールでは、
比較の単位が行であり、しかも、その行内で文字列が同
じであるかどうかを比較する程度のものであるなど、機
能が低いものであり、類似した内容の文書のいくつかを
まとめて理解するのを支援するという観点から利用する
場合には、実用に耐えないものであった。従って、類似
文書の内容的な差異を提示することができて文書理解を
支援することができるようにした支援装置の出現が嘱望
される。
【0019】そこで、この発明の目的とするところは、
第1には、簡易に必要なテンプレートを入手できて、文
書作成を容易にする支援装置を提供することにある。ま
た、第2には、内容的に穴埋めできるものは自動的に穴
埋めして、完成度の高いテンプレートとして使用者に提
示することができるようにした支援装置を提供すること
にある。また、第3には、類似した内容の複数の文書間
で内容的に共通する部分を除いて提示することができる
ようにして、文書理解の効率向上を図るようにした支援
装置を提供することにある。
【0020】
【課題を解決するための手段】上記目的を達成するた
め。本発明は次のようにする。すなわち、第1には、入
力された文書を解析し、該文書中の、少なくとも単語の
情報を含む表現情報を抽出する入力文書解析手段と、こ
の入力文書解析手段により解析して得られた表現情報を
前記文書対応に保持する表現情報保持手段と、表現情報
保持部に保持された情報のうち文書間で共通する表現を
選別する表現比較選別手段と、上記表現比較選別手段に
より選別された表現情報を保持する共通表現情報保持手
段と、上記共通表現情報保持手段に保持された情報に基
づいて表示情報を生成する表示文字列情報生成手段とを
具備する。
【0021】あるいは、入力された文書を解析し、該文
書中の、少なくとも単語の情報を含む表現情報を抽出す
る入力文書解析手段と、この入力文書解析手段により解
析して得られた表現情報を前記文書対応に保持する表現
情報保持手段と、表現情報保持部に保持された情報のう
ち文書間で共通する表現を選別する表現比較選別手段
と、上記表現比較選別手段により選別された表現情報を
保持する共通表現情報保持手段と、上記共通表現情報保
持手段に保持された表現情報に基づいて表示情報を生成
する表示文字列情報生成手段と、上記共通表現情報保持
手段に保持された表現情報を一覧表示する手段と、この
一覧表示された情報を選択指定することにより、その選
択指定順にその表現情報を並べた表現による文書を作成
する手段とを具備する。
【0022】あるいは、入力された文書を解析し、該文
書中の、少なくとも単語の情報を含む表現情報を抽出す
る入力文書解析手段と、この入力文書解析手段により解
析して得られた表現情報を前記文書対応に保持する表現
情報保持手段と、表現情報保持部に保持された情報のう
ち文書間で共通する表現を選別する表現比較選別手段
と、上記表現比較選別手段により選別された表現情報を
保持する共通表現情報保持手段と、入力された文書のう
ちの特定の文書について、上記共通表現情報保持手段に
保持されている表現とそれ以外の表現とを、識別可能な
形態で文書表示する手段とを具備する。
【0023】このような構成において、文書作成者等
が、入力文書を指定すると、共通の表現の部分からテン
プレートの骨組みが生成され、簡易に必要なテンプレー
トを入手できる。あるいは、共通の表現を取り出して一
覧に表示し、文書作成を容易にする。あるいは、共通の
表現の部分を原文書において強調(または非強調=抑
制)して表示することにより文書理解の助けとすること
を可能とする。
【0024】また、本発明は、文書作成用テンプレート
を複数種保持するテンプレート保持手段と、自然言語で
書かれた文書を取り込む手段と、この取り込み手段によ
り取り込まれた文書を参照して得られた情報に基づき、
前記テンプレート保持手段の複数種の文書作成用テンプ
レートの中から最適テンプレートを選択するとともに、
前記取り込まれた文書を参照して得られた情報のうち、
前記選択した文書作成用テンプレートに埋め込み可能な
情報はそのテンプレートに埋め込んで出力するテンプレ
ート制御手段と、このテンプレート制御手段により得ら
れた文書作成用テンプレートを出力する手段とを具備す
る。
【0025】このような装置は、文書作成者が、作成し
ようとする文書と関連する文書、たとえば、往信文書に
対する返信文書、返信文書に対する往信文書を指定し、
往信文書、返信文書などの元になる文書(源文書)を入
力すると、その入力されて取り込まれた文書を解析し、
キーワードの検索、用件の抽出、質問箇所の抽出、丁寧
度の判定などを行ってその結果と、作成文書と源文書と
の関係、例えば返信であるという情報により、予め保持
されている複数種の文書作成用テンプレートから最も適
切な文書テンプレートを自動的に選択し、あるいそれに
源文書の情報を埋め込んでそれを文書作成者に提示させ
るようにしたことにより、文書作成者は、簡易に、最適
の文書作成用テンプレートを得ることができるようにし
た。
【0026】従って、使用者(文書作成者)は、簡易に
最適の文書作成用テンプレートを得ることができるよう
になる。
【0027】
【発明の実施の形態】以下に本発明の具体例を説明す
る。
【0028】はじめに、文書作成者等が入力文書を指定
すると、共通の表現の部分から文書作成用テンプレート
(以下、単にテンプレートと称する)の骨組みが生成さ
れ、簡易に必要なテンプレートを入手できるようにした
支援装置の例を説明する。
【0029】(第1の具体例)図1は、本発明に関わる
文書作成・理解支援装置の概略を表すブロック図であ
る。同図において、100は制御・処理部、101は入
力部、102は出力部である。
【0030】これらのうち、入力部101は、文書を入
力したり、コマンドを与えたり、編集作業を行なうため
のものであり、キーボードやマウス、トラックボール、
イメージスキャナ、フロッピディスク装置、ハードディ
スク装置、CD‐ROM装置、MO装置(光ディスク装
置)、DVD装置(ディジタルビデオディスク)、ある
いはネットワーク接続用の入力インターフェイスなどが
該当する。
【0031】また、制御・処理部100は本装置の制御
や文書解析、テンプレート生成、選択、表示などの処理
などを含む制御・処理の中枢を担うものであり、出力部
102は制御・処理部100の処理結果を出力するため
のもので、ディスプレイやプリンタ、あるいはネットワ
ーク接続用の出力インターフェイスなどが該当する。
【0032】制御・処理部100はさらに制御部10
3、入力文書解析部104、表現情報保持部105、表
現比較選別部106、共通表現情報保持部107、表示
文字列情報生成部108を備える。
【0033】これらのうち、制御部103は、文書の取
り込みやその取り込んだ文書の入力文書解析部104へ
の引き渡し、処理の起動、処理結果の保持制御、最終処
理結果の表示や出力のための処理制御機能を有するもの
であり、また、入力文書解析部104は、入力された文
書を解析し、該文書中の、少なくとも単語の情報を含む
表現情報を抽出するものである。但し、ここで単語とは
名詞、動詞などの自立語の他、助動詞や助詞などの付属
語、また、数字や句読点、括弧などの記号語を含めたも
のを指す。
【0034】また、表現情報保持部105は、この入力
文書解析部104が複数の文書を解析することにより得
た各文書毎の表現情報を保持するものであり、表現比較
選別部106は、表現情報保持部106に保持された情
報のうち、文書間で共通する表現を選別する処理を行な
うものである。
【0035】また、共通表現情報保持部107は、共通
表現情報、すなわち、その場面では日時や場所が変って
も共通に使用できる表現内容を保持するものである。ま
た、表示文字列情報生成部108は、共通表現情報保持
部107に保持された情報に基づいて表示情報を生成す
る処理を行なうものである。
【0036】このような構成において、入力部101か
らは、自然言語文書、例えば日本語で書かれた報告書な
どが取り込まれる。制御・処理部100における制御部
103ではこの入力部101から取り込まれた入力文書
を入力文書解析部104に渡し、当該入力文書解析部1
04では該文書中の、少なくとも単語の情報を含む表現
情報を抽出する。そして、制御部103はこれにより抽
出された表現情報を表現情報保持部105に保持させる
ように制御する。
【0037】次に制御部103は、表現比較選別部10
6による処理を実施させ、これにより表現比較選別部1
06は、表現情報保持部105に保持された情報のう
ち、文書間で共通する表現を選別する。つまり、固有名
詞や日付、曜日、場所といった状況に応じて変化する要
素と、その他の要素を選別し、文書間で共通する表現を
選別する。
【0038】共通表現情報保持部107は、表現比較選
別部106により選別された表現情報を保持する。制御
部103は表示文字列情報生成部108の機能を稼働さ
せ、これにより表示文字列情報生成部108は、共通表
現情報保持部107に保持された情報に基づいて表示情
報を生成する。表示文字列情報生成部108が生成した
表示情報は、制御部103の制御のもとに、出力部10
2に出力され、表示あるいはプリントに供され、あるい
は外部記憶媒体に記憶される。
【0039】これにより出力部102に出力された内容
は、入力文書から固有名詞や日付、曜日、場所といった
状況に応じて変化する要素を空欄とした残りの部分、す
なわち、文書間で共通する表現部分の文書となる。
【0040】以上、第1の具体例によれば、テンプレー
トにしたい文書がある時に、その文書を入力部より入力
すると、その文書中における状況対応に変化を伴う可能
性のある語の部分を空欄にし、他の文書でも共通に使用
できる部分は残して虫食い状態にしたテンプレートを生
成できる。従って、例文を与えるだけで、その例文に基
づくテンプレートを生成できる。
【0041】(第2の具体例)次に、2つの似たような
内容の文書から、必要とする文書のテンプレートを生成
する装置を説明する。図2はその具体的な構成例であ
り、図1に示した文書処理支援装置をベースにした構成
例を示すブロック図である。図において、101は入力
部、102は制御部、103は出力部である。制御部1
02はさらに、入力文書解析部104、表現情報保持部
105、表現比較選別部106、共通表現情報保持部1
07、辞書部209、解析結果保持部210、テンプレ
ート生成部211を備える。
【0042】辞書部209は入力文書の形態素解析など
に用いたり、あるいは文書作成に用いる各種辞書情報を
保持したものであり、入力文書解析部104はこの辞書
情報を用いて文書内容を形態素解析すると共に、構文解
析し、かかり受け関係にあると判定した単語と単語の組
合せの情報を取得する処理を行うものである。また、解
析結果保持部210はこの入力文書解析部104の解析
結果を含む処理結果を保持するためのものであり、テン
プレート生成部211は共通表現情報保持部107と辞
書部209の保持情報を用いてテンプレートを生成する
処理を行うものである。
【0043】辞書部209、解析結果保持部210およ
びテンプレート生成部211にて図1における表示文字
列情報生成部108を構成する。
【0044】次に、上記構成の本装置の作用を説明す
る。入力部101からは、自然言語文書、例えば日本語
で書かれた案内書や報告書などが取り込まれる。取り込
まれた入力文書を、辞書部209の情報を参照しなが
ら、入力文書解析部104で形態素解析し、形態素解析
結果は解析結果保持部210に保持する。
【0045】次に、形態素解析結果を入力文書解析部1
04で構文解析し、かかり受け関係にあると判定した単
語と単語の組合せの情報を表現情報保持部105に保持
する。
【0046】図3は解析結果保持部210に保持される
情報の例を、そして、図4は表現情報保持部105に保
持される情報の例を示した図であり、それぞれ、入力文
書の第1文目に「掲記の会議に参加した」という文言が
記述されていた場合の例である。
【0047】図3において、左から、番号欄は通し番号
を表し、順に“(1)”、“(2)”、“(3)”、
“(4)”、…といった具合に通し番号が付されて表示
される。文番号欄は“1‐1”、“1‐2”、“1‐
3”、“1‐4”…、といった具合に右と左の数字がハ
イフンで繋がれて表示され、ハイフンの左側が文書番
号、ハイフンの右側が文書中の文番号を表している。一
文は読点までの文字列であるが、タイトルや見出しの場
合には読点がないので、文字列の最後が空欄であるか或
いは改行であるかなどで判別し、タイトルや見出しと判
別された文字列はこれも一文として扱う。開始欄は文中
の開始文字位置を、終了欄は文中の終了文字位置を表
す。
【0048】例えば、「掲記の会議に参加」という文字
列であれば、“掲”が1番目、“記”が2番目、“の”
が3番目、“会”が4番目、“議”が5番目、“に”が
6番目、“参”が7番目、“加”が8番目ということに
なり、従って、“掲記”、“の”、“会議”、“に”、
“参加”と区切った場合には“掲記”なる文字列は1番
目から始まり、2番目で終わるので、開始欄には“1”
が、終了欄には“2”が来ることになり、同様に“の”
は3番目の文字でこの文字1字で終りであるから、終了
欄も“3”が来ることになり、同様に“会議”は4番目
と5番目の文字であるから、開始欄は“4”が来ること
になり、終了欄は“5”が来ることになる。
【0049】見出し欄は、辞書引きした見出しの情報
を、品詞欄は品詞の情報を活用欄は活用形の情報を表し
ている。
【0050】見出しの情報は、上記の例の場合、“掲
記”あるいは、“の”あるいは、“会議”あるいは、
“に”あるいは、“参加”といった如きであり、品詞は
その語句の品詞で、“掲記”ならば“名詞”、“の”な
らば“格助詞”、“会議”ならば“名詞”といった具合
である。
【0051】図4においては、左から、番号欄は通し番
号を表し、順に“<1>”、“<2>”、“<3>”、
…といった具合に通し番号が付されて表示される。文番
号欄は“1‐1”、“1‐2”…、といった具合に右と
左の数字がハイフンで繋がれて表示され、ハイフンの左
側が文書番号、ハイフンの右側が文書中の文番号を表し
ている。
【0052】開始欄、終了欄は、それぞれの単語の開始
位置、終了位置を解析結果保持部210の解析結果にお
ける通し番号で表している。例えば、開始“(1)”、
終了“(2)”、開始“(3)”、終了“(4)”は、
図3の場合に通し番号“(1)”で始まり、“(2)”
で終わる単語と、通し番号“(2)”で始まり、
“(3)”で終わる単語とを繋ぐという意味である。
【0053】関係欄は単語間の関係を表している。例え
ば、通し番号“<1>”の情報は“掲記”という単語が
“掲記の”という表層で“会議”という単語に係ってい
て、両者の関係は“の”による連体修飾である、という
ことを示している。なお、説明の便宜上、以下の説明で
は、図4の代わりに図5の形式を用いるものとする。
【0054】次に、別の文書、例えば関連する報告書
が、再び使用者により入力部101から入力される。こ
の文書も先の文書と同様に解析し、各結果を、各部分に
保持する。
【0055】次に、表現比較選別部106では、表現情
報保持部105を参照し、定められた条件に基づき、各
表現間を比較して、共通表現情報を抽出する。図6は、
1番目に入力された文書の例で、シンポジウムの参加報
告書の例を、また、図7は、2番目に入力された文書の
例で研究会の参加報告書の例である。この時、表現情報
保持部105には、図8に示したような情報が保持され
る。
【0056】図9は、表現比較選別部106の処理の流
れを示すフローチャートである。図9に従って表現比較
選別部106における処理を説明する。表現比較選別部
106にはBF1とBF2の2種のバッファが用意して
ある。
【0057】比較選別部106は、まず、ステップS1
101で、表現情報保持部105の保持情報中の通し番
号“<1>”に関係するリスト全ての情報を、バッファ
BF1に取り込む。図5の例の場合、“<1>”、“1
‐1”、“掲記(1)(2)”、“会議(3)”、“連
体修飾『の』”である。
【0058】そして、バッファBF1に取り込んだ情報
の文書番号(文番号欄の左側の情報)が“1”であるこ
とを確認し(ステップS1102)、次に表現情報保持
部105の保持情報中の通し番号“<2>”のリストに
該当する情報全てを、バッファBF2に取り込む(ステ
ップS1103)。図5の例の場合、“<2>”、“1
‐1”、“会議(3)(4)”、“参加(5)”、“連
体修飾『に』”である。
【0059】次にバッファBF2の文書番号を確認し
(ステップS1104)、その文書番号が“1”であれ
ばバッファBF2中の情報の通し番号に“1”を足した
通し番号に該当するリスト全ての情報を表現情報保持部
105からバッファBF2に取り込み(ステップS11
05)、ステップS1104に戻る。
【0060】このようにして、同一文書番号のリスト全
てを取り込む。
【0061】バッファBF2の文書番号が“1”でなく
なったら(ステップS1104)、バッファBF2の文
書番号が“2”であることを確認し(ステップS110
6)、ステップS1108に進む。ステップS1108
では、バッファBF1の1番目の句の自立語と、バッフ
ァBF2の1番目の句の自立語を比較し、一致すればス
テップS1110に進む。
【0062】ステップS1110では、同様に、バッフ
ァBF1の2番目の句の自立語と、バッファBF2の2
番目の句の自立語を比較し、一致すればステップS11
11に進む。ステップS1111では、バッファBF1
の関係情報とバッファBF2の関係情報を比較し、一致
すればステップS1113に進む。一致しなければ、ス
テップS1112に進み、関係情報置換テーブル(後
述)を参照してバッファBF1の関係情報を置換し、再
び、バッファBF2の関係情報と比較する。
【0063】ステップS1112において、バッファB
F1の関係情報を置換したものと、バッファBF2の関
係情報との比較の結果、両者が一致すれば、ステップS
1113に進む。
【0064】ステップS1108、ステップS111
0、ステップS1112で、一致しなかった場合には、
それぞれステップS1109に進み、バッファBF2中
の情報の通し番号に“1”を足した通し番号に該当する
リストの全ての情報を、表現情報保持部105の保持情
報からバッファBF2に取り込んで、ステップS110
6に戻る。そして、ステップS1106でバッファBF
2の文書番号を調べ、バッファBF2の文書番号が
“2”であれば、ステップS1108以降の処理を進め
るが、“2”でなくなった場合にはステップS1117
に進む。
【0065】一方、ステップS1113ではバッファB
F1とバッファBF2の表現番号、2つの見出し語の情
報、バッファBF1の関係情報を共通表現情報保持部1
07に格納し、ステップS1117に戻る。ステップS
1117では、バッファBF1中の情報の通し番号に
“1”を足した通し番号に該当するリストの全ての情報
を、表現情報保持部105からバッファBF1に取り込
んで、ステップS1102に戻る。ステップS1102
で、文書番号が“1”でなくなると、処理が終了する。
図11は、上のフローチャートで用いた、関係情報置換
テーブル例である。
【0066】このような処理を経ることにより、表現比
較選別部106は表現情報を選別して共通表現情報を抽
出する。そして、この抽出した共通表現情報は共通表現
情報保持部107に保持される。
【0067】図10は、ステップS1112の処理の詳
細のフローチャートである。すなわち、ステップS11
12では、バッファBF1の関係情報の置き換えと、そ
の置き換えた関係情報とバッファBF2の関係情報との
比較をして、一致するか否かを判定するが、その詳細を
次に図10を参照して説明する。
【0068】ステップS1301で、図11のテーブル
の1番目の情報を読み込む。バッファBF1中の関係情
報と、「元の関係情報」(左側の欄)が一致するかを調
べ(ステップS1302)、その結果、一致しなければ
テーブルの次の行の情報を読み込み(ステップS130
3)、テーブルの最終行でないことを確認して(ステッ
プS1306)、ステップS1302の処理へ戻る。
【0069】一方、ステップS1302での判定の結
果、一致すれば、「置換する関係情報」(右側の欄)と
バッファBF2中の関係情報とが一致するかを調べる
(ステップS1304)。
【0070】そして、一致すれば「一致」として(ステ
ップS1305)、ステップS1112は「Yes」の
判定をし、ステップS1112としての処理を終了す
る。
【0071】一方、ステップS1304での判定の結
果、一致しなければ、ステップS1303に移り、次の
テーブルを見る。そして、ステップS1306で最終行
に達したか否かを調べ、達していなければ、つまり、終
了でなければステップS1302に移る。
【0072】ステップS1306での判定の結果、最終
行に達したていれば、つまり、終了であれば一致なしと
して(ステップS1307)、ステップS1112は
「No」の判定をし、ステップS1112としての処理
を終了する。
【0073】図12は、表現比較選別部106により以
上の処理によって、図8に示した情報から選別された共
通表現情報保持部107中に保持される情報の例であ
る。番号は通し番号、表現番号は、左側が文書1に対応
する、共通表現情報保持部107中に保持される情報中
の通し番号、右側が文書2に対応する通し番号を表す。
【0074】最後に、テンプレート生成部211で、テ
ンプレート表示情報を生成する。図13は、テンプレー
ト生成部211の処理の流れを示したフローチャートで
ある。
【0075】テンプレート生成部211での処理を説明
する。テンプレート生成部211はまず、ステップS1
501で変数scntの値を“1”とする。そして、ス
テップS1502で、共通表現情報保持部107の保持
情報中の“[1]”の行の情報をバッファBF1に読み
込む。次にステップS1503に移り、ここでバッファ
BF1の表現番号情報の、左側の番号が指す表現情報
を、表現情報保持部105からバッファBF2に読み込
む。そして、次に変数scntの値と、バッファBF2
中の文番号欄の右側の番号とを比較し(ステップS15
04)、文番号が変数scntより大きければ、表層生
成バッファに情報が格納されているかをチェックする
(ステップS1508)。
【0076】格納されていれば、表層生成バッファの情
報から表層を生成する(ステップS1509)。格納さ
れていなければ穴埋め用の1行を生成し(ステップS1
510)、変数scntの値に“1”を加算して(ステ
ップS1511)、ステップS1504に戻る。ステッ
プS1504で文番号が変数scntより大きくなけれ
ば、バッファBF2の情報を表層生成バッファに格納し
(ステップS1505)、ステップS1506に進む。
【0077】ステップS1506では、バッファBF1
に保持されている共通表現情報保持部107の情報の、
次の行の情報を共通表現情報保持部107から読み込
み、バッファBF1に置き換える。読み込んだ情報が最
終行でないことを確認し(ステップS1507)、ステ
ップS1503に戻る。ステップS1507で最終行に
到達すると、処理が終了する。
【0078】このような処理を経ることにより、テンプ
レート生成部211では、共通して使用可能な部分を残
し、そうでない部分は穴埋め用に空欄にしたテンプレー
ト表示情報を生成することができる。
【0079】次に、表層生成バッファの情報から表層を
生成する処理であるステップS1509の詳細について
説明する。図14は、ステップS1509の処理の詳細
を示すフローチャートであり、このフローチャートに従
って表層生成処理する。
【0080】まず、ステップS1601で解析結果保持
部201の“(1)”の行を参照する。そして、ステッ
プS1602で、参照している解析結果保持部201の
データの文番号が、変数scntの値と一致するかをチ
ェックし、一致したら、ステップS1603で、参照し
ている解析結果保持部201のデータの番号が、表層生
成バッファ中にあるかどうかを検索する。その結果、も
しあれば、参照している解析結果保持部201のデータ
から、表層文字列を生成し(ステップS1604)、ス
テップS1605に進む。ステップS1602で一致し
なかった場合も、ステップS1605に進む。
【0081】ステップS1603での検索の結果、無か
った場合には、参照している解析結果保持部201のデ
ータの文字数分の空欄を生成し(ステップS160
6)、ステップS1605に進む。ステップS1605
では、参照している解析結果保持部201のデータを1
行ずらし、次の行を見る。もしそれが最終行であれば
(ステップS1607)、処理が終了する。最終行でな
ければステップS1602に戻る。
【0082】図15は、以上の処理によって、図12に
示した情報から生成されたテンプレートの表示例であ
る。図6および図7の文書から、共通内容部分を抜き出
して図6の文書を主体としたテンプレートが生成される
ことがわかる。
【0083】また、図16(a),(b)に、別の入力
文書2件の例を示す。つまり、入力文書としてA,B二
つの文書を入力させ、これらの文書から、同様の処理に
より、図16(c)に示すようなテンプレートの原型が
生成される。
【0084】この例では、入力文書Aとして 「関係者各位 新年会を開催いたします。日時などは、下記の通りで
す。皆様のご参加をお待ちしております。 」 を、また、入力文書Bとして 「関係者各位 恒例となりましたが今年も社内スポーツ会を開催いたし
ます。今年は少し趣向を変えて、スケート会ということ
になりました。皆様、どうぞ奮ってご参加ください。日
時などは、下記の通りです。 」 を入力すると、処理の結果、 なるテンプレートの原型が生成される。
【0085】以上、本具体例によれば、2つの似たよう
な内容の文書を入力すると、それらの文書を解析して、
これらのうちの共通の要素を抽出し、他は空欄としたテ
ンプレートの原型を生成するようにしたので、必要とす
る文書のテンプレートを誰でも容易に得ることができる
ようになる支援装置が得られる。
【0086】以上、雛形となる2つの文書を入力する
と、これらのうちの共通の要素を抽出し、他は空欄とし
たテンプレートの原型を生成するようにしたものであっ
た。しかし、テンプレートの場合は、一定の様式に文書
が組み立てられており、必要箇所を穴埋めしてゆく方式
で、文の流れを全く変えて自分なりに文書を組み立てた
い場合には、使いにくいものとなる。その場合には、何
を記述すれば良いのかの一覧を提示して、使用者が自分
なりに組み立てるようにする方が、使い勝手が良くな
る。それを実現する例を第3の具体例として説明する。
【0087】(第3の具体例)第3の具体例について、
図17のブロック図を参照して説明する。この装置は、
入力文書からその記述内容を切り分けて一覧にし、何を
記述すれば良いのかを一覧表示すると共に、この一覧か
ら使用者が、所望の文字列を選択すると、それが順番に
作成文書中に配置されてゆき、使用者が自分なりに自由
に文書を組み立てることができるようにした文書作成支
援装置である。
【0088】図17は、図1に示した文書処理支援装置
をベースにした本装置の構成例を示すブロック図であ
る。同図において、101は入力部、102は制御部、
103は出力部である。制御部にはさらに、104の入
力文書解析部、105の表現情報保持部、106の表現
比較選別部、107の共通表現情報保持部、309の辞
書部、310の表示表層文字列生成部が付随する。
【0089】辞書部309は、形態素解析や文書作成に
必要な各種辞書情報を有するものであり、表示表層文字
列生成部310は共通表現情報保持部107に保持され
ている入力文書中の共通表現の情報から、意味あるひと
纏まりの語句となるように、語句を順に生成するための
ものである。
【0090】このような構成の本装置は、入力部101
より元になる文書を入力すると、その情報は制御部10
3を介して入力文書解析部104に与えられ、ここで辞
書部209の辞書情報を利用して形態素解析され、解析
された表現情報が表現情報保持部105に保持される。
【0091】一方、表現比較選別部106が入力文書中
から共通に使用可能な表現を選別し、表現情報保持部1
05に保持されている情報から共通に使用可能な表現情
報を共通表現情報保持部107に保持させる。
【0092】そして、表示表層文字列生成部310は、
共通表現情報保持部107に保持されている共通表現の
情報から、意味あるひと纏まりの語句となるように、語
句を順に取り出し、ポップアップメニューとなるよう
に、文字列生成して制御部103に与える。制御部10
3は、このポップアップメニューを出力部102におけ
る表示部に表示し、使用者はこの表示を見て、自己で文
案を組み立てながら、その文案内容となるように最適文
字列をポップアップメニューから選択する。
【0093】制御部103は、この選択された文字列を
取り込み、文を作成する。ポップアップメニューには入
力文書から抽出された多数ある共通表現から、意味ある
ひと纏まりの語句単位で文字列を一覧形式に表示し、文
字列単位で選択できるようにしたものであり、使用者は
この表示を見て、自己で文案に沿って使用したい文字列
をポップアップメニューの中から順次選択すれば、使用
者オリジナルの文書が容易に作成できることになる。
【0094】図17に示した装置において、入力解析部
104ならびに表現比較選別部106の処理は、入力解
析部により形態素解析結果を全て保持しておかない点を
除いて、第1の具体例における処理と同様の処理である
ので説明を省略し、ここでは、表示表層文字列生成部3
10の処理について、説明する。
【0095】図18は、表示表層文字列生成部310の
処理の流れを示すフローチャートである。ステップS2
001で、共通表現情報保持部107の1行目のデータ
を参照する。ステップS2002で、参照しているデー
タから、表層文字列を1行、生成する。ステップS20
03で、共通表現情報保持部107の参照データを1
行、下に移動する。
【0096】ステップS2004で、参照行が最終行か
を確認し最終行でなければステップS2002に戻る。
ステップS2004で参照行が最終行に到達したら、生
成した文字列を1行毎のップアップメニュー形式で表示
し、処理が終了する。
【0097】図19は、以上の処理によって図12に示
した情報から生成された、表層文字列情報のポップアッ
プメニュー表示例である。
【0098】図20は、図19に示した表示を用いた文
書作成の手順の例である。出力部102を構成する表示
部の画面に、ポップアップメニューとして図19の如く
表示された文字列情報のひとつが、使用者による入力部
101からのマウスカーソル等の操作により選択される
と、その選択された文字列情報は、制御部103に制御
のもとに、作成中の文書領域に取り込まれることにな
る。
【0099】また、ポップアップメニューに無い表現を
使用したい場合にはその所望の表現を挿入したい部分に
カーソルを置き、使用者が入力部101の構成要素の一
つであるキーボードを操作するなどして必要な文字を入
力する。その入力操作された文字情報は、制御部103
に制御のもとに、作成中の文書領域に置けるカーソル対
応位置取り込まれることになる。
【0100】これにより、簡単に文書を作成することが
できる。なお、図20中で、“[]”で囲まれた部分が
使用者の操作によりメニューから取り込まれた表現部分
である。
【0101】以上、この具体例における装置は、入力文
書からその記述内容を切り分けて一覧にし、何を記述す
れば良いのかを一覧表示すると共に、この一覧から使用
者が、所望の文字列を選択すると、それが順番に作成文
書中に配置されてゆき、使用者が自分なりに自由に文書
を組み立てることができるようにしたもので、容易に使
用者オリジナルの文書を作成できるように支援する装置
が得られる。
【0102】(第4の具体例)次に、本発明にかかわる
第4の具体例である、図21に示した文書理解支援装置
について説明する。この具体例は、2つの文書を入力す
ると、これらの差異部分が良くわかるように、2番目の
文書の内容を明示的に表示するようにした例である。
【0103】図21は、図1に示した文書処理支援装置
をベースにした本装置の構成例を示すブロック図であ
る。同図において、101は入力部、102は制御部、
103は出力部である。制御部102はさらに、入力文
書解析部104、表現情報保持部105、表現比較選別
部106、共通表現情報保持部107、辞書部409、
解析結果保持部410、差異情報表示生成部411を備
える。
【0104】図21に示した装置においては、テンプレ
ート生成部と差異情報表示生成部の処理が異なる点を除
いて、第1の具体例における処理と基本的には同様の処
理を行うようにしてあり、従って、重複部分の説明は第
1の具体例の説明を参照するものとし、ここでは、41
1の差異情報表示生成部の処理について、主に説明す
る。
【0105】辞書部409は、形態素解析や文書作成に
必要な各種辞書情報を有するものであり、解析結果保持
部410は、入力文書解析部104が解析した入力文書
の解析結果を保持するものである。入力文書解析部10
4は辞書部409の情報を用いて入力部101からの入
力文書を形態素解析し、また、入力文書中の表現情報を
解析して表現情報保持部105に保持させる。
【0106】差異情報表示生成部411は、2つの入力
文書の差異を見たい場合に、共通表現情報保持部107
中に保持される情報中から差異の部分を調べてその情報
を生成するものである。2つの入力文書のうち、どちら
を基準にどちらの文書の内容の違いを部分を表示するか
は、予めシステム設定により、あるいは使用者が選択す
ることにより、決まるようにしてある。
【0107】共通表現情報保持部107中に保持される
情報は、表現比較選別部106が、表現情報保持部10
5を参照し、定められた条件に基づき、各表現間を比較
することにより、抽出した共通表現情報である。
【0108】入力部101からは、自然言語文書、例え
ば日本語で書かれた案内書や報告書などが取り込まれ
る。取り込まれた入力文書は、辞書部409の情報を参
照しながら、入力文書解析部104で形態素解析され、
形態素解析結果は解析結果保持部410に保持される。
【0109】一方、表現比較選別部106が入力文書中
から共通に使用可能な表現を選別し、表現情報保持部1
05に保持されている情報から共通に使用可能な表現情
報を共通表現情報保持部107に保持させる。
【0110】差異情報表示生成部411は、2つの入力
文書の差異を表示させる場合に使用する。すなわち、2
つの入力文書がある場合には、その解析、比較選別処理
などの結果、それぞれの情報が解析結果保持部410、
表現情報保持部105、共通表現情報保持部107に保
持されている。
【0111】そして、差異情報生成部411は、比較し
ようとしている入力文書のうちから、共通表現情報保持
部107に保持されている共通表現情報中にない表現を
探し、その部分を強調した差異情報を生成する。制御部
103は比較しようとしている入力文書の内容(テキス
ト情報)のうち、この差異情報に対応する部分を強調
し、他は強調しないで表示するように、出力部102に
文書表示出力制御する。この場合の強調部分は、ハイコ
ントラスト表示あるいは反転表示、あるいはカラー表
示、アンダーライン表示、ブリンク表示するなどにより
行い、強調しない部分は薄く表示したり、白文字表示し
たりするなど分かり易い適宜な形態で行うようにする。
【0112】図22は、差異情報表示生成部411の処
理の流れを示すフローチャートである。図に従って説明
すると、まず、ステップS2301で、210に保持さ
れている解析結果の(1)の行のデータを参照する。参
照した行の文書番号が“2”であるかをチェックし、
“2”でなければ、解析結果保持部210の参照行を一
つ下に移動する(ステップS2306)。
【0113】参照行が最終行かを確認し(ステップS2
310)、最終行でなければステップS2302に戻
る。ステップS2302で、文書番号が“2”になった
なら、参照している単語番号が、表現情報保持部105
の表現情報に含まれているかどうかを検索する(ステッ
プS2303)。その結果、含まれていなければ、該単
語データは通常表示とし(ステップS2307)、ステ
ップS2306へ移る。
【0114】一方、ステップS2303での検索の結
果、表現情報保持部105に含まれていたならば、ステ
ップS2304で、参照している単語番号が、共通表現
情報保持部107に含まれているかどうかを検索する。
【0115】その結果、含まれていなければ該単語デー
タは強調表示とし(ステップS2308)、ステップS
2306へ移る。ステップS2304での検索の結果、
共通表現情報保持部107に含まれていたならば、ステ
ップS2305で、参照している単語番号と、表現情報
保持部105中で組合せになっている単語番号の全て
が、共通表現情報保持部107に含まれているかどうか
を検索する。そして、含まれていないものがあれば、該
単語データは強調表示とする(ステップS2308)。
全て含まれていれば該単語データは通常表示とし(ステ
ップS2309)、ステップS2306へ移る。
【0116】ステップS2310で最終行に到達した
ら、処理が終了する。図23(a),(b)は、1番
目、2番目、それぞれの入力文書の例である。図23
(c)は、以上の処理によって2番目の入力文書である
図23の(b)の入力文書から生成された、差異情報表
示の表示例である。
【0117】すなわち、入力された2つの文書から、差
異のある部分について、わかるように2番目の文書を主
体にして、その差異の部分以外の文字が薄くなるように
文書を表示することができる。
【0118】このように、本装置は、2文書を入力する
とそれぞれその文書の共通表現部分を抽出して保持し、
差異を知りたい文書の文面から前記保持した共通表現に
ない部分を調べ、その部分を強調して当該文書を提示す
るようにしたので、2つの似たような文書の内容のう
ち、差異のある内容部分について適確に違いを知ること
ができるようになる。つまり、従来は文字列比較であっ
たために、内容的な違いを比較して表示することができ
なかったが、本発明では、内容的な違いの比較対比がで
きるようになる。
【0119】以上、種々の具体例を述べたが、本装置に
よれば、指定された文書を解析し、共通の表現の部分か
らテンプレートの骨組みを生成して提示するようにした
ので、元になる文書を与えるだけで簡易に必要なテンプ
レートを入手でき、文書作成を容易に行うことができる
ようになり、また、指定された文書から共通の表現を取
り出して一覧形式で表示し、その中から表現を選択して
ゆくと、順にそれが取り込まれて文書として組み立てら
れるようにしたことで、文書作成を容易にすることを可
能にし、あるいは、共通の表現の部分を原文書において
抑制して表示し、他は強調表示することにより、似たよ
うな内容の2つの文書を内容的に比較して内容的な違い
のある部分を明示的に表示できるようにしたから、文書
理解の効率向上を図ることができるようになるなどの効
果が得られる。
【0120】なお、以上の具体例は、あくまでも例示で
あり、これらのみならず、種々の適用が可能である。例
えば、第1の具体例においては、入力文書解析部が形態
素解析と構文解析を行う例を示したが、形態素解析のみ
を行い、隣接関係(隣接しているという関係)や、ひと
つ置きの関係など、単語の位置情報に関わる表現情報を
記憶することも可能である。また、具体例では、表現情
報として単語と単語の組合せを用いたが、他に、単語の
情報自体も表現情報として用いることが可能であるし、
単語と単語と単語の組合せ、単語対と単語対との組合せ
なども利用可能である。また、共通表現の選別において
は、単語が一致することをもって共通としたが、合成語
において単語の一部が一致する場合も、共通と見倣すよ
うに処理することも可能である。
【0121】上述の具体例は、既存の文書から共通に使
用できる文言の部分を抽出して文書の雛形となるテンプ
レートを自動生成するようにしたものであった。これに
よれば、サンプルとなる文書を用意するだけで誰でもが
手軽に種々の文書テンプレートを取得することができる
ようになるが、このような手法により、または予め装置
側において、きめ細かく文書テンプレートを用意すれば
するほど、最適のテンプレートを探すための労力が増大
し、その作業自体が煩雑になる、さらには、最適のテン
プレートを見つけ出すことができないこともあるという
問題を引き起こす。そこで次にこのような問題の改善を
図った装置の具体例を説明する。
【0122】第5の具体例は、テンプレートを探す手間
をかけることなく、必要な文書のテンプレートを提示す
ることができるようにした装置であり、入力文書を元に
必要な内容を含んだ新たな文書を得るためのテンプレー
トを提示することができるようにした装置である。この
装置では、入力文書が往信文書であり、これに対しての
返信文書を作成する場合などに、顕著な効果があるもの
である。
【0123】(第5の具体例)ここでは、文書を入力す
ると、その文書を参照して返信などに適した文書のテン
プレートを提供することができるようにする例を説明す
る。
【0124】以下に本発明の具体例を説明する。
【0125】図24は、本発明の基本的な構成を示した
返信文書作成支援装置の概略を表すブロック図である。
同図において、101は入力部、102は出力部、20
0は制御部、300は文書テンプレート制御部である。
文書テンプレート制御部300は、305のテンプレー
ト選択・生成部、306の入力文書内容参照部、307
の文書テンプレート選択・生成ルール保持部から構成さ
れている。
【0126】入力部101は、文書を入力したり、コマ
ンドを与えたり、編集作業を行なうためのものであり、
キーボードやマウス、トラックボール、イメージスキャ
ナ、フロッピディスク装置、ハードディスク装置、CD
‐ROM装置、MO装置(光ディスク装置)、DVD装
置(ディジタルビデオディスク)、あるいはネットワー
ク接続用の入力インターフェイスなどが該当する。
【0127】また、制御部200は本装置の制御の中枢
を担うものであり、文書テンプレート制御部300は、
文書解析、テンプレート生成、選択、表示などの処理な
どを含む制御・処理を担うものであり、出力部102は
制御部200を介して与えられる文書テンプレート制御
部300での処理結果を出力するためのもので、ディス
プレイやプリンタ、あるいはネットワーク接続用の出力
インターフェイスなどが該当する。
【0128】入力文書内容参照部306は、各種のテン
プレート情報を保持しており、また、入力された文書の
内容を参照して参照結果、例えば、文書内容の検索結果
を出力するものである。文書テンプレート選択・生成ル
ール保持部307は与えられた文書の内容に対して、返
信に適した内容の文書テンプレートを選択したり、生成
したりする際のルールを保持するものである。
【0129】テンプレート選択・生成部305は、制御
部200を介して入力部101から取り込まれた文書を
入力文書内容参照部306を介して参照した結果と、文
書テンプレート選択・生成ルール保持部307に保持さ
れているルールとに基づいて、文書テンプレート情報を
選択し、または生成する処理を行い、結果を制御部20
0に渡すものである。
【0130】この装置において、まず、入力部101か
らは、自然言語文書、例えば日本語で書かれた電子メイ
ル文書などが取り込まれる。この文書は制御部200を
介してテンプレート選択・生成部305に与えられる。
すると、テンプレート選択・生成部305は、入力部1
01から取り込まれて与えられたこの文書を入力文書内
容参照部306を介して参照した結果と、文書テンプレ
ート選択・生成ルール保持部307に保持されているル
ールとに基づいて返信に適した内容のテンプレートを、
入力文書内容参照部306内のテンプレートの中から決
定して選択し、あるいは生成する。これにより、入力さ
れた文書に対しての返信に適した文書テンプレート情報
を得ることができる。
【0131】制御部200は、この情報を出力部102
から出力し、表示する。装置使用者は、表示された文書
テンプレートの空欄に文章を穴埋めし、あるいは一部の
文言を修正した後、これを返信メイルなどとして利用す
ることができる。制御部200はこれらの動作を管理・
制御する。
【0132】このようにして、文書を入力すると、その
文書を参照して返信などに適した文書のテンプレートを
提供することができるようになり、返信文書作成支援が
可能な装置が得られることになる。
【0133】(第6の具体例)図25は、図24のより
具体的な構成例を示した返信文書作成支援装置の一例で
ある。図25において、図24と同一符号を付したもの
は同一物を示しており、その機能は同じであるので改め
て説明はしない。図25において、321は入力文書文
字列検索部、322はテンプレート保持部であり、入力
文書内容参照部306はこれらより構成される。
【0134】入力文書文字列検索部321は、図24の
入力文書内容参照部306の一形態であり、テンプレー
ト選択・生成部305から送られてきた文字列につい
て、入力文書内を検索する機能を有する。テンプレート
保持部322は、シーン対応にテンプレートをいくつか
格納しており、テンプレート選択・生成部305から指
定されたテンプレート情報を提供するものである。
【0135】テンプレート選択ルール保持部323は、
図24のテンプレート選択・生成ルール保持部307の
一形態であり、テンプレート選択の条件と、対応するテ
ンプレート保持部323中のテンプレート番号を格納し
ている。
【0136】テンプレート保持部323中の保持内容は
図38の如くであり、テンプレート番号と、そのテンプ
レート内容とが登録されている。
【0137】この装置において、まず、入力部101か
ら、自然言語文書で書かれた電子メイル文書などが取り
込まれる。この文書は制御部200を介してテンプレー
ト選択・生成部305に与えられる。すると、テンプレ
ート選択・生成部305は、この取り込まれた文書を入
力文書内容参照部306の入力文書文字列検索部321
に与え、入力文書文字列検索部321は、テンプレート
選択・生成部305から送られてきた文字列について、
入力文書内を検索する。
【0138】そして、これにより、文書を組み立ててい
るキーワードとなる言葉を検索する。テンプレート選択
・生成部305はこの検索結果を用いて、文書テンプレ
ート選択・生成ルール保持部323に保持されているル
ールに基づき、どのような文書が返信用の文書テンプレ
ートとして最適かを調べ、その結果として、返信に適し
た内容のテンプレートを、テンプレート保持部322内
のテンプレートの中から決定して選択し、あるいは生成
する。これにより、入力部から入力された文書に対して
の返信に適した文書テンプレート情報を、自動的に得る
ことができるようになる。
【0139】制御部200は、この情報を出力部102
から出力し、表示する。装置使用者は、表示された文書
テンプレートの空欄に文章を穴埋めし、あるいは一部の
文言を修正した後、これを返信メイルなどとして利用す
ることができる。
【0140】このように、文書を入力すると、その文書
を参照して返信などに適した文書のテンプレートを提供
することができるようになり、返信文書作成支援が可能
な装置が得られることになる。
【0141】図26は、同じく図24より詳細な構成を
示した、図25とは別の、返信文書作成支援装置の一例
である。図26において、図24と同一符号を付したも
のは同一物を示しており、その機能は同じであるので改
めて説明はしない。図26において、301は入力文書
解析部、302は辞書部、303は文書解析結果保持
部、305はテンプレート選択・生成部、322はテン
プレート保持部、323はテンプレート選択ルール保持
部であり、文書テンプレート制御部300をこれらで構
成したものである。
【0142】辞書部302は、文書解析に必要な辞書情
報を保持したものであり、入力文書の形態素解析に必要
な辞書を備えているものである。入力文書解析部301
は、制御部200の制御のもとに入力部101から入力
された文書をこの辞書部302の情報を用いて、逐次、
形態素解析するものである。また、文書解析結果保持部
303は、前記入力文書解析部301による解析結果を
保持するためのものであり、この保持情報はテンプレー
ト選択・生成部305から参照することができる。
【0143】テンプレート保持部322は、種々のシー
ン対応に用意された各種の文書テンプレートを保持する
ものであり、作成された新たな文書テンプレートも保持
することができるものである。また、テンプレート選択
ルール保持部323は、テンプレート保持部322に保
持された各種の文書テンプレートのうち、入力文書に対
応して最適なものを選択できるようにするための、テン
プレート選択ルールを保持するものであり、テンプレー
ト選択・生成部305は、入力文書の形態素解析結果
を、テンプレート選択ルール保持部323に保持された
選択ルールに従って処理することにより、入力文書対応
の最適な文書テンプレートをテンプレート保持部322
から選択し、また、必要により埋め込み箇所には最適な
文言を埋め込んで出力するなど、必要とする文書をでき
るだけ完成度の高いかたちで、文書テンプレートして提
示することのできる生成機能をも有している。
【0144】次に図27は、取り込んだ文書(入力部1
01から入力された上述の入力文書)が、定められた内
容識別条件を満足するか、否かを判定し、その結果に基
づき文書テンプレートを選択・生成する機能をさらに追
加する場合のテンプレート選択ルール保持部323の構
成例である。
【0145】この図27の構成の場合は、テンプレート
選択・生成部305が次のような処理を行うことができ
るようにするためのルールと選択テーブルを持たせたも
のである。すなわち、入力文書の内容が、予め登録され
た複数のキーワードの集合から複数の集合のうちの、ど
の集合に該当するかにより、その集合対応に登録されて
いるテンプレート候補を選択できるようにするためのル
ールと、そのためのテーブルをテンプレート選択ルール
保持部323が有して提供することができるようにして
いる。そのために、テンプレート選択ルール保持部32
3はルールの他に、さらに、401の内容判別・テンプ
レート選択テーブルが付加される。
【0146】図28は、内容判別・テンプレート選択テ
ーブル401に保持される情報の一例である。但し、同
図において、『or』はそのどちらかの単語が含まれて
いれば良いことを示す。
【0147】内容判別・テンプレート選択テーブル40
1は、図に示すように登録順の番号、キーワード、テン
プレートの候補の番号からなる。例えば、登録番号が
“(001)”番の内容はキーワードとして“記念”,
“パーティ”,“招く”または“招待”が関連してお
り、その場合にテンプレート番号“(1)”,
“(5)”,“(6)”のテンプレートが候補としてあ
げられることを示している。同様に、登録番号が“(0
02)”番の内容は、キーワードとして“開業”または
“開店”,“周年”が関連しており、その場合にテンプ
レート番号“(2)”,“(5)”,“(1)”のテン
プレートが候補としてあげられることを示している。
【0148】図29は、往信文書を入力文書として入力
し、この往信文書に対する返信文書を、文書内容の丁寧
度を勘案して同等の丁寧度の文書となるようなテンプレ
ートを選択生成して提示するために必要なテンプレート
選択ルール保持部323の機能構成例を示している。
【0149】この図29の構成の場合は、テンプレート
選択・生成部305が、往信文書に対する返信文書を、
文書内容の丁寧度を勘案して同等の丁寧度の文書となる
ようなテンプレート選択ができるようにするために必要
な処理を可能にするためのルールをテンプレート選択ル
ール保持部323が提供できるようにする例である。
【0150】すなわち、図29の構成の場合は、入力文
書の内容について、予め登録された一つもしくは複数の
キーワードの集合からなる複数の集合のうちの、どの集
合に該当するかにより、その集合対応に登録されている
テンプレート候補を選択できるようにするためのルール
と、そのためのテーブルをテンプレート選択ルール保持
部323が有して提供することができるようにしている
ものであり、ここでは入力文書の言葉に表われる丁寧度
を反映させて同程度の丁寧度のテンプレートを選択でき
るようにする。
【0151】そのために、テンプレート選択ルール保持
部323はルールの他に、さらに、601の丁寧度判別
・テンプレート選択テーブルが付加される。丁寧度判別
・テンプレート選択テーブル601は丁寧度を表す言葉
と、それ対応の言葉を使用したテンプレート候補をテー
ブルに纏めたものである。
【0152】図30は、丁寧度判別・テンプレート選択
テーブル601に保持される情報の一例である。丁寧度
を表す単語として例えば“前略”,“拝啓”,“謹啓”
などといった言葉が登録されており、これら単語に対し
てテンプレートの候補の番号が登録されている。例えば
“前略”に対してテンプレート番号“(5)”のテンプ
レートが候補としてあげられており、“拝啓”に対して
テンプレート番号“(1)”,“(2)”,
“(3)”,“(4)”のテンプレートが候補としてあ
げられており、“謹啓”に対してテンプレート番号
“(6)”のテンプレートが候補としてあげられている
ことを示している。
【0153】図31は、取り込んだ文書の一部を自動的
に選択し、これを引用した文書テンプレートを生成する
機能を持たせた場合のテンプレート選択・生成部305
の例である。この機能は文書引用機能であり、この文書
引用機能を持たせるには図31に示すように、テンプレ
ート選択・生成部305に、さらに、701の引用部分
抽出・挿入部が付加されるとともに、702の引用ルー
ルテーブルおよび703の引用文データ保持部を設け
る。
【0154】図32は、引用ルールテーブル702に保
持される情報の一例である。引用ルールテーブル702
には、テンプレートの番号、キーワード、引用の範囲、
引用の位置などの情報が登録されている。例えば、テン
プレートの番号として“(7)”、キーワードとして
“注文したのですが”、引用の範囲として“キーワード
を含む1文”、引用の位置として“穴埋め欄の前”とい
った具合であり、これは、“注文したのですが”という
キーワードは、テンプレート番号“(7)”番のテンプ
レートの穴埋め欄の前の位置に、当該キーワードを含む
1文が入るというルールを示している。
【0155】図33は、新たな文書テンプレートを、文
書テンプレートの選択候補に登録する機能を得るための
テンプレート選択・生成部305の構成例である。同図
において、テンプレート選択・生成部305にはさら
に、テンプレート登録処理を行うためのテンプレート登
録部1001が付加され、また、テンプレート保持部3
23には、学習情報を保持するための学習保持部100
2が付属する構成とする。
【0156】図34は、学習保持部1002に保持され
る情報である学習情報の一例である。学習情報には元テ
ンプレート番号、学習テンプレート番号、追加キーワー
ドが含まれる。この学習情報はテンプレート登録部10
01が生成した情報や、テンプレート選択・生成部30
5の処理情報を元に、テンプレート登録部1001が取
得した情報であり、テンプレート登録部1001から学
習保持部1002に提供される。
【0157】本発明装置では、入力文書が往信文書であ
り、これに対しての返信文書を出力文書として出力する
場合により効果が高いものであるが、このような場合に
のみしか対応できないのでは実用上、問題が残る。その
ため、入力文書と出力文書が返信以外の関係である場合
に対処できる構成も必要である。その場合に対応できる
ようにするテンプレート選択・生成部305の例を図3
5に示す。同図において、テンプレート選択・生成部3
05にはさらに、1201の関係候補および関係・テン
プレート選択ルール対応保持部が付加される。
【0158】図37は、関係候補および関係・テンプレ
ート選択ルール対応保持部1201に保持される情報の
一例である。関係候補および関係・テンプレート選択ル
ール対応保持部1201の保持情報には、関係する語句
と、テンプレート選択テーブルの番号が保持される。関
係する語句としては例えば、“返信”、“詳細”、“続
き”といったものが登録され、“返信”に対しては
“(001)〜(200)”まで、“詳細”に対しては
“(201)〜(400)”まで、“続き”に対しては
“(401)〜(600)”までがテンプレート選択テ
ーブルとして選択できる。
【0159】図36は、図35に対応する、内容判別・
テンプレート選択テーブルの情報の一例である。
【0160】図38は、テンプレート保持部322に保
持されるテンプレート情報の一例である。但し、同図に
おいて、“_____”は使用者による穴埋めの部分を
表す。また「※※n」(n=1,2,3,…)は、可能
ならば装置が往信文書からの情報その他により自動的に
埋める部分である。
【0161】この例の場合、テンプレートとして種々の
シーンに対応した文例のものが“テンプレート(1)”
から“テンプレート(n)”まで順に登録されており、
テンプレート番号“(1)”〜“(n)”で選択でき
る。
【0162】テンプレート番号“(1)”のテンプレー
トは、 『拝啓 ※※1の候、貴社ますます※※2のこととお慶
び申し上げます。さて、このたびは、________
_とのこと、誠におめでとうございます。パーティには
慶んで出席させていただきます。では、後日会場にて。
敬具』 という内容のものが、また、テンプレート番号
“(2)”のテンプレートは、 『拝啓 ※※1の候、貴社ますます※※2のこととお慶
び申し上げます。さて、このたびは、___周年をお迎
えとのこと、誠におめでとうございます。つきまして
は、ささやかながら別便でお祝いを送らせていただきま
した。まずは書中にてお祝いまで。敬具』 なる内容のものが、という具合に、種々のものが保持さ
れている。
【0163】次に、図25の形態での具体例を用いて、
本発明装置の詳細を説明する。
【0164】以下は、入力される電子メイルの往信文書
の一例である。 「拝啓 盛夏の候、貴下ますますご清祥のこととお慶び
申し上げます。平素は格別のお引き立てを賜わり、厚く
御礼を申し上げます。さて、このたび弊社では、本店改
装1周年を記念いたしまして、日頃ご愛顧をいただいて
おります皆様をお招きして、下記により、ささやかなが
ら記念パーティを催すこととなりました。また、今回
は、併せて特別頒布会のコーナーも用意いたしておりま
す。秋冬物の新製品のご紹介の他、定番商品につきまし
ても、特別価格にて御提供させていただく、今回限りの
企画でございます。皆様ご多忙中とはぞんじますが、ど
うかご来場たまわりますよう、一同心から、お待ち申し
上げております。 敬具 記 日時平成7年9月21日17時〜19時 なお、特別頒布会は14時から、開始いたしておりま
す。場所芝浦会館10階催事場 以上」 まずテンプレート選択・生成部305では、入力文書の
情報を参照しながらテンプレートの選択を行う。
【0165】<テンプレート選択処理の例 (I)>この例
では、テンプレート選択・生成部305が、入力文書の
内容を、予め登録された複数のキーワードの集合から複
数の集合のうちの、どの集合に該当するかにより、その
集合対応に登録されているテンプレート候補を選択する
ようにするが、そのためのルールと、テーブルをテンプ
レート選択ルール保持部323が有して提供するように
している図27に示した形態を利用するものである。
【0166】図39に示したフローチャートは、テンプ
レート選択・生成部305でのテンプレート選択処理の
流れの一例であり、図27に示した形態を持つテンプレ
ート選択ルール保持部323を使用する。
【0167】このフローチャートを参照して説明する
と、テンプレート選択・生成部305は、はじめにステ
ップS16‐1で、401の内容判別・テンプレート選
択テーブルの第1番目のルールを参照する。次にステッ
プS16‐2で、現在参照しているルールの情報を保持
しながら、該ルールの第1番目のキーワードを参照す
る。ステップS16‐3では、現在参照しているキーワ
ードについて入力文書に対する文字列検索を入力文書解
析部301に要求し、結果を受け取る。
【0168】もしキーワードと同じ文字列が入力文書中
に存在していたら(ステップS16‐4)、参照中のル
ールに次のキーワードがあるかどうかを調べ(ステップ
S16‐5)、有ればそのキーワードを参照し(ステッ
プS16‐6)、ステップS16‐3に戻る。ステップ
S16‐5で次のキーワードがなければ、該ルールのテ
ンプレート番号を読み込み(ステップS16‐7)、終
了する。
【0169】ステップS16‐4で、キーワードと同じ
文字列が文書中に無かった場合、401に現在参照して
いるルールの次のルールがあるかどうかを調べ(ステッ
プS16‐8)、もしあれば次のルールを参照し(ステ
ップS16‐9)、ステップS16‐2に戻る。ステッ
プS16‐8で次のルールが無かったら、該当ルールが
ないとして、次の処理に移る。
【0170】以上、入力文書の内容を解析して、その入
力文書内に含まれるキーワードを知り、上述の処理を施
すことにより、入力文書中に含まれるキーワード群が、
予め登録された複数のキーワードの集合のうちの、どの
集合に該当するかを知って、その集合対応に登録されて
いるテンプレート候補を選択することができるようにな
る。
【0171】<テンプレート選択処理の例(II)>図40
に示したフローチャートは、テンプレート選択・生成部
305でのテンプレート選択処理の流れの別の一例であ
り、図29に示した形態を持つ場合である。すなわち、
入力文書の内容について、予め登録された一つもしくは
複数のキーワードの集合からなる複数の集合のうちの、
どの集合に該当するかにより、その集合対応に登録され
ているテンプレート候補を選択できるようにするもの
で、特に丁寧度を反映させて同等の丁寧度のテンプレー
ト候補を図38の如きテンプレート群の中から選択して
提示するものであり、以下、処理の詳細を説明する。
【0172】テンプレート選択・生成部305は、はじ
めにステップS17‐1で、丁寧度判別・テンプレート
選択テーブル601の第1番目のルールを参照する。次
にステップS17‐2で、現在参照しているルールの情
報を保持しながら、該ルールの第1番目のキーワードを
参照する。ステップS17‐3では、現在参照している
キーワードについて入力文書に対する文字列検索を20
1に要求し、結果を受け取る。
【0173】もしキーワードと同じ文字列が入力文書中
に存在していたら(ステップS17‐4)、該ルールの
テンプレート番号を読み込み(ステップS17‐5)、
終了する。ステップS17‐4で、キーワードと同じ文
字列が文書中に無かった場合、601に現在参照してい
るルールの次のルールがあるかどうかを調べ(ステップ
S17‐6)、もしあれば次のルールを参照し(ステッ
プS17‐7)、ステップS17‐2に戻る。ステップ
S17‐6で次のルールが無かったら、該当ルールがな
いとして、次の処理に移る。
【0174】以上のように処理することで、テンプレー
ト選択・生成部305においては、まず対応するテンプ
レート候補の情報を得て、その後、テンプレート情報を
表示部に送る。
【0175】以上、入力文書の内容を解析して、その入
力文書内に含まれる丁寧語のキーワードを知り、上述の
処理を施すことにより、入力文書中に含まれるキーワー
ド群が、予め登録された一つあるいは複数のキーワード
の集合のうちの、どの集合に該当するかを知って、その
集合対応に登録されているテンプレート候補を選択する
ことができるようになり、入力文書の内容と、その文書
で使用している丁寧度対応のテンプレートを提示するこ
とができるようになる。
【0176】図41に示すフローチャートは、内容判別
・テンプレート選択テーブルのみを用いた場合の、この
処理の流れの一例である。
【0177】[内容判別・テンプレート選択テーブルの
みによる選択処理例]内容判別・テンプレート選択テー
ブルのみを用いてテンプレート選択を行うようにするに
は、テンプレート選択・生成部305は、はじめにステ
ップS18‐1で、図39に示した処理を行う。次にス
テップS18‐2で、該当するテンプレート候補があっ
たかどうかをチェックし、もし有れば、テンプレート番
号の1番目に対応するテンプレート情報を出力部に送る
(ステップS18‐3)。もしなければ、「該当なし」
という情報を出力部に送り(ステップS18‐4)、次
の処理に移る。
【0178】[内容判別・テンプレート選択テーブルと
丁寧度判別・テンプレート選択テーブルとの併用による
選択処理例]図42に示したフローチャートは、内容判
別・テンプレート選択テーブルと、丁寧度判別・テンプ
レート選択テーブルの2つを用いる場合の処理の流れの
一例である。この場合、はじめにステップS19‐1
で、図39に示した処理を行う。
【0179】そして、次のステップS19‐2で、該当
するテンプレート候補があったかどうかをチェックし、
その結果、もしなければ「該当なし」という情報を出力
部102に送るようにし(ステップS19‐4)、処理
を終了する。
【0180】一方、ステップS19‐2でのチェックの
結果、もしあればテンプレート番号をバッファBF1に
保持する(ステップS19‐3)。そして、次に丁寧度
に関する処理であるステップS19‐5に移る。このス
テップS19‐5での処理は、図40に示した処理であ
る。
【0181】そして、ステップS19‐5での処理の後
に該当する候補の有無をチェックし(ステップS19‐
6)、その結果、該当する候補がなければ、「該当な
し」として(ステップS19‐7)、終了する。
【0182】ステップS19‐6でのチェックの結果、
候補が有れば、テンプレート番号をバッファBF2に保
持する(ステップS19‐8)。そして、ステップS1
9‐9に移る。
【0183】ステップS19‐9では、バッファBF1
のテンプレート番号の1番目を参照し、ステップS19
‐10で、バッファ2の1番目を参照する。そして、次
にバッファBF1の番号とバッファBF2の番号を比較
し(ステップS19‐11)、一致すれば、一致したテ
ンプレート番号に対応したテンプレート情報を出力部1
02に送るように処理し(ステップS19‐12)、こ
こでの処理は終了する。
【0184】また、ステップS19‐11での比較の結
果、一致しなければ、バッファBF2の次の番号を調べ
(ステップS19‐13)、その結果、もしあればその
番号を参照し(ステップS19‐14)、ステップS1
9‐11の処理に戻る。
【0185】ステップS19‐13でのチェックの結
果、次がなければ、バッファBF1の次の番号を調べ
(ステップS19‐15)、もしあればその番号を参照
し(ステップS19‐16)、ステップS19‐10に
戻る。
【0186】ステップS19‐15でのチェックの結
果、もしなければ、「該当なし」として(ステップS1
9‐17)、ここでの処理を終了する。
【0187】このような処理の結果、例えば、上に例示
した往信文書に対しては、図38の如き各種保持テンプ
レートの中から、テンプレート番号“(1)”のテンプ
レートが第1位の候補として選択される。
【0188】以上により、入力文書の内容を解析して、
その入力文書内に含まれる丁寧語を含む各種のキーワー
ドを知り、内容判別・テンプレート選択テーブルと、丁
寧度判別・テンプレート選択テーブルの2つを用いて上
述の処理を施すことにより、入力文書中に含まれるキー
ワード群が、予め登録された一つあるいは複数のキーワ
ードの集合のうちの、どの集合に該当するかを知って、
その集合対応に登録されているテンプレート候補を選択
することができるようになり、入力文書の内容と、その
文書で使用している丁寧度対応のテンプレートを提示す
ることができるようになる。
【0189】[テンプレートの自動穴埋め処理]テンプ
レートは、共通に使える部分を構成する文字列を残し、
状況により種々変わる語句を空欄にしたものであり、空
欄を状況対応に適正な語で埋めると、比必要な文が完成
するようにした雛形である。本発明においては、図38
に示すように、テンプレートには季語や日時、あるいは
決まり文句ではあるがバリエーションがあるような部分
などにおいて、“※※”を埋め込んである。そして、こ
の部分は、テンプレート選択・生成部305において候
補を生成して提示することができるようにしてある。
【0190】そこで次に、テンプレート選択・生成部3
05において、往信文書の解析結果や文書作成の日付な
どにより、テンプレートの“※※”の部位を穴埋めする
処理を説明する。
【0191】テンプレート保持部322には穴埋め表現
のためのデータベースが用意してあり、また、テンプレ
ート選択・生成部305には、それぞれの番号の“※
※”に対して、テンプレート保持部322から提供され
るデータベースを参照して穴埋め表現の候補や、穴埋め
表現を候補から選択し、あるいは穴埋め表現を加工して
生成する処理機能を予め設定する。
【0192】例えば、“※※1”の位置における時候の
挨拶については、テンプレート保持部322に、以下の
ような時候の挨拶のデータベースが付随しており、テン
プレート選択・生成部305はそれを参照する。
【0193】 「1月: 新春(の候)、…、…、…、… 5月: 新緑(の候)、薫風(の候)、…、…、 … 7月: 盛夏(の候)、大暑(の候)、…、…、 8月: 残暑、…、… …」 このようなデータベースにおける1番目の候補はデフォ
ルトでの優先順位第1位の候補であるとする。例えば、
7月の場合は“盛夏”がデフォルトでの優先順位第1位
の候補であり、“大暑”がその次順の候補であるといっ
た具合である。
【0194】往信文書を入力文書として読み込ませてそ
の返信文書を作成する処理の場合には、テンプレート選
択・生成部305では、返信文書作成の日付(現在の日
時;コンピュータにはカレンダ機能や時計機能があるの
で、その機能から得られた現在の日時情報を元にしての
日付)から、上記のデータベースより適宜なる時候の挨
拶の語句を選択する。その際、往信文書中に存在する単
語と同一の語句にはならないように選択処理するものと
する。
【0195】上述の例示往信文書に対しては、返信文書
作成の日が“8月”のある日であったとすると、「残
暑」が選択される。また、“※※2”については、例え
ば以下のように穴埋めする単語の候補を用意する。順序
はデフォルトの優先順位とする。
【0196】データベースに保持された候補としては、
“ご清祥”、“ご盛栄”、“ご隆昌”などがあるとする
と、“ご清祥”がデフォルトでは優先順位第1位である
が、これは往信文書で使用されている語句であるから、
候補から外し、他から選択する。すなわち、テンプレー
ト選択・生成部305は、上記候補の中から、往信文書
中にある「ご清祥」を除いて優先順に選択する。例示し
た往信文書に対しては、デフォルトで第2位の“ご盛
栄”が選択されることになる。
【0197】テンプレート選択・生成部305における
以上の選択・生成処理により、使用者には、次のような
テンプレートが提示される。
【0198】「拝復 残暑の候、貴社ますますご盛栄の
こととお慶び申し上げます。さて、このたびは、
とのこと、誠におめでとうございます。パーティに
は、慶んで出席させていただきます。では、後日会場に
て。 敬具」 従って、返事を出す必要のある文書を作成するにあた
り、往信文書を入力文書として入力部101より入力す
ると、本発明の装置により、その内容を解析して返事と
しての文書として最適な内容の文書テンプレートを、各
種のテンプレートから探し、機械的に穴埋め可能な部分
については、必要な事項を最適語句で穴埋めした文書テ
ンプレートを使用者に自動的に提示することができるよ
うなる。
【0199】以下の例は、この提示されたテンプレート
を用いて使用者が作成できる返信電子メイルの一例であ
る。返信電子メイル用の文書テンプレートとして、提示
された 「拝復 残暑の候、貴社ますますご盛栄のこととお慶び
申し上げます。さて、このたびは、 とのこと、
誠におめでとうございます。パーティには、慶んで出席
させていただきます。では、後日会場にて。 敬具」 なる文を利用者は編集して、例えば、次のようなものに
変更する。そして、これを返信として送ることになる。
【0200】「拝復 残暑の候、貴社ますますご盛栄の
こととお慶び申し上げます。さて、このたびは、貴社本
店改装1周年とのこと、誠におめでとうございます。貴
社の業績はまことに好調と伺っております。これも皆様
のご努力の成果と存じ上げます。記念パーティには、も
ちろん、慶んで出席させていただきます。また特別頒布
会の方にも16時頃から参加させていただく予定です。
日頃ネットワーク上で親しんでおります貴社製品を、直
接一堂に拝見させていただく機会と楽しみにいたしてお
ります。では、後日会場にて。敬具」 このようにして、往信文書の内容から返信に必要な文書
の雛形が自動的に選択・生成されて利用者に提示さるこ
とにより、これを編集加工すれば、使用者のオリジナル
の文書となるので、容易に文書が作成できて、1から文
を起案する苦労から解放される。
【0201】[オリジナル文書テンプレートの登録]さ
て次に、文書テンプレートを編集して使用者が登録する
例を説明する。次は、往信電子メイルの一例である。
【0202】(i) 「先日届きました貴店商品のことで、
少々お伺いいたします。さる5月15日に、貴店の書籍
宅配サービスにて書籍1冊を注文いたしたのですが、先
日届きました書籍は発行日の古いもので、サービスの付
録が付いておりません。最新のものには、付録がもれな
くサービスで付いているはずだと思うのですが、どうい
う事情によりますものなのでしようか?」 これに対して、上記と同様の処理によって、図38のテ
ンプレート番号“(7)”番に登録された如き文書テン
プレートが出力部102より使用者に提示されるものと
する。このテンプレートを用いて、例えば以下のような
返信電子メイル文書を作成できる。
【0203】(ii)「いつもご愛顧いただき、まことにあ
りがとうございます。早速ですが、ご質問の件につきま
して、ご案内を申し上げます。そちらにお届けした書籍
につきましては、ご注文日当時の最新のものをお届けさ
せていただいております。お尋ねのサービス付録付き最
新版は5月31日に発売となりましたもので、特に発売
予告もない商品でしたので、そのように処理させていた
だきました。通常でしたらこのまま商品のお引き取りを
お願いするところなのですが、そちらへのお届けが、版
の変わった直後の6月2日となっておりますこともあ
り、弊社まで直接商品をお持ちいただければ最新版とお
取り換えさせていただきたく存じます。購入表もご持参
の上、ご来店くださいませ。なにとぞ事情のほどご理解
いただけますよう、よろしくお願い申し上げます。」 ここで、使用者は、上記の(i) の文書を適宜、コンピュ
ータ上の編集ツールを用いて編集し、新しいテンプレー
トを作成し、登録することができる。この場合、図33
に示す構成が必要である。すなわち、テンプレート選択
・生成部305に付随してテンプレート保持部322と
テンプレート登録部1001が設けられ、テンプレート
保持部322に付随して学習部1002が設けられる。
【0204】テンプレート登録部1001は使用者によ
る入力部101の操作により登録操作されると、現在、
システムのメインメモリ上に作成されていて未登録のテ
ンプレートを、テンプレート番号として現在登録済みの
末尾のテンプレート番号に1を加えた番号を付与した上
で、新たにテンプレート保持部322に追加記憶するも
のである。また、学習保持部1002はテンプレートを
加工して新たなテンプレートを作成し、登録した場合
に、元になったテンプレートのテンプレート番号と(元
テンプレート番号)、テンプレート保持部322に追加
記憶したそのテンプレートのテンプレート番号(学習テ
ンプレート番号)と、編集加工により追加されたキーワ
ードを、例えば図34の如き学習情報として保持するも
ので、その学習内容はテンプレート選択・生成部305
の情報を元にするなどしてテンプレート登録部1001
が提供する仕組みとなっている。
【0205】今、例えば、返信文書を利用して新たに手
動で作成した文書テンプレートとして次の如きものある
とする。
【0206】「(いつもご愛顧いただき、まことにあり
がとうございます。) (早速ですが、ご質問の件につきまして、ご案内を申し
上げます。) そちらにお届けした***につきましては、ご注文日当
時の最新のものをお届けさせていただいております。特
に発売予告もない商品でしたのでそのような処理となり
ました。 (なにとぞ事情のほどご理解いただけますよう、よろし
くお願い申し上げます。)」 ここで、“( )”で括ってある部分は、元々のテン
プレートから情報を引き継いでいる部分であり、また
「***」は、使用者と装置との間で取り決められた穴
埋め部分を示す記号で、使用者によって自由に指定でき
るものとする。
【0207】使用者がテンプレート登録のための定めら
れた操作を入力部101から行うと、上記の(i) のテン
プレートをテンプレート登録部1001は新たにテンプ
レート保持部322に追加する(番号は例えば“(2
0)”とする)ように処理すると同時に、テンプレート
保持部322は学習テンプレート番号情報、そして、テ
ンプレート選択・生成部305の処理情報を元にした元
テンプレート番号情報および追加キーワードの情報とを
学習保持部1002に与えて学習させるようにする。そ
の結果、新たなテンプレートがテンプレート保持部32
2に追加され、また、学習保持部1002には例えば図
34のような情報が保持されることになる。
【0208】ここで、追加キーワードの欄には、使用者
が情報を作成したものを取り込む。
【0209】[テンプレート登録処理]図43は、テン
プレート登録部1001での処理の流れの一例を示した
フローチャートである。このフローチャートに沿って説
明すると、まずステップS20‐1で、登録する文書テ
ンプレートの情報を入力させる。例えば、上に例示し
た、手動で作成したテンプレート候補を入力させる。ス
テップS20‐2で、「元テンプレートがあるか?」を
使用者に問い合わせる。答えが番号ならばその番号を読
み込み(ステップS20‐3)、「追加キーワードがあ
るか」を使用者に問い合わせ(ステップS20‐4)、
「Yes」ならば、ステップS20‐5に進む。ステッ
プS20‐2で答えが「NO」ならば、同じくステップ
S20‐5に進む。ステップS20‐5では使用者から
入力されたキーワード情報を取り込み、ステップS20
‐6に進む。ステップS20‐4で答えが「No」なら
ば、同じくステップS20‐6に進む。そして、ステッ
プS20‐6の処理においては新テンプレート情報をテ
ンプレート保持部322に登録した後に、学習情報を学
習保持部1002に登録して(ステップS20‐7)、
次の処理に移る。
【0210】次回以降は、元テンプレート欄に指定され
た番号のテンプレートが候補として選択された場合には
追加キーワード欄の条件を満足するかをチェックし、条
件が満足されていれば、学習テンプレートを元テンプレ
ートに優先して候補に採用することにより、テンプレー
トの学習が可能となる。
【0211】以上により、テンプレート登録部1001
によるテンプレート登録処理と学習部1002に対する
学習を実施させることができる。
【0212】[往信文書からの引用]さて次に、往信文
書から引用を行う例を述べる。文書の引用とは、取り込
んだ文書の一部を自動的に選択し、選択した文書テンプ
レートに、これを引用するかたちで当て嵌めて作成した
引用文書テンプレートを生成する機能であり、これを実
施するには、テンプレート選択・生成部305に引用部
分抽出・挿入部701、引用ルールテーブル702、引
用文データ保持部703を付加した図31の構成が必要
である。
【0213】引用ルールテーブル702は引用のルール
を規定したテーブルを保持するものであり、引用文デー
タ保持部703は引用文のデータを保持するものであ
る。また、引用部分抽出・挿入部701は、入力文書
(この場合、往信文書)から返信文書で引用する文もし
くは語句を文の内容から勘案して抽出し、引用文データ
保持部703に与えて保持させるとともに、返信文書に
対して、引用文データ保持部703が保持する引用文の
データを選択して挿入するなど、引用ルールテーブル7
02に示されるルールに従って抽出したり、挿入するな
どの処理を行なうものである。
【0214】図44は、テンプレート選択・生成部30
5での処理の流れの概略を示すフローチャートであり、
引用部分抽出・挿入の処理には、引用部分抽出・挿入部
701の機能を使用するようにする。往信文書からの引
用の処理は、これまでに説明してきたような処理によっ
てテンプレートを選択した(ステップS21‐1)後、
引用部分抽出・挿入部701の機能を使用することでこ
れから説明する図45の引用処理によって引用を行い
(ステップS21‐2)、その結果を出力することで完
結する。
【0215】図45は、引用処理の流れの一例を示すフ
ローチャートであり、テンプレート選択・生成部305
に付加した引用部分抽出・挿入部701の機能により実
現する。引用処理ではテンプレートの第1候補の番号が
確定した後に、まずステップS22‐1で、引用ルール
テーブルの該当するテンプレート番号の第1番目のルー
ルを参照する。
【0216】次にテーブル第2項のキーワード条件を参
照し(ステップS22‐2)、キーフレーズを入力文書
中に文字列検索する(ステップS22‐3)。キーワー
ド条件が一致した場合には(ステップS22‐4)、引
用の範囲と引用の位置を読み込み、引用文を引用文デー
タ保持部703に保持する(ステップS22‐5)。
【0217】次に、該当テンプレート番号の、次のルー
ルがあるかをチェックし(ステップS22‐6)、あれ
ばそれを参照し(ステップS22‐7)、ステップS2
2‐2に戻る。無ければ、引用文を引用の位置に引用す
る。引用文の順序は、同じ位置が指定されているものの
間では、元文書中の出現順を保存することも可能であ
る。
【0218】図46は、引用部分抽出・挿入部701の
より具体的な構成例である。引用部分抽出・挿入部70
1は引用部分の抽出と挿入の処理を行う引用部分抽出挿
入処理部701aと、引用順序の制御を行う引用順序制
御部701bとを有し、引用部分抽出挿入処理部701
aにより引用部分の抽出が行われ、引用順序制御部70
1bにより、引用文の順序が制御された後、引用部分抽
出挿入処理部701aがその順序に従い、テンプレート
の必要な箇所に挿入する処理が行われる。引用部分の挿
入対象となるテンプレートはテンプレート選択・生成部
305が選択する。
【0219】図47は、引用順序制御部701bの処理
の一例を示すフローチャートである。引用順序制御部7
01bでは、ステップS24‐1において、引用文デー
タを引用文データ保持部703から読み込み、引用位置
順にソートする。次に、ステップS24‐2で、同じ引
用位置のデータを元文書中の引用文出現位置順にソート
する。
【0220】以下は、先に例示した往信文書に対する返
信文書のテンプレートに、上記の処理に基づき引用が加
わった場合の文書テンプレート例で、テンプレート番号
“(7)”の文書テンプレートに往信文書に基づく引用
が加わった場合の文書テンプレート例である。
【0221】「いつもご愛顧いただき、まことにありが
とうございます。早速ですが、ご質問の件につきまし
て、ご回答申し上げます。さる5月15日に、貴店の書
籍宅配サービスにて書籍1冊を注文いたしたのですが、
先日届きました書籍は発行日の古いもので、サービスの
付録が付いておりません。最新のものには、付録がもれ
なくサービスで付いているはずだと思うのですがなにと
ぞ事情のほどご理解いただけますよう、お願い申し上げ
ます。」 往信文書に基づき引用が加わったこのテンプレートを用
いて、使用者は例えば、以下のような返信電子メイル文
書を作成できる。
【0222】「いつもご愛顧いただき、まことにありが
とうございます。早速ですが、ご質問の件につきまし
て、ご回答申し上げます。さる5月15日に、貴店の書
籍宅配サービスにて書籍1冊を注文いたしたのですが、
先日届きました書籍は発行日の古いもので、サービスの
付録が付いておりません。最新のものには、付録がもれ
なくサービスで付いているはずだと思うのですが、お届
けしております商品につきましては、通常より、カタロ
グでもご案内の通りご注文日当時の最新のものをお届け
させていただいております。お尋ねの最新商品につきま
しは、発売は5月31日となりますので、商品お届けの
5月23日よりもさらに1週間ほど後となっておりま
す。なにとぞ事情のほどご理解いただけますよう、お願
い申し上げます。」 このように、本装置によれば、往信文書に対して返信文
書を作成するにあたり、往信文書の内容から複数あるテ
ンプレートより最適なものを選択すると共に、往信文書
に基づき引用を加えて、目的により近いかたちでの文書
の雛形を生成して提示することができるようになり、使
用者はこの引用の加わったテンプレートを用いて、さら
に編集加工することでその人のオリジナルに近い返信文
書を容易に作成することができるようになる。
【0223】以上は、入力文書が往信文書であり、これ
に対しての返信文書を出力文書として出力する場合の例
を説明した。しかし、入力文書と出力文書が返信以外の
関係である場合も多いので、それに対処する例を次に説
明する。
【0224】(入力文書と出力文書が返信以外の関係で
ある場合)さて、次に、入力文書と出力文書が返信以外
の関係である場合について述べる。まず第1に、先に述
べたキーワード指定の方法によって、返信以外の関係で
ある場合を想定した装置を構成することは、返信である
場合と同様に、可能である。また、種々の関係の混在に
も、キーワードの指定によって対処できる。
【0225】しかし、関係間によって、キーワードの条
件が同じでありながら、テンプレートを切り替える必要
が存在する。そこで、以下のように、関係を指定して対
処する装置を構築する。
【0226】[関係を指定して対処する装置の例]図4
8は、入力文書と出力文書が返信以外の関係である場合
に対処することができるようにしたテンプレート選択・
生成部305での処理の流れの一例を示すフローチャー
トである。ここで、図35に示す構成がここでの処理に
必要な機能を有するテンプレート選択・生成部305の
例であり、テンプレート選択・生成部305にはさら
に、1201の関係候補および関係・テンプレート選択
ルール対応保持部を備える。関係候補および関係・テン
プレート選択ルール対応保持部1201は、関係候補お
よび関係・テンプレート選択ルール対応情報を保持して
テンプレート選択・生成部305に提供するものであ
る。
【0227】関係候補および関係・テンプレート選択ル
ール対応保持部1201に保持される情報は、例えば図
37の如きであり、この情報は内容判別・テンプレート
選択テーブルに対応している。なお、この図37の例
は、図36に示す如きの内容判別・テンプレート選択テ
ーブルに対応する情報の一例である。
【0228】例えば、テンプレート保持部322にテン
プレート番号“(51)”のテンプレートとして、 「このたびは、ホームパーティにお招きにあずかりまし
て、どうありがとうございました。喜んで出席させて頂
きます。引越しの後でお忙しいのは十分承知しておりま
すので、どうぞ何もお構いなく。料理なども持ち寄りの
パーティということではいかがでしょう? ____________________ では当日を楽しみにいたしております。」 があり、また、テンプレート番号“(120)”のテン
プレートとして、 「このたび、私どもは、下記の住所に転居いたしまし
た。 ____________________ つきましては、皆様をお招きしてささやかながらホーム
パーティを開きたく存じます。 ____________________ どうぞお気軽にお越し下さい。ご都合の良い日取りをお
知らせいただければ、幸いです。」 があるとする。
【0229】本装置の使用者が、関係情報の指定のため
の操作を入力部101より行うと、テンプレート選択・
生成部305はステップS2501で、内容判別・テン
プレート選択テーブルの「関係」の欄の情報を取り出
し、制御部200を通じて、出力部102に出力し、出
力部102の構成要素の一つである表示部(ディスプレ
イ)に表示する。
【0230】これにより、表示部には関係候補および関
係・テンプレート選択ルール対応保持部1201の保持
テーブルの「関係」の欄の情報が一覧表示される。ここ
で「関係」とは、文書テンプレートの内容から極めて大
雑把に分類した場合の分類項目名であり、“返信”、
“詳細”、“続き”といった分け方で表記したものであ
る。例えば、“返信”は往信文書に対する種々の返信文
書のテンプレート群を対象にしていることを示してお
り、これらのうちから候補を選ぶ場合の選択テーブル番
号がその項目対応に登録されている。
【0231】本装置の使用者が、この一覧として提示さ
れた関係の1つを入力部101の操作により選択・指定
すると、その情報を取り込む(ステップS2502)。
【0232】次にテンプレート選択・生成部305はス
テップS2503で該当するテーブル番号の条件を読み
込み、以降、テンプレート選択処理においては、テーブ
ル番号の条件を満たす範囲内で、キーワードのチェック
を行う。
【0233】例えば、一覧の中から“詳細”という「関
係」が指定された場合には、「引越し」,「パーティ」
という同じキーワードがマッチしても、テンプレート番
号“(51)”のテンプレートではなく、テンプレート
番号“(120)”のテンプレートが参照される。
【0234】すなわち、「引っ越しました。10月10
日にホームパーティを開きたいと思います。都合を知ら
せてください。」なる文書を入力文書として入力し、こ
れに対して、“詳細”を指定すると、当該文書の解析の
結果、「引越し」,「パーティ」というキーワードが抽
出されてこれらのキーワードを持つ文書テンプレートが
テンプレート保持部322から検索されることになる
が、“詳細”が指定されていることにより、「引越
し」,「パーティ」という同じキーワードが含まれる種
々の文書テンプレートがテンプレート保持部322にあ
っても、テーブル番号の条件を満たす範囲内での選択と
いう上記の処理の結果、テンプレート番号“(12
0)”のテンプレートが提示されることになる。
【0235】この提示されたテンプレート番号“(12
0)”の文書テンプレートを用いて本装置の使用者は、
次のような文書を作成できる。
【0236】「このたび、私どもは、下記の住所に転居
いたしました。つきましては、来る10月10日に、皆
様をお招きしてささやかながらホームパーティを開きた
く存じます。家族一同お待ちしておりますので、どうぞ
お気軽にお越しくださいませ。ご都合のほどをお知らせ
いただけますよう、よろしくお願いします。」 すなわち、本装置によれば、入力文書と出力文書が返信
以外の関係である場合にその関係を指定することで、目
的の内容の文書テンプレートを選択して利用することが
できるようになる。
【0237】以上は、図25に示した形態での具体例を
対象にしたが、次に図26に示した形態での具体例につ
いて説明する。
【0238】図25の装置と図26の装置の違いは、テ
ンプレート選択の処理の流れである。図49は、図26
に示した装置での、テンプレート選択処理の流れの一例
を示すフローチャートである。
【0239】まず、辞書部302に保持される単語辞書
には、収録されているその単語に関し、テンプレート選
択ルールのキーワードに含まれる見出し語については、
それぞれにテンプレート選択ルールの番号の情報を付与
しておく。文書テンプレート制御部300によるテンプ
レート選択の処理は、はじめにステップS26‐1で入
力文書解析部301の処理により辞書部302の辞書を
利用して入力文書の形態素解析を行い、対応する辞書見
出し語に付随するテンプレート選択ルール番号と共に解
析結果を文書解析結果保持部303に保持する。
【0240】次にステップS26‐2では、前記解析し
た入力文書の第1番目の単語を、テンプレート選択・生
成部305が、文書解析結果保持部303で参照する。
そして、テンプレート選択・生成部305は参照した単
語にテンプレート選択ルール番号が付随しているかどう
かをチェックし(ステップS26‐3)、付いていない
場合には、文書中に次の単語があるかどうかをチェック
する(ステップS26‐4)。
【0241】無い場合には、「該当なし」として、次の
処理に移る(ステップS26‐5)。26‐4で有る場
合には、その単語を参照して(ステップS26‐6)、
ステップS26‐3に戻る。ステップS26‐3で有っ
た場合には、テンプレート選択・生成部305は該当ル
ールの2番目のキーワードを参照し(ステップS26‐
7)、文書解析結果保持部303の保持情報中に含まれ
るキーワードを検索する(ステップS26‐8)。
【0242】キーワードがあった場合(ステップS26
‐9)、テンプレート選択・生成部305は該ルールに
次のキーワードがあるかどうかをチェックし(ステップ
S26‐10)、無ければ該ルールのテンプレート候補
番号を読み込み(ステップS26‐11)、次の処理へ
移る。ステップS26‐10で次のキーワードが有れ
ば、そのキーワードを参照し(ステップS26‐1
2)、ステップS26‐8に戻る。ステップS26‐9
でキーワードが無ければ、ステップS26‐4に進む。
【0243】このような処理を文書テンプレート制御部
300に行わせても、入力文書に対応する最適な返信文
書のテンプレートの選択生成や、作成したい目的の文書
内容に近い文書のテンプレートの選択生成を行うことが
でき、文案を練る労を解放してしかも、装置使用者のオ
リジナルに近い文書を容易に作成することができるよう
になる。
【0244】このように、第5および第6の具体例は、
文書作成者が、作成しようとする文書、たとえば、往信
文書に対する返信文書、返信文書に対する往信文書を指
定し、往信文書、返信文書などの元になる文書(源文
書)を入力すると、その入力されて取り込まれた文書を
解析し、キーワードの検索、用件の抽出、質問箇所の抽
出、丁寧度の判定などを行ってその結果と、作成文書と
源文書との関係、例えば返信であるという情報により、
予め保持されている複数種の文書テンプレートから最も
適切な文書テンプレートを自動的に選択し、あるいは作
成し、それを文書作成者に提示させるようにしたことに
より、文書作成者は、簡易に、最適の文書テンプレート
を得ることができるようにした。
【0245】従って、使用者(文書作成者)は、簡易に
最適の文書テンプレートを得ることができるようにな
る。
【0246】以上、本発明に関わる具体例を述べたが、
その他、本発明は、上記具体例のみならずその趣旨を逸
脱しない範囲内で、種々の適用が可能である。
【0247】
【発明の効果】以上、詳述したように、本発明によれ
ば、指定された文書を解析し、共通の表現の部分からテ
ンプレートの骨組みを生成して提示するようにしたの
で、元になる文書を与えるだけで簡易に必要なテンプレ
ートを入手でき、文書作成を容易に行うことができるよ
うになり、また、指定された文書から共通の表現を取り
出して一覧形式で表示し、その中から表現を選択してゆ
くと、順にそれが取り込まれて文書として組み立てられ
るようにしたことで、文書作成を容易にすることを可能
にし、あるいは、共通の表現の部分を原文書において抑
制して表示し、他は強調表示することにより、似たよう
な内容の2つの文書を内容的に比較して内容的な違いの
ある部分を明示的に表示できるようにしたから、文書理
解の効率向上を図ることができるようになるなどの効果
が得られる。
【0248】また、本発明によれば、自然言語で書かれ
た文書を取り込み、この取り込んだ文書を解析してその
内容を反映させるかたちで文章が埋め込まれた文書作成
用テンプレートを自動的に選択または作成すると共に、
この選択または作成された文書作成用テンプレートを提
示するようにしたことにより、最も適切な文書テンプレ
ートが自動的に選択、あるいは作成され、使用者は、簡
易に最適の文書テンプレートを得ることができる。
【図面の簡単な説明】
【図1】本発明を説明するための図であって、本発明の
第1の具体例に係わる装置の概略構成を示すブロック
図。
【図2】本発明を説明するための図であって、本発明の
第2の具体例に係わる装置の概略構成を示すブロック
図。
【図3】解析結果保持部の情報の例
【図4】表現情報保持部の情報の例を示す図。
【図5】表現情報保持部の情報の例を示す図。
【図6】入力文書の例を示す図。
【図7】入力文書の例を示す図。
【図8】表現情報保持部の情報の例を示す図。
【図9】表現比較選別部の処理内容を示すフローチャー
ト。
【図10】ズテップ1112の処理のフローチャート。
【図11】関係情報置換テーブルの例を示す図。
【図12】共通表現情報保持部の情報の例をしめす図。
【図13】テンプレート生成部の処理のフローチャー
ト。
【図14】ステップS1509の処理のフローチャー
ト。
【図15】生成されたテンプレートの表示例を示す図。
【図16】入力文書の例と生成されたテンプレートの表
示例を示す図
【図17】本発明を説明するための図であって、本発明
の第3の具体例に係わる装置の概略構成を示すブロック
図。
【図18】表示表層文字列生成部の処理のフローチャー
ト。
【図19】生成されたポッブアップメニューの表示例を
示す図。
【図20】編集過程の例を示す図。
【図21】本発明を説明するための図であって、本発明
の第4の具体例に係わる装置の概略構成を示すブロック
図。
【図22】差異情報表示生成部の処理の流れを示すフロ
ーチャート。
【図23】入力文書の例とこれに対する差異情報の表示
例を示す図。
【図24】本発明を説明するための図であって、本発明
の第5の具体例に係わる装置の概略構成を示すブロック
図。
【図25】本発明を説明するための図であって、本発明
の第6の具体例に係わる装置の概略構成を示すブロック
図。
【図26】本発明に係わる装置の概略構成を示すブロッ
ク図
【図27】テンプレート選択ルール保持部の一例を示す
図。
【図28】内容判別・テンプレート選択テーブルの一例
を示す図。
【図29】テンプレート選択ルール保持部の一例を示す
図。
【図30】丁寧度判別・テンプレート選択テーブルの一
例を示す図。
【図31】テンプレート選択・生成部の一例を示す図。
【図32】引用ルールテーブルの一例を示す図。
【図33】テンプレート選択・生成部の一例を示す図。
【図34】学習保持部の一例を示す図。
【図35】テンプレート選択・生成部の一例を示す図。
【図36】関係候補および関係・テンプレート選択ルー
ル対応保持部の一例を示す図。
【図37】内容判別・テンプレート選択テーブルの一例
を示す図。
【図38】テンプレー卜候補保持部の一例を示す図。
【図39】テンプレート選択・生成部の処理の流れを示
すフローチャート。
【図40】テンプレート選択・生成部の処理の流れを示
すフローチャート。
【図41】テンプレート選択・生成部の処理の流れを示
すフローチャート。
【図42】テンプレート選択・生成部の処理の流れを示
すフローチャート。
【図43】テンプレート登録部の処理の流れを示すフロ
ーチャート。
【図44】テンプレート選択・生成部の処理の流れを示
すフローチャート。
【図45】引用部分抽出・挿入部の処理の流れを示すフ
ローチャート。
【図46】引用部分抽出・挿入部の一例を示す図。
【図47】引用順序制御部の処理の流れを示すフローチ
ャート。
【図48】テンプレート選択・生成部の処理の流れを示
すフローチャート。
【図49】テンプレート選択・生成部の処理の流れを示
すフローチャート。
【符号の説明】 100…制御・処理部 101…入力部 102…出力部 103…制御部 104…入力文書解析部 105…表現情報保持部 106…表現比較選別部 107…共通表現情報保持部 108…表示文字列情報生成部 200…制御部 209,302…辞書部 210…解析結果保持部 211…テンプレート生成部 300…文書テンプレート制御部 301…入力文書解析部 303…文書解析結果保持部 305…テンプレート選択・生成部 306…入力文書参照部 322…テンプレート保持部 323…テンプレート選択・生成ルール保持部
フロントページの続き (72)発明者 水谷 由美 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 木村 和広 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 出羽 達也 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 入力された文書を解析し、該文書中の、
    少なくとも単語の情報を含む表現情報を抽出する入力文
    書解析手段と、 この入力文書解析手段により解析して得られた表現情報
    を前記文書対応に保持する表現情報保持手段と、 表現情報保持部に保持された情報のうち文書間で共通す
    る表現を選別する表現比較選別手段と、 上記表現比較選別手段により選別された表現情報を保持
    する共通表現情報保持手段と、 上記共通表現情報保持手段に保持された情報に基づいて
    表示情報を生成する表示文字列情報生成手段と、を具備
    することを特徴とする文書処理支援装置。
  2. 【請求項2】 入力された文書を解析し、該文書中の、
    少なくとも単語の情報を含む表現情報を抽出する入力文
    書解析手段と、 この入力文書解析手段により解析して得られた表現情報
    を前記文書対応に保持する表現情報保持手段と、 表現情報保持部に保持された情報のうち文書間で共通す
    る表現を選別する表現比較選別手段と、 上記表現比較選別手段により選別された表現情報を保持
    する共通表現情報保持手段と、 上記共通表現情報保持手段に保持された情報に基づいて
    表示情報を生成する表示文字列情報生成手段と、 上記共通表現情報保持手段に保持された情報に基づき文
    書テンプレートを生成する手段と、を具備することを特
    徴とする文書処理支援装置。
  3. 【請求項3】 入力された文書を解析し、該文書中の、
    少なくとも単語の情報を含む表現情報を抽出する入力文
    書解析手段と、 この入力文書解析手段により解析して得られた表現情報
    を前記文書対応に保持する表現情報保持手段と、 表現情報保持部に保持された情報のうち文書間で共通す
    る表現を選別する表現比較選別手段と、 上記表現比較選別手段により選別された表現情報を保持
    する共通表現情報保持手段と、 上記共通表現情報保持手段に保持された表現情報に基づ
    いて表示情報を生成する表示文字列情報生成手段と、 上記共通表現情報保持手段に保持された表現情報を一覧
    表示する手段と、 この一覧表示された情報を選択指定することにより、そ
    の表現情報を並べた表現による文書を作成する手段と、
    を具備することを特徴とする文書処理支援装置。
  4. 【請求項4】 入力された文書を解析し、該文書中の、
    少なくとも単語の情報を含む表現情報を抽出する入力文
    書解析手段と、 この入力文書解析手段により解析して得られた表現情報
    を前記文書対応に保持する表現情報保持手段と、 表現情報保持部に保持された情報のうち文書間で共通す
    る表現を選別する表現比較選別手段と、 上記表現比較選別手段により選別された表現情報を保持
    する共通表現情報保持手段と、 入力された文書のうちの特定の文書について、上記共通
    表現情報保持手段に保持されている表現とそれ以外の表
    現とを、識別可能な形態で文書表示する手段と、を具備
    することを特徴とする文書処理支援装置。
  5. 【請求項5】 少なくとも2つの類似内容の文書から、
    共通の要素を抽出し、他は空欄として文書作成用テンプ
    レートを生成することを特徴とする文書処理支援方法。
  6. 【請求項6】 与えられた文書から、記述内容を切り分
    けて一覧にし、この一覧中から切り分けられた記述内容
    を順に指定すると、前記切り分けられた記述内容を並べ
    て文を作成することを特徴とする文書処理支援方法。
  7. 【請求項7】 文書作成用テンプレートを複数種保持す
    るテンプレート保持手段と、 自然言語で書かれた文書を取り込む手段と、 この取り込み手段により取り込まれた文書を参照して得
    られた情報に基づき、前記テンプレート保持手段の複数
    種の文書作成用テンプレートの中から最適テンプレート
    を選択するテンプレート制御手段と、 このテンプレート制御手段により得られた文書作成用テ
    ンプレートを出力する手段と、を具備することを特徴と
    する文書処理支援装置。
  8. 【請求項8】 文書作成用テンプレートを複数種保持す
    るテンプレート保持手段と、 自然言語で書かれた文書を取り込む手段と、 この取り込み手段により取り込まれた文書を参照して得
    られた情報に基づき、前記テンプレート保持手段の複数
    種の文書作成用テンプレートの中から最適テンプレート
    を選択するとともに、前記取り込まれた文書を参照して
    得られた情報のうち、前記選択した文書作成用テンプレ
    ートに埋め込み可能な情報はそのテンプレートに埋め込
    んで出力するテンプレート制御手段と、 このテンプレート制御手段により得られた文書作成用テ
    ンプレートを出力する手段と、を具備することを特徴と
    する文書処理支援装置。
  9. 【請求項9】 文書作成用テンプレートを複数種保持す
    るテンプレート保持手段と、 自然言語で書かれた文書を取り込む手段と、 この取り込み手段により取り込まれた文書が、定められ
    た内容識別条件を満足するか否かを判定し、その結果に
    基づき、前記テンプレート保持手段の複数種の文書作成
    用テンプレートの中から最適なテンプレートを選択する
    テンプレート制御手段と、 このテンプレート制御手段により得られた文書作成用テ
    ンプレートを出力する手段と、を具備することを特徴と
    する文書処理支援装置。
  10. 【請求項10】 文書作成用テンプレートを複数種保持
    するテンプレート保持手段と、 自然言語で書かれた文書を取り込む手段と、 この取り込み手段により取り込まれた文書が、定められ
    た内容識別条件を満足するか否かを判定し、その結果に
    基づき、前記テンプレート保持手段の複数種の文書作成
    用テンプレートの中から最適なテンプレートを選択する
    とともに、前記取り込まれた文書を参照して得られた情
    報のうち、前記選択した文書作成用テンプレートに埋め
    込み可能な情報はそのテンプレートに埋め込んで出力す
    るテンプレート制御手段と、 このテンプレート制御手段により得られた文書作成用テ
    ンプレートを出力する手段と、を具備することを特徴と
    する文書処理支援装置。
  11. 【請求項11】 文書作成用テンプレートを複数種保持
    するテンプレート保持手段と、 自然言語で書かれた文書を取り込む手段と、 この取り込み手段により取り込まれた文書を参照して得
    られた情報に基づき、文書の丁寧度を判定し、その結果
    に基づき相応の丁寧度の文書作成用テンプレートを前記
    テンプレート保持手段の複数種の文書作成用テンプレー
    トの中から選択するとともに、前記取り込まれた文書を
    参照して得られた情報のうち、前記選択した文書作成用
    テンプレートに埋め込み可能な情報はそのテンプレート
    に埋め込んで出力するテンプレート制御手段と、 このテンプレート制御手段により得られた文書作成用テ
    ンプレートを出力する手段と、を具備することを特徴と
    する文書処理支援装置。
  12. 【請求項12】 文書作成用テンプレートを複数種保持
    するテンプレート保持手段と、 自然言語で書かれた文書を取り込む手段と、 この取り込み手段により取り込まれた文書を参照して得
    られた情報に基づき、所定の選択ルールに従って前記テ
    ンプレート保持手段の複数種の文書作成用テンプレート
    の中から最適なテンプレートを選択するとともに、前記
    取り込まれた文書を参照して得られた情報のうち、前記
    選択した文書作成用テンプレートに埋め込み可能な情報
    はそのテンプレートに埋め込んで出力するテンプレート
    制御手段と、 このテンプレート制御手段により得られた文書作成用テ
    ンプレートを出力する手段と、 作成する文書と取り込んだ文書の関係の候補を提示する
    手段と、提示された関係の候補の一つを使用者が選択し
    指定する手段と、指定された関係情報によって文書作成
    用テンプレートの選択ルールを切り替える手段と、を具
    備することを特徴とする文書処理支援装置。
JP8028867A 1996-02-16 1996-02-16 文書処理支援方法および文書処理支援装置 Pending JPH09223129A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8028867A JPH09223129A (ja) 1996-02-16 1996-02-16 文書処理支援方法および文書処理支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8028867A JPH09223129A (ja) 1996-02-16 1996-02-16 文書処理支援方法および文書処理支援装置

Publications (1)

Publication Number Publication Date
JPH09223129A true JPH09223129A (ja) 1997-08-26

Family

ID=12260336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8028867A Pending JPH09223129A (ja) 1996-02-16 1996-02-16 文書処理支援方法および文書処理支援装置

Country Status (1)

Country Link
JP (1) JPH09223129A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106954A (ja) * 2004-10-01 2006-04-20 Kyodo Printing Co Ltd ツメの生成方法及び索引データ生成方法並びにツメの生成装置及び索引データ生成装置
WO2009041586A1 (ja) * 2007-09-28 2009-04-02 Canon Kabushiki Kaisha 診断支援装置及びその制御方法
JP2009271844A (ja) * 2008-05-09 2009-11-19 Ird:Kk 情報処理装置、情報処理方法、およびプログラム
JP2011014102A (ja) * 2009-07-06 2011-01-20 Fujitsu Ltd 診療情報入力プログラム、診療情報入力装置および診療情報入力方法
JP2012037790A (ja) * 2010-08-10 2012-02-23 Toshiba Corp 音声対話装置
JP4888557B2 (ja) * 2007-06-28 2012-02-29 富士通株式会社 通信装置
JP2013097396A (ja) * 2011-10-27 2013-05-20 Kyocera Corp 電子機器
JP2018503145A (ja) * 2015-11-17 2018-02-01 小米科技有限責任公司Xiaomi Inc. 情報テンプレートをマイニングする方法、その装置、プログラム、及び記録媒体
JP2018509689A (ja) * 2015-02-05 2018-04-05 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 放射線レポートのためのレポート内容のコンテキスト生成
CN113761849A (zh) * 2020-06-15 2021-12-07 北京沃东天骏信息技术有限公司 一种填写文档的提示方法和装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106954A (ja) * 2004-10-01 2006-04-20 Kyodo Printing Co Ltd ツメの生成方法及び索引データ生成方法並びにツメの生成装置及び索引データ生成装置
JP4888557B2 (ja) * 2007-06-28 2012-02-29 富士通株式会社 通信装置
WO2009041586A1 (ja) * 2007-09-28 2009-04-02 Canon Kabushiki Kaisha 診断支援装置及びその制御方法
US7894676B2 (en) 2007-09-28 2011-02-22 Canon Kabushiki Kaisha Diagnosis support apparatus and control method therefor
JP2009271844A (ja) * 2008-05-09 2009-11-19 Ird:Kk 情報処理装置、情報処理方法、およびプログラム
JP2011014102A (ja) * 2009-07-06 2011-01-20 Fujitsu Ltd 診療情報入力プログラム、診療情報入力装置および診療情報入力方法
JP2012037790A (ja) * 2010-08-10 2012-02-23 Toshiba Corp 音声対話装置
JP2013097396A (ja) * 2011-10-27 2013-05-20 Kyocera Corp 電子機器
JP2018509689A (ja) * 2015-02-05 2018-04-05 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 放射線レポートのためのレポート内容のコンテキスト生成
JP2018503145A (ja) * 2015-11-17 2018-02-01 小米科技有限責任公司Xiaomi Inc. 情報テンプレートをマイニングする方法、その装置、プログラム、及び記録媒体
US10180976B2 (en) 2015-11-17 2019-01-15 Xiaomi Inc. Method and device for mining an information template
CN113761849A (zh) * 2020-06-15 2021-12-07 北京沃东天骏信息技术有限公司 一种填写文档的提示方法和装置

Similar Documents

Publication Publication Date Title
US6044365A (en) System for indexing and retrieving graphic and sound data
JP5791861B2 (ja) 情報処理装置および情報処理方法
US6996561B2 (en) System and method for interactively entering data into a database
CN105868176A (zh) 基于文字的视频合成方法及其系统
JPH09134282A (ja) プログラム作成方法
WO2002037223A2 (en) Computer based integrated text and graphic document analysis
JP2015201236A (ja) キーワードおよびストリング入力に基づき、動画メディアをアセンブリする方法およびシステム
JPH09223129A (ja) 文書処理支援方法および文書処理支援装置
CN107679038B (zh) 一种文本段落的抽取方法及装置
Connell et al. Ontological Sketch Models: Highlighting User—System Misfits
JP2003141027A (ja) 要約作成方法および要約作成支援装置およびプログラム
Chowdhury et al. An overview of the information retrieval features of twenty digital libraries
Kim et al. Lexichrome: Text construction and lexical discovery with word-color associations using interactive visualization
US20080059311A1 (en) System and Method for Generating Advertisements Utilizing a Database of Stock Imagery
TWI288336B (en) Method and system of editing communication sheets
CN109948128B (zh) 一种辅助编辑系统
JP2005031950A (ja) 情報検索装置、情報検索方法およびプログラム
JP5511161B2 (ja) 情報処理装置および情報処理方法
Gontarski Still at Issue after All These Years: The Beckettian Text, Printed and Performed
US20050278311A1 (en) System and method for generating advertisements utilizing a database of stock imagery
JPH0822470A (ja) 資料作成支援システム
WO2010010920A1 (ja) 情報処理装置および情報処理方法
JP4260641B2 (ja) 検索結果処理装置、検索結果処理プログラム、検索結果処理プログラム記録媒体及び検索結果処理システム
US20070042761A1 (en) Message inputting device
JP3710463B2 (ja) 翻訳支援辞書装置