JPH06168267A - 構造化文書作成方法及び構造化文書作成支援装置 - Google Patents

構造化文書作成方法及び構造化文書作成支援装置

Info

Publication number
JPH06168267A
JPH06168267A JP4340966A JP34096692A JPH06168267A JP H06168267 A JPH06168267 A JP H06168267A JP 4340966 A JP4340966 A JP 4340966A JP 34096692 A JP34096692 A JP 34096692A JP H06168267 A JPH06168267 A JP H06168267A
Authority
JP
Japan
Prior art keywords
unit
character string
speech
input
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4340966A
Other languages
English (en)
Inventor
Shigeo Kosuge
惠雄 小菅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ITEC KK
Original Assignee
ITEC KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ITEC KK filed Critical ITEC KK
Priority to JP4340966A priority Critical patent/JPH06168267A/ja
Publication of JPH06168267A publication Critical patent/JPH06168267A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】本発明は、文書表現の標準化を図り情報伝達の
効率を高めることが可能な構造化文書作成方法を提供す
るものである。 【構成】本発明の構造化文書作成方法は、日本語を含む
多くの言語による多数の文章をランダムに収集し、収集
した多数の文章をその意味内容において分類し関係付け
を行い、関係付けた文章を空間的な位置関係に配置され
た図解表現に自動的に作図処理し、この作図処理結果を
基に抽象化度合いに応じて階層化処理が施された構造化
文書を生成するものである。これにより、文字列単体で
は解析困難な意味内容を含む文章も、品詞分解解析や他
の文章からの類推等から意味の輪郭を確定することがで
き、使い込むことにより、学習効果を高め意味情報の体
系的整理が利用者からは無意識のうちに構築可能とな
り、一見雑多に見え、収束が困難な情報に対し構造を与
え収束点を早く見つけることが可能となる。

Description

【発明の詳細な説明】
【産業上の利用分野】本発明は、日本語ワードプロセッ
サ、オンライン端末、コンピュータ、情報家電の情報処
理機器に対する文書・ファイル管理装置等に適用して好
適な構造化文書作成方法及び構造化文書作成支援装置に
関する。
【従来の技術】従来の情報処理機器における文書の管理
方法は、作業者が手作業で作成する通常の紙をベースと
した文書と同様に、上から下へ順番に読み進むシーケン
シャル(順列的)な構造しか持たず、最後まで読まなけ
れば何が書いてあり、何が主旨なのか判らないという問
題があった。また、この方法では順方向での関係付けし
か記述できず、空間的に関係する諸処の問題については
表現することができないという問題があった。コンピュ
ータによる作図処理もまた、特殊な技能を必要とし、デ
ザイン的感覚や極度の集中力を要求され、誰でもが簡単
にというものではなかった。このために、前述した文書
の表現に関する問題も、文書に図解を添付すれば解決し
そではあるが、実際には、文書を論理的に線的に記述す
る能力と、それを図解で表現し実際に作図できる能力を
有する人は少なく、知識を体系化し伝達することは一部
の文筆業に携わる者か特別に能力の高い者に限られてい
た。また、パソコン通信等で見られるコンピュータ上で
の会議も同様であり、構造化されない収束点のない会話
が延々と続き、途中からそれに入り込むことは困難であ
り、相互の関係性も見いだすことは難しい。更に、コン
ピュータ上に限らず、一般の会議も同様の傾向を持ち、
会議の時間だけ長く、収束点も見つからない。そして、
最終的に決まった内容も明快性に欠け、構造化されてい
ないまま放置されている。
【発明が解決しようとする課題】上記従来における当該
各問題は、雑多な情報を構造的にまとめ抽象化して、記
録する手段が情報機器に対して開発されておらず、情報
が未整理のまま、ただ入力された順番に格納されている
ことに起因するものと考察される。そこで、本発明は、
情報を取り扱う単位を規定しそれを構造化する手順を決
め、最終的な成果物として構造化された文書を可能な限
り自動化し標準的な仕上がりとして提供することで、文
書表現の標準化を図り情報伝達の効率化を高めることが
可能な構造化文書作成方法及び構造化文書作成支援装置
を提供することを目的とするものである。
【課題を解決するための手段】請求項1記載の構造化文
書作成方法は、日本語を含む多くの言語による多数の文
章をランダムに収集し、収集した多数の文章をその意味
内容において分類し関係付けを行い、関係付けた文章を
空間的な位置関係に配置された図解表現に自動的に作図
処理し、この作図処理結果を基に抽象化度合いに応じて
階層化処理が施された構造化文書を生成するものであ
る。請求項2記載の構造化文書作成支援装置は、日本語
を含む多数の単語について、その品詞別属性を記憶して
いる品詞辞書部及び類似語、同義語を管理し、品詞の意
味内容を記憶する類似語辞書部からなる辞書記憶手段
と、日本語を含む多数の文字列を含む文章、ファイルを
入力する入力手段と、入力された文字列を品詞別に分解
する品詞分解部と、品詞分解部により分解した品詞のう
ち品詞辞書に含まれない新語を判断し、品詞辞書部の追
加更新を行う新語更新部と、入力手段から入力された文
字列の総文字数、漢字文字数、ANK文字数等の判断材
料を求める文字列属性処理部と、入力手段から入力され
た文字列、ファイルの可読文字、可読ファイルの判定を
行う可読判定部と、入力手段から入力された文字列と類
似語辞書に記憶した各品詞の意味内容とを照合し文字列
の意味内容を解析する品詞意味内容照合部と、前記品詞
意味内容照合部により解析された文字列の文章としての
正当性を判断する文字列内容判断部と、前記文字列属性
処理部で求めた判断材料、可読判定部で可読と判定され
た文字列、ファイル、文字列内容判断部により正当であ
ると判断された文字列を記憶する記憶手段とを有するも
のである。請求項3記載の構造化文書作成支援装置は、
日本語を含む多数の単語について、その品詞別属性を記
憶している品詞辞書部及び類似語、同義語を管理し、品
詞の意味内容を記憶する類似語辞書部からなる辞書記憶
手段と、日本語を含む多数の文字列を含む文章、ファイ
ルを入力する入力手段と、入力された文字列を品詞別に
分解する品詞分解部と、品詞分解部により分解した品詞
のうち品詞辞書に含まれない新語を判断し、品詞辞書部
の追加更新を行う新語更新部と、入力手段から入力され
た文字列の総文字数、漢字文字数、ANK文字数等の判
断材料を求める文字列属性処理部と、入力手段から入力
された文字列、ファイルの可読文字、可読ファイルの判
定を行う可読判定部と、入力手段から入力された文字列
と類似語辞書に記憶した各品詞の意味内容とを照合し文
字列の意味内容を解析する品詞意味内容照合部と、前記
品詞意味内容照合部により解析された文字列の文章とし
ての正当性を判断する文字列内容判断部と、前記文字列
属性処理部で求めた判断材料、可読判定部で可読と判定
された文字列、ファイル、文字列内容判断部により正当
であると判断された文字列を記憶する記憶手段と、記憶
手段に記憶した正当であると判断された文字列の意味内
容の類似性を解析する類似性解析部と、この類似性解析
部により解析される文字列の類似性計数の算出及び類似
性計数に応じて表示候補となる文字列の選択を行う選択
手段と、この選択手段の選択結果を表示する表示手段
と、前記選択手段により選択した類似性計数の高い文字
列の前記類似語辞書部への書き込みを行う類似語書き込
み部とを有するものである。請求項4記載の構造化文書
作成支援装置は、日本語を含む多数の単語について、そ
の品詞別属性を記憶している品詞辞書部及び類似語、同
義語を管理し、品詞の意味内容を記憶する類似語辞書部
からなる辞書記憶手段と、日本語を含む多数の文字列を
含む文章、ファイル、グループ別の意味内容を代表する
見出し文字をする入力手段と、入力された文字列を品詞
別に分解する品詞分解部と、品詞分解部により分解した
品詞のうち品詞辞書に含まれない新語を判断し、品詞辞
書部の追加更新を行う新語更新部と、入力手段から入力
された文字列の総文字数、漢字文字数、ANK文字数等
の判断材料を求める文字列属性処理部と、入力手段から
入力された文字列、ファイルの可読文字、可読ファイル
の判定を行う可読判定部と、入力手段から入力された文
字列と類似語辞書に記憶した各品詞の意味内容とを照合
し文字列の意味内容を解析する品詞意味内容照合部と、
前記品詞意味内容照合部により解析された文字列の文章
としての正当性を判断する文字列内容判断部と、前記文
字列属性処理部で求めた判断材料、可読判定部で可読と
判定された文字列、ファイル、文字列内容判断部により
正当であると判断された文字列を記憶する記憶手段と、
記憶手段に記憶した正当であると判断された文字列の意
味内容の類似性を解析する類似性解析部と、この類似性
解析部により解析される文字列の類似性計数の算出及び
類似性計数に応じて表示候補となる文字列の選択を行う
選択手段と、この選択手段の選択結果を表示する表示手
段と、前記選択手段により選択した類似性計数の高い文
字列の前記類似語辞書部への書き込みを行う類似語書き
込み部と、前記選択手段により選択した類似性計数の高
い文字列をまとめて記憶する構造化記憶部と、前記入力
手段からのグループ別の意味内容を代表する見出し文字
を基に階層化され構造化された文書構造を生成する構造
化文書成部と、この構造化文書成部により階層化され構
造化された構造化文書の前記表示手段への表示制御、前
記記憶手段への記憶制御を行う制御手段とを有するもの
である。請求項5記載の構造化文書作成支援装置は、日
本語を含む多数の単語について、その品詞別属性を記憶
している品詞辞書部及び類似語、同義語を管理し、品詞
の意味内容を記憶する類似語辞書部からなる辞書記憶手
段と、日本語を含む多数の文字列を含む文章、ファイ
ル、グループ別の意味内容を代表する見出し文字をする
入力手段と、入力された文字列を品詞別に分解する品詞
分解部と、品詞分解部により分解した品詞のうち品詞辞
書に含まれない新語を判断し、品詞辞書部の追加更新を
行う新語更新部と、入力手段から入力された文字列の総
文字数、漢字文字数、ANK文字数等の判断材料を求め
る文字列属性処理部と、入力手段から入力された文字
列、ファイルの可読文字、可読ファイルの判定を行う可
読判定部と、入力手段から入力された文字列と類似語辞
書に記憶した各品詞の意味内容とを照合し文字列の意味
内容を解析する品詞意味内容照合部と、前記品詞意味内
容照合部により解析された文字列の文章としての正当性
を判断する文字列内容判断部と、前記文字列属性処理部
で求めた判断材料、可読判定部で可読と判定された文字
列、ファイル、文字列内容判断部により正当であると判
断された文字列を記憶する記憶手段と、記憶手段に記憶
した正当であると判断された文字列の意味内容の類似性
を解析する類似性解析部と、この類似性解析部により解
析される文字列の類似性計数の算出及び類似性計数に応
じて表示候補となる文字列の選択を行う選択手段と、こ
の選択手段の選択結果を表示する表示手段と、前記選択
手段により選択した類似性計数の高い文字列の前記類似
語辞書部への書き込みを行う類似語書き込み部と、前記
選択手段により選択した類似性計数の高い文字列をまと
めて記憶する構造化記憶部と、前記入力手段からのグル
ープ別の意味内容を代表する見出し文字を基に階層化さ
れ構造化された文書構造を生成する構造化文書生成部
と、この構造化文書生成部により階層化され構造化され
た構造化文書を前記入力手段からのグループ別の意味内
容を代表する見出し文字を基に空間的に視覚化された図
解とする自動作図部と、文字列からなる情報単位をまと
めたグループを自動的にくくる閉曲線を生成する自動閉
曲線生成部と、作図位置支持手段により任意の位置に移
動する文字列からなる情報単位の位置情報を基に自動的
に配置を計算し、閉曲線を含む再作図を行う作図更新部
と、前記見出し文字を基に文字列からなる情報単位をま
とめたグループ単位で任意の上位、下位の階層構造を生
成する階層構造生成部と、作図位置支持手段により任意
の位置に移動する文字列からなる情報単位の位置情報に
より、これらの任意の階層構造への並び替えを行う並び
替え部と、任意の展開表示様式を変更可能に記憶した展
開表示様式記憶部と、この展開表示様式記憶部に記憶し
た展開表示様式を基に前記自動作図部により図解され、
階層構造生成部による階層構造とされ、前記並び替え部
により並び替えられた構造化文書を図解としての体裁で
割り付ける自動レイアウト部と、この自動レイアウト部
により図解としての体裁とされた構造化文書の前記表示
手段への表示制御、印刷手段への印刷制御、記憶手段へ
の記憶制御を行う制御手段とを有するものである。請求
項6記載の構造化文書作成支援装置は、日本語を含む多
数の単語について、その品詞別属性を記憶している品詞
辞書部及び類似語、同義語を管理し、品詞の意味内容を
記憶する類似語辞書部からなる辞書記憶手段と、日本語
を含む多数の文字列を含む文章、ファイル、グループ別
の意味内容を代表する見出し文字をする入力手段と、入
力された文字列を品詞別に分解する品詞分解部と、品詞
分解部により分解した品詞のうち品詞辞書に含まれない
新語を判断し、品詞辞書部の追加更新を行う新語更新部
と、入力手段から入力された文字列の総文字数、漢字文
字数、ANK文字数等の判断材料を求める文字列属性処
理部と、入力手段から入力された文字列、ファイルの可
読文字、可読ファイルの判定を行う可読判定部と、入力
手段から入力された文字列と類似語辞書に記憶した各品
詞の意味内容とを照合し文字列の意味内容を解析する品
詞意味内容照合部と、前記品詞意味内容照合部により解
析された文字列の文章としての正当性を判断する文字列
内容判断部と、前記文字列属性処理部で求めた判断材
料、可読判定部で可読と判定された文字列、ファイル、
文字列内容判断部により正当であると判断された文字列
を記憶する記憶手段と、記憶手段に記憶した正当である
と判断された文字列の意味内容の類似性を解析する類似
性解析部と、該類似性解析部により解析される文字列の
類似性計数の算出及び類似性計数に応じて表示候補とな
る文字列の選択を行う選択手段と、この選択手段の選択
結果を表示する表示手段と、前記選択手段により選択し
た類似性計数の高い文字列の前記類似語辞書部への書き
込みを行う類似語書き込み部と、前記選択手段により選
択した類似性計数の高い文字列をまとめて記憶する構造
化記憶部と、前記入力手段からのグループ別の意味内容
を代表する見出し文字を基に階層化され構造化された文
書構造を生成する構造化文書生成部と、この構造化文書
生成部により階層化され構造化された構造化文書を前記
入力手段からのグループ別の意味内容を代表する見出し
文字を基に空間的に視覚化された図解とする自動作図部
と、文字列からなる情報単位をまとめたグループを自動
的にくくる閉曲線を生成する自動閉曲線生成部と、作図
位置支持手段により任意の位置に移動する文字列からな
る情報単位の位置情報を基に自動的に配置を計算し、閉
曲線を含む再作図を行う作図更新部と、前記見出し文字
を基に文字列からなる情報単位をまとめたグループ単位
で任意の上位、下位の階層構造を生成する階層構造生成
部と、作図位置支持手段により任意の位置に移動する文
字列からなる情報単位の位置情報により、これらの任意
の階層構造への並び替えを行う並び替え部と、任意の展
開表示様式を変更可能に記憶した展開表示様式記憶部
と、この展開表示様式記憶部に記憶した展開表示様式を
基に前記自動作図部により図解され、階層構造生成部に
よる階層構造とされ、前記並び替え部により並び替えら
れた構造化文書を図解としての体裁で割り付ける自動レ
イアウト部と、任意の印刷出力表示様式を変更可能に記
憶した印刷様式記録部と、前記の自動レイアウト部によ
り図解としての体裁とされた構造化文書の前記表示手段
への表示制御、印刷手段へ印刷様式記録部に記録した任
意の印刷出力表示様式に基づく印刷制御、前記記憶手段
への記憶制御を行う制御手段とを有するものである。
【作用】以下に本発明の作用を詳細に説明する。請求項
1記載の構造化文書作成方法は、日本語を含む多くの言
語による多数の文章をランダムに収集し、収集した多数
の文章をその意味内容において分類し関係付けを行い、
関係付けた文章を空間的な位置関係に配置された図解表
現に自動的に作図処理し、この作図処理結果を基に抽象
化度合いに応じて階層化処理が施された構造化文書を生
成するものである。このような方法によれば、文字列単
体では解析困難な意味内容を含む文字列も、意味の輪郭
を確定することが容易となり、また、使い込むことによ
り、学習効果を高め意味情報の体系的整理が利用者から
は無意識のうちに構築可能となる。この機能により一見
雑多に見え、収束が困難な文字情報に対し構造を与え収
束点を早く見つけることが可能となるとともに、自動図
解化、自動文章化による作業レベルの効率化により、よ
り短時間に効率良く情報をまとめあげることが可能とな
る。これらのことから、効率よく情報の管理統合が行わ
れるようになり、情報伝達効果が上り、さらにこれが標
準化することにより広範囲の情報流通が可能となる。請
求項2記載の構造化文書作成支援装置においては、入力
手段から日本語を含む多数の文字列を含む文章、ファイ
ルが入力されると、品詞分解部は入力された文字列を品
詞別に分解する。また、前記新語更新部は、品詞分解部
により分解した品詞のうち品詞辞書に含まれない新語を
判断し、品詞辞書部の追加更新を行う。文字列属性処理
部は、入力された文字列の総文字数、漢字文字数、AN
K文字数等の判断材料を求める。前記文字列内容判断部
は、品詞意味内容照合部により解析された文字列の文章
としての正当性を判断する。可読判定部は、入力された
文字列、ファイルの可読文字、可読ファイルの判定を行
う。記憶手段は、前記文字列属性処理部で求めた判断材
料、可読判定部で可読と判定された文字列、ファイル、
文字列内容判断部により正当であると判断された文字列
を記憶する。このような動作により、入力された文字情
報は、品詞別に分類され意味を単位として格納蓄積さ
れ、次に他の文字列が入力された場合の判断材料となり
ながら学習効果を高めていく。また、主語だけで動詞が
ない文章として客観的に判断できない文字列を可読判定
部によりはじくことにより、誰が読んでも同じ意味に取
れる文章を記録して残すことが可能となり、資料の保存
効果を上げ、情報伝達の質を向上することが可能とな
る。請求項3記載の構造化文書作成支援装置において
は、前記請求項2記載の構造化文書作成支援装置の作用
に加えて、類似性解析部により記憶手段に記憶した正当
であると判断された文字列の意味内容の類似性を解析
し、選択手段により類似性解析部により解析される文字
列の類似性計数の算出及び類似性計数に応じて表示候補
となる文字列の選択を行い、更に、類似語書き込み部に
より選択手段により選択した類似性計数の高い文字列の
前記類似語辞書部への書き込みを行うようにしたもので
ある。この場合、選択手段は類似語、同義語と判断され
た場合の文書の文法関係より、品詞間の意味のつながり
の強さを計数化する。この際、普遍的な意味関係と利用
者の個人的背景からなる意味の解釈との差異が発生する
ため、利用者が個別に作成する意味関係は関係付けが行
われた頻度により計数化され品詞間の意味関係の強さが
更新される。請求項4記載の構造化文書作成支援装置に
よれば、前記請求項2記載の構造化文書作成支援装置に
より標準化された文字列を前提とし、その意味内容の類
似計数をもって文字列(文章)の類似性比較を行うこと
が可能となる。但し、この類似性比較はあくまで文字の
意味解釈の問題であり、含まれているキーワードのマッ
チングによる比較とは完全に異なった目的で行われる。
このため、類似語、同義語による普遍的な一致は単語単
位ではなく、品詞間の意味関係を加味するため完全にコ
ンピュータで推論することができない。故に、個々の解
釈の差異もありそれを尊重する意味から最終的な判断は
人間系にゆだねられる。その際、判断した者の考察が記
録で残るように計数化された品詞間の意味関係の強さは
個別に更新される。請求項5記載の構造化文書作成支援
装置においては、前記請求項3記載の構造化文書作成支
援装置の作用に加えて、構造化記憶部により前記選択手
段により選択した類似性計数の高い文字列をまとめて記
憶し、構造化文書成部により前記入力手段からのグルー
プ別の意味内容を代表する見出し文字を基にして類似性
計数の高い文字列から階層化され構造化された文書構造
を生成し、制御手段により階層化され構造化された構造
化文書の前記表示手段への表示制御、前記記憶手段への
記憶制御を行うようにしたものである。このような動作
により、前記請求項3記載の構造化文書作成支援装置で
グループ化された情報を前提とし、意味内容の抽象化作
業(要約処理)をコンピュータに支援させることが可能
となる。但し、個々の解釈の相違がありそれを尊重する
意味から、最終的な文書(見出し)作成は人間系に委ね
られる。請求項6記載の構造化文書作成支援装置におい
ては、前記請求項4記載の構造化文書作成支援装置の作
用に加えて、自動作図部により構造化文書を前記入力手
段からのグループ別の意味内容を代表する見出し文字を
基に空間的に視覚化された図解とし、自動閉曲線生成部
により文字列からなる情報単位をまとめたグループを自
動的にくくる閉曲線を生成し、作図更新部により作図位
置支持手段により任意の位置に移動する文字列からなる
情報単位の位置情報を基に自動的に配置を計算し、閉曲
線を含む再作図を行い、階層構造生成部により見出し文
字を基に文字列からなる情報単位をまとめたグループ単
位で任意の上位、下位の階層構造を生成し、並び替え部
により作図位置支持手段による位置情報を基に任意の階
層構造への並び替えを行う。更に、自動レイアウト部に
より、展開表示様式記憶部に記憶した任意の展開表示様
式を基に前記自動作図部により図解され、階層構造生成
部による階層構造とされ、前記並び替え部により並び替
えられた構造化文書を図解としての体裁で割り付け、制
御手段により前記自動レイアウト部により図解としての
体裁とされた構造化文書の前記表示手段への表示制御、
印刷手段への印刷制御、記憶手段への記憶制御を行うよ
うにしたものである。このような動作により、前述によ
り作成された文書を抽象化されたグループの情報数等の
情報より自動的に空間的に視覚化された図解が生成す
る。その際、情報が画面上で重なって可読性が下がらな
いように、情報の画面上の占有面積を計算しお互いがそ
の領域を侵略しないように、位置を調整しあいながら最
小の面積で展開するようにする最小面積法で展開が行わ
れる。文字列からなる情報単位(カード)をまとめたグ
ループ(島)を、自動的にくくる閉曲線を生成する自動
閉曲線生成部が装備されていることにより、利用者はマ
ウス等の作図位置支持手段を使った緻密な作業から解放
され、ほぼ自動的に作図を終了することができる。作業
者が行う作業は、図解を見て自分が感じる個々の解釈に
よる標準値からの差異を修正するだけである。自動閉曲
線生成部は、図形の空間的位置関係からそれを囲う閉曲
線を演算で求める手段であるが、どのような位置に置か
れた図形でも単一の方法(アルゴリズム)で閉曲線を求
めることができるように作成されているために、利用者
が任意に図形を移動した場合でも、その演算アルゴリズ
ムにより自動的に再描画することが可能である。これま
でのコンピュータによる作図プログラムは、図形要素が
意味関係により制御されていないためにこのような場
合、図形の移動とそれに(位置的に)関係する要素とは
連携がとれず、再度作業者が緻密な作業で作図をやり直
す必要があり、時間と労力を要した。また、個々の作業
能力、デザイン的センスにより作図の品質にバラツキが
生じ、専門職にゆだねられる場合が多かった。本発明の
自動閉曲線生成アルゴリズムは、後にも述べるように図
形要素の領域を決める各々の頂点座標を求め、その頂点
座標の最小最大位置を求め更にそれからその中心位置を
求める。その中心点から、最小最大位置で求められる矩
型に内接する楕円または円を求め、楕円又は円の外部に
存在する頂点座標を残し、他を削除する。この後残った
座標点を中心点からの角度をもって並び替えを行い、そ
の順番で結線を行う(位置関係による並び替え法)。こ
の際に、斜線で結ばれる箇所を、楕円弧に置き換えるこ
とにより自然な手書き風な作図に見せることができる。
上述した最小面積法による自動作図配置及び位置関係に
よる並び替え法による自動閉曲線生成アルゴリズムによ
り、作図位置指示手段(マウス)により任意の位置に移
動された文字列からなる情報単位の位置情報から、自動
的に配置を計算して閉曲線等を含む再作図を行うことが
可能となった。また、抽象化段階に応じて決定されたグ
ループ単位で、任意に下位の構造を表示、隠蔽すること
が可能な階層構造生成部の動作により、必要な深さで情
報を表示することが可能となった。更に、作図位置指示
手段により任意の位置に移動された文字列からなる情報
単位の位置情報より、自動的に文書の流れに反映させる
ことを可能とするために位置情報による並び替えを行う
並び替え部と、これを文書構造に反映する自動レイアウ
ト部により空間的、視覚的に配置された図形情報(図
解)から文章の分脈を自動的に生成することが可能とな
った。本発明装置により構造化された文書の視覚的表現
は画期的に早く正確に且つ標準化されて作成される。し
かしながら、個々の人間の個性が消失するわけではな
く、表現という作業部分に効率化されるわけであり、反
対により個性的な表現とは文章(図解)に表現された中
身の問題となってくる。また、情報を階層的に表現する
手段により、概要を早く掴み段階的に各論へ入り、時間
が許せば詳細へ目を向けるといった情報の活用法が一般
化できる。会議の議事録、報告書等時間的制約の高い経
営者が臨む、まず結論からという文書スタイルが会社単
位で実現できる。請求項6記載の構造化文書作成支援装
置は、請求項5記載の構造化文書作成支援装置の作用に
加えて、前記制御手段により、自動レイアウト部により
図解としての体裁とされた構造化文書の前記表示手段へ
の表示制御、印刷手段へ印刷様式記録部に記録した任意
の印刷出力表示様式に基づく印刷制御、前記記憶手段へ
の記憶制御を行うようにしたものである。これにより、
章構成が構造化文書として表示され、また、任意の印刷
出力表示様式で印刷手段により出力されるため、論文や
企画書といった構造のしっかりした文書の作成に効果を
上げることが可能となる。また、上記の構造化文書は、
属性状態を変化させることにより前段階や次段階へ容易
に変更することが可能であり、そのファイル間での情報
の再利用、ファイルを更に親ファイルで構造化した親子
関係のデータ構造の構築を可能としている。
【実施例】以下に本発明の実施例を詳細に説明する。図
1に示す構造化文書作成支援装置1は、この構造化文書
作成支援装置1の動作プログラムを格納したプログラム
メモリ2と、前記動作プログラムに基づき全体の制御を
行う制御部3とからなる制御手段4を有している。前記
制御部3に対して、日本語を含む多数の単語について、
その品詞別属性を図2に示すようなフォーマットで記憶
している品詞辞書部5及び類似語、同義語を管理し、品
詞の意味内容を図3に示すようなフォーマットで記憶す
る類似語辞書部6からなる辞書記憶手段7と、日本語を
含む多数の文字列を含む文章、ファイル、グループ別の
意味内容を代表する見出し文字をする入力手段10とし
てのキーボード8及び外部装置(外部コンピュータ等)
に接続したインターフェース9と、入力手段10から入
力された文字列を品詞別に分解する品詞分解部11と、
品詞分解部11により分解した品詞のうち品詞辞書に含
まれない新語を判断し、品詞辞書部5の追加更新を行う
新語更新部12と、入力手段10から入力された文字列
の総文字数、漢字文字数、ANK文字数などの判断材料
を求める文字列属性処理部13と、入力手段10から入
力された文字列、ファイルの可読文字、可読ファイルの
判定を図5に示すようなフォーマットを用いて行う可読
判定部14と、入力手段10から入力された文字列と類
似語辞書部6に記憶した各品詞の意味内容とを照合し文
字列の意味内容を図4に示すようなフォーマットを用い
て解析する品詞意味内容照合部15と、この品詞意味内
容照合部15により解析された文字列の文章としての正
当性を判断する文字列内容判断部16と、前記文字列属
性処理部13で求めた判断材料、可読判定部14で可読
と判定された文字列、ファイル、文字列内容判断部によ
り正当であると判断された文字列を記憶する記憶手段1
7とを各々接続している。更に、前記制御部3に対し
て、前記記憶手段17に記憶した正当であると判断され
た文字列の意味内容の類似性を解析する類似性解析部1
8と、この類似性解析部18により解析される文字列の
類似性計数の算出及び類似性計数に応じて表示候補とな
る文字列の選択を行う選択手段19と、この選択手段1
9の選択結果を表示するCRTディスプレイのような表
示手段20と、前記選択手段19により選択した類似性
計数の高い文字列の前記類似語辞書部6への書き込みを
行う類似語書き込み部21と、前記選択手段19により
選択した類似性計数の高い文字列をまとめて記憶する構
造化記憶部22と、前記入力手段10からのグループ別
の意味内容を代表する見出し文字を基に階層化され構造
化された文書構造を図6、図7に示すフォーマットで生
成する構造化文書生成部23とを接続している。更にま
た、前記制御部3に対して、前記構造化文書生成部23
により階層化され構造化された構造化文書を前記入力手
段10からのグループ別の意味内容を代表する見出し文
字を基に空間的に視覚化された図解とする自動作図部2
4と、文字列からなる情報単位をまとめたグループを自
動的にくくる閉曲線を生成する自動閉曲線生成部26
と、作図位置支持手段としてのマウス25により任意の
位置に移動する文字列からなる情報単位の位置情報を基
に自動的に配置を計算し、閉曲線を含む再作図を行う作
図更新部27と、前記見出し文字を基に文字列からなる
情報単位をまとめたグループ単位で任意の上位、下位の
階層構造を生成する階層構造生成部28と、マウス25
により任意の位置に移動する文字列からなる情報単位の
位置情報により、これらの任意の階層構造への並び替え
を行う並び替え部29と、任意の展開表示様式を変更可
能に記憶した展開表示様式記憶部30と、この展開表示
様式記憶部30に記憶した展開表示様式を基に前記自動
作図部24により図解され、階層構造生成部28による
階層構造とされ、前記並び替え部29により並び替えら
れた構造化文書を図解としての体裁で割り付ける自動レ
イアウト部31と、印刷様式記録部32に記憶した印刷
出力表示様式により用紙に文字、図形等を可視的に出力
するレーザプリンタのような印刷手段33とを接続して
いる。前記階層構造生成部28は、図8に示すように、
見出し文字を基に文字列からなる情報単位をまとめたグ
ループ単位で任意の上位、下位の階層構造を生成するよ
うになっている。この階層構造は、見出し文字列、接続
リスト、複数の件数記録部からなる最上位の階層構造
と、前記複数の件数記録部に各々記録される見出し文字
列、接続リスト、複数の件数記録部からなる2段目の階
層構造と、2段目の階層構造の件数記録部に各々記録さ
れる見出し文字列、接続リスト、複数の件数記録部、フ
ァイル名からなる3段目の階層構造と、3段目の階層構
造のファイル名の領域に記録される外部メモファイル等
からなっている。前記文字列内容判断部16は、日本語
を含む文字列の文書としての正当性を判断する。例え
ば、ASCIIコードの0x20以下のコードが含まれ
る場合等には、文字列が可読文字かどうかを可読文字辞
書より判定する。日本語を含む文字列を品詞分解を行い
文章として必要な要素が含まれているか判断する。ま
た、名詞だけ或いは動詞だけという文字列は文章として
正当性がないとされる。更に、一文章が漢字40文字程
度にまとめられているかを判定して指示を出す。即ち、
句読点で区切られた40文字を越える複文は2つに分解
する。全角或いは半角が混在した英数文字列は半角に内
部的に統一し同義とする。また、カタカナの場合、全角
に統一し、英文で表記された文字と意味が同義の場合は
同義語辞書より判定し同じものと解釈する。新しく発生
した単語は逐次登録し、同義語がある場合は意味関係辞
書にも登録をする。その際に、大文字・小文字・半角・
全角等の違いなど普遍的類似の場合は、パブリックの意
味関係辞書へ登録し、個々の解釈によるものは利用者の
個人別意味関係辞書へ登録する。次に、上述した構成の
構造化文書作成支援装置1を用いた構造化文書作成方法
について説明する。本実施例の構造化文書作成方法の基
本的な手順は以下の通りである。即ち、先ず、日本語を
含む多くの言語による多数の文章をランダムに収集し
て、収集した多数の文章をその意味内容において分類し
関係付けを行い、関係付けた文章を空間的な位置関係に
配置された図解表現に自動的に作図処理し、この作図処
理結果を基に抽象化度合いに応じて階層化処理が施され
た構造化文書を生成するものである。このような構造化
文書作成方法により、文字列単体では解析困難な意味内
容を含む文字列も、意味の輪郭を確定することが容易と
なり、また、使い込むことにより、学習効果を高め意味
情報の体系的整理が利用者からは無意識のうちに構築可
能となる。この機能により一見雑多に見え、収束が困難
な文字情報に対し構造を与え収束点を早く見つけること
が可能となるとともに、自動図解化、自動文章化による
作業レベルの効率化により、より短時間に効率良く情報
をまとめあげることが可能となる。これらのことから、
効率よく情報の管理統合が行われるようになり、情報伝
達効果が上り、更に、これが標準化されることにより広
範囲の情報流通が可能となる。以下、上述した構造化文
書作成方法の詳細を、段階的に分けて説明する。 (1)情報収集手順 前記構造化文書作成支援装置1において、入力手段のキ
ーボード8から日本語を含む多数の文字列を含む文章
が、また、インターフェース9を介して外部コンピュー
タ等から日本語を含む多数の文字列を含むファイルが入
力されると、品詞分解部11は入力された文字列を品詞
別に分解する。また、前記新語更新部12は、品詞分解
部11により分解した品詞のうち品詞辞書に含まれない
新語を判断し、品詞辞書部5の内容の追加更新を行う。
前記文字列属性処理部13は、入力された文字列の総文
字数、漢字文字数やANK文字数等の判断材料を求め
る。前記文字列内容判断部16は、品詞意味内容照合部
15の動作で解析された文字列の文章としての正当性を
判断する。前記可読判定部14は、入力された文字列、
ファイルの可読文字、可読ファイルの判定を行う。記憶
手段17は、前記文字列属性処理部13で求めた判断材
料、可読判定部14で可読と判定された文字列、ファイ
ル、文字列内容判断部16により正当であると判断され
た文字列を記憶し、蓄積していく。このような動作によ
り、入力された文字情報は、品詞別に分類され意味を単
位として格納蓄積され、次に他の文字列が入力された場
合の判断材料となりながら学習効果を高めていく。ま
た、主語だけで動詞がない文章として客観的に判断でき
ない文字列を可読判定部14によりはじくことにより、
誰が読んでも同じ意味に取れる文章を記録して残すこと
が可能となり、資料の保存効果を上げ、情報伝達の質を
向上することが可能となる。 (2)意味構造による分類関連付け手順 この場合には、図12に示すように、上述した情報収集
手順により記憶手段17に記憶された文字列の類似性を
類似性解析部18により先ず解析する。即ち、上述した
如く、入力手段10のキーボード8から日本語を含む多
数の文字列を含む文章が、また、インターフェース9を
介して外部コンピュータ等から日本語を含む多数の文字
列を含むファイルが入力されると(S1)、前記品詞分
解部11は入力された文字列を品詞別に分解する(S
2)。そして、類似性解析部18は、分解された品詞
と、前記品詞辞書部5、類似語辞書部6に格納している
品詞、類似語、同義語との類似性を解析し(S3、S
4、S5、S6、S7)、また、選択手段19により類
似性解析部18により解析される文字列の類似性計数の
算出及び類似性計数に応じて表示候補の選択及び表示手
段20への表示を行い(S8)、作業者の選択(S9)
に基づき類似語書き込み部21は選択した類似性計数の
高い文字列の前記類似語辞書部6への書き込みを行いそ
の内容を更新する(S10)。この場合、選択手段19
は類似語、同義語と判断された場合の文書の文法関係よ
り、品詞間の意味のつながりの強さを計数化する。この
際普遍的な意味関係と作業者の個人的背景からなる意味
の解釈との差異が発生するため、利用者が個別に作成す
る意味関係は関係付けが行われた頻度により計数化され
品詞間の意味関係の強さが更新される。図13は、被比
較対象文字列と比較文字列との意味構造による分類関連
付け手順を示すものであり、基本的には図12に示す場
合と同様である。即ち、入力手段10のキーボード8か
ら日本語を含む多数の文字列を含む文章が、また、イン
ターフェース9を介して外部コンピュータ等から日本語
を含む多数の文字列を含むファイルが入力されると、被
比較対象文字列と比較文字列との選択が行われ(S1
1、S12)、前記品詞分解部11が文字列を品詞別に
分解し(S13)、類似性解析部18は、分解された品
詞と、前記品詞辞書部5、類似語辞書部6に格納してい
る品詞、類似語、同義語との類似性を解析し(S14、
S15、S16、S17、S18)、更に選択手段19
により類似性解析部18により解析される文字列の類似
性計数の算出及び類似性計数に応じて表示候補の選択及
び表示手段20への表示を行い(S19)、作業者の選
択(S20)に基づき類似語書き込み部21は、選択し
た類似性計数の高い文字列の前記類似語辞書部6への書
き込みを行いその内容を更新する(S21)。図14
は、類似文字列群の意味構造による分類関連付け手順を
示すものであり、基本的には図12に示す場合と同様で
ある。即ち、先ず、選択手段19により類似文字列群が
選択され(S21)、品詞分解部11が類似文字列群を
品詞別に分解し(S22)、類似性解析部18は、分解
された品詞と、前記品詞辞書部5、類似語辞書部6に格
納している品詞、類似語、同義語との類似性を解析し
(S23、S24、S25、S26、S27、S2
8)、文字列の修正が行われる(S29)。この文字列
の修正は、品詞分解(S31)、品詞別辞書発生頻度更
新(S32)、類似語、同義語辞書検索(S33)、類
似語、同義語辞書単語発生頻度更新(S34)、意味内
容辞書更新(S35)の順に行われる。このようにし
て、既述した標準化された文字列を前提とし、その意味
内容の類似計数をもって文字列(文章)の類似性比較を
行うことが可能となる。但し、この類似性比較はあくま
で文字の意味解釈の問題であり、含まれているキーワー
ドのマッチングによる比較とは完全に異なった目的で行
われる。このため、類似語、同義語による普遍的な一致
は単語単位ではなく、品詞間の意味関係を加味するため
完全にコンピュータで推論することができない。故に、
個々の解釈の差異もありそれを尊重する意味から最終的
な判断は人間系にゆだねられる。その際、判断した者の
考察が記録で残るように計数化された品詞間の意味関係
の強さは個別に更新される。 (3)意味構造による構造化文書を作成格納する文書構
造生成手順 この場合には、構造化文書作成支援装置1の構造化記憶
部22は、前記選択手段19により選択した類似性計数
の高い文字列をまとめて記憶し、構造化文書生成部23
により前記入力手段10からのグループ別の意味内容を
代表する見出し文字(抽象化されたもの)を基にして類
似性計数の高い文字列から階層化され構造化された文書
構造を生成し、制御部3により階層化され構造化された
構造化文書の前記表示手段20への表示制御、前記記憶
手段17への記憶制御を行うようにしたものである。こ
のような動作により、既述したようにグループ化された
情報を前提とし、意味内容の抽象化作業(要約処理)を
コンピュータに支援させることが可能となる。但し、こ
こでも個々の解釈の相違がありそれを尊重する意味から
最終的な文書(見出し)作成は人間系に委ねられる。 (4)意味構造による構造図解生成手順 この場合には、前記自動作図部24により構造化文書を
前記入力手段10からのグループ別の意味内容を代表す
る見出し文字を基に空間的に視覚化された図解とし、自
動閉曲線生成部26により文字列からなる情報単位をま
とめたグループを自動的にくくる閉曲線を生成し、作図
更新部27によりマウス25の操作に基づいて任意の位
置に移動する文字列からなる情報単位の位置情報を基に
自動的に配置を計算し、閉曲線を含む再作図を行い、階
層構造生成部28により見出し文字を基に文字列からな
る情報単位をまとめたグループ単位で図8に示すような
任意の上位、下位の階層構造を生成し、並び替え部29
によりマウス25による位置情報を基に任意の階層構造
への並び替えを行うものである。更に、前記自動レイア
ウト部31により、展開表示様式記憶部30に記憶した
任意の展開表示様式を基に前記自動作図部24により図
解され、階層構造生成部28による階層構造とされ、前
記並び替え部29により並び替えられた構造化文書を図
解としての体裁で割り付け、制御部3により前記自動レ
イアウト部31により図解としての体裁とされた構造化
文書の前記表示手段20への表示制御、印刷手段33へ
の印刷制御、記憶手段17への記憶制御を行うようにし
たものである。このような動作により、前述により作成
された文書を、抽象化されたグループの情報数等の情報
より自動的に空間的に視覚化された図9、図10に示す
ような図解が生成する。図9、図10は、文字列からな
る情報単位(カード)の編集状態を示すものであり、情
報単位の新規入力、選択、抽出、移動(同一頁、異
頁)、削除、頁変更、見出し入力の態様を模式的に示す
ものである。この場合、情報が画面上で重なって可読性
が下がらないように、情報の画面上の占有面積を計算
し、お互いがその領域を侵略しないように、位置を調整
しあいながら最小の面積で展開するようにする最小面積
法で展開が行われる。次に、図15を参照して上記最小
面積法について説明する。先ず、最初の情報単位に相当
する図形要素を配置し、この図形要素の占有範囲を求め
(S41、S42)、次の図形要素があるか否かを判断
し(S43)、図形要素を縦に配置するか横に配置する
かでより最終面積が少ないほうを選択し(S44)、最
適化計算を行い(S45)、配置を決定し(S46)、
最終面積を求める(S47)。また、文字列からなる情
報単位(カード)をまとめたグループ(島)を、自動的
にくくる閉曲線を生成する自動閉曲線生成部26が装備
されていることにより、作業者はマウス25等の作図位
置支持手段を使った緻密な作業から解放され、ほぼ自動
的に作図を終了することができる。作業者が行う作業
は、図解を見て自分が感じる個々の解釈による標準値か
らの差異を修正するだけである。自動閉曲線生成部26
は、図形の空間的位置関係からそれを囲う閉曲線を演算
で求める手段であるが、どのような位置に置かれた図形
でも単一の方法(アルゴリズム)で閉曲線を求めること
ができるように作成されているために、作業者が任意に
図形を移動した場合でも、その演算アルゴリズムにより
自動的に再描画することが可能である。これまでのコン
ピュータによる作図プログラムは、図形要素が意味関係
により制御されていないためにこのような場合、図形の
移動とそれに(位置的に)関係する要素とは連携がとれ
ず、再度作業者が緻密な作業で作図をやり直す必要があ
り、時間と労力を要した。また、個々の作業能力、デザ
イン的センスにより作図の品質にバラツキが生じ、専門
職にゆだねられる場合が多かった。本実施例に係る自動
閉曲線生成アルゴリズムは、図11に図示し、図16乃
至図18に手順を示すように、先ず、図形要素(カー
ド)の選択を行い(S51)、各図形要素群の頂点座標
の最小座標を求め(S52)、最小点と各図形要素との
距離を求め(S53)、距離順の並び変えを行い(S5
4)、並び変った順番に図形要素を拾い上げる(S5
5)。又は、図17に示すように、図形要素(カード)
を選択して配置を決定し(S56)、各図形要素群の頂
点座標の最小最大座標を求めるとともに中心を決定し
(S57)、中心点と各図形要素との角度を各々求め
(S58)、角度順に並べ替えを行い(S59)、並び
変った順番に図形要素を拾い上げる(S60)。更に
は、図11及び図18に示すように、各図形要素を選択
して配置を決定して(S61)、図形要素群の頂点座標
の最小最大座標を求めるとともに、中心を決定し(S6
2)、中心点と各図形要素との角度を各々求め(S6
3)、角度順に並べ替えを行い(S64)、並び変った
順番に図形要素を拾い上げる(S65)。そして、頂点
座標の最小最大で求めた矩形要素に内設する楕円(又は
円)を求め(S66)、楕円の領域から外れる頂点座標
を拾い上げ(S67)他は削除し、拾い上げた座標点を
順次結び閉曲線を引く(S68)(位置関係による並び
替え法)。この際に、図11に示す各傾斜した線の夫々
の結ばれる箇所を、楕円弧に置き換えることにより自然
な手書き風な作図に見せることができる。上述した最小
面積法による自動作図配置及び位置関係による並び替え
法による自動閉曲線生成アルゴリズムにより、マウス2
5により任意の位置に移動された文字列からなる情報単
位の位置情報より、自動的に配置を計算し閉曲線等を含
む再作図を行うことが可能となった。また、抽象化段階
に応じて決定されたグループ単位で、任意に下位の構造
を表示、隠蔽することが可能な階層構造生成部の動作に
より、必要な深さで情報を表示することが可能となっ
た。更に、マウス25により任意の位置に移動された文
字列からなる情報単位の位置情報より、自動的に文書の
流れに反映させることを可能とするために位置情報によ
る並び替えを行う並び替え部29と、これを文書構造に
反映する自動レイアウト部31により空間的、視覚的に
配置された図形情報(図解)から文章の分脈を自動的に
生成することが可能となる。このような本実施例の構造
化文書作成支援装置1により、構造化された文書の視覚
的表現は画期的に早く正確に、且つ、標準化されて作成
される。しかし、個々の人間の個性が消失するわけでは
なく、表現という作業部分に効率化されるわけであり、
反対に個性的な表現とは文章(図解)に表現された中身
の問題となってくる。また、情報を階層的に表現する手
段により、概要を早く掴み段階的に各論へ入り、時間が
許せば詳細へ目を向けるといった情報の活用法が一般化
できる。会議の議事録、報告書等時間的制約の高い経営
者が臨む、先ず結論からという文書スタイルが会社や官
庁、事務所単位で実現できる。 (5)意味構造による構造化文書生成手順 上述のようにして意味構造により図解された構造化文書
は、前記制御部3の制御の基に、自動レイアウト部31
により図解としての体裁とされた構造化文書の前記表示
手段20へ表示され、また、印刷様式記録部32に記録
した任意の印刷出力表示様式に基づいて印刷手段33に
より可視的に出力され、更に前記記憶手段17へ記憶さ
れ蓄積されていく。これにより、構造化文書の章構成が
表示され、また、任意の印刷出力表示様式で印刷手段に
より出力されるために、論文や企画書といった構造の精
密な文書の作成に効果を上げることが可能となる。ま
た、上記の構造化文書は、属性状態を変化させることに
より前段階や次段階へ容易に変更することが可能であ
り、そのファイル間での情報の再利用、ファイルを更に
親ファイルで構造化した親子関係のデータ構造の構築を
可能としている。図19は、以上説明した構造化文書作
成支援装置1による一連の動作を総合的に示すものであ
る。即ち、文字列の入力(S71)、記憶(S72)、
類似文字列群選択(S73)、類似度の検証、抽象化
(S74)、抽象化文字列入力(S75)、文書構造化
(S76)、構造化図解表示(S77)及び構造化文書
表示、編集(S78)の一連の手順で上述した各動作を
順次実現するものである。なお、図19中の構造化文書
表示、編集(S78)における構造化文書の具体的なも
のとしては、例えば、図22に示すような構造化文書を
挙げることができる。図20、図21は、本実施例に係
る構造化文書作成支援装置1を用いたユーザによる検証
結果を参考的に示すものである。
【発明の効果】以上詳述した本発明によれば、以下の効
果を奏する。請求項1記載の方法によれば、文字列単体
では解析困難な意味内容を含む文字列も、品詞分解解析
や他の文章からの類推等から意味の輪郭を確定すること
が容易となる。また、使い込むことにより、学習効果を
高め意味情報の体系的整理が利用者からは無意識のうち
に構築可能となる。この機能により、一見雑多に見え、
収束が困難な情報に対し構造を与え収束点を早く見つけ
ることが可能となる。請求項2記載の発明によれば、学
習効果を高め、誰が読んでも同じ意味に取れる文章を記
録して残すことが可能となり、資料の保存効果を上げ、
情報伝達の質を向上することが可能な構造化文書作成支
援装置を提供することができる。請求項3記載の発明に
よれば、標準化された文字列を前提とし、その意味内容
の類似計数をもって文字列(文章)の類似性比較を容易
に行うことが可能な構造化文書作成支援装置を提供する
ことができる。請求項4記載の発明によれば、既述した
ようなグループ化された情報を前提とし、意味内容の抽
象化作業(要約処理)をコンピュータに支援させること
が可能な構造化文書作成支援装置を提供することができ
る。請求項5記載の発明によれば、情報を階層的に表現
するようにしたので、概要を早く掴み段階的に各論へ入
り、時間が許せば詳細へ目を向けるといった情報の活用
法が一般化できる構造化文書作成支援装置を提供するこ
とができる。請求項6記載の発明によれば、構造化文書
の章構成が表示され、また、任意の印刷出力表示様式で
印刷手段により出力されるため、論文や企画書といった
構造の精密な文書の作成に効果を上げることが可能な構
造化文書作成支援装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の実施例装置のブロック図
【図2】品詞別辞書のフォーマット図
【図3】同義語辞書のフォーマット図
【図4】意味関係辞書のフォーマット図
【図5】可読文字辞書のフォーマット図
【図6】構造化文書のフォーマット図
【図7】構造化文書のフォーマット図
【図8】本実施例の階層構造の内部表現を示す説明図
【図9】本実施例の文章の編集態様を示す説明図
【図10】本実施例の文章の編集態様を示す説明図
【図11】本実施例の並び替え法及びその応用による閉
曲線生成の態様を示す説明図
【図12】本実施例の意味内容解析処理方法のフローチ
ャート
【図13】本実施例の文字列類似性解析による意味内容
解析処理方法のフローチャート
【図14】本実施例の文字列類似性解析による文書要約
処理方法のフローチャート
【図15】本実施例の最小面積法による図形要素配置及
びその応用による自動作図配置位置関係による並び替え
法及びその応用による閉曲線生成方法のフローチャート
【図16】本実施例の並び替え法の応用による構造化文
書自動生成法を示すフローチャート
【図17】本実施例の並び替え法の応用による構造化文
書自動生成法を示すフローチャート
【図18】本実施例の並び替え法の応用による構造化文
書自動生成法を示すフローチャート
【図19】本実施例方法の全体の手順を示すフローチャ
ート
【図20】本実施例方法の検証結果を示す説明図
【図21】本実施例方法の検証結果を示す説明図
【図22】本実施例方法により得られる具体例としての
構造化文書の説明図
【符号の説明】
1 構造化文書作成支援装置 4 制御手段 5 品詞辞書部 6 類似語辞書部 7 辞書記憶手段 10 入力手段 11 品詞分解部 12 新語更新部 13 文字列属性処理部 14 可読判定部 15 品詞意味内容照合部 16 文字列内容判断部 17 記憶手段 19 選択手段 20 表示手段 23 構造化文書生成部 24 自動作図部 31 自動レイアウト部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】日本語を含む多くの言語による多数の文章
    をランダムに収集し、収集した多数の文章をその意味内
    容において分類し関係付けを行い、関係付けた文章を空
    間的な位置関係に配置された図解表現に自動的に作図処
    理し、この作図処理結果を基に抽象化度合いに応じて階
    層化処理が施された構造化文書を生成することを特徴と
    する構造化文書作成方法。
  2. 【請求項2】日本語を含む多数の単語について、その品
    詞別属性を記憶している品詞辞書部、類似語、同義語を
    管理し、品詞の意味内容を記憶する類似語辞書部からな
    る辞書記憶手段と,日本語を含む多数の文字列を含む文
    章、ファイルを入力する入力手段と,入力された文字列
    を品詞別に分解する品詞分解部と,品詞分解部により分
    解した品詞のうち品詞辞書に含まれない新語を判断し、
    品詞辞書部の追加更新を行う新語更新部と,入力手段か
    ら入力された文字列の総文字数、漢字文字数、ANK文
    字数等の判断材料を求める文字列属性処理部と,入力手
    段から入力された文字列、ファイルの可読文字、可読フ
    ァイルの判定を行う可読判定部と,入力手段から入力さ
    れた文字列と類似語辞書に記憶した各品詞の意味内容と
    を照合し文字列の意味内容を解析する品詞意味内容照合
    部と,前記品詞意味内容照合部により解析された文字列
    の文章としての正当性を判断する文字列内容判断部と,
    前記文字列属性処理部で求めた判断材料、可読判定部で
    可読と判定された文字列、ファイル、文字列内容判断部
    により正当であると判断された文字列を記憶する記憶手
    段とを有することを特徴とする構造化文書作成支援装
    置。
  3. 【請求項3】日本語を含む多数の単語について、その品
    詞別属性を記憶している品詞辞書部、類似語、同義語を
    管理し、品詞の意味内容を記憶する類似語辞書部からな
    る辞書記憶手段と,日本語を含む多数の文字列を含む文
    章、ファイルを入力する入力手段と,入力された文字列
    を品詞別に分解する品詞分解部と,品詞分解部により分
    解した品詞のうち品詞辞書に含まれない新語を判断し、
    品詞辞書部の追加更新を行う新語更新部と,入力手段か
    ら入力された文字列の総文字数、漢字文字数、ANK文
    字数等の判断材料を求める文字列属性処理部と,入力手
    段から入力された文字列、ファイルの可読文字、可読フ
    ァイルの判定を行う可読判定部と,入力手段から入力さ
    れた文字列と類似語辞書に記憶した各品詞の意味内容と
    を照合し文字列の意味内容を解析する品詞意味内容照合
    部と,前記品詞意味内容照合部により解析された文字列
    の文章としての正当性を判断する文字列内容判断部と,
    前記文字列属性処理部で求めた判断材料、可読判定部で
    可読と判定された文字列、ファイル、文字列内容判断部
    により正当であると判断された文字列を記憶する記憶手
    段と,記憶手段に記憶した正当であると判断された文字
    列の意味内容の類似性を解析する類似性解析部と,この
    類似性解析部により解析される文字列の類似性計数の算
    出及び類似性計数に応じて表示候補となる文字列の選択
    を行う選択手段と,この選択手段の選択結果を表示する
    表示手段と,前記選択手段により選択した類似性計数の
    高い文字列の前記類似語辞書部への書き込みを行う類似
    語書き込み部とを有することを特徴とする構造化文書作
    成支援装置。
  4. 【請求項4】日本語を含む多数の単語について、その品
    詞別属性を記憶している品詞辞書部及び類似語、同義語
    を管理し、品詞の意味内容を記憶する類似語辞書部から
    なる辞書記憶手段と,日本語を含む多数の文字列を含む
    文章、ファイル、グループ別の意味内容を代表する見出
    し文字をする入力手段と,入力された文字列を品詞別に
    分解する品詞分解部と,品詞分解部により分解した品詞
    のうち品詞辞書に含まれない新語を判断し、品詞辞書部
    の追加更新を行う新語更新部と,入力手段から入力され
    た文字列の総文字数、漢字文字数、ANK文字数等の判
    断材料を求める文字列属性処理部と,入力手段から入力
    された文字列、ファイルの可読文字、可読ファイルの判
    定を行う可読判定部と,入力手段から入力された文字列
    と類似語辞書に記憶した各品詞の意味内容とを照合し文
    字列の意味内容を解析する品詞意味内容照合部と,前記
    品詞意味内容照合部により解析された文字列の文章とし
    ての正当性を判断する文字列内容判断部と,前記文字列
    属性処理部で求めた判断材料、可読判定部で可読と判定
    された文字列、ファイル、文字列内容判断部により正当
    であると判断された文字列を記憶する記憶手段と,記憶
    手段に記憶した正当であると判断された文字列の意味内
    容の類似性を解析する類似性解析部と,この類似性解析
    部により解析される文字列の類似性計数の算出及び類似
    性計数に応じて表示候補となる文字列の選択を行う選択
    手段と,この選択手段の選択結果を表示する表示手段
    と,前記選択手段により選択した類似性計数の高い文字
    列の前記類似語辞書部への書き込みを行う類似語書き込
    み部と,前記選択手段により選択した類似性計数の高い
    文字列をまとめて記憶する構造化記憶部と,前記入力手
    段からのグループ別の意味内容を代表する見出し文字を
    基に階層化され構造化された文書構造を生成する構造化
    文書成部と,この構造化文書成部により階層化され構造
    化された構造化文書の前記表示手段への表示制御、前記
    記憶手段への記憶制御を行う制御手段とを有することを
    特徴とする構造化文書作成支援装置。
  5. 【請求項5】日本語を含む多数の単語について、その品
    詞別属性を記憶している品詞辞書部、類似語、同義語を
    管理し、品詞の意味内容を記憶する類似語辞書部からな
    る辞書記憶手段と,日本語を含む多数の文字列を含む文
    章、ファイル、グループ別の意味内容を代表する見出し
    文字をする入力手段と,入力された文字列を品詞別に分
    解する品詞分解部と,品詞分解部により分解した品詞の
    うち品詞辞書に含まれない新語を判断し、品詞辞書部の
    追加更新を行う新語更新部と,入力手段から入力された
    文字列の総文字数、漢字文字数、ANK文字数等の判断
    材料を求める文字列属性処理部と,入力手段から入力さ
    れた文字列、ファイルの可読文字、可読ファイルの判定
    を行う可読判定部と,入力手段から入力された文字列と
    類似語辞書に記憶した各品詞の意味内容とを照合し文字
    列の意味内容を解析する品詞意味内容照合部と,前記品
    詞意味内容照合部により解析された文字列の文章として
    の正当性を判断する文字列内容判断部と,前記文字列属
    性処理部で求めた判断材料、可読判定部で可読と判定さ
    れた文字列、ファイル、文字列内容判断部により正当で
    あると判断された文字列を記憶する記憶手段と,記憶手
    段に記憶した正当であると判断された文字列の意味内容
    の類似性を解析する類似性解析部と,この類似性解析部
    により解析される文字列の類似性計数の算出及び類似性
    計数に応じて表示候補となる文字列の選択を行う選択手
    段と,この選択手段の選択結果を表示する表示手段と,
    前記選択手段により選択した類似性計数の高い文字列の
    前記類似語辞書部への書き込みを行う類似語書き込み部
    と,前記選択手段により選択した類似性計数の高い文字
    列をまとめて記憶する構造化記憶部と,前記入力手段か
    らのグループ別の意味内容を代表する見出し文字を基に
    階層化され構造化された文書構造を生成する構造化文書
    生成部と,該構造化文書生成部により階層化され構造化
    された構造化文書を前記入力手段からのグループ別の意
    味内容を代表する見出し文字を基に空間的に視覚化され
    た図解とする自動作図部と,文字列からなる情報単位を
    まとめたグループを自動的にくくる閉曲線を生成する自
    動閉曲線生成部と,作図位置支持手段により任意の位置
    に移動する文字列からなる情報単位の位置情報を基に自
    動的に配置を計算し、閉曲線を含む再作図を行う作図更
    新部と,前記見出し文字を基に文字列からなる情報単位
    をまとめたグループ単位で任意の上位、下位の階層構造
    を生成する階層構造生成部と,作図位置支持手段により
    任意の位置に移動する文字列からなる情報単位の位置情
    報により、これらの任意の階層構造への並び替えを行う
    並び替え部と,任意の展開表示様式を変更可能に記憶し
    た展開表示様式記憶部と,この展開表示様式記憶部に記
    憶した展開表示様式を基に前記自動作図部により図解さ
    れ、階層構造生成部による階層構造とされ、前記並び替
    え部により並び替えられた構造化文書を図解としての体
    裁で割り付ける自動レイアウト部と,この自動レイアウ
    ト部により図解としての体裁とされた構造化文書の前記
    表示手段への表示制御、印刷手段への印刷制御、記憶手
    段への記憶制御を行う制御手段とを有することを特徴と
    する構造化文書作成支援装置。
  6. 【請求項6】日本語を含む多数の単語について、その品
    詞別属性を記憶している品詞辞書部及び類似語、同義語
    を管理し、品詞の意味内容を記憶する類似語辞書部から
    なる辞書記憶手段と,日本語を含む多数の文字列を含む
    文章、ファイル、グループ別の意味内容を代表する見出
    し文字をする入力手段と,入力された文字列を品詞別に
    分解する品詞分解部と,品詞分解部により分解した品詞
    のうち品詞辞書に含まれない新語を判断し、品詞辞書部
    の追加更新を行う新語更新部と,入力手段から入力され
    た文字列の総文字数、漢字文字数、ANK文字数等の判
    断材料を求める文字列属性処理部と,入力手段から入力
    された文字列、ファイルの可読文字、可読ファイルの判
    定を行う可読判定部と,入力手段から入力された文字列
    と類似語辞書に記憶した各品詞の意味内容とを照合し文
    字列の意味内容を解析する品詞意味内容照合部と,前記
    品詞意味内容照合部により解析された文字列の文章とし
    ての正当性を判断する文字列内容判断部と,前記文字列
    属性処理部で求めた判断材料、可読判定部で可読と判定
    された文字列、ファイル、文字列内容判断部により正当
    であると判断された文字列を記憶する記憶手段と,記憶
    手段に記憶した正当であると判断された文字列の意味内
    容の類似性を解析する類似性解析部と,この類似性解析
    部により解析される文字列の類似性計数の算出及び類似
    性計数に応じて表示候補となる文字列の選択を行う選択
    手段と,この選択手段の選択結果を表示する表示手段
    と,前記選択手段により選択した類似性計数の高い文字
    列の前記類似語辞書部への書き込みを行う類似語書き込
    み部と,前記選択手段により選択した類似性計数の高い
    文字列をまとめて記憶する構造化記憶部と,前記入力手
    段からのグループ別の意味内容を代表する見出し文字を
    基に階層化され構造化された文書構造を生成する構造化
    文書生成部と,該構造化文書生成部により階層化され構
    造化された構造化文書を前記入力手段からのグループ別
    の意味内容を代表する見出し文字を基に空間的に視覚化
    された図解とする自動作図部と,文字列からなる情報単
    位をまとめたグループを自動的にくくる閉曲線を生成す
    る自動閉曲線生成部と,作図位置支持手段により任意の
    位置に移動する文字列からなる情報単位の位置情報を基
    に自動的に配置を計算し、閉曲線を含む再作図を行う作
    図更新部と,前記見出し文字を基に文字列からなる情報
    単位をまとめたグループ単位で任意の上位、下位の階層
    構造を生成する階層構造生成部と,作図位置支持手段に
    より任意の位置に移動する文字列からなる情報単位の位
    置情報により、これらの任意の階層構造への並び替えを
    行う並び替え部と,任意の展開表示様式を変更可能に記
    憶した展開表示様式記憶部と,この展開表示様式記憶部
    に記憶した展開表示様式を基に前記自動作図部により図
    解され、階層構造生成部による階層構造とされ、前記並
    び替え部により並び替えられた構造化文書を図解として
    の体裁で割り付ける自動レイアウト部と,任意の印刷出
    力表示様式を変更可能に記憶した印刷様式記録部と,前
    記の自動レイアウト部により図解としての体裁とされた
    構造化文書の前記表示手段への表示制御、印刷手段へ印
    刷様式記録部に記録した任意の印刷出力表示様式に基づ
    く印刷制御、前記記憶手段への記憶制御を行う制御手段
    とを有することを特徴とする構造化文書作成支援装置。
JP4340966A 1992-11-30 1992-11-30 構造化文書作成方法及び構造化文書作成支援装置 Pending JPH06168267A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4340966A JPH06168267A (ja) 1992-11-30 1992-11-30 構造化文書作成方法及び構造化文書作成支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4340966A JPH06168267A (ja) 1992-11-30 1992-11-30 構造化文書作成方法及び構造化文書作成支援装置

Publications (1)

Publication Number Publication Date
JPH06168267A true JPH06168267A (ja) 1994-06-14

Family

ID=18341959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4340966A Pending JPH06168267A (ja) 1992-11-30 1992-11-30 構造化文書作成方法及び構造化文書作成支援装置

Country Status (1)

Country Link
JP (1) JPH06168267A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7584103B2 (en) 2004-08-20 2009-09-01 Multimodal Technologies, Inc. Automated extraction of semantic content and generation of a structured document from speech
US8959102B2 (en) 2010-10-08 2015-02-17 Mmodal Ip Llc Structured searching of dynamic structured document corpuses
US9892734B2 (en) 2006-06-22 2018-02-13 Mmodal Ip Llc Automatic decision support
CN111507236A (zh) * 2020-04-13 2020-08-07 上海朗曦信息技术有限公司 文件处理方法、系统、装置及介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7584103B2 (en) 2004-08-20 2009-09-01 Multimodal Technologies, Inc. Automated extraction of semantic content and generation of a structured document from speech
US9892734B2 (en) 2006-06-22 2018-02-13 Mmodal Ip Llc Automatic decision support
US8959102B2 (en) 2010-10-08 2015-02-17 Mmodal Ip Llc Structured searching of dynamic structured document corpuses
CN111507236A (zh) * 2020-04-13 2020-08-07 上海朗曦信息技术有限公司 文件处理方法、系统、装置及介质
CN111507236B (zh) * 2020-04-13 2023-05-12 上海朗曦信息技术有限公司 文件处理方法、系统、装置及介质

Similar Documents

Publication Publication Date Title
Gross The electronic cocktail napkin—a computational environment for working with design diagrams
US5796866A (en) Apparatus and method for editing handwritten stroke
Feiner A grid-based approach to automating display layout
CN1607524B (zh) 校对多个可变数据文档的方法及计算机装置
JP2923552B2 (ja) 組織活動データベースの構築方法,それに使用する分析シートの入力方法及び組織活動管理システム
US5696916A (en) Information storage and retrieval system and display method therefor
Smolensky et al. Constraint-based hypertext for argumentation
CN113673943B (zh) 一种基于履历大数据的人员任免辅助决策方法及系统
CN115344666A (zh) 政策匹配方法、装置、设备与计算机可读存储介质
US5469539A (en) Method for abstracting/detailing structuring elements of system specification information
Horn Structured writing at twenty-five
GB2260007A (en) Information storage/retrieval system and display method
JP4931114B2 (ja) データ表示装置、データ表示方法及びデータ表示プログラム
JPH0798708A (ja) 文書処理システムおよびその方法
JP2013016036A (ja) 文書部品生成方法及び計算機システム
JPH06168267A (ja) 構造化文書作成方法及び構造化文書作成支援装置
Korfhage et al. Criteria for iconic languages
Kendrick A graphical interface for production and transportation system modeling: PTS
Tou Knowledge engineering
JPH05204981A (ja) 情報記憶・検索システム及びその表示方法
Richards et al. Analyzing unstructured information: can computers help?
Varanka An approach to map/text interrelationships
Cardwell Interactive telecommunications access by computer to design characteristics of the nation's nuclear power stations
JPH0289166A (ja) 文書作成支援装置
Clement The application of interactive graphics and pattern recognition to the reduction of map outlines