JPH04220768A - テキスト変換方法 - Google Patents

テキスト変換方法

Info

Publication number
JPH04220768A
JPH04220768A JP2405194A JP40519490A JPH04220768A JP H04220768 A JPH04220768 A JP H04220768A JP 2405194 A JP2405194 A JP 2405194A JP 40519490 A JP40519490 A JP 40519490A JP H04220768 A JPH04220768 A JP H04220768A
Authority
JP
Japan
Prior art keywords
keyword
text
keywords
unit
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2405194A
Other languages
English (en)
Other versions
JP2808893B2 (ja
Inventor
Akira Nakanouchi
中野内 彰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2405194A priority Critical patent/JP2808893B2/ja
Publication of JPH04220768A publication Critical patent/JPH04220768A/ja
Application granted granted Critical
Publication of JP2808893B2 publication Critical patent/JP2808893B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、コンピュータシステ
ムで利用されているプレーンなテキストを階層構造化さ
れたハイパーテキストに変換するテキスト変換方法に関
する。
【0002】
【従来の技術】従来、コンピュータシステムで利用され
ているプレーンなテキストをハイパーテキストに変換す
るテキスト変換方法としては、 1)プレーンなテキストの区切り文字までの単位テキス
トを、それぞれ1つのノードとしてとりあえず作成し、
このノードを手作業で階層構造化して前記プレーンなテ
キストをハイパーテキストに変換する 2)プレーンなテキストに手を加えて、プレーンなテキ
ストの適宜箇所に階層や構造を指示する特種文字を埋め
込み、これら特種文字を頼りに前記プレーンなテキスト
をハイパーテキストに変換する方法がある。
【0003】しかし、1)の方法は、基本的には、手作
業で階層構造化するため非常に手間がかかり、また、2
)の方法は、特種文字を埋め込む作業に手間がかかり、
いずれの方法によっても多大な労力と時間を要した。
【0004】
【発明が解決しようとする課題】このように従来のプレ
ーンなテキストをハイパーテキストに変換するテキスト
変換方法においては、手作業で階層構造化したり、プレ
ーンなテキストに特種文字を埋め込むなどの修正が必要
なため非常に手間がかかり、プレーンなテキストをハイ
パーテキストに変換する作業に多大な労力と時間を要し
た。
【0005】そこで、この発明はプレーンなテキストを
ハイパーテキストに変換する作業を、短時間でかつ容易
に行うことができるようにしたテキスト変換方法を提供
することを目的とする。
【0006】
【課題を解決するための手段】上記目的を達成するため
、この発明によれば、ハイパーテキスト上で階層構造化
されたキーワードからなるキーワードツリーを作成し、
このキーワードツリーのキーワードと変換すべきプレー
ンなテキストから読み出された単位テキストに含まれる
キーワードとの照合を、前記キーワードツリーの階層構
造の深いキーワードを優先して行ない、自己のキーワー
ドより階層構造の深いキーワードに前記単位テキストが
リンクされていないことを条件に該単位テキストと該キ
ーワードとの間にリンクを形成し、この動作を各単位テ
キスト毎に繰り返すことにより前記プレーンなテキスト
をハイパーテキストに変換する。
【0007】
【作用】ハイパーテキスト上のキーワードツリーと変換
すべきプレーンなテキストから読み出された単位テキス
トに含まれるキーワードとの照合により自動的に前記プ
レーンなテキストから直接ハイパーテキストに変換する
ので、ハイパーテキストへの変換作業が非常に簡単にな
る。
【0008】
【実施例】図1はこの発明のテキスト変換方法が適用さ
れるシステムの一例のハードウエア構成を示したもので
ある。このシステムはハイパーテキストデータベース1
0、制御装置20、記憶装置30、制御装置20と入出
力装置40を介して接続されるディスプレイ50、キー
ボード、マウス70を備えて構成される。
【0009】ハイパーテキストデータベース10は、階
層構造化されたハイパーテキストを記憶する。このハイ
パーテキストは情報のかたまりであるノード情報および
各ノードとのリンク関係を表わすリンク情報を含んでい
る。制御装置20は、ハイパーテキストデータベース1
0に記憶されたハイパーテキストの処理、およびこの発
明に関係するプレーンなテキストからのハイパーテキス
トへの変換処理などを実行する。記憶装置30は、この
発明により変換すべきプレーンなテキストおよびその他
このシステムの制御に必要な種々のデータを記憶する。 制御装置20における処理は入出力装置20を介してキ
ーボード60、マウス70から入力された指令にしたが
って実行され、制御装置20における処理結果および処
理状態は入出力装置40を介してディスプレイ50に表
示される。
【0010】次に、この実施例の動作を図2、図3に示
したフローチャートおよび図4乃至図6の示した具体的
処理例を参照して説明する。この実施例では記憶装置3
0に記憶されたプレーンなテキストをハイパーテキスト
データベース10のハイパーテキスト上において、階層
構造化されたハイパーテキストに変換する。ここで、記
憶装置30に記憶されたプレーンなテキストは、キーボ
ード60から入出力装置40を介して入力されたもの、
また、図示しない他の装置によって予め入力されこの記
憶装置に転送されたものである。
【0011】まず、ハイパーテキストデータベース10
のハイパーテキスト上にキーワードツリーを作成する(
ステップ101)。このキーワードツリーは、例えば図
4に示すように構造化された複数のキーワードからなっ
ている。図4において各ブロック内に記載されたA〜F
はそれぞれキーワードを表わしており、各ブロックの間
に描かれた実線はこれらのキーワードの階層関係を表わ
している。
【0012】次に、変換すべきプレーンなテキストは終
わりかの判断を行う(ステップ102)。ここで、まだ
テキストの変換を開始したばかりで、変換すべきプレー
ンなテキストは終わりではない。そこで、まず、この変
換すべきプレーンなテキストから所定の区切り文字まで
を1つの単位テキストとして読み出し(ステップ103
)、この単位テキストに含まれるキーワードに関して、
図4に示すようなキーワードツリーを参照してキーワー
ドのバックトラック処理を実行する(ステップ104)
【0013】このキーワードのバックトラック処理の詳
細は図3のフローチャートに示される。このキーワード
のバックトラック処理においては、図2のステップ10
1で作成してキーワードツリーの階層の深いキーワード
を優先にして、このキーワードツリーをたどり、変換す
べきプレーンなテキストから読み出された単位テキスト
に含まれるキーワードの中に、このキーワードツリーの
キーワードにマッチ(一致)するものがあるかを調べ、
マッチするものがあるとこのキーワードと単位テキスト
との間にリンクを形成する。すなわち、これを図4に示
すキーワードツリーを参照して更に説明すると、図4の
キーワードツリーで一番階層が深いのはキーワードFで
あり、次に階層が深いのはキーワードD,Eであり、次
に階層が深いのはキーワードB,Cであり、キーワード
Aが一番階層が浅い。そこで、このキーワードツリーの
場合、図5に示すように、まずキーワードFのマッチン
グを調べ、続いてキーワードD,E,B,C,Aの順に
マッチングを調べる。
【0014】図3のフローチャートにおいては、まず、
キーワードツリーのキーワードはまだあるか、すなわち
、キーワードツリーのキーワードのうちまだマッチング
を調べていないものがあるかを調べる。ここで、キーワ
ードのマッチングは、図5に示したように、キーワード
ツリーの階層の深いキーワードを優先にして行われるの
で、最も階層の浅いキーワード(図5の場合キーワード
A)のマッチングが終了すると、ステップ201で参照
すべきキーワードツリーのキーワードはないと判断され
る。ここではまだ参照すべきキーワードツリーのキーワ
ードはあるので、キーワードツリーのキーワードと単位
テキストに含まれるキーワードとのマッチングが行われ
る(ステップ202)。このマッチングにおいて、キー
ワードツリーのキーワードと単位テキストに含まれるキ
ーワードとがマッチしたと判断されると(ステップ20
3)、次に、その単位テキストは既に自分の子供、すな
わち自分よりも階層の深いキーワードとリンクされてい
るかを調べる(ステップ204)。ここで、自分よりも
階層の深いキーワードとリンクされていないと、その単
位テキストをノードとしてそのキーワード、すなわちキ
ーワードツリーのマッチングしたキーワードとリンクを
形成し(ステップ205)、ステップ201に戻る。 なお、ステップ203でキーワードツリーのキーワード
と単位テキストに含まれるキーワードとがマッチしない
場合、またはその単位テキストが既に自分の子供、すな
わち自分よりも階層の深いキーワードとリンクされてい
る場合もステップ201に戻る。
【0015】この動作は、ステップ201でキーワード
ツリーのキーワードはないと判断されるまで繰り返され
る。
【0016】この動作において、例えば、図2のステッ
プ102で読み出された単位テキストが、第6図に示す
ように、キーワードBとFとCの3つのキーワードを含
むものであるとする。この場合、図5のキーワードツリ
ーを用いて考えると、まず、キーワードFとマッチし、
この単位テキストはキーワードFとリンクされる。次に
キーワードBとマッチする。しかし、キーワードBに関
してはキーワードBの子供、すなわち、キーワードBよ
りも階層の深いキーワードFとこの単位テキストが既に
リンクされているので、図3のステップ204で「Y」
と判断され、この単位テキストとキーワードBとはリン
クされない。また、その後、キーワードCとマッチする
。ここではキーワードCの子供とこの単位テキストはリ
ンクされていないので、図3のステップ204で「N」
と判断され、この単位テキストはキーワードCとリンク
される。
【0017】キーワードツリーの最も階層の浅いキーワ
ードとのマッチングが終了し、図3のステップ201に
おいてキーワードツリーのキーワードがないと判断され
ると、このキーワードのバックトラック処理を終了する
【0018】キーワードのバックトラック処理が終了す
ると、図2のステップ102に戻り、以下の処理を繰り
返す。
【0019】そして、変換すべきプレーンなテキストか
らの単位テキストの読み出しが全て終了し、図2のステ
ップ102においてテキストの終わりと判断されると、
このプレーンなテキストからハイパーテキストへの変換
処理を終了する。
【0020】このように、この実施例によればプレーン
なテキストからハイパーテキストへの変換処理を自動化
することができ、非常に簡単に、かつ短時間でハイパー
テキストを直接作成することができる。
【0021】なお、上記実施例ではキーワードツリーの
キーワードとして簡単なキーワードによる指定を用いた
が、これに加え、複雑なキーワードの指定を許すように
構成してもよい。また、キーワードのAND,OR,N
OT,キーワードの指定に省略記号を許すように構成し
てもよい。
【0022】
【発明の効果】以上説明したようにこの発明によれば、
ハイパーテキスト上に構造化されたキーワードツリーを
形成し、このキーワードツリーのキーワードと変換すべ
きプレーンなテキストから読み出された単位テキストに
含まれるキーワードとの照合により自動的にプレーンな
テキストを直接ハイパーテキストに変換するので、ハイ
パーテキストへの変換作業が非常に簡単になる。
【図面の簡単な説明】
【図1】この発明の適用されるシステムのハードウエア
構成を示すブロック図。
【図2】この発明の一実施例の動作を説明するフローチ
ャート。
【図3】図2に示したフローチャートのキーワードのバ
ックトラック処理の詳細を示すフローチャート。
【図4】この実施例の動作を説明するためのキーワード
ツリーの一例を示す図。
【図5】図4に示したキーワードツリーのキーワードの
マッチングの順番を説明する図。
【図6】この実施例で読み出される単位テキストの一例
を説明する図。
【符号の説明】
10    ハイパーテキストデータベース20   
 制御装置 30    記憶装置 40    入出力装置 50    ディスプレイ 60    キーボード 70    マウス

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】ハイパーテキスト上で階層構造化されたキ
    ーワードからなるキーワードツリーを作成し、このキー
    ワードツリーのキーワードと変換すべきプレーンなテキ
    ストから読み出された単位テキストに含まれるキーワー
    ドとの照合を、前記キーワードツリーの階層構造の深い
    キーワードを優先して行ない、自己のキーワードより階
    層構造の深いキーワードに前記単位テキストがリンクさ
    れていないことを条件に該単位テキストと該キーワード
    との間にリンクを形成し、この動作を各単位テキスト毎
    に繰り返すことにより前記プレーンなテキストをハイパ
    ーテキストに変換することを特徴とするテキスト変換方
    法。
JP2405194A 1990-12-21 1990-12-21 テキスト変換方法 Expired - Fee Related JP2808893B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2405194A JP2808893B2 (ja) 1990-12-21 1990-12-21 テキスト変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2405194A JP2808893B2 (ja) 1990-12-21 1990-12-21 テキスト変換方法

Publications (2)

Publication Number Publication Date
JPH04220768A true JPH04220768A (ja) 1992-08-11
JP2808893B2 JP2808893B2 (ja) 1998-10-08

Family

ID=18514822

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2405194A Expired - Fee Related JP2808893B2 (ja) 1990-12-21 1990-12-21 テキスト変換方法

Country Status (1)

Country Link
JP (1) JP2808893B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6438620B2 (en) 1996-10-29 2002-08-20 Mitsubishi Denki Kabushiki Kaisha Software linking system in information processor
US6581065B1 (en) 1998-02-10 2003-06-17 National Broadcasting Comany, Inc. Dynamic insertion and updating of hypertext links for internet servers
USRE40731E1 (en) 1994-02-16 2009-06-09 Sentius International Corporation System and method for linking streams of multimedia data to reference material for display
US9165055B2 (en) 2001-08-16 2015-10-20 Sentius International, Llc Automated creation and delivery of database content

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE40731E1 (en) 1994-02-16 2009-06-09 Sentius International Corporation System and method for linking streams of multimedia data to reference material for display
USRE43633E1 (en) 1994-02-16 2012-09-04 Sentius International Llc System and method for linking streams of multimedia data to reference material for display
USRE45085E1 (en) 1994-02-16 2014-08-19 Sentius International, Llc System and method for linking streams of multimedia data to reference material for display
US6438620B2 (en) 1996-10-29 2002-08-20 Mitsubishi Denki Kabushiki Kaisha Software linking system in information processor
US6581065B1 (en) 1998-02-10 2003-06-17 National Broadcasting Comany, Inc. Dynamic insertion and updating of hypertext links for internet servers
US9165055B2 (en) 2001-08-16 2015-10-20 Sentius International, Llc Automated creation and delivery of database content
US10296543B2 (en) 2001-08-16 2019-05-21 Sentius International, Llc Automated creation and delivery of database content

Also Published As

Publication number Publication date
JP2808893B2 (ja) 1998-10-08

Similar Documents

Publication Publication Date Title
US7165073B2 (en) Dynamic, hierarchical data exchange system
US6449620B1 (en) Method and apparatus for generating information pages using semi-structured data stored in a structured manner
US6145119A (en) Programming development environment for intranet and internet applications employing unique project data structure
JP3063555B2 (ja) 文書データベース管理装置及び方法
US20070067712A1 (en) System, method and program product for a content viewer portlet
WO1996023266A1 (en) End user query facility
JPH09502039A (ja) 自然言語に似た構造を用いたデータベースのモデル化及び照会に関する方法及び装置
JPH06195248A (ja) 関係データベース管理システムからの問合せの最適化援助方法
KR19980702170A (ko) 통신네트워크 데이터베이스 구축 방법 및 장치
US20070094289A1 (en) Dynamic, hierarchical data exchange system
JPH09146931A (ja) 文書型定義生成装置
JPH04220768A (ja) テキスト変換方法
US8762381B2 (en) Storing multipart XML documents
Bédard et al. Spatial data modeling: the Modul-R formalism and CASE technology
JP2861453B2 (ja) ハイパーテキストモデル作成装置
Lee Recent generalization development and road ahead
Dillon et al. Visual specifications for temporal reasoning
Hartsough et al. Documentation production from a formal database
JPH056291A (ja) テスト資源の作成・管理方法
US20090177686A1 (en) Method for Generating Database Installation Scripts
JP2000122855A (ja) データ名称付与方法及び装置、記録媒体
JPS63257826A (ja) デ−タベ−ス検索装置
Kaur Scrutinize Source Code Using Metric and Suffix Array Based Token Technique To Unmask The Code Clones In Multiple Languages.
CN117632997A (zh) 一种跨数据库平台的命令行界面及读写操作方法
JPH02112024A (ja) プログラム処理パターン推定方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees