JP2000137640A - ハイパーテキスト自動作成装置及びハイパーテキスト自動作成処理プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents
ハイパーテキスト自動作成装置及びハイパーテキスト自動作成処理プログラムを記録したコンピュータ読み取り可能な記録媒体Info
- Publication number
- JP2000137640A JP2000137640A JP10309279A JP30927998A JP2000137640A JP 2000137640 A JP2000137640 A JP 2000137640A JP 10309279 A JP10309279 A JP 10309279A JP 30927998 A JP30927998 A JP 30927998A JP 2000137640 A JP2000137640 A JP 2000137640A
- Authority
- JP
- Japan
- Prior art keywords
- title
- character
- text
- hypertext
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 コンピュータに不案内な人であってもリンク
可能なリンク情報を有する複数の画像や文書からなるハ
イパーテキストによる文書を自動的に作成できるハイパ
ーテキスト自動作成装置を提供すること。 【解決手段】 本発明のハイパーテキスト自動作成装置
1では、タイトルと本文を構成する文字と図形とを識別
して切り出すフォーマット解析プログラム43と、文字
の画像をテキストデータに変換するテキスト変換プログ
ラム44と、本文からタイトルを表す文字を検索するキ
ーワード検索プログラム45と、タイトル検索手段によ
り検索に成功した本文中に含まれる他のページのタイト
ルを選択することで、そのタイトルのページにリンクす
るリンク情報を有するハイパーテキストを生成するハイ
パーテキスト生成プログラム46とを備え、画像情報か
らリンク情報を持ったハイパーテキストを自動作成す
る。
可能なリンク情報を有する複数の画像や文書からなるハ
イパーテキストによる文書を自動的に作成できるハイパ
ーテキスト自動作成装置を提供すること。 【解決手段】 本発明のハイパーテキスト自動作成装置
1では、タイトルと本文を構成する文字と図形とを識別
して切り出すフォーマット解析プログラム43と、文字
の画像をテキストデータに変換するテキスト変換プログ
ラム44と、本文からタイトルを表す文字を検索するキ
ーワード検索プログラム45と、タイトル検索手段によ
り検索に成功した本文中に含まれる他のページのタイト
ルを選択することで、そのタイトルのページにリンクす
るリンク情報を有するハイパーテキストを生成するハイ
パーテキスト生成プログラム46とを備え、画像情報か
らリンク情報を持ったハイパーテキストを自動作成す
る。
Description
【0001】
【発明の属する技術分野】本発明は、リンク情報を含ん
だハイパーテキスト自動作成装置及びハイパーテキスト
自動作成処理プログラムを記録した記録媒体に関する。
だハイパーテキスト自動作成装置及びハイパーテキスト
自動作成処理プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】ハイパーテキストは、例えば、WWW
(World Wide Web)において用いられる
文書形式である。このWWWは、クライアントソフトを
使用するインターネットにより相互に連絡されたコンピ
ュータシステムであり、例えば、インターネットエクス
プローラ(Internet Explorer)やネ
ットスケープナビゲーター(Netscape Nav
igator)(いずれも登録商標)などに代表される
ウェブ検索ソフトであるブラウザソフトにより、相互に
アクセス可能なホームページが閲覧される。このホーム
ページは、ハイパーテキスト記述用の言語であるHTM
L(HyperText Markup Langua
ge)により記述され、グラフィック・イメージとテキ
ストが混在可能で、また、文書中にハイパーテキスト・
リンクを含む。このハイパーテキスト・リンクは、文書
中のグラフィック・イメージやテキスト上にリンク情報
を設定し、このリンク情報に基づいてウェブ上の指定の
URL(Uniform Resource Loca
tor)の他のサイトの文書や、同一ディレクトリ内の
他のページや、同一ページの特定の場所とリンクさせる
ことができるものである。従って、ハイパーテキストに
よるホームページを作成すれば、例えば、案内状に関連
する地図の画像や詳細な説明など別個に作成し、案内状
にリンク情報を設定することで、簡単に豊富な内容を参
照できるようなホームページを構築することもできるも
のである。もちろんハイパーテキストによればホームペ
ージに限らず、データベースなど必要な場所にリンク可
能な文書を作成できる。
(World Wide Web)において用いられる
文書形式である。このWWWは、クライアントソフトを
使用するインターネットにより相互に連絡されたコンピ
ュータシステムであり、例えば、インターネットエクス
プローラ(Internet Explorer)やネ
ットスケープナビゲーター(Netscape Nav
igator)(いずれも登録商標)などに代表される
ウェブ検索ソフトであるブラウザソフトにより、相互に
アクセス可能なホームページが閲覧される。このホーム
ページは、ハイパーテキスト記述用の言語であるHTM
L(HyperText Markup Langua
ge)により記述され、グラフィック・イメージとテキ
ストが混在可能で、また、文書中にハイパーテキスト・
リンクを含む。このハイパーテキスト・リンクは、文書
中のグラフィック・イメージやテキスト上にリンク情報
を設定し、このリンク情報に基づいてウェブ上の指定の
URL(Uniform Resource Loca
tor)の他のサイトの文書や、同一ディレクトリ内の
他のページや、同一ページの特定の場所とリンクさせる
ことができるものである。従って、ハイパーテキストに
よるホームページを作成すれば、例えば、案内状に関連
する地図の画像や詳細な説明など別個に作成し、案内状
にリンク情報を設定することで、簡単に豊富な内容を参
照できるようなホームページを構築することもできるも
のである。もちろんハイパーテキストによればホームペ
ージに限らず、データベースなど必要な場所にリンク可
能な文書を作成できる。
【0003】
【発明が解決しようとする課題】しかしながら、例えば
上述のような他の画像や文書にリンクさせるリンク情報
を有するホームページやデータベースを作成するには、
まずハイパーテキストを作成する必要がある。そのため
には、例えばHTMLなどのハイパーテキストを記述す
ることができる言語を用いて作成しなければならず、併
せてコンピュータやコンピュータのアプリケーションソ
フトを熟知していなければこのようなリンク情報を有す
るハイパーテキストを作成することができない。従っ
て、コンピュータに不案内な人にとっては、このような
リンク情報を有するハイパーテキストが制作できず、こ
のようなハイパーテキストを使ったホームページの制作
もまた困難であるという問題があった。
上述のような他の画像や文書にリンクさせるリンク情報
を有するホームページやデータベースを作成するには、
まずハイパーテキストを作成する必要がある。そのため
には、例えばHTMLなどのハイパーテキストを記述す
ることができる言語を用いて作成しなければならず、併
せてコンピュータやコンピュータのアプリケーションソ
フトを熟知していなければこのようなリンク情報を有す
るハイパーテキストを作成することができない。従っ
て、コンピュータに不案内な人にとっては、このような
リンク情報を有するハイパーテキストが制作できず、こ
のようなハイパーテキストを使ったホームページの制作
もまた困難であるという問題があった。
【0004】この発明は上記課題を解決するものであ
り、コンピュータに不案内な人であってもリンク可能な
リンク情報を有する複数の画像や文書からなるハイパー
テキストによる文書を自動的に作成できるハイパーテキ
スト自動作成装置及びハイパーテキスト自動作成処理プ
ログラムを記録したコンピュータ読み取り可能な記録媒
体を提供することを目的とする。
り、コンピュータに不案内な人であってもリンク可能な
リンク情報を有する複数の画像や文書からなるハイパー
テキストによる文書を自動的に作成できるハイパーテキ
スト自動作成装置及びハイパーテキスト自動作成処理プ
ログラムを記録したコンピュータ読み取り可能な記録媒
体を提供することを目的とする。
【0005】
【課題を解決するための手段】上記課題を解決するた
め、請求項1に係る発明のハイパーテキスト自動作成装
置では、ページごとにつけられたタイトルを表す文字
と、本文を構成する文字若しくは図形のいずれか又はそ
の双方のデータを含む複数ページからなる原稿の画像デ
ータから、タイトルを表す文字と、本文を構成する文字
と、本文を構成する図形とを識別して切り出すフォーマ
ット解析手段と、前記フォーマット解析手段により切り
出された前記タイトルを表す文字と、本文を構成する文
字とを画像データからテキストデータに変換する文字読
み取り手段と、前記文字読み取り手段により読み取った
本文を構成する文字のテキストデータに、タイトルを表
す文字の文字列が含まれるかを検索するタイトル検索手
段と、前記タイトル検索手段により検索に成功した文字
列を本文中で指定することで、当該本文中のタイトルを
表す文字列と同一の文字列をタイトルとするページにリ
ンクするリンク情報を有するハイパーテキストを生成す
るハイパーテキスト生成手段とを備えたことを特徴とす
る。
め、請求項1に係る発明のハイパーテキスト自動作成装
置では、ページごとにつけられたタイトルを表す文字
と、本文を構成する文字若しくは図形のいずれか又はそ
の双方のデータを含む複数ページからなる原稿の画像デ
ータから、タイトルを表す文字と、本文を構成する文字
と、本文を構成する図形とを識別して切り出すフォーマ
ット解析手段と、前記フォーマット解析手段により切り
出された前記タイトルを表す文字と、本文を構成する文
字とを画像データからテキストデータに変換する文字読
み取り手段と、前記文字読み取り手段により読み取った
本文を構成する文字のテキストデータに、タイトルを表
す文字の文字列が含まれるかを検索するタイトル検索手
段と、前記タイトル検索手段により検索に成功した文字
列を本文中で指定することで、当該本文中のタイトルを
表す文字列と同一の文字列をタイトルとするページにリ
ンクするリンク情報を有するハイパーテキストを生成す
るハイパーテキスト生成手段とを備えたことを特徴とす
る。
【0006】この構成に係るハイパーテキスト自動作成
装置では、ハイパーテキストを作成して複数の原稿をリ
ンクをさせたい場合、作成者がコンピュータに不案内で
ハイパーテキストの作成方法を詳しく知らない場合であ
っても、各ページの所定のタイトル入力領域にタイトル
を入れて、本文に、記載された文字部分にリンクさせた
いタイトル名を含めた原稿を作成して本装置に入力すれ
ば、リンク情報を備えたハイパーテキストを自動作成で
きる。
装置では、ハイパーテキストを作成して複数の原稿をリ
ンクをさせたい場合、作成者がコンピュータに不案内で
ハイパーテキストの作成方法を詳しく知らない場合であ
っても、各ページの所定のタイトル入力領域にタイトル
を入れて、本文に、記載された文字部分にリンクさせた
いタイトル名を含めた原稿を作成して本装置に入力すれ
ば、リンク情報を備えたハイパーテキストを自動作成で
きる。
【0007】また、請求項2に係る発明のハイパーテキ
スト自動作成装置では、請求項1に記載のハイパーテキ
スト自動作成装置の構成に加え、媒体に形成された前記
原稿を読み取って前記画像データに変換する入力手段
と、前記入力手段を制御する入力制御手段とをさらに備
えたことを特徴とする。
スト自動作成装置では、請求項1に記載のハイパーテキ
スト自動作成装置の構成に加え、媒体に形成された前記
原稿を読み取って前記画像データに変換する入力手段
と、前記入力手段を制御する入力制御手段とをさらに備
えたことを特徴とする。
【0008】この構成に係るハイパーテキスト自動作成
装置では、入力装置が装置と一体に構成されているた
め、入力装置に原画像を読み込ませるだけで、後はハイ
パーテキストが自動作成される。
装置では、入力装置が装置と一体に構成されているた
め、入力装置に原画像を読み込ませるだけで、後はハイ
パーテキストが自動作成される。
【0009】請求項3に係る発明のハイパーテキスト自
動作成装置では、請求項2に記載のハイパーテキスト自
動作成装置の構成に加え、前記入力手段は、光学式スキ
ャナ装置であることを特徴とする。
動作成装置では、請求項2に記載のハイパーテキスト自
動作成装置の構成に加え、前記入力手段は、光学式スキ
ャナ装置であることを特徴とする。
【0010】この構成に係るハイパーテキスト自動作成
装置では、入力手段がスキャナ装置であるため、作成し
たい原稿を紙などに印刷や手書きで記載し、後はスキャ
ナで読み込ませるだけで、ハイパーテキストを作成でき
る。
装置では、入力手段がスキャナ装置であるため、作成し
たい原稿を紙などに印刷や手書きで記載し、後はスキャ
ナで読み込ませるだけで、ハイパーテキストを作成でき
る。
【0011】請求項4に係る発明のハイパーテキスト自
動作成処理プログラムを記録したコンピュータ読み取り
可能な記録媒体では、コンピュータに、ページごとにつ
けられたタイトルを表す文字と、本文を構成する文字若
しくは図形のいずれか又はその双方のデータを含む複数
ページからなる原稿の画像データから、タイトルを表す
文字と、本文を構成する文字と、本文を構成する図形と
を識別して切り出すフォーマット解析の手順と、前記フ
ォーマット解析の手順により切り出された前記タイトル
を表す文字と、本文を構成する文字とを画像データから
テキストデータに変換する文字読み取りの手順と、前記
文字読み取りの手順により読み取った本文を構成する文
字のテキストデータに、タイトルを表す文字の文字列が
含まれるかを検索するタイトル検索の手順と、前記タイ
トル検索の手順により検索に成功した文字列を本文中で
指定することで、当該本文中のタイトルを表す文字列と
同一の文字列をタイトルとするページにリンクするリン
ク情報を有するハイパーテキストを生成するハイパーテ
キスト生成の手順とを実行させることを特徴とする。
動作成処理プログラムを記録したコンピュータ読み取り
可能な記録媒体では、コンピュータに、ページごとにつ
けられたタイトルを表す文字と、本文を構成する文字若
しくは図形のいずれか又はその双方のデータを含む複数
ページからなる原稿の画像データから、タイトルを表す
文字と、本文を構成する文字と、本文を構成する図形と
を識別して切り出すフォーマット解析の手順と、前記フ
ォーマット解析の手順により切り出された前記タイトル
を表す文字と、本文を構成する文字とを画像データから
テキストデータに変換する文字読み取りの手順と、前記
文字読み取りの手順により読み取った本文を構成する文
字のテキストデータに、タイトルを表す文字の文字列が
含まれるかを検索するタイトル検索の手順と、前記タイ
トル検索の手順により検索に成功した文字列を本文中で
指定することで、当該本文中のタイトルを表す文字列と
同一の文字列をタイトルとするページにリンクするリン
ク情報を有するハイパーテキストを生成するハイパーテ
キスト生成の手順とを実行させることを特徴とする。
【0012】この構成に係るハイパーテキスト自動作成
処理プログラムを記録したコンピュータ読み取り可能な
記録媒体では、ハイパーテキストを作成して複数の原稿
をリンクをさせたい場合、作成者がコンピュータに不案
内でハイパーテキストの作成方法を詳しく知らない場合
であっても、各ページの所定のタイトル入力領域にタイ
トルを入れて、本文に、記載された文字部分にリンクさ
せたいタイトル名を含めた原稿を作成して本プログラム
をコンピュータに実行させればリンク情報を備えたハイ
パーテキストを自動作成できる。
処理プログラムを記録したコンピュータ読み取り可能な
記録媒体では、ハイパーテキストを作成して複数の原稿
をリンクをさせたい場合、作成者がコンピュータに不案
内でハイパーテキストの作成方法を詳しく知らない場合
であっても、各ページの所定のタイトル入力領域にタイ
トルを入れて、本文に、記載された文字部分にリンクさ
せたいタイトル名を含めた原稿を作成して本プログラム
をコンピュータに実行させればリンク情報を備えたハイ
パーテキストを自動作成できる。
【0013】請求項5に係るハイパーテキスト自動作成
処理プログラムを記録したコンピュータ読み取り可能な
記録媒体は、請求項4に記載のハイパーテキスト自動作
成処理プログラムを記録したコンピュータ読み取り可能
な記録媒体の構成に加え、媒体に形成された前記原稿を
読み取って前記画像データに変換する入力手段を備えた
前記コンピュータに、前記入力手段を制御する入力制御
の手順をさらに実行させることを特徴とする。
処理プログラムを記録したコンピュータ読み取り可能な
記録媒体は、請求項4に記載のハイパーテキスト自動作
成処理プログラムを記録したコンピュータ読み取り可能
な記録媒体の構成に加え、媒体に形成された前記原稿を
読み取って前記画像データに変換する入力手段を備えた
前記コンピュータに、前記入力手段を制御する入力制御
の手順をさらに実行させることを特徴とする。
【0014】この構成に係るハイパーテキスト自動作成
処理プログラムを記録したコンピュータ読み取り可能な
記録媒体では、入力装置が本装置と一体に制御されるよ
うに構成されているため、入力装置に原画像を読み込ま
せるだけで、後はハイパーテキストが自動作成される。
処理プログラムを記録したコンピュータ読み取り可能な
記録媒体では、入力装置が本装置と一体に制御されるよ
うに構成されているため、入力装置に原画像を読み込ま
せるだけで、後はハイパーテキストが自動作成される。
【0015】
【発明の実施の形態】以下、本発明に係るハイパーテキ
スト自動作成装置及びハイパーテキスト自動作成処理プ
ログラムを記録したコンピュータ読み取り可能な記録媒
体を、好ましい一の実施の形態により、添付図面を参照
して説明する。 ここで、図1は、ハイパーテキスト自
動作成装置1の構成の概略を示すブロック図である。ま
ず最初に、本実施の形態に係るハイパーテキスト自動作
成装置1の構成について図1を参照しながらその概略を
説明する。
スト自動作成装置及びハイパーテキスト自動作成処理プ
ログラムを記録したコンピュータ読み取り可能な記録媒
体を、好ましい一の実施の形態により、添付図面を参照
して説明する。 ここで、図1は、ハイパーテキスト自
動作成装置1の構成の概略を示すブロック図である。ま
ず最初に、本実施の形態に係るハイパーテキスト自動作
成装置1の構成について図1を参照しながらその概略を
説明する。
【0016】図1で示すように、ハイパーテキスト自動
作成装置(以下適宜装置と略す)1は、制御部10に、
入力装置20、表示装置30、出力装置60が接続され
て構成されている。
作成装置(以下適宜装置と略す)1は、制御部10に、
入力装置20、表示装置30、出力装置60が接続され
て構成されている。
【0017】制御部10は、CPU11と、ROM40
と、RAM50と、入出力ポート12とが、バスライン
13を介して電気的に接続され、全体として周知のコン
ピュータを構成している。
と、RAM50と、入出力ポート12とが、バスライン
13を介して電気的に接続され、全体として周知のコン
ピュータを構成している。
【0018】CPU11は、後述するROM40に記憶
された各種プログラムにより、バスライン13を介して
データの入出力を行って、各種演算を行い、処理の実行
に必要な命令を出して制御を行い、ハイパーテキストの
自動作成の処理の実行を行う中心部分である。
された各種プログラムにより、バスライン13を介して
データの入出力を行って、各種演算を行い、処理の実行
に必要な命令を出して制御を行い、ハイパーテキストの
自動作成の処理の実行を行う中心部分である。
【0019】バスライン13は、データバス、アドレス
バス、制御バスから構成され、CPU11、ROM4
0、RAM50及び入出力ポート12を介して各装置と
データのやりとりを行うものである。
バス、制御バスから構成され、CPU11、ROM4
0、RAM50及び入出力ポート12を介して各装置と
データのやりとりを行うものである。
【0020】ROM(Read Only Memor
y)40は、読み出し専用の不揮発性メモリからなり、
制御プログラム41、入力データ解析プログラム42、
ハイパーテキスト生成プログラム46などが記憶されて
いる。
y)40は、読み出し専用の不揮発性メモリからなり、
制御プログラム41、入力データ解析プログラム42、
ハイパーテキスト生成プログラム46などが記憶されて
いる。
【0021】制御プログラム41は、装置1の電源管理
や入出力管理、また各種アプリケーションソフトの管理
などを行い、装置1全体を司るものである。
や入出力管理、また各種アプリケーションソフトの管理
などを行い、装置1全体を司るものである。
【0022】入力データ解析プログラム42は、入力さ
れたビットマップデータからなる画像データからハイパ
ーテキストを生成するためのイメージデータとテキスト
データとその他の文書生成のための情報を解析して抽出
するプログラムで、フォーマット解析プログラム43と
テキスト変換プログラム44とキーワード検索プログラ
ム45とを含む。
れたビットマップデータからなる画像データからハイパ
ーテキストを生成するためのイメージデータとテキスト
データとその他の文書生成のための情報を解析して抽出
するプログラムで、フォーマット解析プログラム43と
テキスト変換プログラム44とキーワード検索プログラ
ム45とを含む。
【0023】フォーマット解析プログラム43は、スキ
ャナなどから読み込まれたビットマップデータから、そ
の形態などを分析して、テキストデータとイメージデー
タの部分を識別して、その領域を切り出して分離するも
のである。その際に、各データの図上の座標を読み取り
記憶しておくものである。
ャナなどから読み込まれたビットマップデータから、そ
の形態などを分析して、テキストデータとイメージデー
タの部分を識別して、その領域を切り出して分離するも
のである。その際に、各データの図上の座標を読み取り
記憶しておくものである。
【0024】テキスト変換プログラム44は、本装置1
に文字読み取り装置としての機能を実行させるプログラ
ムで、前述のフォーマット解析プログラム43により、
入力された画像データのうちテキストデータであると認
識された領域から文字をテキストデータとして読みとる
ものである。具体的には、周知のOCR(光学的文字読
み取り装置)と同様の処理を行うものであり、構成の説
明は省略する。
に文字読み取り装置としての機能を実行させるプログラ
ムで、前述のフォーマット解析プログラム43により、
入力された画像データのうちテキストデータであると認
識された領域から文字をテキストデータとして読みとる
ものである。具体的には、周知のOCR(光学的文字読
み取り装置)と同様の処理を行うものであり、構成の説
明は省略する。
【0025】キーワード検索プログラム45は、前述の
テキスト変換プログラム44により、テキストデータと
して読みとられたデータから、所定のリンク先を表示し
たリンク情報とされたキーワードを検索し発見するプロ
グラムである。
テキスト変換プログラム44により、テキストデータと
して読みとられたデータから、所定のリンク先を表示し
たリンク情報とされたキーワードを検索し発見するプロ
グラムである。
【0026】ハイパーテキスト生成プログラム46は、
入力データ解析プログラム42によりビットマップデー
タから分離・抽出された、タイトル、文字、図形のデー
タ及びリンク情報から、ハイパーリンクが可能なHTM
L文書を生成するプログラムである。
入力データ解析プログラム42によりビットマップデー
タから分離・抽出された、タイトル、文字、図形のデー
タ及びリンク情報から、ハイパーリンクが可能なHTM
L文書を生成するプログラムである。
【0027】RAM(Random Access M
emory)50は、読み書き自由な揮発性メモリで、
各種データを一時的に記憶し、各種処理をするための記
憶領域である。RAM50には、入力バッファ51、イ
メージ記憶領域52、テキスト記憶領域53、付加情報
記憶領域54、ワークエリア55、ハイパーテキスト記
憶領域56の各記憶領域が含まれる。
emory)50は、読み書き自由な揮発性メモリで、
各種データを一時的に記憶し、各種処理をするための記
憶領域である。RAM50には、入力バッファ51、イ
メージ記憶領域52、テキスト記憶領域53、付加情報
記憶領域54、ワークエリア55、ハイパーテキスト記
憶領域56の各記憶領域が含まれる。
【0028】入力バッファ51は、スキャナ或いは電話
回線などを通じて、入力すべき図形及び文字の入力デー
タを一旦ビットマップデータによる画像データとして記
憶しておく記憶エリアである。
回線などを通じて、入力すべき図形及び文字の入力デー
タを一旦ビットマップデータによる画像データとして記
憶しておく記憶エリアである。
【0029】入力バッファ51に記憶された入力データ
は、入力データ解析プログラム42により、イメージデ
ータとテキストデータとその他の付加情報に解析されて
分けられるが、そのうちのイメージ記憶領域52には、
例えばGIF(Graphic Interchang
e Format)やJPEG(Joint Phot
ographic Expert Group)などの
画像データのフォーマットでイメージデータが保存され
る。
は、入力データ解析プログラム42により、イメージデ
ータとテキストデータとその他の付加情報に解析されて
分けられるが、そのうちのイメージ記憶領域52には、
例えばGIF(Graphic Interchang
e Format)やJPEG(Joint Phot
ographic Expert Group)などの
画像データのフォーマットでイメージデータが保存され
る。
【0030】また、テキスト記憶領域53にはテキスト
ファイルでテキストデータが保存される。
ファイルでテキストデータが保存される。
【0031】また、付加情報記憶領域54には、各ペー
ジのタイトルやハイパーリンクのためのリンク情報や、
イメージデータとテキストデータを配列するレイアウト
情報が記憶される。
ジのタイトルやハイパーリンクのためのリンク情報や、
イメージデータとテキストデータを配列するレイアウト
情報が記憶される。
【0032】ワークエリア55は、各種処理に必要なフ
ラグやポインタなど各種の情報を一時的に保持するエリ
アである。
ラグやポインタなど各種の情報を一時的に保持するエリ
アである。
【0033】ハイパーテキスト記憶領域56は、ハイパ
ーテキスト生成プログラム46により生成されたハイパ
ーテキストを出力のために記憶しておく領域である。
ーテキスト生成プログラム46により生成されたハイパ
ーテキストを出力のために記憶しておく領域である。
【0034】入力装置20は、ホームページの原稿にな
る印刷或いは手書きされた画像情報を直接ディジタルデ
ータとして入力する装置で、本装置1においては、光学
的なスキャナ装置により構成される。なお、スキャナに
限らずディジタルカメラなどディジタルデータを入力で
きるものであればよく、さらに他の装置で入力されたデ
ィジタルデータを、電話回線等を使って転送するもの
や、或いは記憶媒体に一旦記憶したものを入力するよう
なものであってもよく、場合によっては、テキストデー
タやベクトルデータによるデータをビットマップデータ
に変換したようなファイルでも処理が可能である。要
は、ディジタルデータを入力できるものであればよい。
る印刷或いは手書きされた画像情報を直接ディジタルデ
ータとして入力する装置で、本装置1においては、光学
的なスキャナ装置により構成される。なお、スキャナに
限らずディジタルカメラなどディジタルデータを入力で
きるものであればよく、さらに他の装置で入力されたデ
ィジタルデータを、電話回線等を使って転送するもの
や、或いは記憶媒体に一旦記憶したものを入力するよう
なものであってもよく、場合によっては、テキストデー
タやベクトルデータによるデータをビットマップデータ
に変換したようなファイルでも処理が可能である。要
は、ディジタルデータを入力できるものであればよい。
【0035】また、処理にあたり、各種処理の命令や、
必要に応じて編集などをするためにキーボード、マウス
などのポインティングデバイス、その他の入力装置を備
えていてもよく、本装置1では、図示しないキーボード
及びマウスが接続されている。
必要に応じて編集などをするためにキーボード、マウス
などのポインティングデバイス、その他の入力装置を備
えていてもよく、本装置1では、図示しないキーボード
及びマウスが接続されている。
【0036】表示装置30は、各種処理の内容をモニタ
ーする装置で、本装置1では、CRTからなるディスプ
レーを用いている。もちろん、LCDディスプレーなど
他の方法のモニターでもよく、さらに完全自動化された
ような場合であれば、表示装置30はなくてもよい。
ーする装置で、本装置1では、CRTからなるディスプ
レーを用いている。もちろん、LCDディスプレーなど
他の方法のモニターでもよく、さらに完全自動化された
ような場合であれば、表示装置30はなくてもよい。
【0037】出力装置60は、ハイパーテキスト記憶領
域56に生成されたハイパーテキストを出力するもの
で、一旦外部記憶装置であるハードディスクやフレキシ
ブルディスクに出力されて記憶されるようなものであっ
てよいし、或いは電話回線などを介して他の装置に転送
するような形式であってもよい。なお、プリンタなど、
作成されたハイパーテキストのデータをハードコピーで
出力するような装置を設けてもよい。
域56に生成されたハイパーテキストを出力するもの
で、一旦外部記憶装置であるハードディスクやフレキシ
ブルディスクに出力されて記憶されるようなものであっ
てよいし、或いは電話回線などを介して他の装置に転送
するような形式であってもよい。なお、プリンタなど、
作成されたハイパーテキストのデータをハードコピーで
出力するような装置を設けてもよい。
【0038】以下、上記のように構成されたハイパーテ
キスト自動作成装置1について、図2、図3及び図7に
示すフローチャートによりそのハイパーテキスト自動作
成処理の手順を説明する。なお、説明の便宜上、ここで
はインターネットのホームページ更新のためにコンピュ
ータの操作に不案内な人が表した図形及び文書の混在し
た複数の紙媒体を、リンク可能なHTML文書にして、
インターネット上のホームページの更新をする場合を一
例として説明する。ここで、図2は、本装置1の処理の
手順の概要を表すフローチャートであり、図3は、図2
に示すS200のフォーマット解析・テキスト変換処理
及びS300のキーワード検索の処理の手順を詳細に表
したフローチャートである。
キスト自動作成装置1について、図2、図3及び図7に
示すフローチャートによりそのハイパーテキスト自動作
成処理の手順を説明する。なお、説明の便宜上、ここで
はインターネットのホームページ更新のためにコンピュ
ータの操作に不案内な人が表した図形及び文書の混在し
た複数の紙媒体を、リンク可能なHTML文書にして、
インターネット上のホームページの更新をする場合を一
例として説明する。ここで、図2は、本装置1の処理の
手順の概要を表すフローチャートであり、図3は、図2
に示すS200のフォーマット解析・テキスト変換処理
及びS300のキーワード検索の処理の手順を詳細に表
したフローチャートである。
【0039】図2に示すように、ハイパーテキスト自動
作成装置1の処理は、データ読み込み(ステップ10
0、以下ステップをSと略記してS100ように表記す
る)、フォーマット解析・テキスト変換処理(S20
0)、キーワード検索(S300)、HTML文書生成
(S400)の4つの処理の手順からなる。
作成装置1の処理は、データ読み込み(ステップ10
0、以下ステップをSと略記してS100ように表記す
る)、フォーマット解析・テキスト変換処理(S20
0)、キーワード検索(S300)、HTML文書生成
(S400)の4つの処理の手順からなる。
【0040】まず、S100におけるデータ読み込みの
処理に先立って、データの入力にあたってデータを入力
する者(以下ユーザという)は、リンクさせる情報を含
んだ紙媒体によるリンク元ページであるリンク元の原稿
70を作成する。ここで図4は、リンク元の原稿70を
表す模式図である。図4に示すように、リンク元の原稿
70の上部には、タイトルとなる文字情報を記載するタ
イトル入力領域71と、その下部には出力ページに表示
される本文の内容である画像及び文字情報を記載する内
容入力領域72とが設けられる。タイトル入力領域71
には、タイトルを表す文字73が印刷或いは手書きで記
入される。この文字73は、ユーザがワードプロセッサ
などに慣れていれば、適当なポイントで、且つ明朝体の
ような所定のフォントで印刷されることが望ましいが、
そうでない場合は手書きで記入する。その場合は、タイ
トルとなる内容の文字73を所定の適当な大きさの楷書
で、文字間隔を詰めないで水平に記載することが後述の
文字認識で高い認識率を示すために望ましい。
処理に先立って、データの入力にあたってデータを入力
する者(以下ユーザという)は、リンクさせる情報を含
んだ紙媒体によるリンク元ページであるリンク元の原稿
70を作成する。ここで図4は、リンク元の原稿70を
表す模式図である。図4に示すように、リンク元の原稿
70の上部には、タイトルとなる文字情報を記載するタ
イトル入力領域71と、その下部には出力ページに表示
される本文の内容である画像及び文字情報を記載する内
容入力領域72とが設けられる。タイトル入力領域71
には、タイトルを表す文字73が印刷或いは手書きで記
入される。この文字73は、ユーザがワードプロセッサ
などに慣れていれば、適当なポイントで、且つ明朝体の
ような所定のフォントで印刷されることが望ましいが、
そうでない場合は手書きで記入する。その場合は、タイ
トルとなる内容の文字73を所定の適当な大きさの楷書
で、文字間隔を詰めないで水平に記載することが後述の
文字認識で高い認識率を示すために望ましい。
【0041】また、内容入力領域72には、ハイパーテ
キスト文書のページに表示されるリンク情報を含まない
文字74、図形76及びリンク情報を表す文字列を含む
文字75を記載するが、文字74,75は、タイトル入
力領域71の説明で述べた文字73と同様に記載される
のが望ましく、特にリンク先を表す文字列を含む文字7
5に関しては、図形とは混在させないことがのぞまし
い。リンク情報を含まない文字74は、もし文字として
認識されなくても図形としてそのままの形で生成された
ハイパーテキスト文書に表示されるため支障はないが、
リンク情報を含む文字が文字として認識されない場合
は、リンクが不能となる。
キスト文書のページに表示されるリンク情報を含まない
文字74、図形76及びリンク情報を表す文字列を含む
文字75を記載するが、文字74,75は、タイトル入
力領域71の説明で述べた文字73と同様に記載される
のが望ましく、特にリンク先を表す文字列を含む文字7
5に関しては、図形とは混在させないことがのぞまし
い。リンク情報を含まない文字74は、もし文字として
認識されなくても図形としてそのままの形で生成された
ハイパーテキスト文書に表示されるため支障はないが、
リンク情報を含む文字が文字として認識されない場合
は、リンクが不能となる。
【0042】ここで図5は、リンク先の原稿77を表す
模式図である。上記のように作成されたリンク元の原稿
70とは別に、図5に示すようなリンク先として指定さ
れたページのリンク先の原稿77を別途準備する。リン
ク先であるページのリンク先の原稿77は、リンク元の
原稿70と同様に、タイトル入力領域78と内容入力領
域79が設けられる。タイトル入力領域78には、リン
ク元の原稿70のリンク情報を表す文字列を含む文字7
5に含まれた文字列、この例においては具体的には「パ
ーティー会場」という文字列がリンク元の原稿70に設
定されているので、リンク先の原稿77のタイトル入力
領域78には、タイトルを表す文字80として「パーテ
ィー会場」という文字列が記載される。そして、内容入
力領域79には、リンク先ページの内容として表示され
る図形81、ここではパーティー会場の地図の図形が記
載される。
模式図である。上記のように作成されたリンク元の原稿
70とは別に、図5に示すようなリンク先として指定さ
れたページのリンク先の原稿77を別途準備する。リン
ク先であるページのリンク先の原稿77は、リンク元の
原稿70と同様に、タイトル入力領域78と内容入力領
域79が設けられる。タイトル入力領域78には、リン
ク元の原稿70のリンク情報を表す文字列を含む文字7
5に含まれた文字列、この例においては具体的には「パ
ーティー会場」という文字列がリンク元の原稿70に設
定されているので、リンク先の原稿77のタイトル入力
領域78には、タイトルを表す文字80として「パーテ
ィー会場」という文字列が記載される。そして、内容入
力領域79には、リンク先ページの内容として表示され
る図形81、ここではパーティー会場の地図の図形が記
載される。
【0043】図2のS100において、上述のように準
備された原稿がそれぞれ入力装置20である周知の光学
式スキャナ装置で読み込まれ、ビットマップデータとし
て認識され、そのデータがページごとに1から順にペー
ジ数がつけられて入力バッファ51に記憶される。
備された原稿がそれぞれ入力装置20である周知の光学
式スキャナ装置で読み込まれ、ビットマップデータとし
て認識され、そのデータがページごとに1から順にペー
ジ数がつけられて入力バッファ51に記憶される。
【0044】続いて、図2のS200のフォーマット解
析・テキスト変換処理及びS300のキーワード検索の
処理が実行される。図3は、図2に示すS200のフォ
ーマット解析・テキスト変換処理及びS300のキーワ
ード検索の処理の手順を詳細に表したフローチャートで
ある。以下図3に示すフローチャートに沿って図2に示
すS200のフォーマット解析・テキスト変換処理及び
S300のキーワード検索の処理の手順を詳細に説明す
る。
析・テキスト変換処理及びS300のキーワード検索の
処理が実行される。図3は、図2に示すS200のフォ
ーマット解析・テキスト変換処理及びS300のキーワ
ード検索の処理の手順を詳細に表したフローチャートで
ある。以下図3に示すフローチャートに沿って図2に示
すS200のフォーマット解析・テキスト変換処理及び
S300のキーワード検索の処理の手順を詳細に説明す
る。
【0045】S200においては、まず、ワークエリア
55に記憶された処理される原稿のページ数を表すiに
1を代入してi=1に初期設定する(S201)。そし
てi枚目の原稿について、RAM50の入力バッファ5
1からi枚目のデータを呼び出して以下に述べるS20
5からS211までの処理を実行する(S203)。こ
こでは、1枚目の原稿である原稿70を例に説明する。
また、図6は1枚目の原稿70について、タイトル入力
領域71及び内容入力領域72においての文字及び図形
の切り出しの様子を示す模式図である。最初に、タイト
ル入力領域71と、内容入力領域72のデータをそれぞ
れの枠線を認識することで分離する(S205)。そし
て、タイトル入力領域71に入力されたタイトルを表す
文字73を、テキスト変換プログラム44を実行して文
字認識を行う(S207)。ここでは図6に示すよう
に、「パーティーの案内」という文字の部分が文字フォ
ーマット82として切り出されて文字73が認識され
る。なお、この説明においては、文字認識はすべて成功
し正しく認識されるものとして説明をする。以下の文字
認識も同様である。ここでの文字読み取り処理自体は周
知の方法であるので、ここでは詳述しない。
55に記憶された処理される原稿のページ数を表すiに
1を代入してi=1に初期設定する(S201)。そし
てi枚目の原稿について、RAM50の入力バッファ5
1からi枚目のデータを呼び出して以下に述べるS20
5からS211までの処理を実行する(S203)。こ
こでは、1枚目の原稿である原稿70を例に説明する。
また、図6は1枚目の原稿70について、タイトル入力
領域71及び内容入力領域72においての文字及び図形
の切り出しの様子を示す模式図である。最初に、タイト
ル入力領域71と、内容入力領域72のデータをそれぞ
れの枠線を認識することで分離する(S205)。そし
て、タイトル入力領域71に入力されたタイトルを表す
文字73を、テキスト変換プログラム44を実行して文
字認識を行う(S207)。ここでは図6に示すよう
に、「パーティーの案内」という文字の部分が文字フォ
ーマット82として切り出されて文字73が認識され
る。なお、この説明においては、文字認識はすべて成功
し正しく認識されるものとして説明をする。以下の文字
認識も同様である。ここでの文字読み取り処理自体は周
知の方法であるので、ここでは詳述しない。
【0046】続いて、内容入力領域72に入力された内
容を、文字認識に先立ってその内容をフォーマット解析
し、文章部分を文字フォーマット82として切り出す
(S209)。ここでは、例えば、水平に且つ等間隔に
並んで配置された複数のビットマップデータ単位を文字
と推定するなどして、文字であるかを判断し、文字であ
ると判断されたデータに関しては後述のテキスト変換処
理を行う文字を含むビットマップデータである文字フォ
ーマット82として切り出し、文字を含まないビットマ
ップデータである図形フォーマット83とは区別するも
のである。ここでは、「パーティーを開きます 日時:
12月1日 19:00」という文字74の部分と、
「パーティー会場は 別紙の地図の所です」という文字
75の部分が文字フォーマット82として切り出されて
いる。そして、S209で文章として切り出された文字
フォーマット82の部分を、テキスト変換プログラム4
4により文字認識を行う。
容を、文字認識に先立ってその内容をフォーマット解析
し、文章部分を文字フォーマット82として切り出す
(S209)。ここでは、例えば、水平に且つ等間隔に
並んで配置された複数のビットマップデータ単位を文字
と推定するなどして、文字であるかを判断し、文字であ
ると判断されたデータに関しては後述のテキスト変換処
理を行う文字を含むビットマップデータである文字フォ
ーマット82として切り出し、文字を含まないビットマ
ップデータである図形フォーマット83とは区別するも
のである。ここでは、「パーティーを開きます 日時:
12月1日 19:00」という文字74の部分と、
「パーティー会場は 別紙の地図の所です」という文字
75の部分が文字フォーマット82として切り出されて
いる。そして、S209で文章として切り出された文字
フォーマット82の部分を、テキスト変換プログラム4
4により文字認識を行う。
【0047】このようにして、1枚目の文字部分の読み
取り処理が終了したら(S205〜S211)、i=1
からiを1インクリメントしてi=2として(S21
3)、i枚目、ここでは2枚目の原稿があるか、入力バ
ッファ51のデータを調べ、この例では2枚目のデータ
が記憶されていることからi枚目の原稿があるとされ
(S215:YES)、再びi枚目の原稿について、こ
こでは2枚目の原稿77について前述の処理と同様の処
理がなされる。
取り処理が終了したら(S205〜S211)、i=1
からiを1インクリメントしてi=2として(S21
3)、i枚目、ここでは2枚目の原稿があるか、入力バ
ッファ51のデータを調べ、この例では2枚目のデータ
が記憶されていることからi枚目の原稿があるとされ
(S215:YES)、再びi枚目の原稿について、こ
こでは2枚目の原稿77について前述の処理と同様の処
理がなされる。
【0048】この処理は、前述の処理と同様な処理であ
るので繰り返して説明することを省くが、図5に示すよ
うに2枚目のデータでは内容入力領域79には文字フォ
ーマット82がないので、S211におけるテキスト変
換処理はなされない。なお、「ココです!」、「N」と
いう文字についてはいずれも図形81の一部として認識
され、文字としては切り出されなかったものとする。
るので繰り返して説明することを省くが、図5に示すよ
うに2枚目のデータでは内容入力領域79には文字フォ
ーマット82がないので、S211におけるテキスト変
換処理はなされない。なお、「ココです!」、「N」と
いう文字についてはいずれも図形81の一部として認識
され、文字としては切り出されなかったものとする。
【0049】そして、i=2からiを1インクリメント
してi=3として(S213)、i枚目、ここでは3枚
目の原稿があるか、入力バッファ51のデータを調べ、
この例では3枚目のデータが記憶されていないため、i
枚目の原稿はないとして(S215:NO)フォーマッ
ト解析・テキスト変換の処理が完了したため、すべての
原稿のタイトルを内容に関連づけてポインタとともにワ
ークエリア55に設けられた図1に示すタイトル記憶部
541に格納される(S217)。
してi=3として(S213)、i枚目、ここでは3枚
目の原稿があるか、入力バッファ51のデータを調べ、
この例では3枚目のデータが記憶されていないため、i
枚目の原稿はないとして(S215:NO)フォーマッ
ト解析・テキスト変換の処理が完了したため、すべての
原稿のタイトルを内容に関連づけてポインタとともにワ
ークエリア55に設けられた図1に示すタイトル記憶部
541に格納される(S217)。
【0050】なお、各ページの文字認識された文章部分
は、ページごとにテキスト記憶領域53に記憶され、図
形部分も各ページごとにイメージ記憶領域52に記憶さ
れる。また、文字認識されたタイトルを表す文字73も
タイトル記憶部541に記憶され、それぞれの文章及び
図形の位置の座標も、付加情報記憶領域54のレイアウ
ト記憶部542にそれぞれの文章及び図形と関係づけら
れるようにポインタとともに記憶される。図2のフォー
マット解析・テキスト変換処理(S200)を終了し、
続いてキーワード検索(S300)の処理に移行する。
は、ページごとにテキスト記憶領域53に記憶され、図
形部分も各ページごとにイメージ記憶領域52に記憶さ
れる。また、文字認識されたタイトルを表す文字73も
タイトル記憶部541に記憶され、それぞれの文章及び
図形の位置の座標も、付加情報記憶領域54のレイアウ
ト記憶部542にそれぞれの文章及び図形と関係づけら
れるようにポインタとともに記憶される。図2のフォー
マット解析・テキスト変換処理(S200)を終了し、
続いてキーワード検索(S300)の処理に移行する。
【0051】図3に示すようにS300に移行すると、
まず、ページ数を表すiがリセットされデフォルト値で
あるi=1とされる(S301)。
まず、ページ数を表すiがリセットされデフォルト値で
あるi=1とされる(S301)。
【0052】そしてi枚目の原稿、即ち1枚目のリンク
元の原稿70に係る原稿についてS305からS309
までの処理が実行される(S303)。まず、文字認識
された文章中からタイトルとなっている文字列を検索す
る(S305)。ここでは、具体的には、1枚目のタイ
トルである「パーティーの案内」の文字73、2枚目の
タイトルである「パーティー会場」の文字80が検索の
対象とされることになる。1枚目の内容である文章部分
の「パーティーを開きます 日時:12月1日19:0
0」の文字74及び「パーティー会場は 別紙の地図の
所です」という文字75部分について、「パーティーの
案内」及び「パーティー会場」の文字を検索すると、
「パーティー会場」という部分が、「パーティー会場は
別紙の地図の所です」という文字75の部分に含まれ
ているため、この「パーティー会場」という文字80の
部分が検索に成功し(S307:YES)、「パーティ
ー会場」というタイトル文字列と、そのタイトルに関連
づけられた「パーティー会場は 別紙の地図の所です」
という文字75の部分がリンクするという情報がワーク
エリア55に記憶されて保持される(S309)。
元の原稿70に係る原稿についてS305からS309
までの処理が実行される(S303)。まず、文字認識
された文章中からタイトルとなっている文字列を検索す
る(S305)。ここでは、具体的には、1枚目のタイ
トルである「パーティーの案内」の文字73、2枚目の
タイトルである「パーティー会場」の文字80が検索の
対象とされることになる。1枚目の内容である文章部分
の「パーティーを開きます 日時:12月1日19:0
0」の文字74及び「パーティー会場は 別紙の地図の
所です」という文字75部分について、「パーティーの
案内」及び「パーティー会場」の文字を検索すると、
「パーティー会場」という部分が、「パーティー会場は
別紙の地図の所です」という文字75の部分に含まれ
ているため、この「パーティー会場」という文字80の
部分が検索に成功し(S307:YES)、「パーティ
ー会場」というタイトル文字列と、そのタイトルに関連
づけられた「パーティー会場は 別紙の地図の所です」
という文字75の部分がリンクするという情報がワーク
エリア55に記憶されて保持される(S309)。
【0053】1枚目の処理が終了すると、ページ数を表
すiが1インクリメントされi=2となって(S31
1)、i枚目、ここでは2枚目の原稿があるので(S3
13:YES)、2枚目の処理がなされる(S30
3)。2枚目の原稿、即ち原稿77に係る原稿の内容に
は、文字認識に成功した文字がないため、「パーティー
の案内」及び「パーティー会場」の文字を検索すること
はできず、即ち検索できないため(S307:NO)、
再びiがインクリメントされ、i=3となり(S31
1)、3枚目の原稿があるかRAM50で検索される
が、3枚目の原稿はないため(S313:NO)、処理
は終了する(END)。
すiが1インクリメントされi=2となって(S31
1)、i枚目、ここでは2枚目の原稿があるので(S3
13:YES)、2枚目の処理がなされる(S30
3)。2枚目の原稿、即ち原稿77に係る原稿の内容に
は、文字認識に成功した文字がないため、「パーティー
の案内」及び「パーティー会場」の文字を検索すること
はできず、即ち検索できないため(S307:NO)、
再びiがインクリメントされ、i=3となり(S31
1)、3枚目の原稿があるかRAM50で検索される
が、3枚目の原稿はないため(S313:NO)、処理
は終了する(END)。
【0054】以上のような処理の結果、1枚目の原稿で
ある原稿70の内容中の「パーティー会場」という文字
列と、2枚目の原稿である原稿77のタイトルである
「パーティー会場」という文字列が一致するためにリン
クするという情報がワークエリアに記憶される。
ある原稿70の内容中の「パーティー会場」という文字
列と、2枚目の原稿である原稿77のタイトルである
「パーティー会場」という文字列が一致するためにリン
クするという情報がワークエリアに記憶される。
【0055】そして図2のHTML文書作成(S40
0)の処理の手順に移行する。ここで図7は、図2のS
400に示されるHTML文書作成の処理の手順を詳細
に示したフローチャートである。この図7に沿って、H
TML文書作成の処理の手順を詳細に説明する。まず、
処理されるページを示すiがi=1に初期化され(S4
01)、i枚目、ここではまず1枚目の原稿について、
S405からS413の処理が行われる(S403)。
0)の処理の手順に移行する。ここで図7は、図2のS
400に示されるHTML文書作成の処理の手順を詳細
に示したフローチャートである。この図7に沿って、H
TML文書作成の処理の手順を詳細に説明する。まず、
処理されるページを示すiがi=1に初期化され(S4
01)、i枚目、ここではまず1枚目の原稿について、
S405からS413の処理が行われる(S403)。
【0056】まず、ここではハイパーテキストがHTM
Lにより記述されるので、記述の概略を説明する。HT
MLファイルは、HTMLの構造に従ってHTMLタグ
を記述したプレーンテキストファイルで、HTMLタグ
は、「<」及び「>」により囲まれた文字列で表現され
る。ここで「タグ(Tag)」というのは、HTMLに
おける各種の機能をブラウザにより発揮させるための表
示である。具体的には、まず、記述される言語がHTM
Lによるものであることを示すように、文章の最初に<
HTML>、最後に</HTML>というタグを付す
る。
Lにより記述されるので、記述の概略を説明する。HT
MLファイルは、HTMLの構造に従ってHTMLタグ
を記述したプレーンテキストファイルで、HTMLタグ
は、「<」及び「>」により囲まれた文字列で表現され
る。ここで「タグ(Tag)」というのは、HTMLに
おける各種の機能をブラウザにより発揮させるための表
示である。具体的には、まず、記述される言語がHTM
Lによるものであることを示すように、文章の最初に<
HTML>、最後に</HTML>というタグを付す
る。
【0057】次に、1枚目のタイトルが、タイトル記憶
部541から呼び出され(S405)、タイトルをヘッ
ダ部分に登録する。具体的にはヘッダ部分を表すタグ<
HEAD>を最初に、</HEAD>を最後においてヘ
ッダの表示領域であることを示し、さらにこのタグの間
にタイトルを示す<TITLE></TITLE>を生
成し、この間にタイトル記憶部541から呼び出したタ
イトルの文字列である「パーティーの案内」という文字
列を挿入し、<TITLE>パーティーの案内</TI
TLE>とする。これで、「パーティーの案内」という
文字列がタイトルとして取り扱われ、出力される画面に
は表示されず、ブラウザのウインドウのフレームにタイ
トルとして表示される。
部541から呼び出され(S405)、タイトルをヘッ
ダ部分に登録する。具体的にはヘッダ部分を表すタグ<
HEAD>を最初に、</HEAD>を最後においてヘ
ッダの表示領域であることを示し、さらにこのタグの間
にタイトルを示す<TITLE></TITLE>を生
成し、この間にタイトル記憶部541から呼び出したタ
イトルの文字列である「パーティーの案内」という文字
列を挿入し、<TITLE>パーティーの案内</TI
TLE>とする。これで、「パーティーの案内」という
文字列がタイトルとして取り扱われ、出力される画面に
は表示されず、ブラウザのウインドウのフレームにタイ
トルとして表示される。
【0058】次は、イメージ記憶領域52に格納されて
いるタイトルに関係づけられて、具体的にはタイトル
「パーティーの案内」に関係づけて記憶されているファ
イル名のイメージデータが呼び出される。同様にタイト
ル記憶領域541に格納されているタイトル「パーティ
ーの案内」に関係づけられて記憶されているファイル名
のテキストデータが呼び出される(S407)。
いるタイトルに関係づけられて、具体的にはタイトル
「パーティーの案内」に関係づけて記憶されているファ
イル名のイメージデータが呼び出される。同様にタイト
ル記憶領域541に格納されているタイトル「パーティ
ーの案内」に関係づけられて記憶されているファイル名
のテキストデータが呼び出される(S407)。
【0059】これらのデータはレイアウト記憶部542
に記憶されたレイアウト情報により、出力ページ上にレ
イアウトされるが、レイアウト情報は、読み取り段階で
の上下の位置関係を座標から読み取るが、HTMLの構
造上正確なレイアウトは再現できず、上下の並びを中心
として、画像の大きさを考慮して再配置されることにな
る(S409)。具体的には、まず、<BODY>及び
</BODY>のタグで本文の領域を定め、各データを
上から並べ、画像の大きさ、文字のポイント、余白など
の情報を、タグにより指示を行う。具体的には、例えば
改行場所では<BR>、画像の貼り付けは<IMG S
RC=”image.001”>のようにタグを自動生
成する。
に記憶されたレイアウト情報により、出力ページ上にレ
イアウトされるが、レイアウト情報は、読み取り段階で
の上下の位置関係を座標から読み取るが、HTMLの構
造上正確なレイアウトは再現できず、上下の並びを中心
として、画像の大きさを考慮して再配置されることにな
る(S409)。具体的には、まず、<BODY>及び
</BODY>のタグで本文の領域を定め、各データを
上から並べ、画像の大きさ、文字のポイント、余白など
の情報を、タグにより指示を行う。具体的には、例えば
改行場所では<BR>、画像の貼り付けは<IMG S
RC=”image.001”>のようにタグを自動生
成する。
【0060】次に、リンク情報記憶部543に格納され
たリンク情報に基づいてハイパーリンク領域を設定する
(S411)。ここでは、「パーティー会場」という文
字の部分がリンク先を示している。そこで、テキストデ
ータのうちの、この「パーティー会場」という部分を、
<A HREF=”URL”>と</A>というタグで
挟んで、リンク情報であるということを示す。なお、U
RLは、リンク先を示すもので、ここでは、リンク先が
パーティー会場の地図が表示された2枚目はURLが
「http://www.tokkyo.co.jp/taro」であるとする。従っ
て、「<A HREF=”http://www.tokkyo.co.jp/ta
ro”>パーティー会場</A>」のように表示されるよ
うに文書を自動的に生成する。
たリンク情報に基づいてハイパーリンク領域を設定する
(S411)。ここでは、「パーティー会場」という文
字の部分がリンク先を示している。そこで、テキストデ
ータのうちの、この「パーティー会場」という部分を、
<A HREF=”URL”>と</A>というタグで
挟んで、リンク情報であるということを示す。なお、U
RLは、リンク先を示すもので、ここでは、リンク先が
パーティー会場の地図が表示された2枚目はURLが
「http://www.tokkyo.co.jp/taro」であるとする。従っ
て、「<A HREF=”http://www.tokkyo.co.jp/ta
ro”>パーティー会場</A>」のように表示されるよ
うに文書を自動的に生成する。
【0061】以上のように、イメージ記憶領域52、テ
キスト記憶領域53、付加情報記憶領域54に格納され
た各情報から上記のようにHTMLのタグを自動的に配
置して、1枚目の原稿からHTML文書を自動作成し、
これをハイパーテキスト記憶領域56に記憶して出力に
備える(S413)。ここで、図8は、作成された1枚
目のHTML文書が、ブラウザにより表示された場合の
画面表示の様子を示す模式図である。また、図9は作成
された2枚目のHTML文書が、ブラウザにより表示さ
れた場合の画面表示の様子を示す模式図である。
キスト記憶領域53、付加情報記憶領域54に格納され
た各情報から上記のようにHTMLのタグを自動的に配
置して、1枚目の原稿からHTML文書を自動作成し、
これをハイパーテキスト記憶領域56に記憶して出力に
備える(S413)。ここで、図8は、作成された1枚
目のHTML文書が、ブラウザにより表示された場合の
画面表示の様子を示す模式図である。また、図9は作成
された2枚目のHTML文書が、ブラウザにより表示さ
れた場合の画面表示の様子を示す模式図である。
【0062】1枚目の処理が終了したら、処理する対象
のページを表すiを1インクリメントしてi=2として
(S415)、2枚目の原稿があるかどうか判断され
(S417)、ここでは処理すべき2枚目が存在するた
め(S417:YES)、2枚目の処理に移行する。
のページを表すiを1インクリメントしてi=2として
(S415)、2枚目の原稿があるかどうか判断され
(S417)、ここでは処理すべき2枚目が存在するた
め(S417:YES)、2枚目の処理に移行する。
【0063】2枚目も同様に処理されるが、1枚目と異
なり、本文部分には、画像が一枚だけであるので、リン
ク情報のタグの自動生成などは行われない。このように
して、2枚目も処理が終わると(S403〜S41
3)、再び処理ページを示すiがインクリメントされi
=3となるが(S415)、ここでは3枚目がないため
(S417:NO)、3枚目の原稿がないとして処理が
終了する(END)。
なり、本文部分には、画像が一枚だけであるので、リン
ク情報のタグの自動生成などは行われない。このように
して、2枚目も処理が終わると(S403〜S41
3)、再び処理ページを示すiがインクリメントされi
=3となるが(S415)、ここでは3枚目がないため
(S417:NO)、3枚目の原稿がないとして処理が
終了する(END)。
【0064】以上のような手順で、図2に示すHTML
文書生成(S400)の処理が終了し、ハイパーテキス
ト自動作成の処理が完了する。ここで、このようにして
作成されたHTML文書は、図8及び図9に示すような
状態でブラウザにより読み出される。即ち、例えば、図
8では、タイトルとして文書に記載した「パーティーの
案内」の文字は、内容としては画面表示されず、ブラウ
ザのウインドウの枠に、タイトル名として、「パーティ
ーの案内」の文字が表示されるだけである。また、各種
タグも、画面表示の種々の機能を達成させているが、画
面上ではこれらのタグは現れない。具体的には、図8に
示すリンク元出力ページ92では文字94、リンク情報
領域95と、図形96のみが表示される。この場合、リ
ンク情報領域95である「パーティー会場」の文字部分
は、他の部分と同じ表示がなされており、このままでも
マウスのポインタの変化などがあるが、HTMLの例で
は、本文部分を表す<BODY>のタグ設定で、赤であ
れば<BODY LINK=#FF0000>のように
指定してやれば、リンク領域の「パーティー会場」の部
分が赤色で表示され、リンク情報領域95であることが
わかりやすくなる。また、方法は省略するが、動きをつ
けたり、点滅させるようなことも可能である。また、図
9に示すように、リンク先出力ページ93は、図形96
のみが表示される。
文書生成(S400)の処理が終了し、ハイパーテキス
ト自動作成の処理が完了する。ここで、このようにして
作成されたHTML文書は、図8及び図9に示すような
状態でブラウザにより読み出される。即ち、例えば、図
8では、タイトルとして文書に記載した「パーティーの
案内」の文字は、内容としては画面表示されず、ブラウ
ザのウインドウの枠に、タイトル名として、「パーティ
ーの案内」の文字が表示されるだけである。また、各種
タグも、画面表示の種々の機能を達成させているが、画
面上ではこれらのタグは現れない。具体的には、図8に
示すリンク元出力ページ92では文字94、リンク情報
領域95と、図形96のみが表示される。この場合、リ
ンク情報領域95である「パーティー会場」の文字部分
は、他の部分と同じ表示がなされており、このままでも
マウスのポインタの変化などがあるが、HTMLの例で
は、本文部分を表す<BODY>のタグ設定で、赤であ
れば<BODY LINK=#FF0000>のように
指定してやれば、リンク領域の「パーティー会場」の部
分が赤色で表示され、リンク情報領域95であることが
わかりやすくなる。また、方法は省略するが、動きをつ
けたり、点滅させるようなことも可能である。また、図
9に示すように、リンク先出力ページ93は、図形96
のみが表示される。
【0065】ここで、本実施の形態のハイパーテキスト
自動作成装置1においては、フォーマット解析プログラ
ム43により図3に示すS205及びS209において
処理を実行するCPU11が、本発明のフォーマット解
析手段に相当し、この手順が本発明のフォーマット解析
の手順に相当する。
自動作成装置1においては、フォーマット解析プログラ
ム43により図3に示すS205及びS209において
処理を実行するCPU11が、本発明のフォーマット解
析手段に相当し、この手順が本発明のフォーマット解析
の手順に相当する。
【0066】また、テキスト変換プログラム44により
図3に示すS207及びS211において処理を実行す
るCPU11が、本発明の文字読み取り手段に相当し、
この手順が本発明の文字読み取りの手順に相当する。
図3に示すS207及びS211において処理を実行す
るCPU11が、本発明の文字読み取り手段に相当し、
この手順が本発明の文字読み取りの手順に相当する。
【0067】キーワード検索プログラム45により図2
に示すS300において処理を実行するCPU11が、
本発明のタイトル検索手段に相当し、この手順が本発明
のタイトル検索の手順に相当する。
に示すS300において処理を実行するCPU11が、
本発明のタイトル検索手段に相当し、この手順が本発明
のタイトル検索の手順に相当する。
【0068】ハイパーテキスト生成プログラム46によ
り図2に示すS400において処理を実行するCPU1
1が、本発明のハイパーテキスト生成手段に相当し、こ
の手順が本発明のハイパーテキスト生成の手順に相当す
る。
り図2に示すS400において処理を実行するCPU1
1が、本発明のハイパーテキスト生成手段に相当し、こ
の手順が本発明のハイパーテキスト生成の手順に相当す
る。
【0069】そして、プログラム41〜46により本実
施の形態のハイパーテキスト自動作成処理プログラムが
構成されている。
施の形態のハイパーテキスト自動作成処理プログラムが
構成されている。
【0070】なお、本実施の形態では、ハイパーテキス
ト自動作成処理プログラムはROM40に格納され、R
OM40が本発明の記録媒体に相当するが、これらのプ
ログラムは、CD−ROM、ハードディスク、フレキシ
ブルディスクや、一時的にRAMに記録されて実行され
てもよく、これらのプログラムが記録されている媒体が
それぞれ本発明のハイパーテキスト自動作成処理プログ
ラムを記録したコンピュータ読み取り可能な記録媒体に
相当する。
ト自動作成処理プログラムはROM40に格納され、R
OM40が本発明の記録媒体に相当するが、これらのプ
ログラムは、CD−ROM、ハードディスク、フレキシ
ブルディスクや、一時的にRAMに記録されて実行され
てもよく、これらのプログラムが記録されている媒体が
それぞれ本発明のハイパーテキスト自動作成処理プログ
ラムを記録したコンピュータ読み取り可能な記録媒体に
相当する。
【0071】以上説明したように、本発明の実施の形態
のハイパーテキスト自動作成装置1によれば、コンピュ
ータの操作に不案内なユーザでも、スキャナで所定の記
載をした原画像を読み込ませるだけで、なんら複雑な操
作をすることなく、リンク情報を有するハイパーテキス
トが極めて容易に作成できる。
のハイパーテキスト自動作成装置1によれば、コンピュ
ータの操作に不案内なユーザでも、スキャナで所定の記
載をした原画像を読み込ませるだけで、なんら複雑な操
作をすることなく、リンク情報を有するハイパーテキス
トが極めて容易に作成できる。
【0072】以上、一の実施の形態に基づき本発明を説
明したが、本発明は上述した実施形態に何ら限定される
ものではなく、本発明の趣旨を逸脱しない範囲で種々の
改良変更が可能であることは容易に推察できるものであ
る。
明したが、本発明は上述した実施形態に何ら限定される
ものではなく、本発明の趣旨を逸脱しない範囲で種々の
改良変更が可能であることは容易に推察できるものであ
る。
【0073】例えば、ハイパーテキストはHTMLに限
らず、他の形式によるものであってもよい。また、リン
クは、本実施の形態では説明の便宜上1枚目から2枚目
のみへのリンクとしたが、他のページと相互リンクする
ように設定してもよく、さらに複数のリンク領域から同
一ページにリンクするようにしてもよい。なお、本発明
の範囲ではないが、同一ページ内の所定場所にリンクさ
せるようなことももちろんできる。
らず、他の形式によるものであってもよい。また、リン
クは、本実施の形態では説明の便宜上1枚目から2枚目
のみへのリンクとしたが、他のページと相互リンクする
ように設定してもよく、さらに複数のリンク領域から同
一ページにリンクするようにしてもよい。なお、本発明
の範囲ではないが、同一ページ内の所定場所にリンクさ
せるようなことももちろんできる。
【0074】また、スキャナは必須の構成ではなく他の
構成でもよい。例えば、ユーザがファクシミリ装置で原
稿を送付し、このデータを直接画像データとして受け取
って、このデータに基づいてホームページの自動更新を
行うような形態でも実施ができる。
構成でもよい。例えば、ユーザがファクシミリ装置で原
稿を送付し、このデータを直接画像データとして受け取
って、このデータに基づいてホームページの自動更新を
行うような形態でも実施ができる。
【0075】ここで図10は、ユーザ情報を記載したシ
ート86を示す図である。この場合は、ユーザ情報を図
10に示すようにして、ユーザ名87、パスワード8
8、アドレス89、フォルダ90、URL91など所定
の事項を記載し、シート86をスキャナに読み込ませ、
この情報に基づいて、本装置1で作成したHTML文書
を、ホームページに自動的に送信するような方法も考え
られる。また、このようなユーザ情報を記載したシート
86をファクシミリ装置で送信し、このデータを受信し
た者が、このデータに基づいてホームページを更新する
ようなシステムとしてもよい。
ート86を示す図である。この場合は、ユーザ情報を図
10に示すようにして、ユーザ名87、パスワード8
8、アドレス89、フォルダ90、URL91など所定
の事項を記載し、シート86をスキャナに読み込ませ、
この情報に基づいて、本装置1で作成したHTML文書
を、ホームページに自動的に送信するような方法も考え
られる。また、このようなユーザ情報を記載したシート
86をファクシミリ装置で送信し、このデータを受信し
た者が、このデータに基づいてホームページを更新する
ようなシステムとしてもよい。
【0076】もっとも、このような情報は必ずしも必要
ではなく、常に更新すべきページを定めおき、これをデ
フォルト値として装置1が自動発信してホームページの
更新を行うようにすればさらに簡単にできる。
ではなく、常に更新すべきページを定めおき、これをデ
フォルト値として装置1が自動発信してホームページの
更新を行うようにすればさらに簡単にできる。
【0077】
【発明の効果】上記説明から明らかなように、請求項1
に係る発明のハイパーテキスト自動作成装置では、ペー
ジごとにつけられたタイトルを表す文字と、本文を構成
する文字若しくは図形のいずれか又はその双方のデータ
を含む複数ページからなる原稿の画像データから、タイ
トルを表す文字と、本文を構成する文字と、本文を構成
する図形とを識別して切り出すフォーマット解析手段
と、前記フォーマット解析手段により切り出された前記
タイトルを表す文字と、本文を構成する文字とを画像デ
ータからテキストデータに変換する文字読み取り手段
と、前記文字読み取り手段により読み取った本文を構成
する文字のテキストデータに、タイトルを表す文字の文
字列が含まれるかを検索するタイトル検索手段と、前記
タイトル検索手段により検索に成功した文字列を本文中
で指定することで、当該本文中のタイトルを表す文字列
と同一の文字列をタイトルとするページにリンクするリ
ンク情報を有するハイパーテキストを生成するハイパー
テキスト生成手段とを備えたことを特徴とするため、ハ
イパーテキストを作成して複数の原稿をリンクをさせた
い場合、作成者がコンピュータに不案内でハイパーテキ
ストの作成方法を詳しく知らない場合であっても、各ペ
ージの所定のタイトル入力領域にタイトルを入れて、本
文に、記載された文字部分にリンクさせたいタイトル名
を含めた原稿を作成して本装置に入力すれば、リンク情
報を備えたハイパーテキストを自動作成できるという効
果がある。
に係る発明のハイパーテキスト自動作成装置では、ペー
ジごとにつけられたタイトルを表す文字と、本文を構成
する文字若しくは図形のいずれか又はその双方のデータ
を含む複数ページからなる原稿の画像データから、タイ
トルを表す文字と、本文を構成する文字と、本文を構成
する図形とを識別して切り出すフォーマット解析手段
と、前記フォーマット解析手段により切り出された前記
タイトルを表す文字と、本文を構成する文字とを画像デ
ータからテキストデータに変換する文字読み取り手段
と、前記文字読み取り手段により読み取った本文を構成
する文字のテキストデータに、タイトルを表す文字の文
字列が含まれるかを検索するタイトル検索手段と、前記
タイトル検索手段により検索に成功した文字列を本文中
で指定することで、当該本文中のタイトルを表す文字列
と同一の文字列をタイトルとするページにリンクするリ
ンク情報を有するハイパーテキストを生成するハイパー
テキスト生成手段とを備えたことを特徴とするため、ハ
イパーテキストを作成して複数の原稿をリンクをさせた
い場合、作成者がコンピュータに不案内でハイパーテキ
ストの作成方法を詳しく知らない場合であっても、各ペ
ージの所定のタイトル入力領域にタイトルを入れて、本
文に、記載された文字部分にリンクさせたいタイトル名
を含めた原稿を作成して本装置に入力すれば、リンク情
報を備えたハイパーテキストを自動作成できるという効
果がある。
【0078】また、請求項2に係る発明のハイパーテキ
スト自動作成装置では、請求項1に記載のハイパーテキ
スト自動作成装置の効果に加え、媒体に形成された前記
原稿を読み取って前記画像データに変換する入力手段
と、前記入力手段を制御する入力制御手段とをさらに備
えたことを特徴とするため、入力装置が装置と一体に構
成されているため、入力装置に原画像を読み込ませるだ
けで、後はハイパーテキストが自動作成されるという効
果がある。
スト自動作成装置では、請求項1に記載のハイパーテキ
スト自動作成装置の効果に加え、媒体に形成された前記
原稿を読み取って前記画像データに変換する入力手段
と、前記入力手段を制御する入力制御手段とをさらに備
えたことを特徴とするため、入力装置が装置と一体に構
成されているため、入力装置に原画像を読み込ませるだ
けで、後はハイパーテキストが自動作成されるという効
果がある。
【0079】請求項3に係る発明のハイパーテキスト自
動作成装置では、請求項2に記載のハイパーテキスト自
動作成装置の効果に加え、前記入力手段は、光学式スキ
ャナ装置であることを特徴とするため、入力手段がスキ
ャナ装置であるため、作成したい原稿を紙などに印刷や
手書きで記載しさえすれば、後はスキャナで読み込ませ
るだけで、ハイパーテキストを作成できるという効果が
ある。
動作成装置では、請求項2に記載のハイパーテキスト自
動作成装置の効果に加え、前記入力手段は、光学式スキ
ャナ装置であることを特徴とするため、入力手段がスキ
ャナ装置であるため、作成したい原稿を紙などに印刷や
手書きで記載しさえすれば、後はスキャナで読み込ませ
るだけで、ハイパーテキストを作成できるという効果が
ある。
【0080】請求項4に係る発明のハイパーテキスト自
動作成処理プログラムを記録したコンピュータ読み取り
可能な記録媒体では、コンピュータに、ページごとにつ
けられたタイトルを表す文字と、本文を構成する文字若
しくは図形のいずれか又はその双方のデータを含む複数
ページからなる原稿の画像データから、タイトルを表す
文字と、本文を構成する文字と、本文を構成する図形と
を識別して切り出すフォーマット解析の手順と、前記フ
ォーマット解析の手順により切り出された前記タイトル
を表す文字と、本文を構成する文字とを画像データから
テキストデータに変換する文字読み取りの手順と、前記
文字読み取りの手順により読み取った本文を構成する文
字のテキストデータに、タイトルを表す文字の文字列が
含まれるかを検索するタイトル検索の手順と、前記タイ
トル検索の手順により検索に成功した文字列を本文中で
指定することで、当該本文中のタイトルを表す文字列と
同一の文字列をタイトルとするページにリンクするリン
ク情報を有するハイパーテキストを生成するハイパーテ
キスト生成の手順とを実行させることを特徴とするた
め、ハイパーテキストを作成して複数の原稿をリンクさ
せたい場合、作成者がコンピュータに不案内でハイパー
テキストの作成方法を詳しく知らない場合であっても、
各ページの所定のタイトル入力領域にタイトルを入れ
て、本文に、記載された文字部分にリンクさせたいタイ
トル名を含めた原稿を作成して本プログラムをコンピュ
ータに実行させればリンク情報を備えたハイパーテキス
トを自動作成できるという効果がある。
動作成処理プログラムを記録したコンピュータ読み取り
可能な記録媒体では、コンピュータに、ページごとにつ
けられたタイトルを表す文字と、本文を構成する文字若
しくは図形のいずれか又はその双方のデータを含む複数
ページからなる原稿の画像データから、タイトルを表す
文字と、本文を構成する文字と、本文を構成する図形と
を識別して切り出すフォーマット解析の手順と、前記フ
ォーマット解析の手順により切り出された前記タイトル
を表す文字と、本文を構成する文字とを画像データから
テキストデータに変換する文字読み取りの手順と、前記
文字読み取りの手順により読み取った本文を構成する文
字のテキストデータに、タイトルを表す文字の文字列が
含まれるかを検索するタイトル検索の手順と、前記タイ
トル検索の手順により検索に成功した文字列を本文中で
指定することで、当該本文中のタイトルを表す文字列と
同一の文字列をタイトルとするページにリンクするリン
ク情報を有するハイパーテキストを生成するハイパーテ
キスト生成の手順とを実行させることを特徴とするた
め、ハイパーテキストを作成して複数の原稿をリンクさ
せたい場合、作成者がコンピュータに不案内でハイパー
テキストの作成方法を詳しく知らない場合であっても、
各ページの所定のタイトル入力領域にタイトルを入れ
て、本文に、記載された文字部分にリンクさせたいタイ
トル名を含めた原稿を作成して本プログラムをコンピュ
ータに実行させればリンク情報を備えたハイパーテキス
トを自動作成できるという効果がある。
【0081】請求項5に係るハイパーテキスト自動作成
処理プログラムを記録したコンピュータ読み取り可能な
記録媒体は、請求項4に記載のハイパーテキスト自動作
成処理プログラムを記録したコンピュータ読み取り可能
な記録媒体の効果に加え、媒体に形成された前記原稿を
読み取って前記画像データに変換する入力手段を備えた
前記コンピュータに、前記入力手段を制御する入力制御
の手順をさらに実行させることを特徴とするため、入力
装置が本装置と一体に制御されるように構成されている
ため、入力装置に原画像を読み込ませるだけで、後はハ
イパーテキストが自動作成されるという効果がある。
処理プログラムを記録したコンピュータ読み取り可能な
記録媒体は、請求項4に記載のハイパーテキスト自動作
成処理プログラムを記録したコンピュータ読み取り可能
な記録媒体の効果に加え、媒体に形成された前記原稿を
読み取って前記画像データに変換する入力手段を備えた
前記コンピュータに、前記入力手段を制御する入力制御
の手順をさらに実行させることを特徴とするため、入力
装置が本装置と一体に制御されるように構成されている
ため、入力装置に原画像を読み込ませるだけで、後はハ
イパーテキストが自動作成されるという効果がある。
【図1】ハイパーテキスト自動作成装置1の構成の概略
を示すブロック図である。
を示すブロック図である。
【図2】ハイパーテキスト自動作成装置1の処理の手順
の概要を表すフローチャートである。
の概要を表すフローチャートである。
【図3】図2に示すS200のフォーマット解析・テキ
スト変換処理及びS300のキーワード検索の処理の手
順を詳細に表したフローチャートである。
スト変換処理及びS300のキーワード検索の処理の手
順を詳細に表したフローチャートである。
【図4】リンク元の原稿70を表す模式図である。
【図5】リンク先原稿77を表す模式図である。
【図6】1枚目の原稿70について、タイトル入力領域
71及び内容入力領域72においての文字及び図形の切
り出しの様子を示す模式図である。
71及び内容入力領域72においての文字及び図形の切
り出しの様子を示す模式図である。
【図7】図2のS400に示されるHTML文書作成の
処理の手順を詳細に示したフローチャートである。
処理の手順を詳細に示したフローチャートである。
【図8】作成された1枚目のHTML文書が、ブラウザ
により表示された場合の画面表示の様子を示す模式図で
ある。
により表示された場合の画面表示の様子を示す模式図で
ある。
【図9】作成された2枚目のHTML文書が、ブラウザ
により表示された場合の画面表示の様子を示す模式図で
ある。
により表示された場合の画面表示の様子を示す模式図で
ある。
【図10】ユーザ情報を記載したシート86を示す図で
ある。
ある。
1 ハイパーテキスト自動作成装置 10 制御部 11 CPU 12 入出力ポート 13 バスライン 20 入力装置 40 ROM 41 制御プログラム 42 入力データ解析プログラム 43 フォーマット解析プログラム 44 テキスト変換プログラム 45 キーワード検索プログラム 46 ハイパーテキスト生成プログラム 50 RAM 51 入力バッファ 52 イメージ記憶領域 53 テキスト記憶領域 54 付加情報記憶領域 541タイトル記憶部 542レイアウト記憶部 543リンク情報記憶部 55ワークエリア 56 ハイパーテキスト記憶領域
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 15/419 320
Claims (5)
- 【請求項1】 ページごとにつけられたタイトルを表す
文字と、本文を構成する文字若しくは図形のいずれか又
はその双方のデータを含む複数ページからなる原稿の画
像データから、タイトルを表す文字と、本文を構成する
文字と、本文を構成する図形とを識別して切り出すフォ
ーマット解析手段と、 前記フォーマット解析手段により切り出された前記タイ
トルを表す文字と、本文を構成する文字とを画像データ
からテキストデータに変換する文字読み取り手段と、 前記文字読み取り手段により読み取った本文を構成する
文字のテキストデータに、タイトルを表す文字の文字列
が含まれるかを検索するタイトル検索手段と、 前記タイトル検索手段により検索に成功した文字列を本
文中で指定することで、当該本文中のタイトルを表す文
字列と同一の文字列をタイトルとするページにリンクす
るリンク情報を有するハイパーテキストを生成するハイ
パーテキスト生成手段とを備えたことを特徴とするハイ
パーテキスト自動作成装置。 - 【請求項2】 媒体に形成された前記原稿を読み取って
前記画像データに変換する入力手段と、 前記入力手段を制御する入力制御手段とをさらに備えた
ことを特徴とする請求項1に記載のハイパーテキスト自
動作成装置。 - 【請求項3】 前記入力手段は、 光学式スキャナ装置であることを特徴とする請求項2に
記載のハイパーテキスト自動作成装置。 - 【請求項4】 コンピュータに、 ページごとにつけられたタイトルを表す文字と、本文を
構成する文字若しくは図形のいずれか又はその双方のデ
ータを含む複数ページからなる原稿の画像データから、
タイトルを表す文字と、本文を構成する文字と、本文を
構成する図形とを識別して切り出すフォーマット解析の
手順と、 前記フォーマット解析の手順により切り出された前記タ
イトルを表す文字と、本文を構成する文字とを画像デー
タからテキストデータに変換する文字読み取りの手順
と、 前記文字読み取りの手順により読み取った本文を構成す
る文字のテキストデータに、タイトルを表す文字の文字
列が含まれるかを検索するタイトル検索の手順と、 前記タイトル検索の手順により検索に成功した文字列を
本文中で指定することで、当該本文中のタイトルを表す
文字列と同一の文字列をタイトルとするページにリンク
するリンク情報を有するハイパーテキストを生成するハ
イパーテキスト生成の手順とを実行させることを特徴と
するハイパーテキスト自動作成処理プログラムを記録し
たコンピュータ読み取り可能な記録媒体。 - 【請求項5】 媒体に形成された前記原稿を読み取って
前記画像データに変換する入力手段を備えた前記コンピ
ュータに、 前記入力手段を制御する入力制御の手順をさらに実行さ
せることを特徴とする請求項4に記載のハイパーテキス
ト自動作成処理プログラムを記録したコンピュータ読み
取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10309279A JP2000137640A (ja) | 1998-10-30 | 1998-10-30 | ハイパーテキスト自動作成装置及びハイパーテキスト自動作成処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10309279A JP2000137640A (ja) | 1998-10-30 | 1998-10-30 | ハイパーテキスト自動作成装置及びハイパーテキスト自動作成処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000137640A true JP2000137640A (ja) | 2000-05-16 |
Family
ID=17991097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10309279A Pending JP2000137640A (ja) | 1998-10-30 | 1998-10-30 | ハイパーテキスト自動作成装置及びハイパーテキスト自動作成処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000137640A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002132976A (ja) * | 2000-10-23 | 2002-05-10 | Uniden Corp | ホームページ管理装置及び方法並びにホームページ評価装置及び記録媒体 |
JP2002215679A (ja) * | 2001-01-22 | 2002-08-02 | Dream Technologies Kk | ファイル中の言葉に別の情報をリンクするための装置 |
JP2003067383A (ja) * | 2001-08-23 | 2003-03-07 | Denseisha:Kk | 地理リンク情報抽出方法及び地図情報表示サービス提供方法 |
-
1998
- 1998-10-30 JP JP10309279A patent/JP2000137640A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002132976A (ja) * | 2000-10-23 | 2002-05-10 | Uniden Corp | ホームページ管理装置及び方法並びにホームページ評価装置及び記録媒体 |
JP2002215679A (ja) * | 2001-01-22 | 2002-08-02 | Dream Technologies Kk | ファイル中の言葉に別の情報をリンクするための装置 |
JP2003067383A (ja) * | 2001-08-23 | 2003-03-07 | Denseisha:Kk | 地理リンク情報抽出方法及び地図情報表示サービス提供方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4843867B2 (ja) | 文書処理装置、文書処理方法および文書処理プログラム、ならびに、記録媒体 | |
JP2862626B2 (ja) | 電子辞書及び情報検索方法 | |
US7363580B2 (en) | Intermediate address table for converting position information to an address of a link structure correlated information file on a hypertext document | |
US7715625B2 (en) | Image processing device, image processing method, and storage medium storing program therefor | |
KR100897635B1 (ko) | 문서 관리 시스템 및 그 방법과 정보 처리 장치 및 그 제어 방법 | |
JP2000222394A (ja) | 文書管理装置及びその文書管理方法並びにその制御プログラムを記録した記録媒体 | |
US20080028292A1 (en) | Techniques to facilitate reading of a document | |
JPH11213011A (ja) | コンピュータで実施する電子的に記憶された文書の注釈方法およびコンピュータプログラム製品およびコンピュータシステム | |
JPH11175527A (ja) | 出力制御装置及び出力制御方法 | |
JP2002063013A (ja) | ウェブ・ブラウザ内にグラフィカル印刷技法を取り込む方法及びシステム | |
JP2004139466A (ja) | 電子ドキュメント印刷プログラムおよび電子ドキュメント印刷システム | |
JP4094777B2 (ja) | 画像通信システム | |
JPH09222974A (ja) | 言語解釈表示方法とその方法を用いた装置およびシステム | |
EP0913779A2 (en) | Browser for documents with annotations | |
JP5188260B2 (ja) | 画像処理装置、画像処理方法ならびにそのプログラムおよび記憶媒体 | |
JP2002207727A (ja) | クライアント装置、そのプログラムを記録した記録媒体、及びそのプログラム | |
CN109445900B (zh) | 用于图片显示的翻译方法和装置 | |
JP2000137640A (ja) | ハイパーテキスト自動作成装置及びハイパーテキスト自動作成処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2006309443A (ja) | 情報処理システム、情報処理装置、情報処理端末、情報処理方法、その方法をコンピュータで実行するプログラム、および記録媒体 | |
JPH1097608A (ja) | イメージ情報の構造化文書作成装置 | |
JP2006244510A (ja) | 出力制御装置 | |
JP3122417B2 (ja) | 情報表示方法及び情報処理装置 | |
JP2010049598A (ja) | ウェブサイト作成支援装置及びウェブサイト作成支援プログラム | |
JP2003241964A (ja) | ソフトウエア保守資料生成装置および生成プログラム | |
JP4148029B2 (ja) | 文書処理装置 |