JPH10134081A - Method and device for supporting page generation - Google Patents
Method and device for supporting page generationInfo
- Publication number
- JPH10134081A JPH10134081A JP8308745A JP30874596A JPH10134081A JP H10134081 A JPH10134081 A JP H10134081A JP 8308745 A JP8308745 A JP 8308745A JP 30874596 A JP30874596 A JP 30874596A JP H10134081 A JPH10134081 A JP H10134081A
- Authority
- JP
- Japan
- Prior art keywords
- data
- area
- page
- image
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 22
- 238000006243 chemical reaction Methods 0.000 claims abstract description 11
- 238000013500 data storage Methods 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 21
- 238000001514 detection method Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 238000004891 communication Methods 0.000 abstract description 5
- 239000000463 material Substances 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 20
- 239000003086 colorant Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Landscapes
- Character Input (AREA)
- Processing Or Creating Images (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、例えば、インター
ネット上のホームページの作成作業等に好適なページ作
成支援方法及び装置に係り、特に、画像領域と文字領域
との双方を含む画像データをハイパーテキスト等のペー
ジ記述言語に効率よく変換できるようにしたページ作成
支援方法及び装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a page creation support method and apparatus suitable for creating a home page on the Internet, for example, and more particularly, to a method for converting image data including both image areas and character areas into hypertext. The present invention relates to a page creation support method and apparatus capable of efficiently converting to a page description language such as.
【0002】[0002]
【従来の技術】従来、この種のページ作成支援装置とし
ては、ワープロで作成された電子ファイルをハイパーテ
キスト等のページ記述言語に変換する装置、画像入力装
置から読み込まれる画像をページに張り付けたりする装
置、さらには、関連するキーワードに手作業でリンクを
張るようにした装置(ハイパーメディア型文書管理アプ
リケーションを効率よく開発するためのソフトウェア基
盤:東京電力株式会社・技術開発本部・システム研究所
・情報研究室)等が知られている。2. Description of the Related Art Conventionally, as this kind of page creation support device, a device for converting an electronic file created by a word processor into a page description language such as hypertext, and an image read from an image input device are pasted on a page. Devices, and devices that manually link related keywords (Software base for efficiently developing hypermedia type document management applications: Tokyo Electric Power Company, Technology Development Division, System Research Institute, Information Labs) are known.
【0003】[0003]
【発明が解決しようとする課題】このような従来のペー
ジ作成支援装置は、(1)画像入力装置から読み込んだ
画像をそのまま画像データとして扱う方式のものと、
(2)文字の部分だけをOCR等で読み込ませてテキス
トデータに変換し、画像については別に入力して後でテ
キストデータと画像データを編集する方式のものとに大
別される。Such a conventional page creation support device includes (1) a system for directly handling an image read from an image input device as image data;
(2) Only the character portion is read by OCR or the like and converted into text data, and the image is roughly classified into a text data type and an image data type editing method which are input later.
【0004】しかしながら、上記の(1)の場合にあっ
ては、画像データとして扱うことからデータ量が膨大な
ものとなり、通信を使ってデータを転送するシステムに
おいては、通信時間がかかり過ぎるという問題点があ
る。However, in the case of the above (1), since the data is handled as image data, the amount of data becomes enormous, and in a system for transferring data using communication, the communication time is too long. There is a point.
【0005】また、上記の(2)の場合にあっては、画
像と文字列を別々に入力することから、後で編集(割付
など)する手間がかかり過ぎると言う問題点がある。[0005] In the case of the above (2), since the image and the character string are separately input, there is a problem that it takes too much time to edit (assign, etc.) later.
【0006】この発明は、従来のページ作成支援装置に
おける問題点に鑑みてなされてものであり、その目的と
するところは、画像領域と文字領域とを含む画像データ
を、煩雑な編集作業等を要することなく、比較的にデー
タ量の少ないページデータ(インターネット上のホーム
ページ、ワープロデータ、DTPデータ等)に変換でき
るようにしたページ作成支援方法及び装置を提供するこ
とにある。SUMMARY OF THE INVENTION The present invention has been made in view of the problems of the conventional page creation support apparatus, and has as its object to perform complicated editing work and the like on image data including an image area and a character area. It is an object of the present invention to provide a page creation supporting method and apparatus which can be converted into page data having a relatively small data amount (a homepage on the Internet, word processing data, DTP data, etc.) without need.
【0007】[0007]
【課題を解決するための手段】この出願の請求項1に記
載の発明は、画像入力装置から取り込んだ画像を記憶す
る入力画像データ記憶手段と、前記記憶された入力画像
の画像領域と文字領域とをそれぞれ認識し、それらの領
域のデータを切り出す領域認識手段と、前記切り出され
た文字領域に含まれる文字情報をテキストデータに変換
するテキストデータ変換手段と、前記切り出された画像
データと変換したテキストデータとからページデータを
生成するページデータ生成手段と、を具備することを特
徴とするページ作成支援装置にある。According to a first aspect of the present invention, there is provided an input image data storing means for storing an image captured from an image input device, an image area and a character area of the stored input image. Respectively, and an area recognizing unit that cuts out data of those areas, a text data converting unit that converts character information included in the cut-out character area into text data, and the cut-out image data is converted. Page data generating means for generating page data from text data.
【0008】そして、この請求項1に記載の発明によれ
ば、ペーパーベースの資料を容易に変換・編集できる
こと、読み込んだ画像情報をそのまま使用する場合に
比べて、データの量が少なくなり、通信などで転送する
場合に処理が早く終わること、テキストデータに変換
することで、きれいなフォントを利用できるので、表示
がきれいになること、テキストデータに変換すること
で、修正が容易に行えるようになること、と言った効果
が得られる。According to the first aspect of the present invention, paper-based materials can be easily converted and edited, and the amount of data can be reduced as compared with a case where read image information is used as it is, and When the data is transferred by, for example, the processing is completed quickly, by converting to text data, a beautiful font can be used, so that the display becomes clearer, and by converting to text data, it can be easily corrected. The effect described above can be obtained.
【0009】この出願の請求項2に記載の発明は、前記
生成されたページデータを複数記憶するだけの記憶容量
を有するページデータ記憶手段と、ユーザにより入力さ
れたか、若しくは、データペースに記憶されているキー
ワード、若しくは、タイトルにマッチングする文字列
を、前記ページデータ記憶手段に格納されたページデー
タから検出するキーワード・タイトル検出手段と、前記
検出されたキーワード或いはタイトルに関連するページ
データ同士をリンクさせるリンク手段と、を具備するこ
とを特徴とする請求項1に記載のページ作成支援装置に
ある。According to a second aspect of the present invention, there is provided a page data storage means having a storage capacity sufficient to store a plurality of the generated page data, and a page data input by a user or stored at a data pace. A keyword / title detecting means for detecting a keyword or a character string matching the title from the page data stored in the page data storing means, and linking the page data related to the detected keyword or title with each other. 2. A page creation support apparatus according to claim 1, further comprising: link means for making the page creation support.
【0010】そして、この請求項2に記載の発明によれ
ば、データベースに格納されているデータと自動的に
リンクさせる機能、並びに、複数のページを作成した
場合にそれらのページ間に自動的にリンクを張る機能を
実現して、それらの間にリンクを張る手間を大幅に軽減
することができる。According to the second aspect of the present invention, a function of automatically linking to data stored in a database, and, when a plurality of pages are created, automatically between the pages The function of linking can be realized, and the trouble of linking between them can be greatly reduced.
【0011】この出願の請求項3に記載の発明は、前記
領域認識部は、入力画像データを一定サイズのブロック
でサーチしつつ、そのブロック内の画像特徴量を算出す
る入力画像サーチ手段と、前記算出された特徴量に基づ
いてファジイ推論を実行することにより、その領域が画
像領域であるか若しくは文字領域であるかを判断する領
域推論手段と、画像領域と判断された領域と文字領域と
判断された領域とを元の入力画像データから切り出す領
域切り出し手段と、前記切り出された画像データを領域
別に格納する領域別データ記憶手段と、を具備すること
を特徴とする請求項1若しくは請求項2に記載のページ
作成支援装置にある。According to a third aspect of the present invention, the area recognizing section searches for input image data in a block of a fixed size and calculates an image feature amount in the block. By performing fuzzy inference based on the calculated feature amount, area inference means for determining whether the area is an image area or a character area, and an area determined to be an image area and a character area 2. The apparatus according to claim 1, further comprising: an area extracting unit that extracts the determined area from the original input image data; and an area data storage unit that stores the extracted image data for each area. 2 in the page creation support device.
【0012】そして、この請求項3に記載の発明によれ
ば、画像領域と文字領域とを的確に判定することができ
る。According to the third aspect of the present invention, the image area and the character area can be accurately determined.
【0013】この出願の請求項4に記載の発明は、前記
ページデータ生成部は、前記切り出された各領域のデー
タに付属する位置情報を読み出し、その位置情報に従っ
て一定の順序で領域データをソートする位置情報読み出
し手段と、前記ソートされた領域データのそれぞれにペ
ージ記述言語を付加して配置するページデータ付加手段
と、を具備することを特徴とする請求項1若しくは請求
項2に記載のページ作成支援装置にある。In the invention described in claim 4 of the present application, the page data generating section reads out position information attached to the data of each of the cut-out areas, and sorts the area data in a predetermined order according to the position information. 3. The page according to claim 1, further comprising: a position information reading unit that performs the reading operation, and a page data adding unit that adds a page description language to each of the sorted area data and arranges them. It is in the creation support device.
【0014】そして、この請求項4に記載の発明によれ
ば、元の画像データのレイアウトを的確に再現すること
ができる。According to the invention described in claim 4, the layout of the original image data can be accurately reproduced.
【0015】この出願の請求項5に記載の発明は、前記
ページデータ生成部は、画像データとテキストデータと
を割り付ける位置を、テンプレートに従って割り付ける
ことを特徴とする請求項1若しくは請求項2に記載のペ
ージ作成支援装置にある。According to a fifth aspect of the present invention, in the first or second aspect, the page data generation unit allocates positions at which image data and text data are allocated according to a template. Page creation support device.
【0016】そして、この請求項5に記載の発明によれ
ば、元の画像データのレイアウトを簡単な処理で的確に
再現することができる。According to the invention described in claim 5, the layout of the original image data can be accurately reproduced by simple processing.
【0017】この出願の請求項6に記載の発明は、画像
入力装置から取り込んだ画像を記憶媒体に記憶する入力
画像データ記憶ステップと、前記記憶された入力画像の
画像領域と文字領域とをそれぞれ認識し、それらの領域
のデータを切り出す領域認識ステップと、前記切り出さ
れた文字領域に含まれる文字情報をテキストデータに変
換するテキストデータ変換ステップと、前記切り出され
た画像データと変換したテキストデータとからページデ
ータを生成するページデータ生成ステップと、を具備す
ることを特徴とするページ作成支援方法にある。According to a sixth aspect of the present invention, there is provided an input image data storing step of storing an image fetched from an image input device in a storage medium, and storing an image area and a character area of the stored input image, respectively. Recognizing, an area recognition step of cutting out data of those areas, a text data conversion step of converting character information included in the cut-out character area into text data, and the cut-out image data and the converted text data. And a page data generating step of generating page data from the page.
【0018】この出願の請求項7に記載の発明は、前記
生成されたページデータを複数記憶させるページデータ
記憶ステップと、ユーザにより入力されたか、若しく
は、データペースに記憶されているキーワード、若しく
は、タイトルにマッチングする文字列を、前記ページデ
ータ記憶ステップにて格納されたページデータから検出
するキーワード・タイトル検出ステップと、前記検出さ
れたキーワード或いはタイトルに関連するページデータ
同士をリンクさせるリンクステップと、を具備すること
を特徴とする請求項1に記載のページ作成支援方法にあ
る。According to a seventh aspect of the present invention, there is provided a page data storing step of storing a plurality of the generated page data, a keyword input by a user or stored in a data pace, or A keyword / title detection step of detecting a character string matching a title from the page data stored in the page data storage step, and a link step of linking page data related to the detected keyword or title with each other; 2. The page creation support method according to claim 1, further comprising:
【0019】この出願の請求項8に記載の発明は、前記
領域認識部は、入力画像データを一定サイズのブロック
でサーチしつつ、そのブロック内の画像特徴量を算出す
る入力画像サーチステップと、前記算出された特徴量に
基づいてファジイ推論を実行することにより、その領域
が画像領域であるか若しくは文字領域であるかを判断す
る領域推論ステップと、画像領域と判断された領域と文
字領域と判断された領域とを元の入力画像データから切
り出す領域切り出しステップと、前記切り出された画像
データを領域別に格納する領域別データ記憶ステップ
と、を具備することを特徴とする請求項1若しくは請求
項2に記載のページ作成支援方法にある。According to an eighth aspect of the present invention, in the input image search step, the area recognizing section searches input image data in blocks of a fixed size and calculates an image feature amount in the blocks. By performing fuzzy inference based on the calculated feature amount, an area inference step of determining whether the area is an image area or a character area, and an area determined to be an image area and a character area 2. The method according to claim 1, further comprising: an area extracting step of extracting the determined area from the original input image data; and an area data storing step of storing the extracted image data for each area. The method is described in page 2 above.
【0020】この出願の請求項9に記載の発明は、前記
ページデータ生成部は、前記切り出された各領域のデー
タに付属する位置情報を読み出し、その位置情報に従っ
て一定の順序で領域データをソートする位置情報読み出
しステップと、前記ソートされた領域データのそれぞれ
にページ記述言語を付加して配置するページデータ付加
ステップと、を具備することを特徴とする請求項1若し
くは請求項2に記載のページ作成支援方法にある。According to a ninth aspect of the present invention, the page data generator reads out position information attached to the data of each of the cut-out areas, and sorts the area data in a predetermined order according to the position information. 3. The page according to claim 1, further comprising: a position information reading step for performing the setting, and a page data adding step for adding and arranging a page description language to each of the sorted area data. In the creation support method.
【0021】この出願の請求項10に記載の発明は、前
記ページデータ生成部は、画像データとテキストデータ
とを割り付ける位置を、テンプレートに従って割り付け
ることを特徴とする請求項1若しくは請求項2に記載の
ページ作成支援方法にある。The invention according to claim 10 of the present application is characterized in that the page data generation unit allocates a position at which image data and text data are allocated according to a template. Page creation support method.
【0022】[0022]
【発明の実施の形態】以下、この発明の好ましい実施の
形態につき、添付図面を参照して詳細に説明する。Preferred embodiments of the present invention will be described below in detail with reference to the accompanying drawings.
【0023】本発明に係るページ作成支援装置の実施の
一形態の構成を図1のブロック図に示す。同図に示され
るように、このページ作成支援装置は、入力画像データ
記憶部1と、領域認識部2と、テキストデータ変換部3
と、ページデータ生成部4とから構成されている。FIG. 1 is a block diagram showing the configuration of an embodiment of the page creation support apparatus according to the present invention. As shown in FIG. 1, the page creation support device includes an input image data storage unit 1, an area recognition unit 2, a text data conversion unit 3,
And a page data generation unit 4.
【0024】入力画像データ記憶部1は、イメージスキ
ャナ、デジタルカメラ、ビデオカメラ等の画像入力装置
から入力された画像データを記憶する機能を有するもの
であり、具体的には、半導体メモリやハードディスク等
の大容量記憶媒体により構成されている。なお、この入
力画像記憶部1には、画像の再入力や複数の入力画像を
使用したページの結合等が容易にできるように、複数の
画像を記憶できる記憶容量が確保されている。The input image data storage section 1 has a function of storing image data input from an image input device such as an image scanner, a digital camera, a video camera or the like. Of large-capacity storage media. Note that the input image storage unit 1 has a storage capacity capable of storing a plurality of images so that re-input of an image or combination of pages using a plurality of input images can be easily performed.
【0025】領域認識部2は、入力された画像データの
中で、どの部分が画像領域であり、またどの部分が文字
領域であるかを認識する機能を有するものである。この
領域認識部2の詳細が図2に示されている。The area recognizing section 2 has a function of recognizing which part of the input image data is an image area and which part is a character area. The details of the area recognition unit 2 are shown in FIG.
【0026】同図に示されるように、この領域認識部2
は、入力画像サーチ部21と、領域推論部22と、領域
切り出し部23と、領域別データ記憶部24とから構成
されている。As shown in FIG.
Comprises an input image search unit 21, an area inference unit 22, an area cutout unit 23, and an area-specific data storage unit 24.
【0027】入力画像サーチ部21は、入力画像の特徴
量を算出する機能を有するものである。この特徴量算出
処理は、例えば、図3に示されるように、入力画像を一
定のブロック(16×16画素)でサーチし、そのブロ
ック内の『色数』、『明るさ』、『コントラスト』等を
算出すること等により行われる。このとき、サーチする
ブロックの大きさは、ユーザが指定するようにして、領
域の認識精度を調整するようにしても良い。The input image search section 21 has a function of calculating the feature amount of the input image. In this feature amount calculation processing, for example, as shown in FIG. 3, an input image is searched for in a fixed block (16 × 16 pixels), and “number of colors”, “brightness”, and “contrast” in the block are searched. And so on. At this time, the size of the block to be searched may be specified by the user, and the recognition accuracy of the area may be adjusted.
【0028】領域推論部22は、前記算出された入力画
像の特徴量に基づいて、そのブロック領域が画像領域で
あるか文字領域であるかを推論により判断する機能を有
するものである。この領域判断にファジイ推論を採用す
る場合、例えば、次のようなルール(1)〜(3)が適
用される([表1]参照)。The area inference unit 22 has a function of determining by inference whether the block area is an image area or a character area based on the calculated feature amount of the input image. When fuzzy inference is adopted for this area determination, for example, the following rules (1) to (3) are applied (see [Table 1]).
【0029】[0029]
【表1】 表−1 [ルール] (1) IF ブロックの色数=少ない AND 明るさ=明るい THEN 文字領域 (2) IF ブロックの色数=多い THEN 画像領域 (3) IF ブロックのコントラスト=高い THEN 文字領域[Table 1] [Rules] (1) Number of IF block colors = small AND Brightness = bright THEN character area (2) Number of IF block colors = large THEN image area (3) IF block contrast = high THEN character area
【0030】続いて、領域推論部22は、図4に示され
るように、各ブロック毎に画像領域か文字領域かが決ま
れば、隣接する同一領域のグループ同士を結合して、よ
り大きなブロック領域を生成する。Subsequently, as shown in FIG. 4, when the image area or the character area is determined for each block, the area inference unit 22 combines adjacent groups of the same area to form a larger block area. Generate
【0031】領域切り出し部23は、画像領域と判断さ
れた領域と文字領域と判断された領域とを、もとの入力
画像データから切り出す機能を有するものである。切り
出す際には、その領域の位置(左上の座標、領域の幅、
領域の長さ)を記憶しておく。これは、後述するページ
データ生成部4において、画像データとテキストデータ
とを並び替えるために使用される。The area extracting section 23 has a function of extracting an area determined as an image area and an area determined as a character area from original input image data. When cutting out, the position of the area (upper left coordinates, area width,
Area length) is stored. This is used in the page data generation unit 4 described later to rearrange the image data and the text data.
【0032】領域別データ記憶部24は、前記切り出さ
れたデータをメモり又はファイルに記憶する機能を有す
るものである。画像データをファイルに記憶する場合に
は、それらの画像データは、JPG、BMP等の一般的
な公知の画像データのフォーマットで格納される。The area-specific data storage section 24 has a function of storing the cut-out data in a memory or a file. When image data is stored in a file, the image data is stored in a general known image data format such as JPG or BMP.
【0033】図1に戻って、テキストデータ変換部3
は、領域認識部2で文字の領域が認識された場合に、そ
の領域の文字をテキストデータに変換する機能を有する
ものである。すなわち、文字領域であると認識された領
域は、OCR等の文字認識技術によりキャラクタに変換
される。Returning to FIG. 1, the text data converter 3
Has a function of converting a character in the area into text data when the area of the character is recognized by the area recognition unit 2. That is, the area recognized as a character area is converted into a character by a character recognition technique such as OCR.
【0034】ページデータ生成部4は、前記の過程を経
て切り出された画像データやテキストデータを、ハイパ
ーテキスト等のページに表示するためのページ記述言語
に変換する機能を有するものである。ページデータ生成
部4の詳細が図5に示されている。The page data generation section 4 has a function of converting the image data and text data cut out through the above-described process into a page description language for displaying on a page such as a hypertext. FIG. 5 shows the details of the page data generator 4.
【0035】同図に示されるように、ページデータ生成
部4は、位置情報読み出し部41と、ページデータ付加
部42と、出力部43とから構成されている。As shown in FIG. 2, the page data generating section 4 includes a position information reading section 41, a page data adding section 42, and an output section 43.
【0036】位置情報読み出し部41は、切り出された
領域に付属する位置情報を読み出し、その位置情報に基
づいて、切り出された各領域のデータを縦座標値の小さ
い順にソートする機能を有するものである。The position information reading section 41 has a function of reading the position information attached to the cut area and sorting the data of each cut area in ascending order of the ordinate value based on the position information. is there.
【0037】ページデータ付加部42は、上記でソート
された各領域のデータにページ記述言語を付加して、画
像データ並びにテキストデータを配置する機能を有する
ものである。The page data adding section 42 has a function of adding a page description language to the data of each area sorted as described above and arranging image data and text data.
【0038】出力部43は、以上で生成されたページデ
ータを該当するファイルへと出力する機能を有するので
ある。The output unit 43 has a function of outputting the page data generated as described above to a corresponding file.
【0039】次に、以上の構成よりなるページ作成支援
装置の作用を図6のフローチャート、図7及び図8の画
面説明図、並びに、図9のページ出力例を参照して順次
系統的に説明する。Next, the operation of the page creation support apparatus having the above configuration will be sequentially and systematically described with reference to the flowchart of FIG. 6, the screen explanatory diagrams of FIGS. 7 and 8, and the page output example of FIG. I do.
【0040】今仮に、入力画像データ記憶部1(図1参
照)には、図7に示されるような画像領域と文字領域と
を併有する画像データが記憶されているものと想定す
る。なお、前述したように、この画像データは、例え
ば、イメージスキャナ、デジタルカメラ、ビデオカメラ
等から入力されたものである。It is now assumed that the input image data storage unit 1 (see FIG. 1) stores image data having both an image area and a character area as shown in FIG. Note that, as described above, the image data is input from, for example, an image scanner, a digital camera, a video camera, or the like.
【0041】この状態において、図6に示される処理が
開始されると、入力された画像データの中で、どの部分
が画像領域で、どの部分が文字領域かの判断が行われる
(ステップ601)。先に説明したように、この領域認
識処理(ステップ601)は、領域認識部2(図1参
照)を構成する入力画像サーチ部21並びに領域推論部
22(図2参照)の作動により行われる。In this state, when the processing shown in FIG. 6 is started, it is determined which part of the input image data is an image area and which part is a character area (step 601). . As described above, this region recognition processing (step 601) is performed by the operation of the input image search unit 21 and the region inference unit 22 (see FIG. 2) constituting the region recognition unit 2 (see FIG. 1).
【0042】図7に示される画像データに対して領域認
識処理(ステップ601)を施した結果の一例を図8に
示す。同図に示されるように、この例では、与えられた
画像データの中から、画面上部約左半分に描かれた『画
像領域1』(sample1.jpg)と、画面上部約右半分に描
かれた『文字領域1』と、画面下部中央の水平方向に細
長い『画像領域2』(sample2.jpg)と、画面最下部約
左半分の水平方向に細長い『文字領域2』とが領域認識
されている。FIG. 8 shows an example of the result of performing the area recognition process (step 601) on the image data shown in FIG. As shown in the figure, in this example, from the given image data, “image area 1” (sample1.jpg) drawn in the upper left half of the screen, and drawn in the upper right half of the screen. The "character area 1", "image area 2" (sample2.jpg) horizontally elongated in the center of the lower part of the screen, and "character area 2" horizontally elongated in the lower left half of the screen are recognized. I have.
【0043】その後、画像領域の存否並びに文字領域の
存否が判定され(ステップ602,604)、画像領域
が存在すると判定される場合には(ステップ602YE
S)、当該画像領域の切り出しファイル化が行われ(ス
テップ603)、また文字領域が存在すると判定される
場合には(ステップ604YES)、テキスト変換処理
が行われる(ステップ606)。先に説明したように、
この画像切り出し処理(ステップ603,605)並び
にテキスト変換処理(ステップ606)は、領域認識部
2(図1参照)を構成する領域切り出し部23並びにテ
キストデータ変換部3(図3参照)の作動により行われ
る。Thereafter, the presence or absence of an image area and the presence of a character area are determined (steps 602 and 604), and if it is determined that an image area exists (step 602YE).
S), the image area is converted into a cut-out file (step 603), and if it is determined that a character area exists (step 604 YES), a text conversion process is performed (step 606). As explained earlier,
The image cutout processing (steps 603 and 605) and the text conversion processing (step 606) are performed by the operation of the area cutout unit 23 and the text data conversion unit 3 (see FIG. 3) constituting the area recognition unit 2 (see FIG. 1). Done.
【0044】その後、上で得られた画像ファイル(図8
の『画像領域1』、『画像領域2』に相当)並びにテキ
ストファイル(図8の『文字領域1』、『文字領域2』
に相当)は、ページ記述言語化処理(ステップ607)
の実行により、ハイパーテキスト等のページ記述言語に
変換される。先に説明したように、このページ記述言語
化処理(ステップ607)は、ページデータ生成部4
(図1参照)を構成する位置情報読み出し部41、ペー
ジデータ付加部42、並びに、出力部43(図5参照)
の作動により行われる。Thereafter, the image file obtained above (FIG. 8)
8 corresponds to “image area 1” and “image area 2”) and text files (“character area 1” and “character area 2” in FIG. 8).
) Is a page description language conversion process (step 607).
Is converted to a page description language such as hypertext. As described above, this page description linguistic processing (step 607) is performed by the page data generation unit 4
(See FIG. 1), a position information reading unit 41, a page data adding unit 42, and an output unit 43 (see FIG. 5).
Is performed by the operation of.
【0045】図8に示される領域分割された画像データ
に対して、ページ記述言語化処理(ステップ607)を
施した結果として得られたページデータの一例を図9に
示す。このページデータの内容は、以下の3つの部分
(1)〜(3)に分かれている。FIG. 9 shows an example of page data obtained as a result of performing the page description linguistic processing (step 607) on the image data obtained by dividing the region shown in FIG. The content of this page data is divided into the following three parts (1) to (3).
【0046】(1)ヘッダ部 ページ言語の始まりを示す。ページデータの先頭に付加
されている。(1) Header section Indicates the beginning of the page language. It is added to the top of the page data.
【0047】(2)本体部 座標位置の順番に従って生成される。縦座標値の一番小
さいものから順に、『画像領域1』、『文字領域1』、
『画像領域2』、『文字領域2』の順で、ページ記述言
語が付加されることとなる。このとき、画像領域並びに
文字領域に対する処理は次のようになる。(2) Main part Generated in accordance with the order of the coordinate positions. “Image area 1”, “Character area 1”,
The page description language is added in the order of “image area 2” and “character area 2”. At this time, the processing for the image area and the character area is as follows.
【0048】画像領域の場合:画像ファイルにリンク
を張る。In the case of an image area: a link is provided to an image file.
【0049】<IMG SRC=”画像ファイル名”> 文字領域の場合:変換した文字列を並べる。<IMG SRC = “image file name”> In the case of a character area: The converted character strings are arranged.
【0050】(3)フッダ部 ページ言語の終わりを示す。ページデータの最後に付加
する。(3) Footer section Indicates the end of the page language. Append to the end of page data.
【0051】以上説明した本発明に係るページ作成支援
装置の実施の一形態によれば、画像入力装置(イメージ
スキャナ、デジタルカメラ等)から取り込んだ画像を記
憶する入力画像データ記憶部1と、入力画像の画像領域
と文字領域とをそれぞれ認識し、それらの領域のデータ
を切り出す領域認識部2と、切り出した文字領域に含ま
れる文字情報をテキストデータに変換するテキストデー
タ変換部3と、切り出した画像データと変換したテキス
トデータとからページデータを生成するページデータ生
成部4とからなるものであるから、ペーパーベースの
資料を容易に変換・編集できること、読み込んだ画像
情報をそのまま使用する場合に比べて、データの量が少
なくなり、通信などで転送する場合に処理が早く終わる
こと、テキストデータに変換することで、きれいなフ
ォントを利用できるので、表示がきれいになること、
テキストデータに変換することで、修正が容易に行える
ようになること、と言った効果が得られることとなる。According to the embodiment of the page creation support apparatus according to the present invention described above, an input image data storage unit 1 for storing an image taken from an image input device (image scanner, digital camera, etc.), An area recognizing unit 2 for recognizing an image area and a character area of an image, and extracting data of those areas; a text data converting unit 3 for converting character information included in the extracted character area into text data; Since it consists of a page data generation unit 4 that generates page data from image data and converted text data, it is easy to convert and edit paper-based materials, compared to the case where read image information is used as it is. The amount of data is reduced, and processing is completed quickly when transferring data via communication, etc. By conversion, it is possible to use a beautiful font, the display is clean,
By converting the data into text data, the effect that correction can be easily performed can be obtained.
【0052】なお、以上の実施の一形態においては、文
字領域と画像領域とを格別に認識するために、入力画像
サーチ部21並びに領域推論部22を使用しているが、
これに代えて、例えば特開平05−14701号公報に
示されるように、イメージスキャナ等の有する領域認識
機能を利用しても良いことは勿論である。In the above-described embodiment, the input image search unit 21 and the region inference unit 22 are used to specifically recognize the character region and the image region.
Instead, for example, as shown in Japanese Patent Application Laid-Open No. 05-14701, an area recognition function of an image scanner or the like may be used.
【0053】また、以上の実施の一形態においては、文
字領域と画像領域とを完全自動認識させるようにしてい
るが、図10に示されるように、領域認識部2(図1参
照)の代わりに、画像表示・領域指定部5を設け、これ
により画像を取り込んで、人手による領域指定を行える
ようにしても良く、更には、図11に示されるように、
画像表示・領域指定部5を新たに設け、領域認識部1で
認識した画像を一旦画像表示・領域指定部5で表示し、
表示した画像の上で人手により領域の修正・入力を行え
るようにしても良い。Further, in the above embodiment, the character area and the image area are completely automatically recognized. However, as shown in FIG. 10, instead of the area recognition unit 2 (see FIG. 1), In addition, an image display / area designation unit 5 may be provided so that an image can be fetched and the area designation can be manually performed. Further, as shown in FIG.
An image display / area specifying unit 5 is newly provided, and the image recognized by the area recognizing unit 1 is temporarily displayed by the image display / area specifying unit 5,
The region may be corrected and input manually on the displayed image.
【0054】また、以上の実施の一形態においては、切
り出された画像に付された位置情報を使用して各画像の
割付を行っているが、図12に示されるように、テンプ
レート記憶部6を新たに設け、画像データとテキストデ
ータを割り付ける位置をテンプレートに従って決定する
ようにしても良い。Further, in the above embodiment, the allocation of each image is performed by using the position information attached to the cut-out image. However, as shown in FIG. May be newly provided, and the position at which the image data and the text data are allocated may be determined according to the template.
【0055】次に、本発明に係るページ作成支援装置の
さらに別の実施の形態を図13〜図18を参照して説明
する。この実施の形態においては、先の例で説明された
ページ作成支援装置100の出力側に新たにページリン
ク部7が設けられており、これにより、データベース
に格納されているデータと自動的にリンクさせる機能、
並びに、複数のページを作成した場合にそれらのペー
ジ間に自動的にリンクを張る機能を実現して、それらの
間にリンクを張る手間を大幅に軽減している。Next, still another embodiment of the page creation support device according to the present invention will be described with reference to FIGS. In this embodiment, a new page link unit 7 is provided on the output side of the page creation support device 100 described in the previous example, whereby the data stored in the database is automatically linked. Function,
In addition, when a plurality of pages are created, a function of automatically linking the pages is realized, thereby greatly reducing the trouble of linking the pages.
【0056】ページリンク部7の一例が図13に詳細に
示されている。同図に示されように、このページリンク
部7は、ページデータ記憶部71と、キーワード・リン
クデータ72と、キーワード・タイトル検出部73と、
リンク部74とから構成されている。One example of the page link section 7 is shown in detail in FIG. As shown in the figure, the page link unit 7 includes a page data storage unit 71, keyword / link data 72, a keyword / title detection unit 73,
And a link unit 74.
【0057】ページデータ記憶部71には、ページ作成
支援装置100で作成されたページデータを記憶する機
能を有するものである。特に、このページデータ記憶部
71には、ページデータが複数個だけ記憶できる記憶容
量が確保されている。The page data storage unit 71 has a function of storing page data created by the page creation support apparatus 100. In particular, the page data storage unit 71 has a storage capacity capable of storing only a plurality of page data.
【0058】キーワード・リンクデータ・データベース
(DB)72には、よく利用されるキーワードとそのリ
ンクデータとが格納されている。キーワード・リンクデ
ータ・データベース(DB)72の一例が図14に示さ
れている。この例では、キーワード(連絡網、電話等)
とリンク先データの実体、或いは、リンク先アドレス/
ファイル名(連絡.HTML、電話.HTML等)とが
対となって記憶されている。The keyword link data database (DB) 72 stores frequently used keywords and their link data. One example of the keyword link data database (DB) 72 is shown in FIG. In this example, keywords (contact network, telephone, etc.)
And the entity of the link destination data, or the link destination address /
File names (contact.HTML, telephone.HTML, etc.) are stored in pairs.
【0059】キーワード・タイトル検出部73は、ユー
ザが入力したキーワード或いはデータベース72に記憶
されているキーワードにマッチする文字列を、ページデ
ータ記憶部71に格納されているデータから検出する機
能を有するものである。また、このキーワード・タイト
ル検出部73では、ページのタイトルとその文字列も同
時に検出するようになっている。The keyword / title detecting section 73 has a function of detecting, from the data stored in the page data storage section 71, a character string that matches a keyword input by the user or a keyword stored in the database 72. It is. In addition, the keyword / title detecting section 73 detects a page title and its character string at the same time.
【0060】リンク部74は、検出したキーワード或い
はタイトルに関連するデータをリンクさせる機能を有す
るものである。The link section 74 has a function of linking data related to the detected keyword or title.
【0061】次に、以上の構成よりなるページリンク部
7を備えたページ作成支援装置の作用を、図15〜図1
8の説明図を参照して説明する。Next, the operation of the page creation support device provided with the page link unit 7 having the above configuration will be described with reference to FIGS.
8 will be described with reference to FIG.
【0062】第1のステップとして、先ず、ページデー
タ作成支援装置100から出力されたページデータは、
そのまま、ページデータ記憶部81に格納される。今仮
に、図15並びに図16に示される2ページのページデ
ータ(『ページデータ1(スポーツ大会.HTML)』、
『ページデータ2(催し物紹介.HTML)』)がページ作
成支援装置100にて作成され、これらがそのままペー
ジデータ記憶部81に格納されているものと想定する。As a first step, first, the page data output from the page data creation support device 100 is
It is stored in the page data storage unit 81 as it is. Suppose now that the page data of two pages shown in FIGS. 15 and 16 (“page data 1 (sports tournament.HTML)”,
It is assumed that “page data 2 (entertainment introduction. HTML)” is created by the page creation support device 100 and these are stored in the page data storage unit 81 as they are.
【0063】第2のステップとして、キーワード・タイ
トル検出部83は、キーワード・リンクデータDB83
に格納されているキーワードを、ページデータ記憶部8
1に格納されているページデータから検出する。同時
に、タイトルの文字列が、それ以外のページデータに含
まれている場合は、その文字列を検出する。As a second step, the keyword / title data detecting unit 83 sends the keyword / link data DB 83
The keyword stored in the page data storage unit 8
1 is detected from the page data stored. At the same time, when the character string of the title is included in other page data, the character string is detected.
【0064】第3のステップとして、リンク部84は、
キーワードとマッチする文字列が存在する場合には、そ
のキーワードにキーワード・リンクデータDB83のリ
ンクデータをリンクさせる。これは、次のように、検出
されたキーワードとの入れ替えを行うことにより実現さ
れる。As a third step, the link unit 84
If there is a character string that matches the keyword, the link data of the keyword / link data DB 83 is linked to the keyword. This is realized by performing the replacement with the detected keyword as follows.
【0065】すなわち、一例としてキーワードである
『連絡網』(図14参照)が検出された場合、このキー
ワードである『連絡網』は次のように入れ替えられる。That is, when the keyword “contact network” (see FIG. 14) is detected as an example, the keyword “contact network” is replaced as follows.
【0066】[例]連絡網 → <A HREF=”連絡.HT
ML”>連絡網</A> 第4のステップとして、リンク部84は、タイトルの文
字列が存在する場合には、キーワードの場合と同様にし
て、ページデータとリンクさせる。これは、次のよう
に、検出されたタイトルとの入れ替えを行うことにより
実現される。[Example] Communication network → <A HREF = “Contact.HT”
ML "> contact network </A> As a fourth step, when a character string of the title exists, the link unit 84 links to the page data in the same manner as in the case of the keyword. As described above, this is realized by replacing the detected title.
【0067】すなわち、一例としてタイトルである『ス
ポーツ大会』、『催し物紹介』が検出された場合には、
これらのタイトルである『スポーツ大会』、『催し物紹
介』は次のように入れ替えられる([表2]参照)。That is, when the titles “sports tournament” and “entertainment introduction” are detected, for example,
These titles, “Sports Tournament” and “Introduction to Entertainment”, are replaced as follows (see [Table 2]).
【0068】[0068]
【表2】 表−2 [例]スポーツ大会 → <A HREF=”スポーツ大会.HTML”>スポーツ・・・ ・・・大会</A> [例]催し物紹介 → <A HREF=”催し物紹介.HTML”>催し物紹介</A>[Table 2] Table 2 [Example] Sports tournament → <A HREF = “Sports tournament. HTML”> Sports ・ ・ ・ Tournament </A> [Example] Introduction of events → <A HREF = “Events introduction. HTML ”> Introduction of Events </A>
【0069】以後、検出したキーワード及びタイトルの
文字列がなくなるまで、上記の第3のステップ及び第4
のステップが繰り返し実行され、その結果が出力される
こととなる。Thereafter, the third step and the fourth step are repeated until the detected character strings of the keyword and the title disappear.
Are repeatedly executed, and the result is output.
【0070】このようにして、リンク処理が完了して出
力されたページデータの一例が図17並びに図18に示
されている。それらの図において、下線が付された部分
が変更された部分である。FIGS. 17 and 18 show examples of page data output after the link processing is completed. In those figures, the underlined portions are the changed portions.
【0071】図15並びに図16に示された元のページ
データ(『ページデータ1(スポーツ大会.HTML)』、
『ページデータ2(催し物紹介.HTML)』)と比較して
説明する。図15に示された元の『ページデータ1』に
含まれるキーワード『連絡網』は、図17に示されたリ
ンク処理後の『ページデータ1』においては、『<AHRE
F=”連絡.HTML”>連絡網</A>』に置き換えが行わ
れている。The original page data shown in FIGS. 15 and 16 (“page data 1 (sports tournament.HTML)”,
This will be described in comparison with “Page Data 2 (Introduction to Events. HTML)”). The keyword “contact network” included in the original “page data 1” shown in FIG. 15 is “<AHRE” in the “page data 1” after the link processing shown in FIG.
F = ”Contact.HTML”> Contact network </A> ”.
【0072】また、図15に示された元の『ページデー
タ1』に含まれるキーワード『催し物紹介』は、図17
に示されたリンク処理後の『ページデータ1』において
は、『<A HREF=”催し物紹介.HTML”>催し物紹介<
/A>』に置き換えが行われている。The keyword “entertainment introduction” included in the original “page data 1” shown in FIG.
In “Page Data 1” after link processing shown in “<A HREF=“Introduction to Events. HTML”>> Introduction to Events <
/ A>].
【0073】さらに、図16に示された元の『ページデ
ータ2』に含まれるキーワード『スポーツ大会』は、図
18に示されたリンク処理後の『ページデータ2』にお
いては、『<A HREF=”スポーツ大会.HTML”>スポー
ツ大会</A>』に置き換えが行われている。Further, the keyword “sports tournament” included in the original “page data 2” shown in FIG. 16 is “<A HREF” in the “page data 2” after the link processing shown in FIG. = "Sports Games. HTML"> Sports Games </A>".
【0074】なお、図17に示されるように、『ページ
データ1』の本体部<BODY>には、ヘッダ部<HE
AD>に含まれるタイトル<TITLE>である『スポ
ーツ大会』と同一の語を含む文『スポーツ大会を開催し
ます。』が存在するが、これは同一ページ内のデータで
あるから、両者間にリンクが張られることはない。As shown in FIG. 17, the main part <BODY> of “page data 1” has a header part <HE
We will hold a sentence "Sports Competition" containing the same words as "Sports Competition", which is the title <TITLE> included in the AD> ], But since these are data in the same page, there is no link between them.
【0075】以上の説明で明らかなように、このリンク
処理を含む実施の形態によれば、データベースに格納
されているデータと自動的にリンクさせる機能、並び
に、複数のページを作成した場合にそれらのページ間
に自動的にリンクを張る機能を実現して、それらの間に
リンクを張る手間を大幅に軽減することができる。As is apparent from the above description, according to the embodiment including the link processing, the function of automatically linking the data stored in the database and the function of automatically linking the data when a plurality of pages are created. The function of automatically linking between the pages can be realized, and the trouble of linking between them can be greatly reduced.
【0076】以上の各実施の形態において、図1、図
2、図5、図10〜図13に示される機能ブロック図の
構成は、コンピュータに一定のプログラムを組み込むこ
とによりソフトウェア的に実現することができることは
勿論であり、その際に、コンピュータプログラムはハー
ドディスクにインストールして起動され、またCDRO
MやDVD等の各種の光ディスク等に格納して提供する
ことができる。In each of the above embodiments, the functional block diagrams shown in FIGS. 1, 2, 5, and 10 to 13 are realized by software by incorporating a certain program into a computer. Of course, at that time, the computer program is installed and started on the hard disk, and the CDRO
It can be provided by being stored on various optical disks such as M and DVD.
【0077】[0077]
【発明の効果】以上の説明から明らかなように、本発明
によれば、画像領域と文字領域とを含む画像データを、
煩雑な編集作業等を要することなく、比較的にデータ量
の少ないページデータ(インターネット上のホームペー
ジ、ワープロデータ、DTPデータ等)に変換すること
ができる。As is apparent from the above description, according to the present invention, image data including an image area and a character area is
The data can be converted into page data having a relatively small data amount (a homepage on the Internet, word processing data, DTP data, etc.) without requiring complicated editing work or the like.
【図面の簡単な説明】[Brief description of the drawings]
【図1】本発明にかかるページ作成支援装置の実施の一
形態の構成を示すブロック図である。FIG. 1 is a block diagram showing a configuration of an embodiment of a page creation support device according to the present invention.
【図2】同実施の一形態を構成する領域認識部の詳細を
示すブロック図である。FIG. 2 is a block diagram showing details of an area recognizing unit constituting the embodiment.
【図3】同領域認識部に含まれる入力画像サーチ部の動
作を説明するための説明図である。FIG. 3 is an explanatory diagram for explaining an operation of an input image search unit included in the area recognition unit.
【図4】同僚域認識部に含まれる領域推論部の動作を説
明するための説明図である。FIG. 4 is an explanatory diagram for explaining an operation of a region inference unit included in a colleague region recognition unit.
【図5】同実施の一形態を構成するページデータ生成部
の詳細を示すブロック図である。FIG. 5 is a block diagram showing details of a page data generation unit constituting the embodiment.
【図6】同実施の一形態の作用を系統的に説明するため
のフローチャートである。FIG. 6 is a flowchart for systematically explaining the operation of the embodiment.
【図7】サンプル入力画像の一例を示す説明図である。FIG. 7 is an explanatory diagram illustrating an example of a sample input image.
【図8】領域認識処理されたサンプル入力画像を示す説
明図である。FIG. 8 is an explanatory diagram illustrating a sample input image that has been subjected to an area recognition process.
【図9】領域認識されたサンプル入力画像をページ記述
言語に変換した例を示す説明図である。FIG. 9 is an explanatory diagram showing an example in which a sample input image whose area has been recognized is converted into a page description language.
【図10】本発明にかかるページ作成支援装置の実施の
一形態の変形例の構成を示すブロック図である。FIG. 10 is a block diagram showing a configuration of a modification of the embodiment of the page creation support device according to the present invention.
【図11】本発明にかかるページ作成支援装置の実施の
一形態の変形例の構成を示すブロック図である。FIG. 11 is a block diagram showing a configuration of a modification of the embodiment of the page creation support device according to the present invention.
【図12】本発明にかかるページ作成支援装置の実施の
一形態の変形例の構成を示すブロック図である。FIG. 12 is a block diagram showing a configuration of a modification of the embodiment of the page creation support device according to the present invention.
【図13】本発明にかかるページ作成支援装置の他の実
施の一形態の構成を示すブロック図である。FIG. 13 is a block diagram showing a configuration of another embodiment of the page creation support device according to the present invention.
【図14】同実施の一形態に含まれるキーワード・リン
クデータDBの構成を示す説明図である。FIG. 14 is an explanatory diagram showing a configuration of a keyword / link data DB included in the embodiment.
【図15】同実施の一形態に適用されるページデータの
一例を示す説明図である。FIG. 15 is an explanatory diagram showing an example of page data applied to the embodiment.
【図16】同実施の一形態に適用されるページデータの
一例を示す説明図であるFIG. 16 is an explanatory diagram showing an example of page data applied to the embodiment;
【図17】リンク処理が完了した図15に示されるペー
ジデータの一例を示す説明図である。FIG. 17 is an explanatory diagram showing an example of the page data shown in FIG. 15 after the link processing has been completed.
【図18】リンク処理が完了した図16に示されるペー
ジデータの一例を示す説明図である。FIG. 18 is an explanatory diagram showing an example of the page data shown in FIG. 16 after the link processing has been completed.
1 入力画像データ記憶部 2 領域認識部 3 テキストデータ変換部 4 ページデータ生成部 5 画像表示・領域指定部 6 テンプレート記憶部 7 ページリンク部 21 入力画像サーチ部 22 領域推論部 23 領域切り出し部 24 領域別データ記憶部 41 位置情報読み出し部 42 ページデータ付加部 43 出力部 71 ページデータ記憶部 72 キーワード・リンクデータDB 73 キーワード・タイトル検出部 74 リンク部 100 ページ作成支援装置 DESCRIPTION OF SYMBOLS 1 Input image data storage part 2 Area recognition part 3 Text data conversion part 4 Page data generation part 5 Image display / area designation part 6 Template storage part 7 Page link part 21 Input image search part 22 Area inference part 23 Area cutout part 24 Area Separate data storage unit 41 Position information read unit 42 Page data addition unit 43 Output unit 71 Page data storage unit 72 Keyword / link data DB 73 Keyword / title detection unit 74 Link unit 100 Page creation support device
───────────────────────────────────────────────────── フロントページの続き (72)発明者 堀内 雅之 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内 (72)発明者 太田 浩二 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内 (72)発明者 八竹 英紀 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内 (72)発明者 鈴木 等 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内 ──────────────────────────────────────────────────の Continuing on the front page (72) Inventor Masayuki Horiuchi O-Muron Co., Ltd. (10) Hanazono Todo-cho, Ukyo-ku, Kyoto-shi, Kyoto (72) Inventor Koji Ota 10-Hanazono Todo-cho, Ukyo-ku, Kyoto, Kyoto Inside (72) Inventor Hideki Hattake 10 Okayama Todo-cho, Ukyo-ku, Kyoto-shi, Kyoto Prefecture (72) Inventor Suzuki, etc. Within Omron 10-ka Dono-cho, Ukyo-ku, Kyoto-shi, Kyoto
Claims (10)
する入力画像データ記憶手段と、 前記記憶された入力画像の画像領域と文字領域とをそれ
ぞれ認識し、それらの領域のデータを切り出す領域認識
手段と、 前記切り出された文字領域に含まれる文字情報をテキス
トデータに変換するテキストデータ変換手段と、 前記切り出された画像データと変換したテキストデータ
とからページデータを生成するページデータ生成手段
と、 を具備することを特徴とするページ作成支援装置。1. An input image data storage means for storing an image captured from an image input device, and an area recognition means for recognizing an image area and a character area of the stored input image, and cutting out data of those areas. Text data converting means for converting character information included in the cut-out character area into text data, and page data generating means for generating page data from the cut-out image data and the converted text data, A page creation support device comprising:
するだけの記憶容量を有するページデータ記憶手段と、 ユーザにより入力されたか、若しくは、データペースに
記憶されているキーワード、若しくは、タイトルにマッ
チングする文字列を、前記ページデータ記憶手段に格納
されたページデータから検出するキーワード・タイトル
検出手段と、 前記検出されたキーワード或いはタイトルに関連するペ
ージデータ同士をリンクさせるリンク手段と、 を具備することを特徴とする請求項1に記載のページ作
成支援装置。2. A page data storage unit having a storage capacity enough to store a plurality of the generated page data, and matching a keyword or a title inputted by a user or stored in a data pace. Keyword / title detection means for detecting a character string from the page data stored in the page data storage means, and link means for linking page data related to the detected keyword or title. The page creation support device according to claim 1, wherein:
つ、そのブロック内の画像特徴量を算出する入力画像サ
ーチ手段と、 前記算出された特徴量に基づいてファジイ推論を実行す
ることにより、その領域が画像領域であるか若しくは文
字領域であるかを判断する領域推論手段と、 画像領域と判断された領域と文字領域と判断された領域
とを元の入力画像データから切り出す領域切り出し手段
と、 前記切り出された画像データを領域別に格納する領域別
データ記憶手段と、 を具備することを特徴とする請求項1若しくは請求項2
に記載のページ作成支援装置。3. The area recognizing unit searches input image data in a block of a fixed size and calculates an image feature amount in the block, and a fuzzy image based on the calculated feature amount. By performing inference, an area inference unit that determines whether the area is an image area or a character area, and converts the area determined as the image area and the area determined as the character area into the original input image. 3. The image processing apparatus according to claim 1, further comprising: an area extracting unit that extracts the data from the data; and an area-specific data storage unit that stores the extracted image data for each area.
A page creation support device according to.
読み出し、その位置情報に従って一定の順序で領域デー
タをソートする位置情報読み出し手段と、 前記ソートされた領域データのそれぞれにページ記述言
語を付加して配置するページデータ付加手段と、 を具備することを特徴とする請求項1若しくは請求項2
に記載のページ作成支援装置。4. The page data generator reads out position information attached to the data of each of the cut-out areas, and sorts the area data in a predetermined order according to the position information. 3. A page data adding means for adding and arranging a page description language to each of the set area data.
A page creation support device according to.
とテキストデータとを割り付ける位置を、テンプレート
に従って割り付けることを特徴とする請求項1若しくは
請求項2に記載のページ作成支援装置。5. The page creation support device according to claim 1, wherein the page data generation unit assigns positions at which image data and text data are assigned according to a template.
媒体に記憶する入力画像データ記憶ステップと、 前記記憶された入力画像の画像領域と文字領域とをそれ
ぞれ認識し、それらの領域のデータを切り出す領域認識
ステップと、 前記切り出された文字領域に含まれる文字情報をテキス
トデータに変換するテキストデータ変換ステップと、 前記切り出された画像データと変換したテキストデータ
とからページデータを生成するページデータ生成ステッ
プと、 を具備することを特徴とするページ作成支援方法。6. An input image data storing step of storing an image captured from an image input device in a storage medium, recognizing an image area and a character area of the stored input image, and cutting out data of those areas. An area recognition step, a text data conversion step of converting character information included in the cut-out character area into text data, and a page data generation step of generating page data from the cut-out image data and the converted text data A page creation support method, comprising:
させるページデータ記憶ステップと、 ユーザにより入力されたか、若しくは、データペースに
記憶されているキーワード、若しくは、タイトルにマッ
チングする文字列を、前記ページデータ記憶ステップに
て格納されたページデータから検出するキーワード・タ
イトル検出ステップと、 前記検出されたキーワード或いはタイトルに関連するペ
ージデータ同士をリンクさせるリンクステップと、 を具備することを特徴とする請求項1に記載のページ作
成支援方法。7. A page data storing step of storing a plurality of the generated page data, and a character string that matches a keyword or a title input by a user or stored in a data pace is stored in the page. A keyword / title detecting step of detecting from the page data stored in the data storing step, and a linking step of linking page data related to the detected keyword or title with each other. 1. The page creation support method according to 1.
つ、そのブロック内の画像特徴量を算出する入力画像サ
ーチステップと、 前記算出された特徴量に基づいてファジイ推論を実行す
ることにより、その領域が画像領域であるか若しくは文
字領域であるかを判断する領域推論ステップと、 画像領域と判断された領域と文字領域と判断された領域
とを元の入力画像データから切り出す領域切り出しステ
ップと、 前記切り出された画像データを領域別に格納する領域別
データ記憶ステップと、 を具備することを特徴とする請求項1若しくは請求項2
に記載のページ作成支援方法。8. An input image search step of calculating an image feature amount in a block while searching for input image data in a block of a fixed size, the area recognizing unit; and a fuzzy image based on the calculated feature amount. Performing an inference to determine whether the area is an image area or a character area; and determining the area determined to be an image area and the area determined to be a character area from an original input image. 3. An area extracting step for extracting the image data from data, and an area-specific data storing step for storing the extracted image data for each area.
Page creation support method described in.
読み出し、その位置情報に従って一定の順序で領域デー
タをソートする位置情報読み出しステップと、 前記ソートされた領域データのそれぞれにページ記述言
語を付加して配置するページデータ付加ステップと、 を具備することを特徴とする請求項1若しくは請求項2
に記載のページ作成支援方法。9. A position information reading step of reading out position information attached to the data of each of the cut-out areas, and sorting the area data in a predetermined order according to the position information. 3. A page data adding step of adding and arranging a page description language to each of the set area data.
Page creation support method described in.
タとテキストデータとを割り付ける位置を、テンプレー
トに従って割り付けることを特徴とする請求項1若しく
は請求項2に記載のページ作成支援方法。10. The page creation support method according to claim 1, wherein the page data generation unit allocates positions at which image data and text data are allocated according to a template.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8308745A JPH10134081A (en) | 1996-11-05 | 1996-11-05 | Method and device for supporting page generation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8308745A JPH10134081A (en) | 1996-11-05 | 1996-11-05 | Method and device for supporting page generation |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10134081A true JPH10134081A (en) | 1998-05-22 |
Family
ID=17984784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8308745A Pending JPH10134081A (en) | 1996-11-05 | 1996-11-05 | Method and device for supporting page generation |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10134081A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002318806A (en) * | 2001-04-20 | 2002-10-31 | Dainippon Printing Co Ltd | Data input system |
JP2002351895A (en) * | 2001-05-28 | 2002-12-06 | Dainippon Printing Co Ltd | Apparatus for information extraction from printing plate data |
US8682075B2 (en) | 2010-12-28 | 2014-03-25 | Hewlett-Packard Development Company, L.P. | Removing character from text in non-image form where location of character in image of text falls outside of valid content boundary |
-
1996
- 1996-11-05 JP JP8308745A patent/JPH10134081A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002318806A (en) * | 2001-04-20 | 2002-10-31 | Dainippon Printing Co Ltd | Data input system |
JP2002351895A (en) * | 2001-05-28 | 2002-12-06 | Dainippon Printing Co Ltd | Apparatus for information extraction from printing plate data |
US8682075B2 (en) | 2010-12-28 | 2014-03-25 | Hewlett-Packard Development Company, L.P. | Removing character from text in non-image form where location of character in image of text falls outside of valid content boundary |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10169354B2 (en) | Indexing and search query processing | |
JP2896634B2 (en) | Full-text registered word search device and full-text registered word search method | |
KR100461019B1 (en) | web contents transcoding system and method for small display devices | |
JP3178475B2 (en) | Data processing device | |
US6336124B1 (en) | Conversion data representing a document to other formats for manipulation and display | |
JP2002055872A (en) | Method, system and medium for simplifying web contents | |
US20060080361A1 (en) | Document information processing apparatus, document information processing method, and document information processing program | |
JP2004355528A (en) | Information processing apparatus, program and recording medium | |
JP3832693B2 (en) | Structured document search and display method and apparatus | |
JP2004086845A (en) | Apparatus, method, and program for expanding electronic document information, and recording medium storing the program | |
JPH10134081A (en) | Method and device for supporting page generation | |
JP2004334341A (en) | Document retrieval system, document retrieval method, and recording medium | |
JP3692416B2 (en) | Information filtering method and apparatus | |
JPH11250077A (en) | Information processor, information processing method and record medium | |
US20030009490A1 (en) | Information processing apparatus, information processing method, recording medium, program, and electronic-publishing-data providing system | |
JP2000020549A (en) | Device for assisting input to document database system | |
JP3504002B2 (en) | Node link automatic generation method | |
JPH10307837A (en) | Retrieval device and recording medium recording retrieval program | |
JP3077615B2 (en) | Homepage analysis display system | |
JP3943005B2 (en) | Information retrieval program | |
JP3744136B2 (en) | Translation device and storage medium | |
JP4113145B2 (en) | Document processing apparatus and document processing method | |
JPH1145236A (en) | Document management support apparatus and computer-readable recording medium storing a program for causing a computer to function as the apparatus | |
JP2007011973A (en) | Information retrieval device and information retrieval program | |
JP3258051B2 (en) | Information retrieval device and information retrieval method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20031211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040202 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040308 |