JP5186863B2 - Image aggregation device and image aggregation program - Google Patents
Image aggregation device and image aggregation program Download PDFInfo
- Publication number
- JP5186863B2 JP5186863B2 JP2007254770A JP2007254770A JP5186863B2 JP 5186863 B2 JP5186863 B2 JP 5186863B2 JP 2007254770 A JP2007254770 A JP 2007254770A JP 2007254770 A JP2007254770 A JP 2007254770A JP 5186863 B2 JP5186863 B2 JP 5186863B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- extracted
- character string
- text
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Editing Of Facsimile Originals (AREA)
- User Interface Of Digital Computer (AREA)
Description
本発明は、複数の画像をステンドグラス状に集約して表示させる画像集約装置に関し、特に、集約後の各画像内の文字の可読性を高める画像集約装置に関する。 The present invention relates to an image aggregating apparatus that aggregates and displays a plurality of images in a stained glass shape, and more particularly to an image aggregating apparatus that improves the readability of characters in each image after aggregation.
画像用の検索エンジン等で検索結果として抽出され、表示装置上に縮小されて表示される画像(以下、抽出画像という。)は、その抽出画像内の文字の可読性が劣る場合がある。例えば、特許文献1では、PDAや携帯電話等の小型移動装置上で画像や文字等を表示させるに際し、表示領域に多くの情報量を表示させるために、画像や文字等を透過的に重ね合わせることが開示されている。
An image extracted as a search result by an image search engine or the like and reduced and displayed on a display device (hereinafter referred to as an extracted image) may have poor readability of characters in the extracted image. For example, in
また、特許文献2では、関心領域処理(ROI(Region Of Interest)処理)に基づき、複数の抽出画像をステンドグラス状に集約することで、小さな表示領域であっても多くの情報量を表示できることが開示されている。
Further, in
ところで、上述したようなステンドグラス状に抽出画像を集約して生成される画像(以下、集約画像という。)の表示においては、その集約画像を構成する各画像内に含まれる文字が縮小されたり、他の抽出画像によって各画像内の文字が分断されたりすることで文字の可読性が劣る可能性がある。 By the way, in the display of an image (hereinafter referred to as an aggregated image) generated by aggregating extracted images in a stained glass shape as described above, characters included in each image constituting the aggregated image are reduced. The characters in each image may be divided by other extracted images, which may result in poor character readability.
本発明は、このような事情に鑑みてなされたものであり、集約画像が生成されたことにより、集約画像を構成する画像内の文字の可読性が劣ることを抑制する画像集約装置及び画像集約プログラムを提供することを目的とする。 The present invention has been made in view of such circumstances, and an image aggregating apparatus and an image aggregating program that suppress the deterioration of the readability of characters in images constituting the aggregated image due to the generation of the aggregated image. The purpose is to provide.
請求項1に記載の発明は、入力装置により入力される検索用文字情報に基づき、該検索用文字情報に関連する画像情報を抽出画像として複数抽出する抽出手段と、抽出手段により抽出された複数の抽出画像の少なくとも1つが文字列と図柄とを備えた抽出画像であり、かつ、該文字列を示す面積が該図柄を示す面積より大きい場合に、該抽出画像が文字列で構成されると判定する判定手段と、文字列を拡大して表示させるための文字列表示領域を抽出画像の数に応じて生成するとともに、関心領域処理に基づいて、抽出された複数の抽出画像から集約画像を生成する生成手段と、生成手段により生成された集約画像を表示させるとともに、生成手段により生成された文字列表示領域のそれぞれに、判定手段により文字列で構成されると判定された抽出画像と、抽出画像が備える文字列と、を当該抽出画像ごとに表示させる表示制御手段と、を有する画像集約装置である。
The invention described in
請求項2に記載の発明は、コンピュータを、入力装置により入力される検索用文字情報に基づき、該検索用文字情報に関連する画像情報を抽出画像として複数抽出する抽出手段、抽出手段により抽出された複数の抽出画像の少なくとも1つが文字列と図柄とを備えた抽出画像であり、かつ、該文字列を示す面積が該図柄を示す面積より大きい場合に、該抽出画像が文字列で構成されると判定する判定手段、文字列を拡大して表示させるための文字列表示領域を抽出画像の数に応じて生成するとともに、関心領域処理に基づいて、抽出された複数の抽出画像から集約画像を生成する生成手段、生成手段により生成された集約画像を表示させるとともに、生成手段により生成された文字列表示領域のそれぞれに、判定手段により文字列で構成されると判定された抽出画像と、抽出画像が備える文字列と、を当該抽出画像ごとに表示させる表示制御手段、として機能させるための画像集約プログラムである。 According to the second aspect of the present invention, the computer is extracted by extraction means and extraction means for extracting a plurality of image information related to the search character information as extracted images based on the search character information input by the input device. In addition, when at least one of the plurality of extracted images is an extracted image having a character string and a pattern, and the area indicating the character string is larger than the area indicating the pattern, the extracted image is configured by a character string. A determination unit that determines that the character string display area for displaying the character string in an enlarged manner is generated according to the number of extracted images, and the aggregated image is extracted from the plurality of extracted images extracted based on the region of interest processing Generating means for displaying the aggregated image generated by the generating means, and each character string display area generated by the generating means is constituted by a character string by the determining means. And the determined extracted image and the character string included in the extracted image, which is the image-intensive program for functioning as display control means, to be displayed for each said extracted image.
請求項1に記載の発明によれば、集約画像を構成する画像内の文字の可読性が劣ることを抑制することができる。
According to invention of
請求項2に記載の発明によれば、集約画像を構成する画像内の文字の可読性が劣ることを抑制することができる。
According to invention of
以下、本発明の最良の実施形態について図面を参照して説明する。
(第1実施形態)
図1は本発明の実施形態に係る画像集約装置の構成図である。
画像集約装置は、図1に示すように、検索部11、結果分析部12、データ管理部13、データベース14、テキスト生成部15、SG(Stained Glass)生成部16、表示制御部17等から構成される。尚、テキスト生成部15、SG生成部16、表示制御部17等から本発明の表示制御手段が構成される。
DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, exemplary embodiments of the invention will be described with reference to the drawings.
(First embodiment)
FIG. 1 is a configuration diagram of an image aggregating apparatus according to an embodiment of the present invention.
As shown in FIG. 1, the image aggregating apparatus includes a
また、画像集約装置は、いわゆるコンピュータ、すなわち、図2に示すように、CPU10a等の処理装置、SRAM(Static Random Access Memory)、DRAM(Dynamic RAM)やSDRAM(Synchronous DRAM)、NVRAM(Non Volatile RAM)等のRAM10b、フラッシュメモリ等のROM(Read Only Memory)10c、入力装置や表示装置等の外部機器との入出力を行うI/F10d、図示しないハードディスク等の磁気ディスク等がバス10eにより接続されたハードウェア構成により実現される。 The image aggregation device is a so-called computer, that is, as shown in FIG. 2, a processing device such as a CPU 10a, SRAM (Static Random Access Memory), DRAM (Dynamic RAM), SDRAM (Synchronous DRAM), NVRAM (Non Volatile RAM). ) And the like, a ROM (Read Only Memory) 10c such as a flash memory, an I / F 10d that inputs and outputs to an external device such as an input device and a display device, and a magnetic disk such as a hard disk (not shown) are connected by a bus 10e. This is realized by the hardware configuration.
したがって、CPU10aがROM10cやハードディスクに格納された所要のプログラムを読み込み、当該プログラムに従った演算を行うことにより、画像集約装置内の各機能が実現される。尚、このようなプログラムとしては後述するフローチャートに応じたプログラムとすることができる。 Therefore, the CPU 10a reads a required program stored in the ROM 10c or the hard disk and performs an operation according to the program, thereby realizing each function in the image aggregation device. In addition, as such a program, it can be set as the program according to the flowchart mentioned later.
検索部11は、キーボードやマウス等の入力装置からの指示に基づき、集約用の画像をインターネットや社内LAN等から検索する。より詳しくは、図3に示すように、液晶ディスプレイやCRTディスプレイ等の表示装置に表示される表示画像のうち、画像検索用の入力ボックス21の文字情報に応じた画像を検索する。表示画像としては例えばWebブラウザ20等がある。図3においては例えば文字情報「GCC」が入力ボックス21に入力されているため、文字情報「GCC」を有する画像又はこれに関連する画像を検索する。検索結果として抽出された抽出画像は、結果分析部12に送信される。
The
結果分析部12は、検索部11から送信される抽出画像を受信し、当該抽出画像が文字のみから構成されるか、図柄のみから構成されるか、これらが混在するか否かを分析する。
データ管理部13は、結果分析部12による分析結果に応じて、抽出画像を区別してデータベース14に格納する。
The
The
テキスト生成部15は、データ管理部13に対しデータベース14から文字のみから構成される抽出画像の送信要求を出力する。さらに、テキスト生成部15は、当該要求に基づき抽出画像を取得すると、抽出画像内の文字列を取得して、文字列を表示するための文字列表示領域(以下、テキストレイヤという。)を生成し、当該テキストレイヤ内の各表示レイヤに文字列を追加していく。文字列が追加されたテキストレイヤは表示制御部17に送信される。
The
SG生成部16は、データ管理部13に対しデータベース14から図柄のみから構成される抽出画像の送信要求を出力する。さらに、SG生成部15は、当該要求に基づき抽出画像を取得すると、抽出画像内の図柄を取得して、関心領域処理に基づいて、ステンドグラス状の画像(集約画像)を生成する。このような画像を生成する場合には、上述した特許文献2に開示される技術や、特開2005−293576号公報、特開2005−293577号公報等に開示される技術を利用することができる。
The
表示制御部17は、テキスト生成部15で生成されるテキストレイヤ、SG生成部16で生成される集約画像を表示装置に表示させる。
The
続いて、画像集約装置の動作について図面を参照して説明する。
図4は画像集約装置の動作の一例を示すフローチャート、図5は実施形態に係る抽出画像と表示結果を説明するための図、図6は実施形態に係る抽出画像と表示結果を説明するための他の図、図7は実施形態に係る表示画像と比較例に係る表示画像の一例である。
Next, the operation of the image aggregation device will be described with reference to the drawings.
FIG. 4 is a flowchart showing an example of the operation of the image aggregation device, FIG. 5 is a diagram for explaining the extracted image and the display result according to the embodiment, and FIG. 6 is for explaining the extracted image and the display result according to the embodiment. FIG. 7 is another example of the display image according to the embodiment and the display image according to the comparative example.
画像集約装置は、図4に示すように、まず、検索用文字情報に応じたページ内のテキストボックスをすべて取得する(ステップS1)。より詳しくは、抽出画像が、図5(a)に示すような、文字のみから構成され、各文字列が所定の区画で区切られているようなページである場合に、入力ボックス21に入力された文字情報、例えば「GCC」を含むページ内のすべてのテキストボックス取得する。この結果、同図におけるテキストボックスBx4、Bx6、Bx9、Bx10を取得する。そして、取得したこれらのテキストボックスを取得した順に領域番号i=1、2、3、4を付与する。 As shown in FIG. 4, the image aggregating apparatus first acquires all the text boxes in the page corresponding to the search character information (step S1). More specifically, when the extracted image is a page composed of only characters as shown in FIG. 5A and each character string is divided by a predetermined section, the extracted image is input to the input box 21. All text boxes in the page including the character information, for example, “GCC” are acquired. As a result, the text boxes Bx4, Bx6, Bx9, and Bx10 in FIG. Then, region numbers i = 1, 2, 3, and 4 are assigned in the order in which these acquired text boxes are acquired.
画像集約装置は、次いで、取得したテキストボックスが1番目のテキストボックスであるか否かを判定する(ステップS2)。ここで、1番目のテキストボックスであるか否かは、取得したテキストボックスを左上から右下にかけて取得していった場合に、最初に取得対象となったテキストボックスを1番目のテキストボックスとする。この結果、図5に示すテキストボックスBx4が1番目のテキストボックスとなる。 Next, the image aggregating apparatus determines whether or not the acquired text box is the first text box (step S2). Here, whether or not it is the first text box is determined based on whether or not the acquired text box is acquired from the upper left to the lower right, and the first text box to be acquired is the first text box. . As a result, the text box Bx4 shown in FIG. 5 becomes the first text box.
画像集約装置は、次いで、取得したテキストボックスが1番目である場合、当該テキストボックスの左上隅を最小座標値(Xmin、Ymin)、右下隅を最大座標値(Xmax、Ymax)とする(ステップS3)。したがって、1番目のテキストボックスを取得した時点では、Xmin=X10、Ymin=Y10、Xmax=X11、Ymax=Y11となる。 Next, when the acquired text box is the first, the image aggregating apparatus sets the upper left corner of the text box as the minimum coordinate value (Xmin, Ymin) and the lower right corner as the maximum coordinate value (Xmax, Ymax) (step S3). ). Therefore, when the first text box is acquired, Xmin = X 10 , Ymin = Y 10 , Xmax = X 11 , and Ymax = Y 11 .
画像集約装置は、次いで、取得したテキストボックスが最後のテキストボックスであるか否かを判定する。図5によれば、最後のテキストボックスは領域番号i=4のテキストボックスBx10であるため、次の領域番号i=2として、X20がXminより小さいか否かを判定する(ステップS5)。そして、X20がXminより小さい場合には、Xminを新たにX20とし(ステップS6)、そうでない場合には、ステップS6の処理を行わない。 Next, the image aggregating apparatus determines whether or not the acquired text box is the last text box. According to FIG. 5, since the end of the text box is a text box Bx10 area number i = 4, as the next region number i = 2, X 20 determines whether Xmin smaller (step S5). When X 20 is Xmin smaller than, the new X 20 and Xmin (step S6), and otherwise does not perform the processing of step S6.
画像集約装置は、同様に、Y20がYminより小さいか否かを判定する(ステップS7)。そして、Y20がYminより小さい場合には、Yminを新たにY20とし(ステップS8)、そうでない場合には、ステップS8の処理を行わない。 Image centralizing device, likewise, Y 20 determines whether Ymin is smaller than (step S7). When Y 20 is Ymin smaller than, the new Y 20 and Ymin (step S8), and otherwise does not perform the processing of step S8.
画像集約装置は、次いで、X21がXmaxより大きいか否かを判定する(ステップS9)。そして、X21がXmaxより大きい場合には、Xmaxを新たにX21とし(ステップS10)、そうでない場合には、ステップS10の処理を行わない。 Image centralizing device, then, X 21 determines whether Xmax greater (step S9). When X 21 is larger than Xmax is a new X21 to Xmax (step S10), and otherwise does not perform the processing of step S10.
画像集約装置は、同様に、Y21がYmaxより大きいか否かを判定する(ステップS11)。そして、Y21がYmaxより大きい場合には、Ymaxを新たにY21とし(ステップS12)、そうでない場合には、ステップS12の処理を行わない。 Image centralizing device, likewise, Y 21 determines whether Ymax larger (step S11). When Y 21 is larger than Ymax is the new Y 21 to Ymax (step S12), the otherwise does not perform the processing in step S12.
画像集約装置は、ステップS4の処理において最後のテキストボックスであると判定した場合、すなわち、本実施形態によればi=4が終了した場合に、後続の処理に移行する。このようにステップS5からステップS12の処理を繰り返すことにより、図5においては、Bx9(i=3)の左上隅のX座標:X30がXminに、Bx4(i=1)の右下隅のX座標:X11がXmaxに、Bx4(i=1)の左上隅のY座標:Y19がYminに、Bx9(i=3)の右下隅のY座標:Y31がYmaxになる。この結果、座標(Xmin,Ymin)と座標(Xmax,Ymax)で構成される矩形の仮想領域AR内のテキストがテキストレイヤ生成対象となる。この仮想領域ARはレイヤ生成対象として所定の区画を含む最大の矩形となっている。尚、当該仮想領域ARをテキストGERMという。 If the image aggregation device determines that it is the last text box in the process of step S4, that is, if i = 4 is completed according to the present embodiment, it proceeds to the subsequent process. By repeating the process in step S12 in this way from the step S5, in Figure 5, X coordinate of the upper left corner of Bx9 (i = 3): the X 30 is Xmin, Bx4 (i = 1) X in the lower-right corner of the coordinates: the X 11 is Xmax, Y coordinate of the upper left corner of Bx4 (i = 1): Y 19 is a Ymin, Y coordinates of the lower right corner of Bx9 (i = 3): Y 31 is Ymax. As a result, the text in the rectangular virtual area AR composed of the coordinates (Xmin, Ymin) and the coordinates (Xmax, Ymax) becomes the text layer generation target. This virtual area AR is the largest rectangle including a predetermined section as a layer generation target. The virtual area AR is referred to as text GERM.
画像集約装置は、次いで、ページ内のすべてのテキストボックスを取得して左上から右下にかけて領域番号j=1,2,・・・を割り当てた上で、j番目のテキストボックスを取得し(ステップS13)、当該テキストボックスの座標がXmin≦Xi0かつYmin≦Yi0かつXmax≧Xi1かつYmax≧Yi1か否かを判定する(ステップS14)。そして、これらの判定条件が満たされた場合には、j番目のテキストを取得し、今まで取得したテキストがある場合に当該テキストと結合する(ステップS15)。このような処理の結果、j=1となるテキストボックスBx1は結合(集約)対象から除外され、j=3となるテキストボックスBx3が結合対象となる。 Next, the image aggregating apparatus acquires all the text boxes in the page, assigns region numbers j = 1, 2,... From the upper left to the lower right, and then acquires the jth text box (step S13), it is determined whether or not the coordinates of the text box are Xmin ≦ Xi0, Ymin ≦ Yi0, Xmax ≧ Xi1, and Ymax ≧ Yi1 (step S14). If these determination conditions are satisfied, the j-th text is acquired, and if there is text acquired so far, it is combined with the text (step S15). As a result of such processing, the text box Bx1 with j = 1 is excluded from the objects to be combined (aggregated), and the text box Bx3 with j = 3 becomes the object to be combined.
画像集約装置は、ここで、結合したテキストが最後のテキストであるか否かを判定し(ステップS16)、最後のテキストでない場合には、ステップS13からステップS15までの処理を繰り返す。画像集約装置は、最後のテキストを結合し終えると、結合したテキストをデータベースに保存し(ステップS17)、処理を終了する。 Here, the image aggregating apparatus determines whether or not the combined text is the last text (step S16), and if it is not the last text, repeats the processing from step S13 to step S15. When the image aggregating apparatus finishes combining the last text, it stores the combined text in the database (step S17), and ends the process.
このような処理による結果、テキストレイヤでは、図5(b)に示すように、1つの表示レイヤ31内に結合されたテキストボックス内のテキストがテキストボックスごとに段落に分けられて表示される。そして、他の表示レイヤ32等には、他の抽出画像で結合されたテキストボックス内のテキストが表示される。これにより文章全体の把握が容易になる。
As a result of such processing, in the text layer, as shown in FIG. 5B, the text in the text box combined in one
また、図6(a)に示すように、仮想領域ARで囲わずに、取得したテキストボックスだけで構成されるテキストボックス内のテキストを結合対象として含めるようにしてもよい。同図によれば、上述したテキストボックスBx4、6、9、10に含まれるテキストをテキストレイヤ内の表示レイヤ31に表示させるようにしてもよい。これにより、携帯電話やPDA等の情報携帯端末で制限された表示領域でより多くの情報を表示できる。
Further, as shown in FIG. 6A, the text in the text box composed only of the acquired text box may be included as a combination target without being surrounded by the virtual area AR. According to the figure, the text included in the text boxes Bx4, 6, 9, and 10 described above may be displayed on the
尚、本実施形態においては、抽出画像(ページ)に検索用文字情報を含むテキストボックスが複数あったため、仮想領域ARをテキストGERMとしたが、テキストボックスが1つである場合には、当該テキストボックスをテキストGERMとしてもよい。また、検索用文字情報を含まない抽出画像である場合には、フォントが一番大きいテキストボックス、上部に配置されるテキストボックス、中央に配置されるテキストボックス、他のページに含まれないテキストボックス等をテキストGERMとしてもよい。 In this embodiment, since there are a plurality of text boxes including search character information in the extracted image (page), the virtual area AR is set as the text GERM. However, if there is only one text box, the text The box may be the text GERM. Also, if the extracted image does not include search character information, the text box with the largest font, the text box placed at the top, the text box placed in the center, and the text box not included on other pages Etc. may be the text GERM.
図7は本実施形態に係る表示画像と比較例に係る表示画像とを説明するための図である。本実施形態に係る表示画像は、図7(a)に示すように、上述したテキストレイヤ33がWebブラウザ20等に表示される。一方、比較例に係る表示画像は、図7(b)に示すように、検索用文字情報に基づいて抽出された抽出画像が縮小されてWebブラウザ20等に表示される。このように、比較例において抽出画像が縮小され、その結果抽出画像内の文字の可読性が劣るという事象が、本発明の実施形態に係る画像集約装置により抑制される。
FIG. 7 is a diagram for explaining a display image according to the present embodiment and a display image according to a comparative example. In the display image according to the present embodiment, as shown in FIG. 7A, the
(第2実施形態)
続いて、本発明の第2実施形態について図面を参照して説明する。
図8は画像集約装置の動作の一例を示すフローチャート、図9は比較用の表示結果の一例である。
(Second Embodiment)
Next, a second embodiment of the present invention will be described with reference to the drawings.
FIG. 8 is a flowchart showing an example of the operation of the image aggregation device, and FIG. 9 is an example of a display result for comparison.
画像集約装置は、図8に示すように、まず、検索用文字情報に基づいてインターネットや社内LAN等から検索処理を行い(ステップS21)、検索用文字情報に応じた抽出画像を取得する(ステップS22)。 As shown in FIG. 8, the image aggregating apparatus first performs a search process from the Internet, an in-house LAN, or the like based on the search character information (step S21), and acquires an extracted image corresponding to the search character information (step S21). S22).
画像集約装置は、次いで、抽出画像がテキスト(文字列)のみから構成されるか否かを判定する(ステップS23)。画像集約装置は、抽出画像がテキストのみから構成されると判定した場合には、第1実施形態で説明したように、ページ順にページデータを取得し(ステップS24)、テキストボックスに含まれるテキストを取得し(ステップS25)、当該テキストを最後のテキストまで表示レイヤに追加していき(ステップS26、S27)、テキストの追加が終了すると表示装置等にテキストレイヤを表示させる(ステップS28)。 Next, the image aggregating apparatus determines whether or not the extracted image is composed only of text (character string) (step S23). If it is determined that the extracted image is composed only of text, the image aggregating apparatus acquires page data in the order of pages as described in the first embodiment (step S24), and the text included in the text box is acquired. It is acquired (step S25), the text is added to the display layer up to the last text (steps S26 and S27), and when the addition of the text is completed, the text layer is displayed on the display device or the like (step S28).
一方、画像集約装置は、抽出画像がテキストのみから構成されていないと判定した場合には、次いで、抽出画像が画像情報(図柄)のみから構成されるか否かを判定する(ステップS29)。画像集約装置は、抽出画像がテキストのみから構成されると判定した場合には、検索結果に基づくすべての抽出画像を取得し(ステップS30)、これらの画像からSG作成を行い(ステップS31)、図9に示すように、表示装置等にステンドガラス状の画像(集約画像)を表示する(ステップS32)。 On the other hand, if it is determined that the extracted image is not composed only of text, the image aggregating apparatus then determines whether or not the extracted image is composed only of image information (design) (step S29). If it is determined that the extracted image is composed only of text, the image aggregating apparatus acquires all the extracted images based on the search results (step S30), creates an SG from these images (step S31), As shown in FIG. 9, a stained glass-like image (aggregated image) is displayed on a display device or the like (step S32).
一方、画像集約装置は、抽出画像が画像情報のみから構成されていないと判定した場合、すなわち、テキスト情報と画像情報との混在であると判定した場合には、ページ順にページデータを取得する(ステップS33)。そして、取得したページデータが画像GERMか否かを判定する(ステップS34)。 On the other hand, if the image aggregating apparatus determines that the extracted image is not composed only of image information, that is, determines that the extracted image is a mixture of text information and image information, the image aggregating apparatus acquires page data in page order ( Step S33). Then, it is determined whether or not the acquired page data is an image GERM (step S34).
画像集約装置は、ページデータが画像GERMでないと判定した場合、すなわちテキストGERMであると判定した場合には、当該テキストGERMに含まれるテキストを取得する。ここで、取得したページデータが画像GERMであるか否かは、画像を示す面積をP、1ページ全体の画像面積A、テキストを示す面積をTとした場合に、(P/A)>(1/3)又はP≧Tを満たす場合に画像GERMと判定され、そうでない場合には、テキストGERMと判定される。尚、画像を示す面積Pは、図10(a)に示す数式で表され、テキストを示す面積Tは、図10(b)に示す数式で表される。また、absは絶対値を示す記号である。 When it is determined that the page data is not the image GERM, that is, when it is determined that the page data is the text GERM, the image aggregation device acquires the text included in the text GERM. Here, whether or not the acquired page data is the image GERM is determined by assuming that the area indicating the image is P, the image area A of the entire page is T, and the area indicating the text is T, (P / A)> ( 1/3) or when P ≧ T is satisfied, the image is determined as GERM. Otherwise, it is determined as text GERM. The area P indicating the image is represented by the mathematical formula shown in FIG. 10A, and the area T representing the text is represented by the mathematical formula shown in FIG. Abs is a symbol indicating an absolute value.
画像集約装置は、ページデータがテキストGERMであると判定した場合には、テキストGERMに含まれるテキストを取得し(ステップS35)、当該テキストを表示レイヤに追加していく(ステップS36)。そして、画像集約装置は、当該ページデータが最後のページデータであったか否かを判定する(ステップS37)。 When determining that the page data is the text GERM, the image aggregating apparatus acquires the text included in the text GERM (step S35) and adds the text to the display layer (step S36). Then, the image aggregating apparatus determines whether or not the page data is the last page data (step S37).
一方、画像集約装置は、ページデータが画像GERMであると判定した場合には、当該ページデータを画像ページとして一時保存し(ステップS38)、表示レイヤに画像のサムネイルを追加する(ステップS39)。 On the other hand, when it is determined that the page data is the image GERM, the image aggregating apparatus temporarily stores the page data as an image page (step S38), and adds an image thumbnail to the display layer (step S39).
画像集約装置は、取得したページデータのすべてに対しステップS35からステップS39の処理を終了すると、画像ページからSG作成処理を行い(ステップS40)、テキストレイヤを表示して(ステップS41)、処理を終了する。 When the image aggregating apparatus completes the processing from step S35 to step S39 for all the acquired page data, it performs SG creation processing from the image page (step S40), displays the text layer (step S41), and performs processing. finish.
この結果、図11に示すように、検索用文字情報「GCC」に基づく集約画像36がWebブラウザ20等に表示されるとともに、併せて、テキストレイヤ33が表示され、当該テキストレイヤ33には、表示レイヤ31内に集約画像36を構成する画像のサムネイル画像と、構成する画像が備える文字列が表示される。一方、図12に示すように、抽出画像25をWebブラウザ20等に縮小して表示させたままでは集約画像36を構成する画像に含まれる文字の可読性は望ましくない。
As a result, as shown in FIG. 11, the aggregated
また、図13に示すように、集約画像36を構成する一の画像を指示画像としてのポインタPtで指示すると、集約画像の元となった画像に含まれる文字がテキストレイヤ33に拡大して表示される。このように、集約元の画像に含まれる文字が集約されたことで分断されたり、縮小されたりすることとなっても、集約画像36に含まれる文字の可読性が落ちることを抑制する。
Further, as shown in FIG. 13, when one image constituting the aggregated
尚、同図においてはテキストレイヤ33と集約画像36との重なる領域に関しては、テキストレイヤ33の表示レイヤ31,32を不透明にすることで表示レイヤ31,32内のテキストの読み易くしているが、テキストレイヤ33内の表示レイヤ31,32を透明にし、テキストレイヤ33の下の画像をテキストレイヤ33の上から視認できるようにしてもよく、さらに、その透明度が設定されるようにしてもよい。これによりテキストレイヤ33により隠れる画像の視認性が向上する。
In the figure, regarding the region where the
(その他の実施形態)
以下において上述したテキストGERMと画像GERMとが混在した場合における表示例について図面を参照して説明する。
図14は画像集約装置における抽出画像の一例、図15及び図16は集約画像における表示レイヤの表示例、図17、図18及び図19は集約画像における表示レイヤの他の表示例、図20は画像集約装置における他の抽出画像の一例及び集約画像における表示レイヤの表示例である。
(Other embodiments)
A display example in the case where the above-described text GERM and image GERM are mixed will be described below with reference to the drawings.
14 is an example of an extracted image in the image aggregation device, FIGS. 15 and 16 are examples of display layer display in the aggregate image, FIGS. 17, 18 and 19 are other examples of display layers in the aggregate image, and FIG. It is an example of another extracted image in an image aggregation device, and a display example of a display layer in an aggregate image.
画像集約装置は、抽出画像の一例として図14に示すような画像を取得し、他に抽出した画像ととともに図15や図16に示すような集約画像を生成して表示装置等に表示させた場合、それぞれの図に示すように、集約後における画像内であって、文字列が記載された文字列領域内の文字列をポインタPtで触れると、当該文字列を拡大して表示させる。尚、拡大された文字列は集約画像上であっても集約画像上以外の場所であってもよい。 The image aggregating apparatus acquires an image as shown in FIG. 14 as an example of the extracted image, and generates an aggregated image as shown in FIGS. 15 and 16 together with the other extracted images and displays the aggregated image on a display device or the like. In each case, as shown in each figure, when the character string in the character string area in which the character strings are described is touched with the pointer Pt in the image after aggregation, the character strings are enlarged and displayed. The enlarged character string may be on the aggregated image or at a place other than on the aggregated image.
また、画像集約装置は、抽出画像の一例として図14に示すような画像を取得し、他に抽出した画像ととともに図17、図18や図19に示すような集約画像を生成して表示装置等に表示させた場合、それぞれの図に示すように、文字列以外の指示位置にポインタPtで触れることより表示する文字列を変化させてもよい。 Further, the image aggregating apparatus acquires an image as shown in FIG. 14 as an example of the extracted image, generates an aggregated image as shown in FIGS. 17, 18, and 19 together with the other extracted images, and displays it. As shown in each figure, the character string to be displayed may be changed by touching the designated position other than the character string with the pointer Pt.
この場合、表示させる文字列は図14に示す全体ページのレイアウトに対応させてもよく、例えば図17であれば、指示位置に最も近い「住宅所有の関係別割合全国(平成15年)」と表示させることができる。このような表示制御は、切り出し領域中心(図17等では真ん中の画像の中心)から見て、上部に指示位置がある場合は、切り出し画像の物理的上部に配置される文字列を表示させてもよい。 In this case, the character string to be displayed may correspond to the layout of the entire page shown in FIG. 14. For example, in FIG. 17, “the ratio of home ownership by country (2003)” closest to the indicated position. Can be displayed. Such display control is performed by displaying a character string arranged at the physical upper part of the clipped image when the designated position is at the upper part as viewed from the center of the clipped area (the center of the middle image in FIG. 17 and the like). Also good.
また、画像集約装置は、抽出画像の一例として図20(a)に示すような画像を取得し、他に抽出した画像ととともに図20(b)に示すような集約画像を生成して表示装置等に表示させた場合、同図に示すように指示位置に最も近い文字列を表示させてもよい。このような場合においても抽出画像25の中心からその距離を基準にして最も近い文字列をテキストレイヤ33に表示させてもよい。
Further, the image aggregating apparatus acquires an image as shown in FIG. 20A as an example of the extracted image, generates an aggregated image as shown in FIG. 20B together with the other extracted images, and displays it. For example, the character string closest to the designated position may be displayed as shown in FIG. Even in such a case, the closest character string based on the distance from the center of the extracted
以上、本発明の好ましい実施形態について詳述したが、本発明に係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。例えば、本発明のプログラムを通信手段により提供することはもちろん、CD−ROM等の記録媒体に格納して提供することも可能である。 The preferred embodiments of the present invention have been described in detail above, but the present invention is not limited to the specific embodiments according to the present invention, and various modifications are possible within the scope of the gist of the present invention described in the claims.・ Change is possible. For example, the program of the present invention can be provided not only by communication means but also stored in a recording medium such as a CD-ROM.
本発明によれば、集約画像中の抽出画像内の文字の可読性が劣ることを抑制することができ、産業上の利用可能性が高い。 ADVANTAGE OF THE INVENTION According to this invention, it can suppress that the readability of the character in the extraction image in an aggregate image is inferior, and industrial applicability is high.
10a CPU
10b RAM
10c ROM
10d I/F
10e バス
11 検索部
12 結果分析部
13 データ管理部
14 データベース
15 テキスト生成部
16 SG生成部
17 表示制御部
20 Webブラウザ
21 入力ボックス
25 抽出画像
31、32 表示レイヤ
33 テキストレイヤ
36 集約画像
AR 仮想領域
Pt ポインタ
Bt 検索ボタン
10a CPU
10b RAM
10c ROM
10d I / F
Claims (2)
前記抽出手段により抽出された複数の抽出画像の少なくとも1つが文字列と図柄とを備えた抽出画像であり、かつ、該文字列を示す面積が該図柄を示す面積より大きい場合に、該抽出画像が文字列で構成されると判定する判定手段と、
前記文字列を拡大して表示させるための文字列表示領域を前記抽出画像の数に応じて生成するとともに、関心領域処理に基づいて、抽出された前記複数の抽出画像から集約画像を生成する生成手段と、
前記生成手段により生成された集約画像を表示させるとともに、前記生成手段により生成された文字列表示領域のそれぞれに、前記判定手段により文字列で構成されると判定された抽出画像と、前記抽出画像が備える文字列と、を当該抽出画像ごとに表示させる表示制御手段と、
を有する画像集約装置。 Extraction means for extracting a plurality of pieces of image information related to the search character information as extracted images based on the search character information input by the input device;
When at least one of the plurality of extracted images extracted by the extracting means is an extracted image including a character string and a design, and the area indicating the character string is larger than the area indicating the design, the extracted image Determining means for determining that is composed of a character string;
Generating a character string display area for enlarging and displaying the character string according to the number of the extracted images, and generating an aggregated image from the extracted extracted images based on a region of interest process Means,
The aggregated image generated by the generating unit is displayed, and the extracted image determined by the determining unit to be composed of the character string in each of the character string display areas generated by the generating unit, and the extracted image Display control means for displaying the character string included in each extracted image;
An image aggregating apparatus.
入力装置により入力される検索用文字情報に基づき、該検索用文字情報に関連する画像情報を抽出画像として複数抽出する抽出手段、
前記抽出手段により抽出された複数の抽出画像の少なくとも1つが文字列と図柄とを備えた抽出画像であり、かつ、該文字列を示す面積が該図柄を示す面積より大きい場合に、該抽出画像が文字列で構成されると判定する判定手段、
前記文字列を拡大して表示させるための文字列表示領域を前記抽出画像の数に応じて生成するとともに、関心領域処理に基づいて、抽出された前記複数の抽出画像から集約画像を生成する生成手段、
前記生成手段により生成された集約画像を表示させるとともに、前記生成手段により生成された文字列表示領域のそれぞれに、前記判定手段により文字列で構成されると判定された抽出画像と、前記抽出画像が備える文字列と、を当該抽出画像ごとに表示させる表示制御手段、
として機能させるための画像集約プログラム。 Computer
Extraction means for extracting a plurality of image information related to the search character information as extracted images based on the search character information input by the input device;
When at least one of the plurality of extracted images extracted by the extracting means is an extracted image including a character string and a design, and the area indicating the character string is larger than the area indicating the design, the extracted image Determining means for determining that is composed of a character string;
Generating a character string display area for enlarging and displaying the character string according to the number of the extracted images, and generating an aggregated image from the extracted extracted images based on a region of interest process means,
The aggregated image generated by the generating unit is displayed, and the extracted image determined by the determining unit to be composed of the character string in each of the character string display areas generated by the generating unit, and the extracted image Display control means for displaying a character string included in each extracted image,
Image aggregation program to function as
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007254770A JP5186863B2 (en) | 2007-09-28 | 2007-09-28 | Image aggregation device and image aggregation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007254770A JP5186863B2 (en) | 2007-09-28 | 2007-09-28 | Image aggregation device and image aggregation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009086935A JP2009086935A (en) | 2009-04-23 |
JP5186863B2 true JP5186863B2 (en) | 2013-04-24 |
Family
ID=40660295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007254770A Expired - Fee Related JP5186863B2 (en) | 2007-09-28 | 2007-09-28 | Image aggregation device and image aggregation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5186863B2 (en) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003067421A (en) * | 2001-08-30 | 2003-03-07 | Sony Corp | Information processing device, information processing method, recording medium and program |
JP2006019780A (en) * | 2004-06-30 | 2006-01-19 | Toshiba Corp | Television broadcast receiver, television broadcast reception system, and display control method |
US7848567B2 (en) * | 2004-09-23 | 2010-12-07 | Fuji Xerox Co., Ltd. | Determining regions of interest in synthetic images |
JP4900640B2 (en) * | 2005-03-30 | 2012-03-21 | 京セラ株式会社 | Portable terminal device and document display control method thereof |
JP4640591B2 (en) * | 2005-06-09 | 2011-03-02 | 富士ゼロックス株式会社 | Document search device |
-
2007
- 2007-09-28 JP JP2007254770A patent/JP5186863B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009086935A (en) | 2009-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5990180B2 (en) | Browsing related image search result sets | |
Gibin et al. | An exploratory cartographic visualisation of London through the Google Maps API | |
US20020089520A1 (en) | Method and system for enhanced detail-in-context viewing | |
US20090106653A1 (en) | Adaptive document displaying apparatus and method | |
US20110066983A1 (en) | Electronic device and method for providing shortcut interface | |
US20110231776A1 (en) | Standard schema and user interface for website maps | |
CN103577524A (en) | Business object representations and detail boxes display | |
US9245016B2 (en) | Information display apparatus and recording medium | |
US7478321B2 (en) | System and method for dynamically processing display information to combine display focus and context information in screen displays | |
JP2012014487A (en) | Information processing device, information browsing device, information processing method and program | |
AU2013325961B2 (en) | Information processing device and program | |
US9619126B2 (en) | Computer-readable non-transitory storage medium with image processing program stored thereon, element layout changed material generating device, image processing device, and image processing system | |
US20150026224A1 (en) | Electronic device, method and storage medium | |
JP5186863B2 (en) | Image aggregation device and image aggregation program | |
JP2012014608A (en) | Information processing device, information processing method and program | |
CN116384363A (en) | Automatic book typesetting method and system | |
CN114491309A (en) | Picture processing method and device | |
JP2012174188A (en) | Information display device and program | |
JP5596068B2 (en) | Electronic terminal and book browsing program | |
JPH07262207A (en) | Image data filing method, image data registering method, image data retrieving method and the device | |
JP6699730B2 (en) | Drawing data generation program, drawing data generation device, and drawing data generation method | |
TW509873B (en) | Generation method for dynamic user interface with arbitrary shape | |
Huddleston et al. | Working with Images | |
JP2022111793A (en) | Information processor and method for processing information | |
JP2022111796A (en) | Information processor and method for processing information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100818 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121009 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121225 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130107 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160201 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5186863 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |