JP2011159250A - Electronic leaflet information retrieval device - Google Patents

Electronic leaflet information retrieval device Download PDF

Info

Publication number
JP2011159250A
JP2011159250A JP2010022798A JP2010022798A JP2011159250A JP 2011159250 A JP2011159250 A JP 2011159250A JP 2010022798 A JP2010022798 A JP 2010022798A JP 2010022798 A JP2010022798 A JP 2010022798A JP 2011159250 A JP2011159250 A JP 2011159250A
Authority
JP
Japan
Prior art keywords
information
search
flyer
keyword
electronic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010022798A
Other languages
Japanese (ja)
Other versions
JP5504937B2 (en
Inventor
Naoko Kimura
尚子 木村
Aki Yasutake
杏季 安武
Tadashi Kanbayashi
忠志 神林
Tsutomu Ono
力 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toppan Inc
Original Assignee
Toppan Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toppan Printing Co Ltd filed Critical Toppan Printing Co Ltd
Priority to JP2010022798A priority Critical patent/JP5504937B2/en
Publication of JP2011159250A publication Critical patent/JP2011159250A/en
Application granted granted Critical
Publication of JP5504937B2 publication Critical patent/JP5504937B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To retrieve electronic leaflet information wherein a commodity name matching a commodity is placed, by inputting the commodity. <P>SOLUTION: This electronic leaflet information retrieval device is equipped with: an electronic leaflet information storage part storing electronic leaflet information wherein leaflet image data and text information included therein are associated; a keyword information storage part storing keyword information wherein a commodity and a commodity name-related word are associated; and a retrieval part searching the keyword information storage part with a retrieval word as a retrieval key, extracting, when detecting the commodity according with the retrieval word, a commodity name-related word associated with the commodity as a commodity name retrieval keyword, retrieving the electronic leaflet information stored in the electronic leaflet information storage part with the commodity name retrieval keyword as the retrieval keyword, and also extracting, when detecting the text information according with the commodity name retrieval keyword, the leaflet image data associated with the text information. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、チラシ広告の掲載情報を画像データ化してデータベースに登録した場合における電子チラシ情報の検索技術に関する。   The present invention relates to a search technology for electronic leaflet information in the case where leaflet advertisement publication information is converted into image data and registered in a database.

広告主が、チラシ広告集配信サイト運営企業が提供する広告フォーマットに広告条件情報とチラシ広告画像とを含むチラシ広告情報を入力して転送することによって、指定した広告期間においてインターネットに自動的に電子チラシ広告を公開し、顧客側端末機で閲覧させるチラシ広告配信システムが知られている(例えば、特許文献1参照)。この広告配信システムによれば、広告紙である「チラシ広告」をもとに電子チラシ広告を作成してインターネットに公開し、顧客側端末機が所望の電子チラシ広告を検索し閲覧することができる。   Advertisers automatically input flyer advertisement information including advertisement condition information and flyer advertisement images into the advertisement format provided by the flyer advertisement collection and distribution site operator, and automatically transfer it to the Internet during the specified advertisement period. 2. Description of the Related Art A flyer advertisement distribution system that publishes a flyer advertisement and browses it on a customer terminal (for example, see Patent Document 1). According to this advertisement distribution system, an electronic flyer advertisement is created based on a “flyer advertisement” that is an advertisement paper and published on the Internet, and a terminal on the customer side can search and browse a desired electronic flyer advertisement. .

また、顧客の情報端末が、電子メールによりまたはホームページのアクセスにより、検索対象商品の一般名称または商品分類等の情報を管理センタの情報処理装置に送信すると、その情報処理装置が受信した情報に関連する特売品情報を特売品情報データベースから検索して顧客の情報端末にメール送信する、特売品情報の配信方法が知られている(例えば、特許文献2参照)。   In addition, when the customer's information terminal sends information such as the general name of the search target product or product classification to the information processing device of the management center by e-mail or access to the homepage, the information processing device relates to the information received by the information processing device. There is known a method for distributing special product information in which special product information to be searched is searched from a special product information database and is sent to a customer information terminal by e-mail (see, for example, Patent Document 2).

特開2005−78159号公報JP 2005-78159 A 特開2005−209134号公報JP 2005-209134 A

しかしながら、特許文献1記載の広告配信システムでは、顧客側端末機は広告条件情報を検索の条件として設定し得るが、その広告条件情報は、端末機識別子、依頼日、登録番号、地域コード、広告条件、業種、修正有無、データ種別、その他備考欄であり、地域や広告期間等のチラシ広告に関する基本的な条件のみでしか電子チラシ広告を検索することができない。
また、特許文献2記載の配信方法は、顧客の購買ニーズに対する商品の特売品情報をメール配信するものであるため、顧客の購買ニーズを検索の入力とすることができても特売品情報しか検索することができない。
However, in the advertisement distribution system described in Patent Document 1, the customer terminal can set the advertisement condition information as a search condition. The advertisement condition information includes the terminal identifier, the request date, the registration number, the area code, the advertisement. It is a condition, type of business, presence / absence of correction, data type, and other remarks columns, and an electronic flyer advertisement can be searched only by basic conditions regarding a flyer advertisement such as a region and an advertisement period.
In addition, since the distribution method described in Patent Document 2 distributes the sale information on the products corresponding to the purchase needs of the customer by e-mail, even if the purchase needs of the customer can be used as input for search, only the sale information is searched. Can not do it.

消費者は、商品を購入したいと欲する場合に、購入希望の商品名は明らかであっても、実際に購入する店舗名や購入地が決まっていない場合がある。例えば、カレールーを購入したいという商品名は明らかであるが、具体的にどの店舗で購入するかが決まっていない場合等である。しかしながら、従来技術では、「カレールー」という商品名をもとに電子チラシ広告を検索し、カレールーを安売りしている店舗の電子チラシ広告を抽出して閲覧させることはできなかった。   When a consumer desires to purchase a product, the name of the store or the place of purchase may not be determined even though the name of the desired product is clear. For example, it is clear that the name of a product that wants to purchase Carrero is clear, but it is not yet decided at which store to purchase. However, in the prior art, it was not possible to search for electronic leaflet advertisements based on the product name “Carreru” and to extract and browse electronic leaflet advertisements of stores selling Carrero.

同じように消費者が、例えば○○社製の△△インチ液晶テレビを購入したい場合、テレビという商品をもとに電子チラシ広告を検索し、○○社製の△△インチ液晶テレビの広告が掲載された電子チラシ広告を抽出して閲覧させることはできなかった。   Similarly, if a consumer wants to purchase, for example, a △ company's △△ inch LCD TV, he searches for electronic flyer advertisements based on the TV product, and the XX company's △△ inch LCD TV advertisement is displayed. It was not possible to extract and view the published electronic flyer advertisements.

上記のように従来の広告配信システムや方法では、地域や広告期間等の広告に関する基
本的な条件のみでしか検索することが出来ないという問題があった。そこで、様々な店舗のチラシを横断的に商品名や価格で検索するために、例えば、全チラシに掲載されている品目の商品名や価格などをテキストデータとして入力する方法が考えられる。
As described above, the conventional advertisement distribution system and method have a problem that the search can be performed only with basic conditions relating to the advertisement such as the region and the advertisement period. Therefore, in order to search leaflets of various stores by product names and prices across the store, for example, a method of inputting the product names and prices of items listed in all leaflets as text data is conceivable.

しかしながら、手入力でデータベース化した場合であっても、その品目のチラシ内での正確な掲載位置までを入力することは困難であり、その結果、商品名や価格で検索したチラシを閲覧する場合に、検索した商品や価格がチラシ内のどの位置に掲載されているかは、閲覧者が自ら探す必要があった。   However, even when manually creating a database, it is difficult to enter the exact placement position of the item in the flyer, and as a result, when browsing a flyer searched for by product name or price. In addition, it is necessary for the viewer to find out where the searched product or price is listed in the flyer.

そこで本発明は上記問題を解決するためになされたものであり、検索キーを商品として供給し、その商品にマッチした商品名が掲載された電子チラシ情報を網羅的に検索することのできる電子チラシ情報検索装置を提供することを目的とする。   Accordingly, the present invention has been made to solve the above problem, and an electronic leaflet capable of exhaustively searching for electronic leaflet information in which a search key is supplied as a product and a product name matching the product is posted. An object is to provide an information retrieval apparatus.

本発明の請求項1に係る発明は、広告チラシの画像データであるチラシ画像データとこのチラシ画像データに含まれる文字の情報であるテキスト情報とを関連付けた電子チラシ情報を記憶する電子チラシ情報記憶部と、商品とこの商品に関連する言葉の文字列である商品名関連ワードとを関連付けたキーワード情報を記憶するキーワード情報記憶部と、検索ワードの供給を受ける入力部と、この入力部に供給された前記検索ワードを第1の検索キーとして前記キーワード情報記憶部に記憶された前記キーワード情報を検索し、前記検索ワードと文字列の一致する商品を検出した場合に、その検出した商品に関連付けられた商品名関連ワードを商品名検索キーワードとして抽出し、その商品名検索キーワードを第2の検索キーとして前記電子チラシ情報記憶部に記憶された電子チラシ情報を検索し、前記商品名検索キーワードと文字列の一致するテキスト情報を検出した場合に、その検出したテキスト情報に関連付けられたチラシ画像データを検索結果として抽出する検索部と、前記抽出された検索結果を出力する出力部と、を備えることを特徴とする電子チラシ情報検索装置である。   The invention according to claim 1 of the present invention is an electronic leaflet information storage for storing electronic leaflet information in which leaflet image data that is image data of an advertisement leaflet is associated with text information that is character information included in the leaflet image data. A keyword information storage unit for storing keyword information that associates a product with a product name related word that is a character string of words related to the product, an input unit that receives search word supply, and a supply to the input unit The keyword information stored in the keyword information storage unit is searched using the search word as a first search key, and when a product matching the search word and a character string is detected, it is associated with the detected product The product name-related word is extracted as a product name search keyword, and the product name search keyword is used as the second search key. When the electronic leaflet information stored in the information storage unit is searched and text information whose character string matches the product name search keyword is detected, the flyer image data associated with the detected text information is used as a search result. An electronic leaflet information search device comprising: a search unit for extracting; and an output unit for outputting the extracted search result.

本発明の請求項2に係る発明は、前記テキスト情報は、前記チラシ画像データに含まれる文字情報とこの文字情報の前記チラシ画像データにおける位置を示す位置情報とを含み、前記検索部は、前記検出したテキスト情報に関連付けられたチラシ画像データを抽出し、前記テキスト情報に含まれる位置情報に基づいて前記チラシ画像データに所定の強調装飾データを付加して検索結果とすることを特徴とする請求項1に記載の電子チラシ情報検索装置である。   In the invention according to claim 2 of the present invention, the text information includes character information included in the leaflet image data and position information indicating a position of the character information in the leaflet image data, and the search unit includes The flyer image data associated with the detected text information is extracted, and predetermined emphasis decoration data is added to the flyer image data based on the position information included in the text information to obtain a search result. Item 2. The electronic leaflet information search device according to Item 1.

本発明によれば、商品を検索キーとして供給し、その商品にマッチした商品名情報が掲載された電子チラシ情報を網羅的に検索することができる。   According to the present invention, products can be supplied as search keys, and electronic leaflet information in which product name information matching the products is posted can be comprehensively searched.

本発明の一実施形態である電子チラシ情報検索装置を適用した電子チラシ情報検索システムの概略のシステム構成図である。1 is a schematic system configuration diagram of an electronic leaflet information search system to which an electronic leaflet information search device according to an embodiment of the present invention is applied. 同実施形態である電子チラシ情報検索装置を適用した電子チラシ情報登録検索装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the electronic flyer information registration search apparatus to which the electronic flyer information search apparatus which is the embodiment is applied. 同実施形態における、電子チラシ情報記憶部に記憶される電子チラシ情報の概略のデータ構成を示す図である。It is a figure which shows the schematic data structure of the electronic leaflet information memorize | stored in the electronic leaflet information storage part in the embodiment. 同実施形態における、チラシ画像情報のより詳細なデータ構成例である。It is an example of a more detailed data structure of leaflet image information in the embodiment. 同実施形態における、チラシテキスト情報のより詳細なデータ構成例である。It is an example of a more detailed data structure of flyer text information in the same embodiment. 同実施形態における、チラシテキスト情報の「テキスト情報」のデータ構成を説明するための図である。It is a figure for demonstrating the data structure of "text information" of flyer text information in the embodiment. 同実施形態における、キーワード情報記憶部に記憶されるキーワード情報の概略のデータ構成を示す図である。It is a figure which shows the rough data structure of the keyword information memorize | stored in the keyword information storage part in the embodiment. 同実施形態における、類似文字情報記憶部に記憶される類似文字情報の概略のデータ構成を示す図である。It is a figure which shows the schematic data structure of the similar character information memorize | stored in the similar character information storage part in the embodiment. 同実施形態における、電子チラシ情報検索システムの検索の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of the search of the electronic leaflet information search system in the embodiment. 同実施形態における、検索結果の表示例を模式的に示した図である。It is the figure which showed typically the example of a display of the search result in the same embodiment.

以下、本発明を実施するための形態について、図面を参照して詳細に説明する。図1は、本発明の一実施形態である電子チラシ情報検索装置を適用した電子チラシ情報検索システムの概略のシステム構成図である。同図に示すように、電子チラシ情報検索システム1は、電子チラシ情報登録検索装置10と検索端末20とをネットワーク30を介して接続した構成を有する。   Hereinafter, embodiments for carrying out the present invention will be described in detail with reference to the drawings. FIG. 1 is a schematic system configuration diagram of an electronic leaflet information retrieval system to which an electronic leaflet information retrieval device according to an embodiment of the present invention is applied. As shown in the figure, the electronic leaflet information search system 1 has a configuration in which an electronic leaflet information registration and search device 10 and a search terminal 20 are connected via a network 30.

電子チラシ情報登録検索装置10は、紙媒体である広告紙をもとに電子チラシ情報を生成して登録する登録機能と、検索端末20から供給される検索ワードに基づいて電子チラシ情報を検索し、その検索結果を検索端末20に供給する検索機能とを備える。本発明の一実施形態である電子チラシ情報検索装置は、電子チラシ情報登録検索装置10の検索機能を備える装置である。
本実施形態における広告紙は、スーパーマーケット、百貨店、ドラッグストア等の店舗が商品や役務を広告するための「広告チラシ」である。
The electronic flyer information registration / retrieval device 10 searches for electronic flyer information based on a registration function for generating and registering electronic flyer information based on advertising paper as a paper medium and a search word supplied from the search terminal 20. And a search function for supplying the search result to the search terminal 20. The electronic leaflet information search device according to an embodiment of the present invention is a device provided with the search function of the electronic leaflet information registration and search device 10.
The advertising paper in this embodiment is an “advertisement flyer” for a store such as a supermarket, a department store, or a drug store to advertise a product or service.

検索端末20は、電子チラシ情報登録検索装置10にアクセスして電子チラシ情報を検索し検索結果を閲覧させる装置であり、一般的なパーソナルコンピュータ、検索専用端末、携帯端末等の情報処理装置を用いて構成することができる。ネットワーク30は、例えばTCP/IP(Transmission Control Protocol/Internet Protocol)により通信可能な電気通信回線である。   The search terminal 20 is an apparatus that accesses the electronic flyer information registration and search apparatus 10 to search electronic flyer information and browse the search results, and uses an information processing apparatus such as a general personal computer, a dedicated search terminal, or a portable terminal. Can be configured. The network 30 is an electric communication line capable of communicating by, for example, TCP / IP (Transmission Control Protocol / Internet Protocol).

次に、電子チラシ情報登録検索装置10の構成について説明する。図2は、本実施形態である電子チラシ情報検索装置を適用した電子チラシ情報登録検索装置10の機能構成を示すブロック図である。同図に示すように、電子チラシ情報登録検索装置10は、読取部101と、文字領域抽出部102と、文字情報検出部103と、位置情報検出部104と、登録部105と、記憶部106と、操作部107と、入力部108と、検索部109と、出力部110とを備える。   Next, the configuration of the electronic leaflet information registration / retrieval apparatus 10 will be described. FIG. 2 is a block diagram illustrating a functional configuration of the electronic leaflet information registration / retrieval device 10 to which the electronic leaflet information retrieval device according to the present embodiment is applied. As shown in the figure, the electronic flyer information registration / retrieval apparatus 10 includes a reading unit 101, a character region extraction unit 102, a character information detection unit 103, a position information detection unit 104, a registration unit 105, and a storage unit 106. An operation unit 107, an input unit 108, a search unit 109, and an output unit 110.

読取部101は、広告紙の紙面の情報を読取って広告紙の画像データであるチラシ画像データを生成する装置であり、例えばイメージスキャナである。文字領域抽出部102は、チラシ画像データから文字を含む矩形領域である文字領域データを抽出する。具体的には、文字領域抽出部102は、例えばチラシ画像データにノイズ除去処理を行って画像の輪郭を検出し、そのフィルタ処理後の画像データについて公知技術である特徴量分析処理を行って文字を含む矩形領域を推定して文字領域データを抽出する。ノイズ除去処理には、例えばSobelフィルタを用いることができる。   The reading unit 101 is an apparatus that reads information on the page of advertisement paper and generates flyer image data that is image data of the advertisement paper, and is an image scanner, for example. The character region extraction unit 102 extracts character region data that is a rectangular region including characters from the flyer image data. Specifically, for example, the character region extraction unit 102 performs noise removal processing on the flyer image data to detect the outline of the image, and performs a feature amount analysis process, which is a known technique, on the image data after the filter processing. Character area data is extracted by estimating a rectangular area including. For the noise removal process, for example, a Sobel filter can be used.

文字情報検出部103は、文字領域データに含まれる文字情報を検出する。例えば、文字情報検出部103は、文字領域データに含まれる画像と予め記憶した文字パターンとをパターンマッチングすることによって文字情報を検出する。位置情報検出部104は、文字領域データに含まれる文字情報の、チラシ画像データにおける位置情報を検出する。具体的には、例えば、位置情報検出部104は、チラシ画像データのいずれかの基準位置を原点として、文字領域データそのものの左上頂点の座標値と右下頂点の座標値とを文字情
報の位置情報として検出する。なお、基準位置としては、例えば、チラシ画像データの画像平面の4隅のうちいずれかの位置を原点としてよいし、画像平面の中心位置を原点としてもよい。または、画像平面の外側に原点を設けてもよい。
The character information detection unit 103 detects character information included in the character area data. For example, the character information detection unit 103 detects character information by performing pattern matching between an image included in the character area data and a character pattern stored in advance. The position information detection unit 104 detects position information in the leaflet image data of the character information included in the character area data. Specifically, for example, the position information detection unit 104 sets the coordinate value of the upper left vertex and the lower right vertex of the character area data itself as the origin of any reference position of the leaflet image data as the position of the character information. Detect as information. As the reference position, for example, any one of the four corners of the image plane of the flyer image data may be the origin, and the center position of the image plane may be the origin. Alternatively, the origin may be provided outside the image plane.

登録部105は、電子チラシ情報登録部105aとキーワード情報登録部105bとを備える。電子チラシ情報登録部105aは、チラシ画像データと文字情報と位置情報とを関連付けて電子チラシ情報を生成し記憶部106に記憶する。キーワード情報登録部105bは、商品とその商品の検索の有効期間と、その商品に関連する言葉の文字列である商品名関連ワードと、その商品名関連ワードの類義語/同義語とを関連付けたキーワード情報を記憶部106に記憶する。   The registration unit 105 includes an electronic leaflet information registration unit 105a and a keyword information registration unit 105b. The electronic leaflet information registration unit 105 a generates electronic leaflet information by associating the leaflet image data, the character information, and the position information, and stores the electronic leaflet information in the storage unit 106. The keyword information registration unit 105b associates a product, a search term of the product, a product name related word that is a character string of words related to the product, and a synonym / synonym of the product name related word. Information is stored in the storage unit 106.

記憶部106は、その機能構成として、電子チラシ情報記憶部106aと、キーワード情報記憶部106bと、類似文字情報記憶部106cと、Webデータ記憶部106dとを備える。電子チラシ情報記憶部106aは、電子チラシ情報を記憶する。キーワード情報記憶部106bは、キーワード情報を記憶する。類似文字情報記憶部106cは、類似文字情報を記憶する。Webデータ記憶部106dは、電子チラシ情報検索サイトを構成するWebデータを記憶する。電子チラシ情報、キーワード情報、および類似文字情報それぞれについてのデータ構成の詳細は後述する。
記憶部106は、例えば、ハードディスク装置もしくは半導体記憶装置またはそれらの組み合わせで構成する。また、電子チラシ情報記憶部106aと、キーワード情報記憶部106bと、類似文字情報記憶部106cと、Webデータ記憶部106dとのうち一部分を他の部分と物理的に分離して構成してもよいし、パーティションによって論理的に分離して構成してもよい。あるいは、その組み合わせとしてもよい。
As a functional configuration, the storage unit 106 includes an electronic leaflet information storage unit 106a, a keyword information storage unit 106b, a similar character information storage unit 106c, and a Web data storage unit 106d. The electronic leaflet information storage unit 106a stores electronic leaflet information. The keyword information storage unit 106b stores keyword information. The similar character information storage unit 106c stores similar character information. The Web data storage unit 106d stores Web data constituting the electronic leaflet information search site. Details of the data structure of each of the electronic leaflet information, keyword information, and similar character information will be described later.
The storage unit 106 is configured by, for example, a hard disk device, a semiconductor storage device, or a combination thereof. In addition, a part of the electronic leaflet information storage unit 106a, the keyword information storage unit 106b, the similar character information storage unit 106c, and the Web data storage unit 106d may be configured to be physically separated from other parts. However, it may be configured to be logically separated by partition. Or it is good also as the combination.

操作部107は、電子チラシ情報記憶部106aに記憶される電子チラシ情報と、キーワード情報記憶部106bに記憶されるキーワード情報とのデータを整理(変更、削除、または追加)するための操作を受け付ける操作インタフェースである。操作部107は、例えば、キーボードおよびマウスで構成される。
入力部108は、外部から供給される入力情報を入力して登録部105に供給したり検索部109に供給したりする入力インタフェースである。つまり、入力部108は、電子チラシ情報記憶部106aに記憶される電子チラシ情報のデータを整理するための情報を入力すると、その情報を電子チラシ情報登録部105aに供給する。また、入力部108は、キーワード情報記憶部106bに記憶されるキーワード情報のデータを整理するための情報を入力すると、その情報をキーワード情報登録部105bに供給する。さらに、入力部108は、検索ワードを入力するとその検索ワードを検索部109に供給する。
The operation unit 107 receives an operation for organizing (changing, deleting, or adding) data of electronic leaflet information stored in the electronic leaflet information storage unit 106a and keyword information stored in the keyword information storage unit 106b. Operation interface. The operation unit 107 is composed of, for example, a keyboard and a mouse.
The input unit 108 is an input interface that inputs input information supplied from the outside and supplies the input information to the registration unit 105 or to the search unit 109. That is, when the input unit 108 inputs information for organizing data of electronic leaflet information stored in the electronic leaflet information storage unit 106a, the input unit 108 supplies the information to the electronic leaflet information registration unit 105a. In addition, when the input unit 108 inputs information for organizing keyword information data stored in the keyword information storage unit 106b, the input unit 108 supplies the information to the keyword information registration unit 105b. Furthermore, when the input unit 108 inputs a search word, the input unit 108 supplies the search word to the search unit 109.

検索部109は、類似文字情報記憶部106cに記憶された類似文字情報で検索ワードをフィルタリングして検索ワードの誤認入力やキータイプミス等による文字列の間違いを適正化した後、フィルタリング後の検索ワードを検索キーとして、キーワード情報記憶部106bに記憶されたキーワード情報からマッチするキーワード情報を抽出する。そして、検索部109は、抽出したキーワード情報を検索キーとして、電子チラシ情報記憶部106aに記憶された電子チラシ情報からマッチする電子チラシ情報を抽出する。この検索処理の詳細については後述する。出力部110は、抽出した電子チラシ情報に基づく所定の検索結果を出力する。   The search unit 109 filters the search word with the similar character information stored in the similar character information storage unit 106c to optimize the error in the character string due to an erroneous input of the search word or a key type error, and then performs the search after filtering. Using the word as a search key, matching keyword information is extracted from the keyword information stored in the keyword information storage unit 106b. Then, the search unit 109 extracts matching electronic leaflet information from the electronic leaflet information stored in the electronic leaflet information storage unit 106a using the extracted keyword information as a search key. Details of this search processing will be described later. The output unit 110 outputs a predetermined search result based on the extracted electronic leaflet information.

上述した構成を備える電子チラシ情報登録検索装置10は、読取部101であるイメージスキャナと情報処理装置であるコンピュータとにより構成される。   The electronic leaflet information registration / retrieval apparatus 10 having the above-described configuration includes an image scanner that is a reading unit 101 and a computer that is an information processing apparatus.

次に、記憶部106に記憶される電子チラシ情報、キーワード情報、および類似文字情報について説明する。図3は、電子チラシ情報記憶部106aに記憶される電子チラシ情
報の概略のデータ構成を示す図である。同図に示すように、電子チラシ情報記憶部106aには、チラシ画像情報LIaとチラシテキスト情報LIbとを含む電子チラシ情報LIが記憶される。
Next, electronic leaflet information, keyword information, and similar character information stored in the storage unit 106 will be described. FIG. 3 is a diagram showing a schematic data configuration of electronic leaflet information stored in the electronic leaflet information storage unit 106a. As shown in the drawing, electronic leaflet information LI including leaflet image information LIa and leaflet text information LIb is stored in the electronic leaflet information storage unit 106a.

図4は、チラシ画像情報LIaのより詳細なデータ構成例である。同図に示すように、チラシ画像情報LIaは、「チラシ属性情報」と「チラシ画像データ」との項目を含む。そして、「チラシ属性情報」は、「チラシID」と「チラシ主」と「チラシ主ID」と「店舗名」と「店舗ID」と「事業形態」と「郵便番号」と「所在地」と「掲載開始日」と「掲載終了日」と「ジャンル」との項目を含む。
「チラシID」は、チラシ画像情報LIaの各レコードの識別子である。チラシ画像情報LIaとテキスト情報LIbとは、「チラシID」を主キーとして関連付けされる。「チラシ主」は、広告紙の広告主(オーナ)の氏名または名称の文字列である。「チラシ主ID」は、「チラシ主」の識別子である。「店舗名」は、広告紙が適用される店舗の名称の文字列である。「店舗ID」は、「店舗名」が示す店舗の識別子である。「事業形態」は、「店舗名」が示す店舗の事業形態を示す文字列または識別子である。「郵便番号」および「所在地」は、「店舗名」が示す店舗の所在地の郵便番号および住所である。「掲載開始日」および「掲載終了日」は、広告紙の有効期間を示す日付である。「ジャンル」は、「店舗名」が示す店舗が取り扱う商品および役務の主なジャンルを示す文字列または識別子である。「チラシ画像データ」は、広告紙を読取部101で読み取って生成された画像データである。
チラシ画像情報LIaのうち「チラシ画像データ」を除く他の項目のデータは、操作部107の操作によって、または外部からの入力部108への入力によって、電子チラシ情報登録部105aが登録する。また、「チラシ画像データ」は、読取部101から出力された画像データを電子チラシ情報登録部105aが登録する。
FIG. 4 is a more detailed data configuration example of the leaflet image information LIa. As shown in the figure, the flyer image information LIa includes items of “flyer attribute information” and “flyer image data”. The “flyer attribute information” includes “flyer ID”, “flyer owner”, “flyer owner ID”, “store name”, “store ID”, “business form”, “postal code”, “location”, “ It includes items of “publication start date”, “publication end date”, and “genre”.
The “flyer ID” is an identifier of each record of the flyer image information LIa. The leaflet image information LIa and the text information LIb are associated with each other using “flyer ID” as a main key. The “flyer owner” is a character string of the name or name of the advertiser (owner) of the advertising paper. The “flyer owner ID” is an identifier of “flyer owner”. “Store name” is a character string of the name of the store to which the advertisement paper is applied. “Store ID” is an identifier of the store indicated by “Store name”. “Business form” is a character string or an identifier indicating the business form of the store indicated by “Store name”. “Postal code” and “location” are the postal code and address of the store location indicated by “store name”. “Posting start date” and “posting end date” are dates indicating the validity period of the advertising paper. “Genre” is a character string or identifier indicating the main genre of products and services handled by the store indicated by “Store Name”. The “flyer image data” is image data generated by reading advertisement paper with the reading unit 101.
Data of items other than the “flyer image data” in the leaflet image information LIa is registered by the electronic leaflet information registration unit 105a by the operation of the operation unit 107 or the input to the input unit 108 from the outside. The “flyer image data” is registered by the electronic leaflet information registration unit 105a with the image data output from the reading unit 101.

図5は、チラシテキスト情報LIbのより詳細なデータ構成例である。同図に示すように、チラシテキスト情報LIbは、「チラシID」と「テキスト情報」と「カテゴリ」との項目を含む。「チラシID」は、上記のとおり、チラシテキスト情報LIbのレコードとチラシ画像情報LIaのレコードとを関連付ける識別子である。「テキスト情報」は、「チラシID」に関連付けられたチラシ画像情報LIaの「チラシ画像データ」から、文字情報検出部103および位置検出部104がそれぞれ検出した文字情報および位置情報である。「カテゴリ」は、「テキスト情報」に含まれる文字情報の属性を示す文字列であり、例えば、“テーマ”、“商品”、“付帯情報”である。
チラシテキスト情報LIbのうち「チラシID」および「カテゴリ」の各項目のデータは、操作部107の操作によって、または外部からの入力部108への入力によって、電子チラシ情報登録部105aが登録する。また、「テキスト情報」は、文字情報検出部103および位置情報検出部104から出力された文字情報および位置情報を電子チラシ情報登録部105aが登録する。
FIG. 5 is a more detailed data configuration example of the flyer text information LIb. As shown in the figure, the flyer text information LIb includes items of “flyer ID”, “text information”, and “category”. As described above, the “flyer ID” is an identifier that associates the record of the flyer text information LIb with the record of the flyer image information LIa. “Text information” is character information and position information respectively detected by the character information detection unit 103 and the position detection unit 104 from “flyer image data” of the leaflet image information LIa associated with the “flyer ID”. “Category” is a character string indicating the attribute of character information included in “text information”, and is, for example, “theme”, “product”, and “accompanying information”.
The data of each item of “flyer ID” and “category” in the flyer text information LIb is registered by the electronic flyer information registration unit 105a by the operation of the operation unit 107 or the input to the input unit 108 from the outside. In the “text information”, the electronic leaflet information registration unit 105 a registers the character information and the position information output from the character information detection unit 103 and the position information detection unit 104.

なお、電子チラシ情報記憶部106aは、チラシ画像情報LIaとチラシテキスト情報LIbとを一体的なテーブルデータとして記憶するようにしてもよい。   The electronic leaflet information storage unit 106a may store the leaflet image information LIa and the leaflet text information LIb as integral table data.

図6は、チラシテキスト情報LIbの「テキスト情報」のデータ構成を説明するための図であり、チラシ画像データの画像の左上部分を模式的に表した図である。同図において、チラシ画像データ61には文字列“OPEN”が含まれている。電子チラシ情報登録検索装置1の文字領域抽出部102がチラシ画像データ61から文字“O”を含む矩形領域である文字領域データ62を抽出すると、文字情報検出部103は、文字領域データ62に含まれる文字情報である“O”を検出する。また、位置情報検索部104は、文字“O”の位置を示す位置情報として、文字領域データ62の左上頂点の座標値(X1L,Y1L)と右下頂点の座標値(X1R,Y1R)とのペアを検出する。なお、この例の場合、画像平面の原点は、チラシ画像データ61の左上隅の位置である。   FIG. 6 is a diagram for explaining the data structure of “text information” of the flyer text information LIb, and schematically shows the upper left part of the image of the flyer image data. In the figure, the leaflet image data 61 includes a character string “OPEN”. When the character area extraction unit 102 of the electronic leaflet information registration / retrieval apparatus 1 extracts the character area data 62 that is a rectangular area including the character “O” from the flyer image data 61, the character information detection unit 103 is included in the character area data 62. "O" which is character information to be detected is detected. Further, the position information search unit 104 uses the coordinate values (X1L, Y1L) of the upper left vertex and the coordinate values (X1R, Y1R) of the lower right vertex of the character area data 62 as position information indicating the position of the character “O”. Detect a pair. In the case of this example, the origin of the image plane is the position of the upper left corner of the leaflet image data 61.

そして、上記と同様にして、文字領域抽出部102がチラシ画像データ61から文字“P”,“E”,“N”の各文字を含む文字領域データ63,64,65を抽出すると、文字情報検出部103は、文字領域データ63,64,65に含まれる文字情報である“P”,“E”,“N”を検出する。また、位置情報検索部104は、文字“P”,“E”,“N”の位置を示す位置情報として、文字領域データ63,64,65それぞれの左上頂点の座標値と右下頂点の座標値とのペアである(X2L,Y2L),(X2R,Y2R)と、(X3L,Y3L),(X3R,Y3R)と、(X4L,Y4L),(X4R,Y4R)とを検出する。   Similarly to the above, when the character area extraction unit 102 extracts the character area data 63, 64, 65 including the characters “P”, “E”, “N” from the leaflet image data 61, the character information The detection unit 103 detects “P”, “E”, and “N” that are character information included in the character region data 63, 64, and 65. Further, the position information search unit 104 uses, as position information indicating the positions of the characters “P”, “E”, “N”, the coordinate values of the upper left vertex and the coordinates of the lower right vertex of the character area data 63, 64, 65, respectively. (X2L, Y2L), (X2R, Y2R), (X3L, Y3L), (X3R, Y3R), and (X4L, Y4L), (X4R, Y4R) that are pairs with values are detected.

そして、電子チラシ情報登録部105aは、文字情報“O”,“P”,“E”,“N”と、位置情報(X1L,Y1L),(X1R,Y1R),(X2L,Y2L),(X2R,Y2R),(X3L,Y3L),(X3R,Y3R),(X4L,Y4L),(X4R,Y4R)とから、「“OPEN”,X1L,Y1L,X1R,Y1R,X2L,Y2L,X2R,Y2R,X3L,Y3L,X3R,Y3R,X4L,Y4L,X4R,Y4R」を、チラシテキスト情報LIbの「テキスト情報」の項目に格納する。   Then, the electronic leaflet information registration unit 105a includes character information “O”, “P”, “E”, “N”, and position information (X1L, Y1L), (X1R, Y1R), (X2L, Y2L), ( X2R, Y2R), (X3L, Y3L), (X3R, Y3R), (X4L, Y4L), (X4R, Y4R) and "" OPEN ", X1L, Y1L, X1R, Y1R, X2L, Y2L, X2R, “Y2R, X3L, Y3L, X3R, Y3R, X4L, Y4L, X4R, Y4R” are stored in the “text information” item of the flyer text information LIb.

図7は、キーワード情報記憶部106bに記憶されるキーワード情報の概略のデータ構成を示す図である。同図に示すように、キーワード情報は、「商品」と「有効期間」と「商品名関連ワード」と「類義語/同義語」との項目を含む。「商品」は、商品を任意のカテゴリで分類する言葉の文字列であり、例えば、“テレビ”、“ビール”、“パソコン”、“デジタルカメラ”、“たまご”、“シーフード”等のように、消費者の希望する商品に関して分類したものである。「有効期間」は、商品が適用される有効期間を年月日で示したものである。なお、有効期間を設定しない場合は、例えば“−”を設定する。「商品名関連ワード」は、商品に関連する言葉の文字列であり、商品名をより細かく分類したものである。「類義語/同義語」は、「商品名関連ワード」の言葉の類義語および同義語の文字列である。   FIG. 7 is a diagram showing a schematic data structure of keyword information stored in the keyword information storage unit 106b. As shown in the figure, the keyword information includes items of “product”, “valid period”, “product name related word”, and “synonyms / synonyms”. "Product" is a word string that classifies products in an arbitrary category, such as "TV", "Beer", "PC", "Digital Camera", "Tamago", "Seafood", etc. Categorized with respect to the products desired by consumers. “Effective period” indicates the effective period in which the product is applied by date. In the case where the effective period is not set, for example, “-” is set. The “product name related word” is a character string of words related to the product, and is a product name classified more finely. The “synonym / synonym” is a synonym of the word “product name related word” and a character string of the synonym.

図8は、類似文字情報記憶部106cに記憶される類似文字情報の概略のデータ構成を示す図である。同図に示すように、類似語情報は、「キーワード」と「類似文字」との項目を含む。「キーワード」は、検索ワードとして用いられやすいと想定される言葉の文字列である。「類似文字」は、「キーワード」の文字列に外見上類似した文字列である。   FIG. 8 is a diagram showing a schematic data configuration of similar character information stored in the similar character information storage unit 106c. As shown in the figure, the similar word information includes items of “keyword” and “similar character”. The “keyword” is a character string of a word that is assumed to be easily used as a search word. The “similar character” is a character string that looks similar to the character string of “keyword”.

次に、本発明の一実施形態である電子チラシ情報検索装置を適用した電子チラシ情報検索システムの検索機能の動作について説明する。図9は、電子チラシ情報検索システム1の検索の処理手順を示すフローチャートである。まず、電子チラシ情報登録検索装置10の動作について説明する。ステップS101において、入力部108は、検索の要求元である検索端末20から送信された電子チラシ情報検索サイトのURL(Uniform Resource Locator)を受信すると、この情報を検索部109に供給する。次に、ステップS102において、検索部109は、Webデータ記憶部106dからURLに基づいて電子チラシ情報検索サイトのWebデータを読み出し、このWebデータを出力部110から検索の要求元である検索端末20に対して送信する。
なお、ここで、電子チラシ情報登録検索装置10は、検索端末20に対してユーザ名およびパスワードを要求し、これらを取得して認証できた場合にのみ電子チラシ情報検索サイトのWebデータを送信するようにしてもよい。
Next, the operation of the search function of the electronic leaflet information search system to which the electronic leaflet information search device according to an embodiment of the present invention is applied will be described. FIG. 9 is a flowchart showing a search processing procedure of the electronic leaflet information search system 1. First, the operation of the electronic leaflet information registration / retrieval apparatus 10 will be described. In step S <b> 101, upon receiving the URL (Uniform Resource Locator) of the electronic leaflet information search site transmitted from the search terminal 20 that is the search request source, the input unit 108 supplies this information to the search unit 109. Next, in step S102, the search unit 109 reads the web data of the electronic flyer information search site from the web data storage unit 106d based on the URL, and retrieves the web data from the output unit 110 as a search request source 20 that is a search request source. Send to.
Here, the electronic leaflet information registration / retrieval apparatus 10 requests the search terminal 20 for a user name and password, and transmits the web data of the electronic leaflet information search site only when the user name and password are acquired and authenticated. You may do it.

ステップS103において、入力部108は、検索の要求元である検索端末20から送信された検索ワードを受信すると、これを検索部109に供給する。次に、ステップS104において、検索部109は、類似文字情報記憶部106cに記憶された類似文字情報の類似文字と検索ワードとの文字列を比較する。そして、検索部109は、検索ワードと文字列の一致する類似文字があると判定した場合は、その類似文字に関係付けられたキーワードで検索ワードを置き換える。一方、検索部109は、検索ワードと文字列の一致する類似文字がないと判定した場合は、検索ワードの置き換えは行わない。つまり、検索部109は、類似文字情報記憶部106cに記憶された類似文字情報で検索ワードをフィルタリングして、検索ワードの誤認入力やキータイプミス等による文字列の間違いを適正化する。
次に、検索部109は、キーワード情報記憶部106bに記憶されたキーワード情報から、フィルタリング後の検索ワードと文字列の一致する商品を検索する。そして、検索部109は、フィルタリング後の検索ワードと文字列の一致する商品を検出した場合は、その商品に関係付けられた全ての商品名関連ワードおよび類義語/同義語を、商品名検索キーワードとして抽出する。
なお、検索部109は、キーワード情報から商品名を検索する際に、有効期間が設定されている場合はこの期間に現在の日付(検索日)が含まれているか否かを判定し、有効期間に検索日が含まれている場合についてのみ、検索された商品名を検出するようにしてもよい。
In step S103, upon receiving the search word transmitted from the search terminal 20 that is the search request source, the input unit 108 supplies the search word to the search unit 109. Next, in step S104, the search unit 109 compares the character strings of the similar characters in the similar character information stored in the similar character information storage unit 106c and the search word. If the search unit 109 determines that there is a similar character that matches the search word and the character string, the search unit 109 replaces the search word with a keyword associated with the similar character. On the other hand, if the search unit 109 determines that there is no similar character that matches the search word and the character string, the search unit 109 does not replace the search word. In other words, the search unit 109 filters the search word with the similar character information stored in the similar character information storage unit 106c, and optimizes the error in the character string due to the erroneous input of the search word, the key type error, or the like.
Next, the search unit 109 searches the keyword information stored in the keyword information storage unit 106b for products that match the search word after filtering and the character string. When the search unit 109 detects a product whose character string matches the search word after filtering, all the product name related words and synonyms / synonyms related to the product are used as product name search keywords. Extract.
Note that the search unit 109 determines whether or not the current date (search date) is included in this period when the valid period is set when searching for the product name from the keyword information. Only when the search date is included in, the searched product name may be detected.

次に、ステップS105において、検索部109は、電子チラシ情報記憶部106aに記憶されたチラシテキスト情報LIbから、商品名検索キーワードと文字列の一致するテキスト情報を含むレコードを検索し、そのレコードの含まれるチラシIDを抽出する。そして、検索部109は、電子チラシ情報記憶部106aに記憶されたチラシ画像情報LIaから、抽出したチラシIDに対応するチラシ画像データを抽出する。   Next, in step S105, the search unit 109 searches the flyer text information LIb stored in the electronic flyer information storage unit 106a for a record including text information that matches the product name search keyword and the character string, and Extract the included flyer ID. Then, the search unit 109 extracts leaflet image data corresponding to the extracted leaflet ID from the leaflet image information LIa stored in the electronic leaflet information storage unit 106a.

次に、ステップS106において、検索部109は、抽出したチラシ画像データについて、商品名検索キーワードと文字列の一致する文字情報の位置に強調装飾を付加する。この強調装飾とは、対応する文字情報を目立たせるための装飾であり、例えば、文字を囲む矩形や楕円形状の枠、文字を含むように重ねる透過性のあるマット、文字のアンダーライン等である。具体的に、文字情報が“A社製液晶テレビB型”であり、強調装飾が矩形枠である場合について説明する。この場合、検索部109は、テキスト情報の“A社製液晶テレビB型”に対応付けられている位置情報を参照し、“A”,“社”,“製”,“液”,“晶”,“テ”,“レ”,“ビ”,“B”,“型”それぞれの座標値を少なくとも全て含む矩形範囲の頂点の座標値を計算し、チラシ画像データのその矩形範囲の周囲に例えば赤色等の枠の画像データ(強調装飾データ)を付加する。
なお、チラシ画像データへの強調装飾の付加は、チラシ画像データに強調装飾データを書き込んでもよいし、チラシ画像データと強調装飾データと強調装飾データの位置を示す座標値とを関係付けるようにしてもよい。
Next, in step S106, the search unit 109 adds an emphasis decoration to the extracted leaflet image data at the character information position where the product name search keyword matches the character string. The emphasis decoration is a decoration for making the corresponding character information stand out, for example, a rectangle or an oval frame surrounding the character, a transparent mat that overlaps to include the character, an underline of the character, etc. . Specifically, a case will be described in which the character information is “A company liquid crystal television B type” and the emphasis decoration is a rectangular frame. In this case, the search unit 109 refers to the position information associated with the text information “A company liquid crystal television B type”, and “A”, “company”, “manufactured”, “liquid”, “crystal” Calculates the coordinate values of the vertices of the rectangular range including at least all the coordinate values of “,” “te”, “le”, “bi”, “B”, and “type”, and around the rectangular range of the flyer image data. For example, image data (enhanced decoration data) of a frame such as red is added.
The emphasis decoration can be added to the flyer image data by writing the emphasis decoration data in the flyer image data, or by relating the flyer image data, the emphasis decoration data, and the coordinate value indicating the position of the emphasis decoration data. Also good.

次に、ステップS107において、検索部109は、強調装飾を付加したチラシ画像データ(検索結果)を、出力部110から要求元である検索端末20に対して送信する。   Next, in step S107, the search unit 109 transmits the flyer image data (search result) with emphasis decoration from the output unit 110 to the search terminal 20 that is the request source.

次に、検索の要求元である検索端末20の動作について説明する。ステップS201において、検索端末20は、電子チラシ情報検索サイトのURLを電子チラシ情報登録検索装置10に対して送信しWebアクセスを行う。ステップS202において、検索端末20は、電子チラシ情報登録検索装置10から送信された電子チラシ情報検索サイトのWebデータを受信すると、ステップS203において、検索端末20は、自端末の表示部にWebデータを表示する。   Next, the operation of the search terminal 20 that is the search request source will be described. In step S <b> 201, the search terminal 20 transmits the URL of the electronic flyer information search site to the electronic flyer information registration search apparatus 10 to perform Web access. In step S202, when the search terminal 20 receives the Web data of the electronic flyer information search site transmitted from the electronic flyer information registration search apparatus 10, in step S203, the search terminal 20 sends the Web data to the display unit of the terminal itself. indicate.

次に、ステップS204において、検索端末20は、端末の利用者(検索者)からの検索ワードの入力を受け付ける。検索ワードは、少なくとも、利用者の所望の商品である。次に、ステップS205において、検索端末20は、検索ワードを電子チラシ情報登録検
索装置10に対して送信する。ステップS206において、検索端末20は、電子チラシ情報登録検索装置10から送信された検索結果を受信すると、ステップS207において、検索端末20は、その検索結果を自端末の表示部に表示する。
Next, in step S204, the search terminal 20 receives an input of a search word from a user (searcher) of the terminal. The search word is at least a product desired by the user. Next, in step S <b> 205, the search terminal 20 transmits a search word to the electronic leaflet information registration search device 10. In step S206, when the search terminal 20 receives the search result transmitted from the electronic leaflet information registration / search apparatus 10, in step S207, the search terminal 20 displays the search result on the display unit of the terminal itself.

以上、説明したとおり、本実施形態によれば、商品を検索ワードとして検索端末20に入力させた場合に、電子チラシ情報登録検索装置10は、その商品にマッチした商品名情報が掲載された電子チラシ情報を網羅的に検索して提供することができる。   As described above, according to the present embodiment, when a product is input to the search terminal 20 as a search word, the electronic flyer information registration / retrieval apparatus 10 is an electronic product on which product name information that matches the product is posted. The leaflet information can be comprehensively searched and provided.

なお、上述した実施形態における電子チラシ情報検索システム1の検索の動作において、ステップS106において検索部109が行うチラシ画像データへの強調装飾の付加の処理は省略してもよい。図10に、検索端末20における検索結果の表示例を示す。同図は、検索端末20が“テレビ”を検索ワードにして電子チラシ情報登録検索装置10の電子チラシ情報検索サイトを検索した結果、商品名検索キーワードのうち“A社製液晶テレビB型”および“E社製液晶テレビF型”が一致するチラシ画像データが検出された場合の検索結果の表示例である。同図(a)は、強調装飾を付加しない場合の検索結果の表示例であり、同図(b)は、強調装飾を付加した場合の検索結果の表示例である。   In the search operation of the electronic flyer information search system 1 in the above-described embodiment, the process of adding emphasis decoration to the flyer image data performed by the search unit 109 in step S106 may be omitted. FIG. 10 shows a display example of search results on the search terminal 20. The figure shows that the search terminal 20 searches the electronic leaflet information search site of the electronic leaflet information registration and search device 10 using “TV” as a search word, and among the product name search keywords, “LCD TV B type manufactured by Company A” and It is a display example of a search result when leaflet image data matching “Liquid crystal television type F manufactured by E company” is detected. FIG. 10A is a display example of search results when no emphasis decoration is added, and FIG. 10B is a display example of search results when emphasis decoration is added.

また、ステップS204の検索ワードの入力処理において、検索端末20は、チラシ属性情報を用いた複合的な検索ワードの入力を受け付けることができる。例えば、検索端末20は、店舗が所在する住所の郵便番号と所望の商品名とをAND条件をかけて入力することができる。このようにした場合、電子チラシ情報登録検索装置10では、ステップS105の処理において、検索部109は、電子チラシ情報記憶部106aに記憶された電子チラシ情報LIから、チラシ属性情報の中の郵便番号が一致するとともに、商品検索キーワードと文字列の一致するテキスト情報を含むレコードを検索してチラシ画像データを抽出する。   Further, in the search word input process of step S204, the search terminal 20 can accept input of a complex search word using flyer attribute information. For example, the search terminal 20 can input the postal code of the address where the store is located and the desired product name under AND conditions. In such a case, in the electronic flyer information registration / retrieval device 10, in the process of step S105, the search unit 109 uses the postal code in the flyer attribute information from the electronic flyer information LI stored in the electronic flyer information storage unit 106a. Are searched and a record including text information whose character string matches the product search keyword is searched to extract leaflet image data.

また、上述した実施形態では、電子チラシ情報登録検索装置10が紙媒体である広告紙をもとに電子チラシ情報を生成して登録する登録機能の例について説明した。これ以外にも、電子チラシ情報登録検索装置10は、広告紙を生成するための所定のデータを用いて電子チラシ情報を生成し登録するようにしてもよい。すなわち、登録部105は、広告紙のレイアウトを示すレイアウトデータや、広告紙に掲載される商品名、価格、個数、商品の画像、商品掲載位置等のチラシデータを取得して電子チラシ情報を生成して記憶部106に記憶するようにしてもよい。この場合は、電子チラシごとにレイアウトデータおよびチラシデータを登録したチラシデータベースをネットワーク30に接続し、電子チラシ情報登録検索装置10がそのチラシデータベースから所望の電子チラシに関するレイアウトデータおよびチラシデータを読み込んで電子チラシ情報を生成し、記憶部106に記憶する処理を実行する。   Further, in the above-described embodiment, the example of the registration function in which the electronic flyer information registration / retrieval device 10 generates and registers electronic flyer information based on the advertisement paper that is a paper medium has been described. In addition to this, the electronic leaflet information registration / retrieval apparatus 10 may generate and register electronic leaflet information using predetermined data for generating advertisement paper. In other words, the registration unit 105 generates electronic flyer information by acquiring layout data indicating the layout of the advertising paper, and flyer data such as the product name, price, number, product image, product placement position, etc. posted on the advertising paper. Then, it may be stored in the storage unit 106. In this case, a flyer database in which layout data and flyer data are registered for each electronic flyer is connected to the network 30, and the electronic flyer information registration / retrieval apparatus 10 reads layout data and flyer data relating to a desired electronic flyer from the flyer database. The electronic flyer information is generated and stored in the storage unit 106.

また、上述した実施形態である電子チラシ情報検索装置の一部、例えば、検索部の機能をコンピュータで実現するようにしてもよい。この場合、その検索機能を実現するための電子チラシ情報検索プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録された電子チラシ情報検索プログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OS(Operating System)や周辺機器のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、光ディスク、メモリカード等の可搬型記録媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモ
リのように、一定時間プログラムを保持するものを含んでもよい。また上記のプログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせにより実現するものであってもよい。
Moreover, you may make it implement | achieve the function of a part of electronic leaflet information search apparatus which is embodiment mentioned above, for example, the search part. In this case, an electronic flyer information search program for realizing the search function is recorded on a computer-readable recording medium, and the electronic flyer information search program recorded on the recording medium is read into a computer system and executed. It may be realized by. Here, the “computer system” includes an OS (Operating System) and hardware of peripheral devices. The “computer-readable recording medium” refers to a portable recording medium such as a flexible disk, a magneto-optical disk, an optical disk, and a memory card, and a storage device such as a hard disk built in the computer system. Furthermore, the “computer-readable recording medium” dynamically holds a program for a short time like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory in a computer system serving as a server or a client in that case may be included and a program that holds a program for a certain period of time may be included. Further, the above program may be for realizing a part of the functions described above, or may be realized by a combination with the program already recorded in the computer system. .

以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計等も含まれる。   As mentioned above, although embodiment of this invention was explained in full detail with reference to drawings, the concrete structure is not restricted to this embodiment, The design etc. of the range which does not deviate from the summary of this invention are included.

1 電子チラシ情報検索システム
10 電子チラシ情報登録検索装置
20 検索端末
30 ネットワーク
101 読取部
102 文字領域抽出部
103 文字情報検出部
104 位置情報検出部
105 登録部
105a 電子チラシ情報登録部
105b キーワード情報登録部
106 記憶部
106a 電子チラシ情報記憶部
106b キーワード情報記憶部
106c 類似文字情報記憶部
106d Webデータ記憶部
107 操作部
108 入力部
109 検索部
110 出力部
DESCRIPTION OF SYMBOLS 1 Electronic flyer information search system 10 Electronic flyer information registration search apparatus 20 Search terminal 30 Network 101 Reading part 102 Character area extraction part 103 Character information detection part 104 Position information detection part 105 Registration part 105a Electronic flyer information registration part 105b Keyword information registration part 106 storage unit 106a electronic leaflet information storage unit 106b keyword information storage unit 106c similar character information storage unit 106d Web data storage unit 107 operation unit 108 input unit 109 search unit 110 output unit

Claims (2)

広告チラシの画像データであるチラシ画像データとこのチラシ画像データに含まれる文字の情報であるテキスト情報とを関連付けた電子チラシ情報を記憶する電子チラシ情報記憶部と、商品とこの商品に関連する言葉の文字列である商品名関連ワードとを関連付けたキーワード情報を記憶するキーワード情報記憶部と、検索ワードの供給を受ける入力部と、この入力部に供給された前記検索ワードを第1の検索キーとして前記キーワード情報記憶部に記憶された前記キーワード情報を検索し、前記検索ワードと文字列の一致する商品を検出した場合に、その検出した商品に関連付けられた商品名関連ワードを商品名検索キーワードとして抽出し、その商品名検索キーワードを第2の検索キーとして前記電子チラシ情報記憶部に記憶された電子チラシ情報を検索し、前記商品名検索キーワードと文字列の一致するテキスト情報を検出した場合に、その検出したテキスト情報に関連付けられたチラシ画像データを検索結果として抽出する検索部と、前記抽出された検索結果を出力する出力部と、を備えることを特徴とする電子チラシ情報検索装置。   An electronic flyer information storage unit that stores electronic flyer information that associates flyer image data that is image data of an advertisement flyer and text information that is character information included in the flyer image data, a product, and words related to the product A keyword information storage unit that stores keyword information that associates a product name related word that is a character string of the character string, an input unit that receives supply of a search word, and the search word supplied to the input unit is a first search key. When the keyword information stored in the keyword information storage unit is searched and a product whose character string matches the search word is detected, a product name related word associated with the detected product is displayed as a product name search keyword. And the product name search keyword is stored as the second search key in the electronic leaflet information storage unit. A search unit that searches for flyer image data associated with the detected text information when the text information matching the product name search keyword and the character string is detected, and the extracted An electronic flyer information search device comprising: an output unit that outputs a search result. 前記テキスト情報は、前記チラシ画像データに含まれる文字情報とこの文字情報の前記チラシ画像データにおける位置を示す位置情報とを含み、前記検索部は、前記検出したテキスト情報に関連付けられたチラシ画像データを抽出し、前記テキスト情報に含まれる位置情報に基づいて前記チラシ画像データに所定の強調装飾データを付加して検索結果とすることを特徴とする請求項1に記載の電子チラシ情報検索装置。   The text information includes character information included in the flyer image data and position information indicating a position of the character information in the flyer image data, and the search unit includes the flyer image data associated with the detected text information. 2. The electronic leaflet information search device according to claim 1, wherein a predetermined emphasis decoration data is added to the leaflet image data based on position information included in the text information to obtain a search result.
JP2010022798A 2010-02-04 2010-02-04 Electronic leaflet information retrieval device Active JP5504937B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010022798A JP5504937B2 (en) 2010-02-04 2010-02-04 Electronic leaflet information retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010022798A JP5504937B2 (en) 2010-02-04 2010-02-04 Electronic leaflet information retrieval device

Publications (2)

Publication Number Publication Date
JP2011159250A true JP2011159250A (en) 2011-08-18
JP5504937B2 JP5504937B2 (en) 2014-05-28

Family

ID=44591118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010022798A Active JP5504937B2 (en) 2010-02-04 2010-02-04 Electronic leaflet information retrieval device

Country Status (1)

Country Link
JP (1) JP5504937B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017182728A (en) * 2016-03-31 2017-10-05 凸版印刷株式会社 Advertised commodity information generation apparatus and advertised commodity information generation method
KR101896404B1 (en) * 2017-09-29 2018-09-07 오명운 Product Recommendation System Using Computer Vision
JP2019049945A (en) * 2017-09-12 2019-03-28 ヤフー株式会社 Extraction device, extraction method, extraction program, and model

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1083404A (en) * 1996-07-15 1998-03-31 Toshiba Corp Full text retrieving system and recording medium recorded with program
JPH10240739A (en) * 1997-02-27 1998-09-11 Toshiba Corp Device for retrieving information and method therefor
JPH10307846A (en) * 1997-03-03 1998-11-17 Toshiba Corp Document information management system, document information management method and document retrieval method
JP2002073619A (en) * 2000-06-12 2002-03-12 Ricoh Co Ltd System for noticing electronic document
JP2002207760A (en) * 2001-01-10 2002-07-26 Hitachi Ltd Document retrieval method, executing device thereof, and storage medium with its processing program stored therein
JP2009151734A (en) * 2007-12-25 2009-07-09 Dainippon Printing Co Ltd Merchandise retrieval device having function for presenting reference keyword and merchandise retrieval method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1083404A (en) * 1996-07-15 1998-03-31 Toshiba Corp Full text retrieving system and recording medium recorded with program
JPH10240739A (en) * 1997-02-27 1998-09-11 Toshiba Corp Device for retrieving information and method therefor
JPH10307846A (en) * 1997-03-03 1998-11-17 Toshiba Corp Document information management system, document information management method and document retrieval method
JP2002073619A (en) * 2000-06-12 2002-03-12 Ricoh Co Ltd System for noticing electronic document
JP2002207760A (en) * 2001-01-10 2002-07-26 Hitachi Ltd Document retrieval method, executing device thereof, and storage medium with its processing program stored therein
JP2009151734A (en) * 2007-12-25 2009-07-09 Dainippon Printing Co Ltd Merchandise retrieval device having function for presenting reference keyword and merchandise retrieval method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNH200610020021; 塚本康則: '電子新聞折込み広告' 東芝技術公開集 第19-32巻, 20010618, p.141-144, 株式会社東芝 *
JPN6013057960; 塚本康則: '電子新聞折込み広告' 東芝技術公開集 第19-32巻, 20010618, p.141-144, 株式会社東芝 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017182728A (en) * 2016-03-31 2017-10-05 凸版印刷株式会社 Advertised commodity information generation apparatus and advertised commodity information generation method
JP2019049945A (en) * 2017-09-12 2019-03-28 ヤフー株式会社 Extraction device, extraction method, extraction program, and model
JP6998162B2 (en) 2017-09-12 2022-01-18 ヤフー株式会社 Extractor, extraction method, and extraction program
KR101896404B1 (en) * 2017-09-29 2018-09-07 오명운 Product Recommendation System Using Computer Vision

Also Published As

Publication number Publication date
JP5504937B2 (en) 2014-05-28

Similar Documents

Publication Publication Date Title
US20190235814A1 (en) Building an infrastructure of actionable elements related to printed items
EP2789150B1 (en) Method, client device and server of accessing network information through graphic code
US20150006333A1 (en) Generating websites and online stores from seed input
US20150007022A1 (en) Generating websites and business documents from seed input
US20140149240A1 (en) Method for collecting point-of-sale data
US20140149846A1 (en) Method for collecting offline data
US20040078388A1 (en) Computer-implemented method and system for browsing directories and generating forms
JPH10171880A (en) Point management device
TWI544435B (en) Information processing device, information processing method, memory media
WO2006066477A1 (en) Method of collecting and issuing information and sorting by bid using wireless communication terminal
JP2008234586A (en) Consumption information acquiring terminal, consumption information acquiring server and household account book management device
JP5504937B2 (en) Electronic leaflet information retrieval device
JP4248193B2 (en) Information provision system
JP6207048B1 (en) Flyer sale information collection server, flyer sale information collection device, and flyer sale information collection method
WO2018061297A1 (en) Information processing method, program, information processing system, and information processing device
JP5504938B2 (en) Electronic leaflet information retrieval device
JP5459606B2 (en) Electronic leaflet information retrieval device
JP6822735B2 (en) Store terminals, processing methods and programs
JP5556166B2 (en) Electronic leaflet information retrieval device
JP2005222154A (en) Information distribution system
JP2002175473A (en) Internet system and recording medium with software program preserved
JP2003076692A (en) Advertisement image retrieval system, on-line shopping system, advertisement image retrieval server, on-line shopping server, client terminal unit therefor, catalog retrieval system, and catalog commodity sales system
TWI640944B (en) Automated intention extraction device and method thereof
JP2002297649A (en) Device and method for supporting information retrieval service provision
JP2023072658A (en) Merchandise information management device, method for managing merchandise information, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140303

R150 Certificate of patent or registration of utility model

Ref document number: 5504937

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250